Subscribe to Bankless or sign in
Los investigadores de IA se han topado con un "muro de datos": los datos de Internet disponibles públicamente ya no son suficientes para entrenar modelos a gran escala.
En respuesta, los gigantes tecnológicos compran cada vez más datos privados, lo que reporta a plataformas como Reddit cientos de millones al año por la venta de contenido generado por los usuarios como material de entrenamiento. Photobucket, Tumblr y Stack Overflow se benefician de la concesión de licencias de datos de usuarios a desarrolladores de IA, mientras que las personas cuyo contenido impulsa estos avances rara vez reciben una compensación. Shutterstock ha firmado acuerdos por valor de entre 25 y 50 millones de dólares para conceder licencias de sus bibliotecas multimedia a empresas de IA, mientras que Meta incluso se planteó adquirir Simon & Schuster para acceder a su catálogo de libros electrónicos.
Esta creciente brecha económica refleja una tendencia más amplia en la que el acceso a los datos está cada vez más controlado por unas pocas empresas tecnológicas ricas. Esto pone de relieve un problema más profundo: Los datos de los usuarios tienen un valor inmenso y, sin embargo, la mayoría no ve ningún retorno por lo que crean.
Suscríbete gratis para seguir leyendo
- Apoya el movimiento Bankless
- Acceso a miles de artículos
- Archivo completo de episodios de Bankless
- Emprende misiones gratis en Airdrop Hunter
- Información diaria en tu bandeja
¿Ya estás suscrito? Iniciar sesión