A sus 20 años, Reddit defiende sus datos y lucha contra la IA con IA

Durante 20 años, Reddit Se ha presentado como "la portada de internet". La IA amenaza con cambiar eso.
A medida que las redes sociales han evolucionado en las últimas dos décadas con la transición a la tecnología móvil y el enfoque más reciente en los videos cortos, plataformas como MySpace, Digg y Flickr han caído en el olvido. Reddit, por su parte, se ha negado a desaparecer, avanzando con paso firme y ganando una audiencia de más de 108 millones de usuarios diarios que se congregan en más de 100,000 comunidades de subreddit. Allí, los usuarios de Reddit mantienen un estilo tradicional y se intercambian comentarios de texto sencillos sobre sus aficiones, pasatiempos e intereses favoritos.
Esos comentarios de texto generados por los usuarios son un tesoro que, en la era de la inteligencia artificial, Reddit está luchando por defender.
La aparición de chatbots de IA como ChatGPT de OpenAI , Claude de Anthropic y Google Gemini amenaza con absorber grandes cantidades de datos de servicios como Reddit. A medida que más personas recurren a chatbots para obtener información que antes buscaban en sitios web, Reddit se enfrenta a un reto gigantesco para captar nuevos usuarios, sobre todo si se agotan las compuertas de búsqueda de Google.
El director ejecutivo Steve Huffman explicó la situación de Reddit a los analistas en mayo, diciendo que desafíos como el que plantea la IA también pueden crear oportunidades.
Si bien el "ecosistema de búsqueda está en plena construcción", Huffman dijo que apuesta a que las voces de los usuarios de Reddit lo ayudarán a destacarse entre las "respuestas estériles anotadas de la IA".
Huffman reafirmó esa idea la semana pasada al decir en un podcast que la realidad es que la IA todavía está en sus inicios.
"Siempre habrá una necesidad, un deseo de que la gente hable con la gente sobre temas", dijo Huffman. "En eso nos centraremos".
Huffman puede tener razón sobre la base de usuarios leales de Reddit, pero en la era de la IA, muchos usuarios simplemente "van por el camino más fácil posible", dijo Ann Smarty, consultora de marketing y gestión de reputación que ayuda a las marcas a monitorear la percepción del consumidor. en Reddit. Y quizás no haya una manera más sencilla de encontrar respuestas en internet que simplemente preguntarle a ChatGPT, dijo Smarty.
"La gente no quiere hacer clic", dijo. "Solo quieren respuestas rápidas".
En una señal de que la empresa cree profundamente en el valor de sus datos, Reddit demandó a Anthropic a principios de este mes, alegando que la startup de inteligencia artificial "participó en actos comerciales ilegales e injustos" al extraer información de subreddits para mejorar sus grandes modelos de lenguaje.
Mientras que los autores de libros han tomado empresas como Meta Reddit ha presentado una demanda contra Anthropic alegando que sus modelos de IA infringen la ley de derechos de autor y han sufrido pérdidas recientes . Basa su demanda en prácticas comerciales desleales. El caso de Reddit parece centrarse en la "explotación comercial de datos que no les pertenecen" por parte de Anthropic, según Randy McCarthy, director del grupo de derecho de propiedad intelectual de Hall Estill.
Reddit está defendiendo su plataforma de contenido generado por los usuarios, afirmó Jason Bloom, presidente de litigios de propiedad intelectual en el bufete de abogados Haynes Boone.
El repositorio de "discusiones detalladas e informativas" de la empresa de redes sociales es particularmente útil para "entrenar un bot o una plataforma de IA", afirmó Bloom. Como han señalado muchos investigadores de IA, el gran volumen de conversaciones moderadas de Reddit puede ayudar a que los chatbots de IA produzcan respuestas más naturales a preguntas que abarcan innumerables temas, por ejemplo, que un libro de texto universitario.
Aunque Reddit tiene acuerdos de licencia de datos relacionados con la IA con OpenAI y Google, la empresa alegó en su demanda que Anthropic ha estado extrayendo sus datos de forma encubierta sin obtener permiso. Reddit alega que las acciones de Anthropic para acaparar datos están "interfiriendo en las relaciones contractuales de Reddit con sus usuarios", según la demanda.
Esta falta de claridad respecto de lo que está permitido cuando se trata del uso de extracción de datos para IA es lo que define el caso de Reddit y otras demandas similares, dijeron expertos legales y en IA.
"El uso comercial requiere términos comerciales", dijo Huffman en el podcast The Best One Yet. "Cuando se utiliza algo —contenido, datos o algún recurso— en los negocios, se paga por ello".
Anthropic no está de acuerdo "con las afirmaciones de Reddit y nos defenderemos enérgicamente", dijo un portavoz de la compañía a CNBC.
La decisión de Reddit de demandar por reclamos de prácticas comerciales desleales en lugar de violaciones de derechos de autor subraya las diferencias entre los editores tradicionales y plataformas como Reddit que albergan contenido generado por los usuarios, dijo McCarthy.
Bloom afirmó que Reddit podría tener argumentos válidos contra Anthropic porque las plataformas de redes sociales tienen diversas fuentes de ingresos. Una de ellas es la venta del acceso a sus datos, añadió.
"Eso les permite vender y licenciar esos datos para usos legítimos y al mismo tiempo proteger la privacidad de sus consumidores y demás", dijo Bloom.
Reddit no solo se defiende de la IA. En diciembre lanzó su propio servicio de IA, Reddit Answers , utilizando tecnología de OpenAI y Google. .
A diferencia de los chatbots generales que resumen las páginas web de otros, el chatbot de Respuestas de Reddit genera respuestas basándose exclusivamente en la red social y redirige a los usuarios a las conversaciones originales para que puedan ver los comentarios específicos de cada usuario. Un portavoz de Reddit afirmó que más de un millón de personas usan Respuestas de Reddit cada semana.
Huffman ha estado presentando Reddit Answers como una herramienta que combina lo mejor de ambos mundos, combinando la simplicidad de los chatbots de IA con el corpus de comentarios de Reddit. Utilizó la función después de ver al grupo de música electrónica Justice tocar recientemente en San Francisco.
"Pensé: '¿Cuánto dura este set?'. Y Reddit me dijo que son 90 minutos porque alguien ya había hecho esa pregunta", dijo Huffman en el podcast.
Aunque los inversores están preocupados por el impacto negativo que la IA pueda tener en el crecimiento de usuarios de Reddit, el analista senior de Internet de Seaport, Aaron Kessler, dijo que está de acuerdo con el sentimiento de Huffman de que el contenido original del sitio le da poder de permanencia.
Las personas que visitan Reddit suelen buscar información sobre cosas o lugares que les puedan interesar, como raquetas de tenis o estaciones de esquí, afirmó Kessler. Estos datos de usuario indican una "intención comercial", lo que significa que los anunciantes consideran cada vez más Reddit como un lugar para publicar anuncios en línea, añadió.
"Se puede saber en qué página de Reddit te encuentras qué le interesa al consumidor", dijo Kessler. "Incluso se podría argumentar que hay señales más fuertes en Reddit que en Facebook o Instagram, donde la gente podría simplemente estar viendo vídeos".
MIRA : Reddit demanda a Anthropic alegando uso indebido de contenido .
CNBC