Reddit poursuit Anthropic : plus de 100 000 accès illégaux aux conversations des utilisateurs

Reddit a intenté une action en justice contre Anthropic devant la Cour supérieure de Californie à San Francisco. La plainte allègue qu'Anthropic a exploité illégalement du contenu généré par les utilisateurs pour entraîner son chatbot Claude .

La société d'intelligence artificielle dirigée par Dario Amodei aurait effectué plus de 100 000 accès non autorisés aux serveurs de Reddit depuis juillet 2024, contournant délibérément les protections anti-bot et violant les conditions de service de la plateforme.

« Nous ne tolérerons pas que des entités à but lucratif comme Anthropic exploitent commercialement le contenu de Reddit pour des milliards de dollars sans aucun retour pour les Redditors ni respect de leur vie privée », a déclaré Ben Lee , directeur juridique de Reddit, à TechCrunch .

Reddit réclame des dommages et intérêts non spécifiés et une injonction pour empêcher toute nouvelle utilisation commerciale de ses données. Anthropic a nié ces allégations . Ce litige met en lumière le conflit croissant entre les plateformes de contenu et les entreprises d'IA concernant l'utilisation éthique des données des utilisateurs.

Pourquoi les données Reddit sont précieuses

Fondée en 2005, Reddit est aujourd'hui l'une des plus grandes plateformes de discussion en ligne au monde. Avec plus de 100 millions d'utilisateurs actifs quotidiens répartis sur des milliers de sous-catégories thématiques, cette plateforme sociale héberge un écosystème de conversations allant de la technologie à la culture populaire.

Cette vaste archive d’ interactions humaines est une ressource précieuse pour des entreprises comme Anthropic, qui recherchent en permanence des données linguistiques diverses et de qualité – le type de données que seuls les humains peuvent produire – idéales pour former les modèles linguistiques à grande échelle (LLM) qui alimentent l’IA générative .

Anthropic, fondée en 2021 par d'anciens chercheurs d'OpenAI et financée par des géants de la technologie comme Amazon et Alphabet , s'est positionnée comme un leader de l'IA responsable, mettant l'accent sur la sécurité et la transparence.

Son chatbot Claude concurrence directement ChatGpt (d'OpenAI) sur le marché de l'IA conversationnelle.

Il est intéressant de noter que le PDG d’OpenAI, Sam Altman, détient une participation de 8,7 % dans Reddit – ce qui en fait le troisième actionnaire – et a déjà siégé au conseil d’administration de la société.

À qui Reddit vend-il des données ?

Conscient de la valeur commerciale de ses données, Reddit a développé une stratégie de monétisation via des accords de licence structurés.

En février 2024, la plateforme sociale, qui vaut actuellement environ 20 milliards de dollars , a signé un accord avec Google d'une valeur d'environ 60 millions de dollars par an qui légitime l'utilisation de son contenu pour former des modèles d'IA.

L’accord comprend des clauses de protection de la vie privée, telles que l’exclusion du contenu supprimé par les utilisateurs.

En mai 2024, Reddit a signé un accord similaire avec OpenAI, dont le montant n'a pas été divulgué, mais qui suit des paramètres similaires d'accès contrôlé. Ces partenariats ont contribué de manière significative à la croissance financière de Reddit, avec une hausse de 28 % du cours de l'action en 2025 .

Batailles juridiques autour des données

Le conflit entre Reddit et Anthropic survient dans un contexte juridique de plus en plus complexe affectant les créateurs de contenu et les développeurs d'IA.

Contrairement à d'autres affaires axées sur la violation du droit d'auteur , Reddit fonde sa stratégie juridique sur des allégations de rupture de contrat et de concurrence déloyale , soulignant comment Anthropic a systématiquement ignoré les conditions de service de la plateforme.

Le New York Times avait déjà poursuivi OpenAI (puis Microsoft , principal bailleur de fonds de l'entreprise à l'origine de ChatGpt), alléguant que des millions d'articles avaient été utilisés sans autorisation pour entraîner les modèles de ChatGpt. Cette bataille juridique est toujours en cours.

Des auteurs comme Sarah Silverman ont également récemment intenté des poursuites contre Meta pour avoir utilisé abusivement leurs œuvres pour Llama Training, tandis que les éditeurs de musique ont accusé Anthropic d' exploiter des paroles protégées par le droit d'auteur .

La Repubblica

Reddit poursuit Anthropic : plus de 100 000 accès illégaux aux conversations des utilisateurs

Nouvelles similaires

La grande bulle de l'intelligence artificielle

Le Musée astronomique démantelé, le Planétarium de Rome fermé pendant 3 mois

Conflit Trump-Musk, Elon gagne sur les réseaux sociaux

Conflit Musk-Trump aux conséquences « cosmiques ». Qu'en est-il de la mission de l'astronaute polonais ?

Les explosions cosmiques les plus puissantes observées depuis le Big Bang