A 20 anni, Reddit difende i suoi dati e combatte l'IA con l'IA

Per 20 anni, Reddit si è presentata come "la prima pagina di Internet". L'intelligenza artificiale minaccia di cambiare le cose.

Con l'evoluzione dei social media negli ultimi vent'anni, con il passaggio al mobile e la recente attenzione ai video brevi, piattaforme come MySpace, Digg e Flickr sono cadute nell'oblio. Reddit, nel frattempo, si è rifiutata di morire, continuando a crescere e conquistando un pubblico di oltre 108 milioni di utenti giornalieri che si riuniscono in più di 100.000 community di subreddit. Lì, gli utenti di Reddit mantengono un approccio alla vecchia maniera e si scambiano semplici commenti di testo sui loro hobby, passatempi e interessi preferiti.

I commenti di testo generati dagli utenti rappresentano un tesoro che, nell'era dell'intelligenza artificiale, Reddit si batte per difendere.

L'emergere di chatbot AI come ChatGPT di OpenAI , Claude di Anthropic e Google I Gemini minacciano di assorbire enormi quantità di dati da servizi come Reddit. Con sempre più persone che si rivolgono ai chatbot per ottenere informazioni che prima cercavano sui siti web, Reddit si trova ad affrontare una sfida gigantesca nell'acquisire nuovi utenti, soprattutto se le porte della ricerca di Google si prosciugheranno .

A maggio, il CEO Steve Huffman ha spiegato la situazione di Reddit agli analisti, affermando che sfide come quella posta dall'intelligenza artificiale possono anche creare opportunità.

Sebbene "l'ecosistema di ricerca sia in fase di forte costruzione", Huffman ha affermato di scommettere che le voci degli utenti di Reddit aiuteranno l'azienda a distinguersi tra le "risposte sterili e annotate dell'intelligenza artificiale".

Huffman ha ribadito questo concetto la scorsa settimana, affermando in un podcast che la realtà è che l'intelligenza artificiale è ancora ai suoi primi passi.

"Ci sarà sempre bisogno, il desiderio che le persone parlino con altre persone di certe cose", ha detto Huffman. "È su questo che ci concentreremo."

Huffman potrebbe avere ragione riguardo alla base di utenti fedeli di Reddit, ma nell'era dell'intelligenza artificiale, molti utenti semplicemente "scendono nella via più semplice possibile", ha affermato Ann Smarty, consulente di marketing e gestione della reputazione che aiuta i marchi a monitorare la percezione dei consumatori. Su Reddit. E forse non c'è modo più semplice per trovare risposte su internet che semplicemente porre una domanda a ChatGPT, ha detto Smarty.

"La gente non vuole cliccare", ha detto. "Vogliono solo risposte rapide."

Proteggere i dati di Reddit dall'intelligenza artificiale

A dimostrazione del fatto che l'azienda crede profondamente nel valore dei propri dati, Reddit ha fatto causa ad Anthropic all'inizio di questo mese, sostenendo che la startup di intelligenza artificiale "ha compiuto atti commerciali illeciti e sleali" estraendo informazioni dai subreddit per migliorare i suoi modelli linguistici di grandi dimensioni.

Mentre gli autori di libri hanno assunto aziende come Meta e Anthropic in tribunale, sostenendo che i loro modelli di intelligenza artificiale violano la legge sul copyright e hanno subito recenti perdite , Reddit basa la sua causa sull'argomento delle pratiche commerciali sleali. Il caso di Reddit sembra incentrarsi sullo "sfruttamento commerciale di dati di cui Anthropic non è proprietaria", ha affermato Randy McCarthy, responsabile del gruppo di diritto della proprietà intellettuale di Hall Estill.

Reddit sta difendendo la sua piattaforma di contenuti generati dagli utenti, ha affermato Jason Bloom, responsabile del contenzioso sulla proprietà intellettuale presso lo studio legale Haynes Boone.

Il repository di "discussioni dettagliate e informative" dell'azienda di social media è particolarmente utile per "addestrare un bot o una piattaforma di intelligenza artificiale", ha affermato Bloom. Come hanno notato molti ricercatori di intelligenza artificiale, l'elevato volume di conversazioni moderate di Reddit può aiutare i chatbot di intelligenza artificiale a produrre risposte più naturali a domande che coprono innumerevoli argomenti rispetto, ad esempio, a un libro di testo universitario.

Sebbene Reddit abbia accordi di licenza sui dati relativi all'intelligenza artificiale con OpenAI e Google, l'azienda ha affermato nella sua causa che Anthropic ha sottratto segretamente i suoi dati senza ottenere il permesso. Reddit sostiene che le azioni di estrazione dati di Anthropic "interferiscono con i rapporti contrattuali di Reddit con gli utenti di Reddit", si legge nella documentazione legale.

Questa mancanza di chiarezza su ciò che è consentito quando si tratta di utilizzare il data scraping per l'intelligenza artificiale è il nocciolo del caso Reddit e di altre cause simili, hanno affermato esperti legali e di intelligenza artificiale.

"L'uso commerciale richiede termini commerciali", ha affermato Huffman nel podcast The Best One Yet. "Quando si utilizza qualcosa – contenuti, dati o risorse – in ambito aziendale, si paga per questo."

Anthropic non è d'accordo "con le affermazioni di Reddit e si difenderà energicamente", ha dichiarato un portavoce dell'azienda alla CNBC.

La decisione di Reddit di intentare causa per presunte pratiche commerciali sleali anziché per violazione del copyright sottolinea le differenze tra gli editori tradizionali e le piattaforme come Reddit che ospitano contenuti generati dagli utenti, ha affermato McCarthy.

Bloom ha affermato che Reddit potrebbe avere un valido motivo per contestare Anthropic, poiché le piattaforme di social media hanno diverse fonti di reddito. Una di queste è la vendita dell'accesso ai propri dati, ha aggiunto Bloom.

Ciò "consente loro di vendere e concedere in licenza tali dati per usi legittimi, continuando a proteggere la privacy dei consumatori e quant'altro", ha affermato Bloom.

Combattere l'IA con l'IA

Reddit non si limita a difendersi dall'intelligenza artificiale. A dicembre ha lanciato il suo servizio di intelligenza artificiale Reddit Answers , utilizzando la tecnologia di OpenAI e Google. .

A differenza dei chatbot generici che riassumono le pagine web altrui, il chatbot di Reddit Answers genera risposte basate esclusivamente sul servizio di social media e reindirizza gli utenti alle conversazioni di origine in modo che possano visualizzare i commenti specifici degli utenti. Un portavoce di Reddit ha affermato che oltre 1 milione di persone utilizza Reddit Answers ogni settimana.

Huffman ha presentato Reddit Answers come uno strumento che unisce il meglio di entrambi i mondi, unendo la semplicità dei chatbot basati sull'intelligenza artificiale con il corpus di commenti di Reddit. Ha utilizzato la funzionalità dopo aver visto il gruppo di musica elettronica Justice esibirsi di recente a San Francisco.

"Mi sono chiesto: quanto dura questo set? E Reddit mi ha risposto che dura 90 minuti, perché qualcuno aveva già fatto la stessa domanda su Reddit", ha detto Huffman nel podcast.

Sebbene gli investitori siano preoccupati per l'impatto negativo che l'intelligenza artificiale avrà sulla crescita degli utenti di Reddit, Aaron Kessler, analista senior di Internet su Seaport, ha affermato di concordare con Huffman sul fatto che i contenuti originali del sito gli conferiscono longevità.

Le persone che visitano Reddit spesso cercano informazioni su cose o luoghi che potrebbero interessargli, come racchette da tennis o stazioni sciistiche, ha affermato Kessler. Questi dati degli utenti indicano "intenzioni commerciali", il che significa che gli inserzionisti stanno prendendo sempre più in considerazione Reddit come luogo in cui pubblicare annunci online, ha aggiunto.

"Si può capire in base alla pagina in cui ci si trova su Reddit a cosa è interessato il consumatore", ha detto Kessler. "Si potrebbe persino sostenere che su Reddit ci siano segnali più forti rispetto a Facebook o Instagram, dove le persone potrebbero semplicemente guardare video."

GUARDA : Reddit fa causa ad Anthropic sostenendo l'uso improprio dei contenuti .

CNBC

A 20 anni, Reddit difende i suoi dati e combatte l'IA con l'IA