Il giudice respinge la causa per violazione del copyright intentata dagli autori contro Meta per l'addestramento all'intelligenza artificiale

SAN FRANCISCO -- Un giudice federale si è schierato dalla parte di Meta Platforms, la società madre di Facebook, nel respingere una causa per violazione del copyright intentata da un gruppo di autori che accusavano l'azienda di aver rubato le loro opere per addestrare la sua tecnologia di intelligenza artificiale.
La sentenza emessa mercoledì dal giudice distrettuale statunitense Vince Chhabria è la seconda in una settimana da una corte federale di San Francisco a respingere importanti rivendicazioni di copyright da parte di autori di libri contro il settore dell'intelligenza artificiale in rapida crescita.
Chhabria ha scoperto che 13 autori che hanno fatto causa a Meta "hanno avanzato argomentazioni sbagliate" e hanno archiviato il caso. Tuttavia, il giudice ha anche affermato che la sentenza è limitata agli autori coinvolti nel caso e non implica che l'uso di materiale protetto da copyright da parte di Meta sia lecito.
"Questa sentenza non sostiene la tesi secondo cui l'uso da parte di Meta di materiali protetti da copyright per addestrare i propri modelli linguistici sia lecito", ha scritto Chhabria. "Sostiene solo la tesi secondo cui questi ricorrenti hanno avanzato argomentazioni errate e non sono riusciti a produrre una documentazione a sostegno di quelle corrette".
Gli avvocati dei querelanti – un gruppo di noti scrittori tra cui la comica Sarah Silverman e gli autori Jacqueline Woodson e Ta-Nehisi Coates – hanno dichiarato in una nota che "il tribunale ha stabilito che le aziende di intelligenza artificiale che 'inseriscono opere protette da copyright nei loro modelli senza ottenere l'autorizzazione dei titolari del copyright o pagarle' violano generalmente la legge. Eppure, nonostante l'indiscussa storia di pirateria di opere protette da copyright da parte di Meta, un fenomeno senza precedenti nella storia, il tribunale si è pronunciato a favore di Meta. Siamo rispettosamente in disaccordo con questa conclusione".
Meta ha affermato di apprezzare la decisione.
"I modelli di intelligenza artificiale open source stanno alimentando innovazioni trasformative, produttività e creatività per individui e aziende, e il corretto utilizzo del materiale protetto da copyright è un quadro giuridico essenziale per sviluppare questa tecnologia trasformativa", ha affermato l'azienda con sede a Menlo Park, California, in una nota.
Sebbene Meta abbia prevalso nella sua richiesta di archiviazione del caso, potrebbe rivelarsi una vittoria di Pirro. Nella sua sentenza di 40 pagine, Chhabria ha ripetutamente indicato motivi per ritenere che Meta e altre aziende di intelligenza artificiale si siano trasformate in violatori seriali del copyright, applicando la loro tecnologia a libri e altre opere create da esseri umani, e sembrava invitare altri autori a presentare casi alla sua corte, presentati in modo da consentire loro di procedere in giudizio.
Il giudice ha deriso le argomentazioni secondo cui imporre alle aziende di intelligenza artificiale di aderire a leggi sul copyright vecchie di decenni avrebbe rallentato i progressi di una tecnologia cruciale in un momento cruciale. "Si prevede che questi prodotti genereranno miliardi, persino migliaia di miliardi di dollari per le aziende che li sviluppano. Se utilizzare opere protette da copyright per addestrare i modelli è così necessario come affermano le aziende, troveranno un modo per compensare i titolari dei diritti d'autore".
Lunedì, nello stesso tribunale, il giudice distrettuale statunitense William Alsup ha stabilito che la società di intelligenza artificiale Anthropic non ha violato la legge addestrando il suo chatbot Claude su milioni di libri protetti da copyright, ma che la società deve comunque essere processata per aver acquisito illecitamente quei libri da siti web pirata invece di acquistarli.
Ma il processo effettivo di un sistema di intelligenza artificiale che distilla migliaia di opere scritte per riuscire a produrre i propri passaggi di testo è stato qualificato come "uso corretto" ai sensi della legge statunitense sul copyright perché era "fondamentalmente trasformativo", ha scritto Alsup.
Nel caso Meta, gli autori avevano sostenuto negli atti giudiziari che Meta era "responsabile di grave violazione del copyright" per aver preso i loro libri da archivi online di opere piratate e averli inseriti nel sistema di intelligenza artificiale generativa di punta di Meta, Llama.
I passaggi di testo lunghi e scritti in modo distintivo, come quelli che si trovano nei libri, sono estremamente utili per insegnare ai chatbot di intelligenza artificiale generativa gli schemi del linguaggio umano. "Meta avrebbe potuto e dovuto pagare" per acquistare e concedere in licenza quelle opere letterarie, hanno sostenuto gli avvocati degli autori.
Meta ha replicato nei documenti depositati in tribunale che la legge statunitense sul copyright "consente la copia non autorizzata di un'opera per trasformarla in qualcosa di nuovo" e che la nuova espressione generata dall'intelligenza artificiale che emerge dai suoi chatbot è fondamentalmente diversa dai libri su cui è stata addestrata.
"Dopo quasi due anni di contenzioso, non esiste ancora alcuna prova che qualcuno abbia mai utilizzato Llama come sostituto della lettura dei libri dei querelanti, o che potrebbe farlo", hanno sostenuto gli avvocati di Meta.
Meta afferma che Llama non pubblicherà i lavori effettivamente copiati, anche quando gli viene chiesto di farlo.
"Nessuno può usare Llama per leggere la descrizione dell'infanzia di Sarah Silverman, o la storia di Junot Diaz di un ragazzo dominicano cresciuto nel New Jersey", hanno scritto i suoi avvocati.
Accusata di aver ritirato quei libri dalle "biblioteche ombra" online, Meta ha anche sostenuto che i metodi utilizzati non hanno "alcuna incidenza sulla natura e sullo scopo del loro utilizzo" e che il risultato sarebbe stato lo stesso se l'azienda avesse invece stretto un accordo con le biblioteche vere .
Grazie a tali accordi, Google ha costruito il suo archivio online Google Libri, che conta oltre 20 milioni di libri, ma ha anche dovuto affrontare un decennio di ricorsi legali prima che la Corte Suprema degli Stati Uniti, nel 2016, lasciasse cadere le sentenze dei tribunali inferiori che avevano respinto le accuse di violazione del copyright.
Il caso degli autori contro Meta ha costretto alle dimissioni il CEO Mark Zuckerberg e ha reso pubbliche le conversazioni interne all'azienda in merito all'etica dell'accesso a database piratati, che da tempo sono oggetto di attenzione.
"Le autorità chiudono regolarmente i loro domini e addirittura perseguono penalmente i colpevoli", hanno sostenuto gli avvocati degli autori in un documento depositato in tribunale. "Che Meta sapesse che prelevare opere protette da copyright da database piratati avrebbe potuto esporre l'azienda a un rischio enorme è indiscutibile: ha innescato una richiesta di approvazione a Mark Zuckerberg e ad altri dirigenti di Meta. La loro scommessa non dovrebbe dare i suoi frutti".
I querelanti nominati sono Jacqueline Woodson, Richard Kadrey, Andrew Sean Greer, Rachel Louise Snyder, David Henry Hwang, Ta-Nehisi Coates, Laura Lippman, Matthew Klam, Junot Diaz, Sarah Silverman, Lysa TerKeurst, Christopher Golden e Christopher Farnsworth.
Chhabria ha affermato nella sentenza che, pur non avendo "altra scelta" se non quella di accogliere la sentenza sommaria di Meta che archiviava il caso, "nel complesso, le conseguenze di questa sentenza sono limitate. Non si tratta di un'azione collettiva, quindi la sentenza riguarda solo i diritti di questi 13 autori, non degli innumerevoli altri le cui opere Meta ha utilizzato per addestrare i suoi modelli".
—
Michael Liedtke, giornalista di AP Technology, ha contribuito a questo articolo.
ABC News