Wikipedia Italia ha un problema con i contenuti prodotti dalle AI generative

Da qualche anno una domanda assilla la comunità mondiale dei curatori di Wikipedia. Cosa ne sarà dell’enciclopedia libera? Del portale capace di tenere in un unico posto, l’intera conoscenza umana, in ogni lingua, prodotta dagli umani per gli umani? Che ne sarà di tutto questo con la potenza raggiunte dalle AI generative? “Ne discutiamo da anni, almeno da quando ChatGpt è stato aperto al grande pubblico”, spiega a Italian Tech Ferdinando Traversa, 20 anni, barese, neo presidente di Wikimedia Italia.
“Ma nell’ultimo periodo molti di noi hanno notato un aumento delle voci scritte con strumenti di intelligenza artificiale. Per questo abbiamo deciso di darci delle regole. Ne stiamo discutendo, ma il fine è uno solo: tenere sempre al centro l’umano e il controllo dell’umano sul prodotto finale”, aggiunge. La comunità è divisa, la discussione è accesa. Ma la fondazione ha deciso per un approccio “non di totale chiusura” rispetto alle AI, che si calcola abbiano scritto o contribuito a scrivere oramai il 5% delle voci dell’intera enciclopedia. Anzi. “Ma vogliamo che le voci restino scritte dagli esseri umani, che però possono aiutarsi nella creazione di tabelle o in attività ripetitive nella stesura”, ragiona.
Il rischio collasso, ovvero che le AI si addestrino dei loro stessi prodottiLa cautela della comunità di Wikipedia Italia è dovuta a diversi fattori di rischio: le allucinazioni di cui le AI generative continuano a soffrire, il rischio di imprecisioni gravi, l’assenza di fonti e di citazioni, ma soprattutto un possibile corto circuito nei risultati se le AI cominciassero ad addestrarsi con articoli scritti da loro stesse.
“Non è un mistero che le AI si siano nutrite di Wikipedia in tutte le lingue per imparare a generare testi. I nostri server hanno sofferto molto la continua richiesta di accesso alle nostre pagine di questi modelli generativi. Ma pochi intravedono un rischio correlato. Il model collapse, (collasso del modello, ndr), cosa che farebbe perdere tutti, gli utenti e Wikipedia stessa”. Il model collapse è un fenomeno piuttosto discusso nel contesto delle AI. Avviene quando i modelli vengono addestrati con prodotti delle AI stesse. Si nutrono del loro stesso pastone. Effetto? Il modello si impoverisce sempre di più, il linguaggio diventa ripetitivo, meno creativo, impreciso, e tende a rafforzare errori e informazioni sbagliate.
Dalla ricerca su Wikipedia alla richiesta al chatbot: cosa si perdeTraversa vede inoltre una sfida lanciata dalle Ai. “Sempre più persone, specie più giovani, non fanno più ricerche online, ma chiedono direttamente ai Chatbot”. Se Wikipedia vuole mantenere il compito di tutelare, tenere insieme la conoscenza dell’umanità e darla al lettore, dovrà quindi “studiare nuovi modi per aiutare il lettore stesso nelle consultazioni”.
Chiedere direttamente a un chatbot vuol dire per Traversa “rinunciare alla bellezza del perdersi nella lettura e magari scoprire un link, un riferimento, e leggere ancora, capire di più, imparare cose nuove”. E il rischio è che quel chatbot si sia addestrato su un dataset che contiene errori, dando cattive informazioni di ritorno. Tutti temi che andranno affrontati col tempo.
Oggi Wikipedia gode di buona salute. Sono 3.000 i membri della comunità attivi ogni mese in Italia. Ad aprile è stata letta 57 milioni di volte, 396 mila sono le modifiche fatte alle voci. Ma se la sua popolarità al momento non risente delle pressioni dell’AI, sono quelle della politica a rappresentare un ostacolo maggiore.
Sugli attacchi di Musk: “Non siamo in vendita”“Siamo stati attaccati più volte da Musk. Ritiene che noi siamo di parte, che conteniamo notizie false sul suo conto e su quello di Tesla. Vorrebbe ci fossero scritte cose non vere, perlomeno non verificate, e questo ha fatto in modo che ci attaccasse più volte, chiedendo agli americani di smettere di farci donazioni”.
Messaggio fallito. Le donazioni sono “in linea con quanto previsto dalla fondazione”, dice Traversa. Il prossimo anno Wikipedia farà 25 anni. “La nostra missione non cambierà, il nostro modo di lavorare non cambierà, non siamo in vendita e non possiamo essere comprati come Twitter, siamo l’ultimo pezzo di internet libero nell’era dello stradominio dei colossi tecnologici”, conclude Traversa.
La Repubblica