Il piano di un’IA italiana per battere gli scienziati da 100 milioni di dollari della Silicon Valley

A Roma si torna a scavare, ma stavolta nei meandri delle reti neurali. Translated, azienda italiana tra le più avanzate al mondo nella traduzione automatica potenziata dall’IA, guida un ambizioso progetto europeo per superare i limiti degli attuali modelli linguistici di grandi dimensioni (LLM), alla base di strumenti come ChatGpt, Gemini e Claude.
L’informatico Marco Trombetti, che ha fondato Translated nel 1999 insieme alla linguista Isabelle Andrieu, ha ospitato nella sede della sua azienda 70 ricercatori europei che lavoreranno a DVPS, nuova iniziativa del programma Horizon Europe che stanzia circa 1 miliardo di euro all'anno per l'IA, con un focus su ricerca di base, innovazione industriale e applicazioni pratiche.
Il cuore europeo del progetto DVPSTranslated coordinerà il progetto sostenuto da un investimento di 29 milioni di euro. Partecipano “venti organizzazioni di primo piano” - aziende ma anche università - provenienti da nove paesi europei. Il nome DVPS – acronimo latino di Diversibus Vilis Plurima Solvo, ovvero “attraverso percorsi diversi, risolvo molteplici problemi” - strizza l’occhio alla passione della Silicon Valley per il mondo romano, ma l’anima di questo lavoro di ricerca è tutta europea.
Il progetto è partito da Roma, nel Pi Campus che si trova a sud della Capitale, un piccolo ecosistema di villette dove si incontrano regolarmente startup e venture capitalist.
Il team di DVPS intende costruire un nuovo modello di IA che sia in grado di “apprendere dall’interazione col mondo reale, combinando dati linguistici, visivi e provenienti dai sensori”.
Oltre gli LLM: un nuovo paradigma“I modelli linguistici di grandi dimensioni hanno segnato una svolta, ma stiamo iniziando a intravedere i loro limiti, sia a livello di architettura sia per quanto riguarda il modo in cui apprendono da contenuti statici, che sono creati dall'uomo e disponibili solo nel mondo digitale. Per evolversi, l'IA deve interagire con il mondo reale in tempo reale. Con DVPS, consentiamo alle macchine di crescere interagendo con la realtà e scambiandosi reciprocamente le conoscenze in modo istantaneo” ha detto Trombetti, uno degli imprenditori italiani più vicini - per spirito, attitudine e rapporti personali - alla Silicon Valley.
Dal Pi Campus sono passati, negli ultimi anni, alcuni dei nomi simbolo dell’IA globale: da Lukasz Kaiser, tra gli autori del paper Attention Is All You Need che ha contribuito alla nascita di ChatGpt, a - solo qualche giorno fa - Jonathan Cohen, Responsabile del Software IA di Nvidia, l’azienda che con le sue schede grafiche ha reso possibile la rivoluzione dell’intelligenza artificiale generativa.
Le fondamenta di DVPSTranslated ha registrato nel 2024 un fatturato di 69,2 milioni di euro. Nel 2021 ha chiuso un round di 30 milioni di euro guidato dalla società di investimento Ardian. La società, con sede a Roma, ha 250 dipendenti. Trombetti è il suo CEO.
Con i profitti dell’azienda, i fondatori di Translated hanno avviato Pi Campus, che viene definita “una società di venture capital che investe in IA applicata”.
Il campus romano è un luogo dove allevare talenti: all’interno è stata creata una scuola di intelligenza artificiale, Pi School, che seleziona i migliori profili ogni anno per invitarli a risolvere problemi reali “proposti da aziende leader o startup in crescita”.
Il progetto DVPS, che viene definito “uno dei più importanti investimenti europei nella ricerca sull’IA”, poggia dunque su fondamenta solide. Il sogno è quello di creare sistemi di intelligenza artificiale avanzati che comprendano meglio il contesto di quanto riescano a fare gli LLM.
L’idea è quello di sviluppare un modello generale che potrà poi essere “verticalizzato” in almeno tre settori: medicina, ambiente e traduzioni linguistiche.
Nel campo delle lingue, dove Translated ha una posizione di forza, DVPS integrerà input visivi, audio spaziale e informazioni sul contesto per identificare correttamente il parlante e offrire traduzioni più precise.
Come si vince nel campionato dell’IAIl progetto partirà con una fase iniziale di sperimentazione, sostenuta dal finanziamento europeo di 29 milioni di euro, di cui 4 milioni destinati alla capacità di calcolo.
Se il modello sviluppato in questa fase darà risultati promettenti, l’obiettivo sarà raccogliere 100 milioni di euro entro l’anno successivo per costruire modelli di scala intermedia. A quel punto, se anche in questa nuova categoria il progetto si confermerà tra i migliori, si potrà puntare a un investimento da un miliardo di euro e all’ingresso nella competizione globale dell’intelligenza artificiale.
Ma come si vincono i campionati dell’intelligenza artificiale?
“Si inizia facendo ricerca, poi si costruisce un modello piccolo, da 5-7 miliardi di parametri – spiega Trombetti –. Questi modelli costano circa un milione. Chi emerge in questa categoria lo fa spendendo poco tempo e risorse. Tra i piccoli, qual è il migliore? Anche se è inferiore rispetto a un modello da 100 miliardi, vince nella sua classe. È come vincere i 'provinciali': poi passi ai 'regionali', raccogli 100 milioni e sviluppi un modello molto più grande. Se vinci anche in quella categoria, puoi investire miliardi e puntare alle 'Olimpiadi'. Noi siamo motivati ad arrivarci, ma sappiamo che dobbiamo passare attraverso tutti gli step. E di certo non siamo quelli che chiedono un miliardo senza aver prima vinto i campionati minori”.
La forza dell’Europa? Vedere i problemiQuali sono le probabilità di successo di DVPS? “Il 20%”, risponde Trombetti. Perché così basse? “Non useremo l’attuale architettura degli LLM – spiega il CEO di Translated –. Non seguiremo l’approccio di DeepSeek, che ha semplicemente introdotto un miglioramento su un sistema esistente. La nostra scommessa è diversa: puntiamo sulla ricerca di base, vogliamo inventare nuovi modi per affrontare questi problemi e costruire un modello con un’architettura completamente nuova. La probabilità di successo è più bassa, ma se ci riusciamo, non facciamo un passo avanti del 101%, facciamo un balzo del 200%.”.
La missione di DVPS è complessa, se si considera che anche dall’altra parte dell’Oceano, nella Silicon Valley, le migliori menti del mondo lavorano per superare gli attuali limiti dei LLM, in particolare la mancanza di dati su cui addestrare i modelli. Ma le Big Tech hanno miliardi da investire, e potenza di calcolo smisurata. Le loro percentuali di successo, a differenza di Translated e dei suoi compagni di viaggio europei, sono molto più alte. Come si può, dunque, competere con tanti Golia, tutti concentrati sullo stesso obiettivo?
“Conosciamo queste persone, ci parliamo - racconta Trombetti - Ho discusso con Cohen, con Lukasz, con Ilya Sutskever, co-fondatore di OpenAI. Hanno una comprensione tecnica e teorica incredibile. Ma c’è una cosa che non hanno: non riescono a comprendere i problemi reali. Noi lavoriamo da anni con traduttori e linguisti, persone che vivono il problema della lingua ogni giorno. E la lingua è probabilmente la cosa più complessa e umana che una macchina possa cercare di comprendere. Quando un traduttore lavora con un sistema IA, non accetta approssimazioni. Se la macchina “allucina” o sbaglia, se ne accorge subito. E ci obbliga a capire perché ha sbagliato. Questo ci espone a un livello di precisione e di verità sul problema che molti ricercatori non vedono. Lucasz, ogni volta che ci parlo, è sorpreso. Perché noi vediamo problemi che loro non vedono. E questo ci dà un vantaggio: loro hanno vinto finora per forza bruta, ma noi capiamo dove la macchina fallisce davvero”.
Ma secondo Trombetti c’è un altro motivo per cui vale la pena tentare.
“Il divario tra modelli open source e modelli chiusi [come ChatGpt e Gemini, ndr] si sta restringendo - dice -. E mentre i finanziamenti iniziano a scarseggiare, l’ingegno sta tornando un asset competitivo decisivo. Per tre anni ha vinto chi aveva più potenza di calcolo. Poi è arrivata DeepSeek: con dieci volte meno risorse e un po’ di ingegno, ha fatto un passo avanti. E questo ci apre una porta. Se hai uno scienziato da cento milioni, ma non ha capito il problema, sei in difficoltà. Se ne hai uno da un milione, ma il problema lo conosce davvero, può vincere. Questo è il nostro vantaggio reale. E poi c’è un’altra cosa: noi possiamo permetterci il 20% di successo. Loro no. Loro devono vincere ogni volta. Noi, invece, possiamo correre il rischio. Ed è proprio lì che può nascere qualcosa di nuovo”.

L’obiettivo di Translated e di tutte le realtà partecipanti al DVPS è “far uscire la macchina dal computer e iniziare a farla interagire con il mondo fisico”.
“Per farlo - dice Trombetti - deve essere in grado di processare tutti i sensori. Pensiamo a un’auto autonoma: ha telecamere, radar, lidar, misuratori di distanza. Oggi, tutti questi dati devono essere pre-processati a mano. Bisogna spiegare alla macchina cosa significa ogni input, semplificando molto. Ma se vogliamo darle mille sensori e farle gestire informazioni complesse – come in medicina, dove i dati sono eterogenei – non possiamo più codificare tutto a mano. La macchina deve essere in grado di leggere direttamente l’informazione, byte per byte, e attribuirle un significato autonomamente. Questo richiede parallelismo, apprendimento a livello di byte, ma soprattutto un cambio di paradigma: finora abbiamo addestrato le macchine solo con dati storici. Ma gli esseri umani imparano soprattutto interagendo col mondo, facendo esperienze: learning by doing. Per questo dobbiamo “aprire lo sportello”: far uscire la macchina, farle fare esperienze, e sviluppare un’architettura che le permetta di auto addestrarsi mentre agisce. Questo è il prossimo passo”.
Per l’AGI serve un cambiamentoUn passo fondamentale, tra l’altro, per arrivare a un’intelligenza artificiale superiore, che in molti chiamano “generale” (AGI), e che un giorno potrebbe superare le capacità cognitive umane in molti ambiti.
“Oggi sono certo che con l’attuale architettura non si può arrivare all’AGI. C’è troppo da imparare nel mondo fisico e nel futuro per poter davvero generalizzare. L’approccio attuale non basta”.
Il nuovo modello sarà “aperto”, ma non troppoGli sforzi del DVPS, dice Trombetti, saranno totalmente aperti per quanto riguarda i paper di ricerca. Mentre il primo modello creato sarà “open weight”: vuol dire che i suoi pesi (cioè i parametri appresi durante l’addestramento) sono pubblicamente accessibili.
E perché non sarà un’IA open source?
“Dobbiamo fare attenzione a quanto condividere: non lo abbiamo ancora deciso - afferma Trombetti -. Il rischio più grande è che, ancora una volta, in Europa si faccia tanta ricerca e si investano soldi, mentre poi sono i ricercatori americani a prenderne i risultati, a pubblicare prima e a proporre progetti alternativi traendone i benefici. Per questo dobbiamo valutare con attenzione dove mettere il limite. È una scelta strategica: se il progetto andrà molto bene, possiamo permetterci di chiuderci un po’ di più; se invece il progresso è più lento, allora è meglio essere più aperti, più collaborativi e cercare nuove opportunità”.
La Repubblica