Mistral, supportata da Microsoft, lancia un cloud AI europeo per competere con AWS e Azure

Partecipa all'evento di cui i leader aziendali si fidano da quasi vent'anni. VB Transform riunisce le persone che sviluppano una vera strategia di intelligenza artificiale aziendale. Scopri di più
Mistral AI , la startup francese di intelligenza artificiale, ha annunciato mercoledì un'importante espansione dell'infrastruttura di intelligenza artificiale, posizionando l'azienda come la risposta europea ai giganti americani del cloud computing, svelando allo stesso tempo nuovi modelli di ragionamento che rivaleggiano con i sistemi più avanzati di OpenAI.
L'azienda parigina ha presentato Mistral Compute , una piattaforma infrastrutturale di intelligenza artificiale completa, realizzata in collaborazione con Nvidia , progettata per offrire alle aziende e ai governi europei un'alternativa ai provider cloud statunitensi come Amazon Web Services , Microsoft Azure e Google Cloud . Questa iniziativa rappresenta un significativo cambiamento strategico per Mistral, che si è spostata dal puro sviluppo di modelli di intelligenza artificiale al controllo dell'intero stack tecnologico.
"Questo passaggio all'infrastruttura di IA segna una svolta radicale per Mistral AI, poiché ci consente di affrontare un settore critico della catena del valore dell'IA", ha affermato Arthur Mensch, CEO e co-fondatore di Mistral AI. "Questo cambiamento comporta la responsabilità di garantire che le nostre soluzioni non solo stimolino l'innovazione e l'adozione dell'IA, ma che sostengano anche l'autonomia tecnologica dell'Europa e contribuiscano alla sua leadership in materia di sostenibilità".
Parallelamente all'annuncio dell'infrastruttura, Mistral ha presentato la sua serie di modelli di ragionamento Magistral : sistemi di intelligenza artificiale in grado di elaborare un pensiero logico passo dopo passo, simili al modello o1 di OpenAI e al modello cinese DeepSeek R1 . Guillaume Lample, responsabile scientifico di Mistral, afferma tuttavia che l'approccio dell'azienda si differenzia da quello dei concorrenti per aspetti cruciali.
"Abbiamo fatto tutto da zero, fondamentalmente perché volevamo acquisire le competenze che possediamo, come la flessibilità in quello che facciamo", mi ha detto Lample in un'intervista esclusiva. "Siamo riusciti a essere davvero molto efficienti nel rafforzare il processo di apprendimento online."
A differenza dei competitor che spesso nascondono i loro processi di ragionamento, i modelli di Mistral mostrano agli utenti l'intera catena di pensiero e, soprattutto, nella loro lingua madre anziché in inglese. "Qui abbiamo l'intera catena di pensiero che viene presentata all'utente, ma nella sua lingua madre, in modo che possa effettivamente leggerla e verificarne il senso", ha spiegato Lample.
L'azienda ha rilasciato due versioni: Magistral Small , un modello open source da 24 miliardi di parametri, e Magistral Medium , un sistema proprietario più potente disponibile tramite l'API di Mistral.
I modelli hanno dimostrato capacità sorprendenti emerse durante l'addestramento. In particolare, Magistral Medium ha mantenuto capacità di ragionamento multimodale – la capacità di analizzare immagini – nonostante il processo di addestramento si concentrasse esclusivamente su problemi matematici e di programmazione basati su testo.
"Ciò che abbiamo capito, non esattamente per sbaglio, ma che non ci aspettavamo assolutamente, è che se alla fine dell'addestramento con apprendimento per rinforzo si ricollega il codificatore visivo iniziale, all'improvviso, come dal nulla, si vede il modello in grado di ragionare sulle immagini", ha affermato Lample.
I modelli hanno anche acquisito sofisticate capacità di chiamata di funzioni, eseguendo automaticamente ricerche su internet in più fasi ed eseguendo codice per rispondere a query complesse. "Quello che vedrete è un modello che fa questo, pensa, e poi realizza, ok, queste informazioni potrebbero essere aggiornate. Fammi fare una ricerca sul web", ha spiegato Lample. "Cercherà su internet, poi passerà effettivamente i risultati, li esaminerà e dirà, forse, forse la risposta non è in questi risultati. Fammi cercare di nuovo."
Questo comportamento è emerso naturalmente, senza un addestramento specifico. "È qualcosa che dipende o meno dalle cose da fare in seguito, ma abbiamo scoperto che in realtà accade in modo piuttosto naturale. Quindi è stata una sorpresa molto piacevole per noi", ha osservato Lample.
Il team tecnico di Mistral ha superato significative sfide ingegneristiche per creare quella che Lample descrive come una svolta nell'infrastruttura di training. L'azienda ha sviluppato un sistema di "apprendimento per rinforzo online" che consente ai modelli di intelligenza artificiale di migliorare costantemente durante la generazione di risposte, anziché basarsi su dati di training preesistenti.
L'innovazione chiave ha riguardato la sincronizzazione degli aggiornamenti del modello su centinaia di unità di elaborazione grafica (GPU) in tempo reale. "Quello che abbiamo fatto è stato trovare un modo per scomporre il modello semplicemente attraverso le GPU. Voglio dire, da GPU a GPU", ha spiegato Lample. Questo permette al sistema di aggiornare i pesi del modello su diversi cluster di GPU in pochi secondi, anziché nelle ore normalmente necessarie.
"Non esiste un'infrastruttura open source che possa farlo correttamente", ha osservato Lample. "In genere, ci sono molti tentativi open source simili, ma sono estremamente lenti. Qui ci siamo concentrati molto sull'efficienza".
Il processo di addestramento si è dimostrato molto più rapido ed economico rispetto al pre-addestramento tradizionale. "È stato molto più economico del pre-addestramento tradizionale. Il pre-addestramento è qualcosa che richiederebbe settimane o mesi su altre GPU. Qui, non ci siamo nemmeno avvicinati. Dipendeva da quante persone ci mettevamo. Ma in realtà è durato meno di una settimana", ha detto Lample.
La piattaforma Mistral Compute sarà basata su 18.000 dei più recenti chip Grace Blackwell di Nvidia, inizialmente ospitati in un data center a Essonne, in Francia, con piani di espansione in tutta Europa. Il CEO di Nvidia, Jensen Huang, ha descritto la partnership come cruciale per l'indipendenza tecnologica europea.
"Ogni Paese dovrebbe sviluppare l'IA per la propria nazione, nella propria nazione", ha dichiarato Huang in un annuncio congiunto a Parigi. "Con Mistral AI, stiamo sviluppando modelli e fabbriche di IA che fungono da piattaforme sovrane per le imprese di tutta Europa, consentendo loro di scalare l'intelligenza artificiale in tutti i settori industriali".
Huang ha previsto che la capacità di calcolo dell'IA in Europa decuplicherà nei prossimi due anni, con oltre 20 "fabbriche di IA" previste in tutto il continente. Molte di queste strutture avranno una capacità superiore a un gigawatt, classificandosi potenzialmente tra i più grandi data center al mondo.
La partnership si estende oltre l'infrastruttura e comprende il lavoro di Nvidia con altre aziende europee di intelligenza artificiale e Perplexity, la società di ricerca, per sviluppare modelli di ragionamento in varie lingue europee in cui i dati di addestramento sono spesso limitati.
Mistral Compute affronta due importanti preoccupazioni relative allo sviluppo dell'intelligenza artificiale: l'impatto ambientale e la sovranità dei dati. La piattaforma garantisce che i clienti europei possano conservare le proprie informazioni entro i confini dell'UE e sotto la giurisdizione europea.
L'azienda ha collaborato con l'agenzia nazionale francese per la transizione ecologica e con Carbone 4, una delle principali società di consulenza in materia di clima, per valutare e ridurre al minimo l'impronta di carbonio dei suoi modelli di intelligenza artificiale durante tutto il loro ciclo di vita. Mistral prevede di alimentare i suoi data center con fonti energetiche decarbonizzate.
"Scegliendo l'Europa come sede dei nostri siti, ci diamo la possibilità di beneficiare di fonti energetiche ampiamente decarbonizzate", ha affermato l'azienda nel suo comunicato.
I primi test suggeriscono che i modelli di ragionamento di Mistral offrono prestazioni competitive, risolvendo al contempo una critica comune ai sistemi esistenti: la velocità. Gli attuali modelli di ragionamento di OpenAI e di altri possono impiegare minuti per rispondere a query complesse, limitandone l'utilità pratica.
"Una delle cose che di solito non piace di questo modello di ragionamento è che, sebbene sia intelligente, a volte richiede molto tempo", ha osservato Lample. "Qui si vede davvero il risultato in pochi secondi, a volte meno di cinque secondi, a volte anche meno. E questo cambia l'esperienza."
Il vantaggio in termini di velocità potrebbe rivelarsi cruciale per l'adozione aziendale, in cui i minuti di attesa per le risposte dell'intelligenza artificiale creano colli di bottiglia nel flusso di lavoro.
L'ingresso di Mistral nel settore delle infrastrutture la pone in diretta competizione con i giganti della tecnologia che hanno dominato il mercato del cloud computing. Amazon Web Services , Microsoft Azure e Google Cloud attualmente controllano la maggior parte delle infrastrutture cloud a livello globale, mentre nuovi attori come CoreWeave hanno guadagnato terreno specificamente nei carichi di lavoro di intelligenza artificiale.
L'approccio dell'azienda si differenzia da quello dei competitor offrendo una soluzione completa e verticalmente integrata, dall'infrastruttura hardware ai modelli di intelligenza artificiale fino ai servizi software. Tra queste, Mistral AI Studio per gli sviluppatori, Le Chat per la produttività aziendale e Mistral Code per l'assistenza alla programmazione.
Gli analisti del settore considerano la strategia di Mistral parte di una tendenza più ampia verso lo sviluppo dell'IA a livello regionale. "L'Europa ha urgente bisogno di potenziare la propria infrastruttura di IA se vuole rimanere competitiva a livello globale", ha osservato Huang, facendo eco alle preoccupazioni espresse dai responsabili politici europei.
L'annuncio arriva in un momento in cui i governi europei sono sempre più preoccupati per la loro dipendenza dalle aziende tecnologiche americane per le infrastrutture critiche di intelligenza artificiale. L'Unione Europea ha impegnato 20 miliardi di euro per la costruzione di "gigafactory" di intelligenza artificiale in tutto il continente, e la partnership di Mistral con Nvidia potrebbe contribuire ad accelerare tali piani.
Il duplice annuncio di Mistral in termini di infrastruttura e capacità di modellazione evidenzia l'ambizione dell'azienda di diventare una piattaforma di intelligenza artificiale completa, piuttosto che un semplice fornitore di modelli. Con il sostegno di Microsoft e di altri investitori, l'azienda ha raccolto oltre 1 miliardo di dollari e continua a cercare ulteriori finanziamenti per supportare il suo raggio d'azione ampliato.
Ma Lample vede possibilità ancora più grandi per i modelli di ragionamento. "Penso che, analizzando i progressi internamente, e considerando alcuni benchmark, il modello ha ottenuto un'accuratezza del 5% in più ogni settimana per circa sei settimane in totale", ha affermato. "Quindi sta migliorando molto rapidamente, ci sono moltissime, intendo, tonnellate di piccole idee a cui si può pensare che miglioreranno le prestazioni."
Il successo di questa sfida europea al dominio americano dell'intelligenza artificiale potrebbe in ultima analisi dipendere dal fatto che i clienti apprezzino abbastanza la sovranità e la sostenibilità da abbandonare i fornitori consolidati. Per ora, almeno, hanno una scelta.
Se vuoi fare colpo sul tuo capo, VB Daily è la soluzione che fa per te. Ti offriamo informazioni privilegiate su ciò che le aziende stanno facendo con l'IA generativa, dai cambiamenti normativi alle implementazioni pratiche, così puoi condividere spunti per massimizzare il ROI.
Leggi la nostra Informativa sulla privacy
Grazie per l'iscrizione. Scopri altre newsletter di VB qui .
Si è verificato un errore.

venturebeat