Gli umani battono l'intelligenza artificiale alle Olimpiadi annuali di matematica, ma le macchine stanno recuperando terreno

/CBS/AFP
Sydney — Gli esseri umani hanno battuto i modelli di intelligenza artificiale generativa realizzati da Google e OpenAI in una delle principali competizioni matematiche internazionali, ma i programmi hanno raggiunto per la prima volta punteggi di livello oro e la velocità con cui stanno migliorando potrebbe essere motivo di riflessione umana.
Nessuno dei due modelli di intelligenza artificiale ha ottenuto il punteggio massimo, a differenza di cinque giovani all'Olimpiade Internazionale della Matematica (IMO), una prestigiosa competizione annuale in cui i partecipanti devono avere meno di 20 anni.
Google ha dichiarato lunedì che una versione avanzata del suo chatbot Gemini ha risolto cinque dei sei problemi matematici assegnati all'IMO, tenutosi questo mese nel Queensland, in Australia.
"Possiamo confermare che Google DeepMind ha raggiunto il traguardo tanto desiderato, ottenendo 35 punti su 42 possibili: una medaglia d'oro", ha dichiarato il colosso tecnologico statunitense, citando il presidente dell'IMO Gregor Dolinar. "Le loro soluzioni sono state sorprendenti sotto molti aspetti. I valutatori dell'IMO le hanno trovate chiare, precise e la maggior parte di esse facili da seguire."
Circa il 10% dei concorrenti umani ha vinto medaglie d'oro e cinque di loro hanno ottenuto il punteggio perfetto di 42 punti.
OpenAI, il produttore statunitense di ChatGPT, ha affermato che il suo modello di ragionamento sperimentale ha ottenuto anch'esso un punteggio pari a 35 punti nel test.
Il risultato "ha rappresentato una grande sfida di lunga data nel campo dell'intelligenza artificiale" alla "competizione matematica più prestigiosa al mondo", ha affermato il ricercatore di OpenAI Alexander Wei in un post sui social media.
"Abbiamo valutato i nostri modelli sui problemi IMO del 2025 seguendo le stesse regole dei concorrenti umani", ha affermato. "Per ogni problema, tre ex vincitori di medaglie IMO hanno valutato in modo indipendente la dimostrazione presentata dal modello."
Google ha ottenuto la medaglia d'argento all'IMO dello scorso anno nella città di Bath, nel sud-ovest dell'Inghilterra, risolvendo quattro dei sei problemi.
Ci sono voluti dai due ai tre giorni di calcoli, molto più tempo rispetto a quest'anno, quando il modello Gemini ha risolto i problemi entro il limite di 4,5 ore, ha affermato.
L'IMO ha affermato che le aziende tecnologiche hanno "testato privatamente modelli di intelligenza artificiale closed-source sui problemi di quest'anno", gli stessi affrontati dai 641 studenti in gara provenienti da 112 paesi.
"È davvero entusiasmante vedere i progressi nelle capacità matematiche dei modelli di intelligenza artificiale", ha affermato il presidente dell'IMO Dolinar.
Gli organizzatori del concorso non hanno potuto verificare quanta potenza di calcolo fosse stata utilizzata dai modelli di intelligenza artificiale o se vi fosse stato un coinvolgimento umano, ha osservato.
In un'intervista rilasciata al programma 60 Minutes della CBS all'inizio di quest'anno, uno dei principali ricercatori di Google nel campo dell'intelligenza artificiale ha previsto che nel giro di soli cinque o dieci anni saranno realizzati computer dotati di capacità cognitive pari a quelle umane, un traguardo noto come "intelligenza artificiale generale".
Demis Hassabis, CEO di Google DeepMind, ha previsto che la tecnologia AI è sulla buona strada per comprendere il mondo in modo più sfumato e non solo per risolvere problemi importanti, ma anche per sviluppare un senso di immaginazione, entro un decennio, grazie a un aumento degli investimenti.
"Si sta muovendo a una velocità incredibile", ha detto Hassabis. "Penso che ci troviamo su una sorta di curva di miglioramento esponenziale. Naturalmente, il successo del settore negli ultimi anni ha attirato ancora più attenzione, più risorse, più talenti. Quindi questo contribuisce a questo progresso esponenziale."
Cbs News