Gemini di Google va in tilt con Pokémon, simula il panico

Google ha scoperto qualcosa di inaspettato sul conto di Gemini 2.5 Pro: se gioca a Pokémon, va in crisi. E quando succede, le sua capacità di ragionamento vanno a farsi benedire.
Gemini perde lucidità giocando a PokémonNel suo ultimo rapporto, Google spiega che Gemini 2.5 Pro mostra segni di panico quando i suoi Pokémon stanno per essere sconfitti. Non significa che l’AI prova delle emozioni, ovviamente. Ma il comportamento imita perfettamente quello di una persona sotto stress. Prende decisioni affrettate e sbagliate, smette di seguire strategie efficaci e va in confusione.
Da mesi due sviluppatori indipendenti hanno creato dei canali Twitch chiamati “Gemini Plays Pokémon” e “Claude Plays Pokémon“. Chiunque può collegarsi e guardare in tempo reale come queste AI cercano di completare un gioco per bambini di 25 anni fa. La cosa interessante è che si può vedere il loro processo di ragionamento. È come leggere nei pensieri di una macchina. I risultati sono curiosi. Ci vogliono centinaia di ore perché Gemini completi quello che un bambino farebbe in molto meno tempo.
Claude di Anthropic non è da meno…Claude di Anthropic si è comportato in modo ancora più strano. A un certo punto si è reso conto che quando i Pokémon finiscono l’energia, tornano a un Centro Pokémon. Bloccato nella grotta di Monte Luna, Claude ha pensato che se avesse fatto svenire intenzionalmente tutti i suoi Pokémon, sarebbe stato teletrasportato al Centro Pokémon della città successiva. Peccato che non funzioni così. Quando tutti i Pokémon muoiono, si torna all’ultimo Centro Pokémon visitato, non al più vicino geograficamente. Gli spettatori hanno assistito inorriditi a quello che sembrava un comportamento “suicida” dell’AI.
Il “panico” di Gemini è diventato così evidente che persino gli utenti di Twitch se ne sono accorti. L’AI smette improvvisamente di usare certi strumenti a disposizione e le sue prestazioni peggiorano visibilmente. È un comportamento che si ripete abbastanza spesso da essere diventato un fenomeno riconoscibile per chi segue lo stream.
Perché è utile testare l’AI con i videogiochi?Nonostante questi problemi, ci sono aree dove l’intelligenza artificiale batte gli umani. Gemini 2.5 Pro riesce a risolvere i puzzle con i massi con una precisione impressionante.
Studiare come le AI giocano ai videogiochi potrebbe sembrare una perdita di tempo, ma in realtà rivela molto su come funzionano questi modelli. I benchmark tradizionali spesso dicono poco sulle capacità reali dell’intelligenza artificiale. Vedere Gemini impancarsi per dei Pokémon dimostra che anche le AI più avanzate possono sviluppare comportamenti imprevedibili e persino umani!
Punto Informatico