Claude, l'IA d'Anthropic, joue à Pokémon sur Twitch — lentement

Mardi après-midi, Anthropic a lancé Claude Plays Pokémon sur Twitch, un flux en direct du nouveau modèle d'IA d'Anthropic, Claude 3.7 Sonnet , en train de jouer à Pokémon Rouge. C'est devenu une expérience fascinante en quelque sorte, qui met en valeur les capacités de la technologie d'IA d'aujourd'hui et les réactions des gens à leur égard.
Les chercheurs en intelligence artificielle ont utilisé toutes sortes de jeux vidéo , de Street Fighter à Pictionary , pour tester de nouveaux modèles, souvent plus pour le plaisir que pour l’utilité. Mais Anthropic a déclaré que Pokémon s’est avéré être une référence utile pour Claude 3.7 Sonnet, qui peut « réfléchir » efficacement aux types d’énigmes que le jeu contient.
Tout comme o3-mini d'OpenAI et R1 de DeepSeek, Claude 3.7 Sonnet peut « raisonner » pour relever des défis difficiles, comme jouer à un jeu vidéo conçu pour les enfants. Alors que le prédécesseur non raisonné du modèle, Claude 3.5 Sonnet , a échoué au tout début de Pokémon Rouge (quittant la maison du joueur à Bourg Palette), Claude 3.7 Sonnet a réussi à gagner trois badges de leader d'arène.

Le dernier Claude a néanmoins rencontré des problèmes. Après plusieurs heures de diffusion sur Twitch, le modèle a été dissuadé par un mur de pierre, qu'il n'a pas pu traverser, malgré tous ses efforts.
Un utilisateur de Twitch a résumé la situation ainsi : « Qui gagnerait, une IA informatique avec des milliers d'heures consacrées à sa programmation, ou un mur d'escalade ? »
Finalement, Claude s'est rendu compte qu'il pouvait contourner le mur.
D'un côté, il est frustrant de voir Claude traverser Pokémon Rouge à la vitesse d'un Slowpoke , en réfléchissant à chaque étape avec une réflexion atroce. Mais c'est aussi étrangement convaincant. La gauche du flux montre le « processus de réflexion » de Claude, tandis que la droite montre le gameplay en temps réel.
À un moment donné, Claude a tenté de localiser le professeur Oak à l'intérieur de son laboratoire, mais il a été confus, car il y avait d'autres PNJ dans la scène.
« Je remarque qu’un nouveau personnage est apparu en dessous de moi – un personnage aux cheveux noirs et ce qui semble être une blouse blanche aux coordonnées (2, 10) », a écrit Claude. « Il pourrait s’agir du professeur Oak ! Laissez-moi descendre et lui parler. »
Claude a ensuite commencé à parler par erreur à un PNJ autre que le Processeur, un PNJ avec lequel le modèle avait déjà parlé plusieurs fois auparavant. Certaines des quelques milliers de personnes présentes dans le chat Twitch ont commencé à s'impatienter. D'autres, en particulier celles qui regardaient le stream depuis plus de quelques minutes, étaient moins inquiètes.
« Les gars, détendez-vous », a écrit une personne dans le chat. « Avant, nous sortions et entrions dans le laboratoire d'Oak une dizaine de fois avant de comprendre comment avancer. »

Pour les utilisateurs de Twitch de longue date, le format du stream d'Anthropic peut sembler nostalgique. Il y a plus de dix ans, des millions de personnes ont essayé de jouer à Pokémon Rouge en même temps dans une expérience sociale en ligne inédite appelée Twitch Plays Pokémon . Chaque utilisateur pouvait contrôler le personnage du joueur via le chat Twitch, ce qui donnait lieu à un gameplay prévisiblement chaotique.
Certains chercheurs en IA ont cité Twitch Plays Pokémon comme source d’inspiration pour leurs travaux. En octobre 2023, Peter Whidden, ingénieur logiciel basé à Seattle, a publié une vidéo YouTube détaillant comment il a entraîné un algorithme d’apprentissage par renforcement pour jouer à Pokémon. Son IA a passé plus de 50 000 heures à jouer au jeu avant d’apprendre à s’y retrouver avec succès. L’un des défis était que l’IA préférait admirer le décor pixellisé au lieu de jouer réellement au jeu.
Les « reconstitutions » de Pokémon de Twitch Plays, comme ceux de Whidden et d'Anthropic, alimentées par l'IA, sont divertissantes, mais un peu douces-amères en même temps. Le stream original a été un moment charnière dans l'histoire de Twitch parce qu'il a réuni les gens d'une manière inattendue. Tout le monde faisait partie de la même équipe, travaillant dans le but d'amener le personnage du joueur à arrêter de tourner en rond et à progresser dans le jeu.
En 2025, nous ne sommes plus des coéquipiers, mais des spectateurs, observant un modèle d'IA essayer de jouer à un jeu auquel beaucoup d'entre nous ont pris goût à l'âge de cinq ans. C'est un microcosme motivé par l'IA d'une tendance plus large : nos expériences en ligne passent d'activités partagées et communautaires à des activités plus solitaires.
techcrunch