Les humains battent l'IA aux Olympiades annuelles de mathématiques, mais les machines les rattrapent

/ CBS/AFP
Sydney — Les humains ont battu les modèles d'IA générative créés par Google et OpenAI lors d'une compétition internationale de mathématiques de premier plan, mais les programmes ont atteint des scores de niveau or pour la première fois, et la vitesse à laquelle ils s'améliorent peut être un motif d'introspection humaine.
Aucun des deux modèles d’IA n’a obtenu la note maximale, contrairement à cinq jeunes participants à l’Olympiade internationale de mathématiques (IMO), une prestigieuse compétition annuelle où les participants doivent avoir moins de 20 ans.
Google a annoncé lundi qu'une version avancée de son chatbot Gemini avait résolu cinq des six problèmes mathématiques posés lors de l'IMO, qui s'est tenue ce mois-ci dans le Queensland en Australie.
« Nous pouvons confirmer que Google DeepMind a atteint le cap tant attendu, obtenant 35 points sur 42 possibles – une médaille d'or », a déclaré le géant technologique américain, citant Gregor Dolinar, président de l'IMO. « Leurs solutions étaient étonnantes à bien des égards. Les évaluateurs de l'IMO les ont trouvées claires, précises et, pour la plupart, faciles à suivre. »
Environ 10 % des concurrents humains ont remporté des médailles de niveau or, et cinq ont reçu des scores parfaits de 42 points.
OpenAI, le créateur américain de ChatGPT, a déclaré que son modèle de raisonnement expérimental avait également obtenu un score de 35 points au niveau or au test.
Le résultat « a permis de relever un grand défi de longue date en matière d'IA » lors de « la compétition mathématique la plus prestigieuse au monde », a déclaré le chercheur d'OpenAI Alexander Wei dans un message sur les réseaux sociaux.
« Nous avons évalué nos modèles sur les problèmes de l'IMO 2025 selon les mêmes règles que les concurrents humains », a-t-il déclaré. « Pour chaque problème, trois anciens médaillés de l'IMO ont évalué indépendamment la preuve soumise par le modèle. »
Google a obtenu une médaille d'argent à l'IMO de l'année dernière dans la ville de Bath, dans le sud-ouest de l'Angleterre, en résolvant quatre des six problèmes.
Cela a pris deux à trois jours de calcul, bien plus longtemps que cette année, lorsque son modèle Gemini a résolu les problèmes dans le délai de 4,5 heures, a-t-il déclaré.
L'OMI a déclaré que les entreprises technologiques avaient « testé en privé des modèles d'IA à source fermée sur les problèmes de cette année », les mêmes que ceux rencontrés par 641 étudiants concurrents de 112 pays.
« C’est très enthousiasmant de voir des progrès dans les capacités mathématiques des modèles d’IA », a déclaré le président de l’OMI, Dolinar.
Les organisateurs du concours n’ont pas pu vérifier la puissance de calcul utilisée par les modèles d’IA ni s’il y avait eu une intervention humaine, a-t-il noté.
Dans une interview accordée à l'émission 60 Minutes de CBS plus tôt cette année, l'un des principaux chercheurs en IA de Google a prédit que d'ici cinq à dix ans seulement, des ordinateurs seraient fabriqués avec des capacités cognitives de niveau humain - une étape importante connue sous le nom d'« intelligence artificielle générale ».
Demis Hassabis, PDG de Google DeepMind, a prédit que la technologie de l'IA était en passe de comprendre le monde de manière nuancée et de non seulement résoudre des problèmes importants, mais même de développer un sens de l'imagination, d'ici une décennie, grâce à une augmentation des investissements.
« Les choses évoluent à une vitesse incroyable », a déclaré Hassabis. « Je pense que nous sommes sur une courbe d'amélioration exponentielle. Bien sûr, le succès de ce domaine ces dernières années a attiré encore plus d'attention, de ressources et de talents. Cela contribue à cette progression exponentielle. »
Cbs News