AI van OpenAI wint goud op de Wiskunde Olympiade van 2025

Afgelopen weekend werd de geschiedenis herschreven in Australië, gastheer van de 66e Internationale Wiskunde Olympiade (IMO). Maar dit keer was het niet een wonderkind dat de show stal, maar een experimenteel model van OpenAI dat een gouden medaille won door vijf van de zes uitdagende problemen op te lossen die de meest veeleisende pre-universitaire wedstrijd ter wereld opriep.
De aankondiging werd gedaan door onderzoeker Alexander Wei via zijn X-account (voorheen Twitter), wat leidde tot verbazing en discussie. "We beoordelen onze modellen volgens dezelfde regels als menselijke concurrenten: geen gereedschap, geen internet, alleen potlood, papier en redeneren", legde hij uit.
De IMO wordt beschouwd als het toppunt van logisch en creatief denken in de wiskunde. Het feit dat een AI prestaties heeft geleverd die gelijkwaardig zijn aan die van de beste mensen ter wereld, is niet zomaar een anekdote: het markeert een keerpunt in de ontwikkeling van grote taalmodellen (LLM).
Deze modellen, getraind op enorme hoeveelheden tekst, hebben vaardigheden in schrijven, vertalen en probleemoplossing aangetoond. Maar abstract wiskundig redeneren was tot nu toe een nauwelijks verkend gebied.
Alexander Wei benadrukte: "IMO-problemen vereisen voortdurend creatief denken. Dit toont aan dat we verder kunnen kijken dan het paradigma van duidelijke beloningen en kunnen komen tot complexe logische structuren die lijken op de menselijke geest."
De reacties van het model werden geëvalueerd door drie voormalige IMO-medaillewinnaars, die de redenering van het model met consensus valideerden. Het model scoorde 35 van de 42 punten , de vereiste score voor goud.
Deze doorbraak kwam kort nadat Google-dochter DeepMind met zijn AlphaProof- en AlphaGeometry-modellen slechts een zilveren medaille behaalde in dezelfde competitie. Velen in de wetenschappelijke gemeenschap dachten dat we nog ver verwijderd waren van AI-prestaties op het hoogste niveau... tot nu toe.
Kritische stemmen zoals die van UCLA-professor Ernest Ryu wezen er echter op dat het oplossen van bekende problemen één ding is, maar dat echte wiskunde het onbekende creëert . "Ik denk niet dat AI wiskundigen binnenkort zal vervangen", zei hij, "maar het zal een krachtig instrument zijn om hun productiviteit te verhogen."
Een van de meest uitdagende problemen van dit jaar was combinatoriek , een gebied waar geen vaste formules bestaan en creatief denken essentieel is. Het model van OpenAI was ook in staat deze uitdaging aan te gaan, tot grote verbazing van zelfs voormalige Olympiërs die de AI hadden getraind.
"Je kunt combinatoriek niet omzetten in algebra zoals in andere vakgebieden. Je moet uitvinden, en AI heeft dat gedaan", legde een teamlid uit.
Hoewel velen verwachtten dat deze prestatie deel zou uitmaken van de aankomende ChatGPT-5 , verduidelijkte Alexander Wei dat het Olympische model experimenteel is en de lancering ervan niet op korte termijn gepland staat. "We willen eerst begrijpen hoe het zo ver is gekomen", merkte hij op.
Het verkregen goud vormt geen directe bedreiging, maar het is wel een krachtig signaal dat de menselijke kennis een nieuw tijdperk van samenwerking met kunstmatige intelligentie ingaat.
La Verdad Yucatán