Studenten die wonnen waar hun leraren verloren: een nieuwe definitie van genialiteit is geboren
Juli 2025, in een Australisch examenlokaal, terwijl de klok onverbiddelijk tikt, proberen honderden tieners enkele van de moeilijkste en meest uitdagende wiskundeopgaven op te lossen. Ze hebben geen toegang tot rekenmachines of internet. Alleen papier, potloden en hun vindingrijkheid. Wat dit jaar zo bijzonder was, was niet alleen het menselijke talent dat bijeenkwam op de Internationale Wiskunde Olympiade (IMO), maar ook het feit dat kunstmatige intelligentie een jaar geleden voor het eerst iets ondenkbaars presteerde . En hoewel de machines schitterden als nooit tevoren... wonnen mensen, althans voorlopig.
Een andere vraag die dit verhaal oproept, is of, nu AI een steeds grotere rol speelt in de academische wereld, er een onvermijdelijke vraag ontstaat: wat betekent het om briljant te zijn in een tijdperk waarin AI bijna alles kan oplossen?
De IMO is geen gewone wedstrijd. Gedurende twee dagen moeten leerlingen zes problemen oplossen die niet alleen logica en techniek vereisen, maar ook creativiteit en wiskundige intuïtie. De vragen, die variëren van algebra tot getaltheorie, zijn zo ontworpen dat ze uniek zijn. Als ze lijken op iets dat al ergens ter wereld is opgelost, worden ze afgewezen.
Dit jaar behoorden onder de deelnemers enkele van de slimste jongeren ter wereld, en tot de genodigden behoorden toptechbedrijven, met een focus op het AI-model Gemini Deep Think van Google DeepMind. Deze AI werd beoordeeld volgens dezelfde criteria en tijd als mensen: vierenhalf uur per examen, zonder externe assistentie. IMO pakt originele, nieuwe en onconventionele problemen aan, terwijl een AI wordt getraind met enorme hoeveelheden problemen en het proces herhaalt. Desondanks won de AI de gouden medaille door vijf van de zes problemen perfect op te lossen en 35 van de 42 mogelijke punten te behalen. Dit waren echter niet de hoogste scores van het evenement.
Zesentwintig studenten presteerden beter dan de machines. Van het Amerikaanse team, dat achter de Chinezen eindigde, viel Alexander Wang op, een student uit New Jersey die zijn derde gouden medaille op rij won en, volgens The Wall Street Journal, een van de meest gedecoreerde jonge wiskundigen aller tijden was. De andere was Qiao "Tiger" Zhang , die moedig de gevreesde opgave 6, de moeilijkste van dit jaar, aanpakte. Deze laatste opgave, een combinatorisch probleem, stelde zowel de AI's als 569 van de 630 deelnemers voor een raadsel. Slechts zes studenten losten hem volledig op.
Zhang was niet een van hen, maar zijn gedeeltelijke oplossing was meer waard dan het complete gebrek aan ideeën van de machines. Desondanks voorspelde Zhang zelf dat de AI volgend jaar een perfecte score zou kunnen behalen. "De dag dat een AI Probleem 6 zou oplossen," zei Zhang, "zou ik me zorgen gaan maken."
-
Beschouw een raster van 2025x2025 met eenheidsvierkanten. Matilda wil verschillende rechthoekige tegels, mogelijk van verschillende grootte, op het raster plaatsen, zodat elke zijde van elke tegel op een rasterlijn ligt en elk eenheidsvierkant door maximaal één tegel wordt bedekt. Bepaal het minimale aantal tegels dat Matilda moet plaatsen, zodat elke rij en elke kolom van het raster precies één eenheidsvierkant heeft dat niet door een tegel wordt bedekt.
En toen Thang Luong, leider van het Google DeepMind-team, werd gevraagd of dit het jaar zou worden dat de geschiedenis in zou gaan als het jaar waarin de mens AI zou overtreffen, zei hij: "Dat zou heel goed kunnen" ,
De makers van deze AI's vierden hun prestaties. Google prees de prestaties van Gemini als een historische sprong, niet alleen vanwege de behaalde score, maar ook omdat het model, in tegenstelling tot het voorgaande jaar, direct in natuurlijke taal kon redeneren, zonder de problemen naar code te hoeven vertalen. Het voldeed ook aan de testtijd, een prestatie die een jaar geleden ondenkbaar zou zijn geweest. OpenAI testte zijn model daarentegen buiten het officiële evenement, maar met onafhankelijke evaluatoren en dezelfde problemen. Het resultaat was hetzelfde: goud.
Een paar maanden voor deze wedstrijd , in mei 2025, vond er een ongewone bijeenkomst plaats op de campus van de Universiteit van Californië in Berkeley. Dertig van 's werelds meest prestigieuze wiskundigen kwamen bijeen in een geheim conclaaf, niet om met elkaar te debatteren, maar om het op te nemen tegen een kunstmatige intelligentie: o4-mini. Een state-of-the-art taalmodel, ontwikkeld door OpenAI, dat met ongekende snelheid en nauwkeurigheid kan redeneren. Ze probeerden zeer complexe problemen op te lossen die de AI zouden overweldigen, maar die een ongekend probleemoplossend vermogen vertoonden. Deelnemers merkten op dat het was alsof ze voor een uiterst competente promovendus stonden, "nog meer zelfs."
Betekent dit dat deze onderzoekers verslagen werden waar de jongeren zegevierden? Het antwoord is nee, omdat de context en de probleemoplossing anders zijn, maar er is wel een interessante achtergrond.
Als we Gemini zelf vragen, is de conclusie dat studenten in de IMO de AI verslaan bij het oplossen van problemen die ontworpen zijn voor competitief opgeleide individuen, door gebruik te maken van creativiteit, nauwkeurigheid en wiskundige intuïtie in een beperkte tijd. De IMO-problemen zijn ontworpen om vindingrijkheid en lateraal denken te stimuleren, niet alleen brute logische kracht, en AI's worstelen nog steeds met dit soort problemen die niet-voor de hand liggende redeneersprongen vereisen. Maar AI wint steeds vaker bij formele, gestructureerde of enorm verkennende problemen, zoals die van puur onderzoek .
Ervaren wiskundigen werken aan het ontdekken van nieuwe theorieën, niet alleen aan het oplossen van puzzels. De vergelijking laat zien dat het pad van de menselijke wiskunde niet lineair is; je kunt uitblinken door op te lossen wat anderen je voorleggen (naar mijn mening), en vervolgens kun je proberen problemen te creëren die nog nooit iemand heeft opgelost. Het is dus niet zo dat sommigen verliezen en anderen winnen. Het is dat ze zich in verschillende stadia van hetzelfde proces bevinden.
Verre van deze evolutie als een bedreiging te zien, zien sommige van dezelfde mensen die deze machines hebben ontworpen het als een nieuwe vorm van samenwerking. "Deze AI is als een nieuwe rekenmachine", aldus Thang Luong, leider van het DeepMind-team. "Een hulpmiddel dat ons verder kan brengen, niet vervangen."
Zhang zelf ziet AI, ondanks dat hij het heeft verslagen, niet als een rivaal, maar eerder als een stimulans om beter, dieper en gedurfder te denken. Voormalig goudenmedaillewinnaar en huidig DeepMind-onderzoeker Junehyuk Jung is het daarmee eens: echt complexe problemen – zoals het beroemde Probleem 6 – zullen machines nog jarenlang blijven uitdagen.
De wiskundigen op de geheime bijeenkomst vroegen zich af of ze uiteindelijk 'vraagstellers' zouden kunnen worden, die AI's naar nieuwe ontdekkingen zouden leiden. En zo ja, dan weten ze nog niet wat dat inhoudt.
Een paar jaar geleden betekende briljant zijn in wiskunde onder andere dat je problemen kon oplossen die niemand anders kon. Tegenwoordig is dat niet meer voldoende. Wanneer machines diezelfde niveaus kunnen bereiken, ligt het nieuwe domein van genialiteit elders: in het vermogen om vooral nieuwe vragen te formuleren. Want hoewel AI vakkundig problemen kan oplossen, weet het nog niet wat de moeite waard is om te vragen.
ABC.es