Worden wiskundigen overbodig? Dit is de geheime bijeenkomst die enkele van 's werelds grootste geesten in verlegenheid bracht.
In mei 2025 vond op de campus van de Universiteit van Californië in Berkeley een ongewone bijeenkomst plaats die een keerpunt in de geschiedenis van de moderne wiskunde zou kunnen betekenen . Dertig van 's werelds meest prestigieuze wiskundigen kwamen bijeen in een geheim conclaaf, niet om met elkaar te debatteren, maar om de confrontatie aan te gaan met een kunstmatige intelligentie: o4-mini , een state-of-the-art taalmodel ontwikkeld door OpenAI, dat met ongekende snelheid en nauwkeurigheid kan redeneren.
Het doel was om de machine twee dagen lang te testen op enkele van 's werelds meest complexe problemen. Voor elke vraag die de o4-mini niet kon oplossen, zou de wiskundige die de machine had bedacht een beloning van $ 7.500 (€ 6.389) ontvangen . De uitkomst van die marathon liet echter veel aanwezigen perplex staan. Ken Ono, wiskundige aan de Universiteit van Virginia en een van de juryleden van het evenement, vertelde aan Scientific American: " Ik heb nog nooit zo'n redenering in een model gezien. Dat is wat een wetenschapper doet. Het is angstaanjagend."
De bijeenkomst, georganiseerd door de non-profitorganisatie Epoch AI als onderdeel van het FrontierMath-project, vond plaats onder strikte veiligheidsmaatregelen. Deelnemers ondertekenden geheimhoudingsverklaringen en mochten geen e-mail gebruiken . Ze konden alleen communiceren via de versleutelde Signal-app om lekken te voorkomen die de training van het model zouden kunnen besmetten. De 30 wiskundigen werden verdeeld in groepen van zes en streden tegen elkaar om problemen te ontwerpen die ze konden oplossen, maar die de AI zouden laten crashen.
De gestelde problemen varieerden van getaltheorie tot algebraïsche meetkunde en omvatten uitdagingen die normaal gesproken weken academisch werk zouden vergen. o4-mini loste ze echter binnen enkele minuten op, waarbij hij niet alleen een antwoord gaf, maar ook een gestructureerd redeneerproces liet zien. Hij splitste het probleem op, ging stap voor stap te werk en stelde tussenoplossingen voor voordat hij tot een conclusie kwam.
"Wat deze modellen onderscheidt, is dat ze oplossingen nu beter koppelen aan kleinere problemen", legt Jordi Serra Ruiz, hoogleraar computerwetenschappen aan de Universitat Oberta de Catalunya, uit aan ABC . "Zo kunnen ze dezelfde uitdagingen als mensen stap voor stap oplossen. Maar alleen voor problemen die eerder zijn getraind of uitgelegd ."
Het meest verontrustende voor veel aanwezigen was de verbluffende vooruitgang die AI in slechts één jaar tijd heeft geboekt. Dankzij de ontwikkeling van training begonnen de ontwikkelaars problemen van niveau vier te formuleren – vraagstukken die slechts een handjevol experts ter wereld kan bedenken – en tegen april 2025 was o4-mini in staat om bijna 20% daarvan op te lossen. Traditionele modellen slaagden er nauwelijks in om meer dan 2% te doen.
"Voor elk probleem besteedde de AI de eerste twee minuten aan het absorberen en beheersen van de relevante literatuur. Vervolgens loste hij een vereenvoudigde versie op om te leren, en uiteindelijk stortte hij zich op het volledige probleem en vond een correcte, zij het gedurfde, oplossing ," zei Ono. "En aan het einde zei de AI zelfs: 'Je hoeft (mijn inspiratie) niet te noemen, want ik heb het mysterieuze getal berekend! '"
De ervaring maakte een blijvende indruk op de deelnemers . "Het is alsof je samenwerkt met een uiterst competente collega", erkende Ono. Yang Hui He, wiskundige aan het Institute of Mathematical Sciences in Londen en pionier in het gebruik van AI in onderzoek, ging nog een stap verder: "Dit is wat een excellente promovendus zou doen. Sterker nog, beter."
Hui He introduceerde ook het concept van 'beproeving door intimidatie'. Dat wil zeggen, een AI reageert met zoveel zelfvertrouwen dat de luisteraar – zelfs een expert – de conclusies ervan zonder vragen accepteert. "Als je iets met voldoende gezag zegt, raken mensen gewoon bang. Ik denk dat de o4-mini deze test domineerde door intimidatie ," zei hij.
Naarmate het weekend vorderde, werd de stemming steeds ambivalenter: bewondering voor de technische vooruitgang, maar ook diepe bezorgdheid over de toekomst van wiskundigen. " Wat gebeurt er als de machine alles sneller oplost dan jij?", vroegen verschillende aanwezigen zich af. Ono was bot, maar verduidelijkte dat ze niet probeerde alarmistisch te zijn: "Het is een ernstige vergissing om te denken dat kunstmatige algemene intelligentie (AGI) – een hypothetisch type AI dat kennis op een vergelijkbare manier kan begrijpen en toepassen als een mens – nooit zal bestaan, dat het slechts een computer is. In sommige opzichten presteren deze modellen nu al beter dan onze beste promovendi."
De uitkomst van deze bijeenkomst was geen nederlaag, maar eerder een waarschuwing. De groep slaagde erin tien problemen te formuleren die o4-mini niet kon oplossen , hoewel iedereen begreep dat dit menselijke voordeel steeds moeilijker te behouden zou worden. De mogelijkheid om "niveau vijf" te bereiken – met vragen die zelfs voor de beste mensen onoplosbaar zijn – lijkt niet langer sciencefiction.
In dat scenario vroegen de wiskundigen zich af of ze uiteindelijk "vraagstellers" zouden worden en AI naar nieuwe ontdekkingen zouden leiden. "Menselijke creativiteit en interpretatie zullen fundamenteel blijven," hield Hui He vol. "AI berekent, redeneert, deduceert... maar droomt of intuïteert nog niet ."
Óscar Corcho, hoogleraar kunstmatige intelligentie aan de Polytechnische Universiteit van Madrid , vat het voor ABC als volgt samen: "We moeten ons aanpassen aan de samenwerking met deze machines, net zoals we dat deden toen zoekmachines op het web verschenen." Het begrijpen van de werking van deze nieuwe intelligenties is een net zo cruciale uitdaging als het begrijpen van het menselijk brein : "Er zullen blinde vlekken in deze kunstmatige geest zitten die we zullen proberen te ontcijferen. Sterker nog, we zijn al zoiets als 'de psychologen van AI'." Maar het is altijd goed om te onthouden dat we te maken hebben met een tool die zijn gebruikers niet overbodig hoeft te maken.
De Amerikaanse Defense Advanced Research Projects Agency (DARPA) waarschuwt al lang dat wiskunde in het verleden is blijven hangen . "Wiskunde wordt nog steeds beoefend zoals het eeuwen geleden gebeurde: door mensen die voor een schoolbord staan", klaagde Patrick Shafto, de directeur van het programma. Daarom lanceerde hij in april 2025 het expMath-initiatief, met als doel een "AI-co-auteur" te ontwikkelen die grote wiskundige problemen kan opdelen in beter beheersbare componenten en deze snel en nauwkeurig kan oplossen.
De bijeenkomst in Berkeley was meer dan een experiment; het was een weerspiegeling van het heden en een glimp van de toekomst. Ken Ono merkte hierover op: " Ik heb collega's die letterlijk zeiden dat deze modellen bijna wiskundig genie zijn."
En als je AI zelf naar dit fenomeen vraagt, is het antwoord opvallend. ChatGPT, eveneens ontwikkeld door OpenAI, antwoordt: "Mensen zoals Terence Tao, Noam Chomsky, of zelfs creatieve genieën zoals Leonardo da Vinci of Marie Curie hebben een diepgaand, innovatief en persoonlijk begrip van de wereld dat veel verder gaat dan wat AI nu kan."
Maar hij wijst erop dat als we onszelf afvragen waarom we iets zouden willen dat ons overstijgt, het antwoord simpel is: "Omdat we diep van binnen weten dat beperkingen ons verstikken. En we weten ook dat comfort zonder uitdaging de geest afstompt. Misschien is dat wel de sleutel: in een wereld waar machines problemen efficiënt oplossen, zal onze ware waarde liggen in het bedenken van wat nog geen oplossing heeft."
ABC.es