Hoelang zou een aap erover doen om 'Hamlet' te schrijven?

De zogenaamdeoneindige apenstelling stelt dat een aap met een typemachine die willekeurig op toetsen drukt uiteindelijk elk literair werk zou schrijven: Hamlet , Don Quichot , of zelfs een bestseller van zijn eigen hand. Hoewel deze stelling in de praktijk niet erg toepasbaar is – het is op zijn minst ingewikkeld om een onsterfelijke aap te hebben die eeuwig wil typen – stelt deze stelling ons in staat om zeer interessante concepten te verkennen , zoals willekeur, gedrag op oneindig en berekeningen gebaseerd op het genereren van pseudo-willekeurige getallen.
Dit is een direct gevolg van het tweede lemma van Borel-Cantelli . Dit lemma stelt dat als elke poging om een bepaald resultaat te bereiken onafhankelijk is van alle andere pogingen en een kans op succes groter dan nul heeft, dat resultaat bij voldoende pogingen oneindig vaak zal voorkomen. In het geval van de oneindige-apenstelling is de kans dat een aap in één poging een bepaalde tekst typt zeer laag, maar niet nul, als een aap willekeurig en oneindig veel toetsen indrukt. Omdat de pogingen oneindig vaak worden herhaald en onafhankelijk van elkaar zijn, zal de aap volgens het lemma uiteindelijk de gewenste tekst oneindig vaak typen.
Om te voldoen aan de stelling, is deze gebaseerd op verschillende aannames. De eerste is dat de aap willekeurig moet typen. In de volksmond begrijpen we een willekeurig fenomeen als een fenomeen waarvan de uitkomst niet met zekerheid kan worden bepaald voordat het zich voordoet, zelfs als de beginvoorwaarden bekend zijn. Voorbeelden van willekeur zijn de worp van een dobbelsteen of de trekking van de Kerstloterij. In het geval van de aap wordt aangenomen dat bij elke toetsaanslag alle letters van het alfabet dezelfde kans hebben om getrokken te worden, ongeacht de reeds geschreven tekst.
Met deze voorwaarde kunnen we de waarschijnlijkheid berekenen dat de aap een willekeurige reeks typt. De kans om bijvoorbeeld "hallo" te typen door willekeurig vier toetsen op een Spaans toetsenbord in te drukken (alleen rekening houdend met de letters en de spatie) is (1/27)^4, ongeveer 0,0000019. Deze kleine waarde, voor zo'n korte reeks, laat al zien hoe ingewikkeld het probleem is.
Hier komt de tweede aanname van de stelling: er is oneindig veel tijd beschikbaar, en dus een oneindig aantal pogingen. Na n pogingen, waarvan we voor de eenvoud aannemen dat ze geïsoleerd zijn, is de kans dat de reeks 'hallo' niet verschijnt (1 - 0,0000019)^ n . Hoewel (1 - 0,0000019) heel dicht bij 1 ligt, geeft vermenigvuldiging met zichzelf n keer, als n groot genoeg is, een waarde die dicht bij nul ligt. Daarom zal de aap 'hallo' schrijven met een zo grote waarschijnlijkheid als we willen.
Hetzelfde geldt voor elke andere reeks – zelfs die met alle woorden van Hamlet , in de juiste volgorde – en daarop is de oneindige apentheorie gebaseerd. Kunnen we nu met een hoge waarschijnlijkheid een ruwe schatting maken van hoe lang het zou duren om Shakespeares klassieker te produceren? In een recent artikel berekenden ze met vrijwel volledige zekerheid dat de gehele huidige apenpopulatie niet in staat zou zijn om een tekst van meer dan een paar woorden te schrijven vóór de hittedood van het universum.
Een ander interessant experiment gerelateerd aan deze stelling stelt de gebruiker in staat om een willekeurige reeks in te voeren en simuleert de willekeurige generatie van tekst totdat de gegeven reeks is gevonden. Om de tekst te produceren, maakt deze pagina gebruik van zogenaamde pseudorandom-getallengeneratoren . Omdat ze op regels gebaseerd zijn, zijn de berekeningen die door deze programma's worden uitgevoerd volledig deterministisch: als alle beginvoorwaarden bekend zijn, kan het gegenereerde getal worden voorspeld. Met andere woorden, pseudorandom-getallen zijn niet willekeurig. Zodra de beginvoorwaarden van de generator echter onbekend zijn, zijn de gegenereerde waarden niet te onderscheiden van echt willekeurige getallen. Hiervoor bestaan verschillende technieken, zoals generatoren gebaseerd op modulaire rekenkunde of generatoren gebaseerd op cijfers.
Tot slot, in de geest van grote taalmodellen , zouden deze gebruikt kunnen worden als vervanging voor de apen in ons experiment? Zouden ChatGPT of DeepSeek spontaan Don Quichot kunnen schrijven als ze een oneindige tijd zouden moeten schrijven? Bovenstaande redenering gaat niet op, aangezien deze modellen tekst genereren op basis van de waarschijnlijkheid dat woorden in een bepaalde context voorkomen; ze zijn niet het product van een willekeurig proces. En aangezien Don Quichot tot de teksten behoort waarmee ze getraind zijn, lijkt het erop dat de waarschijnlijkheid dat ze het hele werk reproduceren groter is dan in het vorige geval.
Verschillende factoren maken dit echter uiterst onwaarschijnlijk . Ten eerste zijn deze modellen niet getraind om Spaanse teksten uit de Gouden Eeuw getrouw te repliceren, maar juist moderne, waardoor het voor hen moeilijk is om Cervantes' stijl nauwkeurig te volgen. Bovendien zijn deze programma's ontworpen om grote delen van de teksten waarmee ze geleerd hebben niet letterlijk te kopiëren, waardoor de kans op reproductie van complete werken verder afneemt. Dit, gecombineerd met andere beperkingen van het programma, betekent dat hoewel het model mogelijk dichter bij bepaalde delen van de tekst kan komen dan apen, de kans dat het deze in zijn geheel reproduceert minimaal is.
Pablo García Arce is predoctoraal onderzoeker bij de Spaanse Nationale Onderzoeksraad (CSIC) aan het Instituut voor Wiskundige Wetenschappen (ICMAT).
Koffie en Stellingen is een sectie gewijd aan wiskunde en de omgeving waarin deze tot stand komt, gecoördineerd door het Instituut voor Wiskundige Wetenschappen (ICMAT). In deze sectie beschrijven onderzoekers en leden van het centrum de nieuwste ontwikkelingen in dit vakgebied, delen ze raakvlakken tussen wiskunde en andere sociale en culturele uitingen, en herdenken ze degenen die de ontwikkeling ervan vormgaven en wisten hoe ze koffie konden omzetten in stellingen. De naam doet denken aan de definitie van de Hongaarse wiskundige Alfred Rényi: "Een wiskundige is een machine die koffie omzet in stellingen."
Geredigeerd, vertaald en gecoördineerd door Ágata Timón García-Longoria . Zij is coördinator van de eenheid Wiskundige Cultuur aan het Instituut voor Wiskundige Wetenschappen (ICMAT).
EL PAÍS