Exclusief: Mira Murati's Stealth AI Lab lanceert zijn eerste product

Thinking Machines Lab, een zwaar gefinancierde startup die mede is opgericht door vooraanstaande onderzoekers van OpenAI , heeft zijn eerste product onthuld: een tool genaamd Tinker die de creatie van op maat gemaakte AI-frontiermodellen automatiseert.
"Wij geloven dat [Tinker] onderzoekers en ontwikkelaars in staat zal stellen om te experimenteren met modellen en dat het grensverleggende mogelijkheden veel toegankelijker zal maken voor iedereen", aldus Mira Murati, medeoprichter en CEO van Thinking Machines, in een interview met WIRED voorafgaand aan de aankondiging.
Grote bedrijven en academische laboratoria verfijnen open source AI-modellen al om nieuwe varianten te creëren die zijn geoptimaliseerd voor specifieke taken, zoals het oplossen van wiskundige problemen, het opstellen van juridische overeenkomsten of het beantwoorden van medische vragen.
Meestal omvat dit werk het aanschaffen en beheren van clusters van GPU's en het gebruik van diverse softwaretools om ervoor te zorgen dat grootschalige trainingsruns stabiel en efficiënt verlopen. Tinker belooft meer bedrijven, onderzoekers en zelfs hobbyisten de mogelijkheid te bieden hun eigen AI-modellen te verfijnen door een groot deel van dit werk te automatiseren.
In wezen gokt het team erop dat het helpen van mensen bij het verfijnen van frontiermodellen de volgende grote stap in AI zal zijn. En er is reden om aan te nemen dat ze misschien wel gelijk hebben. Thinking Machines Lab staat onder leiding van onderzoekers die een cruciale rol speelden bij de ontwikkeling van ChatGPT. En vergeleken met vergelijkbare tools op de markt is Tinker krachtiger en gebruiksvriendelijker, volgens bètatesters met wie ik sprak.
Murati zegt dat Thinking Machines Lab hoopt het werk rond het optimaliseren van 's werelds krachtigste AI-modellen te demystificeren en meer mensen de mogelijkheid te geven de grenzen van AI te verkennen. "We maken wat anders een grensverleggende mogelijkheid is, toegankelijk voor iedereen, en dat is een ware revolutie", zegt ze. "Er zijn enorm veel slimme mensen, en we hebben zoveel mogelijk slimme mensen nodig om grensverleggend AI-onderzoek te doen."
Tinker biedt gebruikers momenteel de mogelijkheid om twee open source modellen te verfijnen: Meta's Llama en Alibaba's Qwen. Gebruikers kunnen een paar regels code schrijven om toegang te krijgen tot de Tinker API en te beginnen met verfijnen via supervised learning, wat betekent dat het model wordt aangepast met gelabelde data, of via reinforcement learning , een steeds populairdere methode om modellen te verfijnen door ze positieve of negatieve feedback te geven op basis van hun uitkomsten. Gebruikers kunnen hun verfijnde model vervolgens downloaden en uitvoeren waar ze maar willen.
De AI-industrie volgt de lancering nauwlettend, mede dankzij het kaliber van het team erachter.
Murati was voorheen CTO van OpenAI. Ze was korte tijd CEO van OpenAI nadat de raad van bestuur Sam Altman eind 2023 had ontslagen. Ongeveer 10 maanden later kondigde ze aan dat ze het bedrijf zou verlaten .
Murati richtte Thinking Machines Lab op met een handvol andere OpenAI-veteranen, waaronder John Schulman, medeoprichter van OpenAI; Barret Zoph, voormalig vicepresident onderzoek; Lilian Weng, die zich bezighield met onderzoek naar veiligheid en robotica; Andrew Tulloch, die zich bezighield met pretraining en redenering; en Luke Metz, een specialist in post-training. Het team trok al veel aandacht voordat er überhaupt producten werden aangekondigd: in juli maakte de startup bekend dat het maar liefst $ 2 miljard aan startkapitaal had opgehaald , wat de onderneming een indrukwekkende waardering van $ 12 miljard opleverde.
Schulman leidde het werk aan het verfijnen van het grote taalmodel dat ChatGPT aanstuurt door middel van reinforcement learning. Input van menselijke testers levert een beloningssignaal op waardoor het model veel beter (hoewel niet perfect) is in het voeren van samenhangende gesprekken, het beantwoorden van vragen zonder af te dwalen en het vermijden van ongewenst gedrag. Hij beweert dat Tinker het voor meer mensen gemakkelijker zal maken om nieuwe vaardigheden uit grote modellen te halen door gebruik te maken van reinforcement learning en andere trainingstrucs. "Er zit een hoop geheime magie achter, maar we geven mensen volledige controle over de trainingslus", vertelt Schulman aan WIRED. "We abstraheren de gedistribueerde trainingsdetails, maar we geven mensen nog steeds volledige controle over de data en de algoritmen."
Thinking Machines Lab biedt gebruikers vanaf woensdag de mogelijkheid om toegang tot Tinker aan te vragen. Het bedrijf rekent voorlopig geen kosten voor de API, maar verwacht dit uiteindelijk wel te gaan doen.
De API is al beschikbaar gesteld aan een aantal bètagebruikers, waaronder Eric Gan, een onderzoeker bij Redwood Research, een bedrijf dat zich richt op de risico's van AI-modellen. Hij zegt dat hij de reinforcement learning-functionaliteit van Tinker gebruikt om modellen af te stemmen op het schrijven van backdoors in code.
Gan zegt dat Tinker het mogelijk heeft gemaakt om mogelijkheden uit een model te halen die met een API simpelweg niet zouden worden onthuld. Het is relatief eenvoudig om de finetuning aan te passen, zegt hij. "Tinker is absoluut veel eenvoudiger dan de RL helemaal opnieuw te maken", merkt Gan op, en voegt eraan toe: "RL is vooral handig als je een zeer gespecialiseerde taak hebt en bestaande modellen deze niet aankunnen."
Een andere bètatester, Robert Nishihara, CEO van Anyscale, een bedrijf dat technologie levert voor het beheer van grootschalige AI-projecten, zegt dat er weliswaar al andere finetuningtools zoals VERL en SkyRL bestaan, maar dat Tinker een opmerkelijke mix van abstractie en afstembaarheid biedt. "Ik denk dat het een geweldige API is en dat veel mensen hem willen gebruiken", zegt hij.
Een hardnekkige angst rond open-sourcemodellen is dat ze op snode manieren gedownload en aangepast kunnen worden. Thinking Machines controleert momenteel wie toegang krijgt tot de API, maar Schulman zegt dat het bedrijf uiteindelijk geautomatiseerde systemen zal introduceren om misbruik te voorkomen.
Tinker is misschien wel het eerste product van Thinking Machines Lab, maar het bedrijf publiceert al fundamenteel onderzoek naar modeltraining, waaronder ontwikkelingen in het op peil houden van de prestaties van neurale netwerken en het efficiënter verfijnen van grote taalmodellen . Deze resultaten worden achter de schermen gebruikt voor tools als Tinker.
Het plan van het bedrijf om het proces voor het optimaliseren van grote modellen open te stellen, toont ook aan dat het zich inzet voor openheid in een tijd waarin de meeste Amerikaanse AI-bedrijven hun beste modellen gesloten houden en alleen via een API toegankelijk zijn. China heeft momenteel meer open source AI-modellen dan de VS, en deze modellen worden door veel bedrijven en onderzoekers over de hele wereld gebruikt.
Murati zegt dat ze hoopt dat Tinker de trend zal helpen keren dat commerciële AI-modellen steeds meer gesloten worden. "Als je kijkt naar wat er in grensverleggende laboratoria gebeurt en naar wat andere slimme mensen in de academische wereld doen, dan lopen ze steeds verder uit elkaar", zegt ze. "En dat is niet best als je bedenkt hoe deze krachtige systemen de wereld in komen."
wired