Wat is recursieve zelfverbetering in AI-ontwikkeling?

Recursieve zelfverbetering verwijst naar een autonome cyclus waarin een AI-model inefficiënties in zijn eigen code identificeert en zichzelf herschrijft om de prestaties te verbeteren. In tegenstelling tot traditionele ontwikkeling, die afhankelijk is van menselijke ontwerpers en gecureerde datasets, probeert deze aanpak een exponentieel groeimodel te creëren. Het doel is om de cirkel te sluiten door de machine in staat te stellen zijn eigen upgrades te programmeren zonder menselijke tussenkomst, wat potentieel kan leiden tot een snelle en zelfvoorzienende intelligentie-explosie.

Waarom gaven investeerders een waardering van $4 miljard aan een startup van vier maanden oud?

Investeerders waarderen het bedrijf op $4 miljard vanwege de focus op recursieve superintelligentie, een technologie die de lineaire groeibeperkingen van door mensen geleide AI-ontwikkeling zou kunnen omzeilen. Met een klein team van 20 personen komt deze waardering neer op ongeveer $200 miljoen per werknemer. Geldschieters zoals Google en Nvidia geloven dat zelfs gedeeltelijk succes bij het automatiseren van AI-optimalisatie enorme operationele besparingen en een aanzienlijk concurrentievoordeel kan opleveren in de race naar autonome machine-intelligentie.

Welke technische uitdagingen verhinderen dat AI zijn eigen code succesvol herschrijft?

Een groot technisch risico is 'model collapse', waarbij een feedbackloop ervoor zorgt dat de AI zijn eigen fouten versterkt totdat de output verandert in statistische ruis. Omdat grote taalmodellen vaak geen basis hebben in formele logica, kunnen ze moeite hebben om te verifiëren of nieuwe code daadwerkelijk superieur is. Zonder een robuuste doelfunctie loopt het systeem het risico sneller of zelfverzekerder te worden terwijl het gebrekkige resultaten produceert. Dit maakt het extreem moeilijk om de cirkel te sluiten zonder menselijk toezicht.

Hoe verschilt het investeringsklimaat voor AI-startups tussen de Verenigde Staten en Europa?

Het investeringsklimaat weerspiegelt een aanzienlijk verschil in risicobereidheid tussen de twee regio's. In de Verenigde Staten zijn durfkapitalisten bereid om risicovolle 'moonshot'-projecten met miljardenwaarderingen te financieren om te voorkomen dat ze tijdperk-bepalende verschuivingen missen. Omgekeerd wordt de Europese ontwikkeling vaak vertraagd door regelgevende voorzichtigheid, zoals de AI-wet, en een afhankelijkheid van academische beurzen. Dit leidt tot een scenario waarin in Europa opgeleide onderzoekers vaak Amerikaanse financiering veiligstellen om hun innovaties op hoog niveau op te schalen.

Zelfverbeterende startup, recursieve superintelligentie, waardering

De wiskunde achter de waardering is even ontnuchterend als speculatief. Met een team van 20 mensen en een waardering van 4 miljard dollar, waardeert de markt elke werknemer effectief op 200 miljoen dollar. Dit overtreft de piek aan 'acq-hire'-tarieven uit de eerste golf van de deep learning-boom van tien jaar geleden. Het suggereert dat de investeerders — waaronder de durfkapitaaltak van Google en 's werelds machtigste halfgeleiderbedrijf — niet langer geïnteresseerd zijn in incrementele winst bij Large Language Models (LLM's). Ze zijn op zoek naar de uitgang van ontwikkeling waarbij de mens in de lus (human-in-the-loop) zit.

Kan code daadwerkelijk betere code schrijven?

Het kernuitgangspunt van Recursive Superintelligence is het nastreven van een autonome verbeteringscyclus. Huidige AI-ontwikkeling is een proces met knelpunten: mensen ontwerpen de architecturen, mensen beheren de datasets en mensen leveren de Reinforcement Learning from Human Feedback (RLHF) die voorkomt dat modellen hallucineren of giftig worden. Dit is een lineair groeimodel. Recursieve zelfverbetering streeft naar een exponentieel model, waarbij een model zijn eigen algoritmische inefficiënties identificeert en zijn eigen codebase herschrijft om deze te verhelpen.

Ingenieurs in het veld noemen dit vaak 'de lus sluiten'. De moeilijkheid ligt in de doelfunctie. Als een model de taak krijgt om zijn eigen redeneervermogen te verbeteren, moet het een manier hebben om te verifiëren of zijn 'nieuwe en verbeterde' versie daadwerkelijk beter is, in plaats van alleen maar sneller of zelfverzekerder in zijn fouten. Zonder een basis in de fysieke realiteit of formele logica — iets wat LLM's aantoonbaar missen — leidt recursieve zelfverbetering vaak tot 'model collapse', een feedbackloop waarbij de AI zijn eigen eigenaardigheden begint te versterken totdat de output statistische ruis wordt. Het team bij Recursive, geleid door Richard Socher en Tim Rocktäschel, wedt dat hun specifieke benadering van symbolische redenering of geautomatiseerde ontdekking deze entropie kan omzeilen.

De achtergrond van Tim Rocktäschel aan het University College London en Google DeepMind geeft een aanwijzing voor de technische richting. Zijn werk richtte zich vaak op 'open-ended' leren — omgevingen waarin agenten taken moeten leren oplossen zonder dat hen wordt verteld wat die taken zijn. In een Europese industriële context is dit het soort hoogwaardig onderzoek dat doorgaans wordt gefinancierd door Horizon Europe-subsidies of de European Research Council. Hier is het gepasseerd door Amerikaans durfkapitaal, wat het aanhoudende gat benadrukt tussen de Europese academische uitmuntendheid en het vermogen van het continent om die uitmuntendheid op te schalen naar soevereine industriële macht.

Nvidia is de huisbaas van de Singulariteit

Dit creëert een merkwaardige circulaire economie in het ecosysteem van Silicon Valley. Amerikaanse durfkapitaalfondsen verstrekken het kapitaal, dat de startups uitgeven aan hardware van Nvidia, wat vervolgens de winst van Nvidia opdrijft, wat op zijn beurt de bredere tech-indices stimuleert waar de 'limited partners' van de durfkapitaalfondsen op vertrouwen. Voor Europese waarnemers is deze cyclus frustrerend gesloten. Hoewel de EU Chips Act beoogt lokale productiecapaciteit op te bouwen, moet de wetgeving nog het type software-hardware-feedbackloop met hoog risico en hoge beloning bevorderen dat een waardering van 4 miljard dollar voor een bedrijf van vier maanden oud mogelijk maakt in Palo Alto, maar ondenkbaar is in Berlijn of Parijs.

De betrokkenheid van Richard Socher, de voormalig hoofdwetenschapper bij Salesforce, voegt een laag commercieel pragmatisme toe aan wat anders een puur academische oefening zou kunnen lijken. Socher's carrière werd gedefinieerd door natural language processing (NLP) werkend te krijgen voor het bedrijfsleven. Als Recursive Superintelligence slechts een 'moonshot'-lab was geweest, had het in dit klimaat van rentestanden waarschijnlijk moeite gehad om 500 miljoen dollar op te halen. De omvang van de financiering suggereert dat er geloof is dat zelfs gedeeltelijk succes — een AI die alleen zijn eigen inferentiekosten kan optimaliseren of zijn eigen data kan opschonen — miljarden waard zou zijn aan operationele besparingen voor de Fortune 500.

Is de 'intelligentie-explosie' een haalbaar technisch doel?

Critici van de theorie van recursieve zelfverbetering wijzen op het probleem van 'afnemende meeropbrengsten'. In de meeste technische disciplines geldt: hoe meer je een systeem optimaliseert, hoe moeilijker het wordt om verdere winst te boeken. Een automotor die voor 98% efficiënt is, is aanzienlijk moeilijker te verbeteren dan een die voor 40% efficiënt is. Het narratief van de 'Singulariteit' gaat ervan uit dat intelligentie anders is — dat elke toename in cognitief vermogen de volgende toename makkelijker maakt om te bereiken. Dit blijft een filosofische hypothese, geen technisch feit.

Vanuit regelgevend perspectief moet de AI Act in Europa mogelijk binnenkort rekening houden met bedrijven die AI niet alleen 'gebruiken', maar bedrijven wiens product het creatieproces zelf is. Als een model zijn eigen code begint te herschrijven, wie is er dan verantwoordelijk voor de uiteindelijke output? De oorspronkelijke programmeurs? De leverancier van de rekenkracht? Deze juridische ambiguïteit is precies het soort zaak waardoor durfkapitalisten in de VS hun schouders ophalen en die in Duitsland naar hun verzekeringspolissen grijpen. Het is een fundamenteel verschil in risicobereidheid dat de Atlantische kloof blijft bepalen.

De snelheid van deze deal — vier maanden van nul naar een half miljard — is een symptoom van een markt die doodsbang is de volgende epochale verschuiving te missen. Het echoot de beginjaren van de ruimtewedloop, waarbij het doel niet noodzakelijkerwijs een duurzaam bedrijfsmodel was, maar het bereiken van de bestemming vóór de andere partij. In dit geval is de bestemming een autonome intelligentie die 24/7 aan zijn eigen evolutie kan werken. Als Recursive Superintelligence slaagt, zal het prijskaartje van 500 miljoen dollar een afrondingsfout lijken. Als ze falen, zal het herinnerd worden als het hoogtepunt van de Tweede AI-zeepbel — een moment waarop we de droom van een machine die voor zichzelf kon denken hoger waardeerden dan de meeste bedrijven die daadwerkelijk dingen voor mensen bouwen.

Silicon Valley heeft besloten dat de slimste manier om de toekomst te bouwen is om de toekomst zichzelf te laten bouwen. Europa wacht nog steeds tot het papierwerk in drievoud wordt ingediend.

Recursieve superintelligentie en de werknemer van 200 miljoen dollar

Kan code daadwerkelijk betere code schrijven?

Nvidia is de huisbaas van de Singulariteit

Is de 'intelligentie-explosie' een haalbaar technisch doel?

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments