Als je vandaag de dag een taalmodel een nieuwe kwantumdynamische simulatie wilt laten uitvoeren, moet je meestal wachten tot een mens de software schrijft. Natuurkundebibliotheken zoals OpenFermion of PennyLane zijn zeer capabel, maar ze staan stil in de tijd. Wanneer een AI een moleculaire structuur tegenkomt die een wiskundige functie vereist die buiten zijn voorgeprogrammeerde omgeving valt, loopt het proces simpelweg vast.
Een team met daarin onderzoekers Zijian Zhang, Ignacio Gustin en Alán Aspuru-Guzik heeft een oplossing gebouwd. Hun raamwerk, genaamd El Agente Forjador (De Smedende Agent), dwingt de AI om vanaf nul zijn eigen Python-tools te schrijven, uit te voeren en te debuggen. Het is een verschuiving van het behandelen van code als een statische afhankelijkheid naar een dynamisch gegenereerde toeleveringsketen.
De Python-feedbackloop
Traditionele agent-gestuurde workflows behandelen bestaande software als een harde grens. El Agente Forjador behandelt het als een ruwe schets. Het systeem werkt met een cyclus van vier fasen: analyse, generatie, uitvoering en evaluatie.
Wanneer de agent een wetenschappelijk probleem krijgt voorgelegd, analyseert hij de wiskundige vereisten en schrijft hij een aangepast Python-script om het op te lossen. Vervolgens voert hij de code uit. Als de output niet voldoet aan de simulatieparameters, leest de agent de foutmelding, debugt hij zijn eigen script en itereert hij totdat de natuurkunde klopt.
De onderzoekers testten deze autonome cyclus voor 24 verschillende kwantumchemische en moleculaire dynamische taken. Modellen die gebruikmaken van de zelf-smedende loop presteerden consequent beter dan basissystemen die gedwongen waren om complexe chemieproblemen op te lossen zonder het vermogen om aangepaste toolsets te schrijven.
Het uitbesteden van de rekenkosten
Het meest opvallende detail in het onderzoek is niet de automatisering zelf, maar de economie van rekenkracht. Het draaien van geavanceerde modellen zoals GPT-4o voor elke iteratieve wetenschappelijke vraag is ruïneus duur. Het is een bekend structureel nadeel voor Europese onderzoeksinstellingen die Horizon-financiering moeten oprekken tegen de prijzen van Amerikaanse hyperscalers.
El Agente Forjador introduceert een vorm van digitale kennisoverdracht die dit prijsmodel gedeeltelijk ondermijnt. Zodra een krachtige AI met succes een tool heeft gesmeed — zoals een script om de grondtoestandsenergie van een complex molecuul te berekenen — slaat hij die code op in een permanente bibliotheek. Hij cureert in feite zijn eigen curriculum.
Daaropvolgende, zwakkere taalmodellen kunnen vervolgens die gevalideerde tool ophalen om problemen op expertniveau op te lossen. Een kleiner, goedkoper model met open gewichten hoeft niet langer over de redeneercapaciteiten te beschikken om complexe kwantumalgoritmen te schrijven. Het hoeft alleen maar te weten welke reeds gesmede tool het uit het schap moet pakken.
Het dure model betaalt de hoge computationele prijs om de tool uit te vinden, en het goedkopere model gebruikt deze voor een fractie van de kosten. Silicon Valley is misschien eigenaar van de meest geavanceerde modellen, maar de computationele chemie heeft net ontdekt hoe ze hun output op grote schaal kan inkopen.
Bronnen
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Comments
No comments yet. Be the first!