AI-modeller skriver egna verktyg för kvantkemi för att kringgå beräkningskostnader

Breaking News Teknik
A glowing, intricate quantum processor core with gold and cyan light in a dark, high-tech laboratory setting.
4K Quality
Ett nytt ramverk med flera agenter kallat El Agente Forjador gör det möjligt för AI att skriva och felsöka sina egna Python-verktyg för kvantsimuleringar, vilket minskar beroendet av dyra stora språkmodeller.

Om du vill att en språkmodell ska köra en ny kvantdynamisk simulering idag, måste du vanligtvis vänta på att en människa skriver programvaran. Fysikbibliotek som OpenFermion eller PennyLane är mycket kapabla, men de är låsta i tiden. När en AI möter en molekylär struktur som kräver en matematisk funktion utanför dess förprogrammerade miljö, stannar den helt enkelt av.

Ett team med bland andra forskarna Zijian Zhang, Ignacio Gustin och Alán Aspuru-Guzik har byggt en lösning. Deras ramverk, som kallas El Agente Forjador (Smedsagenten), tvingar AI:n att skriva, exekvera och felsöka sina egna Python-verktyg från grunden. Det är ett skifte från att betrakta kod som ett statiskt beroende till att se det som en dynamiskt genererad leveranskedja.

Python-återkopplingsloopen

Traditionella agentbaserade arbetsflöden betraktar befintlig programvara som en fast gräns. El Agente Forjador betraktar den som ett första utkast. Systemet arbetar i en loop i fyra steg: analys, generering, exekvering och utvärdering.

När agenten får ett vetenskapligt problem analyserar den de matematiska kraven och skriver ett skräddarsytt Python-skript för att lösa det. Därefter kör den koden. Om resultatet inte uppfyller simuleringsparametrarna läser agenten felmeddelandet, felsöker sitt eget skript och itererar tills fysiken stämmer.

Forskarna testade denna autonoma cykel på 24 distinkta uppgifter inom kvantkemi och molekylärdynamik. Modeller som använde den självskapande loopen presterade konsekvent bättre än baslinjesystem som tvingades navigera komplexa kemiproblem utan förmågan att skriva anpassade verktygsuppsättningar.

Att lägga ut beräkningskostnaden på entreprenad

Den mest intressanta detaljen i forskningen är inte själva automatiseringen, utan beräkningsekonomin. Att köra banbrytande modeller som GPT-4o för varje iterativ vetenskaplig förfrågan är ruinerande dyrt. Det är en välkänd strukturell nackdel för europeiska forskningsinstitut som försöker få Horizon-finansiering att räcka mot amerikanska molnleverantörers prissättning.

El Agente Forjador introducerar en form av digital kunskapsöverföring som delvis kringgår denna prismodell. När en kraftfull AI framgångsrikt smider ett verktyg — till exempel ett skript för att beräkna grundtillståndsenergin hos en komplex molekyl — sparar den koden i ett permanent bibliotek. Den kurerar i praktiken sin egen läroplan.

Efterföljande, svagare språkmodeller kan sedan hämta det validerade verktyget för att lösa expertnivåproblem. En mindre, billigare modell med öppen vikt behöver inte längre besitta resonemangsförmågan för att skriva komplexa kvantalgoritmer. Den behöver bara veta vilket färdigsmitt verktyg som ska hämtas från hyllan.

Den dyra modellen betalar den tunga beräkningsskatten för att uppfinna verktyget, och den billigare modellen använder det för småsummor. Silicon Valley må äga de främsta modellerna, men beräkningskemi har precis listat ut hur man köper deras resultat i grossistledet.

Källor

  • Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Vad är det primära syftet med ramverket El Agente Forjador?
A El Agente Forjador är ett ramverk med flera agenter utformat för att göra det möjligt för artificiell intelligens att autonomt skriva och felsöka sina egna Python-verktyg för kvantkemiska simuleringar. Istället för att förlita sig på statiska, förhandsbefintliga programvarubibliotek använder systemet en feedback-loop av analys, generering och exekvering. Detta tillåter AI:n att lösa komplexa molekylära problem genom att skapa anpassad kod i stunden och förfina den tills de matematiska resultaten uppfyller specifika simuleringskrav.
Q Hur minskar ramverket de långsiktiga kostnaderna för vetenskaplig beräkning?
A Ramverket skapar ett bibliotek av validerade verktyg som avsevärt sänker beräkningskostnaderna. En högpresterande frontmodell används initialt för att skapa ett komplext skript för en specifik uppgift. När detta verktyg är perfekt och lagrat kan mindre och mer prisvärda modeller med öppna vikter återanvända det för att lösa liknande problem. Denna process gör att forskare slipper betala de höga avgifter som är förknippade med expertmodellresonemang för varje enskild fråga, vilket effektivt kommodifierar avancerade AI-resultat.
Q Vilka är de fyra stadierna i El Agente Forjadors iterativa loop?
A Systemet arbetar genom en strukturerad cykel bestående av analys, generering, exekvering och utvärdering. Under analysen fastställer agenten de matematiska behoven för ett vetenskapligt problem. Den genererar sedan ett Python-skript och kör det i en simuleringsmiljö. Slutligen kontrollerar utvärderingsstadiet resultatet mot fysikaliska parametrar. Om koden misslyckas läser agenten felrapporterna och felsöker skriptet, och upprepar processen tills en fungerande lösning uppnås.
Q Vilka forskare ansvarar för utvecklingen av detta AI-verktyg för kodskapande?
A Utvecklingen av El Agente Forjador leddes av ett forskarteam bestående av Zijian Zhang, Ignacio Gustin och Alan Aspuru-Guzik. Deras arbete adresserar begränsningarna i befintliga fysikbibliotek som OpenFermion och PennyLane, vilka kan bli föråldrade eller otillräckliga för nya molekylära strukturer. Genom att gå från statiska programvaruberoenden till en dynamisk, självgenererande försörjningskedja av kod har teamet tillhandahållit en mer flexibel och kostnadseffektiv metod för avancerade kvantdynamiska simuleringar.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!