Se oggi si vuole che un modello linguistico esegua una nuova simulazione di dinamica quantistica, solitamente bisogna attendere che un essere umano scriva il software. Le librerie di fisica come OpenFermion o PennyLane sono estremamente capaci, ma sono statiche. Quando un'IA incontra una struttura molecolare che richiede una funzione matematica al di fuori del suo ambiente pre-programmato, si blocca semplicemente.
Un team che include i ricercatori Zijian Zhang, Ignacio Gustin e Alán Aspuru-Guzik ha creato una soluzione alternativa. Il loro framework, denominato El Agente Forjador (L'agente forgiatore), costringe l'IA a scrivere, eseguire ed eseguire il debug dei propri strumenti Python da zero. Si tratta di un passaggio dal considerare il codice come una dipendenza statica a una catena di fornitura generata dinamicamente.
Il ciclo di feedback di Python
I flussi di lavoro agentici tradizionali trattano il software esistente come un limite invalicabile. El Agente Forjador lo tratta come una bozza. Il sistema opera su un ciclo a quattro fasi: analisi, generazione, esecuzione e valutazione.
Quando riceve un problema scientifico, l'agente analizza i requisiti matematici e scrive uno script Python personalizzato per risolverlo. Successivamente esegue il codice. Se l'output non rispetta i parametri della simulazione, l'agente legge l'errore, corregge il proprio script e procede per iterazioni finché la fisica non è corretta.
I ricercatori hanno testato questo ciclo autonomo su 24 diversi compiti di chimica quantistica e dinamica molecolare. I modelli che utilizzano il ciclo di auto-forgiatura hanno superato costantemente i sistemi di base, costretti a navigare in complessi problemi chimici senza la capacità di scrivere set di strumenti personalizzati.
Subappaltare la tassa di calcolo
Il dettaglio più interessante della ricerca non è l'automazione in sé, ma l'economia computazionale. Eseguire modelli di frontiera come GPT-4o per ogni interrogazione scientifica iterativa è rovinosamente costoso. Si tratta di un noto svantaggio strutturale per gli istituti di ricerca europei che cercano di far bastare i finanziamenti di Horizon a fronte dei prezzi degli hyperscaler americani.
El Agente Forjador introduce una forma di trasferimento digitale della conoscenza che sovverte parzialmente questo modello di prezzo. Una volta che un'IA di alto livello forgia con successo uno strumento — come uno script per calcolare l'energia dello stato fondamentale di una molecola complessa — deposita quel codice in una libreria permanente. Di fatto, cura il proprio curriculum.
Modelli linguistici successivi, più leggeri, possono quindi attingere a quello strumento convalidato per risolvere problemi di livello esperto. Un modello open-weight più piccolo ed economico non ha più bisogno di possedere le capacità di ragionamento necessarie per scrivere complessi algoritmi quantistici. Deve solo sapere quale strumento pre-forgiato prelevare dallo scaffale.
Il modello costoso paga la pesante tassa computazionale per inventare lo strumento, e il modello più economico lo utilizza per pochi centesimi. La Silicon Valley potrà anche possedere i modelli di frontiera, ma la chimica computazionale ha appena scoperto come acquistare i loro risultati all'ingrosso.
Fonti
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Comments
No comments yet. Be the first!