Modele AI piszą własne narzędzia do chemii kwantowej, aby ominąć koszty obliczeniowe

Breaking News Technologia
A glowing, intricate quantum processor core with gold and cyan light in a dark, high-tech laboratory setting.
4K Quality
Nowy wieloagentowy framework o nazwie El Agente Forjador pozwala sztucznej inteligencji samodzielnie tworzyć i debugować narzędzia w języku Python do symulacji kwantowych, co osłabia przewagę cenową dużych modeli bazowych.

Jeśli dzisiaj chcesz, aby model językowy przeprowadził nowatorską symulację dynamiki kwantowej, zazwyczaj musisz czekać, aż człowiek napisze odpowiednie oprogramowanie. Biblioteki fizyczne, takie jak OpenFermion czy PennyLane, mają ogromne możliwości, ale są „zamrożone” w czasie. Gdy sztuczna inteligencja napotyka strukturę molekularną wymagającą funkcji matematycznej wykraczającej poza jej zaprogramowane środowisko, po prostu się zawiesza.

Zespół, w skład którego wchodzą naukowcy Zijian Zhang, Ignacio Gustin oraz Alán Aspuru-Guzik, opracował obejście tego problemu. Ich framework, nazwany El Agente Forjador (Agent Kowal), zmusza sztuczną inteligencję do pisania, wykonywania i debugowania własnych narzędzi w języku Python od podstaw. To zmiana podejścia z traktowania kodu jako statycznej zależności na dynamicznie generowany łańcuch dostaw.

Pętla zwrotna Pythona

Tradycyjne workflowy agentowe traktują istniejące oprogramowanie jako nieprzekraczalną barierę. El Agente Forjador traktuje je jak szkic. System działa w oparciu o czterostopniową pętlę: analizę, generowanie, wykonywanie i ewaluację.

W obliczu problemu naukowego agent analizuje wymagania matematyczne i pisze niestandardowy skrypt w Pythonie, aby go rozwiązać. Następnie uruchamia kod. Jeśli wynik nie spełnia parametrów symulacji, agent odczytuje błąd, debuguje własny skrypt i iteruje, aż założenia fizyczne zostaną spełnione.

Naukowcy przetestowali ten autonomiczny cykl w 24 różnych zadaniach z zakresu chemii kwantowej i dynamiki molekularnej. Modele wykorzystujące pętlę samodoskonalenia konsekwentnie przewyższały systemy bazowe, które były zmuszone do rozwiązywania złożonych problemów chemicznych bez możliwości tworzenia własnych zestawów narzędzi.

Podwykonawstwo podatku obliczeniowego

Najbardziej intrygującym szczegółem tych badań nie jest sama automatyzacja, lecz ekonomia obliczeń. Uruchamianie modeli klasy frontier, takich jak GPT-4o, dla każdego iteracyjnego zapytania naukowego jest rujnująco drogie. To znana wada strukturalna europejskich instytutów badawczych, próbujących efektywnie zarządzać funduszami programu Horyzont w starciu z cennikami amerykańskich dostawców chmury (hyperscalerów).

El Agente Forjador wprowadza formę cyfrowego transferu wiedzy, która częściowo podważa ten model cenowy. Gdy zaawansowany model AI pomyślnie stworzy narzędzie — na przykład skrypt do obliczania energii stanu podstawowego złożonej cząsteczki — zapisuje ten kod w trwałej bibliotece. W efekcie system samodzielnie tworzy własny program nauczania.

Kolejne, słabsze modele językowe mogą następnie pobrać to zweryfikowane narzędzie, aby rozwiązywać problemy na poziomie eksperckim. Mniejszy i tańszy model o otwartych wagach nie musi już posiadać zdolności rozumowania pozwalających na pisanie złożonych algorytmów kwantowych. Musi jedynie wiedzieć, które „wykute” narzędzie pobrać z półki.

Drogi model płaci wysoki podatek obliczeniowy za wynalezienie narzędzia, a tańszy model korzysta z niego za grosze. Dolina Krzemowa może być właścicielem modeli klasy frontier, ale chemia obliczeniowa właśnie odkryła, jak kupować ich wyniki w cenach hurtowych.

Źródła

  • Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — Framework El Agente Forjador
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Jaki jest główny cel środowiska El Agente Forjador?
A El Agente Forjador to wieloagentowe środowisko zaprojektowane tak, aby umożliwić sztucznej inteligencji autonomiczne pisanie i debugowanie własnych narzędzi w języku Python do symulacji chemii kwantowej. Zamiast polegać na statycznych, istniejących bibliotekach oprogramowania, system wykorzystuje pętlę zwrotną obejmującą analizę, generowanie i wykonywanie kodu. Pozwala to sztucznej inteligencji rozwiązywać złożone problemy molekularne poprzez tworzenie niestandardowego kodu na bieżąco i jego udoskonalanie, aż wyniki matematyczne spełnią określone wymagania symulacji.
Q W jaki sposób to środowisko obniża długoterminowe koszty obliczeń naukowych?
A Środowisko tworzy bibliotekę zweryfikowanych narzędzi, co znacząco obniża wydatki obliczeniowe. Zaawansowany model wiodący jest początkowo używany do stworzenia złożonego skryptu dla konkretnego zadania. Gdy narzędzie to zostanie udoskonalone i zapisane, mniejsze i bardziej przystępne cenowo modele o otwartych wagach mogą użyć go ponownie do rozwiązania podobnych problemów. Proces ten pozwala badaczom uniknąć wysokich opłat związanych z korzystaniem z zaawansowanych modeli eksperckich przy każdym zapytaniu, skutecznie urynkowiając wysokiej klasy wyniki sztucznej inteligencji.
Q Jakie są cztery etapy iteracyjnej pętli El Agente Forjador?
A System działa w oparciu o ustrukturyzowany cykl składający się z analizy, generowania, wykonywania i ewaluacji. Podczas analizy agent określa potrzeby matematyczne danego problemu naukowego. Następnie generuje skrypt w języku Python i wykonuje go w środowisku symulacyjnym. Ostatni etap, ewaluacja, polega na sprawdzeniu wyników pod kątem parametrów fizycznych. Jeśli kod zawiedzie, agent odczytuje raporty o błędach i poprawia skrypt, powtarzając proces aż do uzyskania poprawnego rozwiązania.
Q Którzy naukowcy odpowiadają za opracowanie tego systemu tworzenia narzędzi AI?
A Prace nad El Agente Forjador prowadził zespół badawczy, w skład którego weszli Zijian Zhang, Ignacio Gustin oraz Alan Aspuru-Guzik. Ich praca stanowi odpowiedź na ograniczenia istniejących bibliotek fizycznych, takich jak OpenFermion i PennyLane, które mogą stać się przestarzałe lub niewystarczające w przypadku nowatorskich struktur molekularnych. Przechodząc od statycznych zależności oprogramowania do dynamicznego, samogenerującego się łańcucha dostaw kodu, zespół zapewnił bardziej elastyczne i opłacalne podejście do zaawansowanych symulacji dynamiki kwantowej.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!