今日、言語モデルを使って新しい量子力学シミュレーションを実行しようとする場合、通常は人間がソフトウェアを記述するのを待たなければなりません。OpenFermionやPennyLaneといった物理学ライブラリは非常に高性能ですが、その機能は固定されたものです。AIが事前にプログラムされた環境の範囲外にある数学関数を必要とする分子構造に遭遇すると、AIはそこで立ち往生してしまいます。
Zijian Zhang、Ignacio Gustin、およびAlán Aspuru-Guzikらを含む研究チームは、その回避策を構築しました。El Agente Forjador(鍛造エージェント)と名付けられた彼らのフレームワークは、AI自身にPythonツールを一から作成、実行、デバッグさせるものです。これは、コードを静的な依存関係として扱うのではなく、動的に生成されるサプライチェーンへと変化させる試みです。
Pythonフィードバックループ
従来の自律型ワークフローでは、既存のソフトウェアは超えられない境界線として扱われてきました。しかし、El Agente Forjadorはそれを叩き台として扱います。このシステムは、分析、生成、実行、評価という4段階のループで動作します。
科学的な課題を与えられると、エージェントは数学的な要件を分析し、それを解決するためのカスタムPythonスクリプトを作成します。次にそのコードを実行します。出力がシミュレーションのパラメータを満たさない場合、エージェントはエラーを読み取り、自身のスクリプトをデバッグし、物理的に正しい結果が得られるまで繰り返し実行します。
研究チームは、この自律サイクルを24種類の量子化学および分子動力学の課題でテストしました。自己鍛造ループを使用するモデルは、カスタムツールセットを作成する能力を持たずに複雑な化学問題を扱わなければならないベースラインシステムを一貫して上回るパフォーマンスを示しました。
計算コストの再配分
この研究で最も注目すべき詳細は、自動化そのものではなく、計算経済の側面です。GPT-4oのような最先端モデルを科学的な問いのたびに実行するのは、莫大なコストがかかります。これは、米国のハイパースケーラーの価格設定に対して、Horizon助成金をやり繰りしようとする欧州の研究機関にとって、おなじみの構造的な不利な条件です。
El Agente Forjadorは、この価格モデルを部分的に覆す、デジタルな知識転送の形を導入しました。高性能なAIが複雑な分子の基底状態エネルギーを計算するスクリプトのようなツールを一度正常に構築(鍛造)すると、そのコードは永続的なライブラリに保存されます。これにより、AIは実質的に自身の学習カリキュラムを編成していることになります。
その後、より能力の低い言語モデルが、その検証済みツールを引き出して専門レベルの問題を解決できるようになります。小型で安価なオープンウェイトモデルは、複雑な量子アルゴリズムを記述する推論能力を持つ必要がなくなります。必要なのは、棚からどの「鍛造済み」ツールを取り出すべきかを知ることだけです。
高価なモデルがツールを発明するために多額の計算コストを支払い、より安価なモデルがわずかなコストでそれを利用する。シリコンバレーが最先端モデルを独占していたとしても、計算化学の分野は、その成果物を「卸売り」価格で購入する方法を見つけ出したのです。
ソース
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Comments
No comments yet. Be the first!