AI 模型正自主编写量子化学工具以规避计算成本

Breaking News 科技
A glowing, intricate quantum processor core with gold and cyan light in a dark, high-tech laboratory setting.
4K Quality
一种名为“El Agente Forjador”的新型多智能体框架,允许 AI 自主编写并调试用于量子模拟的 Python 工具,从而削弱了大型前沿模型的定价权。

如果你现在想让语言模型运行一项新颖的量子动力学模拟,通常必须等待人类编写相应的软件。OpenFermion 或 PennyLane 等物理库功能强大,但它们的状态是固定的。当人工智能遇到需要预设环境之外数学函数的分子结构时,它就会陷入停滞。

包括 Zijian Zhang、Ignacio Gustin 和 Alán Aspuru-Guzik 在内的研究团队构建了一种变通方法。他们的框架被称为 El Agente Forjador(锻造者代理),强制人工智能从零开始编写、执行和调试其自己的 Python 工具。这标志着从将代码视为静态依赖项向动态生成供应链的转变。

Python 反馈循环

传统的代理工作流将现有软件视为一道硬边界。而 El Agente Forjador 将其视为草稿。该系统在一个四阶段循环中运行:分析、生成、执行和评估。

当面对科学问题时,该代理会分析数学需求并编写自定义 Python 脚本来解决问题。然后它会运行代码。如果输出结果未能达到模拟参数的要求,代理会读取错误信息,调试自己的脚本,并不断迭代,直到物理计算结果准确无误。

研究人员在 24 项不同的量子化学和分子动力学任务中测试了这种自主循环。使用“自我锻造”循环的模型,表现始终优于那些被迫在没有编写自定义工具集能力的情况下处理复杂化学问题的基准系统。

计算成本的外包

这项研究中最引人注目的细节不是自动化本身,而是计算经济学。针对每一次科学查询都运行 GPT-4o 这样的前沿模型,成本高得惊人。对于试图在面对美国超大规模数据中心定价时延长 Horizon 资助期限的欧洲研究机构来说,这是一个熟悉的结构性劣势。

El Agente Forjador 引入了一种数字知识转移形式,部分颠覆了这种定价模式。一旦功能强大的 AI 成功锻造出一个工具——例如计算复杂分子基态能量的脚本——它就会将该代码存入一个永久库中。它实际上是在策划自己的课程体系。

随后,较弱的语言模型便可以调用这些经过验证的工具来解决专家级问题。一个规模更小、成本更低的开放权重模型不再需要具备编写复杂量子算法的推理能力。它只需要知道从架子上取出哪个预先锻造好的工具即可。

昂贵的模型支付了沉重的计算成本来发明工具,而较便宜的模型只需花费几分钱就能使用它。硅谷可能拥有这些前沿模型,但计算化学领域刚刚找到了如何批发购买其产出成果的方法。

来源

  • Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador 框架
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q El Agente Forjador 框架的主要目的是什么?
A El Agente Forjador 是一个多智能体框架,旨在使人工智能能够自主编写和调试用于量子化学模拟的 Python 工具。该系统不依赖于静态的现有软件库,而是使用分析、生成和执行的反馈循环。这使得 AI 能够通过动态创建自定义代码并对其进行完善,直到数学结果满足特定的模拟要求,从而解决复杂的分子问题。
Q 该框架如何降低科学计算的长期成本?
A 该框架构建了一个经过验证的工具库,显著降低了计算费用。首先使用高性能的前沿模型为特定任务构建复杂的脚本。一旦该工具完善并存储,更小且更具性价比的开源权重模型就可以重用它来解决类似问题。这一过程使研究人员无需为每次查询支付与专家级模型推理相关的高额费用,从而有效地将高端 AI 输出商品化。
Q El Agente Forjador 迭代循环的四个阶段是什么?
A 该系统通过包含分析、生成、执行和评估的结构化循环来运行。在分析阶段,智能体确定科学问题的数学需求。随后,它生成一个 Python 脚本并在模拟环境中执行。最后,评估阶段会根据物理参数检查输出结果。如果代码运行失败,智能体将读取错误报告并调试脚本,重复此过程直到获得可行的解决方案。
Q 哪些研究人员负责开发这种 AI 工具锻造系统?
A El Agente Forjador 的开发由包括 Zijian Zhang、Ignacio Gustin 和 Alan Aspuru-Guzik 在内的研究团队领导。他们的工作解决了 OpenFermion 和 PennyLane 等现有物理库的局限性,这些库可能过时或不足以处理新颖的分子结构。通过从静态软件依赖转向动态、自生成的代码供应链,该团队为先进的量子动力学模拟提供了一种更灵活且更具成本效益的方法。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!