如果你现在想让语言模型运行一项新颖的量子动力学模拟,通常必须等待人类编写相应的软件。OpenFermion 或 PennyLane 等物理库功能强大,但它们的状态是固定的。当人工智能遇到需要预设环境之外数学函数的分子结构时,它就会陷入停滞。
包括 Zijian Zhang、Ignacio Gustin 和 Alán Aspuru-Guzik 在内的研究团队构建了一种变通方法。他们的框架被称为 El Agente Forjador(锻造者代理),强制人工智能从零开始编写、执行和调试其自己的 Python 工具。这标志着从将代码视为静态依赖项向动态生成供应链的转变。
Python 反馈循环
传统的代理工作流将现有软件视为一道硬边界。而 El Agente Forjador 将其视为草稿。该系统在一个四阶段循环中运行:分析、生成、执行和评估。
当面对科学问题时,该代理会分析数学需求并编写自定义 Python 脚本来解决问题。然后它会运行代码。如果输出结果未能达到模拟参数的要求,代理会读取错误信息,调试自己的脚本,并不断迭代,直到物理计算结果准确无误。
研究人员在 24 项不同的量子化学和分子动力学任务中测试了这种自主循环。使用“自我锻造”循环的模型,表现始终优于那些被迫在没有编写自定义工具集能力的情况下处理复杂化学问题的基准系统。
计算成本的外包
这项研究中最引人注目的细节不是自动化本身,而是计算经济学。针对每一次科学查询都运行 GPT-4o 这样的前沿模型,成本高得惊人。对于试图在面对美国超大规模数据中心定价时延长 Horizon 资助期限的欧洲研究机构来说,这是一个熟悉的结构性劣势。
El Agente Forjador 引入了一种数字知识转移形式,部分颠覆了这种定价模式。一旦功能强大的 AI 成功锻造出一个工具——例如计算复杂分子基态能量的脚本——它就会将该代码存入一个永久库中。它实际上是在策划自己的课程体系。
随后,较弱的语言模型便可以调用这些经过验证的工具来解决专家级问题。一个规模更小、成本更低的开放权重模型不再需要具备编写复杂量子算法的推理能力。它只需要知道从架子上取出哪个预先锻造好的工具即可。
昂贵的模型支付了沉重的计算成本来发明工具,而较便宜的模型只需花费几分钱就能使用它。硅谷可能拥有这些前沿模型,但计算化学领域刚刚找到了如何批发购买其产出成果的方法。
来源
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador 框架
Comments
No comments yet. Be the first!