오늘날 언어 모델을 통해 새로운 양자 역학 시뮬레이션을 실행하려면 일반적으로 인간이 소프트웨어를 작성할 때까지 기다려야 합니다. OpenFermion이나 PennyLane과 같은 물리 라이브러리는 매우 뛰어나지만, 특정 시점에 고정되어 있습니다. AI가 사전 프로그래밍된 환경 외부의 수학적 함수를 필요로 하는 분자 구조를 접하게 되면, AI는 단순히 멈춰버리고 맙니다.
Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik 등의 연구진은 이에 대한 해결책을 마련했습니다. El Agente Forjador(The Forger Agent)라고 불리는 이 프레임워크는 AI가 직접 처음부터 파이썬 도구를 작성하고, 실행하며, 디버깅하도록 강제합니다. 이는 코드를 정적인 의존성으로 간주하던 방식에서 동적으로 생성되는 공급망으로의 전환입니다.
파이썬 피드백 루프
기존의 에이전트 워크플로우는 기존 소프트웨어를 넘을 수 없는 경계로 취급합니다. 하지만 El Agente Forjador는 이를 초안으로 간주합니다. 이 시스템은 분석, 생성, 실행, 평가라는 4단계 루프로 작동합니다.
과학적 문제를 접하면 에이전트는 수학적 요구 사항을 분석하고 이를 해결하기 위한 맞춤형 파이썬 스크립트를 작성합니다. 그런 다음 코드를 실행합니다. 만약 출력값이 시뮬레이션 매개변수를 충족하지 못하면, 에이전트는 오류를 읽고 스크립트를 직접 디버깅하며 물리학적 타당성을 확보할 때까지 반복합니다.
연구진은 이 자율 주기를 24개의 서로 다른 양자 화학 및 분자 역학 작업에 걸쳐 테스트했습니다. 자가 구축 루프를 사용하는 모델은 맞춤형 도구 세트를 작성할 수 없는 상태로 복잡한 화학 문제를 해결해야 했던 기준 시스템보다 일관되게 뛰어난 성능을 보였습니다.
컴퓨팅 비용의 하청
이번 연구에서 가장 흥미로운 점은 자동화 그 자체가 아니라 컴퓨팅 경제학입니다. GPT-4o와 같은 최첨단 모델을 모든 반복적인 과학적 쿼리에 실행하는 것은 엄청난 비용이 듭니다. 이는 Horizon 연구 자금으로 미국의 하이퍼스케일러 가격 정책에 대응해야 하는 유럽 연구 기관들이 겪는 익숙한 구조적 불리함입니다.
El Agente Forjador는 이러한 가격 모델을 부분적으로 전복시키는 형태의 디지털 지식 전달 방식을 도입합니다. 고성능 AI가 복잡한 분자의 바닥 상태 에너지를 계산하는 스크립트와 같은 도구를 성공적으로 구축하면, 해당 코드를 영구 라이브러리에 저장합니다. 이는 AI가 효과적으로 스스로의 커리큘럼을 큐레이팅하는 셈입니다.
그 후 더 낮은 성능의 언어 모델은 검증된 도구를 가져와 전문가 수준의 문제를 해결할 수 있습니다. 더 작고 저렴한 오픈 웨이트 모델은 복잡한 양자 알고리즘을 작성할 수 있는 추론 능력을 갖출 필요가 없습니다. 단지 선반에서 미리 구축된 도구 중 무엇을 꺼내야 하는지만 알면 됩니다.
고성능 모델은 도구를 발명하기 위해 막대한 컴퓨팅 비용을 지불하고, 더 저렴한 모델은 이를 푼돈으로 사용합니다. 실리콘밸리가 최첨단 모델을 소유하고 있을지 모르지만, 계산 화학 분야는 이제 그 결과물을 도매가로 구매하는 방법을 찾아냈습니다.
출처
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Comments
No comments yet. Be the first!