Si desea que un modelo de lenguaje ejecute una simulación de dinámica cuántica novedosa hoy en día, normalmente debe esperar a que un humano escriba el software. Las bibliotecas de física como OpenFermion o PennyLane son altamente capaces, pero están congeladas en el tiempo. Cuando una IA se encuentra con una estructura molecular que requiere una función matemática fuera de su entorno preprogramado, simplemente se bloquea.
Un equipo que incluye a los investigadores Zijian Zhang, Ignacio Gustin y Alán Aspuru-Guzik ha construido una solución. Su marco de trabajo, denominado El Agente Forjador, obliga a la IA a escribir, ejecutar y depurar sus propias herramientas de Python desde cero. Es un cambio que pasa de tratar el código como una dependencia estática a una cadena de suministro generada dinámicamente.
El bucle de retroalimentación de Python
Los flujos de trabajo agentes tradicionales tratan el software existente como un límite rígido. El Agente Forjador lo trata como un borrador. El sistema opera en un bucle de cuatro etapas: análisis, generación, ejecución y evaluación.
Cuando se le asigna un problema científico, el agente analiza los requisitos matemáticos y escribe un script de Python personalizado para resolverlo. Luego ejecuta el código. Si el resultado no cumple con los parámetros de simulación, el agente lee el error, depura su propio script e itera hasta que la física se sostiene.
Los investigadores probaron este ciclo autónomo en 24 tareas distintas de química cuántica y dinámica molecular. Los modelos que utilizaron el bucle de auto-forjado superaron constantemente a los sistemas de referencia que estaban obligados a navegar problemas de química complejos sin la capacidad de escribir conjuntos de herramientas personalizados.
Subcontratación del impuesto de cómputo
El detalle más convincente de la investigación no es la automatización en sí, sino la economía del cómputo. Ejecutar modelos de frontera como GPT-4o para cada consulta científica iterativa es extremadamente costoso. Es una desventaja estructural familiar para los institutos de investigación europeos que intentan estirar la financiación de Horizonte frente a los precios de los hiperescaladores estadounidenses.
El Agente Forjador introduce una forma de transferencia de conocimiento digital que subvierte parcialmente este modelo de precios. Una vez que una IA de gran potencia forja con éxito una herramienta —como un script para calcular la energía del estado fundamental de una molécula compleja—, deposita ese código en una biblioteca permanente. Efectivamente, cura su propio plan de estudios.
Los modelos de lenguaje posteriores y más débiles pueden entonces extraer esa herramienta validada para resolver problemas de nivel experto. Un modelo de pesos abiertos más pequeño y barato ya no necesita poseer las capacidades de razonamiento para escribir algoritmos cuánticos complejos. Solo necesita saber qué herramienta preforjada extraer del estante.
El modelo costoso paga el pesado impuesto computacional para inventar la herramienta, y el modelo más barato la utiliza por centavos. Puede que Silicon Valley sea dueño de los modelos de frontera, pero la química computacional acaba de descubrir cómo comprar sus resultados al por mayor.
Fuentes
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Comments
No comments yet. Be the first!