Si vous souhaitez qu'un modèle de langage exécute une simulation de dynamique quantique inédite aujourd'hui, vous devez généralement attendre qu'un humain écrive le logiciel. Les bibliothèques de physique comme OpenFermion ou PennyLane sont extrêmement performantes, mais elles sont figées dans le temps. Lorsqu'une IA rencontre une structure moléculaire qui nécessite une fonction mathématique située en dehors de son environnement préprogrammé, elle se retrouve tout simplement bloquée.
Une équipe composée notamment des chercheurs Zijian Zhang, Ignacio Gustin et Alán Aspuru-Guzik a mis au point une solution de contournement. Leur cadre de travail, baptisé El Agente Forjador (l'agent forgeron), contraint l'IA à écrire, exécuter et déboguer ses propres outils en Python à partir de zéro. Il s'agit d'un changement de paradigme : le code n'est plus considéré comme une dépendance statique, mais comme une chaîne d'approvisionnement générée dynamiquement.
La boucle de rétroaction Python
Les flux de travail agents traditionnels considèrent les logiciels existants comme une limite infranchissable. El Agente Forjador les traite comme une ébauche. Le système fonctionne selon une boucle en quatre étapes : analyse, génération, exécution et évaluation.
Lorsqu'il est confronté à un problème scientifique, l'agent analyse les besoins mathématiques et écrit un script Python personnalisé pour le résoudre. Il exécute ensuite le code. Si le résultat ne respecte pas les paramètres de simulation, l'agent lit l'erreur, débogue son propre script et itère jusqu'à ce que les lois de la physique soient respectées.
Les chercheurs ont testé ce cycle autonome sur 24 tâches distinctes de chimie quantique et de dynamique moléculaire. Les modèles utilisant cette boucle d'auto-forgeron ont systématiquement surpassé les systèmes de référence contraints de résoudre des problèmes chimiques complexes sans pouvoir créer leurs propres outils.
Sous-traiter le coût computationnel
Le détail le plus fascinant de ces recherches n'est pas l'automatisation en soi, mais l'économie du calcul. Utiliser des modèles de pointe comme GPT-4o pour chaque requête scientifique itérative est excessivement coûteux. C'est un désavantage structurel bien connu pour les instituts de recherche européens qui tentent de faire fructifier les financements Horizon face à la tarification des hyperscalers américains.
El Agente Forjador introduit une forme de transfert de connaissances numérique qui contourne partiellement ce modèle tarifaire. Une fois qu'une IA puissante réussit à forger un outil — tel qu'un script permettant de calculer l'énergie de l'état fondamental d'une molécule complexe — elle dépose ce code dans une bibliothèque permanente. Elle constitue ainsi, en quelque sorte, son propre programme d'études.
Des modèles de langage plus petits et moins performants peuvent ensuite extraire cet outil validé pour résoudre des problèmes de niveau expert. Un modèle open-weights plus léger et moins onéreux n'a plus besoin de posséder les capacités de raisonnement nécessaires pour écrire des algorithmes quantiques complexes. Il lui suffit de savoir quel outil pré-forgé extraire de la bibliothèque.
Le modèle onéreux paie le lourd tribut computationnel pour inventer l'outil, et le modèle moins coûteux l'utilise pour quelques centimes. La Silicon Valley possède peut-être les modèles de pointe, mais la chimie computationnelle vient de trouver comment acheter leurs résultats en gros.
Sources
- Zijian Zhang, Ignacio Gustin, Alán Aspuru-Guzik — El Agente Forjador Framework
Comments
No comments yet. Be the first!