What is computational alchemy in this context and what AI tools power it?

Computational alchemy refers to using AI to map chemical space and turn software-generated designs into real materials by rapidly proposing atomic arrangements, testing their thermodynamic stability, and validating predictions through simulations and experiments. The effort combines DeepMind's graph neural networks (GNoME), Microsoft's MatterGen and MatterSim, and the OMol25/UMA data with automated, robotic synthesis to close the loop.

What milestone did DeepMind achieve with GNoME?

One milestone from DeepMind's materials effort was using GNoME to scan combinations of elements and lattice geometries, predicting roughly 2.2 million candidate crystal structures, of which about 380,000 were identified as highly stable by conventional thermodynamic criteria. The team released top candidates and documented experimental follow-ups that validated hundreds of predictions, illustrating a data-driven loop that accelerates discovery from centuries to months.

How do AI models and robotics create a closed loop between prediction and experiment?

A model proposes a candidate, high‑throughput DFT or ML surrogates estimate its stability and properties, and automated or human laboratories attempt synthesis. The measured outcomes are fed back as labeled data to retrain the models. Collaborations with autonomous platforms, such as Lawrence Berkeley National Laboratory, demonstrate the practical payoff of lab‑in‑the‑loop discovery, driving a self‑improving flywheel.

What are the policy and industry implications and the main challenges ahead?

Policy and industry implications are shaped by the Genesis Mission, a DOE program started in 2025 to fuse supercomputing, AI platforms, and automated facilities into a shared discovery engine for energy, materials, and national security priorities. Meanwhile, firms balance open-source releases against private roadmaps, creating tension between democratization and proprietary advantage. The central challenge remains lab-to-fab: turning DFT‑friendly crystals into manufacturable materials at scale with reproducible properties and affordable costs.

Alquimia computacional: IA remodela a tabela periódica

Em uma bancada de laboratório de concreto na Califórnia e em vastos clusters de GPUs em centros de dados, um novo fluxo de trabalho está reformulando silenciosamente a tabela periódica. Em vez de químicos ajustarem lentamente receitas experimentais, grandes redes neurais estão propondo arranjos atômicos, pipelines de computação de alto rendimento estão verificando seu destino termodinâmico e laboratórios robóticos estão tentando fabricar os projetos vencedores em questão de dias. O resultado é nada menos que um mapeamento em escala industrial do espaço químico: milhões de cristais hipotéticos, centenas de milhares sinalizados como termodinamicamente estáveis e um novo vocabulário — "alquimia computacional" — para transformar silício, lítio e cobalto em invenções projetadas por software.

IA na escala da matéria

Um dos primeiros marcos públicos nesta transformação veio do esforço em materiais do Google DeepMind, que usou uma abordagem de redes neurais gráficas chamada GNoME (Graph Networks for Materials Exploration) para escanear combinações de elementos e geometrias de rede e prever cerca de 2,2 milhões de estruturas de cristais candidatos, das quais cerca de 380.000 foram identificadas como altamente estáveis por critérios termodinâmicos convencionais. O DeepMind liberou os principais candidatos e documentou acompanhamentos experimentais que validaram centenas de previsões, ilustrando como um ciclo impulsionado por dados pode multiplicar em meses o universo de materiais acessíveis, o que antes levava séculos de descoberta incremental.

O grupo Fundamental AI Research da Meta seguiu um caminho complementar em 2025: em vez de apenas gerar cristais, publicou conjuntos de dados atomísticos massivos e modelos interatômicos pré-treinados destinados a atuar como priors físicos reutilizáveis. O conjunto de dados Open Molecules 2025 (OMol25) e o Universal Model for Atoms (UMA) fornecem centenas de milhões de cálculos em nível de DFT e potenciais interatômicos aprendidos por máquina que podem ser ajustados ou integrados em pipelines de descoberta posteriores. O objetivo declarado é fornecer aos pesquisadores um microscópio computacional pronto para o uso e um campo de força rápido, para que mais equipes — em universidades e startups — possam realizar simulações realistas em larga escala sem possuir o supercomputador que gerou os dados de treinamento.

Diferentes arquiteturas, mesma missão

Embora as manchetes unam esses esforços, as famílias de IA subjacentes são diferentes, e essas diferenças importam. O GNoME do DeepMind baseia-se em redes neurais gráficas otimizadas para prever energias de formação e propor estruturas por meio de busca composicional e estrutural. A Microsoft Research publicou dois projetos irmãos — o MatterGen, um modelo de difusão generativo que propõe materiais inorgânicos condicionados a propriedades-alvo, e o MatterSim, um simulador aprendido que prevê energias e respostas em diversos elementos, temperaturas e pressões. Juntos, esses modelos são descritos como um par gerador/emulador capaz de propor sugestões e filtrá-las rapidamente in silico.

Fechando o ciclo: robôs e aprendizado ativo

Previsões sozinhas não mudam o mundo físico; a síntese e a caracterização sim. Para alcançar invenções utilizáveis, os laboratórios estão conectando modelos de IA à experimentação automatizada e a um ciclo de aprendizado ativo. Um modelo propõe um candidato, substitutos de DFT ou ML de alto rendimento estimam a estabilidade e as propriedades, um laboratório automatizado ou humano tenta a síntese e o resultado medido retorna ao modelo como dados rotulados. O DeepMind e outros relatam colaborações com instalações automatizadas — como as plataformas autônomas do Lawrence Berkeley National Laboratory — que já sintetizaram um conjunto não trivial de materiais propostos por modelos, demonstrando o retorno prático da descoberta em ciclo fechado. Essa abordagem de "laboratório no ciclo" (lab-in-the-loop) é o que transforma a previsão em engenharia produtiva.

Essa combinação — modelos generativos, simuladores rápidos de ML e robótica — cria um "volante de aceleração": previsões melhores produzem sínteses mais fáceis e mais dados de treinamento, o que, por sua vez, melhora as próximas previsões. As consequências são palpáveis: o que costumava ser um caminho de várias décadas, do conceito ao protótipo, pode, em casos favoráveis, encolher para meses ou poucos anos.

Política, computação e a divisão da ciência aberta

Essas capacidades remodelam não apenas os cadernos de laboratório, mas também as políticas e as estratégias industriais. O Departamento de Energia dos Estados Unidos lançou a Missão Genesis no final de 2025, um esforço nacional para combinar supercomputadores de laboratórios nacionais, plataformas de IA e instalações automatizadas em um único mecanismo de descoberta para prioridades de energia, materiais e segurança nacional. O programa aloca financiamento e infraestrutura para construir plataformas compartilhadas e evitar a duplicação do imenso custo computacional dentro de um punhado de laboratórios privados. Ao mesmo tempo, empresas como Google, Meta e Microsoft continuam a definir seus próprios roteiros — alguns disponibilizando código e conjuntos de dados em código aberto, outros mantendo modelos e infraestrutura atrás de nuvens privadas — criando uma tensão entre a vantagem proprietária e a democratização científica.

Interesses industriais e metas de curto prazo

Por que tudo isso importa fora dos laboratórios? Materiais melhores são os insumos fundamentais para diversas transições industriais: baterias de estado sólido mais densas e seguras, absorvedores solares de perovskita ou tandem com maior eficiência de conversão, condutores de menor perda e até novos supercondutores que reformulariam as redes elétricas e a eletrônica. Empresas de tecnologia e programas nacionais estão orientando explicitamente esses esforços em torno de metas críticas para o clima — armazenamento em escala de rede, materiais fotovoltaicos eficientes e redução da dependência de minerais estratégicos. A corrida comercial já é visível: a Microsoft promove o MatterGen e o MatterSim como ferramentas para empresas que trabalham com energia e semicondutores, enquanto o DeepMind, a Meta e outros enfatizam lançamentos para a comunidade e parcerias que canalizarão as descobertas para a P&D industrial.

Nem todo candidato promissor ganhará escala. O desafio técnico dominante agora é o 'lab-to-fab': transformar um cristal favorável em simulações DFT em um material fabricável em volumes industriais, com propriedades reprodutíveis e custo aceitável. Condições de síntese, dopagem, contornos de grão e envelhecimento ambiental são todos detalhes práticos que os modelos de IA ainda têm dificuldade em prever perfeitamente. É por isso que a validação experimental e a engenharia continuam indispensáveis, mesmo com a proliferação das previsões dos modelos.

Onde entram a transparência e a reprodutibilidade

Existem riscos científicos reais ao lado dos benefícios. Grandes modelos pré-treinados podem parecer autoritários mesmo quando seus modos de erro são sutis; conjuntos de dados e modelos substitutos podem embutir vieses ou aproximações que levam a afirmações irreprodutíveis se os laboratórios não puderem replicar exatamente a rota de síntese. A resposta da comunidade tem enfatizado conjuntos de dados abertos, benchmarks compartilhados e esforços de síntese independentes precisamente para evitar uma repetição do problema de reprodutibilidade que perturbou outros campos impulsionados pela IA.

Esse esforço está acontecendo em paralelo ao trabalho arquitetônico em redes equivariantes, potenciais interatômicos de ML transferíveis e estratégias de aprendizado ativo que quantificam a incerteza — etapas técnicas projetadas para tornar as previsões não apenas mais rápidas, mas mais interpretáveis e confiáveis. O resultado é uma mistura de ciência da computação, física da matéria condensada e automação de laboratório que se assemelha mais a uma disciplina de engenharia do que a uma coleção de truques inteligentes.

Qualquer que seja o rótulo que se dê — alquimia computacional, IA para a ciência ou engenharia atomística — a onda que quebrou nos últimos dois anos trata-se de escalar o processo de descoberta. Os vencedores serão as organizações que combinarem modelos excelentes, conjuntos de dados acessíveis, pipelines experimentais reprodutíveis e acesso justo à computação. A próxima grande manchete poderia ser uma bateria de estado sólido comercialmente viável ou um supercondutor à temperatura ambiente proposto por um modelo e realizado em uma fábrica; até lá, o trabalho continuará sendo uma maratona interdisciplinar corrida na velocidade das GPUs.

Fontes

Nature (artigo de pesquisa do GNoME sobre descoberta por IA de milhões de estruturas de cristais)
arXiv / OMol25 (conjunto de dados Open Molecules 2025 e modelo UMA)
Materiais de imprensa do Lawrence Berkeley National Laboratory (centro de notícias do Berkeley Lab)
Publicações e postagens de blog da Microsoft Research (MatterGen e MatterSim)
Comunicados de imprensa do Departamento de Energia dos EUA e documentação da Missão Genesis

Alquimia Computacional: IA Reescreve a Tabela Periódica

IA na escala da matéria

Diferentes arquiteturas, mesma missão

Fechando o ciclo: robôs e aprendizado ativo

Política, computação e a divisão da ciência aberta

Interesses industriais e metas de curto prazo

Onde entram a transparência e a reprodutibilidade

Fontes

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments