Alquimia Computacional: IA Reescreve a Tabela Periódica

Física
Computational Alchemy: AI Rewrites the Periodic Table
Laboratórios de big techs estão utilizando IA generativa e equivariante para prever milhões de novos cristais estáveis e comportamentos em escala atômica, transformando a descoberta de materiais de um ofício de décadas em uma corrida algorítmica. Este artigo explica como DeepMind, Meta, Microsoft e o DOE dos EUA estão construindo os modelos, conjuntos de dados e loops de feedback robóticos por trás do que os pesquisadores chamam de 'alquimia computacional'.

Em uma bancada de laboratório de concreto na Califórnia e em vastos clusters de GPUs em centros de dados, um novo fluxo de trabalho está reformulando silenciosamente a tabela periódica. Em vez de químicos ajustarem lentamente receitas experimentais, grandes redes neurais estão propondo arranjos atômicos, pipelines de computação de alto rendimento estão verificando seu destino termodinâmico e laboratórios robóticos estão tentando fabricar os projetos vencedores em questão de dias. O resultado é nada menos que um mapeamento em escala industrial do espaço químico: milhões de cristais hipotéticos, centenas de milhares sinalizados como termodinamicamente estáveis e um novo vocabulário — "alquimia computacional" — para transformar silício, lítio e cobalto em invenções projetadas por software.

IA na escala da matéria

Um dos primeiros marcos públicos nesta transformação veio do esforço em materiais do Google DeepMind, que usou uma abordagem de redes neurais gráficas chamada GNoME (Graph Networks for Materials Exploration) para escanear combinações de elementos e geometrias de rede e prever cerca de 2,2 milhões de estruturas de cristais candidatos, das quais cerca de 380.000 foram identificadas como altamente estáveis por critérios termodinâmicos convencionais. O DeepMind liberou os principais candidatos e documentou acompanhamentos experimentais que validaram centenas de previsões, ilustrando como um ciclo impulsionado por dados pode multiplicar em meses o universo de materiais acessíveis, o que antes levava séculos de descoberta incremental.

O grupo Fundamental AI Research da Meta seguiu um caminho complementar em 2025: em vez de apenas gerar cristais, publicou conjuntos de dados atomísticos massivos e modelos interatômicos pré-treinados destinados a atuar como priors físicos reutilizáveis. O conjunto de dados Open Molecules 2025 (OMol25) e o Universal Model for Atoms (UMA) fornecem centenas de milhões de cálculos em nível de DFT e potenciais interatômicos aprendidos por máquina que podem ser ajustados ou integrados em pipelines de descoberta posteriores. O objetivo declarado é fornecer aos pesquisadores um microscópio computacional pronto para o uso e um campo de força rápido, para que mais equipes — em universidades e startups — possam realizar simulações realistas em larga escala sem possuir o supercomputador que gerou os dados de treinamento.

Diferentes arquiteturas, mesma missão

Embora as manchetes unam esses esforços, as famílias de IA subjacentes são diferentes, e essas diferenças importam. O GNoME do DeepMind baseia-se em redes neurais gráficas otimizadas para prever energias de formação e propor estruturas por meio de busca composicional e estrutural. A Microsoft Research publicou dois projetos irmãos — o MatterGen, um modelo de difusão generativo que propõe materiais inorgânicos condicionados a propriedades-alvo, e o MatterSim, um simulador aprendido que prevê energias e respostas em diversos elementos, temperaturas e pressões. Juntos, esses modelos são descritos como um par gerador/emulador capaz de propor sugestões e filtrá-las rapidamente in silico.

Fechando o ciclo: robôs e aprendizado ativo

Previsões sozinhas não mudam o mundo físico; a síntese e a caracterização sim. Para alcançar invenções utilizáveis, os laboratórios estão conectando modelos de IA à experimentação automatizada e a um ciclo de aprendizado ativo. Um modelo propõe um candidato, substitutos de DFT ou ML de alto rendimento estimam a estabilidade e as propriedades, um laboratório automatizado ou humano tenta a síntese e o resultado medido retorna ao modelo como dados rotulados. O DeepMind e outros relatam colaborações com instalações automatizadas — como as plataformas autônomas do Lawrence Berkeley National Laboratory — que já sintetizaram um conjunto não trivial de materiais propostos por modelos, demonstrando o retorno prático da descoberta em ciclo fechado. Essa abordagem de "laboratório no ciclo" (lab-in-the-loop) é o que transforma a previsão em engenharia produtiva.

Essa combinação — modelos generativos, simuladores rápidos de ML e robótica — cria um "volante de aceleração": previsões melhores produzem sínteses mais fáceis e mais dados de treinamento, o que, por sua vez, melhora as próximas previsões. As consequências são palpáveis: o que costumava ser um caminho de várias décadas, do conceito ao protótipo, pode, em casos favoráveis, encolher para meses ou poucos anos.

Política, computação e a divisão da ciência aberta

Essas capacidades remodelam não apenas os cadernos de laboratório, mas também as políticas e as estratégias industriais. O Departamento de Energia dos Estados Unidos lançou a Missão Genesis no final de 2025, um esforço nacional para combinar supercomputadores de laboratórios nacionais, plataformas de IA e instalações automatizadas em um único mecanismo de descoberta para prioridades de energia, materiais e segurança nacional. O programa aloca financiamento e infraestrutura para construir plataformas compartilhadas e evitar a duplicação do imenso custo computacional dentro de um punhado de laboratórios privados. Ao mesmo tempo, empresas como Google, Meta e Microsoft continuam a definir seus próprios roteiros — alguns disponibilizando código e conjuntos de dados em código aberto, outros mantendo modelos e infraestrutura atrás de nuvens privadas — criando uma tensão entre a vantagem proprietária e a democratização científica.

Interesses industriais e metas de curto prazo

Por que tudo isso importa fora dos laboratórios? Materiais melhores são os insumos fundamentais para diversas transições industriais: baterias de estado sólido mais densas e seguras, absorvedores solares de perovskita ou tandem com maior eficiência de conversão, condutores de menor perda e até novos supercondutores que reformulariam as redes elétricas e a eletrônica. Empresas de tecnologia e programas nacionais estão orientando explicitamente esses esforços em torno de metas críticas para o clima — armazenamento em escala de rede, materiais fotovoltaicos eficientes e redução da dependência de minerais estratégicos. A corrida comercial já é visível: a Microsoft promove o MatterGen e o MatterSim como ferramentas para empresas que trabalham com energia e semicondutores, enquanto o DeepMind, a Meta e outros enfatizam lançamentos para a comunidade e parcerias que canalizarão as descobertas para a P&D industrial.

Nem todo candidato promissor ganhará escala. O desafio técnico dominante agora é o 'lab-to-fab': transformar um cristal favorável em simulações DFT em um material fabricável em volumes industriais, com propriedades reprodutíveis e custo aceitável. Condições de síntese, dopagem, contornos de grão e envelhecimento ambiental são todos detalhes práticos que os modelos de IA ainda têm dificuldade em prever perfeitamente. É por isso que a validação experimental e a engenharia continuam indispensáveis, mesmo com a proliferação das previsões dos modelos.

Onde entram a transparência e a reprodutibilidade

Existem riscos científicos reais ao lado dos benefícios. Grandes modelos pré-treinados podem parecer autoritários mesmo quando seus modos de erro são sutis; conjuntos de dados e modelos substitutos podem embutir vieses ou aproximações que levam a afirmações irreprodutíveis se os laboratórios não puderem replicar exatamente a rota de síntese. A resposta da comunidade tem enfatizado conjuntos de dados abertos, benchmarks compartilhados e esforços de síntese independentes precisamente para evitar uma repetição do problema de reprodutibilidade que perturbou outros campos impulsionados pela IA.

Esse esforço está acontecendo em paralelo ao trabalho arquitetônico em redes equivariantes, potenciais interatômicos de ML transferíveis e estratégias de aprendizado ativo que quantificam a incerteza — etapas técnicas projetadas para tornar as previsões não apenas mais rápidas, mas mais interpretáveis e confiáveis. O resultado é uma mistura de ciência da computação, física da matéria condensada e automação de laboratório que se assemelha mais a uma disciplina de engenharia do que a uma coleção de truques inteligentes.

Qualquer que seja o rótulo que se dê — alquimia computacional, IA para a ciência ou engenharia atomística — a onda que quebrou nos últimos dois anos trata-se de escalar o processo de descoberta. Os vencedores serão as organizações que combinarem modelos excelentes, conjuntos de dados acessíveis, pipelines experimentais reprodutíveis e acesso justo à computação. A próxima grande manchete poderia ser uma bateria de estado sólido comercialmente viável ou um supercondutor à temperatura ambiente proposto por um modelo e realizado em uma fábrica; até lá, o trabalho continuará sendo uma maratona interdisciplinar corrida na velocidade das GPUs.

Fontes

  • Nature (artigo de pesquisa do GNoME sobre descoberta por IA de milhões de estruturas de cristais)
  • arXiv / OMol25 (conjunto de dados Open Molecules 2025 e modelo UMA)
  • Materiais de imprensa do Lawrence Berkeley National Laboratory (centro de notícias do Berkeley Lab)
  • Publicações e postagens de blog da Microsoft Research (MatterGen e MatterSim)
  • Comunicados de imprensa do Departamento de Energia dos EUA e documentação da Missão Genesis
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q O que é a alquimia computacional neste contexto e quais ferramentas de IA a alimentam?
A Alquimia computacional refere-se ao uso de IA para mapear o espaço químico e transformar designs gerados por software em materiais reais, propondo rapidamente arranjos atômicos, testando sua estabilidade termodinâmica e validando previsões por meio de simulações e experimentos. O esforço combina as redes neurais de grafos da DeepMind (GNoME), o MatterGen e MatterSim da Microsoft, e os dados OMol25/UMA com síntese robótica automatizada para fechar o ciclo.
Q Qual marco a DeepMind alcançou com o GNoME?
A Um marco do esforço em materiais da DeepMind foi o uso do GNoME para escanear combinações de elementos e geometrias de rede, prevendo cerca de 2,2 milhões de estruturas cristalinas candidatas, das quais cerca de 380.000 foram identificadas como altamente estáveis por critérios termodinâmicos convencionais. A equipe liberou os principais candidatos e documentou acompanhamentos experimentais que validaram centenas de previsões, ilustrando um ciclo orientado por dados que acelera a descoberta de séculos para meses.
Q Como os modelos de IA e a robótica criam um ciclo fechado entre a previsão e o experimento?
A Um modelo propõe um candidato, substitutos de DFT de alto rendimento ou ML estimam sua estabilidade e propriedades, e laboratórios automatizados ou humanos tentam a síntese. Os resultados medidos são realimentados como dados rotulados para treinar novamente os modelos. Colaborações com plataformas autônomas, como o Laboratório Nacional Lawrence Berkeley, demonstram o retorno prático da descoberta 'lab-in-the-loop', impulsionando um ciclo de autoaperfeiçoamento.
Q Quais são as implicações políticas e industriais e os principais desafios pela frente?
A As implicações políticas e industriais são moldadas pela Missão Genesis, um programa do DOE iniciado em 2025 para fundir supercomputação, plataformas de IA e instalações automatizadas em um motor de descoberta compartilhado para prioridades de energia, materiais e segurança nacional. Enquanto isso, as empresas equilibram lançamentos de código aberto com roteiros privados, criando tensão entre a democratização e a vantagem proprietária. O desafio central continua sendo a transição do laboratório para a fábrica (lab-to-fab): transformar cristais compatíveis com DFT em materiais fabricáveis em escala, com propriedades reprodutíveis e custos acessíveis.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!