Вычислительная алхимия: ИИ переписывает таблицу Менделеева

Physics
Computational Alchemy: AI Rewrites the Periodic Table
Лаборатории крупнейших технологических компаний используют генеративный и эквивариантный ИИ для предсказания миллионов новых стабильных кристаллов и поведения на атомном уровне, превращая поиск новых материалов из многолетнего ремесла в алгоритмический спринт. В статье объясняется, как DeepMind, Meta, Microsoft и Министерство энергетики США создают модели, наборы данных и роботизированные системы обратной связи, лежащие в основе того, что исследователи называют «вычислительной алхимией».

На бетонном лабораторном столе в Калифорнии и в огромных кластерах GPU в центрах обработки данных новый рабочий процесс незаметно переписывает периодическую таблицу. Вместо того чтобы химики медленно подбирали экспериментальные рецепты, крупные нейронные сети предлагают варианты расположения атомов, высокопроизводительные вычислительные конвейеры проверяют их термодинамическую устойчивость, а роботизированные лаборатории пытаются создать лучшие образцы за считанные дни. Результатом является не что иное, как картографирование химического пространства в промышленных масштабах: миллионы гипотетических кристаллов, сотни тысяч из которых признаны термодинамически стабильными, и новый термин — «вычислительная алхимия» — для превращения кремния, лития и кобальта в технологические изобретения с помощью программного обеспечения.

ИИ в масштабе материи

Одной из первых публичных вех в этой трансформации стала работа подразделения Google DeepMind по исследованию материалов. Команда использовала графовый нейросетевой подход под названием GNoME (Graph Networks for Materials Exploration) для сканирования комбинаций элементов и геометрий кристаллических решеток. Было предсказано около 2,2 миллиона потенциальных кристаллических структур, из которых около 380 000 были идентифицированы как высокостабильные по традиционным термодинамическим критериям. DeepMind опубликовала список лучших кандидатов и представила результаты экспериментальных проверок, подтвердивших сотни предсказаний. Это продемонстрировало, как цикл, основанный на данных, может за месяцы расширить вселенную доступных материалов настолько, на что раньше требовались столетия постепенных открытий.

Группа Fundamental AI Research компании Meta выбрала в 2025 году дополняющий путь: вместо того чтобы просто генерировать кристаллы, она опубликовала массивные атомистические наборы данных и предварительно обученные межатомные модели, предназначенные для использования в качестве многоразовых физических априорных знаний (priors). Набор данных Open Molecules 2025 (OMol25) и универсальная модель атомов Universal Model for Atoms (UMA) предоставляют сотни миллионов вычислений уровня DFT (теории функционала плотности) и машинообученных межатомных потенциалов, которые можно тонко настраивать или интегрировать в конвейеры открытий. Заявленная цель — предоставить исследователям готовый «вычислительный микроскоп» и быстрое силовое поле, чтобы больше команд — в университетах и стартапах — могли запускать реалистичные крупномасштабные симуляции, не владея суперкомпьютером, на котором генерировались обучающие данные.

Разные архитектуры, одна миссия

Хотя в заголовках эти усилия часто объединяют, лежащие в их основе семейства ИИ различаются, и эти различия имеют значение. GNoME от DeepMind опирается на графовые нейронные сети, оптимизированные для прогнозирования энергии образования и предложения структур путем композиционного и структурного поиска. Microsoft Research опубликовала два родственных проекта: MatterGen — генеративную диффузионную модель, которая предлагает неорганические материалы на основе заданных целевых свойств, и MatterSim — обученный симулятор, предсказывающий энергию и отклик материалов в зависимости от элементов, температуры и давления. Вместе эти модели описываются как пара «генератор/эмулятор», способная выдвигать предложения и быстро проверять их in silico.

Замыкание цикла: роботы и активное обучение

Сами по себе предсказания не меняют физический мир; это делают синтез и характеризация. Чтобы прийти к пригодным для использования изобретениям, лаборатории связывают модели ИИ с автоматизированными экспериментами и циклом активного обучения. Модель предлагает кандидата, высокопроизводительные суррогатные модели на базе DFT или машинного обучения оценивают стабильность и свойства, автоматизированная или традиционная лаборатория пытается провести синтез, а полученный результат возвращается в модель в виде размеченных данных. DeepMind и другие компании сообщают о сотрудничестве с автоматизированными центрами — такими как автономные платформы Национальной лаборатории имени Лоуренса в Беркли — которые уже синтезировали значительную часть предложенных моделями материалов, доказав практическую пользу открытий с замкнутым циклом. Именно этот подход «лаборатория в цикле» (lab-in-the-loop) превращает предсказание в продуктивное инженерное решение.

Эта комбинация — генеративные модели, быстрые ML-симуляторы и робототехника — создает ускоряющийся «маховик»: лучшие прогнозы обеспечивают более простой синтез и больше обучающих данных, что, в свою очередь, улучшает следующие прогнозы. Последствия ощутимы: путь от концепции до прототипа, который раньше занимал десятилетия, в благоприятных случаях может сократиться до месяцев или нескольких лет.

Политика, вычисления и раскол в открытой науке

Эти возможности меняют не только лабораторные журналы, но и государственную политику, и промышленную стратегию. В конце 2025 года Министерство энергетики США запустило миссию Genesis — национальный проект по объединению суперкомпьютеров национальных лабораторий, платформ ИИ и автоматизированных комплексов в единую систему поиска новых решений для энергетики, материаловедения и национальной безопасности. Программа распределяет финансирование и инфраструктуру для создания общих платформ и предотвращения дублирования огромных вычислительных затрат внутри нескольких частных лабораторий. В то же время такие фирмы, как Google, Meta и Microsoft, продолжают следовать собственным дорожным картам: одни открывают исходный код и наборы данных, другие держат модели и инфраструктуру в частных облаках, что создает напряженность между проприетарным преимуществом и демократизацией науки.

Промышленные ставки и краткосрочные цели

Почему все это важно за пределами лабораторий? Новые материалы являются ключевыми факторами для нескольких промышленных переходов: более емкие и безопасные твердотельные аккумуляторы, перовскитные или тандемные поглотители солнечной энергии с более высоким КПД, проводники с низкими потерями и даже новые сверхпроводники, которые могли бы перестроить электросети и электронику. Технологические компании и национальные программы явно ориентируют эти усилия на критически важные для климата цели: хранение энергии в масштабах сети, эффективные фотоэлектрические материалы и снижение зависимости от стратегических минералов. Коммерческая гонка уже видна: Microsoft продвигает MatterGen и MatterSim как инструменты для компаний, работающих в сфере энергетики и полупроводников, в то время как DeepMind, Meta и другие делают упор на релизы для сообщества и партнерства, которые направят открытия в промышленные НИОКР.

Не каждый перспективный кандидат пойдет в серию. Главной технической проблемой сейчас является переход «от лаборатории к производству» (lab-to-fab): превращение удобного для DFT кристалла в материал, пригодный для изготовления в промышленных объемах с воспроизводимыми свойствами и приемлемой стоимостью. Условия синтеза, легирование, границы зерен и старение под воздействием среды — все это практические детали, которые модели ИИ пока не могут предсказать идеально. Именно поэтому экспериментальная проверка и инженерная работа остаются незаменимыми даже при лавинообразном росте модельных предсказаний.

Прозрачность и воспроизводимость

Наряду с преимуществами существуют и реальные научные риски. Крупные предварительно обученные модели могут выглядеть авторитетно даже тогда, когда их ошибки неочевидны; наборы данных и суррогатные модели могут содержать предвзятости или аппроксимации, ведущие к недостоверным заявлениям, если лаборатории не могут в точности повторить путь синтеза. Реакция научного сообщества была сосредоточена на открытых наборах данных, общих бенчмарках и независимых попытках синтеза именно для того, чтобы избежать повторения проблемы воспроизводимости, которая затронула другие области, управляемые ИИ.

Эта работа идет параллельно с архитектурными разработками в области эквивариантных сетей, переносимых межатомных потенциалов на базе ML и стратегий активного обучения, которые количественно оценивают неопределенность. Эти технические шаги призваны сделать предсказания не только быстрее, но и более интерпретируемыми и надежными. В результате получается сплав компьютерных наук, физики конденсированного состояния и лабораторной автоматизации, который больше напоминает инженерную дисциплину, чем набор хитроумных приемов.

Как бы вы это ни называли — вычислительной алхимией, ИИ для науки или атомистической инженерией — волна, поднявшаяся в последние два года, связана с масштабированием процесса открытий. Победителями станут организации, сочетающие в себе отличные модели, доступные наборы данных, воспроизводимые экспериментальные конвейеры и справедливый доступ к вычислительным мощностям. Следующим громким заголовком может стать коммерчески жизнеспособный твердотельный аккумулятор или сверхпроводник при комнатной температуре, предложенный моделью и реализованный на заводе; а до тех пор эта работа останется междисциплинарным марафоном, бегущим со скоростью GPU.

Источники

  • Nature (исследовательская статья GNoME об открытии миллионов кристаллических структур с помощью ИИ)
  • arXiv / OMol25 (набор данных Open Molecules 2025 и модель UMA)
  • Пресс-материалы Национальной лаборатории имени Лоуренса в Беркли (Berkeley Lab news center)
  • Публикации и посты в блоге Microsoft Research (MatterGen и MatterSim)
  • Пресс-релизы Министерства энергетики США и документация миссии Genesis
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Что такое вычислительная алхимия в данном контексте и какие инструменты ИИ лежат в ее основе?
A Вычислительная алхимия — это использование ИИ для картирования химического пространства и превращения программных моделей в реальные материалы путем быстрого предложения вариантов расположения атомов, проверки их термодинамической стабильности и подтверждения прогнозов с помощью симуляций и экспериментов. Проект объединяет графовые нейронные сети DeepMind (GNoME), разработки Microsoft MatterGen и MatterSim, а также данные OMol25/UMA с автоматизированным робототехническим синтезом для замыкания цикла разработки.
Q Какого важного рубежа достигла компания DeepMind с помощью GNoME?
A Одним из достижений DeepMind в области материаловедения стало использование GNoME для анализа комбинаций элементов и геометрии кристаллических решеток, что позволило предсказать около 2,2 миллиона потенциальных структур, из которых около 380 000 были признаны высокостабильными по стандартным термодинамическим критериям. Команда опубликовала лучшие варианты и задокументировала экспериментальные исследования, подтвердившие сотни прогнозов, что демонстрирует цикл на основе данных, сокращающий время открытий со столетий до месяцев.
Q Как модели ИИ и робототехника создают замкнутый цикл между прогнозом и экспериментом?
A Модель предлагает кандидата, высокопроизводительные расчеты DFT или суррогатные модели машинного обучения оценивают его стабильность и свойства, после чего автоматизированные или традиционные лаборатории пытаются провести синтез. Измеренные результаты возвращаются в виде размеченных данных для переобучения моделей. Сотрудничество с автономными платформами, такими как Национальная лаборатория имени Лоуренса в Беркли, демонстрирует практическую отдачу от открытий по принципу «лаборатория в цикле», запуская самосовершенствующийся процесс.
Q Каковы последствия для политики и промышленности, и какие основные проблемы стоят впереди?
A Последствия для политики и промышленности определяются миссией Genesis — программой Министерства энергетики США, запущенной в 2025 году для объединения суперкомпьютеров, платформ ИИ и автоматизированных мощностей в единую систему поиска решений для энергетики, материаловедения и национальной безопасности. В то же время компании балансируют между выпуском открытого кода и частными планами развития, что создает напряженность между демократизацией технологий и коммерческим преимуществом. Главной проблемой остается переход от «лаборатории к фабрике»: превращение подходящих для DFT кристаллов в материалы, пригодные для массового производства с воспроизводимыми свойствами и доступной стоимостью.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!