この文脈における「計算機錬金術（Computational alchemy）」とは何ですか？また、それを支えるAIツールは何ですか？

計算機錬金術とは、AIを用いて化学空間をマッピングし、原子配列の迅速な提案、熱力学的安定性のテスト、そしてシミュレーションや実験を通じた予測の検証を行うことで、ソフトウェアが生成した設計を現実の材料へと変換することを指します。この取り組みは、DeepMindのグラフニューラルネットワーク（GNoME）、MicrosoftのMatterGenおよびMatterSim、そしてOMol25/UMAデータを、自動化されたロボット合成と組み合わせることで、一連のプロセス（ループ）を完結させています。

DeepMindはGNoMEでどのようなマイルストーンを達成しましたか？

DeepMindの材料開発におけるマイルストーンの一つは、GNoMEを使用して元素の組み合わせと格子幾何学をスキャンし、約220万の候補結晶構造を予測したことです。そのうち約38万件が、従来の熱力学的基準において極めて安定していると特定されました。チームは上位候補を公開し、数百の予測を検証した実験的な追跡調査を記録しました。これは、発見に要する時間を数世紀から数ヶ月へと短縮するデータ駆動型のループを実証しています。

AIモデルとロボット工学は、予測と実験の間にどのようにクローズドループを構築するのですか？

モデルが候補を提案し、高スループットのDFT（密度汎関数理論）または機械学習（ML）代理モデルがその安定性と特性を推定し、自動化された研究室または人間の研究員が合成を試みます。測定された結果は、モデルを再学習させるためのラベル付きデータとしてフィードバックされます。ローレンス・バークレー国立研究所などの自律型プラットフォームとの提携は、実地での発見（lab-in-the-loop）の実用的な成果を示しており、自己改善型のサイクルを動かしています。

政策や産業への影響、および今後の主な課題は何ですか？

政策と産業への影響は、2025年に開始された米国エネルギー省（DOE）のプログラム「Genesis Mission」によって形作られています。これは、スーパーコンピューティング、AIプラットフォーム、自動化施設を統合し、エネルギー、材料、国家安全保障の優先事項のための共有発見エンジンを構築するものです。一方で、企業はオープンソースでの公開と独自のロードマップのバランスを取っており、民主化と独占的優位性の間で緊張が生じています。最大の課題は依然として「ラボから製造（lab-to-fab）」、つまりDFT（密度汎関数理論）に適した結晶を、再現可能な特性と手頃なコストで大規模に製造可能な材料へと変えることにあります。

計算機錬金術：AIが再構築する周期表

カリフォルニアのコンクリートの実験台の上で、そしてデータセンターの広大なGPUクラスターの中で、新たなワークフローが周期表を静かに書き換えています。化学者が実験レシピを地道に微調整する代わりに、大規模なニューラルネットワークが原子配置を提案し、ハイスループットな計算パイプラインがその熱力学的な運命をチェックし、ロボットラボがその中から選ばれたデザインをわずか数日で形にしようとしています。その結果は、化学空間の産業規模のマッピングに他なりません。数百万の仮想的な結晶、熱力学的に安定していると特定された数十万の構造、そしてシリコンやリチウム、コバルトをソフトウェアによる設計発明へと変える「計算アルケミー（Computational Alchemy）」という新しい語彙が生まれています。

物質スケールのAI

この変革における初期の重要なマイルストーンの一つは、Google DeepMindの材料研究の取り組みから生まれました。彼らはGNoME（Graph Networks for Materials Exploration）と呼ばれるグラフニューラルネットワークの手法を用い、元素の組み合わせと格子幾何学をスキャンして約220万の候補となる結晶構造を予測しました。そのうち約38万構造が、従来の熱力学的基準によって極めて安定していると特定されました。DeepMindは上位の候補を公開し、数百の予測を検証した実験的な追跡調査を記録しました。これは、データ駆動型のループがいかにして、かつては何世紀にもわたる漸進的な発見を必要としたアクセス可能な材料の世界を、わずか数ヶ月で何倍にも広げられるかを示しています。

MetaのFundamental AI Researchグループは、2025年に補完的なルートをとりました。結晶を生成するだけでなく、再利用可能な物理的プライア（事前知識）として機能することを意図した、膨大な原子データセットと事前学習済みの原子間モデルを公開したのです。Open Molecules 2025（OMol25）データセットとUMA（Universal Model for Atoms）は、数億件のDFT（密度汎関数法）レベルの計算と、下流の発見パイプラインに微調整や組み込みが可能な機械学習による原子間ポテンシャルを提供します。その公言された目標は、研究者に既製の「計算顕微鏡」と高速な力場を提供し、大学やスタートアップ内のより多くのチームが、学習データを生成したスーパーコンピュータを所有することなく、現実的で大規模なシミュレーションを実行できるようにすることです。

異なるアーキテクチャ、同じ使命

ヘッドラインではこれらの取り組みは一括りにされていますが、基盤となるAIファミリーは異なっており、その違いには重要な意味があります。DeepMindのGNoMEは、生成エネルギーの予測と、組成および構造探索による構造提案に最適化されたグラフニューラルネットワークに依存しています。一方、Microsoft Researchは2つの兄弟プロジェクトを公開しました。ターゲットとする特性を条件として無機材料を提案する生成拡散モデル「MatterGen」と、元素、温度、圧力全域にわたるエネルギーと応答を予測する学習済みシミュレータ「MatterSim」です。これらのモデルは、イン・シリコで提案を行い、それを迅速にスクリーニングできる「ジェネレータとエミュレータ」のペアとして説明されています。

ループを閉じる：ロボットと能動学習

予測だけでは物理的な世界を変えることはできません。合成とキャラクタリゼーション（特性評価）が必要です。実用的な発明に至るために、研究室ではAIモデルを自動化された実験と能動学習（アクティブラーニング）のループに縫い合わせています。モデルが候補を提案し、ハイスループットのDFTまたは機械学習（ML）のサロゲートモデルが安定性と特性を推定し、自動化されたラボまたは人間の研究者が合成を試み、その測定結果がラベル付きデータとしてモデルにフィードバックされます。DeepMindなどは、Lawrence Berkeley National Laboratoryの自律型プラットフォームなどの自動化施設との提携を報告しており、すでにモデルが提案した材料の少なからぬセットを合成し、クローズドループ型の発見プロセスの実用的な成果を実証しています。この「ラボ・イン・ザ・ループ（lab-in-the-loop）」アプローチこそが、予測を生産的なエンジニアリングへと変えるものです。

生成モデル、高速なMLシミュレータ、そしてロボティクスの組み合わせは、加速する「フライホイール（はずみ車）」を生み出します。より優れた予測がより容易な合成とより多くの学習データをもたらし、それが次なる予測をさらに向上させます。その結果は明白です。コンセプトからプロトタイプまでかつては数十年を要した道のりが、好条件の下では数ヶ月から数年に短縮される可能性があるのです。

政治、計算、そしてオープンサイエンスの分裂

これらの能力は、研究ノートだけでなく、政策や産業戦略をも再編しています。米国エネルギー省（DOE）は2025年後半、国立研究所のスーパーコンピュータ、AIプラットフォーム、自動化施設を統合し、エネルギー、材料、国家安全保障の優先事項のための単一の発見エンジンとする国家的な取り組み「Genesis Mission」を開始しました。このプログラムは、共有プラットフォームを構築するために資金とインフラを割り当て、一握りのプライベートな研究所内での膨大な計算コストの重複を避けることを目的としています。同時に、Google、Meta、Microsoftといった企業は独自のロードマップを設定し続けています。コードやデータセットをオープンソース化する企業もあれば、モデルやインフラをプライベートクラウドの背後に秘匿する企業もあり、独自の優位性と科学の民主化との間に緊張関係が生じています。

産業的利害と短期的な目標

研究室の外でこれがなぜ重要なのでしょうか？より優れた材料は、いくつかの産業転換における鍵となるインプットだからです。より高密度で安全な全固体電池、変換効率の高いペロブスカイトやタンデム型の太陽光吸収体、低損失の導体、さらには電力網や電子機器を作り変えるような新しい超伝導体などが挙げられます。テック企業や国家プロジェクトは、これらの取り組みを、グリッドスケールの蓄電、効率的な太陽光発電材料、戦略的鉱物への依存低減といった気候変動に関わる重要な目標に明確に向けています。商業的な競争はすでに目に見える形となっており、MicrosoftはMatterGenとMatterSimをエネルギーや半導体分野に取り組む企業向けのツールとして宣伝し、DeepMindやMetaなどは発見を産業界の研究開発へと流し込むためのコミュニティ向けのリリースやパートナーシップを強調しています。

すべての有望な候補がスケールするわけではありません。現在の主要な技術的課題は「ラボから製造（lab-to-fab）」です。DFTに適した結晶を、再現性のある特性と許容可能なコストで、産業規模で製造可能な材料へと変えることです。合成条件、ドーピング、粒界、環境劣化などはすべて、AIモデルが完璧に予測するのに苦労している実用上の詳細事項です。モデルによる予測が増殖しても、実験による検証とエンジニアリングが不可欠である理由がここにあります。

透明性と再現性の重要性

明るい兆しの一方で、現実的な科学的リスクも存在します。大規模な事前学習済みモデルは、そのエラーモードが微妙なものであっても権威があるように見えることがあります。データセットやサロゲートモデルにバイアスや近似が含まれていると、研究室が合成経路を正確に再現できない場合、再現不可能な主張につながる可能性があります。コミュニティの反応としては、他のAI駆動型の分野を悩ませてきた再現性の問題の再発を避けるために、オープンなデータセット、共有ベンチマーク、そして独立した合成の取り組みが強調されています。

その努力は、同変ネットワーク（equivariant networks）、転移可能な機械学習原子間ポテンシャル、そして不確実性を定量化する能動学習戦略に関するアーキテクチャの研究と並行して進められています。これらは予測を高速化するだけでなく、より解釈可能で信頼性の高いものにするために設計された技術的なステップです。その結果、コンピュータ科学、物性物理学、そしてラボオートメーションが融合し、単なる巧妙なハックの集まりというよりも、一つの工学分野に近いものになりつつあります。

計算アルケミー、科学のためのAI、あるいは原子工学（atomistic engineering）と、どのようなラベルを貼ろうとも、ここ2年で巻き起こった波の本質は発見プロセスのスケーリングにあります。勝者となるのは、優れたモデル、アクセス可能なデータセット、再現可能な実験パイプライン、そして計算資源への公平なアクセスを兼ね備えた組織でしょう。次の大きなヘッドラインは、モデルによって提案され、工場で実現された商用レベルの全固体電池や常温超伝導体かもしれません。それまでの間、この仕事はGPUの速度で走る学際的なマラソンであり続けるでしょう。

出典

Nature（数百万の結晶構造のAIによる発見に関するGNoME研究論文）
arXiv / OMol25（Open Molecules 2025データセットおよびUMAモデル）
Lawrence Berkeley National Laboratory プレス資料（Berkeley Lab ニュースセンター）
Microsoft Research 刊行物およびブログ投稿（MatterGen および MatterSim）
米国エネルギー省プレスリリースおよび Genesis Mission 文書

計算機錬金術：AIが書き換える周期表

物質スケールのAI

異なるアーキテクチャ、同じ使命

ループを閉じる：ロボットと能動学習

政治、計算、そしてオープンサイエンスの分裂

産業的利害と短期的な目標

透明性と再現性の重要性

出典

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments