캘리포니아의 콘크리트 실험대와 데이터 센터의 거대한 GPU 클러스터에서 새로운 워크플로우가 주기율표를 조용히 재편하고 있습니다. 화학자들이 실험 레시피를 서서히 수정하는 대신, 거대 신경망이 원자 배열을 제안하고, 고처리량 컴퓨팅 파이프라인이 그 열역학적 운명을 확인하며, 로봇 실험실은 단 며칠 만에 우승한 설계를 실제로 제작하려고 시도합니다. 그 결과는 화학적 공간의 산업적 규모 매핑이나 다름없습니다. 수백만 개의 가상 결정, 열역학적으로 안정하다고 판명된 수십만 개의 물질, 그리고 소프트웨어를 통해 실리콘, 리튬, 코발트를 공학적 발명품으로 바꾸는 '계산 연금술(computational alchemy)'이라는 새로운 용어가 등장했습니다.
물질 규모의 AI
이러한 변화에서 가장 먼저 공개된 이정표 중 하나는 Google DeepMind의 재료 연구 노력에서 나왔습니다. 이들은 GNoME(Graph Networks for Materials Exploration)라 불리는 그래프 신경망 접근 방식을 사용하여 원소 조합과 격자 기하학을 스캔하고 약 220만 개의 후보 결정 구조를 예측했으며, 그중 약 38만 개가 기존 열역학 기준에 따라 매우 안정적인 것으로 확인되었습니다. DeepMind는 상위 후보군을 공개하고 수백 개의 예측을 검증한 실험적 후속 조치를 기록함으로써, 데이터 기반 루프가 과거 수 세기에 걸친 점진적 발견이 필요했던 가용 재료의 우주를 단 몇 달 만에 어떻게 확장할 수 있는지 보여주었습니다.
Meta의 Fundamental AI Research 그룹은 2025년에 보완적인 경로를 택했습니다. 결정을 생성하는 데 그치지 않고, 재사용 가능한 물리적 사전 지식 역할을 하도록 의도된 방대한 원자 데이터셋과 사전 학습된 원자 간 모델을 발표한 것입니다. Open Molecules 2025(OMol25) 데이터셋과 UMA(Universal Model for Atoms)는 수억 개의 DFT 수준 계산과 머신러닝된 원자 간 포텐셜을 제공하며, 이는 하위 발견 파이프라인으로 미세 조정되거나 구성될 수 있습니다. 명시된 목표는 연구자들에게 기성품 계산 현미경과 빠른 포스 필드(force field)를 제공하여, 대학과 스타트업 내부의 더 많은 팀이 학습 데이터를 생성한 슈퍼컴퓨터를 보유하지 않고도 현실적이고 대규모인 시뮬레이션을 실행할 수 있도록 하는 것입니다.
서로 다른 아키텍처, 같은 사명
헤드라인은 이러한 노력들을 하나로 묶고 있지만, 기반이 되는 AI 제품군은 서로 다르며 그 차이점은 중요합니다. DeepMind의 GNoME은 생성 에너지를 예측하고 조성 및 구조 탐색을 통해 구조를 제안하도록 최적화된 그래프 신경망에 의존합니다. Microsoft Research는 두 개의 형제 프로젝트를 발표했습니다. 대상 특성에 맞춰 무기 재료를 제안하는 생성형 확산 모델인 MatterGen과, 원소, 온도, 압력에 걸친 에너지와 반응을 예측하는 학습된 시뮬레이터인 MatterSim입니다. 이 모델들은 함께 인 실리코(in silico)에서 제안을 내놓고 이를 신속하게 선별할 수 있는 '생성기/에뮬레이터' 쌍으로 묘사됩니다.
루프 닫기: 로봇과 능동 학습
예측만으로는 물리적 세상을 바꿀 수 없습니다. 합성 표창과 특성 분석이 뒤따라야 합니다. 사용 가능한 발명품에 도달하기 위해 실험실은 AI 모델을 자동화된 실험 및 능동 학습(active-learning) 루프에 결합하고 있습니다. 모델이 후보를 제안하면, 고처리량 DFT 또는 머신러닝 대리 모델이 안정성과 특성을 추정하고, 자동화된 실험실이나 사람이 합성을 시도하며, 측정된 결과는 레이블이 지정된 데이터로서 모델에 다시 피드백됩니다. DeepMind 등은 Lawrence Berkeley National Laboratory의 자율 플랫폼과 같은 자동화 시설과의 협업을 보고했으며, 이들은 이미 모델이 제안한 상당수의 재료를 합성하여 폐쇄 루프 발견의 실질적인 성과를 입증했습니다. 이러한 실험실 루프(lab-in-the-loop) 방식은 예측을 생산적인 공학으로 전환하는 핵심입니다.
생성형 모델, 빠른 머신러닝 시뮬레이터, 그리고 로보틱스의 결합은 가속화되는 '플라이휠'을 만듭니다. 더 나은 예측은 더 쉬운 합성과 더 많은 학습 데이터를 생성하고, 이는 다시 다음 예측을 개선합니다. 그 결과는 명확합니다. 개념에서 프로토타입에 이르는 수십 년의 경로가 유리한 경우 몇 달 또는 몇 년으로 단축될 수 있습니다.
정치, 컴퓨팅, 그리고 오픈 사이언스의 분열
이러한 역량은 실험 노트뿐만 아니라 정책과 산업 전략까지 재편하고 있습니다. 미국 에너지부는 2025년 말, 국립 연구소의 슈퍼컴퓨터, AI 플랫폼, 자동화 시설을 에너지, 재료 및 국가 안보 우선순위를 위한 단일 발견 엔진으로 통합하려는 국가적 노력인 Genesis Mission을 출범시켰습니다. 이 프로그램은 공유 플랫폼을 구축하고 소수의 민간 실험실 내부에서 발생하는 막대한 컴퓨팅 비용의 중복을 피하기 위해 자금과 인프라를 할당합니다. 동시에 Google, Meta, Microsoft와 같은 기업들은 각자의 로드맵을 계속 설정하고 있습니다. 일부는 코드와 데이터셋을 오픈 소스로 공개하고, 다른 일부는 모델과 인프라를 폐쇄형 클라우드로 유지하면서 독점적 우위와 과학적 민주화 사이의 긴장을 조성하고 있습니다.
산업적 이해관계와 단기 목표
실험실 밖에서 이것이 왜 중요할까요? 더 나은 재료는 여러 산업적 전환의 핵심 입력물입니다. 더 밀도 높고 안전한 전고체 배터리, 더 높은 변환 효율을 가진 페로브스카이트 또는 탠덤 태양광 흡수체, 저손실 전도체, 심지어 전력망과 전자 제품을 재편할 새로운 초전도체 등이 그 예입니다. 기술 기업과 국가 프로그램은 이러한 노력을 그리드 규모의 저장 장치, 효율적인 태양광 재료, 전략 광물에 대한 의존도 감소와 같은 기후 위기 관련 목표에 명시적으로 맞추고 있습니다. 상업적 경쟁은 이미 가시화되었습니다. Microsoft는 MatterGen과 MatterSim을 에너지 및 반도체 분야 기업을 위한 도구로 홍보하는 반면, DeepMind, Meta 등은 발견된 내용을 산업 R&D로 흘려보낼 커뮤니티 공개와 파트너십을 강조합니다.
모든 유망한 후보가 규모를 확장할 수 있는 것은 아닙니다. 현재 지배적인 기술적 과제는 '실험실에서 제조 현장으로(lab-to-fab)'입니다. 즉, DFT 친화적인 결정을 재현 가능한 특성과 수용 가능한 비용을 갖춘 산업적 규모의 제조 가능한 재료로 전환하는 것입니다. 합성 조건, 도핑, 결정립계, 환경적 노화 등은 모두 AI 모델이 완벽하게 예측하기 어려워하는 실제적인 세부 사항입니다. 이것이 모델 예측이 급증하더라도 실험적 검증과 공학적 노력이 여전히 필수적인 이유입니다.
투명성과 재현성의 등장
긍정적인 측면과 함께 실제적인 과학적 위험도 존재합니다. 거대 사전 학습 모델은 오류 모드가 미묘할 때조차 권위 있게 보일 수 있습니다. 데이터셋과 대리 모델은 편향이나 근사치를 포함할 수 있으며, 실험실이 합성 경로를 정확히 복제할 수 없다면 재현 불가능한 주장으로 이어질 수 있습니다. 커뮤니티는 다른 AI 기반 분야를 괴롭혔던 재현성 문제의 반복을 피하고자 오픈 데이터셋, 공유 벤치마크, 독립적인 합성 노력을 강조하며 대응해 왔습니다.
그러한 노력은 등변성 신경망(equivariant networks), 전이 가능한 머신러닝 원자 간 포텐셜, 그리고 불확실성을 정량화하는 능동 학습 전략에 대한 아키텍처 작업과 병행하여 진행되고 있습니다. 이는 예측을 더 빠를 뿐만 아니라 더 해석 가능하고 신뢰할 수 있게 만들기 위한 기술적 단계들입니다. 그 결과는 컴퓨터 과학, 응집 물질 물리학, 그리고 실험실 자동화의 혼합체로, 단순한 기발한 해결책의 모음이라기보다는 하나의 공학 학문처럼 보입니다.
계산 연금술, 과학을 위한 AI, 원자 공학 등 어떤 이름을 붙이든, 지난 2년 동안 일어난 물결은 발견 프로세스를 확장하는 것에 관한 것입니다. 승자는 우수한 모델, 접근 가능한 데이터셋, 재현 가능한 실험 파이프라인, 그리고 컴퓨팅 자원에 대한 공정한 접근권을 결합한 조직이 될 것입니다. 다음 주요 헤드라인은 모델에 의해 제안되고 공장에서 실현된 상업적으로 실용적인 전고체 배터리나 상온 초전도체가 될 수 있습니다. 그때까지 이 작업은 GPU의 속도로 달리는 학제 간 마라톤으로 남을 것입니다.
출처
- Nature (수백만 개의 결정 구조 AI 발견에 관한 GNoME 연구 논문)
- arXiv / OMol25 (Open Molecules 2025 데이터셋 및 UMA 모델)
- Lawrence Berkeley National Laboratory 보도 자료 (Berkeley Lab 뉴스 센터)
- Microsoft Research 간행물 및 블로그 게시물 (MatterGen 및 MatterSim)
- 미국 에너지부 보도 자료 및 Genesis Mission 문서
Comments
No comments yet. Be the first!