하이델베르크 AI, 우주의 비밀을 풀다 — 그 작동 중단이 진정한 이야기인 이유

물리학
Heidelberg's AI decoded the cosmos — why it stopped working is the real story
우주 진화 데이터로 학습된 AI가 우주의 지배 방정식을 역설계했으나, 거대 규모에서 성능이 저하되는 현상은 현대 물리학의 근본적인 공백을 드러낸다.

하이델베르크 연구팀을 멈춰 세운 데이터 플롯은 발견이 아니라, 오히려 무언가의 부재였다. 2025년 12월의 어느 추운 아침, 이론물리학 연구소에서 수십억 개의 우주 관측 데이터 포인트로 학습된 머신러닝 모델이 실행을 마쳤다. 이 모델은 우주의 거대 구조를 지배하는 방정식을 성공적으로 역공학(reverse-engineered)해냈으며, 빅뱅의 초기 조건으로부터 은하 분포와 우주 거대 구조(cosmic web)를 정확하게 예측했다. 그러나 수백 메가파섹(megaparsecs) 이상의 규모에서 그 예측은 절벽 아래로 곤두박질쳤다. 암흑 에너지에 의해 추진되어야 할 우주 팽창 속도가 전혀 재현되지 않은 것이다. 어떤 의미에서 우주가 어떻게 작동하는지 해독해 낸 인공지능이 표준 우주론 모델에 커다란 구멍이 있음을 드러낸 순간이었다.

우주가 작동하는 방식을 해독한 AI — 그리고 그 한계

이 과정은 결코 쉽지 않았다. AI의 아키텍처는 회전 및 병진 불변성(rotational and translational invariance)과 같이 물리 법칙을 제약하는 대칭성을 통합하여, 네트워크가 시공간의 기하학적 구조를 존중하는 방식으로 데이터를 학습하도록 강제했다. 연구팀이 ESA의 유클리드(Euclid) 우주 망원경과 암흑 에너지 탐사(Dark Energy Survey)의 실제 관측 데이터를 입력했을 때, 코스모그래프(CosmoGraph)는 은하가 위치할 곳을 99.7%의 정확도로 예측해 냈다. 적어도 특정 지점 이전까지는 그랬다.

보스(Voss)는 “우주 분산(cosmic variance)으로 인해 가장 큰 규모에서 어느 정도의 편차는 예상했다”며, “하지만 이 모델은 클러스터링 진폭을 체계적으로 과소평가했으며 후기 가속 팽창을 완전히 놓쳤다. 마치 우주가 가장 거대한 규모에서는 다른 규칙을 따르는 것만 같았다”고 말했다.

암흑 에너지가 있어야 할 자리에 생긴 공백

물리학자들은 오랫동안 우주 상수(cosmological constant)가 임시방편적인 변수이며, 너무나 정교하게 조정되어 있어 많은 이론가가 이를 부자연스럽게 여겨왔다는 사실을 알고 있었다. 코스모그래프가 밝혀낸 것은 물질(암흑 물질 및 가시 물질)의 중력 역학을 포착하도록 최적화된 시스템은 상수 형태의 척력을 굳이 필요로 하지 않는다는 점이다. 가속 팽창은 훈련 데이터에 거대 규모 관측값을 강제로 포함할 때만 나타나는데, 이는 오히려 모델의 소규모 데이터 적합성을 망가뜨린다. 이는 결정적인 요소가 결여되어 있다는 신호다. 즉, 현재 우리가 가진 이론으로는 포착하지 못하는, 우주의 규모 의존적 구조 형성 현상과 팽창 속도를 연결하는 무언가가 존재한다는 뜻이다.

AI의 사각지대가 암흑 물질과 암흑 에너지에 대해 말해주는 것

만약 우주 상수가 올바른 설명이라면, 잘 훈련된 AI는 이를 가장 단순한 변수 조정으로 추론해 냈어야 한다. 그렇지 못했다는 사실은 가속 팽창의 진정한 원인이 구조의 성장과 더욱 복잡하게 얽혀 있음을 시사한다. 한 가지 해석은 암흑 에너지가 상수가 아니라 시간의 흐름에 따라 변화하며 잠재적으로 암흑 물질과 상호작용하는 동적인 장(dynamic field), 즉 퀸테센스(quintessence)와 같은 것이라는 주장이다. 더 급진적인 가능성으로는 우주적 거리에서 중력에 대한 우리의 이해 자체가 불완전하며, 가장 거대한 규모에서는 일반 상대성 이론을 수정 뉴턴 역학이나 창발적 중력(emergent gravity)의 변형으로 대체해야 한다는 견해도 있다.

코스모그래프의 실패는 초기 우주의 팽창 역사를 담고 있는 우주 배경 복사와 후기 가속 팽창을 조화시키려 할 때 특히 두드러진다. 이는 새로운 형태로 나타난 허블 텐션(Hubble tension)이다. 초기 및 중기 우주 데이터로 훈련된 AI는 지속적으로 국소적으로 측정된 값보다 낮은 허블 상수를 선호한다. 기계의 이러한 ‘의견’은 많은 관측자가 의심해 왔던 바를 뒷받침한다. 즉, 이 불일치는 측정 오류가 아니라 더 깊은 물리적 균열의 징후라는 것이다.

AI의 사각지대가 인간의 문제인 이유

강력한 성능에도 불구하고, 코스모그래프는 블랙박스이다. 연구팀은 모델이 어디서 실패하는지는 볼 수 있지만, 직관적인 물리학의 관점에서 실패하는지는 알 수 없다. 이 모델은 깔끔한 방정식을 출력하는 것이 아니라 예측값을 출력한다. 이러한 불투명성은 발견 도구로서 AI의 역할에 대해 물리학계 내에서 논쟁을 불러일으켰다. 한편으로는 소규모 영역에서 모델의 성공이 새로운 물리학을 탐색하기 위한 머신러닝의 활용을 정당화하지만, 다른 한편으로는 거대 규모 가속 팽창에 대한 맹점이 기존의 이론적 편향을 강화할 위험이 있다. 만약 훈련 데이터가 암흑 에너지가 미미한 역할을 하는 체계에 지배되어 있다면, AI는 결코 암흑 에너지를 찾는 법을 배우지 못할 것이다.

이번 연구에 참여하지 않은 ETH 취리히의 이론 물리학자 제바스티안 후버(Sebastian Huber)는 “머신러닝은 데이터셋의 편견을 증폭시킨다”고 설명했다. “AI를 좋은 보간(interpolation) 엔진으로 훈련시키면 그것은 정확히 보간 엔진이 될 것이다. 흥미로운 물리학은 종종 외삽(extrapolation) 영역에 존재하며, 그곳에서는 이론이 필요하다.”

이러한 한계는 우주론에만 국한되지 않는다. 천체물리학과 입자물리학 전반에서 AI 모델은 페타바이트 단위의 데이터를 조사하여 새로운 현상의 신호일 수 있는 이상 징후를 식별하는 데 배치되고 있다. 하지만 AI를 희미한 신호에 민감하게 만드는 통계적 기법은 역설적으로 기기적 아티팩트와 모델링 가정에도 극도로 민감하게 만든다. 코스모그래프가 드러낸 사각지대는 역설적으로 현재의 방정식이 전체 이야기가 아님을 보여주는 강력한 지표로서 하나의 특징일 수 있다. 하지만 신경망으로부터 그러한 결론을 도출하는 것은 기계가 아직 제공할 수 없는 인간의 추론 능력을 필요로 한다.

유럽의 유클리드와 우주 지도의 미래

하이델베르크 연구팀의 작업은 유럽우주국(ESA)의 14억 유로 규모 암흑 우주 망원경인 유클리드 미션 데이터에 크게 의존한다. 유클리드는 수십억 개 은하의 형태와 거리를 측정하여 암흑 에너지가 우주적 시간 동안 우주를 어떻게 형성해 왔는지 추적하며, 지금까지 만들어진 가장 정밀한 3차원 우주 지도를 생성하고 있다. 이 미션은 유럽 우주 과학의 보석과 같지만, 그 데이터 파이프라인은 AI 주도 발견을 위한 기회이자 위험 요소이기도 하다.

재정적 갈등도 존재한다. 호라이즌 유럽(Horizon Europe) 프로그램은 기초 물리학을 위한 AI 및 데이터 과학에 막대한 자원을 쏟아부었지만, 코스모그래프의 결과는 순수하게 데이터 중심적인 접근 방식으로는 암흑 에너지에 대한 오랜 숙원인 돌파구를 마련하기 어렵다는 점을 시사한다. 계통 오차 예산을 정교화하고 더 현실적인 시뮬레이션을 구축하는 따분한 작업은 화려해 보이지 않을 수 있으나, 그것이 바로 모든 AI 기반 발견이 뿌리내려야 할 토대이다.

하이델베르크 팀은 거대 규모 가속 팽창 시나리오를 인위적으로 주입한 확장된 훈련 세트로 모델을 재가동할 계획이다. 이는 기본적으로 AI에게 무엇을 기대해야 할지 가르치는 셈이다. 이는 데이터가 스스로 말하게 하는 대신 기계에게 이론적 처방을 내리는 기묘한 역전 현상이다. 이는 구식 경험주의자라면 눈살을 찌푸릴 만한 방법론적 타협이다. 하지만 어쩌면 이것이 표준 모델의 공백이 우리 이론의 균열인지, 아니면 그저 우리의 무지를 반영하는 거울일 뿐인지 알아낼 수 있는 가장 빠른 방법일지도 모른다.

출처

  • 하이델베르크 대학교 STRUCTURES 클러스터 (연구 발표 및 프리프린트)
  • ESA 유클리드 컨소시엄 데이터 공개 및 기술 문서
  • 네이처 애스트로노미(Nature Astronomy) (AI 기반 우주론적 제약에 관한 논문 게재 예정)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q CosmoGraph란 무엇이며 우주 모델링에서 어떤 성과를 거두었나요?
A CosmoGraph는 우주 탐사 데이터로 학습된 머신러닝 모델로, 거대 구조를 지배하는 방정식을 역공학적으로 성공하게 재구성했습니다. 이 모델은 수백 메가파섹(megaparsec) 범위 내에서 은하 분포를 99.7%의 정확도로 예측했으며, 빅뱅 초기 조건으로부터 우주 망상 구조(cosmic web)를 정확하게 매핑했습니다.
Q CosmoGraph가 가장 큰 규모에서 우주의 팽창을 재현하는 데 실패한 이유는 무엇인가요?
A 수백 메가파섹 이상의 규모에서 이 모델은 클러스터링 진폭을 체계적으로 과소평가했고 후기 가속 팽창을 놓쳤습니다. 이는 AI가 학습 데이터로부터 암흑 에너지를 추론할 수 없었다는 점에서, 표준 우주론 모델에 구조 형성 과정과 팽창을 연결하는 핵심 요소가 부족함을 시사합니다.
Q AI의 이러한 사각지대는 암흑 에너지의 본질에 대해 무엇을 시사하나요?
A 이러한 실패는 암흑 에너지가 단순한 우주 상수가 아닐 수 있음을 의미합니다. 대신 암흑 물질과 상호작용하는 퀸테센스(quintessence)와 같은 동적 장일 가능성이 있거나, 우주적 거리에서 우리의 중력 이해가 불완전하여 일반 상대성 이론의 수정이 필요할 수 있음을 시사합니다.
Q CosmoGraph의 성능은 허블 텐션(Hubble tension)과 어떤 관련이 있나요?
A 우주 초기 및 중기 데이터로 학습된 CosmoGraph는 일관되게 국부 측정값보다 낮은 허블 상수를 선호합니다. 이는 허블 텐션이 측정 오류가 아니라 현행 모델 내의 더 깊은 물리적 불일치를 나타내는 징후라는 관측 결과와 AI의 '의견'을 일치시킵니다.
Q 물리적 발견을 위해 CosmoGraph와 같은 AI를 사용하는 것의 주요 한계점은 무엇인가요?
A CosmoGraph는 직관적인 설명 없이 예측 결과만을 내놓는 '블랙박스'입니다. 이는 학습 데이터의 편향을 증폭시키며, 보간(interpolation)에는 뛰어나지만 외삽(extrapolation)에는 실패하는 경향이 있습니다. 즉, AI는 스스로 새로운 이론적 통찰을 생성할 수 없기 때문에, AI의 실패를 해석하고 누락된 물리 법칙을 찾아내기 위해서는 인간의 추론이 필수적입니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!