AI가 설계한 바이러스: 진화의 속도와 위협

Genetics
AI-Designed Virus: Pace and Peril
보고된 AI 설계 박테리오파지는 컴퓨팅 기술이 얼마나 빠르게 새로운 유전체를 생성할 수 있는지를 대중에 알리는 계기가 되었으며, 생물안전, 이중 용도(dual-use) 및 거버넌스에 대한 논쟁을 재점화했습니다.

한 실험과 헤드라인

이번 주, 급변하는 두 분야인 인공지능과 합성 생물학의 교차점에서 극적인 소식이 전해졌습니다. 2026년 2월 5일에 보도되고 2026년 1월 26일에 발생한 활동으로 추적된 내용에 따르면, Evo2라는 AI 시스템을 사용하는 연구자들이 모델에 "바이러스를 설계하라"는 프롬프트를 입력하고, 그 결과로 나온 DNA를 출력하여 실험실에서 생존 가능한 생물학적 구조체를 관찰했다고 합니다. 언론 보도와 관련 프리프린트(preprint)에 요약된 이 에피소드는 AI 설계 바이러스가 부각하는 속도와, 그 속도가 혁신과 안전 모두에 왜 중요한지를 보여주는 명확한 사례입니다.

연구 보도 방식과 검증된 내용

대중에게 알려진 서사는 세 가지 자료가 결합된 것입니다. Stanford/Genyro 팀의 작업에 대한 미디어 보도, 생성형 파지(phage) 설계에 관한 bioRxiv 프리프린트, 그리고 단백질 및 게놈 설계를 위한 AI 도구에 관한 기존의 과학 문헌들입니다. 이를 종합해 볼 때, 여러 연구 그룹이 대규모 생물학적 데이터 세트와 생성형 모델을 사용하여 기존 데이터베이스에 존재하지 않았던 서열을 제안하고 있음을 알 수 있습니다. 그러나 중요한 주의 사항이 있습니다. 언론 요약본은 동료 검토(peer-review)를 거친 검증이 아니며, 프리프린트는 예비 단계일 뿐입니다. 또한 해당 서열이 어떻게 생성되었는지, 진정으로 '데 노보(de novo, 신규)'인지, 그리고 어떤 척도가 그 '생존력'을 증명했는지에 대한 주장을 학계에서 확인하기 위해서는 독립적인 재현과 완전한 방법론적 공개가 필요합니다.

AI 설계 바이러스가 부각하는 속도 — 속도, 규모 및 이중 용도 위험

이 에피소드가 이전의 이정표들과 구별되는 점은 설계 일정의 압축입니다. 방대한 게놈 데이터를 읽고 서열-기능 관계를 학습하는 AI 도구는 몇 시간 내에 후보 서열을 제안할 수 있습니다. 연구자들은 AI가 백신이나 약물 리드(lead) 발굴 기간을 수개월에서 수일로 단축한 사례들을 지적합니다. 생성형 모델은 이제 그 어떤 인간 팀도 수작업으로 스캔할 수 없는 규모로 서열 공간을 탐색할 수 있습니다. 이러한 역량은 더 빠른 대응책 마련, 항생제 내성 감염을 치료하기 위한 맞춤형 박테리오파지, 더 효율적인 산업용 효소와 같은 정당한 희망의 근거가 되지만, 동시에 거버넌스, 감독 및 기술적 안전 장치가 작동할 수 있는 기간을 단축시키기도 합니다.

이중 용도(Dual-use) 문제가 핵심입니다. 특정 박테리아 균주를 더 잘 사멸시키는 파지를 제안하는 것과 동일한 알고리즘이 숙주 범위, 병원성 또는 환경적 안정성을 강화하는 설계를 생성하는 쪽으로 악용될 수 있습니다. 디지털 설계도는 휴대가 간편하고 기성 DNA 합성, 자동화된 클로닝 및 벤치 로봇 공학을 통해 재현 가능한 경우가 많기 때문에, 계산 속도의 향상은 고전적인 이중 용도 딜레마를 증폭시킵니다.

"AI 설계 바이러스"란 실제로 무엇을 의미하는가?

"AI 설계 바이러스"는 특정 방식으로 접히고, 발현되며, 상호작용할 것으로 예측되는 핵산 서열을 제안하는 컴퓨팅 파이프라인을 뜻하는 약칭입니다. 단백질 구조 예측기부터 DNA 언어 모델에 이르는 현대적 모델들은 수백만에서 수조 개의 서열 조각으로부터 통계적 관계를 학습합니다. 그 후 생성형 모델은 인 실리코(in silico)에서 원하는 특성을 극대화하는 서열을 샘플링할 수 있습니다. 하지만 설계는 첫 번째 단계일 뿐입니다. 일련의 문자열을 감염성이 있거나 기능적인 생물학적 입자로 바꾸려면 조립(DNA 합성 및 결합), 적절한 숙주 또는 패키징 시스템, 조절 요소(프로모터, 터미네이터, 패키징 신호) 및 세심한 표현형 테스트가 필요합니다. 요컨대, 그럴듯한 서열이 곧 자동으로 작동하는 병원체는 아닙니다. 바이트와 생물학 사이에는 여전히 많은 기술적 장벽이 존재하지만, 합성, 자동화, AI가 동반 진화함에 따라 그 장벽은 무너지고 있습니다.

AI가 합성 생물학을 가속화하는 방법

AI는 여러 단계에서 합성 생물학을 가속화합니다. 판별 모델은 서열로부터 구조를 예측하며(AlphaFold와 그 후속 모델들은 단백질 접힘 예측을 획기적으로 개선했습니다), 생성형 모델은 소설 같은 아미노산 서열이나 게놈 전체를 제안합니다. 구축-시험 사이클을 자동화하는 로봇 실험실과 결합된 이 모델들은 훨씬 적은 인간의 노동력으로 '설계-제작-시험-학습' 루프를 가동할 수 있습니다. 게놈을 학습한 언어 모델 접근법은 조절 모티프를 식별하거나, 프로모터를 설계하거나, 맞춤형 특성을 가진 바이러스 게놈 전체를 제안할 수 있습니다. AI와 합성 생물학의 융합에 관한 Nature 리뷰는 이것이 가설이 아님을 강조합니다. 자율 또는 반자율 파이프라인은 이미 대사 경로, 효소 활성 및 치료용 구조체를 최적화하고 있으며, 그 궤적은 더욱 유능한 시스템을 향하고 있습니다.

위험, 한계 그리고 맥락이 중요한 이유

기술적 한계가 위험을 완화하기는 하지만 제거하지는 못합니다. 인간에게 복제, 전파되거나 질병을 일으키는 요인을 만드는 데는 더 나은 서열만으로는 쉽게 우회할 수 없는 생물학적 제약이 따릅니다. 숙주 특이성, 면역 반응, 생태적 역학 등이 중요하기 때문입니다. 그렇긴 하지만, 그럴듯한 설계에 대한 진입 장벽이 낮아진 것은 글로벌 합성 서비스에 대한 접근성, 저렴해진 시퀀싱, 원격 실험실 서비스와 결합되어 사고 또는 의도적인 오용의 기회를 증가시킵니다.

모델의 실패 또한 위험 요소입니다. AI 시스템은 생물학적으로 불가능한 모티프를 생성(환각)하거나 훈련 데이터의 편향에 과적합(overfit)될 수 있습니다. 불투명한 모델은 실패 모드를 예측하기 어렵게 만듭니다. 이러한 약점은 철저한 실험적 검증과 인간의 판단 없이 모델의 출력을 그대로 실행에 옮길 때 가장 큰 문제가 됩니다.

AI 설계 바이러스가 부각하는 속도 — 존재하는 안전장치와 부족한 점

일부 안전장치는 이미 마련되어 있습니다. 상업용 DNA 공급업체는 일반적으로 위험 서열 목록과 대조하여 주문을 스크리닝하고 고객 심사를 유지합니다. 미국 과학기술정책국(OSTP)과 기타 기관들은 핵산 스크리닝 및 공급업체 모범 사례를 위한 프레임워크와 지침을 발행했습니다. 전문가 규범, 기관 생물 안전 위원회, 연구비 지원 조건 등도 검문소 역할을 합니다.

그러나 이러한 보호 조치에는 공백이 있습니다. 서열 기반 스크리닝은 알려진 위협과 상동성이 없는 새로운 설계에 대응하는 데 어려움을 겪으며, 자동화된 파이프라인은 인간의 감시를 우회할 수 있습니다. 또한 많은 공급업체와 사용자가 규제 환경 밖에서 활동합니다. Nature 분석은 기술적, 정책적, 문화적 조치의 혼합을 주장합니다. 여기에는 기능 인식 도구를 포함한 더 강력하고 표준화된 스크리닝, 자동화된 습식 실험실(wet lab)에 대한 의무적 기록 및 감사, 인간 참여형(human-in-the-loop) 검문소, 모델 설명 가능성, AI 시스템에 대한 레드티밍(red-teaming)이 포함됩니다. 정보와 자재가 규제보다 빠르게 국경을 넘나들기 때문에 국제적인 공조가 필수적입니다.

혁신과 안전의 균형

잠재적인 이점은 상당합니다. 생성형 설계는 약물 내성 감염을 위한 맞춤형 박테리오파지를 제공하고, 발병 시 백신 설계를 가속화하며, 지속 가능한 제조를 위한 효소 배치를 앞당길 수 있습니다. 과제는 이러한 이점을 보존하면서 위험을 줄이는 것입니다. 합리적인 조치로는 연방 정부의 지원을 받는 실험실의 DNA 주문에 대한 출처 확인 및 스크리닝 요구, 영향력이 큰 주장에 대한 독립적인 검증 및 재현 지원, 안전이 직결된 경우 모델 및 훈련 데이터 문서화 의무화, 설계의 동인이 되는 변수를 밝히는 설명 가능한 AI 접근법에 대한 투자 등이 있습니다.

사회적 조치 또한 그만큼 중요합니다. 이중 용도 인식에 관한 인력 교육, 투명한 보고 채널, 그리고 과학자, 윤리학자, 산업계, 시민 사회를 포함하는 다자간 거버넌스가 필요합니다. 이러한 메커니즘은 비판적인 결정이 불투명한 시스템에 완전히 위임되는 대신, 인간의 판단이 그 과정의 활성 요소로 남을 수 있도록 도울 수 있습니다.

향후 주목할 점

연구 팀의 후속 보고서, 독립적인 실험실의 재현, 그리고 동료 검토를 거친 학술지 발표가 단기적으로 가장 중요한 신호가 될 것입니다. 규제 기관과 합성 공급업체 또한 주요 행위자가 될 것입니다. 스크리닝 규칙, 조달 정책 또는 의무적 기록 보관의 변화는 진지한 정책적 대응이 시작되었음을 나타낼 것입니다. 마지막으로, 이 분야의 궤적은 자율 실험실과 완전한 생성형 설계 파이프라인이 얼마나 빨리 성숙하느냐, 그리고 거버넌스가 그와 유사한 속도로 진화하느냐에 달려 있을 것입니다.

Evo2 에피소드는 컴퓨팅 성능이 생물학의 템포를 바꾸어 놓았음을 일깨워주는 시의적절한 사례입니다. 이제 질문은 AI가 생물학적 코드를 작성할 것인지 여부가 아니라, 그 어느 때보다 빠르게 코드를 작성할 수 있는 세상을 사회가 어떻게 다스릴 것인가입니다.

출처

  • npj Biomed. Innov. (Nature manuscript: "The convergence of AI and synthetic biology: the looming deluge")
  • Stanford University / Genyro (research reports and preprints on generative bacteriophage design)
  • bioRxiv preprint repository (preprint on generative design of novel bacteriophages)
  • United States Office of Science and Technology Policy — Framework for Nucleic Acid Synthesis Screening
  • National Academies of Sciences, Engineering, and Medicine (reports on biodefense and synthetic biology)
Wendy Johnson

Wendy Johnson

Genetics and environmental science

Columbia University • New York

Readers

Readers Questions Answered

Q AI 설계 바이러스란 무엇이며 합성 생물학과 어떤 관련이 있습니까?
A Evo-Φ2147과 같은 AI 설계 바이러스는 Evo 2와 같은 생성형 AI 모델을 사용하여 처음부터 만들어진 완전한 합성 박테리오파지 게놈입니다. 이 모델은 실험실 테스트에서 대장균을 성공적으로 감염시키고 사멸시킨 285개의 완전한 바이러스 게놈을 생성했습니다. 이는 자연적인 서열을 수정하는 단계를 넘어 컴퓨터를 통해 새로운 생명체를 설계하는 등 기능적 게놈의 데 노보(de novo) 설계를 입증함으로써 합성 생물학과의 연관성을 보여줍니다. 이는 2003년 phiX174 게놈의 화학적 합성과 같은 역사적인 합성 생물학적 성과를 기반으로 한 실험실 설계 생명체의 이정표입니다.
Q 인공지능은 합성 생물학 연구의 속도를 어떻게 가속화하고 있습니까?
A 인공지능은 파지 게놈을 학습한 Evo 1 및 Evo 2와 같은 게놈 파운데이션 모델을 사용하여 유전적 변화를 예측하고, 새로운 DNA 서열을 생성하며, 시행착오가 따르는 실험실 작업에 의존하지 않고 전체 기능성 게놈을 신속하게 설계함으로써 합성 생물학 연구를 가속화합니다. 이러한 모델은 분자 상호작용을 내면화하여 박테리아 감염에 있어 천연 바이러스보다 뛰어난 최적화된 바이러스를 생성할 수 있게 하며, 잠재적으로 수년이 걸리는 연구를 프롬프트 기반 설계와 실험실 검증으로 단축할 수 있습니다. 이는 설계-구축-테스트-학습(Design-Build-Test-Learn) 사이클을 크게 가속화합니다.
Q 합성 생물학에서 AI의 잠재적 위험과 윤리적 우려 사항은 무엇입니까?
A 잠재적 위험에는 독성이나 전염성이 강화된 자가 복제 생물학적 작용제를 설계하기 위해 AI를 오용하는 것이 포함되며, 이는 위험한 병원체 생성에 대한 장벽을 낮출 수 있습니다. 다만 현재 모델은 복잡한 전염병 가능 바이러스를 만들 정도의 정밀도는 부족합니다. 윤리적 우려로는 생물 안전 사고, 의도적인 무기화, 규제 감독을 앞지르는 빠른 발전 속도 등이 있으며, 이는 파지 요법을 통해 항생제 내성에 맞설 수도 있지만 해를 끼칠 수도 있는 이중 용도 연구(dual-use research)에 대한 문제를 제기합니다. 현재로서는 생물학적 데이터의 한계와 기계론적 이해의 부족이 매우 위험한 작용제의 데 노보 설계를 완화하고 있습니다.
Q AI로 설계된 생물학적 작용제의 오용을 방지하기 위해 어떤 안전 장치와 규제가 존재합니까?
A 연구원들은 오용을 방지하기 위해 전체 AI 모델 가중치와 데이터의 공개를 제한하는 한편, 과학적 접근을 위해 방법론을 프리프린트(preprint) 형식으로 발표했습니다. 기존의 생물 안전 프로토콜은 합성 및 테스트를 위해 통제된 실험실 환경을 요구하며, 광범위한 규제는 합성 작용제 취급 시의 위험을 완화하기 위해 설계-구축-테스트-학습 사이클을 다룹니다. 그러나 AI 설계 생물학에 특화된 포괄적인 글로벌 규제는 여전히 미비한 상태이며, 이중 용도 역량에 대한 강화된 감독의 필요성이 제기되고 있습니다.
Q 과학자들은 합성 생물학의 혁신과 생물 안전 및 생물 보안 사이에서 어떻게 균형을 맞출 수 있습니까?
A 과학자들은 격리된 환경에서 연구를 수행하고, 민감한 모델 데이터의 공개를 제한하며, 항생제 내성 박테리아에 대한 파지 요법과 같은 유익한 응용 분야를 우선시함으로써 혁신과 생물 안전의 균형을 맞출 수 있습니다. AI 개발자, 생물학자, 정책 입안자 간의 협력은 발전을 저해하지 않으면서 이중 용도 위험을 해결하는 선제적 규제를 개발하는 데 필수적입니다. 실험실 테스트를 통한 반복적인 검증은 기능을 보장하는 동시에, 의도치 않은 결과를 모니터링하여 생물 보안을 유지합니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!