AI가 유전자 제어를 위한 DNA 스위치를 설계하다

유전학
AI Designs DNA Switches to Control Genes
생성형 모델이 특정 포유류 세포에서 유전자를 확실하게 켜고 끌 수 있는 합성 DNA 인핸서와 유전자 회로를 제작하고 있다. 이는 치료제 설계를 가속화하는 동시에 거버넌스 및 제조 관련 문제를 제기하고 있다.

2025년 5월 8일, 바르셀로나의 Centre for Genomic Regulation 연구팀은 인공지능 시스템이 건강한 포유류 세포 내부에서 세포 유형 특이적 스위치 역할을 하는 짧은 합성 DNA 조절 서열을 설계할 수 있음을 보여주는 논문을 Cell에 발표했습니다. 그로부터 채 1년도 지나지 않아, Rice University의 별도 연구 그룹은 수백만 개의 완전한 유전자 회로를 세포 출력값과 매핑하고 해당 측정값을 머신러닝 모델에 입력하여 방대한 미시험 설계 공간 전체의 기능을 예측하는 CLASSIC이라는 실험 플랫폼을 Nature에 발표하며 보완적인 진전을 알렸습니다. 이 두 논문은 급격한 변화를 시사합니다. DNA 서열에 대한 알고리즘적 상상력이 이론적 예시를 넘어 살아있는 세포에서 유전자 활동을 확실하게 변화시키는 실제 분자로 이동하고 있으며, 산업계와 정책 그룹은 이에 발맞추기 위해 제조 및 감독 체계를 신속히 조정하고 있습니다.

새로운 종류의 합성 인핸서

바르셀로나 그룹의 Cell 논문은 짧은 DNA 조각인 인핸서(enhancer)가 혈구 세포 발달 과정에서 유전자 발현에 어떻게 영향을 미치는지에 대한 방대한 측정 데이터를 학습한 생성형 AI를 설명합니다. 인핸서는 전사 인자를 모집하고 유전자가 발현되는 시기와 장소를 결정하는 DNA의 비부호화 구간입니다. CRG 팀은 수십 개의 전사 인자에 대한 결합 모티프의 조합과 배열을 테스트하기 위해 설계된 64,000개 이상의 변이체를 합성한 다음, 조혈 작용의 여러 단계에 걸친 활성도를 측정했습니다. 이 데이터로부터 모델은 설계 규칙을 학습했고, 자연계에는 존재하지 않았지만 마우스 1차 혈액 전구세포에 도입되었을 때 의도한 대로 작동하는 서열들을 제안했습니다. 일부는 단계적 조절 다이얼처럼 작동했고, 다른 것들은 이진법적인 온/오프(on/off) 동작을 보였으며, 많은 서열이 놀라운 세포 유형 특이성을 나타냈습니다.

CLASSIC을 이용한 대규모 라이브러리 및 유전자 회로 매핑

CLASSIC은 설계자들에게 두 가지 실질적인 교훈을 제시했습니다. 첫째, 회로는 종종 단일 솔루션 문제가 아닙니다. 즉, 여러 서로 다른 설계가 동일한 출력을 달성할 수 있어 엔지니어에게 견고성, 강도 및 자원 비용 사이의 유연한 선택권을 제공합니다. 둘째, 중간 강도의 부품이 가장 극단적인 구성 요소보다 성능이 뛰어난 경우가 많습니다. 다시 말해, 생물학에는 고유한 '골디락스 존(Goldilocks zones)'이 존재한다는 것입니다. 결정적으로, 이 파이프라인은 예측된 설계를 합성하고 테스트함으로써 검증되었습니다. AI가 선택한 수십 개의 회로가 실험실 측정값과 일치했으며, 이는 데이터셋이 대규모이고 정밀하게 측정될 경우 모델이 훈련 세트를 넘어 일반화될 수 있음을 보여주었습니다.

인실리코(in silico) 설계에서 살아있는 세포까지

두 연구 라인 모두 긴밀하게 결합된 '설계-구축-테스트' 루프를 강조합니다. 바르셀로나에서 AI가 짧은 인핸서 서열을 제안하면, 연구진은 해당 250 염기쌍 조각을 합성하여 전달체에 담고 살아있는 포유류 세포에 삽입하여 세포 상태에 따른 활성도를 판독합니다. 휴스턴과 협력 실험실의 CLASSIC 전략은 완전한 회로의 라이브러리를 생성하고 수천 또는 수백만 개의 세포에서 출력값을 판독한 후, 그 결과를 머신러닝 모델로 되돌려 다음 라운드의 후보군을 추천받습니다.

실질적인 결과는 속도와 창의성입니다. 고전적인 유전 공학이 수개월에 걸친 반복적인 디버깅과 전문가의 직관을 필요로 했던 반면, AI와 대규모 병렬 측정의 결합은 이전에는 불가능했던 규모로 조합 공간을 탐색할 수 있게 해줍니다. 이는 치료용 프로모터, 계통 한정 발현 카세트 및 세포 내의 더 정교한 논리 게이트를 위한 기능성 DNA 스위치의 발견을 가속화합니다.

AI 속도에 맞춘 제조: 세포 프리(cell-free) 합성 및 공급망

합성과 생산이 따라가지 못하면 설계는 공급을 앞지르게 됩니다. 산업계와 일부 스타트업은 이미 적응하고 있습니다. 박테리아 클로닝 없이 선형 IVT 가능 템플릿을 조립하는 세포 프리 DNA 합성 워크플로우는 오염원(엔도톡신, 숙주 DNA)을 제거하고, 인코딩된 폴리(A) 꼬리와 같은 긴 호모폴리머를 플라스미드에서 불안정하게 만드는 재조합 문제를 방지합니다. 이러한 장점은 모델이 빠르게 반복되고 촉박한 일정 내에 많은 수의 맞춤형 템플릿을 요구하는 AI 사이클에서 중요합니다.

세포 프리 템플릿은 또한 폴리(A) 꼬리 길이 및 서열 무결성 측면에서 하류의 가변성을 줄여 시험관 내 전사(in-vitro transcription) 제품의 재현성을 향상시킵니다. AI가 수백 또는 수천 개의 후보 서열을 제안할 때, 합성, QC 및 IVT 템플릿을 제공하는 자동화 친화적인 고속 공급망은 속도를 결정하는 핵심 요소가 됩니다. 이는 기업, 위탁 제조업체 및 학계 핵심 시설들이 계산 속도에 맞추기 위해 세포 프리 접근 방식을 중심으로 재편되고 있음을 의미합니다.

응용 분야, 제약 사항 및 초기 한계

하지만 실제적인 제약도 존재합니다. 조절 게놈은 방대하며 상황에 따라 달라집니다. CRG 연구는 전사 인자와 세포 상태의 일부만을 프로파일링했으며, Rice University의 CLASSIC 시연은 원리 증명을 위해 모델 세포주에서 수행되었습니다. 배양 접시에서 작동하는 서열을 인간에게 안전하고 지속적이며 효과적인 치료제로 전환하려면 광범위한 전임상 검증이 필요합니다. 모델은 훈련 데이터가 목표 맥락을 반영할 때 가장 잘 일반화되며, 훈련 세트의 공백은 여전히 주요 실패 원인으로 남아 있습니다.

위험성, 거버넌스 및 인간의 감독

신속한 설계와 저렴한 합성은 합성 생물학계가 수년간 고민해 온 보안 및 거버넌스 문제를 야기합니다. npj Biomedical Innovations의 한 리뷰는 이를 '수렴 문제'로 정의했습니다. AI는 복잡한 바이오 엔지니어링의 기술적 문턱을 낮추는 반면, 자동화된 실험실과 저렴한 합성은 역량과 유통 규모를 확장합니다. 이러한 결합은 유익한 접근성을 넓히는 동시에 이중 용도(dual-use) 위험도 증가시킵니다.

최근의 논평과 정책 연구에서는 세 가지 거버넌스 우선순위가 나타납니다. 첫째, 모델과 설계 파이프라인에 대한 설명 가능성 및 감사 추적입니다. 불투명한 '블랙박스' 추천은 실패 모드나 오용 가능성을 평가하기 더 어렵습니다. 둘째, 결정적인 병목 지점에서의 인간 참여형(human-in-the-loop) 제어입니다. 생물학적 시스템에 방출될 의도가 있는 모든 서열은 전문가 검토와 기능 분석을 거치도록 제한해야 합니다. 셋째, 새로운 서열일지라도 해로운 기능을 가능하게 할 수 있는 설계를 탐지하기 위한 공급망 조치와 서열 스크리닝 표준입니다. 핵산 합성 스크리닝을 확대하려는 국가적 노력은 이러한 기술이 현재 받고 있는 정책적 관심을 입증합니다.

과학은 빠르게 발전하고 있으며, 현재로서는 AI가 창조할 수 있는 것에 대한 열정과 더불어 위험을 제한하고 출처를 기록하며 가장 중요한 지점에서 인간의 판단을 보존하려는 신중하고 투명한 관행을 결합하는 것이 현명한 길입니다.

출처

  • Cell (AI 설계 합성 인핸서에 관한 연구 논문)
  • Nature (연구 논문: 초고처리량 유전자 회로 매핑을 위한 CLASSIC 플랫폼)
  • npj Biomedical Innovations (AI와 합성 생물학 수렴에 관한 분석)
  • Centre for Genomic Regulation (CRG), Barcelona
  • Rice University Synthetic Biology Institute
  • Pompeu Fabra University (UPF)
Wendy Johnson

Wendy Johnson

Genetics and environmental science

Columbia University • New York

Readers

Readers Questions Answered

Q CRG 바르셀로나 셀(Cell) 연구는 AI로 설계된 DNA 스위치에 대해 무엇을 입증했나요?
A 이 연구는 인공지능 시스템이 건강한 포유류 세포에서 세포 유형별 스위치 역할을 하는 짧은 합성 DNA 조절 서열을 설계할 수 있음을 입증했습니다. 연구팀은 64,000개 이상의 인핸서 변이를 합성 및 테스트하고 혈액 발달 과정 전반의 활성을 측정함으로써, 단계적 또는 거의 이진법적인 발현과 강력한 세포 유형 특이성을 생성하는 서열을 발견했으며, 모델은 데이터로부터 설계 규칙을 추론했습니다.
Q CLASSIC은 무엇이며 무엇을 보여주었나요?
A 라이스 대학교의 CLASSIC 플랫폼은 수백만 개의 완전한 유전자 회로를 세포 출력에 매핑하고, 이러한 측정값을 머신러닝 모델에 입력하여 방대하고 검증되지 않은 설계 공간 전체의 기능을 예측합니다. 이 연구는 많은 설계가 동일한 출력을 달성할 수 있으며, 중간 강도의 부품이 극단적인 성분을 능가하는 경우가 많다는 것을 보여주었습니다. AI가 선택한 수십 개의 회로가 실험실 결과와 일치하여 모델의 일반화 능력을 확인했습니다.
Q AI로 설계된 DNA 스위치는 어떻게 발전을 가속화하며, 어떤 워크플로우를 사용하나요?
A 두 연구 모두 엄격한 '설계-구축-테스트(design-build-test)' 루프를 강조합니다. AI가 짧은 인핸서 서열이나 완전한 회로를 제안하면, 연구진은 해당 설계(250개 염기 조각 또는 라이브러리 변이)를 합성하여 살아있는 세포나 무세포 시스템에 삽입해 활성을 읽어내고, 그 결과를 다시 모델에 피드백하여 다음 라운드를 제안하게 함으로써 전통적인 방식보다 빠르게 조합 설계 공간을 탐색할 수 있게 합니다.
Q 논의된 제약 사항과 거버넌스 시사점은 무엇인가요?
A 이 기사는 조절 게놈의 복잡성과 맥락 의존성을 언급합니다. 셀 바르셀로나 연구는 전사 인자와 세포 상태의 일부만을 프로파일링했으며, CLASSIC 시연은 모델 세포주를 사용했으므로 설계를 안전한 인간 치료제로 전환하려면 광범위한 전임상 검증이 필요합니다. 거버넌스 우선순위에는 설명 가능성과 감사 추적, 의사 결정 병목 지점에서의 인간 개입(human-in-the-loop) 제어, 생물학적 시스템에 방출하기 전 서열 검문 등이 포함됩니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!