What did the CRG Barcelona Cell study demonstrate about AI-designed DNA switches?

The study demonstrates that an artificial intelligence system can design short synthetic DNA regulatory sequences that act as cell-type specific switches in healthy mammalian cells. By synthesizing and testing over 64,000 enhancer variants and measuring activity across blood development, the team found sequences that produced graded or near-binary expression and strong cell-type specificity, and the model inferred design rules from the data.

What is CLASSIC and what did it show?

The CLASSIC platform from Rice University maps millions of complete genetic circuits to cellular outputs and feeds those measurements into machine-learning models to predict function across vast, untested design space. It showed that many designs can achieve the same output and that mid-strength parts often outperform extreme components. Dozens of AI-selected circuits matched lab readouts, confirming model generalization.

How do AI-designed DNA switches accelerate progress, and what workflow do they use?

Both efforts emphasize a strict design-build-test loop. AI proposes short enhancer sequences or complete circuits; researchers synthesize the designs (250-base fragments or library variants), insert into living cells or cell-free systems to read activity, and feed results back to models that propose the next round, enabling rapid exploration of combinatorial design spaces that outpace traditional methods.

What are the constraints and governance implications discussed?

The article notes regulatory genome complexity and context dependence; the Cell Barcelona work profiled only a subset of transcription factors and cell states, and the CLASSIC demonstrations used model cell lines, so translating designs to safe human therapies requires extensive preclinical validation. Governance priorities include explainability and audit trails, human-in-the-loop controls at decision chokepoints, and gating sequences before release to biological systems.

AI, 유전자 제어용 DNA 스위치 설계

2025년 5월 8일, 바르셀로나의 Centre for Genomic Regulation 연구팀은 인공지능 시스템이 건강한 포유류 세포 내부에서 세포 유형 특이적 스위치 역할을 하는 짧은 합성 DNA 조절 서열을 설계할 수 있음을 보여주는 논문을 Cell에 발표했습니다. 그로부터 채 1년도 지나지 않아, Rice University의 별도 연구 그룹은 수백만 개의 완전한 유전자 회로를 세포 출력값과 매핑하고 해당 측정값을 머신러닝 모델에 입력하여 방대한 미시험 설계 공간 전체의 기능을 예측하는 CLASSIC이라는 실험 플랫폼을 Nature에 발표하며 보완적인 진전을 알렸습니다. 이 두 논문은 급격한 변화를 시사합니다. DNA 서열에 대한 알고리즘적 상상력이 이론적 예시를 넘어 살아있는 세포에서 유전자 활동을 확실하게 변화시키는 실제 분자로 이동하고 있으며, 산업계와 정책 그룹은 이에 발맞추기 위해 제조 및 감독 체계를 신속히 조정하고 있습니다.

새로운 종류의 합성 인핸서

바르셀로나 그룹의 Cell 논문은 짧은 DNA 조각인 인핸서(enhancer)가 혈구 세포 발달 과정에서 유전자 발현에 어떻게 영향을 미치는지에 대한 방대한 측정 데이터를 학습한 생성형 AI를 설명합니다. 인핸서는 전사 인자를 모집하고 유전자가 발현되는 시기와 장소를 결정하는 DNA의 비부호화 구간입니다. CRG 팀은 수십 개의 전사 인자에 대한 결합 모티프의 조합과 배열을 테스트하기 위해 설계된 64,000개 이상의 변이체를 합성한 다음, 조혈 작용의 여러 단계에 걸친 활성도를 측정했습니다. 이 데이터로부터 모델은 설계 규칙을 학습했고, 자연계에는 존재하지 않았지만 마우스 1차 혈액 전구세포에 도입되었을 때 의도한 대로 작동하는 서열들을 제안했습니다. 일부는 단계적 조절 다이얼처럼 작동했고, 다른 것들은 이진법적인 온/오프(on/off) 동작을 보였으며, 많은 서열이 놀라운 세포 유형 특이성을 나타냈습니다.

CLASSIC을 이용한 대규모 라이브러리 및 유전자 회로 매핑

CLASSIC은 설계자들에게 두 가지 실질적인 교훈을 제시했습니다. 첫째, 회로는 종종 단일 솔루션 문제가 아닙니다. 즉, 여러 서로 다른 설계가 동일한 출력을 달성할 수 있어 엔지니어에게 견고성, 강도 및 자원 비용 사이의 유연한 선택권을 제공합니다. 둘째, 중간 강도의 부품이 가장 극단적인 구성 요소보다 성능이 뛰어난 경우가 많습니다. 다시 말해, 생물학에는 고유한 '골디락스 존(Goldilocks zones)'이 존재한다는 것입니다. 결정적으로, 이 파이프라인은 예측된 설계를 합성하고 테스트함으로써 검증되었습니다. AI가 선택한 수십 개의 회로가 실험실 측정값과 일치했으며, 이는 데이터셋이 대규모이고 정밀하게 측정될 경우 모델이 훈련 세트를 넘어 일반화될 수 있음을 보여주었습니다.

인실리코(in silico) 설계에서 살아있는 세포까지

두 연구 라인 모두 긴밀하게 결합된 '설계-구축-테스트' 루프를 강조합니다. 바르셀로나에서 AI가 짧은 인핸서 서열을 제안하면, 연구진은 해당 250 염기쌍 조각을 합성하여 전달체에 담고 살아있는 포유류 세포에 삽입하여 세포 상태에 따른 활성도를 판독합니다. 휴스턴과 협력 실험실의 CLASSIC 전략은 완전한 회로의 라이브러리를 생성하고 수천 또는 수백만 개의 세포에서 출력값을 판독한 후, 그 결과를 머신러닝 모델로 되돌려 다음 라운드의 후보군을 추천받습니다.

실질적인 결과는 속도와 창의성입니다. 고전적인 유전 공학이 수개월에 걸친 반복적인 디버깅과 전문가의 직관을 필요로 했던 반면, AI와 대규모 병렬 측정의 결합은 이전에는 불가능했던 규모로 조합 공간을 탐색할 수 있게 해줍니다. 이는 치료용 프로모터, 계통 한정 발현 카세트 및 세포 내의 더 정교한 논리 게이트를 위한 기능성 DNA 스위치의 발견을 가속화합니다.

AI 속도에 맞춘 제조: 세포 프리(cell-free) 합성 및 공급망

합성과 생산이 따라가지 못하면 설계는 공급을 앞지르게 됩니다. 산업계와 일부 스타트업은 이미 적응하고 있습니다. 박테리아 클로닝 없이 선형 IVT 가능 템플릿을 조립하는 세포 프리 DNA 합성 워크플로우는 오염원(엔도톡신, 숙주 DNA)을 제거하고, 인코딩된 폴리(A) 꼬리와 같은 긴 호모폴리머를 플라스미드에서 불안정하게 만드는 재조합 문제를 방지합니다. 이러한 장점은 모델이 빠르게 반복되고 촉박한 일정 내에 많은 수의 맞춤형 템플릿을 요구하는 AI 사이클에서 중요합니다.

세포 프리 템플릿은 또한 폴리(A) 꼬리 길이 및 서열 무결성 측면에서 하류의 가변성을 줄여 시험관 내 전사(in-vitro transcription) 제품의 재현성을 향상시킵니다. AI가 수백 또는 수천 개의 후보 서열을 제안할 때, 합성, QC 및 IVT 템플릿을 제공하는 자동화 친화적인 고속 공급망은 속도를 결정하는 핵심 요소가 됩니다. 이는 기업, 위탁 제조업체 및 학계 핵심 시설들이 계산 속도에 맞추기 위해 세포 프리 접근 방식을 중심으로 재편되고 있음을 의미합니다.

응용 분야, 제약 사항 및 초기 한계

하지만 실제적인 제약도 존재합니다. 조절 게놈은 방대하며 상황에 따라 달라집니다. CRG 연구는 전사 인자와 세포 상태의 일부만을 프로파일링했으며, Rice University의 CLASSIC 시연은 원리 증명을 위해 모델 세포주에서 수행되었습니다. 배양 접시에서 작동하는 서열을 인간에게 안전하고 지속적이며 효과적인 치료제로 전환하려면 광범위한 전임상 검증이 필요합니다. 모델은 훈련 데이터가 목표 맥락을 반영할 때 가장 잘 일반화되며, 훈련 세트의 공백은 여전히 주요 실패 원인으로 남아 있습니다.

위험성, 거버넌스 및 인간의 감독

신속한 설계와 저렴한 합성은 합성 생물학계가 수년간 고민해 온 보안 및 거버넌스 문제를 야기합니다. npj Biomedical Innovations의 한 리뷰는 이를 '수렴 문제'로 정의했습니다. AI는 복잡한 바이오 엔지니어링의 기술적 문턱을 낮추는 반면, 자동화된 실험실과 저렴한 합성은 역량과 유통 규모를 확장합니다. 이러한 결합은 유익한 접근성을 넓히는 동시에 이중 용도(dual-use) 위험도 증가시킵니다.

최근의 논평과 정책 연구에서는 세 가지 거버넌스 우선순위가 나타납니다. 첫째, 모델과 설계 파이프라인에 대한 설명 가능성 및 감사 추적입니다. 불투명한 '블랙박스' 추천은 실패 모드나 오용 가능성을 평가하기 더 어렵습니다. 둘째, 결정적인 병목 지점에서의 인간 참여형(human-in-the-loop) 제어입니다. 생물학적 시스템에 방출될 의도가 있는 모든 서열은 전문가 검토와 기능 분석을 거치도록 제한해야 합니다. 셋째, 새로운 서열일지라도 해로운 기능을 가능하게 할 수 있는 설계를 탐지하기 위한 공급망 조치와 서열 스크리닝 표준입니다. 핵산 합성 스크리닝을 확대하려는 국가적 노력은 이러한 기술이 현재 받고 있는 정책적 관심을 입증합니다.

과학은 빠르게 발전하고 있으며, 현재로서는 AI가 창조할 수 있는 것에 대한 열정과 더불어 위험을 제한하고 출처를 기록하며 가장 중요한 지점에서 인간의 판단을 보존하려는 신중하고 투명한 관행을 결합하는 것이 현명한 길입니다.

출처

Cell (AI 설계 합성 인핸서에 관한 연구 논문)
Nature (연구 논문: 초고처리량 유전자 회로 매핑을 위한 CLASSIC 플랫폼)
npj Biomedical Innovations (AI와 합성 생물학 수렴에 관한 분석)
Centre for Genomic Regulation (CRG), Barcelona
Rice University Synthetic Biology Institute
Pompeu Fabra University (UPF)

AI가 유전자 제어를 위한 DNA 스위치를 설계하다

새로운 종류의 합성 인핸서

CLASSIC을 이용한 대규모 라이브러리 및 유전자 회로 매핑

인실리코(in silico) 설계에서 살아있는 세포까지

AI 속도에 맞춘 제조: 세포 프리(cell-free) 합성 및 공급망

응용 분야, 제약 사항 및 초기 한계

위험성, 거버넌스 및 인간의 감독

출처

Tags

Wendy Johnson

Readers Questions Answered

Have a question about this article?

Comments