AI가 CRISPR를 재창조하는 방법

유전학
How AI Is Reinventing CRISPR
연구자들은 더 나은 뉴클레아제를 설계하고, 결과를 예측하며, 실험 설계를 가속화하기 위해 머신러닝과 유전체 교정을 결합하고 있습니다. 하지만 기술적, 윤리적, 규제적 장벽은 여전히 남아 있습니다.

인공지능유전체 교정의 만남

지난 5년 동안 머신러닝의 발전은 단백질 구조 예측에서 시작하여 기능적 생체 분자 발명과 복잡한 실험 프로토콜 안내로 진화했습니다. CRISPR 시스템이 이미 분자 생물학을 뒤바꾼 유전체 교정 분야에서 AI는 이제 단순한 편의 도구가 아닙니다. AI는 새로운 효소를 제안하고, 가이드 RNA를 최적화하며, 단 하나의 세포도 건드리기 전에 교정 결과를 예측할 수 있는 능동적인 설계 파트너가 되고 있습니다.

이러한 발전은 더 빠르고 저렴하며 정밀한 교정을 약속하며, 이는 치료제 프로그램, 기능 유전체학 및 농업 공학의 속도를 높일 수 있습니다. 하지만 이는 과학자들과 규제 당국이 병행하여 해결해야 할 검증, 안전성 및 거버넌스에 관한 실질적이고 윤리적인 문제를 제기하기도 합니다.

AI가 CRISPR 워크플로에 가져온 변화

광범위하게 말하자면, AI는 세 가지 상호 보완적인 방식으로 유전체 교정에 기여합니다. 분자 도구 자체(예: 엔지니어링된 뉴클레아제 및 탈아미노효소)의 설계를 돕고, 특정 유전체 맥락에서 어떤 교정이 성공하거나 실패할지 예측하며, 실험 설계 및 최적화를 자동화하여 웻랩(wet‑lab) 반복 횟수를 줄여줍니다.

  • 데 노보(De novo) 단백질 디자인: 수백만 개의 단백질 서열을 학습한 생성 모델은 자연계에 존재하지 않는 새로운 Cas 유사 단백질이나 이펙터 도메인을 제안할 수 있습니다. 이러한 모델은 서열 패턴과 기능적 모티프를 추론하여 연구자가 세포에서 테스트할 후보를 제공합니다.
  • 가이드 및 교정기용 예측 모델: 딥러닝 분류 및 회귀 모델은 가이드 RNA의 온타겟(on‑target) 활성과 오프타겟(off‑target) 위험을 점수화하며, 프라임 및 염기 교정기를 위한 후보 pegRNA나 염기 교정 윈도우를 정렬할 수 있습니다.
  • 실험 최적화: 머신러닝은 선택된 세포 유형에서 작동 가능성이 가장 높은 시약 농도, 전달 방식 또는 pegRNA 설계를 제안하여 반복 주기를 몇 주 또는 몇 달 단축할 수 있습니다.

연구실에서 나온 구체적인 사례들

현재 AI가 설계한 교정 시스템이 인간 세포에서 작동할 수 있다는 공개적인 사례들이 있습니다. 한 회사는 방대한 CRISPR 관련 서열 데이터를 바탕으로 거대 단백질 언어 모델을 훈련하고, 이를 사용하여 새로운 Cas 유사 단백질과 파트너 가이드 RNA를 생성했습니다. 초기 테스트 결과, AI가 설계한 교정기 중 적어도 하나는 기존 시스템과 대등한 활성과 향상된 특이성으로 인간 DNA를 절단하는 것으로 나타났으며, 해당 그룹은 연구 커뮤니티에 서열 및 프로토콜 자료를 공개했습니다.

AI는 또한 기존의 교정 방식들을 개선하는 데에도 사용되었습니다. 연구자들은 단백질 돌연변이 효과 예측 모델과 실증적 스크리닝을 결합하여, 여러 표적 부위, 특히 까다로운 세포 환경에서 염기 교정기의 효율을 크게 높이는 Cas9 변이체를 제작했습니다. 이 작업은 예측과 표적화된 실험실 검증이 어떻게 교정기의 성능을 신속하게 반복 개선할 수 있는지를 보여줍니다.

최근에는 그래프 신경망 등을 사용하여 서열과 RNA 이차 구조 정보를 통합하는 새로운 모델 아키텍처가 서로 다른 CRISPR 시스템 전반에서 교정 효율 예측 성능을 향상시켰습니다. 이는 모델이 단순히 서열에만 의존하는 것이 아니라 더욱 풍부한 생물물리학적 특징을 통합하는 미래를 시사합니다.

모델의 작동 방식 (쉬운 설명)

두 가지 광범위한 머신러닝 접근 방식이 이 분야를 주도하고 있습니다. 첫 번째는 단백질 언어 모델 및 관련 아키텍처와 같은 생성 모델로, 수백만 개의 자연 서열에서 통계적 규칙을 학습한 다음 기능적으로 보이는 새로운 서열을 샘플링합니다. 두 번째는 입력값(가이드 서열, 국소 DNA 맥락, 후성유전학적 표지)으로부터 결과(교정율, 인델 스펙트럼, 오프타겟 가능성)로의 매핑을 학습하는 지도형 예측 모델입니다.

생성 모델은 이전에 본 적 없는 새로운 분자를 원할 때 유용하며, 예측 모델은 이미 알려진 교정기를 위해 수많은 후보 가이드나 pegRNA 중에서 선택하고자 할 때 가장 적합합니다. 실제로 연구팀들은 대개 두 방식을 결합합니다. 새로운 단백질 변이체를 생성한 다음, 예측 모델을 사용하여 성공을 극대화할 가이드 RNA와 실험 조건을 선택하는 식입니다.

이것이 중요한 이유 — 속도, 규모, 그리고 새로운 역량

AI는 세 가지 방식으로 장벽을 낮춥니다. 첫째, 속도를 높입니다. 계산을 통한 순위 선정은 실험실에서 제작해야 할 구성체와 세포 형질전환 횟수를 줄여줍니다. 둘째, 규모를 확장합니다. 모델은 거대한 서열 공간을 탐색하거나 수백만 개의 가이드-표적 쌍을 몇 분 안에 평가할 수 있습니다. 셋째, 새로운 역량을 확보합니다. 서로 다른 PAM 선호도, 바이러스 전달을 위한 더 작은 크기, 또는 치료 용도에 더 적합한 변경된 면역원성 프로파일을 가진 교정기를 설계할 수 있게 됩니다.

한계, 위험 그리고 책임 있는 테스트

이러한 유망함에도 불구하고, AI 기반 설계가 신중한 실험적 검증을 대체할 수는 없습니다. 모델은 가용한 데이터로부터 학습하므로, 데이터의 편향이나 공백으로 인해 새로운 세포 유형, 종 또는 전달 환경에 적용될 때 과도하게 확신에 찬 예측을 내놓을 수 있습니다. 오프타겟 활성, 염색질 효과 및 면역 반응은 여전히 게놈 전반의 분석과 동물 실험이 필요한 실증적인 문제입니다.

거버넌스에 관한 우려도 존재합니다. 자연적인 대응물이 없는 새로운 뉴클레아제를 설계하는 것은 이중 용도(dual-use) 문제를 야기하며, 서열의 공개 배포는 커뮤니티 표준 및 안전장치와 병행되어야 합니다. 더욱 강력한 설계 시스템이 널리 보급됨에 따라 투명한 보고, 독립적인 재현, 출판 전 위험 평가가 필수적입니다. 과학적 개방성과 안전의 균형을 맞추기 위해 세심한 라이선스 관리, 감독, 세포주 또는 생물체 제한이 필요할 수 있습니다.

향후 나아갈 방향

  1. 여러 세포 유형 및 전달 방식에 걸쳐 서열과 견고한 실험 결과값을 연결하는 더 크고 높은 품질의 벤치마크 데이터셋을 구축해야 합니다.
  2. 일반화 능력을 향상시키기 위해 물리 정보 기반 모델(구조 및 열역학)을 데이터 기반 접근 방식과 결합해야 합니다.
  3. 게놈 전반의 오프타겟 분석, 면역원성 스크리닝 및 재현 가능한 프로토콜과 같은 표준 검증 파이프라인을 채택하여 AI의 제안을 객관적으로 비교할 수 있어야 합니다.
  4. 연구를 유익하고 안전하게 유지하기 위한 정책을 수립하기 위해 규제 당국, 윤리학자 및 대중과 조기에 소통해야 합니다.

결론

머신러닝은 유전체 교정을 더 스마트하게 만들고 있습니다. 새로운 교정기를 구상하고, 더 나은 가이드의 우선순위를 정하며, 실패하는 실험 횟수를 줄일 수 있습니다. 초기 사례들은 AI가 설계한 교정기가 인간 세포에서 작동할 수 있으며, 머신러닝 가이드 최적화가 염기 및 프라임 교정과 같은 기존 방식을 개선한다는 것을 보여줍니다. 하지만 모델은 마법이 아닙니다. 모델은 해답으로 가는 경로를 단축할 뿐, 최종 증명은 실험의 몫으로 남아 있습니다.

연구자와 정책 입안자 모두에게 이제 과제는 AI의 창의적인 힘을 활용하는 동시에 유전체 교정이 의학과 농업을 안전하고 형평성 있게 발전시킬 수 있도록 기술적, 윤리적, 규제적 토대를 강화하는 것입니다. 혁신과 책임 사이의 이러한 균형이 AI가 신뢰할 수 있는 부조종사가 될 것인지, 아니면 CRISPR의 다음 장에서 예상치 못한 위험의 근원이 될 것인지를 결정할 것입니다.

Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q AI는 CRISPR 워크플로우를 어떻게 재편하고 있습니까?
A AI는 세 가지 영역에서 설계 파트너 역할을 수행하며 CRISPR 워크플로우를 재편하고 있습니다. 새로운 분자 도구(공학적 뉴클레아제 및 디아미나제)를 생성하고, 특정 게놈 맥락에서 어떤 편집이 성공할지 예측하며, 실험 설계를 자동화하여 습식 실험(wet-lab) 반복 횟수를 줄여줍니다. 이러한 역량들은 결합되어 개발 속도를 높이고 규모를 확장하며, 이전에는 불가능했던 편집을 가능하게 합니다.
Q 게놈 편집에서 AI가 적용된 구체적인 사례는 무엇입니까?
A 구체적인 사례로는 인간 DNA를 유사한 활성과 향상된 선택성으로 절단하는 AI 설계 편집기, 그리고 연구 커뮤니티에 공개된 서열 및 프로토콜 등이 있습니다. 한 기업은 CRISPR 서열을 바탕으로 단백질 언어 모델을 훈련시켜 Cas 유사 단백질과 파트너 가이드 RNA를 생성함으로써 AI 기반 설계의 실질적인 이점을 입증했습니다.
Q CRISPR 설계 및 예측에서 AI 모델은 어떻게 작동합니까?
A 크게 두 가지 모델 범주가 있습니다. 단백질 언어 모델과 같은 생성형 모델은 방대한 서열로부터 학습하여 기능적인 새로운 분자를 제안하며, 예측 모델은 가이드 서열 및 후성유전학적 맥락과 같은 입력 정보를 편집률 및 표적 이탈(off-target) 위험과 같은 결과로 매핑합니다. 연구팀은 흔히 이 두 모델을 결합하여 변이체를 생성한 후, 최적의 가이드와 조건을 예측합니다.
Q 주요 위험과 거버넌스 고려 사항은 무엇입니까?
A AI 기반 설계가 검증을 대체할 수는 없습니다. 모델은 데이터 편향으로 인해 새로운 세포 유형이나 전달 환경에서 과적합되거나 잘못된 예측을 할 수 있습니다. 표적 이탈 활성, 염색질 효과, 면역 반응 등은 여전히 실증적인 과제로 남아 있습니다. 거버넌스 측면에서는 이중 용도 위험, 서열 공개, 위험 평가, 독립적 재현, 보고, 그리고 안전과 개방성 사이의 균형을 맞추기 위한 잠재적 라이선스나 규제 등이 논의됩니다.
Q 이 분야의 발전을 위해 제안된 단계는 무엇입니까?
A 발전을 위해서는 세포 유형과 전달 방법 전반에 걸쳐 서열과 견고한 판독 결과를 연결하는 대규모 벤치마크 데이터셋, 물리 기반 모델과 데이터 기반 접근 방식의 결합, 그리고 표준 검증 파이프라인이 필요합니다. 이러한 파이프라인에는 게놈 전체 표적 이탈 분석, 면역원성 스크리닝, 재현 가능한 프로토콜이 포함되어 AI가 제안한 내용을 여러 연구실에서 비교하고 검증할 수 있어야 합니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!