구겨진 유전체: AI가 밝혀낸 DNA 저장소의 핵심은 결코 고정되어 있지 않다

유전학
The Crumpled Genome: AI Finds the Core of DNA Storage Is Anything But Locked
AI 기반 시퀀싱을 활용한 새로운 연구에 따르면 뉴클레오솜을 감싸고 있는 DNA는 접근 불가능한 상태가 아니며, 유전자 활동을 제어하는 14가지의 서로 다른 왜곡 상태로 존재하는 것으로 밝혀졌습니다.

수십 년 동안 인간 DNA를 설명하는 표준 교과서적 삽화는 '실에 꿰인 구슬'이라는 그럴듯하고 깔끔한 비유에 의존해 왔다. 2미터에 달하는 유전 물질을 수 마이크론 폭의 세포핵 안에 구겨 넣기 위해, 세포는 뉴클레오솜(nucleosome)이라 불리는 실패 모양의 단백질 주위로 DNA를 감는다. 모든 생물학 학부생이 배우는 통설은 이 과정이 이진법적 잠금장치라는 것이다. DNA가 감겨 있으면 침묵 상태로 격리되어 접근할 수 없으며, 풀려 있으면 활성 상태가 된다는 것이다. 이는 연구자들이 유전체를 책이 서가에 꽂혀 있거나 독자의 손에 들려 있는 도서관처럼 취급할 수 있게 해주는 깔끔하고 우아한 모델이었다.

이번 발견은 유전자 조절에 대한 우리의 이해를 단순한 온-오프 스위치에서 14단계 밝기 조절 다이얼과 유사한 것으로 변화시킨다. 이는 단순히 분자생물학의 미묘한 차이가 아니라, 우리가 어떻게 노화하는지, 암과 같은 질병이 어떻게 세포의 자연 방어 체계를 우회하는지를 지배하는 유전체 코드의 근본적인 재작성이다. 유전체가 설계도라면, 우리는 페이지가 접혀 있는 상태에서도 잉크가 보인다는 사실을 방금 발견한 셈이다.

뉴클레오솜의 통계적 유령

기존 모델의 문제는 호기심 부족이 아니라 해상도 부족이었다. 수년간 과학계는 수백만 개의 세포 집단을 한꺼번에 관찰하는 '농축 기반(enrichment-based)' 분석법에 의존해 왔다. 이러한 방식은 흐릿한 평균값을 제공했으며, 개별 DNA-단백질 상호작용의 미세한 왜곡은 통계적 평균치로 상쇄되어 사라졌다. 이는 마치 박물관의 저해상도 위성 사진을 보고 반 고흐의 붓놀림을 이해하려는 것과 같았다.

글래드스톤(Gladstone) 연구원이자 본 연구의 책임자 중 한 명인 비제이 라마니(Vijay Ramani)는 이전에 SAMOSA(단일 분자 아데닌 메틸화 올리고 수준 시퀀싱 분석)라는 기술로 한계를 뛰어넘은 바 있다. SAMOSA를 통해 과학자들은 개별 DNA 가닥에서 뉴클레오솜이 어디에 위치하는지 지도를 그릴 수 있었지만, 뉴클레오솜 자체는 여전히 블랙박스로 취급되었다. 내부를 들여다보기 위해 연구팀은 IDLI(반복적으로 정의된 접근 불가능성 길이)를 개발했는데, 이는 뉴클레오솜 내부의 구조적 변이의 특정 징후를 인식하도록 훈련된 AI 모델이다.

14가지 단계의 유전체 접근성

연구팀은 뉴클레오솜이 가질 수 있는 14가지의 독특한 구조적 상태를 확인했다. 바로 이 지점에서 이번 발견은 기술적 호기심을 넘어 조절 기제에 관한 폭발적인 이슈로 변모한다. 이 14가지 상태는 무작위로 분포된 것이 아니라, 하나의 프로그래밍된 언어처럼 보였다. 연구팀은 인간 줄기세포, 간 유사 세포, 생쥐의 일차 조직에서 동일한 패턴을 관찰했으며, 이는 이러한 '구김'이 종과 세포 유형 전반에 걸쳐 보존된 메커니즘임을 시사한다.

이러한 상태의 존재는 생명공학 분야의 '열린 염색질(open chromatin)'에 대한 현재의 집착에 의문을 제기한다. 지난 10년간 많은 후성유전학 치료법의 목표는 스위치를 닫힘에서 열림으로 전환하는 것이었다. 그러나 '닫힌' 유전체의 85%가 실제로는 다양한 정도의 열림 상태라면, 우리는 지금까지 잘못된 표적을 겨냥하고 있었던 셈이다. 특정 유전자가 '켜짐' 상태인 이유는 뉴클레오솜이 제거되었기 때문이 아니라, 특정 전사 인자가 파고들 수 있도록 정밀하게 왜곡되었기 때문일 수 있다.

이는 질병 유발 요인을 찾는 과정에 복잡성을 더한다. 알츠하이머나 자가면역 질환과 같은 많은 복합 질환에서 연구자들은 '결정적 증거(smoking gun)'가 되는 돌연변이를 찾는 데 어려움을 겪어 왔다. AI의 이번 발견은 그 결함이 DNA 서열에 있는 것이 아니라 실패(spool)의 구조적 상태에 있을 수 있음을 시사한다. 10%의 강도로 작동해야 할 유전자가 뉴클레오솜이 2번 상태가 아닌 7번 상태에 머물러 있다는 이유로 40%로 고정되어 있을 수 있다. 일생 동안 이러한 미세한 유전자 발현 누출은 건강한 세포와 악성 세포를 가르는 차이가 될 수 있다.

왜곡의 설계자들

본 연구의 더 당혹스러운 측면 중 하나는 전사 인자의 역할이다. 역사적으로 이 단백질들은 유전체의 '독자'로 간주되었다. 즉, DNA에서 열린 지점을 찾아 내려앉아 RNA를 만드는 과정을 시작하는 존재로 보았다. 글래드스톤과 아크(Arc) 연구팀은 전사 인자가 실제로는 뉴클레오솜 왜곡의 능동적인 설계자임을 밝혀냈다. 연구자들이 화학적으로 특정 전사 인자를 제거했을 때, 뉴클레오솜 패턴은 그대로 유지되지 않고 더 '잠긴' 상태로 되돌아갔다.

이는 재귀적인 권력 역학을 시사한다. 지침을 읽어야 할 단백질들이 사실은 그 지침을 찾기 쉽게 만들기 위해 서류 정리 시스템을 물리적으로 왜곡하고 있는 것이다. 이는 유전자 네트워크를 모델링하려는 우리의 노력을 복잡하게 만드는 세포적 주체성 수준이다. 만약 전사 인자가 뉴클레오솜을 강제로 '구기게' 할 수 있다면, DNA의 물리적 구조는 그 전구체인 동시에 활동의 결과물이기도 하다.

이는 또한 현재의 제약 개발 과정에 잠재적인 사각지대가 있음을 가리킨다. 만약 우리가 전사 인자가 '열린' 부위에 결합하는 것을 차단하는 약물을 설계한다면, 우리는 그 인자가 이미 옆에 있는 '닫힌' 부위를 변형시켰다는 사실을 간과하고 있을지도 모른다. 우리는 근본 원인이 아닌 구조적 변화의 증상만을 치료하고 있는 것이다.

노화의 대가를 바라보는 새로운 렌즈

노화 연구에 대한 함의는 특히 심각하다. 우리는 나이가 들면서 염색질이 '새기(leaky)' 시작한다는 것을 알고 있다. 심장 세포에서 침묵해야 할 유전자들이 깜빡거리며 켜지기 시작하고, 이는 장기 기능을 저하시키는 세포적 잡음을 만들어낸다. 지금까지 우리는 이를 뉴클레오솜 밀도를 유지하지 못하는 세포의 일반적인 실패, 일종의 유전적 마모로 간주해 왔다.

이러한 관점은 환경적 위험에 대해서도 불편한 질문을 던진다. 오염 물질, 중금속, 심지어 만성적인 스트레스가 DNA에 후성유전학적 표지를 남길 수 있다는 것은 잘 알려져 있다. 만약 이러한 외부 요인들이 뉴클레오솜 왜곡의 '문법적' 구조에 영향을 미치고 있다면, 우리는 환경과 생물학 사이에서 이전에 상상했던 것보다 훨씬 더 민감한 접점을 마주하고 있는 것이다. EPA나 FDA와 같은 규제 기관들은 DNA 손상이나 메틸화를 모니터링하는 장비조차 갖추기 벅찬 수준인데, 줄기세포 유전체의 '구김'을 미세하게 변화시킬 수 있는 물질을 규제할 준비는 전혀 되어 있지 않다.

관찰에서 개입으로의 전환

기관의 타성도 고려해야 한다. 과학계는 염색질의 이진법 모델에 수십억 달러를 투자해 왔다. '접근 불가능한' DNA가 진정으로 어두운 영역이라는 가정하에 수천 편의 논문이 발표되었다. 대다수의 유전체가 부분적이고 프로그래밍 가능한 가시성 상태에 있다는 사실을 갑작스럽게 인정하는 것은 실험을 설계하고 데이터를 분석하는 방식의 거대한 전환을 요구한다. 하니 구다르지(Hani Goodarzi)가 언급했듯이, 우리는 지금까지 소리와 침묵으로 이루어진 텍스트를 읽어왔지만, 이제는 무한한 그라데이션의 문법을 배워야 한다.

이번 발견은 유전학에서 단순함은 종종 우리의 기술적 한계를 감추는 가면일 뿐이라는 사실을 상기시켜 준다. 우리는 잠금장치 모델이 그리기 쉽고 계산하기 쉬웠기 때문에 선호했다. 14가지 구조적 상태를 가진 지저분하고, 구겨져 있으며, 매우 역동적인 실제 풍경은 관리하기 훨씬 어렵지만, 우리가 해결하지 못한 가장 끈질긴 의학적 수수께끼의 해답이 숨겨져 있을 가능성이 높다. 유전체는 정밀하지만 그 안의 세상은 전혀 그렇지 않으며, 우리는 우리 삶을 지탱하는 실패 위에 새겨진 그 혼란의 지문을 이제야 비로소 보기 시작했을 뿐이다.

Wendy Johnson

Wendy Johnson

Genetics and environmental science

Columbia University • New York

Readers

Readers Questions Answered

Q 연구진이 발견한 뉴클레오솜 변형의 14가지 상태는 무엇인가요?
A 14가지의 독특한 뉴클레오솜 변형 상태에 대한 발견은 DNA 감김이 단순한 이진법적 온-오프 스위치가 아니라 14단계의 조광기 다이얼처럼 복잡하다는 것을 보여줍니다. 이는 이전에 잠겨 있어 접근이 불가능하다고 여겨졌던 유전체의 대부분이 실제로는 다양한 정도로 읽힐 수 있음을 시사합니다. 세포는 이러한 상태들을 전환함으로써 유전자 활성을 정밀하게 조절할 수 있으며, 이는 기초 발달부터 만성 질환의 진행에 이르기까지 모든 것에 영향을 미치는 새로운 차원의 제어 기전을 제공합니다.
Q IDLI AI 모델은 기존의 DNA 염기서열 분석 방법을 어떻게 개선했나요?
A 기존의 염기서열 분석은 세포 집단의 흐릿한 평균값만을 제공했지만, IDLI AI 모델은 단일 분자 데이터를 분석하여 구조적 변이의 특정 패턴을 식별합니다. 인공지능이 반복적으로 정의된 접근 불가 구간의 길이를 인식하도록 학습시킴으로써, 과학자들은 이제 DNA가 개별 뉴클레오솜 내에서 어떻게 구겨져 있는지 확인할 수 있게 되었습니다. 이러한 고해상도 분석은 구조적 상태가 무작위적인 변이나 단순한 이진법적 잠금이 아니라, 서로 다른 종과 조직 전반에 걸쳐 공유되는 프로그램화되고 보존된 언어임을 보여줍니다.
Q 전사 인자는 뉴클레오솜의 물리적 구조에 어떤 영향을 미치나요?
A 전사 인자는 단순히 열린 DNA를 읽는 존재가 아니라 유전체의 물리적 구조를 설계하는 능동적인 건축가로 이해되고 있습니다. 이러한 단백질은 뉴클레오솜을 물리적으로 뒤틀어 구조적 상태를 변화시키고, 특정 유전 정보에 더 쉽게 접근할 수 있도록 만듭니다. 전사 인자가 제거되면 DNA는 종종 더 잠긴 상태로 되돌아갑니다. 이는 염색질의 물리적 구조가 단백질 활동의 역동적인 결과물임을 시사하며, 유전자 네트워크가 조절되는 방식에 대한 기존 모델을 더욱 정교하게 만듭니다.
Q 누출형 유전자 발현(leaky gene expression)이 인간의 노화와 질병에 미치는 영향은 무엇인가요?
A 누출형 유전자 발현은 뉴클레오솜 구조 상태의 변화로 인해 억제되어야 할 유전자가 우연히 활성화될 때 발생합니다. 인간이 노화함에 따라 이러한 DNA 구김의 미세한 오류는 세포 잡음을 유발하여 장기 기능을 저하시킬 수 있습니다. 암이나 알츠하이머와 같은 질환의 경우, 그 원인은 DNA 서열 자체가 아니라 단백질 스풀(단백질 타래)의 물리적 상태에 있을 수 있습니다. 이번 발견은 이러한 구조적 누출을 해결하는 것을 목표로 하는 새로운 치료법의 표적을 제시합니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!