折り畳まれたゲノム:AIが解明した「固定されていない」DNAストレージの核心

遺伝学
The Crumpled Genome: AI Finds the Core of DNA Storage Is Anything But Locked
AIを活用したシーケンシング技術を用いた新たな研究により、ヌクレオソームに巻き付いたDNAは固定されてアクセス不能な状態にあるのではなく、遺伝子活性を制御する14の異なる歪み状態で存在していることが明らかになった。

何十年もの間、人間のDNAに関する教科書的な標準的図解は、「糸の上のビーズ」という、見かけほど単純ではない比喩に頼ってきた。わずか数ミクロンの核の中に2メートルもの遺伝物質を詰め込むため、細胞は「ヌクレオソーム」と呼ばれるスプール状のタンパク質にDNAを巻き付けている。生物学の学部生全員が教わる定説では、このプロセスは二進法的な「ロックボックス(金庫)」であるとされてきた。DNAが巻き付いていればそれは沈黙し、隔離され、アクセス不能な状態であり、巻き付いていなければ活性化状態にあるというものだ。これは、ゲノムを「本が棚にあるか、読者の手中にあるか」のどちらかで管理する図書室のように扱うことを可能にした、洗練された美しいモデルだった。

今回の発見は、遺伝子調節に対する我々の理解を、単純なオン・オフのスイッチから、14段階の調光ダイアルのようなものへと変貌させる。これは単なる分子生物学上の細かな差異ではない。我々がいかにして老化し、がんのような疾患がいかにして細胞の自然な防御を回避するのかを支配する、ゲノムコードの根本的な書き換えである。もしゲノムが設計図であるなら、我々は今、ページが閉じられているときでさえインクの文字が読めることに気づいたのだ。

ヌクレオソームの統計的幽霊

古いモデルの問題は好奇心の欠如ではなく、解像度の不足にあった。長年、科学界は数百万個の細胞集団を一括して調査する「エンリッチメント(濃縮)ベース」のアッセイに依存してきた。これらの手法が提示する平均値はぼやけたものであり、個々のDNAとタンパク質の相互作用による微細な歪みは、統計的な平均値の中に塗りつぶされていた。それは、美術館の低解像度な衛星写真を見て、ゴッホの筆致を理解しようとするようなものだった。

Gladstone Investigatorであり、本研究の主導者の一人であるVijay Ramaniは、以前から「SAMOSA(Single-molecule Adenine Methylation Oligo-level Sequencing Assay)」という技術で限界を押し広げてきた。SAMOSAは個々のDNA鎖上のどこにヌクレオソームが存在するかをマッピングすることを可能にしたが、それでもヌクレオソーム自体は「ブラックボックス」として扱われていた。その内部を覗き込むため、チームは「IDLI(Iteratively Defined Lengths of Inaccessibility)」を開発した。これは、ヌクレオソーム内部の構造的変異という特定のシグネチャーを認識するように訓練されたAIモデルである。

ゲノムアクセスの14のグラデーション

研究チームは、ヌクレオソームがとりうる14の明確な構造状態を特定した。ここで、この発見は技術的な好奇心の対象から、調節の仕組みを根底から覆す爆弾へと変わる。これら14の状態はランダムに分布しているのではなく、プログラムされた言語であるように見えた。研究チームは、ヒト幹細胞、肝臓様細胞、そしてマウスの初代組織において同じパターンを観察しており、この「折りたたみ(crumpling)」が種や細胞型を超えて保存されたメカニズムであることを示唆している。

これらの状態の存在は、バイオテクノロジーにおいて現在重要視されている「オープンクロマチン」という概念に対する執着に異議を唱えるものだ。過去10年間、多くのエピジェネティック治療の目標は、スイッチを「閉」から「開」へと切り替えることだった。しかし、もし「閉」とされていたゲノムの85パーセントが、実際には様々な程度の「開」状態にあるのであれば、我々は的を外していたことになる。ある遺伝子が「オン」であるのは、ヌクレオソームが剥ぎ取られたからではなく、特定の転写因子が潜り込めるように正確に歪められているからかもしれない。

これは、疾患の要因を探る作業に複雑さを加える。アルツハイマー病や自己免疫疾患といった多くの複雑な疾患において、研究者たちは「決定的な証拠(スモーキングガン)」となる変異を見つけ出そうと苦闘してきた。AIによるこの発見は、その欠陥がDNAの配列にあるのではなく、スプールの構造的状態にある可能性を示唆している。本来10パーセントのボリュームであるべき遺伝子が、ヌクレオソームが状態#2ではなく状態#7にあるために、40パーセントのボリュームで固定されてしまっている可能性があるのだ。一生を通じて見れば、その遺伝子発現における微細な「漏れ」こそが、健康な細胞と悪性細胞を分かつ違いかもしれない。

歪みの設計者たち

この研究で特に不安をかき立てるのは、転写因子の役割である。歴史的に、これらのタンパク質はゲノムの「読者」と見なされてきた。つまり、DNA上の開いた場所を見つけて着陸し、RNAを作るプロセスを開始するという役割だ。GladstoneとArcのチームは、転写因子が実際にはヌクレオソームを歪ませる能動的な設計者であることを発見した。研究者たちが化学的に特定の転写因子を取り除くと、ヌクレオソームのパターンはそのまま維持されるどころか、より「ロック」された状態へと逆戻りした。

これは再帰的な権力のダイナミクスを示唆している。指示を読み取るはずのタンパク質が、その指示を見つけやすくするために、自ら物理的にファイリングシステムを歪めているのだ。これは細胞の主体性というレベルの話であり、遺伝子ネットワークをモデル化しようとする我々の試みを困難にする。もし転写因子がヌクレオソームを強制的に「折りたたむ」ことができるのなら、DNAの物理的構造は、その活動の結果であると同時に、活動の先駆けでもあるということになる。

これはまた、現在の医薬品開発における潜在的な死角をも指摘している。もし「開」の部位に転写因子が結合するのをブロックする薬を設計しても、その隣にある「閉」の部位をその因子がすでに変えてしまっているという事実を無視している可能性がある。我々は構造変化の原因ではなく、その症状を治療しているに過ぎないのかもしれない。

老化の代償を捉える新しいレンズ

老化研究への影響は特に深刻だ。我々は加齢とともにクロマチンが「漏れやすく」なることを知っている。心臓の細胞では沈黙しているはずの遺伝子がちらつき始め、臓器機能を低下させる細胞ノイズを生み出す。これまでは、これを細胞がヌクレオソーム密度を維持できないことによる一般的な失敗、いわばゲノムの摩耗と見なしてきた。

この視点はまた、環境リスクに関する厄介な疑問を投げかける。汚染物質、重金属、さらには慢性的なストレスさえもが、DNAにエピジェネティックな痕跡を残しうることは分かっている。もしこれらの外部要因が、ヌクレオソームの歪みという「文法」構造に影響を与えているのであれば、我々はこれまで想像していたよりもはるかに敏感な、環境と生物学のインターフェースを目の当たりにしていることになる。EPA(米国環境保護庁)やFDA(米国食品医薬品局)のような規制当局は、DNA損傷やメチル化を監視する準備さえ十分に整っていない。ましてや、幹細胞ゲノムの「折りたたみ」を微細に変化させうる物質を規制する準備など、遠く及ばない。

観察から介入への移行

制度的な慣性の問題も考慮せねばならない。科学界はクロマチンの二進法モデルに何十億ドルもの投資を行ってきた。「アクセス不能」なDNAは完全に暗黒であるという前提に基づき、何千もの論文が出版されてきた。ゲノムの大部分が、部分的に、かつプログラム可能な形で可視化されている状態にあると突然認めるには、実験の設計やデータ分析の方法において大規模な転換が必要となる。Hani Goodarziが指摘したように、我々はこれまで「音と沈黙」で構成されたテキストを読んでいたが、これからは「無限のグラデーション」という文法を学ばなければならないのだ。

この発見は、遺伝学において単純さとは多くの場合、我々自身の技術的欠陥を隠すためのマスクに過ぎないということを思い出させる。我々がロックボックスモデルを好んだのは、それが図に描きやすく、数えやすかったからに過ぎない。しかし現実の、乱雑で、折りたたまれ、極めてダイナミックな14の構造状態からなる景観を管理するのははるかに困難だ。だが、我々が抱える最も執拗な医学的謎への答えは、そこに隠されている可能性が高い。ゲノムは精密だが、それが存在する世界は決してそうではない。我々は今、我々の命を束ねるスプールそのものに刻まれた、その乱雑さの指紋をようやく見始めたばかりなのだ。

Wendy Johnson

Wendy Johnson

Genetics and environmental science

Columbia University • New York

Readers

Readers Questions Answered

Q 研究者が発見したヌクレオソームの14の変形状態とはどのようなものですか?
A 14種類の異なるヌクレオソーム変形状態の発見により、DNAの巻き付きは単なるオン・オフの二進法的なスイッチではなく、14段階の調光ダイヤルのような複雑な仕組みであることが明らかになりました。これは、従来はロックされていてアクセス不能と考えられていたゲノムの大部分が、実際には程度の差こそあれ読み取り可能であることを示唆しています。細胞はこれらの状態を切り替えることで遺伝子活性を精密に調整し、基礎的な発生から慢性疾患の進行に至るまで、あらゆる現象に影響を与える新しい制御層を提供しています。
Q IDLI AIモデルは、従来のDNAシーケンシング手法をどのように改善しましたか?
A 従来のシーケンシングでは細胞集団の曖昧な平均値しか得られませんでしたが、IDLI AIモデルは単一分子データを解析することで、構造変異の特定のパターンを識別します。AIに反復定義されたアクセス不能領域の長さを認識させるよう訓練することで、科学者はDNAが個々のヌクレオソーム内でどのように折りたたまれているかを可視化できるようになりました。この高い解像度により、構造的な状態は単なるランダムな変異や単純な二進法的ロックではなく、異なる種や組織間で共有されるプログラム化され保存された言語であることが明らかになりました。
Q 転写因子はヌクレオソームの物理的構造にどのような影響を与えますか?
A 転写因子は、単に開いたDNAを読み取るだけでなく、ゲノムの積極的な設計者であることが理解されるようになりました。これらのタンパク質はヌクレオソームを物理的に歪めることで構造状態を変化させ、特定の遺伝的指示へのアクセスを容易にします。転写因子が取り除かれると、DNAはしばしばより強固にロックされた状態に戻ります。このことは、クロマチンの物理的構造がタンパク質活動の動的な結果であることを示唆しており、遺伝子ネットワークの制御に関する現在のモデルをより複雑なものにしています。
Q 「リーキー(漏出性)遺伝子発現」が人間の老化や疾患に与える影響は何ですか?
A リーキー遺伝子発現とは、ヌクレオソームの構造状態の変化により、本来抑制されるべき遺伝子が誤って活性化してしまう現象です。人間が加齢するにつれて、DNAの折りたたみにおけるこうした微細なエラーが細胞内のノイズとなり、臓器機能の低下を招く可能性があります。がんやアルツハイマー病などの疾患においては、DNA配列そのものではなく、タンパク質スプールの物理的な状態に原因がある可能性があります。この発見は、構造的な「漏れ」を修復することを目的とした治療法の新たな標的を特定するものです。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!