2025年5月8日、BarcelonaのCentre for Genomic Regulationの研究チームは、人工知能(AI)システムが、健康な哺乳類細胞内で細胞タイプ特異的なスイッチとして機能する短い合成DNA調節配列を設計できることを示す論文をCell誌に発表しました。それから1年も経たないうちに、Rice Universityの別のグループがNature誌において、相補的な進歩を発表しました。CLASSICと呼ばれる実験プラットフォームは、数百万もの完全な遺伝子回路を細胞の出力へとマッピングし、それらの測定値を機械学習モデルに提供することで、未テストの広大な設計空間にわたる機能を予測することを可能にします。これらの論文は共に、急速な転換を象徴しています。DNA配列のアルゴリズムによる構想は、単純な例から、生きている細胞内の遺伝子活性を確実に変化させる実際の分子へと移行しており、業界や政策団体は、製造と監視をそれに適応させるべく奔走しています。
新たなクラスの合成エンハンサー
BarcelonaのグループによるCell誌の論文では、短いDNA断片(エンハンサー)が血球細胞の分化過程で遺伝子発現にどのように影響するかという膨大な測定データに基づいて学習された、ジェネレーティブAIについて記述されています。エンハンサーは、転写因子を動員し、遺伝子がいつどこで発現するかを決定する非コードDNA領域です。CRGのチームは、数十種類の転写因子の結合モチーフの組み合わせと配置をテストするために設計された64,000以上のバリアントを合成し、造血の複数の段階にわたる活性を測定しました。これらのデータから、モデルは設計ルールを学習し、自然界には存在しなかったものの、マウスの主要な造血前駆細胞に導入された際に意図した通りに機能する配列を提案しました。あるものは段階的なダイヤルのように機能し、別のものはバイナリ(二値的)なオン/オフ挙動を示し、多くは顕著な細胞タイプ特異性を示しました。
巨大ライブラリとCLASSICによる遺伝子回路のマッピング
CLASSICは設計者に2つの実用的な教訓を提示しました。第一に、回路は多くの場合、単一の解決策しかない問題ではないということです。多くの異なる設計が同じ出力を達成できるため、エンジニアは堅牢性、強度、リソースコストの間で柔軟に調整を行うことができます。第二に、中間程度の強度のパーツが、最も極端なコンポーネントを上回ることがよくあります。言い換えれば、生物学には独自のゴルディロックス・ゾーン(最適範囲)が存在するのです。決定的なのは、予測された設計を合成してテストすることで、このパイプラインが検証されたことです。AIが選んだ数十の回路がラボの測定結果と一致しており、学習セットが大規模で注意深く測定されていれば、モデルは学習セットを超えて一般化できることが示されました。
イン・シリコの設計から生きた細胞へ
両方の研究ラインは、密接に結合した「設計・構築・テスト」のループを強調しています。Barcelonaでは、AIが短いエンハンサー配列を提案します。研究者はそれらの250塩基の断片を合成し、デリバリービークルにパッケージ化して生きた哺乳類細胞に導入し、細胞の状態に応じた活性を読み取ります。ヒューストンおよび共同研究先のラボでは、CLASSIC戦略によって完全な回路のライブラリが作成され、数千から数百万の細胞にわたる出力が読み取られ、その結果が次の候補を推奨する機械学習モデルへとフィードバックされます。
実質的なメリットは、スピードと創造性です。従来の遺伝子工学では、数ヶ月にわたる反復的なデバッグと専門家の直感が必要でしたが、AIと大規模並列測定を組み合わせることで、チームはこれまで不可能だった規模で組み合わせ空間を探索できるようになりました。これにより、治療用プロモーター、系統限定的発現カセット、さらに複雑な細胞内論理ゲートのための、機能的なDNAスイッチの発見が加速されます。
AIのスピードに合わせた製造:無細胞合成とサプライチェーン
合成と生産が追いつかなければ、設計スピードは供給を上回ってしまいます。業界団体や一部のスタートアップは、すでに適応を進めています。細菌でのクローニングを介さずに線形のIVT(体外転写)対応テンプレートを組み立てる「無細胞DNA合成」のワークフローは、汚染源(エンドトキシン、ホストDNA)を排除し、コードされたポリ(A)テールなどの長いホモポリマーをプラスミド内で不安定にする組換えの問題を回避します。AIのサイクルは反復が速く、厳しいスケジュールで多くの異なる特注テンプレートを要求するため、これらの利点はAIサイクルにとって重要です。
無細胞テンプレートはまた、下流工程におけるポリ(A)テールの長さや配列の完全性のばらつきを抑え、体外転写産物の再現性を向上させます。AIが数百、数千の候補配列を提案する場合、合成、品質管理(QC)、IVTテンプレートを提供する高速で自動化に適したサプライチェーンが律速段階となります。つまり、企業、受託製造業者、学術機関のコアファシリティは、計算のペースに合わせるために無細胞アプローチを中心に再編を進めています。
応用、制約、および初期の限界
しかし、現実的な制約も存在します。調節ゲノムは広大でコンテキスト(文脈)に依存します。CRGの研究でプロファイリングされたのは転写因子と細胞状態の一部のみであり、Rice UniversityによるCLASSICのデモンストレーションは原理証明のためのモデル細胞株で行われました。試験管内で機能する配列を、ヒトにおいて安全で持続的かつ効果的な治療薬へと変換するには、広範な臨床前バリデーション(前臨床検証)が必要になります。モデルは学習データがターゲットとするコンテキストを反映しているときに最もよく一般化されますが、学習セットの欠落は依然として失敗の主な原因となっています。
リスク、ガバナンス、および人間の監視
迅速な設計と安価な合成は、合成生物学コミュニティが長年取り組んできたセキュリティとガバナンスの問題を提起しています。npj Biomedical Innovations誌のレビューは、これを「コンバージェンス(収束)問題」として構成しました。AIが複雑なバイオエンジニアリングの技術的ハードルを下げる一方で、自動化されたラボと安価な合成が能力と流通を拡大させます。この組み合わせは、有益なアクセシビリティを広げると同時に、デュアルユース(軍民両用)のリスクも増大させます。
最近の論評や政策活動から、3つのガバナンスの優先事項が浮かび上がっています。第一に、モデルと設計パイプラインの説明責任と監査証跡です。不透明な「ブラックボックス」による推奨は、故障モードや誤用の評価を困難にします。第二に、意思決定のチョークポイントにおける「ヒューマン・イン・ザ・ループ」の制御です。生物学的システムへの放出を意図したあらゆる配列を、専門家によるレビューと機能アッセイの背後にゲートとして配置することです。第三に、新規のものであっても有害な機能を可能にする恐れのある設計を検知するための、サプライチェーン対策と配列スクリーニング基準です。核酸合成スクリーニングを拡大しようとする国家的な取り組みは、これらの技術がいまや政策上の大きな関心事となっていることを証明しています。
科学は急速に進歩しており、現時点では、AIが生み出すものへの熱意と、リスクを制限し、由来を記録し、最も重要な場面で人間の判断を維持するための慎重かつ透明性のある実践を組み合わせることが賢明な道です。
Sources
- Cell (research paper on AI‑designed synthetic enhancers)
- Nature (research paper: CLASSIC platform for ultra‑high‑throughput genetic circuit mapping)
- npj Biomedical Innovations (analysis of AI–synthetic biology convergence)
- Centre for Genomic Regulation (CRG), Barcelona
- Rice University Synthetic Biology Institute
- Pompeu Fabra University (UPF)
Comments
No comments yet. Be the first!