8 мая 2025 года группа исследователей из Centre for Genomic Regulation в Барселоне опубликовала в журнале Cell статью, демонстрирующую, что система искусственного интеллекта способна проектировать короткие синтетические регуляторные последовательности ДНК, которые действуют как специфичные для определенных типов клеток переключатели внутри здоровых клеток млекопитающих. Менее чем через год другая группа из Rice University объявила в журнале Nature о взаимодополняющем достижении — экспериментальной платформе под названием CLASSIC, которая картирует миллионы полных генетических цепей в соответствии с клеточными результатами и передает эти данные моделям машинного обучения, чтобы те могли предсказывать функции в огромном неизученном пространстве вариантов дизайна. Вместе эти работы знаменуют стремительный сдвиг: алгоритмическое воображение последовательностей ДНК переходит от игрушечных примеров к реальным молекулам, которые надежно изменяют активность генов в живых клетках, а промышленность и регуляторы спешат адаптировать производство и надзор к новым реалиям.
Новый класс синтетических энхансеров
В статье в Cell группа из Барселоны описывает генеративный ИИ, обученный на огромном массиве данных о том, как короткие фрагменты ДНК — энхансеры — влияют на экспрессию генов в ходе развития клеток крови. Энхансеры — это некодирующие участки ДНК, которые привлекают факторы транскрипции и определяют, когда и где будут экспрессироваться гены. Команда CRG синтезировала более 64 000 вариантов, предназначенных для проверки комбинаций и расположения мотивов связывания для десятков факторов транскрипции, а затем измерила их активность на нескольких стадиях гемопоэза. На основе этих данных модель выучила правила проектирования и предложила последовательности, которые никогда не существовали в природе, но вели себя в соответствии с замыслом при введении в первичные клетки-предшественники крови мышей: одни работали как плавные регуляторы, другие демонстрировали почти бинарное поведение «вкл/выкл», а многие показали поразительную специфичность к типу клеток.
Масштабные библиотеки и картирование генетических цепей с помощью CLASSIC
Платформа CLASSIC выявила два практических урока для проектировщиков. Во-первых, генетические цепи часто не являются задачами с единственным решением — множество различных конструкций могут обеспечивать один и тот же результат, что дает инженерам гибкость в выборе между надежностью, силой и затратами ресурсов. Во-вторых, детали средней силы часто превосходят экстремальные компоненты; иными словами, в биологии существуют свои «зоны Златовласки» (оптимальные диапазоны). Важно отметить, что технологический процесс был подтвержден путем синтеза и тестирования предсказанных конструкций: десятки выбранных ИИ цепей совпали с лабораторными показателями, что доказывает способность моделей к обобщению за пределами обучающих выборок, если эти выборки велики и тщательно измерены.
От проектирования in silico к живым клеткам
Обе линии работ подчеркивают важность тесно связанного цикла «проектирование — сборка — тестирование». В Барселоне ИИ предлагает короткие последовательности энхансеров; исследователи синтезируют эти фрагменты длиной 250 оснований, упаковывают их в средства доставки и вводят в живые клетки млекопитающих для считывания активности в различных состояниях клеток. В Хьюстоне и в партнерских лабораториях стратегия CLASSIC создает библиотеки полных цепей, считывает результаты в тысячах или миллионах клеток и возвращает эти данные модели машинного обучения, которая рекомендует следующий раунд кандидатов.
Практический итог заключается в скорости и креативности. Там, где классическая генетическая инженерия требовала месяцев итеративной отладки и экспертной интуиции, ИИ в сочетании с массово-параллельными измерениями позволяет командам исследовать комбинаторные пространства в масштабах, которые ранее были невозможны. Это ускоряет поиск функциональных ДНК-переключателей для терапевтических промоторов, кассет экспрессии с ограничением по клеточной линии и более сложных логических вентилей в клетках.
Производство на скорости ИИ: бесклеточный синтез и цепочки поставок
Проектирование опережает предложение, если синтез и производство не поспевают за ним. Промышленные группы и некоторые стартапы уже адаптируются: рабочие процессы бесклеточного синтеза ДНК, которые собирают линейные шаблоны, готовые к ИВТ (in vitro транскрипции), без клонирования в бактериях, устраняют источники загрязнения (эндотоксины, ДНК хозяина) и позволяют избежать проблем с рекомбинацией, которые делают длинные гомополимеры, такие как кодируемые поли(A)-хвосты, нестабильными в плазмидах. Эти преимущества важны для циклов ИИ, поскольку модели быстро итерируют и требуют множества различных индивидуальных шаблонов в сжатые сроки.
Бесклеточные шаблоны также снижают вариативность длины поли(A)-хвоста и целостности последовательности на последующих этапах, улучшая воспроизводимость продуктов транскрипции in vitro. Когда ИИ предлагает сотни или тысячи последовательностей-кандидатов, быстрая и удобная для автоматизации цепочка поставок, обеспечивающая синтез, контроль качества и шаблоны для ИВТ, становится критическим звеном — и это означает, что компании, контрактные производители и академические центры перестраиваются на бесклеточные подходы, чтобы соответствовать темпам вычислений.
Области применения, ограничения и первые барьеры
Однако существуют реальные ограничения. Регуляторный геном огромен и зависит от контекста: в исследовании CRG был профилирован лишь подмножество факторов транскрипции и клеточных состояний, а демонстрации CLASSIC в Rice University проводились на модельных клеточных линиях для подтверждения концепции. Перенос последовательности, которая работает в чашке Петри, в безопасный, долговечный и эффективный терапевтический препарат для человека потребует обширной доклинической валидации. Модели лучше всего обобщают данные, когда обучающая выборка отражает целевой контекст; пробелы в обучающих наборах остаются основной причиной неудач.
Риски, управление и человеческий контроль
Быстрое проектирование и дешевый синтез порождают вопросы безопасности и управления, над которыми сообщество синтетической биологии бьется уже много лет. В обзоре в npj Biomedical Innovations это было сформулировано как проблема конвергенции: ИИ снижает технический порог для сложной биоинженерии, в то время как автоматизированные лаборатории и недорогой синтез масштабируют возможности и распространение. Эта комбинация расширяет как полезную доступность, так и риск двойного назначения.
В недавних комментариях и программных работах выделяются три приоритета управления. Во-первых, объяснимость и аудит для моделей и процессов проектирования: непрозрачные рекомендации «черного ящика» сложнее оценить на предмет ошибок или злоупотреблений. Во-вторых, контроль с участием человека в критических точках принятия решений — проверка любой последовательности, предназначенной для выпуска в биологические системы, экспертами и с помощью функциональных тестов. В-третьих, меры в цепочке поставок и стандарты скрининга последовательностей для обнаружения конструкций, которые могут обеспечить вредоносные функции, даже если они являются новыми. Национальные усилия по расширению скрининга синтеза нуклеиновых кислот свидетельствуют о том внимании, которое политики теперь уделяют этим технологиям.
Наука движется быстро, и на данный момент разумный путь сочетает энтузиазм по поводу возможностей ИИ с осознанными, прозрачными практиками для ограничения рисков, документирования происхождения и сохранения человеческого суждения там, где это важнее всего.
Источники
- Cell (научная статья о синтетических энхансерах, спроектированных ИИ)
- Nature (научная статья: платформа CLASSIC для сверхвысокопроизводительного картирования генетических цепей)
- npj Biomedical Innovations (анализ конвергенции ИИ и синтетической биологии)
- Centre for Genomic Regulation (CRG), Барселона
- Rice University Synthetic Biology Institute
- Pompeu Fabra University (UPF)
Comments
No comments yet. Be the first!