AI 设计病毒:速度与风险

遗传学
AI-Designed Virus: Pace and Peril
据报道,一种由 AI 设计的噬菌体让公众意识到计算技术生成新型基因组的速度之快,并再次引发了关于生物安全、双重用途和治理的辩论。

一项实验与一个头条新闻

本周,一个戏剧性的报道出现在了两个快速发展的领域的交汇点:人工智能与合成生物学。据 2026 年 2 月 5 日报道并追溯至 2026 年 1 月 26 日的活动,研究人员利用一个名为 Evo2 的 AI 系统,据称提示该模型“设计一种病毒”,随后打印出生成的 DNA,并在实验室中观察到了具有活性的生物构建体。这一事件——在新闻报道和相关预印本中有所总结——是 AI 设计病毒凸显速度的一个明显例子,以及为什么这种速度对于创新和安全都至关重要。

这项工作是如何报道的以及哪些已得到验证

公众叙事结合了三类材料:关于 Stanford/Genyro 团队工作的媒体报道、关于生成式噬菌体设计的 bioRxiv 预印本,以及长期以来关于蛋白质和基因组设计 AI 工具的科学文献。综合来看,这些资料表明,研究小组目前正在利用大型生物数据集和生成式模型来提出数据库中以前不存在的序列。但这里存在重要的警示:媒体总结并非经过同行评审的验证;预印本是初步的;在科学界确认有关该序列如何创建、是否真正是从头开始(de novo)以及哪些措施证明了其“活性”的说法之前,还需要独立的重复实验和完整的方案披露。

AI 设计的病毒凸显速度——速度、规模与双重用途风险

将这一事件与早期里程碑区分开来的是设计时间线的压缩。能够读取大量基因组并学习序列与功能关系的 AI 工具可以在数小时内提出候选序列。研究人员指出,AI 将疫苗或药物先导物的时间线从数月缩短至数天;生成式模型现在能够以任何人类团队都无法手动扫描的规模探索序列空间。这种能力奠定了合理的希望——更快的应对措施、用于治疗抗生素耐药性感染的定制噬菌体以及更高效的工业酶——但它也缩短了治理、监管和技术保障措施发挥作用的窗口期。

双重用途问题是核心:能够提出更好地杀死细菌菌株的噬菌体的相同算法,也可能被误导去产生增强宿主范围、致病性或环境稳定性的设计。计算速度放大了经典的双重用途难题,因为数字设计具有便携性,并且通常可以通过现成的 DNA 合成、自动克隆和台式机器人进行复制。

“AI 设计的病毒”究竟意味着什么?

“AI 设计的病毒”是计算流程的简写,该流程提出的核酸序列被预测能够以指定方式折叠、表达和相互作用。现代模型——从蛋白质结构预测器到 DNA 语言模型——从数万亿个序列片段中学习统计关系。随后,生成式模型可以在计算机模拟(in silico)中采样,使所需特性最大化。但设计只是第一步。将一串字母变成具有传染性或功能的生物颗粒需要组装(合成并连接 DNA)、合适的宿主或包装系统、调节元件(启动子、终止子、包装信号)以及仔细的表型测试。简而言之:一个看似合理的序列并不等同于一个自动运行的病原体;在字节与生物学之间仍存在许多技术障碍,然而随着合成、自动化和 AI 的共同进化,这些障碍正在瓦解。

AI 如何加速合成生物学

AI 在多个步骤上加速了合成生物学。判别模型从序列预测结构(AlphaFold 及其后续产品显著改善了蛋白质折叠预测),而生成式模型则提出新的氨基酸序列或全基因组。结合自动化构建-测试循环的机器人实验室,这些模型可以以更少的人力投入驱动“设计-构建-测试-学习”循环。在基因组上训练的语言模型方法可以识别调节基序、设计启动子,或建议具有定制特性的完整病毒基因组。《自然》(Nature)杂志关于 AI 与合成生物学融合的综述指出,这并非假设:自主或半自主流程已经在优化代谢途径、酶活性和治疗构建体,且发展轨迹指向能力更强的系统。

风险、局限性以及为何背景至关重要

技术限制缓解了但并未消除风险。创造一个能在人类中复制、传播或致病的媒介涉及生物学约束,这些约束并不能通过更好的序列被轻易绕过:宿主特异性、免疫反应和生态动力学都至关重要。尽管如此,看似合理的设计门槛降低——再加上全球范围内可获得的合成服务、更便宜的测序和远程实验室服务——增加了意外或蓄意滥用的机会。

模型失效是另一个风险。AI 系统可能会产生生物学上不可能实现的基序幻觉,或对训练偏见产生过拟合。不透明的模型使得预测故障模式变得困难。当模型的输出在没有经过彻底实验验证和人类判断的情况下就被付诸实施时,这些弱点最为致命。

AI 设计的病毒凸显速度——现有的保障措施及缺失之处

一些保障措施已经到位:商业 DNA 供应商通常会根据整理好的危险序列名单筛选订单,并维持客户审查。美国科学和技术政策办公室(OSTP)和其他机构已经发布了核酸筛选和供应商最佳实践的框架和指南。专业规范、机构生物安全委员会和资助条件也设立了检查点。

但这些保护措施存在漏洞。基于序列的筛选在处理缺乏已知威胁同源性的新型设计时非常吃力;自动化流程可以绕过人类监管;且许多供应商和用户在受监管环境之外运行。《自然》分析主张采取技术、政策和文化措施相结合的方式:更强大、标准化的筛选(包括功能感知工具)、自动化湿实验室的强制性日志记录和审计、人机协同(human-in-the-loop)检查点、模型可解释性以及 AI 系统的红队测试。国际协调至关重要,因为信息和材料跨越国界的速度超过了法规演进的速度。

平衡创新与安全

潜在的益处是巨大的。生成式设计可以为耐药性感染提供定制噬菌体,在疫情爆发时加速疫苗设计,并加快用于可持续制造的酶的部署。挑战在于如何在降低风险的同时保留这些益处。合理的措施包括要求联邦资助的实验室对 DNA 订单进行溯源和筛选,资助对高影响力主张进行独立验证和重复实验,在涉及安全的情况下强制要求提供模型和训练数据的文档,并投资于能够揭示驱动设计的变量的可解释 AI 方法。

同样重要的是社会措施:开展双重用途意识方面的劳动力培训、建立透明的报告渠道,以及包括科学家、伦理学家、工业界和公民社会在内的多方利益相关者治理。这些机制有助于确保人类判断始终是关键决策的一部分,而不是将其完全委托给不透明的系统。

接下来的关注点

来自研究团队的后续报告、独立实验室的重复实验以及经过同行评审的出版物将是短期内最重要的信号。监管机构和合成供应商也将是关键角色:筛选规则、采购政策或强制性日志记录的变化将表明政策维度的严肃回应。最后,该领域的发展轨迹将取决于自主实验室和完全生成式设计流程成熟的速度——以及治理是否能以类似的速度进化。

Evo2 事件及时提醒我们,计算能力已经改变了生物学的节奏。现在的问题不在于 AI 是否会编写生物代码,而在于社会将如何管理一个它能比以前更快做到这一点的世界。

来源

  • npj Biomed. Innov. (Nature 手稿:"The convergence of AI and synthetic biology: the looming deluge")
  • Stanford University / Genyro (关于生成式噬菌体设计的研究报告和预印本)
  • bioRxiv 预印本仓库 (关于新型噬菌体生成式设计的预印本)
  • 美国科学和技术政策办公室 —— 核酸合成筛选框架
  • 美国国家科学、工程和医学院 (关于生物防御和合成生物学的报告)
Wendy Johnson

Wendy Johnson

Genetics and environmental science

Columbia University • New York

Readers

Readers Questions Answered

Q 什么是AI设计的病毒,它与合成生物学有何关系?
A AI设计的病毒(例如 Evo-Φ2147)是使用 Evo 2 等生成式 AI 模型从零开始创建的完全合成的噬菌体基因组。该模型生成了 285 个完整的病毒基因组,并在实验室测试中成功感染并杀死了大肠杆菌。它与合成生物学的关系在于,它展示了功能性基因组的从头设计(de novo)工程,将该领域从修改天然序列推进到通过计算设计新型生命形式。这标志着实验室设计生命的一个里程碑,是在 2003 年 phiX174 基因组化学合成等历史性合成生物学成就的基础上实现的。
Q 人工智能如何加速合成生物学的研究进程?
A 人工智能通过使用 Evo 1 和 Evo 2 等基因组基础模型来加速合成生物学研究。这些模型在噬菌体基因组上进行训练,能够预测遗传变化、生成新的 DNA 序列,并快速设计整个功能性基因组,而无需依赖反复试验的实验室工作。这些模型内化了分子相互作用,能够创建在感染细菌方面表现优于天然病毒的优化病毒,从而有可能将数年的研究缩短为基于提示的设计,随后进行实验室验证。这显著加快了“设计-构建-测试-学习”(Design-Build-Test-Learn)循环。
Q 合成生物学中 AI 的潜在风险和伦理问题有哪些?
A 潜在风险包括误用 AI 来设计具有增强毒力或传播性的自我复制生物制剂,这可能会降低制造危险病原体的门槛,尽管目前的模型尚不具备设计复杂流行潜力病毒所需的保真度。伦理问题涉及生物安全事故、蓄意武器化以及研究速度超过监管审查,这引发了关于双用途研究的问题——此类研究既可以通过噬菌体疗法对抗抗生素耐药性,也可能造成危害。目前,生物学数据和机制理解方面的局限性在一定程度上缓解了高度危险制剂的从头设计风险。
Q 目前有哪些保障措施和法规来防止 AI 设计的生物制剂被误用?
A 为了防止误用,研究人员限制了完整 AI 模型权重和数据的发布,同时以预印本的形式发布方法论以供科学交流。现有的生物安全协议要求在受控的实验室环境中进行合成和测试,更广泛的法规涵盖了“设计-构建-测试-学习”循环,以降低处理合成制剂的风险。然而,专门针对 AI 设计生物学的全面全球法规仍不完善,各界纷纷呼吁加强对双用途能力的监管。
Q 科学家如何平衡合成生物学的创新与生物安全及生物保卫?
A 科学家可以通过在封闭环境中进行研究、限制敏感模型数据的公开披露以及优先考虑有益应用(如针对抗生素耐药细菌的噬菌体疗法)来平衡创新与生物安全。AI 开发人员、生物学家和决策者之间的合作对于制定前瞻性法规至关重要,这些法规既能应对双用途风险,又不会阻碍进步。通过实验室测试进行的迭代验证可确保功能性,同时通过监测意外后果来维护生物保卫。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!