一项实验与一个头条新闻
本周,一个戏剧性的报道出现在了两个快速发展的领域的交汇点:人工智能与合成生物学。据 2026 年 2 月 5 日报道并追溯至 2026 年 1 月 26 日的活动,研究人员利用一个名为 Evo2 的 AI 系统,据称提示该模型“设计一种病毒”,随后打印出生成的 DNA,并在实验室中观察到了具有活性的生物构建体。这一事件——在新闻报道和相关预印本中有所总结——是 AI 设计病毒凸显速度的一个明显例子,以及为什么这种速度对于创新和安全都至关重要。
这项工作是如何报道的以及哪些已得到验证
公众叙事结合了三类材料:关于 Stanford/Genyro 团队工作的媒体报道、关于生成式噬菌体设计的 bioRxiv 预印本,以及长期以来关于蛋白质和基因组设计 AI 工具的科学文献。综合来看,这些资料表明,研究小组目前正在利用大型生物数据集和生成式模型来提出数据库中以前不存在的序列。但这里存在重要的警示:媒体总结并非经过同行评审的验证;预印本是初步的;在科学界确认有关该序列如何创建、是否真正是从头开始(de novo)以及哪些措施证明了其“活性”的说法之前,还需要独立的重复实验和完整的方案披露。
AI 设计的病毒凸显速度——速度、规模与双重用途风险
将这一事件与早期里程碑区分开来的是设计时间线的压缩。能够读取大量基因组并学习序列与功能关系的 AI 工具可以在数小时内提出候选序列。研究人员指出,AI 将疫苗或药物先导物的时间线从数月缩短至数天;生成式模型现在能够以任何人类团队都无法手动扫描的规模探索序列空间。这种能力奠定了合理的希望——更快的应对措施、用于治疗抗生素耐药性感染的定制噬菌体以及更高效的工业酶——但它也缩短了治理、监管和技术保障措施发挥作用的窗口期。
双重用途问题是核心:能够提出更好地杀死细菌菌株的噬菌体的相同算法,也可能被误导去产生增强宿主范围、致病性或环境稳定性的设计。计算速度放大了经典的双重用途难题,因为数字设计具有便携性,并且通常可以通过现成的 DNA 合成、自动克隆和台式机器人进行复制。
“AI 设计的病毒”究竟意味着什么?
“AI 设计的病毒”是计算流程的简写,该流程提出的核酸序列被预测能够以指定方式折叠、表达和相互作用。现代模型——从蛋白质结构预测器到 DNA 语言模型——从数万亿个序列片段中学习统计关系。随后,生成式模型可以在计算机模拟(in silico)中采样,使所需特性最大化。但设计只是第一步。将一串字母变成具有传染性或功能的生物颗粒需要组装(合成并连接 DNA)、合适的宿主或包装系统、调节元件(启动子、终止子、包装信号)以及仔细的表型测试。简而言之:一个看似合理的序列并不等同于一个自动运行的病原体;在字节与生物学之间仍存在许多技术障碍,然而随着合成、自动化和 AI 的共同进化,这些障碍正在瓦解。
AI 如何加速合成生物学
AI 在多个步骤上加速了合成生物学。判别模型从序列预测结构(AlphaFold 及其后续产品显著改善了蛋白质折叠预测),而生成式模型则提出新的氨基酸序列或全基因组。结合自动化构建-测试循环的机器人实验室,这些模型可以以更少的人力投入驱动“设计-构建-测试-学习”循环。在基因组上训练的语言模型方法可以识别调节基序、设计启动子,或建议具有定制特性的完整病毒基因组。《自然》(Nature)杂志关于 AI 与合成生物学融合的综述指出,这并非假设:自主或半自主流程已经在优化代谢途径、酶活性和治疗构建体,且发展轨迹指向能力更强的系统。
风险、局限性以及为何背景至关重要
技术限制缓解了但并未消除风险。创造一个能在人类中复制、传播或致病的媒介涉及生物学约束,这些约束并不能通过更好的序列被轻易绕过:宿主特异性、免疫反应和生态动力学都至关重要。尽管如此,看似合理的设计门槛降低——再加上全球范围内可获得的合成服务、更便宜的测序和远程实验室服务——增加了意外或蓄意滥用的机会。
模型失效是另一个风险。AI 系统可能会产生生物学上不可能实现的基序幻觉,或对训练偏见产生过拟合。不透明的模型使得预测故障模式变得困难。当模型的输出在没有经过彻底实验验证和人类判断的情况下就被付诸实施时,这些弱点最为致命。
AI 设计的病毒凸显速度——现有的保障措施及缺失之处
一些保障措施已经到位:商业 DNA 供应商通常会根据整理好的危险序列名单筛选订单,并维持客户审查。美国科学和技术政策办公室(OSTP)和其他机构已经发布了核酸筛选和供应商最佳实践的框架和指南。专业规范、机构生物安全委员会和资助条件也设立了检查点。
但这些保护措施存在漏洞。基于序列的筛选在处理缺乏已知威胁同源性的新型设计时非常吃力;自动化流程可以绕过人类监管;且许多供应商和用户在受监管环境之外运行。《自然》分析主张采取技术、政策和文化措施相结合的方式:更强大、标准化的筛选(包括功能感知工具)、自动化湿实验室的强制性日志记录和审计、人机协同(human-in-the-loop)检查点、模型可解释性以及 AI 系统的红队测试。国际协调至关重要,因为信息和材料跨越国界的速度超过了法规演进的速度。
平衡创新与安全
潜在的益处是巨大的。生成式设计可以为耐药性感染提供定制噬菌体,在疫情爆发时加速疫苗设计,并加快用于可持续制造的酶的部署。挑战在于如何在降低风险的同时保留这些益处。合理的措施包括要求联邦资助的实验室对 DNA 订单进行溯源和筛选,资助对高影响力主张进行独立验证和重复实验,在涉及安全的情况下强制要求提供模型和训练数据的文档,并投资于能够揭示驱动设计的变量的可解释 AI 方法。
同样重要的是社会措施:开展双重用途意识方面的劳动力培训、建立透明的报告渠道,以及包括科学家、伦理学家、工业界和公民社会在内的多方利益相关者治理。这些机制有助于确保人类判断始终是关键决策的一部分,而不是将其完全委托给不透明的系统。
接下来的关注点
来自研究团队的后续报告、独立实验室的重复实验以及经过同行评审的出版物将是短期内最重要的信号。监管机构和合成供应商也将是关键角色:筛选规则、采购政策或强制性日志记录的变化将表明政策维度的严肃回应。最后,该领域的发展轨迹将取决于自主实验室和完全生成式设计流程成熟的速度——以及治理是否能以类似的速度进化。
Evo2 事件及时提醒我们,计算能力已经改变了生物学的节奏。现在的问题不在于 AI 是否会编写生物代码,而在于社会将如何管理一个它能比以前更快做到这一点的世界。
来源
- npj Biomed. Innov. (Nature 手稿:"The convergence of AI and synthetic biology: the looming deluge")
- Stanford University / Genyro (关于生成式噬菌体设计的研究报告和预印本)
- bioRxiv 预印本仓库 (关于新型噬菌体生成式设计的预印本)
- 美国科学和技术政策办公室 —— 核酸合成筛选框架
- 美国国家科学、工程和医学院 (关于生物防御和合成生物学的报告)
Comments
No comments yet. Be the first!