AI 智能体在科学工作流中媲美人类

Breaking News 科技
Close-up of a futuristic computer chip glowing with green digital DNA strands against a dark background.
4K Quality
在具有历史意义的布莱切利园峰会上受命编制的《2026年国际人工智能安全报告》标志着通用人工智能治理的一个关键时刻。这项由 Yoshua Bengio 和国际专家小组领导的综合研究表明,人工智能系统已达到一个门槛,能够在复杂的生物研究工作流中媲美人类的表现。

2026年国际人工智能安全报告:系统现已在生物研究领域比肩人类专家

根据具有里程碑意义的《2026年国际人工智能安全报告》,通用人工智能系统正式达到了在复杂生物研究工作流程中比肩人类表现的门槛。该研究在具有历史意义的布莱切利园(Bletchley Park)峰会期间受托开展,并由Yoshua Bengio领衔。研究显示,前沿模型现在能够在生命科学领域担任“共同科学家”。这一进步标志着技术能力的重大转变,使人工智能从简单的辅助工具转变为能够合成分子数据并加速病原体研究的高级智能体,而这类工作此前仅限博士级专家。

这项研究是由于前沿人工智能模型快速且往往不可预测的发展轨迹而变得必不可少。随着这些系统更深入地融入全球经济,代表布莱切利峰会的29个国家以及联合国(UN)、经合组织(OECD)和欧盟(EU)寻求对新兴风险达成明确的科学共识。通过综合100多位独立专家的证据,该报告为未来的监管提供了严谨的实证基础,从轶事证据转向了有据可查的人工智能能力和安全基准。

《2026年国际人工智能安全报告》中关于人工智能能力的主要发现是什么?

《2026年国际人工智能安全报告》发现,通用人工智能在生物研究方面已达到与人类专家同等的水平,并越来越多地被误用于犯罪活动。主要发现表明,23%的高性能生物人工智能工具具有极高的误用潜力,而人工智能生成的合成媒体正变得几乎与现实无异,对信息完整性和公共安全构成了重大威胁。

除了生物基准,报告还详尽地记录了通用人工智能在合成媒体创作中的崛起。包括Stephen CasperYi Zeng在内的专家贡献的研究结果显示,用于欺诈目的的文本、音频和视频生成已从理论风险转变为日常现实。研究指出,虽然通过分层深度防御策略,技术保障正变得更加强大,但老练的攻击者仍能以“中等偏高的比率”绕过这些缓解措施,因此有必要向更具韧性的安全架构转型。

对生物能力的评估尤为严峻。专家小组发现,人工智能模型现在可以辅助进行分子合成和识别新型病原体,其精准度可比肩人类研究人员。这种双重用途能力虽然在药物研发方面前景广阔,但对生命科学领域构成了前所未有的挑战,因为旨在治愈疾病的工具正在降低制造危险生物制剂的门槛。

根据报告,人工智能智能体能否执行端到端的科学工作流程?

虽然人工智能智能体在特定研究任务中已跨越专家门槛,但2026年的报告澄清,真正的端到端自主科学工作流程尚未完全实现。目前,人工智能充当的是“共同科学家”,擅长假设生成、复杂数据分析和实验设计,但这些系统在物理实验室执行和高层战略推理方面仍需要人类干预。

研究人员使用的方法涉及针对标准实验室协议和研究基准测试前沿人工智能模型。研究结果表明,虽然人工智能智能体可以设计复杂的实验并以类人的准确性预测结果,但整个科学过程的“闭环”自动化仍是一个新兴的前沿领域。Álvaro Soto和其他贡献者强调,目前的限制在于人工智能软件与物理机器人的集成,以及在现实生物环境中所需的细微故障排除。

尽管存在这些局限性,报告警告称差距正在迅速缩小。假设生成的自动化程度已经显著提升,使研究人员能够探索以前耗费大量人力的广阔化学和生物空间。这种能力表明,随着实验室机器人集成度的提高,向完全自主科学发现的过渡可能会比行业分析师此前预测的更早发生。

报告对网络安全和深度伪造中的人工智能有何论述?

报告记录称,人工智能生成的深度伪造日益真实且难以检测,其中针对女性的个性化深度伪造色情内容呈现上升趋势。在网络安全领域,犯罪集团和国家相关行为体正积极利用通用人工智能来增强网络钓鱼和社会工程攻击的规模及复杂性。

随着深度伪造成为虚假信息的主要工具,信息完整性正受到威胁。包括Gaël Varoquaux在内的专家小组指出,水印和检测人工智能生成内容的技术挑战仍然是一个主要障碍。由于检测工具往往滞后于生成模型,创作者与检测者之间的“军备竞赛”目前向合成媒体制作者倾斜,导致数字通信中出现“现实危机”。

在网络安全方面,报告强调了从手动利用向人工智能辅助漏洞发现的转变。虽然人工智能在实际执行零日漏洞利用中的作用目前被归类为有限,但其自动化网络攻击侦察阶段的能力使低技能行为体能够表现出高级持续性威胁(APT)的水平。系统性风险在于高水平黑客工具的民主化,这可能导致全球网络事件发生的频率呈指数级增长。

Yoshua Bengio及专家小组如何评估生物风险

对生物风险的评估是通过对实证数据和由Yoshua Bengio领导的红队演练进行严谨综合后得出的。专家小组发现,用于识别救命蛋白质折叠的相同模型可以被改用于识别有毒化合物或增强已知病原体的毒性,从而产生了一个目前缺乏全球缓解标准的“双重用途”困境。

Yoshua Bengio的领导下,专家顾问小组专注于通用模型的生物误用潜力。报告显示,在面对复杂的越狱技术诱导时,许多模型已经“忘掉”了安全过滤器,允许用户访问受限的生物协议。这一发现导致了加强“算力治理”的建议,并对任何在生命科学领域表现出高水平专业能力的模型实施强制性安全审计。

为了量化这些风险,研究人员开发了一套实证基准。这些指标显示,顶尖的人工智能模型可以为受控药剂的合成提供分步指导。专家小组强调,风险不仅仅是理论上的;曾经保护敏感生物数据的“知识壁垒”正在被削弱,因为人工智能可以轻松地将零散的信息合成为可操作的指令。

专家观点:Yoshua Bengio与基准测试科学

Yoshua Bengio强调,人工智能安全研究的快速轨迹必须跟上模型能力指数级增长的步伐。在他的评估中,2026年的报告充当了“科学北极星”,为政策制定者提供了必要的证据,使其能够从反应性措施转向能够经受住下一代模型发布的积极安全框架。

  • Yoshua Bengio强调了国际合作的必要性,以防止在安全标准上出现“竞相探底”的情况。
  • Gaël Varoquaux倡导开发开源、透明的基准,以确保安全评估不完全由私营公司控制。
  • 专家小组达成共识,认为“新兴风险”(如人工智能智能体中的自主目标设定)需要立即进行标准化监测。

专家的集体观点是,“黑箱式”开发的时代必须结束。通过在前沿人工智能模型的训练和部署阶段引入严谨的科学审查,专家小组旨在创造一种透明的文化。报告强调,如果没有这种透明度,国际社会就无法准确评估通用系统新能力突然涌现所带来的系统性风险

布莱切利授权与全球共识

这份报告的产生是布莱切利授权(Bletchley Mandate)的直接结果,这是一项由29个国家签署的将人工智能安全视为全球公共产品的协议。该授权确保了专家顾问小组保持独立于政治和商业影响,使100多位贡献者能够对人工智能安全技术的现状及其相关危险提供客观的看法。

报告背后的方法涉及多学科途径,结合了计算机科学、伦理学、生物学和政治科学。这种整体视角对于理解通用人工智能如何与复杂的社会和技术系统互动至关重要。联合国和经合组织的参与确保了研究结果适用于不同的监管环境,从高度监管的欧盟市场到快速发展的全球南方科技部门。

全球政策影响与人工智能治理的未来

《2026年国际人工智能安全报告》的发现预计将在经合组织(OECD)和欧盟内部引发新一轮监管活动。通过提供模型能力与生物误用之间明确的科学联系,该报告为监管机构提供了所需的证据,以要求对超过特定专家级门槛的系统进行更严谨的测试和“自毁开关”协议。

人工智能安全峰会系列的后续活动将把这份报告作为衡量进展的基准。对全球领导人而言,关键的启示是模型训练中国际透明度的必要性。随着人工智能继续向更自主的科学智能体演进,报告建议建立稳健治理的机会之窗正在缩小,这使得2026年的发现成为未来十年技术发展的关键路线图。

James Lawson

James Lawson

Investigative science and tech reporter focusing on AI, space industry and quantum breakthroughs

University College London (UCL) • United Kingdom

Readers

Readers Questions Answered

Q 根据该报告,人工智能代理能否执行端到端的科学工作流?
A 搜索结果中不包含关于人工智能代理是否能根据报告执行端到端科学工作流的具体信息。虽然有一个来源提到人工智能作为“共同科学家”在生物研究中跨越了专家门槛,但提供的摘要并未详细说明报告中关于完整科学工作流自动化的调查结果。
Q 报告关于网络安全和深度伪造(deepfakes)中的人工智能是如何表述的?
A 报告记录了人工智能生成的深度伪造正变得越来越逼真且更难识别,其中个性化的深度伪造色情内容不成比例地针对女性和女童。关于网络安全,报告指出犯罪集团和与国家相关的攻击者正在其行动中积极使用通用人工智能,尽管目前人工智能在这一领域的作用有限。
Q 《2026年国际人工智能安全报告》中关于人工智能能力的主要发现有哪些?
A 《2026年国际人工智能安全报告》综合了关于通用人工智能能力、新兴风险和安全措施的证据。主要发现包括:人工智能被越来越多地误用于生成文本、音频、图像和视频以进行犯罪活动;生物风险方面,23%的高性能生物人工智能工具具有极高的误用潜力;以及技术防护措施在分层部署时会变得更加稳健,尽管攻击者的成功率依然处于中等偏高水平。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!