Spirit AI 在 RoboArena 击败 Nvidia——这场胜利在中美科技战中意味着什么

机器人技术
Spirit AI beat Nvidia on RoboArena — what that win really means in the US-China tech war
Spirit AI 的 Spirit v1.6 本周登顶 RoboArena 排行榜,击败了 Nvidia 的 Cosmos3。这一结果揭示了中国真正的优势所在——数据、规模和产业政策,同时也对机器人开发者和芯片供应链产生了深远影响。

在Nvidia发布Cosmos 3两天后,杭州的工程师们并没有在进行演示——他们正盯着基准测试排行榜上数字的变化。Spirit AI表示,Spirit v1.6在RoboArena上取得了1,924分,以微弱优势超过了Nvidia Cosmos3‑Nano‑Policy的1,881分。这次胜利是一个具体的细节,它打破了幻灯片所描绘的叙事:它是在公开场合发生的,是在与领先实验室共同开发的基准测试上测得的,而且Spirit在同一周还宣布了15亿元人民币的融资。这种性能与资本的结合向更广泛的中美科技战传递了一个明确而直白的信号:中国在具身智能(embodied AI)领域的领先地位,并没有西方许多人所假设的那样神秘,而是更加务实。

中美科技战:中国的机器人领域胜利在于数据,而不仅仅是GPU

Spirit在排行榜上的胜利回答了一个头条问题——中国是如何在这场竞争中击败Nvidia的?——其答案是操作性的,而非神秘的。Spirit并没有在超级计算机上投入比Nvidia更多的资金,而是开发出了一种在RoboArena的随机化、抗过拟合测试中表现更好的策略模型。关键因素在于获取多样化、大规模的机器人数据以及快速迭代周期:中国的公司正在工业规模上收集操作日志、多摄像头影像和机器人试验数据,并将它们反馈到基础模型中。当Nvidia和其他西方团队依赖昂贵的GPU算力和模拟保真度时,中国团队正利用现实世界的规模和更低的单位成本来缩小性能差距。

这对机器人开发人员来说意义重大。赢得RoboArena并不能立即创造出完美的仿人机器人,但它减轻了将模拟行为转化为复杂现实的工程负担。对于一个正在选择是授权外来策略栈、内部构建还是使用本地提供商的开发人员来说,Spirit的成果改写了计算方式:那些见过数十万次真实交互的模型将能以更少的微调进行适应,需要更少极其昂贵的模拟周期,并能将部署时间缩短数月。

中美科技战:中国的工业路线图——资金、工厂与监管

Spirit的成绩背后有一套清晰的工业路线图。该公司本周宣布了一轮重磅融资——15亿元人民币,这是资本向物理AI领域大规模进军的一部分。投资者和地方政府正在向能够展示具身能力的初创企业注资,市政激励措施正将廉价硬件、厂房和测试场与软件团队结合起来。这就是欧盟和美国在规模化复制方面一直难以实现的垂直整合环境。

监管也发挥了作用。中国的中央和地方政府在无人机、无人驾驶出租车和其他低空或城市系统的试点规则方面一直持务实态度。当美国的诉讼和碎片化的州规则减缓了现实世界中机器人的推广时,中国的监管机构往往优先考虑具有明确操作边界的快速试点。这缩短了基准测试成功与付费客户之间的转化时间——这种经济优势又转化为更多的数据、更多的边缘案例,从而造就了更强大的模型。

从欧洲的角度来看,这带来了压力。《芯片法案》和最近的欧盟资助计划旨在巩固半导体和AI供应链,但Spirit的胜利表明,差距不仅仅在于晶圆厂。这是一个系统性问题:资本流动、包容性的测试场以及工业生态系统都很重要。欧洲拥有工程深度;它所缺乏的是能够在城市和区域范围内协调激励措施的单一行政意志——而且它显然还没有选择好由哪个政府来承担风险。

基准测试机制:为何RoboArena对工程师和政策制定者很重要

但基准测试也是片面的。RoboArena的胜利标志着在一类通用任务(操作、导航、工具使用)方面已做好准备,但它并不能取代在硬件、安全验证和监管审批方面数月的整合工作。Nvidia在技术栈的许多部分仍占据主导地位:芯片设计、数据中心GPU和模拟工具。因此,Spirit的胜利与其说是击倒性的一击,不如说是一个拐点。

政策制定者应注意两点:第一,具身智能的瓶颈日益在于数据和整合能力;第二,针对GPU的出口管制虽然在一个领域直白有效,但并不能阻止通过不同手段实现的性能提升。这对西方政府如何制定工业政策产生了影响:扣留硬件可以减缓某些参与者的速度,但这也可能迫使竞争对手通过绕过限制来进行创新。

中国加速器与Nvidia GPU的对比——以及这对开发人员的重要性

关于中国AI加速器与Nvidia GPU如何对比的PAA问题,是务实且迫切的。高端Nvidia芯片在原始浮点吞吐量、内存带宽以及围绕CUDA的软件生态系统方面仍然是黄金标准。中国的加速器——华为的昇腾系列、百度的M系列芯片等——在持续吞吐量上正在追赶,并且在境内云端环境下运行成本往往更低。它们通常在绝对峰值性能和开发者工具的成熟度上落后,但通过更好的本地整合、监管清晰度和每训练小时的成本优势进行了补偿。

对于机器人开发人员来说,其含义显而易见:如果你的产品需要数月大规模模型训练中最后10%至20%的性能,Nvidia仍然是最快的路径。如果你的优先级是在流式真实世界数据上进行频繁再训练、降低云成本并更容易地在中国境内进行部署,本地加速器则越来越具有竞争力。Spirit的结果表明,巧妙的模型设计和丰富的主体数据可以抵消原始计算能力的不足——这提醒我们,芯片是必要的,但并非充分条件。

这次胜利对中美科技战意味着什么:战术转移,而非瞬间的支配地位

Spirit的排名在许多圈子里会被解读为一个地缘政治里程碑,但正确的解读更为微妙。美国在先进芯片设计、开发者生态系统和领先的LLM研究方面仍保持着实质性优势。中国在制造规模、实地数据收集以及将资本、测试场和监管机构对齐的单一工业政策方面拥有优势。这种划分——用一种流行的简写来说就是“大脑”与“身体”——随着双方相互借鉴战术,正在变得模糊。

对于全球机器人公司来说,新的现实将是混合式的:在软件和芯片能加速研发的地方采用西方工具链,在需要快速、经济高效地进行部署的地方利用中国的模型和数据集。对于政策制定者来说,教训是出口管制和制裁只是众多工具中的一种;长期的优势将取决于资金、标准,以及谁能赢得让机器人在现实世界中工作的复杂业务。

来源

  • RoboArena基准测试(Nvidia、斯坦福大学、加州大学伯克利分校)
  • Spirit AI(公司公告及融资轮次)
  • Nvidia(Cosmos 3及相关研究)
  • Manifold AI(WorldScape基准测试结果)
  • 台积电与ASML(半导体供应链背景)
  • 百度、华为(中国AI芯片及工业政策)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Spirit AI 在 RoboArena 中的得分是多少,这些分数意味着什么?
A Spirit AI 的 Spirit v1.6 在 RoboArena 中获得了 1,924 分,略高于 Nvidia 的 Cosmos3-Nano-Policy(1,881 分)。这次公开的基准测试获胜被视为美中技术竞争中的一个具体信号,表明中国在具身智能方面的优势是真实且可衡量的,而不仅仅是推测。
Q 除了原始算力之外,还有哪些因素促成了 Spirit AI 的优势?
A 文章指出,Spirit 并没有在超级计算机上投入比 Nvidia 更多的资金;相反,它构建了一个在 RoboArena 的随机防过拟合测试中表现更出色的策略模型。其关键因素在于获取了多样化、大规模的机器人数据——包括操作日志、多摄像头录像和大量的机器人试验——并将这些数据反馈到基础模型中,以提高真实环境下的性能。
Q Spirit 的胜出对机器人开发者和部署时间表有何影响?
A Spirit 的领先地位表明,在 RoboArena 中获胜可以减少将模拟行为转化为复杂现实环境所需的工程负担。这意味着所需的微调和昂贵的模拟周期可能会缩短几个月,因为在海量真实世界数据上训练的模型能够更快速地适应环境。开发者可以选择授权使用外国策略栈、内部自研或使用本地供应商,而 Spirit 的测试结果正在促使这一决策向数据驱动、更快速部署的方向转变。
Q Spirit 的测试结果揭示了关于美中科技战和产业政策的哪些信息?
A 文章将 Spirit 的得分视为更广泛产业蓝图的一部分:巨额融资(15亿元人民币)、将廉价硬件和测试平台与软件团队相挂钩的城市激励政策,以及加速试点项目的务实监管。它指出,资本、生态系统和快速实验可以超越单纯的晶圆制造优势,强调数据和集成才是关键瓶颈。
Q 中国国产加速器与 Nvidia GPU 相比如何?这对开发者意味着什么?
A 华为昇腾(Ascend)和百度 M 系列芯片等中国国产加速器在持续吞吐量方面正在赶超,且在国内云环境下的运行成本更低,但在峰值性能和成熟的开发者工具方面仍有差距。对于机器人开发者而言,这意味着 Nvidia 仍然是实现峰值训练的最快路径,而国产加速器在中国境内的日常重训练中则提供了成本和部署上的优势。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!