Spirit AIがRoboArenaでNvidiaを撃破 — 驚きの勝因はコンピューティング性能にあらず

ロボティクス
Spirit AI beat Nvidia on RoboArena — but the surprise advantage wasn’t compute
今週、Spirit AIの「Spirit v1.6」がRoboArenaのリーダーボードで首位に立ち、Nvidiaの「Cosmos3」を王座から引きずり下ろした。この結果は、中国のデータ戦略、政策、そして産業の「プレイブック」が、米中技術戦争におけるロボティクス分野の勢力図をいかに塗り替えているかを浮き彫りにした。

米中ハイテク戦争:中国Spirit v1.6とRoboArenaでの波乱

Nvidiaが「Cosmos 3」を発表してから2日後、杭州の小さなスタートアップが、重役室のモニターを注視させるようなスコアを公開した。Spirit AIの「Spirit v1.6」は、ロボット工学のベンチマークである「RoboArena」で1,924点を記録し、1,881点のNvidia「Cosmos3-Nano-Policy」を僅差で上回った。同社は同時に15億元(約2億2,200万米ドル)の資金調達ラウンドを発表した。数字だけ見れば見出しは単純だが、実際にはこの衝突により、米中ハイテク戦争の現状におけるロボット工学の優位性がどこにあるのか、再考を迫られる事態となっている。

RoboArenaが重要なのは、汎用的なロボットのポリシーが、ランダム化された敵対的環境において、認識と計画を現実世界の動きにどれだけうまく変換できるかをテストするからだ。このベンチマークは学術界の多大な協力を得て構築されており、開発協力者にはスタンフォード大学やカリフォルニア大学バークレー校(UC Berkeley)の名が連なっている。しかし、リーダーボードの単一の数値からは、それを生み出したサプライチェーン、規制、データといった動的な背景は見えてこない。そして、そうした舞台裏の要素こそが、現在中国が最も強みを発揮している領域なのだ。

ベンチマークでの勝利が技術的イベントであると同時に政治的イベントである理由

RoboArenaのようなベンチマークはポリシーアーキテクチャを比較するのには有用だが、それがすべてではない。リーダーボードは、厳格な過学習防止策を用いながら、多くのシミュレートされたタスク全体で観測を堅牢なアクションに変換するモデルを評価する。とはいえ、性能向上はモデルのアーキテクチャ、より優れた合成データや現実世界のトレーニングデータ、巧妙なドメインランダム化、あるいは限られた計算資源から最大限の成果を引き出すための目標を絞ったエンジニアリングなど、いくつかのルートから生まれる可能性がある。Spiritの台頭は、単なる最高級GPUへのアクセスではなく、積極的なデータ収集、実利的なモデルエンジニアリング、そして資金調達の猛ラッシュの組み合わせによるもののように見える。

この組み合わせ自体が政治的なものだ。NvidiaはRoboArenaの設計を支援し、その後Cosmos 3をそのリングに投入した。Spiritの勝利は、エンボディドAI(身体性AI)の競争が、純粋なチップの馬力による勝負を超え、データ規模、タスクの網羅性、展開パイプラインが少なくとも同等に重要視される領域へと移行したことを示している。地政学のウォッチャーにとって、これは重要だ。米中競争における影響力の所在を変化させるからである。

米中ハイテク戦争:中国の構造的な強み — データ、工場、そして国家資本

中国がロボット工学AIにもたらす最も明白な優位性はデータである。業界関係者や幹部は、物理AIにとって「データこそが最も困難な課題である」と繰り返し述べてきた。NvidiaのCEO自身も最近の発表でその点を強調している。中国では、地方自治体が中央集権的なロボット工学データの収集を静かに支援しており、それは時に「データ工場」と表現される。これにより、操作、ナビゲーション、人間との対話タスクを訓練するための、キュレーションされラベル付けされたストリームを産業規模で生成できる。

中国はロボット用AIハードウェアおよびソフトウェアでNvidiaとどう競合しているか

チップ輸出規制に対する中国の対応は、二面性を持っている。HuaweiやBaiduのような企業は、ますます高性能化する国内製アクセラレータを出荷している(Huaweiの「Ascend」ファミリーやBaiduの「M100」チップは、外国製GPUへの依存を減らすために明示的に設計された)。これがNvidiaのトップクラスのデータセンター用GPUと同等であるとはまだ言えないが、多くのロボット工学のワークロードにおいてはその差は縮まっている。ロボット工学のワークロードでは、純粋なスループットよりも、レイテンシ、決定論的動作、電力効率が優先されることが多いためだ。

ロボット開発者にとって、新しい中国製プロセッサは魅力的だ。コストが低く、現地のクラウドスタックと統合でき、地元で容易に入手可能な大規模データセットと組み合わせることができる。また、それらは異なるソフトウェアエコシステムやツールチェーンを伴うため、CUDAやNvidiaのSDKに慣れたチームにとっては移行や検証のコストが課題となる。実際には、多くのロボット開発者は混在した環境で運用することになるだろう。つまり、重いオフライン学習にはNvidiaを使用し、コストとレイテンシが最も重要となるエッジでの推論やクローズドループ制御には、現地のアクセラレータを使用するという形だ。

これがNvidiaのロードマップとロボット顧客にとって意味するもの

Nvidiaの対応は予想通り、エンボディドAIに最適化されたパートナーシップと製品ラインへの注力であった。Cosmos 3はこの転換を念頭に置いて設計されており、最近のUnitreeやSharpaとの協力発表は、シミュレータ、モデル、ハードウェアにまたがるエコシステムに開発者を囲い込もうとする動きを示している。しかし、今回のようなリーダーボードでの敗北は、純粋なFLOPs(浮動小数点演算性能)だけでなく、ソフトウェアの堅牢性と開発者の人間工学(使いやすさ)を重視するようNvidiaを促すだろう。

ヨーロッパやドイツの企業にとって、この選択は技術的なものであると同時に戦略的なものでもある。「EU半導体法(EU Chips Act)」やドイツの産業政策は、特定の単一サプライヤーへの過度な依存を防ぎつつ、最先端のツールへのアクセスを確保することを目的としている。つまり、Nvidiaを標準とするか、コスト上の理由から中国の現地アクセラレータを採用するか、あるいはハイブリッドなパイプラインを設計するかといった調達の意思決定は、今後ますます政治的かつ技術的な判断となる。

ロボット工学向け次世代AIアクセラレータを形成している中国企業はどこか

有名企業以外にも、中国のエコシステムは幅広い。Huaweiのような家庭でも知られる企業がハイエンドのアクセラレータを開発している一方で、Baiduはチップの製造と自社のクラウドおよび自律走行スタックとの統合の両方を行っている。スタートアップや国立研究所もニッチな分野を埋めている。ある企業はロボットアームの低電力推論に、別の企業は高密度な3D点群のための高速化された認識ネットワークに注力している。その結果として、安価な現地製シリコンと豊富なデータを組み合わせることで、より低い価格帯で競争力のあるロボット工学スタックを生み出せる、階層化されたサプライチェーンが構築されている。

この競争こそが、現場の担当者が知っておくべきことだ。中国製シリコンは、まだすべてのNvidiaワークロードの代替品にはなり得ない。しかし、多くのエンボディドAIシステムを定義する認識、制御、シミュレーションの組み合わせにおいて、それはしばしば「十分な性能」であり、規模を拡大した際にははるかに安価になる。

ロボット工学のベンチマーク結果をどう判断するか(そしていつ懐疑的になるべきか)

リーダーボードは最適化を促進する。優れたチームは汎用性の高いモデルを構築するが、賢いチームはテストに向けて調整を行う。RoboArenaの設計者は、ランダム化されたタスク、敵対的なシーン、過学習防止策などを導入し、ベンチマークを堅牢にしようと試みた。しかし、いかなるベンチマークも、展開に伴うコスト、安全性、規制上の複雑な課題を完全には再現できない。Spiritの勝利は重要な技術的指標ではあるが、工場、病院、公道への展開には、スコアには反映されないソフトウェア検証、規制遵守、サプライチェーンの保証が求められる。

これは、EUの調達担当者やドイツの産業用ロボットインテグレーターにとって特に重要だ。ベンチマークの最高スコアは、安全認証、長期的なメンテナンス計画、あるいは安全なハードウェアサプライチェーンの代わりにはならない。

中国製アクセラレータとNvidiaの選択に迫られるロボット開発者への実践的アドバイス

第一に、リスクを棚卸しすること。製品が西側の防衛や輸出管理の制約を満たさなければならない場合、NvidiaやTSMCで製造されたGPUの使用が必須となる可能性がある。第二に、ワークロードをプロファイリングすること。制御ループにミリ秒単位の決定論的な動作と低電力が求められるなら、現地のアクセラレータの方が安価で、十分に事足りる可能性がある。第三に、移植性を計画すること。抽象化レイヤー、コンテナ化された推論スタック、ハードウェアに依存しないMLOpsを使用することで、供給や政策が変更された場合にモデルを再ターゲットできるようにしておくこと。

最後に、トレーニングデータがどこから来ているかを考慮すること。中国でホストされている大規模な独自データセットや、中国のデータを使用するサードパーティのサービスに依存している場合、データアクセスとローカライゼーションをめぐる地政学的要因が、将来的にモデルを再現性を持ってトレーニングおよび維持する能力に影響を与える可能性がある。

なぜヨーロッパは気にかけるべきか(そして何に対してまだ影響力を行使できるか)

ヨーロッパは、精密ツールから専門的なセンサーに至るまで、世界の半導体および製造というパズルの重要な部分を供給しており、ドイツのエンジニアリングは依然として高付加価値ロボット工学の中核を担っている。しかし、ヨーロッパの政策的な対応は、中国の国家主導のアプローチと比較して慎重である。EU半導体法はブリュッセルに対し、生産能力とレジリエンスを補助するための手段を提供しているが、それだけでは中国が現在活用しているようなデータパイプライン、ベンチャー資金による急速なイテレーションサイクル、あるいは規制のスピードを即座に生み出すことはできない。

ヨーロッパがロボット工学において意味のある産業主権を望むのであれば、政策立案者はハードウェア補助金と並行して、共有の現実世界データ収集への投資、エンボディドシステムをテストするための寛容な規制サンドボックス、そして国境を越えた供給の回復力のためのより明確な調達戦略を整備する必要がある。そうでなければ、ヨーロッパはエンジニアは抱えたままで、高利益率のユースケースを、より安価でより良いデータを持つ既存勢力に奪われることになるだろう。

SpiritのRoboArenaでの勝利は、競争の枠組みを再定義したため重要である。「米中ハイテク戦争:中国フェーズ」は、誰が次世代LLMを設計するか、誰がファブ(工場)を支配するかということだけではない。機械に現実世界で動くことや働くことを教えるという、厄介でコストのかかるビジネスを誰が所有するかという争いでもある。そのビジネスは、計算能力と同じくらい、データ、展開パイプライン、そして忍耐強い国家資本に報いるものである。

要するに、Spiritは魔法のアルゴリズムだけでNvidiaを「打ち負かした」わけではない。資金、データ、そしてロボットをトレーニング装置に変える国家エコシステムを使ってそれを成し遂げたのだ。Nvidiaは依然として大規模なトレーニングジョブの基盤となるチップを販売しているが、応用ロボット工学の戦場はGPUよりも広く、それこそが注目すべき変化である。

ヨーロッパにはエンジニアがいる。彼らに昼食代を支払う誰かを選びさえすればいい。

ソース

  • RoboArena(スタンフォード大学およびカリフォルニア大学バークレー校との共同開発ベンチマーク)
  • 北京大学(BigAI研究所および関連研究)
  • 中華人民共和国工業情報化部(低空経済および産業AIに関する政策プラン)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Spirit v1.6とNvidiaのCosmos3-Nano-PolicyはRoboArenaでどのようなスコアを記録しましたか?また、Spiritはその結果と併せてどのような資金調達を発表しましたか?
A Spirit v1.6はRoboArenaで1,924を記録し、1,881のCosmos3-Nano-Policyを僅差で上回りました。Spiritはこれと同時に、約2億2,200万米ドルに相当する15億元の資金調達ラウンドを発表し、リーダーボードでの躍進と並行して大幅な資金調達を推し進めていることを示しました。
Q RoboArenaが米中の技術競争において政治的に重要だと考えられているのはなぜですか?
A RoboArenaは、ロボットのポリシーがいかにして観測結果をランダム化された敵対的タスクにおける堅牢なアクションへと変換できるかをテストするもので、単なる計算能力よりもデータの規模と展開パイプラインを重視します。この記事では、今回の結果が中国の優位性を形作るサプライチェーンやデータダイナミクスといった舞台裏の要因を反映していると指摘しています。
Q この記事によると、中国はロボット工学のAIにおいてどのようなデータ関連の利点を持っていますか?
A この記事は、データを中国の最も明白な利点として挙げています。政府が中央集権的なロボットデータ収集や、マニピュレーション、ナビゲーション、人間との対話タスクを産業規模で学習させるためのキュレーション済み・ラベル付きストリームを生成する「データ工場」を密かに支援しています。また、これらは外国製GPUへの依存を減らすための国内生産アクセラレータによって補完されています。
Q Nvidiaは中国製アクセラレータの台頭とRoboArenaの結果を受けて、どのように適応していますか?
A Nvidiaは、具現化されたインテリジェンス(Embodied Intelligence)に向けたパートナーシップと製品ラインを強化しています。Cosmos 3は、UnitreeやSharpaとの協力関係を通じて、シミュレータ、モデル、ハードウェアにわたるエコシステムへと開発者を囲い込んでおり、同社は純粋なFLOPS(計算能力)だけでなく、ソフトウェアの堅牢性と開発者のエルゴノミクスを強調しています。
Q どの機関がRoboArenaの設計に貢献しましたか?
A RoboArenaはかなりの学術的知見を取り入れて構築されており、スタンフォード大学やカリフォルニア大学バークレー校が共同開発者に名を連ねています。これは、ランダム化された敵対的環境において知覚、計画、行動をテストするベンチマークの形成に、主要な大学が協力していることを示しています。

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!