Spirit AI, RoboArena에서 Nvidia를 제치다 — 놀라운 승부처는 연산 능력이 아니었다

로보틱스
Spirit AI beat Nvidia on RoboArena — but the surprise advantage wasn’t compute
Spirit AI의 Spirit v1.6이 이번 주 RoboArena 리더보드 정상에 오르며 Nvidia의 Cosmos3를 2위로 밀어냈다. 이번 결과는 중국의 데이터, 정책, 산업 전략이 미·중 기술 전쟁 속 로봇 공학 분야의 판도를 어떻게 재편하고 있는지 여실히 보여준다.

미-중 기술 전쟁: 중국 Spirit v1.6의 RoboArena 반란

Nvidia가 Cosmos 3를 공개한 지 이틀 후, 항저우의 한 소규모 스타트업이 이사회 모니터를 깜짝 놀라게 할 만한 점수를 발표했다. Spirit AI의 Spirit v1.6은 RoboArena 벤치마크에서 1,924점을 기록하며 Nvidia의 Cosmos3-Nano-Policy(1,881점)를 앞질렀고, 이와 동시에 15억 위안(약 2억 2,200만 달러) 규모의 투자 유치를 발표했다. 냉정한 수치로만 보면 헤드라인은 간단해 보이지만, 실제로는 이번 충돌로 인해 현재 미-중 기술 전쟁의 '중국 단계'에서 로봇 공학의 우위가 어디에 있는지를 재고하게 만든다.

RoboArena가 중요한 이유는 범용 로봇 정책이 무작위적이고 적대적인 환경 전반에서 인식과 계획을 어떻게 실제 세계의 움직임으로 전환하는지를 테스트하기 때문이다. 이 벤치마크는 스탠퍼드 대학교와 UC 버클리 등 학계의 상당한 기여를 받아 구축되었다. 그러나 단 하나의 리더보드 결과만으로는 이를 만들어낸 공급망, 규제, 데이터 역학을 파악할 수 없으며, 바로 그 이면의 요소들이 현재 중국이 가장 강력한 모습을 보이는 지점이다.

벤치마크 승리가 기술적 사건인 동시에 정치적 사건인 이유

RoboArena와 같은 벤치마크는 정책 아키텍처를 비교하는 데 유용하지만, 그것이 곧 운명을 결정짓지는 않는다. 리더보드는 엄격한 과적합 방지 조치를 사용해 관찰 내용을 다양한 시뮬레이션 작업 전반에 걸쳐 강력한 행동으로 변환하는 모델에 보상을 제공한다. 그럼에도 불구하고 성능 향상은 모델 아키텍처, 더 나은 합성 또는 실제 훈련 데이터, 영리한 도메인 무작위화, 또는 제한된 연산 자원에서 더 많은 것을 짜내기 위한 타겟팅된 엔지니어링 등 여러 경로를 통해 이루어질 수 있다. Spirit의 부상은 단순히 최고급 GPU에 대한 접근권 때문이 아니라, 공격적인 데이터 수집과 실용적인 모델 엔지니어링, 그리고 자금 지원의 결합으로 보인다.

이러한 결합 자체가 정치적이다. Nvidia는 RoboArena 설계를 도왔고, 그 후 Cosmos 3를 링 위에 올렸다. Spirit의 승리는 구현된 AI(Embodied AI) 경쟁이 단순히 칩의 마력을 넘어 데이터 규모, 작업 범위, 배포 파이프라인이 최소한 그만큼 중요한 영역으로 이동했음을 시사한다. 지정학적 관찰자들에게 이는 중요한 의미를 갖는다. 미-중 경쟁에서 레버리지가 어디에 있는지 그 위치를 바꾸기 때문이다.

미-중 기술 전쟁: 중국의 구조적 우위 — 데이터, 공장, 국가 자본

중국이 로봇 공학 AI 분야에서 가진 가장 명확한 우위는 데이터다. 업계 관계자와 경영진들은 물리적 AI에게 "데이터가 가장 어려운 문제"라고 반복해서 말해왔으며, Nvidia의 CEO 역시 최근 발표에서 이 점을 재차 강조했다. 중국에서는 시 정부와 성 정부가 조용히 중앙 집중식 로봇 공학 데이터 수집을 지원해 왔으며, 이는 때때로 '데이터 공장'으로 묘사되기도 한다. 이러한 공장들은 산업 규모로 조작, 내비게이션, 인간 상호작용 작업을 훈련하기 위한 큐레이션되고 라벨링된 데이터 스트림을 생산할 수 있다.

중국은 어떻게 로봇 공학용 AI 하드웨어와 소프트웨어에서 NVIDIA와 경쟁하고 있는가

칩 수출 통제에 대한 중국의 대응은 두 가지 방향으로 전개되고 있다. 화웨이(Huawei)와 바이두(Baidu) 같은 기업들은 점점 더 강력해지는 자국산 가속기를 출시하고 있다(화웨이의 Ascend 제품군과 바이두의 M100 칩은 외국산 GPU에 대한 의존도를 낮추기 위해 명시적으로 설계되었다). 이것이 아직 Nvidia의 최상급 데이터센터 GPU와 동등한 수준을 의미하는 것은 아니지만, 처리량보다 지연 시간, 결정론, 전력 효율성을 우선시하는 많은 로봇 공학 워크로드에서 그 격차는 좁혀지고 있다.

로봇 공학 개발자들에게 새로운 중국산 프로세서는 매력적이다. 비용이 저렴하고, 현지 클라우드 스택과 통합되며, 현지에서 대량으로 확보 가능한 데이터셋과 결합할 수 있기 때문이다. 또한 다른 소프트웨어 생태계와 툴체인을 제공하는데, 이는 CUDA와 Nvidia의 SDK에 익숙한 팀들에게는 마이그레이션 및 검증 비용을 발생시킨다. 실질적으로 많은 로봇 공학 개발자들은 혼합된 세계에서 운영될 것이다. 즉, 대규모 오프라인 훈련에는 Nvidia를 사용하고, 비용과 지연 시간이 가장 중요한 엣지 추론 및 폐쇄 루프 제어에는 현지 가속기를 사용하는 방식이다.

이것이 NVIDIA의 로드맵과 로봇 공학 고객에게 의미하는 것

Nvidia의 대응은 예상 가능했다. 구현된 지능(Embodied Intelligence)에 최적화된 파트너십과 제품 라인에 집중하는 것이다. Cosmos 3는 이러한 방향 전환을 염두에 두고 설계되었으며, 최근 Unitree 및 Sharpa와의 협력 발표는 개발자들을 시뮬레이터, 모델, 하드웨어를 아우르는 생태계에 가두려는 움직임을 보여준다. 그러나 이번과 같은 리더보드에서의 패배는 Nvidia로 하여금 원시적인 FLOPs뿐만 아니라 소프트웨어의 견고성과 개발자 편의성을 강조하게 만들 것이다.

유럽 및 독일 기업들에게 이 선택은 기술적인 문제일 뿐만 아니라 전략적인 문제이기도 하다. EU 칩스법(EU Chips Act)과 독일의 산업 정책은 최첨단 도구에 대한 접근권을 확보하는 동시에 특정 공급업체에 대한 과도한 의존을 방지하는 것을 목표로 한다. 즉, Nvidia를 표준으로 삼을지, 비용 문제로 중국산 로컬 가속기를 채택할지, 아니면 하이브리드 파이프라인을 설계할지 등의 조달 결정은 기술적인 문제인 동시에 점점 더 정치적인 문제가 될 것이다.

로봇 공학을 위한 차세대 AI 가속기를 형성하고 있는 중국 기업은 어디인가?

헤드라인을 장식하는 기업 외에도 중국의 생태계는 방대하다. 화웨이와 같은 익숙한 이름들이 고성능 가속기를 개발하고 있으며, 바이두는 칩을 직접 제조함과 동시에 이를 자사의 클라우드 및 자율주행 스택과 통합하고 있다. 스타트업과 국립 연구소들도 틈새시장을 채우고 있다. 어떤 곳은 로봇 팔을 위한 저전력 추론에 집중하고, 다른 곳은 밀집된 3D 포인트 클라우드를 위한 가속 인식 네트워크에 집중한다. 그 결과는 저렴한 현지 실리콘과 풍부한 데이터가 결합하여 더 낮은 가격대로 경쟁력 있는 로봇 공학 스택을 생산할 수 있는 계층형 공급망이다.

현장 팀들이 알아야 할 경쟁의 핵심은 이것이다. 중국산 실리콘이 아직 모든 Nvidia 워크로드를 즉시 대체할 수는 없지만, 많은 구현된 AI 시스템을 정의하는 인식, 제어, 시뮬레이션의 혼합에 있어서는 종종 "충분히 좋은(good enough)" 성능을 내며 규모의 경제 면에서 훨씬 저렴하다는 것이다.

로봇 공학 벤치마크 결과를 판단하는 방법 (그리고 회의적이어야 할 때)

리더보드는 최적화를 장려한다. 우수한 팀은 일반화가 가능한 모델을 구축하지만, 똑똑한 팀은 테스트에 맞춰 튜닝하기도 한다. RoboArena 설계자들은 무작위 작업, 적대적 장면, 과적합 방지 조치 등을 통해 벤치마크를 견고하게 만들려 노력했지만, 그 어떤 벤치마크도 배포 시 발생하는 복잡한 비용, 안전성, 규제 문제를 완전히 재현할 수는 없다. Spirit의 승리는 중요한 기술적 지표이지만, 공장, 병원, 또는 공공 도로에서의 배포는 점수로는 포착할 수 없는 소프트웨어 검증, 규제 준수, 공급망 보증을 요구한다.

이는 EU 조달 담당자와 독일의 산업용 로봇 통합업체에게 특히 관련이 있다. 최고의 벤치마크 점수가 안전 인증, 장기 유지보수 계획 또는 안전한 하드웨어 공급망을 대체할 수는 없다.

중국산 가속기와 Nvidia 사이에서 고민하는 로봇 공학 개발자를 위한 실질적 조언

첫째, 리스크를 파악하라. 제품이 서구권의 국방 또는 수출 통제 제약을 충족해야 한다면 Nvidia 및 TSMC 제조 GPU가 필수적일 수 있다. 둘째, 워크로드를 프로파일링하라. 제어 루프에 밀리초 단위의 결정론과 저전력이 필요하다면 현지 가속기가 더 저렴하고 충분히 적절할 수 있다. 셋째, 이식성을 계획하라. 추상화 계층, 컨테이너화된 추론 스택, 하드웨어에 구애받지 않는 ML 운영(MLOps)을 사용하여 공급이나 정책이 변경될 경우 모델을 재배치할 수 있도록 하라.

마지막으로, 훈련 데이터의 출처를 고려하라. 중국 내에 호스팅된 대규모 독점 데이터셋이나 중국 데이터를 사용하는 타사 서비스에 의존한다면, 데이터 접근 및 현지화와 관련된 지정학적 문제가 향후 모델을 재현 가능하게 훈련하고 유지 관리하는 능력에 영향을 미칠 수 있다.

유럽이 관심을 가져야 하는 이유 (그리고 여전히 영향력을 행사할 수 있는 영역)

유럽은 정밀 도구부터 전문 센서에 이르기까지 글로벌 반도체 및 제조 퍼즐의 핵심 부품을 공급하며, 독일의 공학 기술은 여전히 고부가가치 로봇 공학의 중심에 있다. 그러나 유럽의 정책적 대응은 중국의 국가 주도적 접근 방식에 비해 신중했다. EU 칩스법은 브뤼셀이 역량과 회복 탄력성을 보조할 수 있는 도구를 제공하지만, 이것이 중국이 현재 활용하고 있는 데이터 파이프라인, 벤처 자금 기반의 빠른 반복 주기, 또는 규제 속도를 즉각적으로 만들어내지는 못할 것이다.

유럽이 로봇 공학 분야에서 의미 있는 산업 주권을 원한다면, 정책 입안자들은 하드웨어 보조금과 함께 공유된 실제 데이터 수집, 구현된 시스템을 테스트하기 위한 허용적인 규제 샌드박스, 그리고 국경을 넘는 공급 회복 탄력성을 위한 명확한 조달 전략에 대한 투자를 병행해야 한다. 그렇지 않으면 유럽은 엔지니어는 보유하겠지만, 고수익 사례는 더 저렴하고 더 나은 데이터를 가진 기존 업체들에게 빼앗기게 될 것이다.

Spirit의 RoboArena 승리는 경쟁의 구도를 재편한다는 점에서 중요하다. 미-중 기술 전쟁: 중국 단계는 차세대 LLM을 누가 설계하거나 팹을 누가 통제하느냐에 관한 것만이 아니다. 이는 또한 기계가 실제 세계에서 움직이고 작업하도록 가르치는 복잡하고 비용이 많이 드는 사업을 누가 소유하느냐에 관한 것이다. 그 사업은 연산 자원만큼이나 데이터, 배포 파이프라인, 인내심 있는 국가 자본에 보상한다.

요약하자면, Spirit은 마법 같은 알고리즘 하나만으로 Nvidia를 '이긴' 것이 아니다. 그들은 자금, 데이터, 그리고 로봇을 훈련 장비로 바꾸는 국가 생태계를 통해 그렇게 했다. Nvidia는 여전히 대규모 훈련 작업의 기반이 되는 칩을 판매하고 있지만, 응용 로봇 공학의 전장은 GPU보다 훨씬 넓으며 이것이 바로 우리가 주목해야 할 변화다.

유럽은 엔지니어를 보유하고 있다. 다만 그들의 점심값을 낼 지불 주체를 정해야 할 뿐이다.

출처

  • RoboArena (스탠퍼드 대학교 및 UC 버클리와 공동 개발한 벤치마크)
  • 베이징 대학교 (BigAI 연구소 및 관련 연구)
  • 중화인민공화국 공업정보화부 (저고도 경제 및 산업 AI에 관한 정책 계획)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Spirit v1.6와 Nvidia의 Cosmos3-Nano-Policy가 RoboArena에서 기록한 점수는 무엇이며, Spirit은 이 결과와 함께 어떤 투자 유치 소식을 발표했습니까?
A Spirit v1.6은 RoboArena에서 1,924점을 기록하여 1,881점을 기록한 Cosmos3-Nano-Policy를 근소한 차이로 앞섰습니다. 또한 Spirit은 리더보드 순위 변동과 더불어 약 2억 2,200만 달러(15억 위안) 규모의 자금 조달 라운드를 발표하며 대규모 투자 유치를 알렸습니다.
Q RoboArena가 미국과 중국 간의 기술 경쟁에서 정치적으로 중요한 이유 무엇입니까?
A RoboArena는 로봇 정책이 무작위적이고 적대적인 환경 전반에서 관측 데이터를 얼마나 탄탄한 행동으로 변환하는지를 테스트하며, 단순한 컴퓨팅 성능보다는 데이터 규모와 배포 파이프라인의 중요성을 강조합니다. 이 기사는 해당 결과가 중국의 경쟁 우위를 형성하는 공급망 및 데이터 역학 관계와 같은 이면의 요소들을 반영하고 있다고 지적합니다.
Q 기사에 따르면 로봇 AI 분야에서 중국이 가진 데이터 관련 강점은 무엇입니까?
A 기사는 중국의 가장 명확한 강점으로 데이터를 꼽습니다. 중국 정부는 조작, 내비게이션, 인간 상호작용 작업 등을 산업 규모로 학습시키기 위해 큐레이팅되고 라벨링된 데이터를 생산하는 '데이터 공장' 혹은 중앙 집중식 로봇 데이터 수집을 조용히 지원하고 있으며, 여기에 국산 가속기를 더해 해외 GPU 의존도를 낮추고 있습니다.
Q Nvidia는 중국의 가속기 부상과 RoboArena 결과에 어떻게 대응하고 있습니까?
A Nvidia는 구현 지능(embodied intelligence)을 위한 파트너십과 제품군에 주력하고 있습니다. Cosmos 3는 Unitree, Sharpa와 같은 기업과의 협업을 통해 시뮬레이터, 모델, 하드웨어를 아우르는 생태계에 개발자를 묶어두는 전략을 취하고 있으며, 순수 FLOP 성능과 더불어 소프트웨어 견고성 및 개발자 편의성을 강조하고 있습니다.
Q 어떤 기관들이 RoboArena 설계에 기여했습니까?
A RoboArena는 상당한 학계의 기여를 바탕으로 구축되었으며, 스탠퍼드 대학교와 UC 버클리가 공동 개발자로 이름을 올렸습니다. 이는 무작위적이고 적대적인 환경에서 지각, 계획, 행동을 테스트하는 벤치마크를 형성하는 데 선도적인 대학들이 협력하고 있음을 시사합니다.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!