Spirit AI обошла Nvidia в RoboArena — но неожиданное преимущество заключалось не в вычислительной мощности

Робототехника
Spirit AI beat Nvidia on RoboArena — but the surprise advantage wasn’t compute
На этой неделе модель Spirit v1.6 от Spirit AI возглавила рейтинг RoboArena, сместив Cosmos3 от Nvidia с первой строчки. Этот результат показывает, как китайская стратегия в области данных, политики и промышленности меняет ландшафт робототехники в рамках американо-китайского технологического противостояния.

Технологическая война США и Китая: Spirit v1.6 из КНР и сенсация на RoboArena

Спустя два дня после того, как Nvidia представила Cosmos 3, небольшой стартап из Ханчжоу опубликовал результат, заставивший мониторы в залах заседаний советов директоров мигать. Модель Spirit v1.6 от Spirit AI набрала 1924 балла в бенчмарке RoboArena, обойдя решение Nvidia Cosmos3‑Nano‑Policy с его 1881 баллом, и одновременно компания объявила о раунде финансирования в размере 1,5 млрд юаней (около 222 млн долларов США). Если говорить о сухих цифрах, заголовок выглядит просто; с практической точки зрения это столкновение заставляет переосмыслить, где именно сосредоточено преимущество в сфере робототехники в текущей фазе технологической войны между США и Китаем.

RoboArena важна, поскольку она проверяет, насколько эффективно алгоритм робота общего назначения превращает восприятие и планирование в реальные движения в рандомизированных состязательных средах. Бенчмарк был создан при значительной академической поддержке; в числе его соразработчиков указаны Стэнфордский университет и Калифорнийский университет в Беркли. Однако снимок таблицы лидеров не раскрывает динамику цепочек поставок, регулирования и данных, которая привела к такому результату — а именно эти закулисные факторы сейчас выглядят наиболее сильной стороной Китая.

Почему победа в бенчмарке — это не только техническое, но и политическое событие

Бенчмарки вроде RoboArena полезны для сравнения архитектур алгоритмов, но они не предопределяют судьбу технологий. Таблица лидеров поощряет модели, которые преобразуют наблюдения в устойчивые действия в ходе множества симулируемых задач, используя строгие меры против переобучения. Тем не менее, прирост производительности может достигаться разными путями: архитектурой модели, более качественными синтетическими или реальными данными для обучения, продуманной рандомизацией доменов или целевой инженерной оптимизацией для извлечения максимума из ограниченных вычислительных мощностей. Успех Spirit выглядит как сочетание агрессивного сбора данных, прагматичного проектирования моделей и инвестиционного рывка — а не просто доступа к топовым графическим процессорам.

Это сочетание само по себе является политическим фактором. Nvidia участвовала в разработке RoboArena, а затем выставила Cosmos 3 на ринг. Победа Spirit сигнализирует о том, что гонка в области воплощенного ИИ (embodied AI) вышла за рамки простой мощности чипов на арену, где масштаб данных, охват задач и конвейеры развертывания значат не меньше. Для геополитических наблюдателей это важно: это меняет расстановку сил в конкуренции США и Китая.

Технологическая война США и Китая: структурное преимущество Китая — данные, заводы и государственный капитал

Самое очевидное преимущество, которое Китай привносит в ИИ для робототехники — это данные. Инсайдеры индустрии и руководители неоднократно заявляли, что «данные — это самая сложная проблема» для физического ИИ; генеральный директор Nvidia подтвердил этот тезис в своих недавних анонсах. В Китае муниципальные и провинциальные власти в тихом режиме поддерживают централизованный сбор данных для робототехники — их иногда называют «фабриками данных», — которые могут производить курируемые, размеченные потоки для обучения манипуляциям, навигации и задачам взаимодействия с человеком в промышленном масштабе.

Как Китай конкурирует с NVIDIA в аппаратном и программном обеспечении для робототехники

Ответ Китая на экспортный контроль чипов оказался двусторонним. Компании вроде Huawei и Baidu поставляют все более функциональные отечественные ускорители (семейство Huawei Ascend и чипы Baidu M100 были разработаны специально для снижения зависимости от зарубежных GPU). Это еще не означает паритета с топовыми дата-центровыми GPU от Nvidia, но разрыв сокращается для многих задач робототехники, где приоритет часто отдается задержке, детерминизму и энергоэффективности, а не чистой пропускной способности.

Разработчикам робототехники новые китайские процессоры кажутся привлекательными: они дешевле, интегрируются с локальными облачными стеками и могут использоваться с большими локально доступными наборами данных. Они также поставляются с другими программными экосистемами и наборами инструментов, что повышает затраты на миграцию и валидацию для команд, привыкших к CUDA и SDK от Nvidia. На практике многие разработчики робототехники будут работать в смешанной среде: Nvidia для тяжелого обучения в офлайне и локальные ускорители для инференса (вывода) на периферии и управления в замкнутом контуре, где важнее всего стоимость и задержка.

Что это означает для дорожной карты NVIDIA и клиентов в сфере робототехники

Ответ Nvidia был предсказуемым: удвоить усилия по развитию партнерств и продуктовых линеек, оптимизированных для воплощенного интеллекта. Cosmos 3 создавался с учетом этого вектора, а недавние анонсы сотрудничества с Unitree и Sharpa свидетельствуют о стремлении закрепить разработчиков в экосистеме, охватывающей симулятор, модель и оборудование. Однако поражения в таблицах лидеров, подобные этому, подтолкнут Nvidia уделять больше внимания надежности ПО и эргономике для разработчиков наряду с «сырыми» флопсами.

Для европейских и немецких фирм выбор является не только техническим, но и стратегическим. Закон ЕС о чипах и промышленная политика Германии направлены на обеспечение доступа к передовым инструментам при предотвращении чрезмерной зависимости от какого-либо одного поставщика. Это означает, что решения о закупках — будь то стандартизация на Nvidia, внедрение локальных китайских ускорителей из соображений стоимости или проектирование гибридных конвейеров — будут все чаще становиться как политическими, так и техническими.

Какие китайские компании формируют ИИ-ускорители нового поколения для робототехники?

Помимо лидеров заголовков, китайская экосистема очень широка. Такие известные имена, как Huawei, разрабатывают высокопроизводительные ускорители; Baidu одновременно создает чипы и интегрирует их со своими облачными и автономными стеками. Стартапы и национальные лаборатории занимают свои ниши: одни специализируются на маломощном инференсе для конечностей роботов, другие — на ускоренных сетях восприятия для плотных 3D-облаков точек. Итоговый эффект — многоуровневая цепочка поставок, где недорогой локальный кремний плюс изобилие данных позволяют производить конкурентоспособные стеки для робототехники по более низкой цене.

Это та конкуренция, о которой стоит знать специалистам «в поле»: китайский кремний пока не является полной заменой для всех нагрузок Nvidia, но для сочетания восприятия, управления и симуляции, определяющих многие системы воплощенного ИИ, он часто «достаточно хорош» и гораздо дешевле при масштабировании.

Как оценивать результаты бенчмарка в робототехнике (и когда стоит быть скептиком)

Таблицы лидеров стимулируют оптимизацию. Хорошие команды создают модели, которые обобщают данные; умные команды также настраиваются под тест. Разработчики RoboArena пытались сделать бенчмарк устойчивым — рандомизированные задачи, состязательные сцены, меры против переобучения, — однако ни один бенчмарк не может полностью воспроизвести сложные проблемы стоимости, безопасности и регулирования при развертывании. Победа Spirit — важный технический маркер, но развертывание на заводах, в больницах или на улицах требует валидации ПО, соблюдения нормативных требований и гарантий цепочки поставок, чего оценка в баллах отразить не может.

Это особенно актуально для сотрудников отделов закупок в ЕС и интеграторов промышленной робототехники в Германии. Высокий балл в бенчмарке не заменит сертификацию безопасности, планы долгосрочного обслуживания или надежность цепочки поставок оборудования.

Практические советы разработчикам робототехники при выборе между китайскими ускорителями и Nvidia

Во-первых: оцените свои риски. Если ваш продукт должен соответствовать западным оборонным или экспортным ограничениям, GPU от Nvidia и TSMC могут стать обязательными. Во-вторых: профилируйте свою нагрузку. Если ваш контур управления требует миллисекундного детерминизма и низкого энергопотребления, локальные ускорители могут быть дешевле и вполне подходить. В-третьих: планируйте переносимость. Используйте уровни абстракции, контейнеризированные стеки инференса и аппаратно-независимые инструменты ML-операций, чтобы модели можно было перенацелить в случае изменений в поставках или политике.

Наконец, подумайте, откуда берутся ваши данные для обучения. Если вы полагаетесь на большие проприетарные наборы данных, размещенные в Китае, или на сторонние сервисы, использующие китайские данные, геополитика доступа к данным и их локализации может повлиять на вашу способность воспроизводимо обучать и поддерживать модели в будущем.

Почему Европе стоит обратить на это внимание (и на что она еще может повлиять)

Европа поставляет важнейшие части мирового пазла полупроводников и производства — от прецизионных инструментов до специализированных датчиков, а немецкая инженерная школа остается ключевой для высококлассной робототехники. Но политический ответ Европы был осторожным по сравнению с подходами, ведомыми государством в Китае. Закон ЕС о чипах дает Брюсселю инструменты для субсидирования мощностей и устойчивости, но он не создаст мгновенно конвейеры данных, циклы быстрой итерации на венчурные средства или регуляторную гибкость, которые сейчас использует Китай.

Если Европа хочет значимого промышленного суверенитета в робототехнике, политикам необходимо сочетать субсидии на оборудование с инвестициями в совместный сбор реальных данных, создание регуляторных «песочниц» для тестирования воплощенных систем и более четкие стратегии закупок для трансграничной устойчивости поставок. В противном случае у Европы останутся инженеры, но она просто проиграет высокомаржинальные ниши более дешевым игрокам, обладающим лучшими данными.

Победа Spirit на RoboArena важна, потому что она меняет рамки конкуренции. Фаза «технологической войны США и Китая: Китай» касается не только того, кто разработает следующий LLM или кто контролирует фабрики; это также вопрос того, кто владеет сложным и дорогим процессом обучения машин движению и работе в реальном мире. Этот бизнес вознаграждает за наличие данных, конвейеры развертывания и терпеливый государственный капитал так же, как за вычислительные мощности.

Коротко: Spirit не «победила» Nvidia одним лишь магическим алгоритмом. Она сделала это с помощью денег, данных и национальной экосистемы, которая превращает роботов в тренировочные полигоны. Nvidia по-прежнему продает чипы, лежащие в основе крупных задач обучения, но поле битвы прикладной робототехники шире, чем просто GPU, — и это именно то изменение, за которым стоит следить.

У Европы есть инженеры. Ей просто нужно найти того, кто оплатит их обед.

Источники

  • RoboArena (бенчмарк, разработанный совместно со Стэнфордским университетом и Калифорнийским университетом в Беркли)
  • Пекинский университет (институт BigAI и связанные исследования)
  • Министерство промышленности и информатизации КНР (планы политики в области экономики малых высот и промышленного ИИ)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Какие баллы набрали Spirit v1.6 и Nvidia Cosmos3-Nano-Policy на RoboArena, и о каких новостях финансирования объявила компания Spirit вместе с публикацией результатов?
A Spirit v1.6 набрала 1924 балла на RoboArena, лишь немного опередив Cosmos3-Nano-Policy с результатом 1881 балл. Одновременно с лидерством в рейтинге компания Spirit объявила о раунде финансирования на сумму 1,5 миллиарда юаней (около 222 миллионов долларов США), что свидетельствует о значительном притоке инвестиций.
Q Почему RoboArena считается политически значимой в контексте технологического соперничества между США и Китаем?
A RoboArena проверяет, насколько эффективно модель управления роботом преобразует наблюдения в надежные действия в рандомизированных состязательных задачах, подчеркивая важность масштаба данных и конвейеров развертывания, а не только чистой вычислительной мощности. В статье отмечается, что результат отражает закулисные факторы, такие как цепочки поставок и динамика данных, которые определяют преимущество Китая.
Q Какое преимущество в области данных Китай использует в робототехническом ИИ согласно статье?
A Статья называет данные самым очевидным преимуществом Китая. Правительство оказывает скрытую поддержку централизованному сбору данных для робототехники — так называемым «фабрикам данных», которые производят курируемые, размеченные потоки для обучения манипуляциям, навигации и задачам взаимодействия с человеком в промышленных масштабах. Это дополняется использованием ускорителей собственного производства для снижения зависимости от иностранных графических процессоров.
Q Как Nvidia адаптируется к появлению китайских ускорителей и результатам RoboArena?
A Nvidia делает ставку на партнерства и линейки продуктов для воплощенного интеллекта (embodied intelligence). Cosmos 3 сопровождается сотрудничеством с такими компаниями, как Unitree и Sharpa, чтобы закрепить разработчиков в экосистеме, охватывающей симуляторы, модели и оборудование. При этом компания делает упор на надежность программного обеспечения и удобство для разработчиков наряду с «сырой» производительностью FLOPS.
Q Какие организации внесли вклад в разработку RoboArena?
A RoboArena была создана при существенном академическом участии: Стэнфордский университет и Калифорнийский университет в Беркли указаны в качестве соразработчиков. Это свидетельствует о сотрудничестве ведущих университетов в создании бенчмарка, который тестирует восприятие, планирование и действия в рандомизированных состязательных средах.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!