Spirit AI wygrywa z Nvidia na RoboArena — ale zaskakującą przewagą nie była moc obliczeniowa

Robotyka
Spirit AI beat Nvidia on RoboArena — but the surprise advantage wasn’t compute
Model Spirit v1.6 firmy Spirit AI zajął w tym tygodniu pierwsze miejsce w rankingu RoboArena, spychając Cosmos3 firmy Nvidia z pozycji lidera. Wynik ten pokazuje, jak chińskie dane, polityka i model przemysłowy zmieniają krajobraz robotyki w amerykańsko-chińskiej wojnie technologicznej.

wojna technologiczna USA-Chiny: chiński Spirit v1.6 i niespodzianka w RoboArena

Dwa dni po tym, jak Nvidia zaprezentowała Cosmos 3, niewielki start-up z Hangzhou opublikował wynik, który sprawił, że monitory w salach posiedzeń rozbłysły. Spirit v1.6 firmy Spirit AI uzyskał 1924 punkty w benchmarku RoboArena — wyprzedzając Cosmos3-Nano-Policy od Nvidii z wynikiem 1881 — a firma jednocześnie ogłosiła rundę finansowania na kwotę 1,5 miliarda juanów (około 222 mln USD). W suchych liczbach nagłówek jest prosty; w wymiarze praktycznym to starcie zmusza do przemyślenia, gdzie tak naprawdę leży przewaga w robotyce w obecnej fazie wojny technologicznej USA-Chiny: Chiny.

RoboArena ma znaczenie, ponieważ sprawdza, jak dobrze ogólny model sterowania robotem (robot policy) przekłada percepcję i planowanie na ruch w świecie rzeczywistym w zrandomizowanych, nieprzyjaznych środowiskach. Benchmark powstał przy dużym udziale środowisk akademickich; wśród jego współtwórców wymieniane są Stanford i UC Berkeley. Jednak jedno migawkowe ujęcie z tablicy wyników nie ujawnia dynamiki łańcucha dostaw, regulacji i danych, które do niego doprowadziły — a to właśnie w tych zakulisowych czynnikach Chiny wydają się obecnie najsilniejsze.

Dlaczego wygrana w benchmarku jest wydarzeniem politycznym, a nie tylko technicznym

Benchmarki takie jak RoboArena są przydatne do porównywania architektur modeli, ale nie wyznaczają losów rynku. Tablica wyników nagradza modele, które przekładają obserwacje na solidne działania w wielu symulowanych zadaniach, przy zastosowaniu rygorystycznych środków zapobiegających nadmiernemu dopasowaniu (anti-overfitting). Mimo to, wzrost wydajności może wynikać z kilku źródeł: architektury modelu, lepszych danych treningowych (syntetycznych lub rzeczywistych), sprytnej randomizacji domeny lub ukierunkowanych prac inżynieryjnych mających na celu wyciśnięcie więcej z ograniczonej mocy obliczeniowej. Wzrost Spirit wygląda na połączenie agresywnego gromadzenia danych, pragmatycznej inżynierii modeli i szybkiego finansowania — a nie tylko dostępu do procesorów graficznych najwyższej klasy.

Ta kombinacja sama w sobie jest polityczna. Nvidia pomogła zaprojektować RoboArena, a następnie wystawiła do rywalizacji Cosmos 3. Zwycięstwo Spirit sygnalizuje, że wyścig w dziedzinie sztucznej inteligencji ucieleśnionej (embodied AI) wykroczył poza surową moc obliczeniową układów scalonych i przeniósł się na arenę, gdzie skala danych, pokrycie zadań i procesy wdrażania znaczą co najmniej tyle samo. Dla obserwatorów geopolitycznych jest to istotne: zmienia to układ sił w rywalizacji USA-Chiny.

wojna technologiczna USA-Chiny: strukturalna przewaga Chin — dane, fabryki i kapitał państwowy

Najbardziej oczywistą przewagą, jaką Chiny wnoszą do AI w robotyce, są dane. Eksperci branżowi i kadra zarządzająca wielokrotnie powtarzali, że „dane to najtrudniejszy problem” dla fizycznej sztucznej inteligencji; CEO Nvidii potwierdził ten punkt w ostatnich komunikatach. W Chinach władze miejskie i prowincjonalne po cichu wspierały scentralizowane gromadzenie danych robotycznych — czasami opisywane jako „fabryki danych” — które mogą generować wyselekcjonowane, etykietowane strumienie do trenowania zadań manipulacji, nawigacji i interakcji z człowiekiem na skalę przemysłową.

Jak Chiny konkurują z NVIDIA w zakresie sprzętu i oprogramowania AI dla robotyki

Odpowiedź Chin na kontrolę eksportu chipów jest dwutorowa. Firmy takie jak Huawei i Baidu wprowadzają na rynek coraz wydajniejsze krajowe akceleratory (rodzina Ascend od Huawei oraz chipy M100 od Baidu zostały zaprojektowane wyraźnie w celu zmniejszenia zależności od zagranicznych GPU). Nie oznacza to jeszcze parytetu z najlepszymi układami Nvidii dla centrów danych, ale luka dla wielu zadań robotycznych, w których często priorytetem jest opóźnienie (latency), determinizm i efektywność energetyczna, a nie czysta przepustowość, maleje.

Dla programistów robotyki nowe chińskie procesory są atrakcyjne: kosztują mniej, integrują się z lokalnymi stosami chmurowymi i mogą być łączone z dużymi, lokalnie dostępnymi zbiorami danych. Wiążą się również z innymi ekosystemami oprogramowania i łańcuchami narzędzi, co podnosi koszty migracji i walidacji dla zespołów przyzwyczajonych do CUDA i pakietów SDK Nvidii. W praktyce wielu programistów robotyki będzie działać w świecie mieszanym: Nvidia do ciężkich szkoleń offline, a lokalne akceleratory do wnioskowania na krawędzi (edge inference) i sterowania w pętli zamkniętej, gdzie koszt i opóźnienie mają największe znaczenie.

Co to oznacza dla planów rozwoju (roadmap) Nvidii i klientów z branży robotyki

Odpowiedź Nvidii była przewidywalna: podwojenie zaangażowania w partnerstwa i linie produktów zoptymalizowane pod kątem ucieleśnionej inteligencji. Cosmos 3 został zaprojektowany z myślą o tym zwrocie, a niedawne ogłoszenia współpracy z Unitree i Sharpa sygnalizują dążenie do zamknięcia programistów w ekosystemie obejmującym symulator, model i sprzęt. Jednak porażki w rankingach, takie jak ta, skłonią Nvidię do kładzenia nacisku na solidność oprogramowania i ergonomię pracy programistów, obok surowych wartości FLOPs.

Dla firm europejskich i niemieckich wybór jest nie tylko techniczny, ale i strategiczny. Europejski akt o czipach (EU Chips Act) i niemiecka polityka przemysłowa mają na celu zapewnienie dostępu do najnowocześniejszych narzędzi przy jednoczesnym zapobieganiu nadmiernej zależności od jednego dostawcy. Oznacza to, że decyzje zakupowe — czy standaryzować na Nvidii, przyjąć lokalne chińskie akceleratory ze względów kosztowych, czy projektować hybrydowe procesy — będą coraz bardziej polityczne, a nie tylko techniczne.

Które chińskie firmy kształtują akceleratory AI nowej generacji dla robotyki?

Poza liderami nagłówków, chiński ekosystem jest szeroki. Znane marki, takie jak Huawei, rozwijają wysokiej klasy akceleratory; Baidu zarówno buduje chipy, jak i integruje je ze swoimi stosami chmurowymi i autonomicznymi. Start-upy i krajowe laboratoria wypełniają nisze: niektóre koncentrują się na wnioskowaniu przy niskim poborze mocy dla kończyn robotycznych, inne na akcelerowanych sieciach percepcji dla gęstych chmur punktów 3D. Efektem netto jest warstwowy łańcuch dostaw, w którym niedrogi lokalny krzem oraz obfitość danych pozwalają tworzyć konkurencyjne stosy robotyczne przy niższych cenach.

Ta konkurencja jest tym, co zespoły „w terenie” powinny wiedzieć: chiński krzem nie jest jeszcze bezpośrednim zamiennikiem dla każdego zadania Nvidii, ale w przypadku miksu percepcji, sterowania i symulacji, który definiuje wiele systemów AI, jest często „wystarczająco dobry” i znacznie tańszy na dużą skalę.

Jak oceniać wynik benchmarku robotycznego (i kiedy zachować sceptycyzm)

Tablice wyników zachęcają do optymalizacji. Dobre zespoły budują modele, które generalizują; sprytne zespoły dodatkowo dostrajają je pod kątem testów. Projektanci RoboArena starali się uczynić benchmark solidnym — zrandomizowane zadania, nieprzyjazne sceny, środki zapobiegające nadmiernemu dopasowaniu — jednak żaden benchmark nie jest w stanie w pełni oddać złożonych wyzwań związanych z kosztami, bezpieczeństwem i regulacjami przy wdrażaniu. Zwycięstwo Spirit jest ważnym wskaźnikiem technicznym, ale wdrożenie w fabrykach, szpitalach czy na ulicach publicznych nakłada wymogi walidacji oprogramowania, zgodności z przepisami i gwarancji łańcucha dostaw, których wynik punktowy nie jest w stanie uchwycić.

Jest to szczególnie istotne dla urzędników ds. zamówień w UE i integratorów robotyki przemysłowej w Niemczech. Najwyższy wynik w benchmarku nie zastąpi certyfikacji bezpieczeństwa, planów długoterminowej konserwacji ani bezpiecznego łańcucha dostaw sprzętu.

Praktyczne porady dla programistów robotyki wybierających między chińskimi akceleratorami a Nvidią

Po pierwsze: oceń swoje ryzyko. Jeśli Twój produkt musi spełniać zachodnie wymogi obronne lub ograniczenia kontroli eksportu, procesory GPU od Nvidii i produkowane przez TSMC mogą być obowiązkowe. Po drugie: stwórz profil swojego obciążenia. Jeśli Twoja pętla sterowania wymaga determinizmu na poziomie milisekund i niskiego poboru mocy, lokalne akceleratory mogą być tańsze i w pełni wystarczające. Po trzecie: zaplanuj przenośność. Korzystaj z warstw abstrakcji, konteneryzowanych stosów wnioskowania i operacji ML niezależnych od sprzętu, aby modele można było przemapować w przypadku zmian w dostawach lub polityce.

Na koniec, rozważ, skąd pochodzą Twoje dane treningowe. Jeśli polegasz na dużych zbiorach danych własnościowych hostowanych w Chinach — lub na usługach stron trzecich, które korzystają z chińskich danych — geopolityka dostępu do danych i ich lokalizacja może wpłynąć na Twoją zdolność do odtwarzalnego trenowania i utrzymywania modeli w przyszłości.

Dlaczego Europa powinna się tym przejmować (i na co wciąż może wpływać)

Europa dostarcza kluczowe elementy globalnej układanki półprzewodnikowej i produkcyjnej — od precyzyjnych narzędzi po specjalistyczne czujniki — a niemiecka inżynieria pozostaje kluczowa dla robotyki o wysokiej wartości. Jednak reakcja polityczna Europy była ostrożna w porównaniu z podejściem Chin, gdzie inicjatywę przejmuje państwo. Europejski akt o czipach daje Brukseli narzędzia do dotowania zdolności produkcyjnych i odporności, ale nie stworzy natychmiast potoków danych, finansowanych przez fundusze VC cykli szybkiej iteracji ani szybkości regulacyjnej, którą obecnie wykorzystują Chiny.

Jeśli Europa chce znaczącej suwerenności przemysłowej w robotyce, decydenci muszą dopasować dotacje sprzętowe do inwestycji we współdzielone gromadzenie danych z rzeczywistego świata, stworzyć permisywne piaskownice regulacyjne do testowania systemów ucieleśnionych i jaśniejsze strategie zaopatrzeniowe dla odporności łańcuchów dostaw. W przeciwnym razie Europa wciąż będzie mieć inżynierów, ale straci wysokomarżowe zastosowania na rzecz tańszych konkurentów dysponujących lepszymi danymi.

Wygrana Spirit w RoboArena ma znaczenie, ponieważ zmienia definicję konkurencji. Wojna technologiczna USA-Chiny: faza chińska, nie dotyczy tylko tego, kto zaprojektuje kolejny LLM lub kto kontroluje fabryki; chodzi również o to, kto zawładnie kosztownym i złożonym biznesem uczenia maszyn poruszania się i pracy w świecie rzeczywistym. Ten biznes nagradza dane, procesy wdrożeniowe i cierpliwy kapitał państwowy równie mocno, co moc obliczeniową.

W skrócie: Spirit nie „pokonał” Nvidii samym magicznym algorytmem. Zrobił to pieniędzmi, danymi i narodowym ekosystemem, który zmienia roboty w stanowiska treningowe. Nvidia wciąż sprzedaje chipy, które stanowią fundament wielkich zadań szkoleniowych, ale pole bitwy dla robotyki stosowanej jest szersze niż procesory graficzne — i to jest zmiana, którą należy obserwować.

Europa ma inżynierów. Musi tylko znaleźć kogoś, kto zapłaci za ich lunch.

Źródła

  • RoboArena (benchmark współtworzony z Uniwersytetem Stanforda i Uniwersytetem Kalifornijskim w Berkeley)
  • Uniwersytet Pekiński (instytut BigAI i powiązane badania)
  • Ministerstwo Przemysłu i Technologii Informatycznych Chińskiej Republiki Ludowej (plany polityczne dotyczące gospodarki niskopułapowej i przemysłowej sztucznej inteligencji)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Jakie wyniki uzyskały Spirit v1.6 oraz Nvidia Cosmos3-Nano-Policy w RoboArena i jaką wiadomość o finansowaniu ogłosiło Spirit wraz z tym wynikiem?
A Spirit v1.6 uzyskał 1924 punkty w RoboArena, nieznacznie wyprzedzając Cosmos3-Nano-Policy, który zdobył 1881 punktów. Firma Spirit ogłosiła również rundę finansowania o wartości 1,5 miliarda juanów, czyli około 222 milionów dolarów amerykańskich, co sygnalizuje znaczący zastrzyk kapitału równolegle z sukcesem w rankingu.
Q Dlaczego RoboArena jest uważana za istotną politycznie w kontekście rywalizacji technologicznej między USA a Chinami?
A RoboArena sprawdza, jak dobrze polityka sterowania robotem przekłada obserwacje na skuteczne działania w zrandomizowanych, kontradyktoryjnych środowiskach, kładąc nacisk na skalę danych i potoki wdrożeniowe, a nie tylko na samą moc obliczeniową; artykuł zauważa, że wynik odzwierciedla zakulisowe czynniki, takie jak łańcuchy dostaw i dynamika danych, które kształtują przewagę Chin.
Q Jaką przewagę w zakresie danych w dziedzinie robotycznej sztucznej inteligencji posiadają Chiny według artykułu?
A Artykuł wskazuje dane jako najbardziej oczywistą przewagę Chin, gdzie rządy po cichu wspierają scentralizowane gromadzenie danych z robotyki lub „fabryki danych”, które tworzą przygotowane i otagowane strumienie do trenowania zadań manipulacji, nawigacji i interakcji z człowiekiem na skalę przemysłową, uzupełnione przez krajowe akceleratory w celu zmniejszenia zależności od zagranicznych układów GPU.
Q W jaki sposób Nvidia dostosowuje się do rozwoju chińskich akceleratorów i wyników RoboArena?
A Nvidia stawia na partnerstwa i linie produktów związane z inteligencją ucieleśnioną. Model Cosmos 3 został połączony z współpracą z takimi firmami jak Unitree i Sharpa, aby przywiązać programistów do ekosystemu obejmującego symulatory, modele i sprzęt, podczas gdy firma kładzie nacisk na niezawodność oprogramowania i ergonomię pracy programisty obok surowej wydajności obliczeniowej (FLOPs).
Q Które instytucje przyczyniły się do zaprojektowania RoboArena?
A RoboArena powstała przy znaczącym wkładzie akademickim; Stanford oraz UC Berkeley zostały wymienione jako współtwórcy, co sygnalizuje współpracę czołowych uniwersytetów w kształtowaniu benchmarku, który testuje percepcję, planowanie i działanie w zrandomizowanych, kontradyktoryjnych środowiskach.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!