Spirit AI, RoboArena'da Nvidia'yı geçti; ancak şaşırtıcı avantaj işlem gücü değildi

Robotik
Spirit AI beat Nvidia on RoboArena — but the surprise advantage wasn’t compute
Spirit AI'ın Spirit v1.6 modeli bu hafta RoboArena liderlik tablosunun zirvesine yerleşerek Nvidia'nın Cosmos3 modelini tahtından indirdi. Bu sonuç, Çin'in veri, politika ve endüstriyel stratejilerinin ABD-Çin teknoloji savaşındaki robotik katmanını nasıl yeniden şekillendirdiğini gözler önüne seriyor.

ABD-Çin teknoloji savaşı: Çin’in Spirit v1.6’sı ve RoboArena sürprizi

Nvidia’nın Cosmos 3’ü tanıtmasından iki gün sonra, Hangzhou merkezli küçük bir start-up, yönetim kurulu monitörlerinin şaşkınlıkla karşıladığı bir puan yayınladı. Spirit AI’ın Spirit v1.6 modeli, RoboArena kıyaslama testinde 1.924 puan alarak Nvidia’nın 1.881 puanlık Cosmos3-Nano-Policy modelini geride bıraktı ve şirket eş zamanlı olarak 1,5 milyar yuanlık (yaklaşık 222 milyon ABD doları) bir finansman turu duyurdu. Rakamlarla ifade edildiğinde başlık oldukça basit; ancak pratik açıdan bu çatışma, devam eden ABD-Çin teknoloji savaşının Çin safhasında robotik alanındaki avantajın aslında nerede yattığına dair bir yeniden düşünmeyi zorunlu kılıyor.

RoboArena önem taşıyor çünkü genel amaçlı bir robot politikasının, algılama ve planlamayı rastgeleleştirilmiş, çekişmeli ortamlarda nasıl gerçek dünya hareketine dönüştürdüğünü test ediyor. Kıyaslama testi yoğun akademik katkılarla oluşturuldu; Stanford ve UC Berkeley, ortak geliştiricileri arasında yer alıyor. Ancak tek bir skor tablosu görüntüsü, bunu ortaya çıkaran tedarik zinciri, düzenleyici çerçeve ve veri dinamiklerini açığa çıkarmıyor; işte Çin’in şu anda en güçlü göründüğü alan da tam olarak bu perde arkası faktörler.

Bir kıyaslama zaferi neden teknik olduğu kadar siyasi bir olaydır

RoboArena gibi kıyaslama testleri, politika mimarilerini karşılaştırmak için yararlıdır ancak kaderi belirlemezler. Skor tablosu, sıkı aşırı öğrenmeyi önleme (anti-overfitting) önlemleri kullanarak gözlemleri birçok simüle edilmiş görevde sağlam eylemlere dönüştüren modelleri ödüllendirir. Yine de performans kazanımları çeşitli yollarla elde edilebilir: model mimarisi, daha iyi sentetik veya gerçek dünya eğitim verileri, akıllı alan rastgeleleştirme veya sınırlı işlem gücünden daha fazlasını elde etmek için hedeflenmiş mühendislik. Spirit’in yükselişi; sadece üst düzey GPU'lara erişimden değil, agresif veri toplama, pragmatik model mühendisliği ve hızlı bir finansman hamlesinin birleşiminden kaynaklanıyor gibi görünüyor.

Bu birleşim başlı başına siyasidir. Nvidia, RoboArena’nın tasarımına yardımcı oldu ve ardından Cosmos 3’ü sahaya sürdü. Spirit’in zaferi, somutlaşmış yapay zeka (embodied AI) yarışının, çiplerin ham beygir gücünün ötesine geçerek veri ölçeğinin, görev kapsamının ve dağıtım hatlarının en az onun kadar önemli olduğu bir arenaya taşındığını gösteriyor. Jeopolitik gözlemciler için bu durum anlamlı: ABD-Çin rekabetinde kaldıraç gücünün nerede durduğunu değiştiriyor.

ABD-Çin teknoloji savaşı: Çin’in yapısal üstünlüğü — veri, fabrikalar ve devlet sermayesi

Çin’in robotik yapay zekasına getirdiği en belirgin avantaj veridir. Sektör içindekiler ve yöneticiler, fiziksel yapay zeka için “en zor problemin veri olduğunu” defalarca belirttiler; Nvidia’nın CEO’su da yakın zamandaki duyurularında bu noktayı yineledi. Çin’de belediye ve il yönetimleri, merkezi robotik veri toplamayı —bazen “veri fabrikaları” olarak tanımlanan— sessizce destekliyor; bu yapılar endüstriyel ölçekte manipülasyon, navigasyon ve insan etkileşimi görevlerini eğitmek için küratörlü, etiketli akışlar üretebiliyor.

Çin, robotik için yapay zeka donanımı ve yazılımı konusunda NVIDIA ile nasıl rekabet ediyor?

Çin’in çip ihracat kontrollerine yanıtı iki yönlü oldu. Huawei ve Baidu gibi şirketler giderek daha yetenekli yerel hızlandırıcılar piyasaya sürüyor (Huawei’nin Ascend ailesi ve Baidu’nun M100 çipleri, yabancı GPU’lara bağımlılığı azaltmak için özel olarak tasarlandı). Bu, henüz Nvidia’nın en üst düzey veri merkezi GPU’ları ile eşitlik anlamına gelmiyor ancak genellikle ham verimden ziyade gecikme süresi, belirlenebilirlik ve güç verimliliğine öncelik veren birçok robotik iş yükü için aradaki fark kapanıyor.

Robotik geliştiricileri için yeni Çin işlemcileri çekici: daha az maliyetliler, yerel bulut yığınlarıyla entegre oluyorlar ve büyük, yerel olarak erişilebilir veri setleriyle eşleştirilebiliyorlar. Ayrıca, CUDA ve Nvidia SDK’larına alışkın ekipler için geçiş ve doğrulama maliyetlerini artıran farklı yazılım ekosistemleri ve araç zincirleriyle birlikte geliyorlar. Pratikte, birçok robotik geliştiricisi karma bir dünyada çalışacak: yoğun çevrimdışı eğitim için Nvidia, maliyet ve gecikmenin en önemli olduğu uç çıkarım ve kapalı döngü kontrolü için ise yerel hızlandırıcılar.

Bu durum NVIDIA’nın yol haritası ve robotik müşterileri için ne anlama geliyor?

Nvidia’nın yanıtı tahmin edilebilirdi: ortaklıklara ve somutlaşmış zeka için optimize edilmiş ürün gruplarına ağırlık vermek. Cosmos 3 bu odak noktası düşünülerek tasarlandı ve Unitree ile Sharpa ile yapılan son iş birliği duyuruları, geliştiricileri simülatör, model ve donanımı kapsayan bir ekosisteme hapsetme çabasını gösteriyor. Ancak bunun gibi skor tablosu kayıpları, Nvidia’yı ham FLOP değerlerinin yanı sıra yazılım sağlamlığına ve geliştirici ergonomisine daha fazla vurgu yapmaya itecektir.

Avrupalı ve Alman firmalar için seçim sadece teknik değil, aynı zamanda stratejiktir. AB Çip Yasası ve Alman sanayi politikası, tek bir tedarikçiye aşırı bağımlılığı önlerken en son teknoloji araçlara erişimi güvence altına almayı amaçlıyor. Bu da tedarik kararlarının —Nvidia’da standartlaşmak, maliyet nedenleriyle yerel Çinli hızlandırıcıları benimsemek veya hibrit hatlar tasarlamak— teknik olduğu kadar giderek daha fazla siyasi hale geleceği anlamına geliyor.

Hangi Çinli şirketler robotik için yeni nesil yapay zeka hızlandırıcılarını şekillendiriyor?

Manşetleri süsleyenlerin ötesinde, Çin ekosistemi oldukça geniştir. Huawei gibi tanınmış isimler üst düzey hızlandırıcılar geliştiriyor; Baidu hem çip üretiyor hem de bunları kendi bulut ve otonom yığınlarıyla entegre ediyor. Start-up’lar ve ulusal laboratuvarlar niş alanları dolduruyor: bazıları robotik uzuvlar için düşük güçlü çıkarıma, diğerleri ise yoğun 3D nokta bulutları için hızlandırılmış algılama ağlarına odaklanıyor. Net etki, ucuz yerel silikonun bol veriyle birleşerek daha düşük fiyat noktalarında rekabetçi robotik yığınları üretebildiği katmanlı bir tedarik zinciridir.

Sahadaki profesyonellerin bilmesi gereken rekabet budur: Çin silikonu henüz her Nvidia iş yükü için doğrudan bir alternatif değildir ancak somutlaşmış yapay zeka sistemlerinin çoğunu tanımlayan algılama, kontrol ve simülasyon karışımı için genellikle “yeterince iyi” ve ölçekte çok daha ucuzdur.

Bir robotik kıyaslama sonucu nasıl değerlendirilir (ve ne zaman şüpheci olunmalı?)

Skor tabloları optimizasyonu teşvik eder. İyi ekipler genelleme yapabilen modeller inşa eder; akıllı ekipler ise test için ayar yapar. RoboArena’nın tasarımcıları kıyaslama testini sağlamlaştırmaya çalıştı —rastgeleleştirilmiş görevler, çekişmeli sahneler, aşırı öğrenmeyi önleme önlemleri— ancak hiçbir kıyaslama, dağıtımın karmaşık maliyet, güvenlik ve düzenleyici zorluklarını tam olarak kopyalayamaz. Spirit’in zaferi önemli bir teknik göstergedir, ancak fabrikalarda, hastanelerde veya halka açık sokaklarda dağıtım; yazılım doğrulama, yasal uyumluluk ve bir puanın yakalayamayacağı tedarik zinciri güvenceleri gerektirir.

Bu durum özellikle AB tedarik yetkilileri ve Alman endüstriyel robotik entegratörleri için geçerlidir. En yüksek kıyaslama puanı, güvenlik sertifikasının, uzun vadeli bakım planlarının veya güvenli bir donanım tedarik zincirinin yerini tutmayacaktır.

Çinli hızlandırıcılar ile Nvidia arasında seçim yapan robotik geliştiricileri için pratik tavsiyeler

Birincisi: risk envanterinizi çıkarın. Ürününüz Batılı savunma veya ihracat kontrolü kısıtlamalarını karşılamak zorundaysa, Nvidia ve TSMC üretimi GPU’lar zorunlu olabilir. İkincisi: iş yükünüzün profilini çıkarın. Kontrol döngünüz milisaniyelik belirlenebilirlik ve düşük güç gerektiriyorsa, yerel hızlandırıcılar daha ucuz ve gayet yeterli olabilir. Üçüncüsü: taşınabilirlik için plan yapın. Tedarik veya politika değişikliklerinde modellerin yeniden hedeflenebilmesi için soyutlama katmanları, konteynerli çıkarım yığınları ve donanımdan bağımsız makine öğrenmesi operasyonları (MLOps) kullanın.

Son olarak, eğitim verilerinizin nereden geldiğini düşünün. Çin’de barındırılan büyük özel veri setlerine veya Çince verileri kullanan üçüncü taraf hizmetlere güveniyorsanız, veri erişimi ve yerelleştirmenin jeopolitiği, gelecekte modelleri yeniden üretilebilir şekilde eğitme ve bakımını yapma yeteneğinizi etkileyebilir.

Avrupa neden önemsemeli (ve hala neler üzerinde etkisi olabilir?)

Avrupa, hassas aletlerden uzman sensörlere kadar küresel yarı iletken ve üretim bulmacasının önemli parçalarını tedarik ediyor ve Alman mühendisliği yüksek değerli robotikte merkezi olmaya devam ediyor. Ancak Avrupa’nın politika yanıtı, Çin’deki devlet güdümlü yaklaşımlara kıyasla temkinli kaldı. AB Çip Yasası, Brüksel’e kapasite ve direnci desteklemek için araçlar veriyor ancak bu; veri hatlarını, girişim sermayesi destekli hızlı yineleme döngülerini veya Çin’in halihazırda kullandığı düzenleyici hızı anında yaratmayacaktır.

Avrupa, robotikte anlamlı bir endüstriyel egemenlik istiyorsa, politika yapıcıların donanım sübvansiyonlarını paylaşımlı gerçek dünya veri toplama yatırımları, somutlaşmış sistemleri test etmek için izin verici düzenleyici korumalı alanlar ve sınır ötesi tedarik direnci için daha net tedarik stratejileri ile eşleştirmesi gerekir. Aksi takdirde, Avrupa mühendislere sahip olmaya devam edecek; ancak sadece yüksek kâr marjlı kullanım durumlarını daha ucuz ve daha iyi veriye sahip rakiplerine kaptıracaktır.

Spirit’in RoboArena zaferi önemlidir çünkü rekabeti yeniden çerçeveliyor. ABD-Çin teknoloji savaşının Çin safhası sadece bir sonraki büyük dil modelini (LLM) kimin tasarladığı veya fabrikaları kimin kontrol ettiği ile ilgili değildir; aynı zamanda makinelere gerçek dünyada hareket etmeyi ve çalışmayı öğretmenin karmaşık, pahalı işine kimin sahip olduğuyla da ilgilidir. Bu iş, veriyi, dağıtım hatlarını ve sabırlı devlet sermayesini, işlem gücünü ödüllendirdiği kadar ödüllendirir.

Kısacası: Spirit, Nvidia’yı sadece sihirli bir algoritmayla “yenmedi”. Bunu parayla, veriyle ve robotları eğitim platformlarına dönüştüren ulusal bir ekosistemle yaptı. Nvidia hala büyük eğitim işlerinin temelini oluşturan çipleri satıyor ancak uygulamalı robotik için savaş alanı GPU’lardan çok daha geniş ve dikkat edilmesi gereken değişim tam olarak bu.

Avrupa’nın mühendisleri var. Sadece öğle yemeklerinin parasını ödeyecek birini bulması gerekiyor.

Kaynaklar

  • RoboArena (Stanford Üniversitesi ve California Üniversitesi, Berkeley ile ortaklaşa geliştirilen kıyaslama testi)
  • Pekin Üniversitesi (BigAI enstitüsü ve ilgili araştırmalar)
  • Çin Halk Cumhuriyeti Sanayi ve Bilgi Teknolojileri Bakanlığı (düşük irtifa ekonomisi ve endüstriyel yapay zeka üzerine politika planları)
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Spirit v1.6 ve Nvidia'nın Cosmos3-Nano-Policy modeli RoboArena'da hangi puanları elde etti ve Spirit bu sonuçla birlikte hangi yatırım haberini duyurdu?
A Spirit v1.6, RoboArena'da 1.924 puan alarak 1.881 puan alan Cosmos3-Nano-Policy modelini az farkla geçti. Spirit ayrıca, liderlik tablosundaki bu sürprizle eş zamanlı olarak yaklaşık 222 milyon ABD dolarına denk gelen 1,5 milyar yuanlık bir finansman turu gerçekleştirdiğini duyurdu.
Q RoboArena, ABD-Çin teknoloji rekabetinde neden siyasi açıdan önemli görülüyor?
A RoboArena, bir robot politikasının gözlemleri rastgele ve çekişmeli görevlerde ne kadar başarılı bir şekilde sağlam eylemlere dönüştürdüğünü test ederek, sadece saf işlem gücünden ziyade veri ölçeğini ve dağıtım süreçlerini öne çıkarıyor. Makale, elde edilen sonucun Çin'in avantajını şekillendiren tedarik zincirleri ve veri dinamikleri gibi perde arkası faktörleri yansıttığına dikkat çekiyor.
Q Makaleye göre Çin, robotik yapay zeka konusunda ne tür bir veri avantajına sahip?
A Makale, veriyi Çin'in en belirgin avantajı olarak tanımlıyor. Hükümetler, manipülasyon, navigasyon ve insan etkileşimi görevlerinin eğitimi için düzenlenmiş ve etiketlenmiş veri akışları üreten merkezi robotik veri toplama merkezlerini veya "veri fabrikalarını" gizlice destekliyor. Bu süreç, yabancı GPU'lara olan bağımlılığı azaltmak için yerli üretim hızlandırıcılarla destekleniyor.
Q Nvidia, Çinli hızlandırıcıların yükselişine ve RoboArena sonuçlarına nasıl uyum sağlıyor?
A Nvidia, somutlaştırılmış yapay zeka (embodied intelligence) için ortaklıklara ve ürün gruplarına ağırlık veriyor. Cosmos 3, geliştiricileri simülatör, model ve donanımı kapsayan bir ekosisteme dahil etmek için Unitree ve Sharpa gibi iş birlikleriyle eşleştirilirken; şirket, saf işlem gücünün (FLOPs) yanı sıra yazılım sağlamlığına ve geliştirici ergonomisine de vurgu yapıyor.
Q RoboArena'nın tasarımına hangi kurumlar katkıda bulundu?
A RoboArena, önemli ölçüde akademik katkıyla oluşturuldu. Stanford ve UC Berkeley'nin ortak geliştiriciler arasında yer alması, algılama, planlama ve eylemi rastgele, çekişmeli ortamlarda test eden bir kıyaslama standardının oluşturulmasında önde gelen üniversiteler arasındaki iş birliğine işaret ediyor.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!