Två vägar till robotaxi

Technology
Two Roads to Robotaxis
Nvidia och Tesla tävlar båda mot helt autonoma transporttjänster, men de satsar på fundamentalt olika tekniska och affärsmässiga strategier – den ena modulär och öppen, den andra vertikalt integrerad och vision-fokuserad.

På CES och på Austins gator: två slående olika ritningar

I början av januari på Consumer Electronics Show i Las Vegas avtäckte Nvidia Alpamayo – en öppen familj av stora vision-språk-handlingsmodeller och tillhörande simuleringsverktyg designade för att lära bilar att "resonera" kring ovanliga trafikscener. Företaget presenterade tekniken som ett tekniksprång för vad man kallar "fysisk AI" och marknadsförde metoden som en lärbar, modulär plattform som biltillverkare kan integrera i sina fordon.

Ett halvår tidigare, i Austin, Texas, började Tesla i tysthet låta en liten flotta av modifierade Model Y-fordon transportera inbjudna passagerare som en del av sitt Robotaxi-pilotprojekt, en synlig demonstration av företagets decennierlånga satsning på körprogramvara som enbart baseras på kameror och tränas av flottan. Denna utrullning – som initialt var begränsad och övervakad – visade på en kontrasterande väg: Tesla levererar programvara inuti fordon som man själv bygger och använder för att samla in körupplevelse från den verkliga världen.

Plattform mot produkt: hur ingenjörsfilosofierna går isär

Nvidias publika budskap är plattformen först. Företaget säljer kisel, middleware, sensorsviter och en operativ miljö (DRIVE Hyperion och DRIVE AGX/Thor), och i januari lyfte företaget fram säkerhetsbedömningar från tredje part och ett ekosystem av samarbetspartners bland biltillverkare som kan använda delar av teknikstacken istället för att bygga upp allt från grunden. Den modellen låter traditionella biltillverkare och nya elbilsproducenter öka tempot genom att lägga ut beräkningskraft och programvara på entreprenad, samtidigt som de förblir fria att välja sensorer och fordonsarkitekturer.

Träningskapacitet: molnkluster, öppna modeller och Dojos öde

Fram till nyligen hade Tesla drivit en skräddarsydd träningsväg med Dojo – ett internt superdatorprojekt som beskrivits som ryggraden för forskning kring Full Self-Driving och i förlängningen för humanoida robotar. Under 2025 omorganiserade Tesla delar av sin beräkningsstrategi, och rapportering sedan mitten av 2025 har beskrivit hur Dojo-programmet avvecklas när företaget skiftat mot andra chip- och klusterplaner. Den förändringen illustrerar en central spänning: att bygga en superdator för träning i världsklass i egen regi är dyrt och tar tid, medan köp eller samhyra av toppmoderna acceleratorer kan skalas snabbare men innebär att man ger upp en del av kontrollen.

Nvidias satsning ser annorlunda ut: tillhandahåll högpresterande beräkningskraft (dess GPU:er och DRIVE SoC:er) och ett öppet lärare-elev-arbetsflöde där en stor resonerande modell som Alpamayo kan destilleras till mindre runtime-nätverk som körs inuti en bil. Företaget tillkännagav också en uppsättning simuleringsverktyg och öppna dataset avsedda att låta många aktörer träna, testa och validera utan att behöva bygga om varje del av infrastrukturen. Det tillvägagångssättet sänker tröskeln för traditionella biltillverkare att införa avancerad förarassistans och på sikt högre nivåer av autonomi.

Sensorer och "long tail"-problemet

De två företagen är även oeniga om sensorer. Nvidias referensdesign Hyperion stöder uttryckligen multimodala sensorsviter – kameror, radar och i allt högre grad lidar – och företaget lyfte fram samarbeten med lidar-leverantörer på CES och i tillkännagivanden om DRIVE Hyperion-plattformen. Nvidia menar att en rikare sensorfusion hjälper system att uppfatta djup och upptäcka faror i scenarier med dålig sikt eller vid edge-cases.

Tesla har istället fördubblat sin satsning på en kamerabaserad strategi och hävdar att mänskliga förare enbart använder synen och att ett vältränat neuralt nätverk kan extrahera djup och rörelse från video. Fördelen är lägre hårdvarukostnad och enklare integration, plus enorma mängder video från Teslas flotta som kontinuerligt kan förbättra modellerna. Nackdelen – som påtalats upprepade gånger av tillsynsmyndigheter och säkerhetsexperter – är osäkerheten kring sällsynta händelser och huruvida system som enbart bygger på synförmåga generaliserar lika bra som multimodala system i ovanliga situationer.

Reglering, incidenter och allmänhetens förtroende

Operativ säkerhet och offentlig granskning är prövostenen för båda strategierna. Teslas FSD- och Autopilot-system har varit föremål för flera regulatoriska undersökningar och en omfattande datamängd av incidentrapporter som lämnats till den amerikanska trafiksäkerhetsmyndigheten. Under 2025 inledde National Highway Traffic Safety Administration en preliminär utvärdering som omfattar miljontals fordon efter rapporter om incidenter vid rödljus och körfältsbyten, vilket belyser både de juridiska riskerna och den politiska granskning som följer på tidiga utrullningar.

Nvidia har betonat säkerhetsbedömningar från tredje part, inklusive samverkan med etablerade bilsäkerhetsorgan, som en del av ett paket som passar bättre in i de befintliga regulatoriska ramverk som biltillverkare förlitar sig på. Företagets koncept – certifierade komponenter, öppna dataset och förklaringsbara resonemangsspår från Alpamayo – är uttryckligen utformat för att hjälpa fordonstillverkare att uppfylla säkerhets- och granskningskrav när de skalar upp autonoma funktioner.

Marknadsdynamik och vägen till skalbarhet

Strategiskt sett jagar Nvidia och Tesla överlappande slutmål – stora autonoma flottor och robotaxitjänster – men med olika risk/avkastningsprofiler. Nvidia säljer till en enorm marknad av biltillverkare som sannolikt kommer att föredra moduluppbyggda, validerade plattformar som de kan integrera i befintliga produktionslinjer; det öppnar många intäktsvägar utan den kapitalintensitet som krävs för att bygga bilar eller driva flottor. Tidiga marknadsreaktioner på Nvidias CES-tillkännagivanden inkluderade kraftiga rörelser i aktier för lidar- och sensorleverantörer, vilket speglar investerarnas tro på att en plattformsstrategi med flera leverantörer påskyndar ekosystemets tillväxt.

Teslas uppsida, om deras vertikalt integrerade strategi lyckas, är en unik helhetsprodukt: en bil, en operativ hjärna tränad på miljarder mil i verklig miljö, och de tjänster som kommersialiserar dessa fordon som robotaxis. Men den modellen koncentrerar operativa, regulatoriska och anseenderelaterade risker till ett och samma ställe – och den nyligen genomförda omorganisationen av Teslas egna beräkningssatsningar understryker hur kostsam och sårbar den vägen kan vara.

Konvergens, konkurrens och vad som händer härnäst

Även om företagen skiljer sig åt kan deras vägar komma att sammanstråla. Nvidias öppna lärare-elev-modell gör det lättare för biltillverkare (och i teorin kanske till och med för Tesla) att använda resonemangsbaserade modeller; Teslas massiva flotta fortsätter att vara en datafördel för maskininlärning från början till slut. Båda lägren kommer att bedömas inte bara utifrån hur sofistikerade deras modeller och kisel är, utan utifrån säkerhet i verkliga förhållanden, transparenta mätvärden för hantering av edge-cases och tillsynsmyndigheters vilja att certifiera drift utan mänsklig tillsyn.

För konsumenter och städer kommer den närmaste tiden att se rörig ut: blandade flottor, ett lapptäcke av regleringar i olika jurisdiktioner och gradvisa tjänsteutrullningar med operatörer och geofencing. För investerare och tekniker är frågan om branschen lutar åt modulära plattformar som gör autonomi allmänt tillgänglig, eller åt ett fåtal vertikalt integrerade vinnare som tar hand om hela stacken. Oavsett vilket framstår kapplöpningen om robotaxis nu som en tävling på flera spår: ett körfält fyllt med miljontals konsumentbilar som samlar in data, det andra med standardiserade plattformar och öppna modeller som lovar snabbare validering och bredare spridning.

Källor

  • NVIDIA pressmaterial (Alpamayo, DRIVE Hyperion och DRIVE AGX-tillkännagivanden)
  • National Highway Traffic Safety Administration (preliminära utvärderings- och utredningsfiler rörande avancerade förarassistanssystem)
  • TÜV SÜD och oberoende rapporter om säkerhetsbedömning av fordon som refereras i leverantörsmaterial
  • Teslas offentliga uttalanden och företagsrapporter gällande FSD, Robotaxi-piloter och beräkningsstrategi
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Vad vill Nvidia och Tesla uppnå med sina strategier för autonoma resor?
A Nvidia satsar på en plattformscentrerad metod fokuserad på Alpamayo, en öppen familj av stora vision-language-action-modeller plus simuleringsverktyg utformade för att låta biltillverkare koppla in komponenter och träna logiskt tänkande för ovanliga trafiksituationer. Tesla driver i kontrast en vertikalt integrerad, kameracentrerad produktstrategi, där de levererar programvara i sina egna fordon och samlar in kördata från verkligheten från sin fordonsflotta.
Q Hur skiljer sig Nvidia och Tesla åt i sina sensorstrategier och varför spelar det roll?
A Nvidia hävdar att mer omfattande sensorfusion genom deras multimodala sensorkonstruktion Hyperion – kameror, radar och alltmer lidar – förbättrar djupseende och upptäckt av faror i scenarier med dålig sikt eller vid ovanliga gränsfall. Tesla lutar sig mot en kameracentrerad modell och hävdar att tränade neurala nätverk kan härleda djup och rörelse från video, vilket möjliggör lägre hårdvarukostnad och snabbare integrering, även om tillsynsmyndigheter och säkerhetsexperter ifrågasätter generaliseringen vid sällsynta händelser.
Q Vilka regulatoriska eller säkerhetsmässiga ramar skiljer Nvidias och Teslas tillvägagångssätt?
A Nvidia betonar säkerhetsbedömningar från tredje part, öppna dataset och förklarbara resonemangsspår för att anpassa sig till befintliga regulatoriska ramverk, vilket presenterar en modulär väg som underlättar skalning och granskning. Tesla har ställts inför regulatoriska utredningar och ett stort antal incidentrapporter för Autopilot och FSD, vilket illustrerar den politiska granskning och risk som följer med ett enskilt helhetssystem (end-to-end).
Q Vilka är marknadsimplikationerna och risk-/belöningsprofilerna för respektive väg?
A Nvidias tillvägagångssätt riktar sig till biltillverkare som vill ha modulära, validerade plattformar som kan integreras i befintliga produktionslinjer, vilket erbjuder flera intäktsströmmar utan att behöva bygga fordonsflottor eller bilar. Teslas end-to-end-strategi skulle kunna leverera en unik robotaxi-tjänst och stark varumärkeslojalitet, men koncentrerar operativ, regulatorisk och anseendemässig risk till ett enda företag, en risk som understryks av deras nyligen genomförda omorganisering av skräddarsydda beräkningsinsatser.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!