Varför kräver Anthropic en global paus i AI-utvecklingen?

AI
Why is Anthropic calling for a global pause in AI development?
Anthropics institut har publicerat ny intern data som visar att Claude numera skriver huvuddelen av företagets kod. De efterlyser en samordnad och verifierbar avmattning för avancerad AI, men varnar för att verifiering och geopolitik gör en verklig global paus extremt svårgenomförbar.

De publicerade siffrorna, sedan bad de om en broms

Den 4 juni 2026 publicerade Anthropic Institute essän "When AI builds itself", som läses som en teknisk revision med en varningsetikett: Anthropic uppger att deras Claude-modellfamilj internt gick från att skriva nästan ingen produktionskod alls till att författa merparten av alla sammanslagna ändringar – mer än 80 % av kodraderna per maj 2026 – och att ingenjörer nu styr och granskar modellskrivet arbete snarare än att skriva det själva. Efter att ha presenterat denna interna data drog Anthropic slutsatsen att världen bör skapa möjligheten att "bromsa eller tillfälligt pausa utvecklingen av avancerad AI" om modellerna börjar förbättra sig själva snabbare än vad människor hinner hantera.

Anthropic efterlyser global paus: interna bevis och insatserna

Rubrikstatistiken – att Claude bidrar med lejonparten av alla produktionsincheckningar och en rapporterad mångfaldig ökning av produktionen per ingenjör sedan slutet av 2024 – är inte någon PR-glansbild. Anthropic presenterar grafer och interna enkätresultat som visar tydliga brytpunkter när modellerna gick från att ge förslag till att utföra arbete autonomt, och kopplar denna förändring direkt till en typ av risk som forskare kallar "rekursiv självförbättring". Om ett system på ett tillförlitligt sätt kan designa snabbare och bättre efterföljare, kan takten i kapacitetstillväxten frikopplas från mänskliga planeringscykler. Anthropic ramar in detta som ett styrningsproblem snarare än ett tekniskt problem: snabbare automatiserad forskning och utveckling komprimerar den tid som tillsynsmyndigheter, etiker och säkerhetsforskare har på sig att reagera.

Anthropic efterlyser global paus: varför verifiering är problemet

Anthropic säger inte bara "stopp". Företaget villkorar uttryckligen varje paus med verifierbarhet: en meningsfull nedbromsning, menar de, skulle kräva att flera välresursstarka gränsöverskridande lab över flera länder enas om att stoppa under samma förutsättningar, och – avgörande – att kunna verifiera att de andra faktiskt har stoppat. Träningskörningar och modellutveckling är, noterar essän, mycket lättare att dölja än en missilsilo; problemet med upptäckbarhet är här svårare än i traditionella rustningskontrollregimer. Det är anledningen till att Anthropic föreslår att man bygger verifieringssystemen först, snarare än att ensidigt stanna av och hoppas att rivaler följer efter.

När Anthropic pressas på operationella detaljer ger företagets publika material ett medvetet öppet recept: pausen skulle innebära att "bromsa eller tillfälligt pausa utvecklingen av avancerad AI" tills forskning om linjering (alignment) och samhälleliga strukturer hunnit ikapp, med utlösande faktorer, skiljedomare och villkor för avslut som ska specificeras av den internationella process de vill sammankalla. Det finns ingen fastställd varaktighet. Företaget jämför utmaningen med historiska verifieringsregimer – som tog årtionden att bygga upp – och varnar för att världen inte har den lyxen. Kort sagt: pausen föreslås som en mekanism för att köpa tid för linjeringsforskning och styrning, inte som ett enskilt kalenderbundet moratorium.

Varför förslaget kommer att uppfattas som en gåta av beslutsfattare

En samordnad, verifierbar paus låter attraktiv på pappret men omöjlig i praktiken för många beslutsfattare. Incitamentet att avvika är enormt: varje aktör som fortsätter träna medan andra stannar skulle ärva ett försprång med strategiska, ekonomiska och militära konsekvenser. Det är kärnan i Anthropics pragmatiska argument för att bygga verifiering först. Det är också anledningen till att vissa bedömare ser planen som både brådskande och ouppnåelig utan omfattande stöd från stater – i synnerhet USA och Kina. Företagets tajming – att släppa essän strax efter att ha publicerat sin egen Riskrapport enligt Responsible Scaling Policy v3 – skjuter medvetet in frågan i den politiska arenan.

Vilka är Anthropic och varför ska vi lyssna (eller inte)?

Anthropic är det kaliforniska AI-företaget bakom Claude-familjen av modeller och produktlinjen Claude Code; deras publika identitet är byggd på säkerhetsfokuserad retorik och en formell Responsible Scaling Policy. Den bakgrunden ger essän trovärdighet: Anthropic presenterar direkta interna mätningar, sammanfattningar av systemkort och en första publik Riskrapport som dokumenterar de förmågor och motåtgärder de använder. Men detta är också samma företag som 2026 omarbetade sin Responsible Scaling Policy för att skilja på ensidiga företagsåtgärder och branschövergripande krav – en ändring som kritiker menar begränsade innebörden av ett tidigare, strängare pausåtagande. Den historien är anledningen till att vissa kommentatorer hör en paradox när Anthropic nu efterlyser en global paus: företaget har samtidigt backat från ett löfte om ensidig paus och argumenterar för att världen bör skapa en samordnad broms. Läsare bör betrakta både den nya datan och den politiska kontexten med en sund skepsis.

Kan en paus minska risken för att AI blir okontrollerbar?

Anthropics svar är försiktigt: ja, en nedbromsning skulle kunna köpa tid för linjeringsforskning, förbättrade utvärderingar och för institutioner att bygga mekanismer för prövning och verifiering. Företaget ramar in risken som tvåfaldig – system som snabbar på forskningspipelines och system som i princip skulle kunna ges mål som leder till att de agerar autonomt – och positionerar en paus som ett sätt att frikoppla forskningshastighet från okontrollerad kapacitetseskalering. Men motåtgärden är villkorad: utan trovärdig övervakning och internationell samordning skulle en paus som vissa lab följer och andra ignorerar kunna göra världen mindre säker, inte mer. Det är just därför Anthropic argumenterar för tekniska åtgärder som gör avvikelser upptäckbara och för överenskomna protokoll som definierar utlösande faktorer och vem som prövar dem.

Hur skulle en världsomspännande paus kunna implementeras och upprätthållas — och vem skulle sköta övervakningen?

Anthropic pekar på två komplementära tillvägagångssätt. För det första: bygg verifierbara tekniska kontroller och övervakningsverktyg som gör det möjligt att upptäcka storskaliga träningskörningar eller stöld av modellvikter. För det andra: bygg en politisk arkitektur – forum med flera intressenter med representation från regeringar, stora lab, det civila samhället och oberoende revisorer – som kan sätta utlösande faktorer och pröva tvister. Företaget åberopar analogier inom rustningskontroll men medger att jämförelsen är ofullständig: det tog årtionden att bygga upp det förtroende och den instrumentering som fick tidigare fördrag att fungera. Varje trovärdig mekanism för efterlevnad kommer att behöva starkt statligt deltagande, oberoende revisionskapacitet och offentlig transparens för att minska frestelsen att fuska. Utan det kommer pausen sannolikt bara vara ett moratorium till namnet. citeturn2view0turn6view0

Vad beslutsfattare redan gör och var Europa passar in

Europa har rört sig snabbare än de flesta regioner för att få ner grunderna för AI-styrning på papper: EU:s AI-förordning (AI Act) och de nya rådgivande organen som ska stödja dess efterlevnad görs nu redo som praktiska instrument för tillsyn. Dessa institutioner skulle kunna utgöra en del av den verifieringsarkitektur som Anthropic efterlyser – till exempel genom att villkora marknadstillträde med dokumenterad efterlevnad av varje överenskommen nedbromsning – men AI-förordningens geografiska omfattning och undantag för nationell säkerhet innebär att Bryssel inte på egen hand kan lösa problemet med internationell samordning. Varje trovärdig paus skulle fortfarande behöva stöd från USA och Kina.

Hur detta passar in i den bredare politiska konflikten kring Anthropic

Dokumentet anländer samtidigt som Anthropic driver en uppmärksammad tvist med USA:s försvarsdepartement över en leveranskedjedesignering och restriktioner för militär användning – en strid som redan har dragit till sig branschaktörer och en skeptisk federal domare. Den kontexten är viktig eftersom den belyser de konkurrerande påfrestningarna på Anthropic: att försvara en kommersiell framtid och statliga kontrakt, samtidigt som de offentligt argumenterar för strängare globala bromsar på kapacitetsvinster. Spänningen gör det svårare för utomstående att tolka essän som enbart idealistisk eller enbart egennyttig; det är tydligt att det är ett politiskt drag lika mycket som en teknisk vädjan.

Var detta lämnar oss

Anthropic har gjort något ovanligt för ett gränsöverskridande lab: publicerat operativa mätetal som visar hur mycket av det dagliga ingenjörsarbetet deras modeller nu utför, och parat ihop den datan med ett politiskt krav. Företagets huvudpunkt är tydlig: om AI kan påskynda sin egen utveckling bör samhället ha en procedur för att bromsa den innan styrning och linjeringsforskning lämnas kvar jagande efter ett skenande tåg. Den svåra delen – att bygga trovärdig, verkställbar, internationell verifiering – är vad de flesta beslutsfattare och teknologer nu kommer att försöka bena ut. Den processen kommer att vara teknisk, geopolitisk och stökig; det kommer också att vara där frågan om vem som får en plats vid bordet blir den verkliga politiken. Europa kan tillhandahålla regler och inspektionsinstrument, men det kan inte ersätta en politisk avspänning mellan USA och Kina i frågan.

Det är framsteg. Den sorten som inte får plats i en presentationsbild.

Källor

  • Anthropic Institute — "When AI builds itself" (företagsessä och interna data)
  • Anthropic — Redacted Risk Report (implementeringsmaterial för Responsible Scaling Policy v3.0, feb 2026)
  • Anthropic — Responsible Scaling Policy v3.0 och relaterade systemkort
  • Europeiska kommissionen / Implementeringsdokument för EU AI Act och rådgivande organ
Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Vilken intern data publicerade Anthropic om Claude?
A Anthropic offentliggjorde intern data som visar att Claude har gått från att nästan inte skriva någon produktionskod alls till att författa majoriteten av de sammanslagna ändringarna, mer än 80 % av kodraderna per maj 2026. Ingenjörer styr och granskar nu modellens arbete istället för att skriva koden själva, vilket speglar ett skifte mot autonom kodproduktion.
Q Vad föreslår Anthropic gällande utvecklingen av frontier-AI?
A Anthropic föreslår en samordnad, verifierbar nedgång, en paus eller inbromsning av utvecklingen av frontier-AI, i syfte att köpa tid för forskning kring säkerhetsanpassning och styrning. Förslaget innebär en internationell process där välresursstarka labb går med på att stoppa utvecklingen under samma villkor, med verifierbara bevis på att andra faktiskt har pausat, samt definierade utlösande faktorer, granskare och villkor för avslut.
Q Varför är verifiering en central utmaning för en global paus?
A Verifiering är avgörande eftersom träningskörningar och modellutveckling är lättare att dölja än andra typer av rustningsverksamhet. Anthropic hävdar att flera välresursstarka frontier-labb i olika länder måste komma överens om att sluta och kunna verifiera varandras handlingar; utan trovärdig övervakning skulle en enskild aktör kunna fortsätta träningen och underminera hela pausen.
Q Hur föreslår de att en världsomspännande paus ska genomföras och efterlevas?
A Anthropic skisserar två kompletterande tillvägagångssätt: tekniska åtgärder för att möjliggöra verifierbar övervakning av storskalig träning och exfiltrering av modellvikter, samt en politisk arkitektur bestående av forum med flera intressenter där regeringar, stora labb, civilsamhället och andra aktörer ingår. Planen betonar överenskomna utlösande faktorer, granskare och villkor för avslut definierade genom en internationell process, utan fastställd varaktighet och med fokus på verifiering innan några unilaterala åtgärder vidtas.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!