Quali dati interni ha pubblicato Anthropic su Claude?

Anthropic ha reso noti dati interni che mostrano come Claude sia passato dal non scrivere quasi alcun codice di produzione all'essere l'autore della maggior parte delle modifiche unite, oltre l'80% delle righe inserite nella base di codice a maggio 2026. Gli ingegneri ora dirigono e revisionano il lavoro scritto dal modello invece di digitarlo in prima persona, riflettendo uno spostamento verso una produzione di codice autonoma.

Cosa propone Anthropic riguardo allo sviluppo dell'IA di frontiera?

Anthropic propone un rallentamento coordinato e verificabile, una pausa o un rallentamento dello sviluppo dell'IA di frontiera, destinato a guadagnare tempo per la ricerca sull'allineamento e la governance. La proposta prevede un processo internazionale in cui i laboratori dotati di risorse adeguate concordano di fermarsi alle stesse condizioni, con prove verificabili che gli altri abbiano effettivamente sospeso le attività, definendo al contempo trigger, arbitri e condizioni di uscita.

Come propongono di implementare e far rispettare una pausa a livello mondiale?

Anthropic delinea due approcci complementari: misure tecniche per consentire un monitoraggio verificabile dell'addestramento su larga scala e dell'esfiltrazione dei pesi dei modelli, e un'architettura politica composta da forum multi-stakeholder che includano governi, principali laboratori, società civile e altri attori. Il piano enfatizza la definizione di trigger, arbitri e condizioni di uscita concordati attraverso un processo internazionale, senza una durata prestabilita e con un focus sulla verifica prima di qualsiasi azione unilaterale.

Anthropic chiede una pausa globale dopo l'auto-programmazione

Q: Perché la verifica è una sfida fondamentale per una pausa globale?

La verifica è importante perché le sessioni di addestramento e lo sviluppo dei modelli sono più facili da nascondere rispetto ad altre attività legate agli armamenti. Anthropic sostiene che molteplici laboratori di frontiera ben finanziati in diversi paesi debbano concordare di fermarsi ed essere in grado di verificare le azioni reciproche; senza un monitoraggio credibile, un singolo attore potrebbe continuare l'addestramento e vanificare qualsiasi pausa.

Hanno pubblicato i numeri, poi hanno chiesto di frenare

Il 4 giugno 2026 l'Anthropic Institute ha pubblicato un saggio, "When AI builds itself" (Quando l'IA si costruisce da sola), che si legge come un audit ingegneristico con un'etichetta di avvertenza: all'interno di Anthropic, afferma l'azienda, la sua famiglia di modelli Claude è passata dal non scrivere quasi alcun codice di produzione all'essere responsabile della maggior parte delle modifiche unite (merge) — oltre l'80% delle righe unite nella base di codice a maggio 2026 — e gli ingegneri ora dirigono e revisionano il lavoro scritto dai modelli invece di digitarlo personalmente. Dopo aver esposto questi dati interni, Anthropic ha concluso che il mondo dovrebbe creare l'opzione per "rallentare o mettere in pausa temporanea lo sviluppo dell'IA di frontiera" se i modelli dovessero iniziare a migliorare se stessi più velocemente di quanto gli esseri umani possano gestire.

Anthropic chiede una pausa globale: prove interne e posta in gioco

La statistica principale — Claude che contribuisce alla parte del leone dei commit di produzione e un incremento di svariate volte della produttività per ingegnere riportato dalla fine del 2024 — non è un vezzo di pubbliche relazioni. Anthropic presenta grafici e risultati di sondaggi interni che mostrano distinti punti di inflessione in cui i modelli sono passati dal suggerimento all'esecuzione autonoma, e collega tale cambiamento direttamente a una categoria di rischio che i ricercatori definiscono "auto-miglioramento ricorsivo". Se un sistema può progettare in modo affidabile successori più rapidi e migliori, il ritmo di crescita delle capacità potrebbe svincolarsi dai cicli di pianificazione umana. Anthropic inquadra la questione come un problema di governance tanto quanto tecnico: una R&S automatizzata più rapida comprime il tempo a disposizione di legislatori, eticisti e ricercatori della sicurezza per reagire.

Anthropic chiede una pausa globale: perché la verifica è il problema

Anthropic non dice semplicemente "fermatevi". L'azienda subordina esplicitamente qualsiasi pausa alla verificabilità: un rallentamento significativo, sostengono, richiederebbe che molteplici laboratori di frontiera ben finanziati in diversi paesi accettino di fermarsi alle stesse condizioni e, aspetto cruciale, che siano in grado di verificare che gli altri si siano effettivamente fermati. I cicli di addestramento e lo sviluppo dei modelli, osserva il saggio, sono molto più facili da nascondere di un silos di missili; il problema della rilevabilità qui è più complesso rispetto ai regimi tradizionali di controllo degli armamenti. È per questo che Anthropic propone di costruire prima i sistemi di verifica, piuttosto che fermarsi unilateralmente sperando che i rivali seguano l'esempio.

Quando pressata per dettagli operativi, i materiali pubblici di Anthropic offrono una prescrizione deliberatamente aperta: la pausa dovrebbe servire a "rallentare o mettere in pausa temporanea lo sviluppo dell'IA di frontiera" finché la ricerca sull'allineamento e le strutture sociali non saranno al passo, con trigger, arbitri e condizioni di uscita da specificare attraverso il processo internazionale che intendono convocare. Non viene proposta una durata fissa. L'azienda paragona la sfida ai regimi di verifica storici — che hanno richiesto decenni per essere costruiti — e avverte che il mondo non ha questo lusso. In breve: la pausa è proposta come meccanismo per guadagnare tempo per la ricerca sull'allineamento e la governance, non come una singola moratoria fissata sul calendario.

Perché la proposta sembrerà un enigma per i decisori politici

Una pausa coordinata e verificabile suona attraente sulla carta ma impossibile nella pratica per molti decisori politici. L'incentivo a defezionare è enorme: qualsiasi attore che continui ad addestrare mentre altri si fermano otterrebbe un vantaggio con conseguenze strategiche, economiche e militari. Questo è il nucleo dell'argomentazione pragmatica di Anthropic a favore della costruzione prioritaria della verifica. È anche il motivo per cui alcuni osservatori vedono il piano come simultaneamente urgente e irrealizzabile senza un importante sostegno statale, in particolare da parte di Stati Uniti e Cina. Il tempismo dell'azienda — che ha pubblicato il saggio poco dopo aver diffuso il proprio Rapporto sui Rischi in base alla Responsible Scaling Policy v3 — sposta deliberatamente la questione nell'arena politica.

Chi è Anthropic e perché dovremmo ascoltarla (o meno)?

Anthropic è l'azienda di IA californiana dietro la famiglia di modelli Claude e la linea di prodotti Claude Code; la sua identità pubblica si basa su una retorica focalizzata sulla sicurezza e su una formale Responsible Scaling Policy. Tale pedigree conferisce credibilità al saggio: Anthropic presenta misurazioni interne dirette, riepiloghi delle schede di sistema e un primo Rapporto sui Rischi pubblico che documenta le capacità e le mitigazioni implementate. Ma si tratta anche della stessa azienda che nel 2026 ha rielaborato la sua Responsible Scaling Policy per distinguere le azioni unilaterali aziendali dai requisiti di settore — una modifica che i critici sostengono abbia ridotto il significato di un precedente e più rigoroso impegno alla pausa. Questa storia è il motivo per cui alcuni commentatori ravvisano un paradosso quando Anthropic chiede ora una pausa globale: l'azienda ha contemporaneamente fatto marcia indietro rispetto alla promessa di una pausa unilaterale e sostiene che il mondo dovrebbe creare un freno coordinato. I lettori dovrebbero trattare sia i nuovi dati che il contesto politico con sano scetticismo.

Una pausa può ridurre il rischio che l'IA diventi incontrollabile?

La risposta di Anthropic è cauta: sì, un rallentamento potrebbe guadagnare tempo per la ricerca sull'allineamento, valutazioni migliori e per permettere alle istituzioni di costruire meccanismi di giudizio e verifica. L'azienda inquadra il rischio come duplice — sistemi che accelerano i flussi di ricerca e sistemi a cui, in linea di principio, potrebbero essere assegnati obiettivi che li portino ad agire autonomamente — e posiziona la pausa come un modo per svincolare la velocità della ricerca da un'escalation incontrollata delle capacità. Ma la mitigazione è subordinata: senza un monitoraggio credibile e un coordinamento internazionale, una pausa che alcuni laboratori rispettano e altri ignorano potrebbe rendere il mondo meno sicuro, non di più. È precisamente per questo che Anthropic sostiene misure tecniche che rendano la defezione rilevabile e protocolli concordati che definiscano i trigger e chi debba arbitrarli.

Come potrebbe essere implementata e fatta rispettare una pausa mondiale — e chi farebbe rispettare le regole?

Anthropic indica due approcci complementari. Primo: costruire controlli tecnici e strumenti di monitoraggio verificabili che rendano possibile rilevare cicli di addestramento su larga scala o l'esfiltrazione di pesi dei modelli. Secondo: costruire un'architettura politica — forum multi-stakeholder con rappresentanza di governi, principali laboratori, società civile e revisori indipendenti — in grado di impostare i trigger e dirimere le controversie. L'azienda richiama analoghi nel controllo degli armamenti ma ammette che il confronto è imperfetto: ci sono voluti decenni per costruire la fiducia e la strumentazione che hanno reso efficaci i trattati passati. Qualsiasi meccanismo di applicazione credibile richiederà una forte partecipazione statale, capacità di audit indipendente e trasparenza pubblica per ridurre la tentazione di barare. Senza ciò, la pausa rischia di essere una moratoria solo di nome. citeturn2view0turn6view0

Cosa stanno già facendo i decisori politici e dove si colloca l'Europa

L'Europa si è mossa più velocemente della maggior parte delle regioni per mettere nero su bianco le basi della governance dell'IA: l'AI Act dell'UE e i nuovi organismi consultivi destinati a supportarne l'applicazione vengono preparati come strumenti pratici per la supervisione. Tali istituzioni potrebbero costituire una parte dell'architettura di verifica richiesta da Anthropic — ad esempio, condizionando l'accesso al mercato al rispetto documentato di qualsiasi rallentamento concordato — ma la portata geografica dell'AI Act e le esenzioni per la sicurezza nazionale significano che Bruxelles non può, da sola, risolvere il problema del coordinamento internazionale. Qualsiasi pausa credibile avrebbe comunque bisogno del sostegno di Stati Uniti e Cina.

Come si inserisce tutto ciò nell'ampia disputa politica su Anthropic

Il documento arriva mentre Anthropic sta portando avanti una controversia di alto profilo con il Dipartimento della Difesa degli Stati Uniti riguardo a una designazione della catena di approvvigionamento e a restrizioni sull'uso militare — una battaglia che ha già attirato amicus curiae del settore e un giudice federale scettico. Questo contesto è importante perché evidenzia le pressioni contrastanti su Anthropic: difendere un futuro commerciale e i contratti governativi, sostenendo al contempo pubblicamente freni globali più rigorosi sui guadagni di capacità. La tensione rende più difficile per gli esterni leggere il saggio come puramente idealistico o puramente opportunistico; si tratta chiaramente di una mossa politica tanto quanto di un appello tecnico.

Cosa resta dopo tutto questo

Anthropic ha fatto qualcosa di insolito per un laboratorio di frontiera: pubblicare metriche operative che mostrano quanto lavoro di ingegneria quotidiana svolgono ora i suoi modelli, e abbinare tali dati a una richiesta di politica pubblica. Il punto centrale dell'azienda è chiaro: se l'IA può accelerare il proprio progresso, la società dovrebbe disporre di una procedura per rallentarla prima che la governance e la ricerca sull'allineamento si ritrovino a inseguire un treno in corsa. La parte difficile — costruire una verifica internazionale credibile ed esecutiva — è ciò che la maggior parte dei decisori politici e dei tecnologi cercherà ora di analizzare. Tale analisi sarà tecnica, geopolitica e complessa; sarà anche il punto in cui la questione di chi ottiene un posto al tavolo diventerà la vera politica. L'Europa può fornire regole e strumenti di ispezione, ma non può sostituire una distensione politica tra Stati Uniti e Cina sulla questione.

È un progresso. Di quelli che non stanno su una presentazione.

Fonti

Anthropic Institute — "When AI builds itself" (saggio aziendale e dati interni)
Anthropic — Rapporto sui Rischi redatto (materiale di implementazione per la Responsible Scaling Policy v3.0, febbraio 2026)
Anthropic — Responsible Scaling Policy v3.0 e schede di sistema correlate
Commissione Europea / Documenti di implementazione dell'EU AI Act e organismi consultivi

Perché Anthropic chiede una pausa globale nello sviluppo dell'IA?

Hanno pubblicato i numeri, poi hanno chiesto di frenare

Anthropic chiede una pausa globale: prove interne e posta in gioco

Anthropic chiede una pausa globale: perché la verifica è il problema

Perché la proposta sembrerà un enigma per i decisori politici

Chi è Anthropic e perché dovremmo ascoltarla (o meno)?

Una pausa può ridurre il rischio che l'IA diventi incontrollabile?

Come potrebbe essere implementata e fatta rispettare una pausa mondiale — e chi farebbe rispettare le regole?

Cosa stanno già facendo i decisori politici e dove si colloca l'Europa

Come si inserisce tutto ciò nell'ampia disputa politica su Anthropic

Cosa resta dopo tutto questo

Fonti

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments