Jakie wewnętrzne dane opublikowała firma Anthropic na temat modelu Claude?

Firma Anthropic ujawniła wewnętrzne dane pokazujące, że model Claude przeszedł od pisania znikomej ilości kodu produkcyjnego do tworzenia większości scalanych zmian – według stanu na maj 2026 r. odpowiadał za ponad 80% linii kodu dodawanych do repozytorium. Inżynierowie obecnie raczej kierują pracą modelu i weryfikują ją, niż sami piszą kod, co odzwierciedla przejście w stronę autonomicznego generowania oprogramowania.

Co firma Anthropic proponuje w kwestii rozwoju zaawansowanych systemów AI?

Anthropic proponuje skoordynowane i weryfikowalne spowolnienie, czyli przerwę lub ograniczenie tempa rozwoju zaawansowanych systemów AI, co ma pozwolić na zyskanie czasu na badania nad dopasowaniem (alignment) i budową struktur zarządzania. Propozycja zakłada proces międzynarodowy, w ramach którego dobrze dofinansowane laboratoria zgodziłyby się na wstrzymanie prac na tych samych warunkach, dysponując weryfikowalnymi dowodami, że inni również je wstrzymali, oraz określonymi wyzwalaczami, arbitrami i warunkami wyjścia.

Dlaczego weryfikacja stanowi główne wyzwanie dla globalnej przerwy w pracach nad AI?

Weryfikacja jest kluczowa, ponieważ procesy trenowania modeli i prace rozwojowe łatwiej ukryć niż inne działania zbrojeniowe. Anthropic argumentuje, że wiele dobrze dofinansowanych laboratoriów zajmujących się sztuczną inteligencją w różnych krajach musi porozumieć się w kwestii wstrzymania prac i być w stanie wzajemnie weryfikować swoje działania. Bez wiarygodnego monitoringu jeden podmiot mógłby kontynuować szkolenie modelu, niwecząc skutki ewentualnej przerwy.

Anthropic wzywa do pauzy w AI po sukcesach Claude

Q: W jaki sposób proponują oni wdrożenie i egzekwowanie ogólnoświatowej przerwy?

Anthropic przedstawia dwa uzupełniające się podejścia: środki techniczne umożliwiające weryfikowalne monitorowanie treningów na dużą skalę oraz wycieku wag modeli, a także architekturę polityczną obejmującą fora z udziałem wielu interesariuszy – rządów, głównych laboratoriów, społeczeństwa obywatelskiego i innych podmiotów. Plan kładzie nacisk na ustalone wyzwalacze, arbitrów i warunki wyjścia określone w procesie międzynarodowym, bez z góry narzuconego czasu trwania i z priorytetem weryfikacji przed podjęciem jakichkolwiek jednostronnych działań.

Opublikowali wyniki, a potem poprosili o hamulec

4 czerwca 2026 r. Anthropic Institute opublikował esej „When AI builds itself” („Kiedy AI buduje się sama”), który brzmi jak audyt inżynieryjny z etykietą ostrzegawczą: firma podaje, że wewnątrz Anthropic jej rodzina modeli Claude przeszła drogę od pisania niemal zerowej ilości kodu produkcyjnego do tworzenia większości scalanych zmian – ponad 80% linii scalonych z bazą kodu w maju 2026 r. – a inżynierowie obecnie kierują pracą modeli i ją weryfikują, zamiast pisać ją samodzielnie. Po przedstawieniu tych wewnętrznych danych Anthropic stwierdził, że świat powinien stworzyć możliwość „spowolnienia lub tymczasowego wstrzymania rozwoju pionierskiej sztucznej inteligencji”, jeśli modele zaczną ulepszać się szybciej, niż ludzie będą w stanie nadążyć.

Anthropic wzywa do globalnej pauzy: dowody wewnętrzne i stawka

Główna statystyka – Claude odpowiadający za lwią część commitów produkcyjnych oraz wielokrotny wzrost wydajności na inżyniera od końca 2024 roku – nie jest jedynie PR-owym zabiegiem. Anthropic przedstawia wykresy i wyniki wewnętrznych ankiet pokazujące wyraźne punkty zwrotne, w których modele przeszły od sugestii do autonomicznego wykonywania zadań, i wiąże tę zmianę bezpośrednio z klasą ryzyka, którą badacze nazywają „rekurencyjnym samodoskonaleniem”. Jeśli system potrafi niezawodnie projektować szybszych i lepszych następców, tempo wzrostu możliwości może odłączyć się od ludzkich cykli planowania. Anthropic postrzega to w równym stopniu jako problem zarządzania, co techniczny: szybsze zautomatyzowane prace badawczo-rozwojowe (R&D) ograniczają czas, jaki organy regulacyjne, etycy i badacze bezpieczeństwa mają na reakcję.

Anthropic wzywa do globalnej pauzy: dlaczego weryfikacja jest problemem

Anthropic nie mówi po prostu „stop”. Firma wyraźnie uzależnia każdą pauzę od możliwości weryfikacji: sensowne spowolnienie, jak argumentują, wymagałoby od wielu dobrze finansowanych laboratoriów zajmujących się sztuczną inteligencją w kilku krajach zgody na zatrzymanie prac na tych samych warunkach oraz – co kluczowe – możliwości zweryfikowania, czy pozostałe podmioty faktycznie to zrobiły. Esej zauważa, że cykle trenowania i rozwój modeli są znacznie łatwiejsze do ukrycia niż silos rakietowy; problem wykrywalności jest tutaj trudniejszy niż w tradycyjnych reżimach kontroli zbrojeń. To właśnie powód, dla którego Anthropic proponuje najpierw zbudowanie systemów weryfikacji, zamiast jednostronnego wstrzymania prac w nadziei, że rywale pójdą w ich ślady.

Gdy poproszono o szczegóły operacyjne, materiały publiczne Anthropic przedstawiają celowo otwartą receptę: pauza miałaby „spowolnić lub tymczasowo wstrzymać rozwój pionierskiej sztucznej inteligencji” do czasu, aż badania nad dopasowaniem (alignment) i struktury społeczne nadrobią zaległości, z wyzwalaczami, arbitrami i warunkami zakończenia określonymi w procesie międzynarodowym, który firma chce zwołać. Nie zaproponowano żadnego ustalonego czasu trwania. Firma porównuje to wyzwanie do historycznych reżimów weryfikacji – których budowa zajęła dekady – i ostrzega, że świat nie ma takiego luksusu. Krótko mówiąc: pauza jest proponowana jako mechanizm zyskania czasu na badania nad dopasowaniem i zarządzanie, a nie jako jednorazowe moratorium ograniczone kalendarzem.

Dlaczego propozycja będzie dla decydentów zagadką

Skoordynowana, weryfikowalna pauza brzmi atrakcyjnie na papierze, ale dla wielu decydentów jest w praktyce niemożliwa. Pokusa wyłamania się jest ogromna: każdy podmiot, który kontynuowałby szkolenie modeli podczas gdy inni przestali, zyskałby przewagę o strategicznych, gospodarczych i militarnych konsekwencjach. To sedno pragmatycznego argumentu Anthropic za tym, by najpierw zbudować system weryfikacji. Jest to również powód, dla którego niektórzy obserwatorzy postrzegają plan jako jednocześnie pilny i nieosiągalny bez dużego poparcia ze strony państw – zwłaszcza Stanów Zjednoczonych i Chin. Czas wybrany przez firmę – publikacja eseju krótko po wydaniu własnego Raportu o Ryzyku (Risk Report) w ramach Responsible Scaling Policy v3 – celowo przenosi tę kwestię na arenę polityczną.

Kim jest Anthropic i dlaczego powinniśmy słuchać (lub nie)?

Anthropic to kalifornijska firma AI stojąca za rodziną modeli Claude i linią produktów Claude Code; jej tożsamość publiczna opiera się na retoryce skupionej na bezpieczeństwie i formalnej polityce Responsible Scaling Policy. Ten rodowód nadaje esejowi wiarygodności: Anthropic przedstawia bezpośrednie pomiary wewnętrzne, podsumowania kart systemowych (system cards) i pierwszy publiczny Raport o Ryzyku dokumentujący możliwości i stosowane środki łagodzące. Jest to jednak ta sama firma, która w 2026 roku zrewidowała swoją politykę Responsible Scaling Policy, aby odróżnić jednostronne działania firmy od wymogów całej branży – zmiana, którą krytycy oceniają jako zawężenie znaczenia wcześniejszego, bardziej rygorystycznego zobowiązania do pauzy. Ta historia sprawia, że niektórzy komentatorzy słyszą paradoks, gdy Anthropic wzywa teraz do globalnej pauzy: firma jednocześnie wycofała się z obietnicy jednostronnej pauzy i argumentuje, że świat powinien stworzyć skoordynowany hamulec. Czytelnicy powinni traktować zarówno nowe dane, jak i kontekst polityczny ze zdrowym sceptycyzmem.

Czy pauza może zmniejszyć ryzyko, że sztuczna inteligencja stanie się niekontrolowana?

Odpowiedź Anthropic jest ostrożna: tak, spowolnienie mogłoby zyskać czas na badania nad dopasowaniem, lepsze ewaluacje oraz na zbudowanie przez instytucje mechanizmów orzekania i weryfikacji. Firma przedstawia ryzyko jako dwupoziomowe – systemy, które przyspieszają potoki badawcze, oraz systemy, którym w zasadzie można by wyznaczyć cele prowadzące do autonomicznego działania – i pozycjonuje pauzę jako sposób na oddzielenie prędkości badań od niekontrolowanej eskalacji możliwości. Jednak to łagodzenie jest warunkowe: bez wiarygodnego monitorowania i międzynarodowej koordynacji, pauza przestrzegana przez niektóre laboratoria, a ignorowana przez inne, mogłaby uczynić świat mniej, a nie bardziej bezpiecznym. Właśnie dlatego Anthropic opowiada się za środkami technicznymi, które czynią wykrywalnym wyłamanie się z ustaleń, oraz za uzgodnionymi protokołami definiującymi wyzwalacze i podmioty je orzekające.

Jak światowa pauza mogłaby zostać wdrożona i wyegzekwowana — i kto by ją nadzorował?

Anthropic wskazuje na dwa uzupełniające się podejścia. Po pierwsze: budowa weryfikowalnych środków technicznych i narzędzi monitorujących, które umożliwiają wykrywanie szkoleń na dużą skalę lub eksfiltrację wag modelu. Po drugie: budowa architektury politycznej – wielostronnych forów z reprezentacją rządów, głównych laboratoriów, społeczeństwa obywatelskiego i niezależnych audytorów – które mogą wyznaczać wyzwalacze i rozstrzygać spory. Firma odwołuje się do analogii w kontroli zbrojeń, ale przyznaje, że porównanie jest niedoskonałe: budowa zaufania i instrumentarium, które sprawiły, że dawne traktaty zadziałały, zajęła dekady. Każdy wiarygodny mechanizm egzekwowania będzie wymagał silnego udziału państw, zdolności do niezależnego audytu i przejrzystości publicznej, aby zmniejszyć pokusę oszukiwania. Bez tego pauza prawdopodobnie będzie moratorium tylko z nazwy. citeturn2view0turn6view0

Co robią decydenci i gdzie w tym wszystkim znajduje się Europa?

Europa działa szybciej niż większość regionów w kwestii spisywania podstaw zarządzania sztuczną inteligencją: unijny akt o sztucznej inteligencji (EU AI Act) i nowe organy doradcze mające wspierać jego egzekwowanie są przygotowywane jako praktyczne instrumenty nadzoru. Instytucje te mogłyby stanowić część architektury weryfikacyjnej, o którą apeluje Anthropic – na przykład poprzez uzależnienie dostępu do rynku od udokumentowanej zgodności z jakimkolwiek uzgodnionym spowolnieniem – ale zasięg geograficzny AI Act oraz wyłączenia dotyczące bezpieczeństwa narodowego oznaczają, że Bruksela nie może samodzielnie rozwiązać problemu międzynarodowej koordynacji. Każda wiarygodna pauza nadal wymagałaby poparcia ze strony Stanów Zjednoczonych i Chin.

Jak to wpisuje się w szerszy spór polityczny wokół Anthropic

Dokument pojawia się w czasie, gdy Anthropic prowadzi głośny spór z Departamentem Obrony USA dotyczący wyznaczenia łańcucha dostaw i ograniczeń w zastosowaniach wojskowych – walkę, która już przyciągnęła amicus curiae z branży i sceptycznego sędziego federalnego. Ten kontekst jest ważny, ponieważ podkreśla sprzeczne presje wywierane na Anthropic: obronę komercyjnej przyszłości i kontraktów rządowych przy jednoczesnym publicznym argumentowaniu za ściślejszymi globalnymi hamulcami dla wzrostu możliwości. To napięcie utrudnia obserwatorom odczytanie eseju jako czysto idealistycznego lub czysto interesownego; jest to wyraźnie ruch polityczny, w takim samym stopniu co techniczny apel.

Wnioski

Anthropic zrobiło coś nietypowego dla pionierskiego laboratorium: opublikowało wskaźniki operacyjne pokazujące, jak dużą część codziennych prac inżynieryjnych wykonują teraz ich modele, i połączyło te dane z publicznym żądaniem politycznym. Główny punkt firmy jest prosty: jeśli AI potrafi przyspieszać własny postęp, społeczeństwo powinno mieć procedurę, aby je spowolnić, zanim badania nad zarządzaniem i dopasowaniem zostaną w tyle za pędzącym pociągiem. Najtrudniejsza część – budowa wiarygodnej, egzekwowalnej, międzynarodowej weryfikacji – to coś, co większość decydentów i technologów będzie teraz próbowała rozpracować. To rozpracowywanie będzie techniczne, geopolityczne i nieuporządkowane; będzie to również moment, w którym kwestia tego, kto zasiądzie do stołu, stanie się prawdziwą polityką. Europa może dostarczyć zasady i instrumenty inspekcji, ale nie zastąpi odprężenia politycznego między USA a Chinami w tej kwestii.

To postęp. Tego rodzaju, który nie mieści się w prezentacji.

Źródła

Anthropic Institute — „When AI builds itself” (esej firmowy i dane wewnętrzne)
Anthropic — Redacted Risk Report (materiał wdrożeniowy dla Responsible Scaling Policy v3.0, luty 2026)
Anthropic — Responsible Scaling Policy v3.0 i powiązane karty systemowe
Komisja Europejska / dokumenty wdrożeniowe EU AI Act i organy doradcze

Dlaczego Anthropic wzywa do globalnego wstrzymania rozwoju sztucznej inteligencji?

Opublikowali wyniki, a potem poprosili o hamulec

Anthropic wzywa do globalnej pauzy: dowody wewnętrzne i stawka

Anthropic wzywa do globalnej pauzy: dlaczego weryfikacja jest problemem

Dlaczego propozycja będzie dla decydentów zagadką

Kim jest Anthropic i dlaczego powinniśmy słuchać (lub nie)?

Czy pauza może zmniejszyć ryzyko, że sztuczna inteligencja stanie się niekontrolowana?

Jak światowa pauza mogłaby zostać wdrożona i wyegzekwowana — i kto by ją nadzorował?

Co robią decydenci i gdzie w tym wszystkim znajduje się Europa?

Jak to wpisuje się w szerszy spór polityczny wokół Anthropic

Wnioski

Źródła

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments