Opublikowali wyniki, a potem poprosili o hamulec
4 czerwca 2026 r. Anthropic Institute opublikował esej „When AI builds itself” („Kiedy AI buduje się sama”), który brzmi jak audyt inżynieryjny z etykietą ostrzegawczą: firma podaje, że wewnątrz Anthropic jej rodzina modeli Claude przeszła drogę od pisania niemal zerowej ilości kodu produkcyjnego do tworzenia większości scalanych zmian – ponad 80% linii scalonych z bazą kodu w maju 2026 r. – a inżynierowie obecnie kierują pracą modeli i ją weryfikują, zamiast pisać ją samodzielnie. Po przedstawieniu tych wewnętrznych danych Anthropic stwierdził, że świat powinien stworzyć możliwość „spowolnienia lub tymczasowego wstrzymania rozwoju pionierskiej sztucznej inteligencji”, jeśli modele zaczną ulepszać się szybciej, niż ludzie będą w stanie nadążyć.
Anthropic wzywa do globalnej pauzy: dowody wewnętrzne i stawka
Główna statystyka – Claude odpowiadający za lwią część commitów produkcyjnych oraz wielokrotny wzrost wydajności na inżyniera od końca 2024 roku – nie jest jedynie PR-owym zabiegiem. Anthropic przedstawia wykresy i wyniki wewnętrznych ankiet pokazujące wyraźne punkty zwrotne, w których modele przeszły od sugestii do autonomicznego wykonywania zadań, i wiąże tę zmianę bezpośrednio z klasą ryzyka, którą badacze nazywają „rekurencyjnym samodoskonaleniem”. Jeśli system potrafi niezawodnie projektować szybszych i lepszych następców, tempo wzrostu możliwości może odłączyć się od ludzkich cykli planowania. Anthropic postrzega to w równym stopniu jako problem zarządzania, co techniczny: szybsze zautomatyzowane prace badawczo-rozwojowe (R&D) ograniczają czas, jaki organy regulacyjne, etycy i badacze bezpieczeństwa mają na reakcję.
Anthropic wzywa do globalnej pauzy: dlaczego weryfikacja jest problemem
Anthropic nie mówi po prostu „stop”. Firma wyraźnie uzależnia każdą pauzę od możliwości weryfikacji: sensowne spowolnienie, jak argumentują, wymagałoby od wielu dobrze finansowanych laboratoriów zajmujących się sztuczną inteligencją w kilku krajach zgody na zatrzymanie prac na tych samych warunkach oraz – co kluczowe – możliwości zweryfikowania, czy pozostałe podmioty faktycznie to zrobiły. Esej zauważa, że cykle trenowania i rozwój modeli są znacznie łatwiejsze do ukrycia niż silos rakietowy; problem wykrywalności jest tutaj trudniejszy niż w tradycyjnych reżimach kontroli zbrojeń. To właśnie powód, dla którego Anthropic proponuje najpierw zbudowanie systemów weryfikacji, zamiast jednostronnego wstrzymania prac w nadziei, że rywale pójdą w ich ślady.
Gdy poproszono o szczegóły operacyjne, materiały publiczne Anthropic przedstawiają celowo otwartą receptę: pauza miałaby „spowolnić lub tymczasowo wstrzymać rozwój pionierskiej sztucznej inteligencji” do czasu, aż badania nad dopasowaniem (alignment) i struktury społeczne nadrobią zaległości, z wyzwalaczami, arbitrami i warunkami zakończenia określonymi w procesie międzynarodowym, który firma chce zwołać. Nie zaproponowano żadnego ustalonego czasu trwania. Firma porównuje to wyzwanie do historycznych reżimów weryfikacji – których budowa zajęła dekady – i ostrzega, że świat nie ma takiego luksusu. Krótko mówiąc: pauza jest proponowana jako mechanizm zyskania czasu na badania nad dopasowaniem i zarządzanie, a nie jako jednorazowe moratorium ograniczone kalendarzem.
Dlaczego propozycja będzie dla decydentów zagadką
Skoordynowana, weryfikowalna pauza brzmi atrakcyjnie na papierze, ale dla wielu decydentów jest w praktyce niemożliwa. Pokusa wyłamania się jest ogromna: każdy podmiot, który kontynuowałby szkolenie modeli podczas gdy inni przestali, zyskałby przewagę o strategicznych, gospodarczych i militarnych konsekwencjach. To sedno pragmatycznego argumentu Anthropic za tym, by najpierw zbudować system weryfikacji. Jest to również powód, dla którego niektórzy obserwatorzy postrzegają plan jako jednocześnie pilny i nieosiągalny bez dużego poparcia ze strony państw – zwłaszcza Stanów Zjednoczonych i Chin. Czas wybrany przez firmę – publikacja eseju krótko po wydaniu własnego Raportu o Ryzyku (Risk Report) w ramach Responsible Scaling Policy v3 – celowo przenosi tę kwestię na arenę polityczną.
Kim jest Anthropic i dlaczego powinniśmy słuchać (lub nie)?
Anthropic to kalifornijska firma AI stojąca za rodziną modeli Claude i linią produktów Claude Code; jej tożsamość publiczna opiera się na retoryce skupionej na bezpieczeństwie i formalnej polityce Responsible Scaling Policy. Ten rodowód nadaje esejowi wiarygodności: Anthropic przedstawia bezpośrednie pomiary wewnętrzne, podsumowania kart systemowych (system cards) i pierwszy publiczny Raport o Ryzyku dokumentujący możliwości i stosowane środki łagodzące. Jest to jednak ta sama firma, która w 2026 roku zrewidowała swoją politykę Responsible Scaling Policy, aby odróżnić jednostronne działania firmy od wymogów całej branży – zmiana, którą krytycy oceniają jako zawężenie znaczenia wcześniejszego, bardziej rygorystycznego zobowiązania do pauzy. Ta historia sprawia, że niektórzy komentatorzy słyszą paradoks, gdy Anthropic wzywa teraz do globalnej pauzy: firma jednocześnie wycofała się z obietnicy jednostronnej pauzy i argumentuje, że świat powinien stworzyć skoordynowany hamulec. Czytelnicy powinni traktować zarówno nowe dane, jak i kontekst polityczny ze zdrowym sceptycyzmem.
Czy pauza może zmniejszyć ryzyko, że sztuczna inteligencja stanie się niekontrolowana?
Odpowiedź Anthropic jest ostrożna: tak, spowolnienie mogłoby zyskać czas na badania nad dopasowaniem, lepsze ewaluacje oraz na zbudowanie przez instytucje mechanizmów orzekania i weryfikacji. Firma przedstawia ryzyko jako dwupoziomowe – systemy, które przyspieszają potoki badawcze, oraz systemy, którym w zasadzie można by wyznaczyć cele prowadzące do autonomicznego działania – i pozycjonuje pauzę jako sposób na oddzielenie prędkości badań od niekontrolowanej eskalacji możliwości. Jednak to łagodzenie jest warunkowe: bez wiarygodnego monitorowania i międzynarodowej koordynacji, pauza przestrzegana przez niektóre laboratoria, a ignorowana przez inne, mogłaby uczynić świat mniej, a nie bardziej bezpiecznym. Właśnie dlatego Anthropic opowiada się za środkami technicznymi, które czynią wykrywalnym wyłamanie się z ustaleń, oraz za uzgodnionymi protokołami definiującymi wyzwalacze i podmioty je orzekające.
Jak światowa pauza mogłaby zostać wdrożona i wyegzekwowana — i kto by ją nadzorował?
Anthropic wskazuje na dwa uzupełniające się podejścia. Po pierwsze: budowa weryfikowalnych środków technicznych i narzędzi monitorujących, które umożliwiają wykrywanie szkoleń na dużą skalę lub eksfiltrację wag modelu. Po drugie: budowa architektury politycznej – wielostronnych forów z reprezentacją rządów, głównych laboratoriów, społeczeństwa obywatelskiego i niezależnych audytorów – które mogą wyznaczać wyzwalacze i rozstrzygać spory. Firma odwołuje się do analogii w kontroli zbrojeń, ale przyznaje, że porównanie jest niedoskonałe: budowa zaufania i instrumentarium, które sprawiły, że dawne traktaty zadziałały, zajęła dekady. Każdy wiarygodny mechanizm egzekwowania będzie wymagał silnego udziału państw, zdolności do niezależnego audytu i przejrzystości publicznej, aby zmniejszyć pokusę oszukiwania. Bez tego pauza prawdopodobnie będzie moratorium tylko z nazwy. citeturn2view0turn6view0
Co robią decydenci i gdzie w tym wszystkim znajduje się Europa?
Europa działa szybciej niż większość regionów w kwestii spisywania podstaw zarządzania sztuczną inteligencją: unijny akt o sztucznej inteligencji (EU AI Act) i nowe organy doradcze mające wspierać jego egzekwowanie są przygotowywane jako praktyczne instrumenty nadzoru. Instytucje te mogłyby stanowić część architektury weryfikacyjnej, o którą apeluje Anthropic – na przykład poprzez uzależnienie dostępu do rynku od udokumentowanej zgodności z jakimkolwiek uzgodnionym spowolnieniem – ale zasięg geograficzny AI Act oraz wyłączenia dotyczące bezpieczeństwa narodowego oznaczają, że Bruksela nie może samodzielnie rozwiązać problemu międzynarodowej koordynacji. Każda wiarygodna pauza nadal wymagałaby poparcia ze strony Stanów Zjednoczonych i Chin.
Jak to wpisuje się w szerszy spór polityczny wokół Anthropic
Dokument pojawia się w czasie, gdy Anthropic prowadzi głośny spór z Departamentem Obrony USA dotyczący wyznaczenia łańcucha dostaw i ograniczeń w zastosowaniach wojskowych – walkę, która już przyciągnęła amicus curiae z branży i sceptycznego sędziego federalnego. Ten kontekst jest ważny, ponieważ podkreśla sprzeczne presje wywierane na Anthropic: obronę komercyjnej przyszłości i kontraktów rządowych przy jednoczesnym publicznym argumentowaniu za ściślejszymi globalnymi hamulcami dla wzrostu możliwości. To napięcie utrudnia obserwatorom odczytanie eseju jako czysto idealistycznego lub czysto interesownego; jest to wyraźnie ruch polityczny, w takim samym stopniu co techniczny apel.
Wnioski
Anthropic zrobiło coś nietypowego dla pionierskiego laboratorium: opublikowało wskaźniki operacyjne pokazujące, jak dużą część codziennych prac inżynieryjnych wykonują teraz ich modele, i połączyło te dane z publicznym żądaniem politycznym. Główny punkt firmy jest prosty: jeśli AI potrafi przyspieszać własny postęp, społeczeństwo powinno mieć procedurę, aby je spowolnić, zanim badania nad zarządzaniem i dopasowaniem zostaną w tyle za pędzącym pociągiem. Najtrudniejsza część – budowa wiarygodnej, egzekwowalnej, międzynarodowej weryfikacji – to coś, co większość decydentów i technologów będzie teraz próbowała rozpracować. To rozpracowywanie będzie techniczne, geopolityczne i nieuporządkowane; będzie to również moment, w którym kwestia tego, kto zasiądzie do stołu, stanie się prawdziwą polityką. Europa może dostarczyć zasady i instrumenty inspekcji, ale nie zastąpi odprężenia politycznego między USA a Chinami w tej kwestii.
To postęp. Tego rodzaju, który nie mieści się w prezentacji.
Źródła
- Anthropic Institute — „When AI builds itself” (esej firmowy i dane wewnętrzne)
- Anthropic — Redacted Risk Report (materiał wdrożeniowy dla Responsible Scaling Policy v3.0, luty 2026)
- Anthropic — Responsible Scaling Policy v3.0 i powiązane karty systemowe
- Komisja Europejska / dokumenty wdrożeniowe EU AI Act i organy doradcze
Comments
No comments yet. Be the first!