Опубликовали цифры, а затем нажали на тормоз
4 июня 2026 года Anthropic Institute опубликовал эссе «Когда ИИ создает сам себя» (When AI builds itself), которое читается как инженерный аудит с предупреждающей этикеткой: компания Anthropic заявляет, что внутри нее семейство моделей Claude прошло путь от написания практически нулевого объема промышленного кода до авторства большинства вливаемых изменений — по состоянию на май 2026 года это более 80% строк, добавленных в кодовую базу. Теперь инженеры направляют и проверяют работу, написанную моделями, вместо того чтобы писать ее самостоятельно. Представив эти внутренние данные, Anthropic пришла к выводу, что мир должен создать возможность «замедлить или временно приостановить разработку передового ИИ», если модели начнут совершенствоваться быстрее, чем люди смогут это контролировать.
Anthropic призывает к глобальной паузе: внутренние доказательства и ставки
Главная статистика — Claude обеспечивает львиную долю промышленных коммитов и, как сообщается, многократный рост производительности на одного инженера с конца 2024 года — это не просто PR-ход. Anthropic представляет графики и результаты внутренних опросов, показывающие четкие точки перегиба, когда модели перешли от предложений к автономному исполнению, и связывает это изменение непосредственно с классом рисков, которые исследователи называют «рекурсивным самосовершенствованием». Если система может надежно проектировать более быстрых и совершенных преемников, темпы роста возможностей могут отделиться от циклов человеческого планирования. Anthropic рассматривает это как проблему управления в такой же степени, как и техническую: более быстрое автоматизированное R&D сокращает время, которое есть у регуляторов, специалистов по этике и исследователей безопасности на то, чтобы отреагировать.
Anthropic призывает к глобальной паузе: почему верификация — это проблема
Anthropic не просто говорит «остановитесь». Компания четко обуславливает любую паузу верифицируемостью: значимое замедление, утверждают они, потребует от нескольких хорошо обеспеченных ресурсами передовых лабораторий в разных странах согласия на остановку на одних и тех же условиях и — что критически важно — возможности проверять, что остальные действительно остановились. Как отмечается в эссе, циклы обучения и разработку моделей гораздо легче скрыть, чем шахту ракетной установки; проблема обнаруживаемости здесь сложнее, чем в традиционных режимах контроля над вооружениями. Именно поэтому Anthropic предлагает сначала создать системы верификации, а не останавливаться в одностороннем порядке в надежде, что конкуренты последуют их примеру.
Когда их просят уточнить операционные детали, публичные материалы Anthropic дают намеренно открытый рецепт: пауза должна быть «замедлением или временной приостановкой разработки передового ИИ» до тех пор, пока исследования в области согласования целей и общественные структуры не догонят прогресс, с триггерами, арбитрами и условиями выхода, которые будут определены в рамках международного процесса, который они хотят созвать. Фиксированной продолжительности не предлагается. Компания сравнивает эту задачу с историческими режимами верификации, на создание которых ушли десятилетия, и предупреждает, что у мира нет такой роскоши. Короче говоря: пауза предлагается как механизм для выигрыша времени для исследований в области согласования (alignment) и управления, а не как единый мораторий с жесткими сроками.
Почему для политиков это предложение будет выглядеть как загадка
Скоординированная, верифицируемая пауза звучит привлекательно на бумаге, но кажется невозможной на практике многим политикам. Стимул к нарушению огромен: любой игрок, который продолжит обучение, пока другие остановились, получит преимущество со стратегическими, экономическими и военными последствиями. Это основа прагматичного аргумента Anthropic в пользу того, чтобы сначала создать верификацию. Именно поэтому некоторые наблюдатели видят в этом плане одновременно нечто неотложное и недостижимое без серьезной поддержки государств — прежде всего США и Китая. Время, выбранное компанией — публикация эссе вскоре после выхода собственного Отчета о рисках в рамках Responsible Scaling Policy v3, — намеренно переносит вопрос в политическую плоскость.
Кто такая Anthropic и почему нам стоит (или не стоит) их слушать?
Anthropic — это калифорнийская ИИ-фирма, создавшая семейство моделей Claude и линейку продуктов Claude Code; ее публичный имидж построен на риторике, ориентированной на безопасность, и официальной Политике ответственного масштабирования (Responsible Scaling Policy). Такая репутация придает эссе авторитет: Anthropic представляет прямые внутренние измерения, краткие обзоры системных карт и первый публичный Отчет о рисках, документирующий возможности и меры по их смягчению. Но это также та самая компания, которая в 2026 году переработала свою Политику ответственного масштабирования, чтобы отделить односторонние действия компании от отраслевых требований — изменение, которое, по мнению критиков, сузило смысл более раннего и строгого обязательства о паузе. Именно поэтому у некоторых комментаторов возникает ощущение парадокса, когда Anthropic теперь призывает к глобальной паузе: компания одновременно отказалась от обещания односторонней паузы и доказывает, что мир должен создать скоординированный тормоз. Читателям следует относиться как к новым данным, так и к политическому контексту со здоровым скептицизмом.
Может ли пауза снизить риск того, что ИИ станет неуправляемым?
Ответ Anthropic осторожен: да, замедление могло бы дать время для исследований в области согласования целей, улучшения оценки и создания институтами механизмов вынесения решений и верификации. Компания определяет риск как двойственный — системы, которые ускоряют исследовательские процессы, и системы, которым в принципе могут быть заданы цели, побуждающие их действовать автономно, — и рассматривает паузу как способ отделить скорость исследований от неконтролируемой эскалации возможностей. Но смягчение рисков является условным: без достоверного мониторинга и международной координации пауза, которую соблюдают одни лаборатории, но игнорируют другие, может сделать мир менее безопасным, а не более. Именно поэтому Anthropic выступает за технические меры, которые сделают нарушение условий обнаруживаемым, и за согласованные протоколы, определяющие триггеры и то, кто выступает арбитром.
Как можно внедрить и обеспечить соблюдение всемирной паузы — и кто будет осуществлять контроль?
Anthropic указывает на два взаимодополняющих подхода. Во-первых: создание верифицируемых технических средств контроля и инструментов мониторинга, которые позволяют обнаруживать крупномасштабные циклы обучения или эксфильтрацию весов моделей. Во-вторых: создание политической архитектуры — форумов с участием многих заинтересованных сторон (правительств, крупных лабораторий, гражданского общества и независимых аудиторов), которые могут устанавливать триггеры и разрешать споры. Компания ссылается на аналоги в сфере контроля над вооружениями, но признает, что сравнение несовершенно: потребовались десятилетия, чтобы создать доверие и инструментарий, обеспечившие работу прошлых договоров. Любой заслуживающий доверия механизм обеспечения соблюдения потребует активного участия государств, возможности проведения независимого аудита и публичной прозрачности, чтобы уменьшить соблазн схитрить. Без этого пауза, скорее всего, останется мораторием только на словах. citeturn2view0turn6view0
Что уже делают политики и какое место занимает Европа
Европа движется быстрее большинства регионов в вопросе закрепления основ управления ИИ на бумаге: Закон ЕС об ИИ (EU AI Act) и новые консультативные органы, призванные поддерживать его исполнение, готовятся в качестве практических инструментов надзора. Эти институты могли бы стать частью архитектуры верификации, к которой призывает Anthropic — например, путем обусловливания доступа к рынку документально подтвержденным соблюдением любого согласованного замедления, — но географический охват Закона об ИИ и исключения по соображениям национальной безопасности означают, что Брюссель не может в одиночку решить проблему международной координации. Любая заслуживающая доверия пауза все равно потребует участия США и Китая.
Как это вписывается в более широкий политический скандал вокруг Anthropic
Этот документ появился в то время, когда Anthropic ведет громкий спор с Министерством обороны США по поводу классификации цепочки поставок и ограничений на военное использование — борьба, которая уже привлекла отраслевых экспертов (amici) и скептически настроенного федерального судью. Этот контекст важен, поскольку он подчеркивает конкурирующее давление на Anthropic: защищать коммерческое будущее и государственные контракты, одновременно публично выступая за более строгие глобальные тормоза для роста возможностей. Это напряжение мешает сторонним наблюдателям воспринимать эссе как чисто идеалистическое или чисто корыстное; это, безусловно, такой же политический ход, как и технический призыв.
К чему это нас приводит
Anthropic сделала нечто необычное для передовой лаборатории: опубликовала операционные метрики, показывающие, какую часть повседневной инженерной работы выполняют сейчас их модели, и подкрепила эти данные призывом к государственной политике. Основная мысль компании проста: если ИИ может ускорять собственный прогресс, у общества должна быть процедура, позволяющая замедлить его, прежде чем исследования в области управления и согласования целей окажутся в роли догоняющих убегающий поезд. Самое сложное — создание достоверной, принудительной, международной верификации — это то, что большинство политиков и технологов теперь будут пытаться осмыслить. Это осмысление будет техническим, геополитическим и запутанным; именно здесь вопрос о том, кто получит место за столом переговоров, станет настоящей политикой. Европа может предоставить правила и инструменты инспекции, но она не может заменить политическую разрядку между США и Китаем по этому вопросу.
Это прогресс. Из тех, что не помещаются в презентацию.
Источники
- Anthropic Institute — «Когда ИИ создает сам себя» (эссе компании и внутренние данные)
- Anthropic — Отредактированный отчет о рисках (материал по реализации Политики ответственного масштабирования v3.0, февраль 2026 г.)
- Anthropic — Политика ответственного масштабирования v3.0 и связанные с ней системные карты
- Европейская комиссия / Документы по реализации Закона ЕС об ИИ и консультативные органы
Comments
No comments yet. Be the first!