Рекурсивный суперинтеллект и сотрудник стоимостью $200 млн

ИИ
Recursive Superintelligence and the $200 Million Employee
120-дневный стартап привлек $500 млн на реализацию «Святого Грааля» ИИ: создание системы, способной программировать собственные обновления без участия человека.

Математика, лежащая в основе этой оценки, столь же сурова, сколь и спекулятивна. При штате из 20 человек и оценке в $4 миллиарда рынок фактически оценивает каждого сотрудника в $200 миллионов. Это превышает пиковые показатели «поглощений ради талантов» (acq-hire), наблюдавшиеся во время первой волны бума глубокого обучения десятилетие назад. Это говорит о том, что инвесторы — включая венчурное подразделение Google и самую влиятельную в мире полупроводниковую компанию — больше не заинтересованы в постепенных улучшениях больших языковых моделей (LLM). Они ищут выход из системы разработки, предполагающей постоянное участие человека (human-in-the-loop).

Может ли код на самом деле писать лучший код?

Основная предпосылка рекурсивного суперинтеллекта заключается в стремлении к циклу автономного совершенствования. Текущая разработка ИИ — это процесс, ограниченный «узкими местами»: люди проектируют архитектуры, люди курируют наборы данных и люди обеспечивают обучение с подкреплением на основе отзывов людей (RLHF), которое удерживает модели от галлюцинаций или токсичного поведения. Это модель линейного роста. Рекурсивное самосовершенствование нацелено на экспоненциальный рост, при котором модель выявляет собственные алгоритмические неэффективности и переписывает свою кодовую базу для их устранения.

Инженеры в этой области часто называют это «замыканием цикла». Сложность заключается в целевой функции. Если перед моделью стоит задача улучшить собственные способности к рассуждению, ей нужен способ верифицировать, что её «новая и улучшенная» версия действительно лучше, а не просто быстрее или более уверенна в своих ошибках. Без опоры на физическую реальность или формальную логику — то, чего остро не хватает LLM — рекурсивное самосовершенствование часто приводит к «коллапсу модели», петле обратной связи, в которой ИИ начинает усиливать свои собственные странности, пока результат не превращается в статистический шум. Команда Recursive под руководством Ричарда Сочера (Richard Socher) и Тима Роктешеля (Tim Rocktäschel) делает ставку на то, что их специфический подход к символьным рассуждениям или автоматизированным открытиям позволит избежать этой энтропии.

Прошлое Тима Роктешеля в Университетском колледже Лондона (University College London) и Google DeepMind дает подсказку о техническом направлении. Его работа часто была сосредоточена на «открытом» обучении — средах, где агенты должны учиться решать задачи, не получая инструкций о том, что это за задачи. В европейском промышленном контексте это тот тип высокоуровневых исследований, которые обычно финансируются грантами Horizon Europe или Европейским исследовательским советом. Здесь же этот путь был обойден американским венчурным капиталом, что подчеркивает сохраняющийся разрыв между европейским академическим превосходством и способностью континента превратить это превосходство в суверенную промышленную мощь.

Nvidia — домовладелец Сингулярности

Это создает причудливую циклическую экономику в экосистеме Кремниевой долины. Венчурные фонды США предоставляют капитал, который стартапы тратят на оборудование Nvidia, что затем увеличивает доходы Nvidia, что, в свою очередь, стимулирует более широкие технологические индексы, на которые полагаются партнеры с ограниченной ответственностью венчурных фондов. Для европейских наблюдателей этот цикл выглядит досадно замкнутым. Хотя закон ЕС о чипах (EU Chips Act) нацелен на создание местных производственных мощностей, он еще не породил тот тип обратной связи между программным обеспечением и «железом» с высоким уровнем риска и высокой отдачей, который делает оценку в $4 миллиарда для четырехмесячной компании возможной в Пало-Альто, но немыслимой в Берлине или Париже.

Присутствие Ричарда Сочера, бывшего главного научного сотрудника Salesforce, добавляет коммерческого прагматизма тому, что в противном случае могло бы показаться чисто академическим упражнением. Карьера Сочера строилась на внедрении обработки естественного языка (NLP) в корпоративный сектор. Если бы Recursive Superintelligence была просто лабораторией по реализации «амбициозных прожектов» (moonshot), ей было бы трудно привлечь $500 миллионов в текущих условиях процентных ставок. Масштаб финансирования предполагает веру в то, что даже частичный успех — ИИ, способный просто оптимизировать собственные затраты на логический вывод или самостоятельно очищать свои данные — будет стоить миллиарды в виде операционной экономии для компаний из списка Fortune 500.

Является ли «интеллектуальный взрыв» жизнеспособной инженерной целью?

Критики теории рекурсивного самосовершенствования указывают на проблему «убывающей отдачи». В большинстве инженерных дисциплин чем больше вы оптимизируете систему, тем сложнее становится добиться дальнейших улучшений. Автомобильный двигатель с КПД 98% улучшить значительно сложнее, чем двигатель с КПД 40%. Повествование о «Сингулярности» предполагает, что интеллект устроен иначе — что каждое приращение когнитивных способностей облегчает достижение следующего. Это остается философской гипотезой, а не инженерным фактом.

С регуляторной точки зрения, европейскому Закону об ИИ (AI Act) вскоре, возможно, придется иметь дело не только с компаниями, которые «используют» ИИ, но и с компаниями, чьим продуктом является сам акт творчества. Если модель начинает переписывать свой код, кто несет ответственность за конечный результат? Изначальные программисты? Поставщик вычислительных мощностей? Эта правовая двусмысленность — именно то, что заставляет венчурных капиталистов в США пожимать плечами, а в Германии — тянуться за страховыми полисами. Это фундаментальное различие в отношении к риску, которое продолжает определять трансатлантический разрыв.

Скорость этой сделки — путь от нуля до полумиллиарда за четыре месяца — симптом рынка, который боится пропустить следующий тектонический сдвиг. Это напоминает первые дни космической гонки, где целью было не обязательно наличие устойчивой бизнес-модели, а достижение цели раньше другой стороны. В данном случае цель — это автономный интеллект, способный работать 24/7 над собственной эволюцией. Если у Recursive Superintelligence все получится, ценник в $500 миллионов будет выглядеть как ошибка округления. Если они потерпят неудачу, это запомнится как пик Второго пузыря ИИ — момент, когда мы оценили мечту о машине, способной мыслить самостоятельно, выше, чем большинство компаний, которые действительно что-то производят для людей.

Кремниевая долина решила, что самый разумный способ построить будущее — позволить будущему построить себя самому. Европа все еще ждет, когда бумаги будут поданы в трех экземплярах.

Mattias Risberg

Mattias Risberg

Cologne-based science & technology reporter tracking semiconductors, space policy and data-driven investigations.

University of Cologne (Universität zu Köln) • Cologne, Germany

Readers

Readers Questions Answered

Q Что такое рекурсивное самосовершенствование в разработке ИИ?
A Рекурсивное самосовершенствование — это автономный цикл, в котором модель ИИ выявляет неэффективные участки собственного кода и переписывает их для повышения производительности. В отличие от традиционной разработки, полагающейся на участие программистов и кураторские наборы данных, этот подход направлен на создание модели экспоненциального роста. Цель состоит в том, чтобы замкнуть цикл, позволив машине самостоятельно программировать свои обновления без участия человека, что потенциально может привести к быстрому и самоподдерживающемуся «интеллектуальному взрыву».
Q Почему инвесторы оценили четырехмесячный стартап в 4 миллиарда долларов?
A Инвесторы оценили компанию в 4 миллиарда долларов из-за ее ориентации на рекурсивный суперинтеллект — технологию, способную преодолеть ограничения линейного роста, свойственные разработке ИИ под руководством человека. При штате всего в 20 человек такая оценка составляет примерно 200 миллионов долларов на одного сотрудника. Такие инвесторы, как Google и Nvidia, полагают, что даже частичный успех в автоматизации оптимизации ИИ может принести колоссальную экономию операционных расходов и обеспечить значительное конкурентное преимущество в гонке за создание автономного машинного интеллекта.
Q Какие технические проблемы мешают ИИ успешно переписывать свой собственный код?
A Основным техническим риском является «схлопывание модели» (model collapse), при котором петля обратной связи заставляет ИИ усиливать собственные ошибки до тех пор, пока выходные данные не превратятся в статистический шум. Поскольку большие языковые модели часто не опираются на формальную логику, им трудно проверить, действительно ли новый код лучше старого. Без надежной целевой функции система рискует стать быстрее или увереннее в себе, при этом выдавая ошибочные результаты. Это делает замыкание цикла без контроля со стороны человека крайне сложной задачей.
Q Чем инвестиционный климат для ИИ-стартапов в США отличается от европейского?
A Инвестиционный климат отражает существенный разрыв в готовности к риску между двумя регионами. В Соединенных Штатах венчурные капиталисты готовы финансировать высокорискованные проекты («луншоты») с многомиллиардными оценками, чтобы не упустить эпохальные технологические сдвиги. Напротив, развитие в Европе часто замедляется из-за регуляторной осторожности, например, закона AI Act, и зависимости от академических грантов. В результате исследователи, прошедшие обучение в Европе, часто привлекают американское финансирование для масштабирования своих инноваций высокого уровня.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!