什么是人工智能开发中的递归自我提升？

递归自我提升是指一种自动循环，即人工智能模型识别自身代码中的低效之处并重写代码以提升性能。与依赖人类设计人员和策展数据集的传统开发方式不同，这种方法旨在创建一个指数级增长模型。其目标是通过允许机器在无需人工干预的情况下编程自身的升级来闭合这一循环，这可能导致一场迅速且自我持续的智能爆炸。

为什么投资者会给一家仅成立四个月的初创公司高达40亿美元的估值？

投资者给予该公司40亿美元的估值，是因为它专注于递归超人工智能，这项技术有望绕过人类主导的人工智能开发所面临的线性增长限制。对于一个仅有20人的小团队而言，这一估值相当于每位员工约2亿美元。谷歌和英伟达等支持者认为，即使在自动化人工智能优化方面取得部分成功，也能带来巨大的运营成本节约，并在自主机器智能竞赛中获得显著的竞争优势。

哪些技术挑战阻碍了人工智能成功重写自身代码？

一个重大的技术风险是“模型崩溃”，即反馈循环会导致人工智能放大自身的错误，直到输出结果变成统计噪声。由于大型语言模型往往缺乏形式逻辑的基础，它们可能难以验证新代码是否真的更优。如果缺乏稳健的目标函数，该系统可能会在产出有缺陷结果的同时变得更快或更自信。这使得在无人监督的情况下闭合这一循环变得极其困难。

美国和欧洲在人工智能初创企业的投资环境有何不同？

这种投资环境反映了两个地区在风险偏好上的巨大差距。在美国，风险投资家愿意为高风险的“登月”项目提供数十亿美元的估值，以免错失定义时代的变革。相反，欧洲的开发进程往往因《人工智能法案》等监管审慎态度以及对学术资助的依赖而放缓。这导致了一种局面，即在欧洲受训的研究人员经常需要寻求美国资金来扩展其高水平创新。

自进化初创公司与递归超级智能估值

其估值背后的数学逻辑既直白又充满投机性。在仅有20人团队且估值高达40亿美元的情况下，市场实际上为每位员工定价2亿美元。这一数字超过了十年前深度学习热潮第一波期间“人才收购”（acq-hire）的峰值水平。这表明，包括Google旗下风险投资部门和全球最强大的半导体公司在内的投资者，已不再满足于大型语言模型（LLM）的渐进式收益。他们正在寻找摆脱“人在回路”（human-in-the-loop）开发的路径。

代码真的能编写出更好的代码吗？

递归超级智能（Recursive Superintelligence）的核心前提是对自主改进周期的追求。当前的人工智能开发是一个存在瓶颈的过程：人类设计架构，人类整理数据集，并由人类提供“人类反馈强化学习”（RLHF），以防止模型产生幻觉或变得具有毒性。这是一种线性增长模型。递归自我改进的目标是实现指数级增长，即模型能够识别其自身的算法低效之处，并重写自己的代码库来加以修复。

该领域的工程师通常将其称为“闭环”。难点在于目标函数。如果一个模型被赋予改进自身推理能力的任务，它需要一种方法来验证其“新版本”确实得到了改进，而不是仅仅运行得更快或对错误更加自信。由于缺乏对物理现实或形式逻辑的立足点——而这正是LLM公认的缺失之处——递归自我改进往往会导致“模型崩溃”，即一种反馈回路，AI开始放大自身的怪癖，直到输出变成统计噪声。由Richard Socher和Tim Rocktäschel领导的Recursive团队正在押注，他们针对符号推理或自动化发现的独特方法能够绕过这种熵增。

Tim Rocktäschel在伦敦大学学院（University College London）和Google DeepMind的背景为这一技术方向提供了线索。他的工作重点通常是“开放式”学习，即智能体必须在无需明确任务指令的情况下学会解决任务的环境。在欧洲工业背景下，这通常是那种由“欧洲地平线”（Horizon Europe）计划或欧洲研究理事会（European Research Council）资助的高水平研究。在这里，这种研究路径已被美国风险资本绕过，这凸显了欧洲学术卓越性与该地区将这种卓越性转化为自主工业实力的能力之间长期存在的鸿沟。

Nvidia是“奇点”的房东

这在硅谷生态系统中创造了一种奇异的循环经济。美国风险基金提供资本，初创公司将其用于购买Nvidia硬件，这继而推高了Nvidia的收益，进而提振了风险基金的有限合伙人所依赖的更广泛的科技指数。对于欧洲观察家而言，这种循环是一个令人沮丧的封闭系统。尽管欧盟《芯片法案》（EU Chips Act）旨在建立本土制造能力，但它尚未培育出那种高风险、高回报的软件-硬件反馈回路，而正是这种反馈回路使得一家仅成立四个月的公司在帕洛阿托（Palo Alto）获得40亿美元估值成为可能，而在柏林或巴黎则难以想象。

Salesforce前首席科学家Richard Socher的加入，为这项看似纯学术的实践增添了一层商业实用主义色彩。Socher的职业生涯以推动自然语言处理（NLP）在企业中的实际应用而著称。如果Recursive Superintelligence仅仅是一个“登月计划”实验室，它可能很难在当前的利率环境下获得5亿美元融资。融资的规模表明，市场相信即使是部分成功——例如一个能够优化自身推理成本或自动清理数据的AI——也足以在《财富》500强企业中产生数十亿美元的运营成本节约。

“智能爆炸”是一个可行的工程目标吗？

递归自我改进理论的批评者指出了“收益递减”问题。在大多数工程学科中，对系统优化的程度越高，取得进一步提升的难度就越大。一个效率为98%的汽车引擎要比效率为40%的引擎难提升得多。“奇点”叙事假设智能是不同的——即认知能力的每一次提升都会使下一次提升更容易实现。这仍然是一个哲学假说，而非工程事实。

从监管角度来看，欧洲的《人工智能法案》（AI Act）可能很快就必须审视那些不仅仅是“使用”AI，而是以创造本身为产品的公司。如果模型开始重写自己的代码，谁应对最终的输出负责？原始程序员？算力提供商？这种法律上的模糊性正是让美国风险投资家耸耸肩而德国投资家伸手去拿保险单的原因。这是风险偏好的根本差异，这种差异继续定义着大西洋两岸的分歧。

这项交易的速度——从零到五亿美元仅耗时四个月——是市场恐惧错过下一个划时代转变的症状。它呼应了太空竞赛的早期阶段，当时的目标不一定是拥有可持续的商业模式，而是要在对方之前到达目的地。在这种情况下，目的地是一个可以全天候自主进化的智能体。如果Recursive Superintelligence成功了，5亿美元的标价看起来就像一个四舍五入的误差；如果他们失败了，这将作为第二次AI泡沫的巅峰被人们铭记——在那一刻，我们给一个机器能够独立思考的梦想所赋予的价值，超过了大多数为人类创造实际产品的公司。

硅谷已经决定，构建未来的最聪明方式是让未来自我构建。而欧洲仍在等待一式三份的纸质文件被归档。

递归超级智能与价值2亿美元的员工

代码真的能编写出更好的代码吗？

Nvidia是“奇点”的房东

“智能爆炸”是一个可行的工程目标吗？

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments