AI 自主进化：递归改进的现实与未来

发布时间：2026-06-05 08:44阅读：25

AI 开始自己造 AI 了——递归自我改进，到底是不是狼来了?

6 月 4 日，Anthropic（就是做 Claude 的那家公司）发了一篇文章，标题叫《当 AI 构建自身》（When AI builds itself）。

听起来像科幻片的台词，但通篇没有一句煽情，全是数据。

它讲了一件正在发生、但很多人还没意识到严重性的事:AI 不只是在帮人写代码了，它正在一步步参与「制造下一代 AI」这件事本身。

如果你最近被各种「AGI 要来了」「人类要失业了」的标题搞得有点麻木，那我建议你把这篇看完。因为这次说话的不是某个自媒体，而是这条赛道上跑在最前面的公司之一——而且它说的话，口气还挺克制。

我尽量把它讲清楚，不吓你，也不哄你。

我们已经习惯了 AI 帮忙写代码。程序员让 Claude 写个函数、修个 bug，这事现在稀松平常。

但 Anthropic 这篇文章真正想说的，是另一件事。

「AI 帮人写代码」，人还是主角。AI 是个特别能干的工具，你让它干什么它干什么，方向、目标、判断，都还在人手里。

「AI 设计并训练下一代 AI」，主角开始换人。这意味着 AI 不再只是执行者，而是开始参与「决定下一个版本该长什么样」「该往哪个方向改进」——这是一个本质的跳变。

这个跳变有个专门的名字，叫递归自我改进（recursive self-improvement）。

为什么值得单独拎出来讲?因为它可能触发一个「飞轮」。

打个比方。

普通的进步是这样的:人努力一年，造出更好的工具，再用工具努力一年。每一轮的「努力」还是人，速度受限于人。

而递归自我改进设想的是:AI 帮你把 AI 做得更强，更强的 AI 又能把下一代做得更强，更强的下一代再把再下一代做得更强……每一轮的「努力者」自己也在变强。

这就不是滚雪球，是雪球自己学会了往山下滚，而且越滚越会滚。

理论上，这个循环一旦真正闭合，进步速度可能不再由「人有多聪明」「人有多勤奋」决定，而是由另一个东西决定——我们后面会说到。

但先别急着害怕。Anthropic 自己也没说这事一定会发生。它给的态度是:这是一个正在加速的趋势，值得严肃对待，但终局有好几种可能。

我们一个一个看。

观点谁都会喊，关键看证据。Anthropic 这篇文章最值得看的，是它把自家内部数据摊开了。

第一组:AI 能干的「活的难度」，每 4 个月翻一倍。

注意，这里说的不是「快了多少」，而是「能处理的任务复杂度」。

两年前，Claude 大概只能搞定需要人花几分钟的任务;现在，它能处理需要连续工作十几个小时才能完成的任务。两年，从「4 分钟级」到「12 小时级」。

每 4 个月翻倍意味着什么?意味着这是指数曲线，不是线性曲线。人脑对指数特别不敏感——你以为下一步只是「再快一点点」，实际可能是「又翻了一倍」。

第二组:Anthropic 自己的生产代码，80% 以上是 Claude 写的。

2024 年的时候，这个比例还是个位数。现在，超过八成合并进生产环境的代码，作者是 Claude。

与此对应，2026 年第二季度，工程师人均每季度交付的代码量，是 2024 年的 8 倍。

研究人员自己估算，当前的 AI 模型给他们带来了大约 4 倍的生产力提升。

第三组——这组才是真正的关键:AI 开始在「做研究」这件事上接近甚至超过人。

写代码是体力活的延伸，做研究是判断力的较量。后者一直被认为是人类的护城河。但数据在松动:

•Claude 在代码优化上，实现了约52 倍的加速——而一年前，这个数字还只有约 3 倍。

•在「该选哪个研究方向作为下一步」这种典型的判断题上，模型已经有64%的概率做得比人类研究员更好（此前是 51%，也就是刚过半）。

•第一个由 AI 自主完成的研究项目，恢复了「弱模型」和「强模型」之间97%的性能差距。换句话说，在那个具体任务上，AI 几乎自己走完了从「差」到「好」的全程。

把这三组数据连起来看，你会发现 Anthropic 想说的不是「AI 现在多强」，而是「加速度」本身在变陡。

去年 3 倍，今年 52 倍;去年刚过半，今年 64%。重要的不是某个点的高度，是曲线的斜率。

讲到这，你可能开始有点慌。先把心放回去。

文章里有一个特别诚实、也特别重要的承认:有一种能力，AI 目前还没真正拿下——研究品味（research taste）。

什么叫研究品味?

简单说，就是「知道该做哪个问题」的能力。

写代码、跑实验、优化参数，这些是「怎么做」的问题，AI 越来越擅长。但「在无数个可以研究的方向里，选出那个真正重要、真正值得押注的问题」——这是「做什么」的问题，靠的是直觉、经验、对领域的深层理解，甚至一点说不清的审美。

这就是为什么 Anthropic 内部 80% 的代码是 AI 写的，但那 20% 不是。那 20% 里，藏着方向、判断和取舍。

文章把这点说得很坦白:AI 能不能获得这种判断力，是目前真正悬而未决的问题。没人知道答案。

这也是整篇文章里我最欣赏的一点——它没有把「AI 全面超越人类」说成已成定局，而是明确标出:这里有一道坎，我们还没看到它被跨过去。

所以如果你问「人现在还有什么不可替代」，答案大概率就在这个区域:提出好问题的能力，而不是回答问题的能力。

聊未来最容易翻车的地方，就是把话说太满。要么吹「乌托邦」，要么喊「天塌了」。

Anthropic 这次没这么干。它给了三种平行的可能，让你自己掂量。

第一种:趋势停下来。

规模化的收益开始递减，投入越来越多但回报越来越少，曲线趋平。如果是这样，那一切都好说——社会有足够的时间慢慢适应，该转型转型，该学新东西学新东西，不会被打个措手不及。

这是最温和的剧本。

第二种:自动化继续，但人还掌着方向盘。

AI 越来越能干，承担掉大量执行工作，但「要往哪走」这件事仍然由人决定。人定方向，AI 负责把活干完。

这种情况下，生产力会发生巨大跃升，知识工作的形态被彻底重塑——很多今天靠「执行」吃饭的岗位会变，但「判断」和「方向」还在人这边。

这大概是目前我们正站在的位置，也是最可能的中期现实。

第三种:完全递归。

AI 开始设计自己的继任者，那个飞轮真正转起来。

到这一步，进步速度的瓶颈不再是「人聪不聪明」，而是变成了两个更冷的变量:算力够不够，以及——对齐做没做好。

「算力」好理解，有多少计算资源，就能跑多快。

「对齐（alignment）」是这里最要命的词:我们能不能确保，这个越来越强、越来越自主的系统，它想要的、它优化的方向，和人类真正想要的是一致的。

在前两种未来里，对齐是个「重要问题」。在第三种未来里，对齐是决定成败的关键变量——因为系统跑得太快，人来不及一步步纠偏，只能在它起跑之前就把方向定对。

注意，Anthropic 没有说第三种一定会发生。它说的是:如果发生，关键就在这里。

文章的结尾，Anthropic 提出了一个倡议:应该建立一套可验证的机制，让全球能够协调——在其他实验室也同意的前提下，有能力暂停前沿开发。

它也点出了一个现实困境:单方面减速会让自己在竞争中吃亏。你停了，别人没停，你就输了。所以光靠某一家「自觉」没有意义，必须是「大家一起、而且能互相验证」的暂停机制才行得通。

这个倡议本身值得记下来，但也值得保持一点冷静的距离。

一方面，它指出了一个真问题:在没有外部协调的情况下，竞争压力会逼着每一家都不敢停下来。这个困境是真实存在的。

另一方面，「呼吁一个可验证的暂停机制」具体怎么落地——谁来验证、用什么标准、出现分歧怎么办——文章并没有给出答案。倡议和可执行的机制之间，还隔着很长的路。

把它当成「一家前沿公司公开承认了这个困境」来看就够了，不必读出更多。真正决定这件事走向的，不会是某一篇文章的态度，而是接下来有没有人能把这套机制真正建起来。

回到标题这个问题。

我的看法是:不是「狼来了」那种喊话，但确实有什么东西，正在朝我们走过来，而且越走越快。

把这篇文章的信息冷静地收一收，大概是这么几条:

我不打算给你一个「赶紧学 AI 否则被淘汰」的鸡血结尾，那太廉价了。

我更想说的是:在一个变化快到连一线公司都在谈「踩刹车」的时代，普通人最该保留的，恰恰是 AI 目前还学不会的那个东西——

别只顾着回答问题，要学会问出好问题。

方向感，可能是接下来很长一段时间里，最贵的能力。

← 上一篇：AI 竞赛进入实战阶段：三大厂商同步聚焦商业化交付能力下一篇：腾讯高管汤道生与姚顺雨共议AI产业新阶段 →