AI 自主进化:递归改进的现实与未来
AI 开始自己造 AI 了——递归自我改进,到底是不是狼来了?
6 月 4 日,Anthropic(就是做 Claude 的那家公司)发了一篇文章,标题叫《当 AI 构建自身》(When AI builds itself)。
听起来像科幻片的台词,但通篇没有一句煽情,全是数据。
它讲了一件正在发生、但很多人还没意识到严重性的事:AI 不只是在帮人写代码了,它正在一步步参与「制造下一代 AI」这件事本身。
如果你最近被各种「AGI 要来了」「人类要失业了」的标题搞得有点麻木,那我建议你把这篇看完。因为这次说话的不是某个自媒体,而是这条赛道上跑在最前面的公司之一——而且它说的话,口气还挺克制。
我尽量把它讲清楚,不吓你,也不哄你。
我们已经习惯了 AI 帮忙写代码。程序员让 Claude 写个函数、修个 bug,这事现在稀松平常。
但 Anthropic 这篇文章真正想说的,是另一件事。
「AI 帮人写代码」,人还是主角。AI 是个特别能干的工具,你让它干什么它干什么,方向、目标、判断,都还在人手里。
「AI 设计并训练下一代 AI」,主角开始换人。这意味着 AI 不再只是执行者,而是开始参与「决定下一个版本该长什么样」「该往哪个方向改进」——这是一个本质的跳变。
这个跳变有个专门的名字,叫递归自我改进(recursive self-improvement)。
为什么值得单独拎出来讲?因为它可能触发一个「飞轮」。
打个比方。
普通的进步是这样的:人努力一年,造出更好的工具,再用工具努力一年。每一轮的「努力」还是人,速度受限于人。
而递归自我改进设想的是:AI 帮你把 AI 做得更强,更强的 AI 又能把下一代做得更强,更强的下一代再把再下一代做得更强……每一轮的「努力者」自己也在变强。
这就不是滚雪球,是雪球自己学会了往山下滚,而且越滚越会滚。
理论上,这个循环一旦真正闭合,进步速度可能不再由「人有多聪明」「人有多勤奋」决定,而是由另一个东西决定——我们后面会说到。
但先别急着害怕。Anthropic 自己也没说这事一定会发生。它给的态度是:这是一个正在加速的趋势,值得严肃对待,但终局有好几种可能。
我们一个一个看。
观点谁都会喊,关键看证据。Anthropic 这篇文章最值得看的,是它把自家内部数据摊开了。
第一组:AI 能干的「活的难度」,每 4 个月翻一倍。
注意,这里说的不是「快了多少」,而是「能处理的任务复杂度」。
两年前,Claude 大概只能搞定需要人花几分钟的任务;现在,它能处理需要连续工作十几个小时才能完成的任务。两年,从「4 分钟级」到「12 小时级」。
每 4 个月翻倍意味着什么?意味着这是指数曲线,不是线性曲线。人脑对指数特别不敏感——你以为下一步只是「再快一点点」,实际可能是「又翻了一倍」。
第二组:Anthropic 自己的生产代码,80% 以上是 Claude 写的。
2024 年的时候,这个比例还是个位数。现在,超过八成合并进生产环境的代码,作者是 Claude。
与此对应,2026 年第二季度,工程师人均每季度交付的代码量,是 2024 年的 8 倍。
研究人员自己估算,当前的 AI 模型给他们带来了大约 4 倍的生产力提升。
第三组——这组才是真正的关键:AI 开始在「做研究」这件事上接近甚至超过人。
写代码是体力活的延伸,做研究是判断力的较量。后者一直被认为是人类的护城河。但数据在松动:
•Claude 在代码优化上,实现了约52 倍的加速——而一年前,这个数字还只有约 3 倍。
•在「该选哪个研究方向作为下一步」这种典型的判断题上,模型已经有64%的概率做得比人类研究员更好(此前是 51%,也就是刚过半)。
•第一个由 AI 自主完成的研究项目,恢复了「弱模型」和「强模型」之间97%的性能差距。换句话说,在那个具体任务上,AI 几乎自己走完了从「差」到「好」的全程。
把这三组数据连起来看,你会发现 Anthropic 想说的不是「AI 现在多强」,而是「加速度」本身在变陡。
去年 3 倍,今年 52 倍;去年刚过半,今年 64%。重要的不是某个点的高度,是曲线的斜率。
讲到这,你可能开始有点慌。先把心放回去。
文章里有一个特别诚实、也特别重要的承认:有一种能力,AI 目前还没真正拿下——研究品味(research taste)。
什么叫研究品味?
简单说,就是「知道该做哪个问题」的能力。
写代码、跑实验、优化参数,这些是「怎么做」的问题,AI 越来越擅长。但「在无数个可以研究的方向里,选出那个真正重要、真正值得押注的问题」——这是「做什么」的问题,靠的是直觉、经验、对领域的深层理解,甚至一点说不清的审美。
这就是为什么 Anthropic 内部 80% 的代码是 AI 写的,但那 20% 不是。那 20% 里,藏着方向、判断和取舍。
文章把这点说得很坦白:AI 能不能获得这种判断力,是目前真正悬而未决的问题。没人知道答案。
这也是整篇文章里我最欣赏的一点——它没有把「AI 全面超越人类」说成已成定局,而是明确标出:这里有一道坎,我们还没看到它被跨过去。
所以如果你问「人现在还有什么不可替代」,答案大概率就在这个区域:提出好问题的能力,而不是回答问题的能力。
聊未来最容易翻车的地方,就是把话说太满。要么吹「乌托邦」,要么喊「天塌了」。
Anthropic 这次没这么干。它给了三种平行的可能,让你自己掂量。
第一种:趋势停下来。
规模化的收益开始递减,投入越来越多但回报越来越少,曲线趋平。如果是这样,那一切都好说——社会有足够的时间慢慢适应,该转型转型,该学新东西学新东西,不会被打个措手不及。
这是最温和的剧本。
第二种:自动化继续,但人还掌着方向盘。
AI 越来越能干,承担掉大量执行工作,但「要往哪走」这件事仍然由人决定。人定方向,AI 负责把活干完。
这种情况下,生产力会发生巨大跃升,知识工作的形态被彻底重塑——很多今天靠「执行」吃饭的岗位会变,但「判断」和「方向」还在人这边。
这大概是目前我们正站在的位置,也是最可能的中期现实。
第三种:完全递归。
AI 开始设计自己的继任者,那个飞轮真正转起来。
到这一步,进步速度的瓶颈不再是「人聪不聪明」,而是变成了两个更冷的变量:算力够不够,以及——对齐做没做好。
「算力」好理解,有多少计算资源,就能跑多快。
「对齐(alignment)」是这里最要命的词:我们能不能确保,这个越来越强、越来越自主的系统,它想要的、它优化的方向,和人类真正想要的是一致的。
在前两种未来里,对齐是个「重要问题」。在第三种未来里,对齐是决定成败的关键变量——因为系统跑得太快,人来不及一步步纠偏,只能在它起跑之前就把方向定对。
注意,Anthropic 没有说第三种一定会发生。它说的是:如果发生,关键就在这里。
文章的结尾,Anthropic 提出了一个倡议:应该建立一套可验证的机制,让全球能够协调——在其他实验室也同意的前提下,有能力暂停前沿开发。
它也点出了一个现实困境:单方面减速会让自己在竞争中吃亏。你停了,别人没停,你就输了。所以光靠某一家「自觉」没有意义,必须是「大家一起、而且能互相验证」的暂停机制才行得通。
这个倡议本身值得记下来,但也值得保持一点冷静的距离。
一方面,它指出了一个真问题:在没有外部协调的情况下,竞争压力会逼着每一家都不敢停下来。这个困境是真实存在的。
另一方面,「呼吁一个可验证的暂停机制」具体怎么落地——谁来验证、用什么标准、出现分歧怎么办——文章并没有给出答案。倡议和可执行的机制之间,还隔着很长的路。
把它当成「一家前沿公司公开承认了这个困境」来看就够了,不必读出更多。真正决定这件事走向的,不会是某一篇文章的态度,而是接下来有没有人能把这套机制真正建起来。
回到标题这个问题。
我的看法是:不是「狼来了」那种喊话,但确实有什么东西,正在朝我们走过来,而且越走越快。
把这篇文章的信息冷静地收一收,大概是这么几条:
我不打算给你一个「赶紧学 AI 否则被淘汰」的鸡血结尾,那太廉价了。
我更想说的是:在一个变化快到连一线公司都在谈「踩刹车」的时代,普通人最该保留的,恰恰是 AI 目前还学不会的那个东西——
别只顾着回答问题,要学会问出好问题。
方向感,可能是接下来很长一段时间里,最贵的能力。