AI自我进化的真相与焦虑营销

发布时间：2026-06-06 10:16阅读：35

一个AI安全研究项目，交给AI自己完成：它耗时约800小时、花费约1.8万美元算力，恢复了97%的性能差距；而两名人类研究员用整整一周时间，仅恢复了23%的效果。

这组数据来自Anthropic最新发布的内部报告，标题颇具科幻感——《当AI开始构建自身》。除了这项实验，报告开头还抛出了几个关键数字：截至2026年5月，Anthropic代码库中超过80%的代码由Claude自主编写；2026年第二季度，工程师的人均日代码产出是2024年的8倍；Claude可连续自主工作超过16小时。

报告得出的结论令人震惊：按照当前趋势，AI自主设计并制造下一代AI完全可能实现。基于这一判断，Anthropic甚至建议全球暂停前沿AI研发。

社交媒体瞬间沸腾。"AI即将自我创造"、"递归自我改进，奇点将至"——熟悉的配方，熟悉的味道。如果你在AI圈混迹多年，一定对这种节奏不陌生：每隔数月，总有头部公司高呼"时代要变天"，引发一轮集体焦虑，然后一切照旧。

巧合的是，OpenAI刚宣称"AI展现出递归自我改进的早期迹象"，紧接着Anthropic就发布了"AI正在创造下一个自己"。连营销话术都开始互相较劲了。

我仔细研读了这份报告。哪些是事实、哪些是被舆论放大的焦虑，下面逐条分析。

递归自我改进（Recursive Self-Improvement，简称RSI），是AI圈讨论了近二十年的话题。其逻辑简单明了：AI能自我优化，优化后的版本继续改进下一代，无需人工干预，形成自我加速的飞轮效应。这正是奇点理论的核心。

关键在于，RSI不是开关，而是一个渐进过程。学界将其分为六个阶段，从"AI辅助人类"逐步发展到"AI完全自主迭代"。Anthropic也绘制了时间轴，分为五个阶段，并将自己定位在第四阶段——距离终点仅一步之遥。

用业界的六阶段标准重新评估，Anthropic的实际位置大约在第3到第4阶段之间。虽然略有折扣，但这个位置已经相当扎实。

支撑这一判断的不是PPT，而是两个公开的内部实验。

第一个实验，即开篇提到的"是否会做研究"测试。Claude Agent全程自主完成了AI安全研究项目，从提出假设、运行实验到分析结果，实现全自动化。800小时恢复97%、人类一周恢复23%的背后，是一个真实运转的半自动研究闭环——称其已站稳第3阶段毫不为过。

第二个实验关注"是否会自我提速"。Anthropic让Claude拿到一段训练小模型的代码，自己运行、计时、改写、再运行。最终它将速度提升了52倍——而熟练的人类研究员只能做到4倍。改进工具链、运行基准测试、选择更优版本，这条路径已非常接近"自改进Agent"的逻辑。

52倍对4倍，97%对23%。这两组对比并非炒作，而是已发生的事实。因此那句"AI大规模参与AI研发"，并非危言耸听，而是事实。

报告中隐藏着一个词：research taste，即判断"什么问题值得研究"的能力。Anthropic用了个贴切的比喻：

初级员工接到的任务是"这个按钮坏了，去修一下"；有经验的员工接到的是"网络有时卡顿，查查原因"；而资深专家思考的是"下个季度该做什么"。

第一层，Claude已很擅长；第二层，它在快速追赶；但第三层——判断问题价值、结果可信度、何时该放弃——这种研究直觉，人类仍有明显优势。只要这个环节仍由人类主导，AI就还不是真正的自改进Agent，离完整的RSI还差一步。

报告中有个数据专门衡量这一点：在"判断研究方向"方面，Claude的新预览版在64%的情况下被另一个Claude裁判认为提出了更好的方案；而五个月前这一比例仅为51%。

趋势确实在上升。但请注意两点：一是64%离"完全自主判断"还远；二是这个数据是在问题边界清晰的实验环境下测得。现实中多为模糊、矛盾、无标准答案的问题，AI能判断到什么程度尚无定论。

换句话说：AI已成为极其高效的"执行者"和"加速器"，但尚未成为能决定"做什么"的决策者。飞轮的核心仍掌握在人类手中。

报告未给出明确结局，而是列出了三种可能——这反而是其最可信之处。

第一种情况：趋势停在S曲线上。Transformer架构遇到瓶颈、算力能源跟不上、地缘政治阻碍全球合作，指数曲线变成S形，逐渐平缓。Anthropic认为这是最不可能的情况。但他们承认，即使停在这里，当前能力已足以让百人公司完成过去千人公司才能做的事——社会结构的变革不会因AI停滞而停止，只是形式会变化。

第二种情况：飞轮转动，但人类仍掌舵。AI负责执行和生成选项，人类负责判断和最终决策。听起来理想，但报告指出了一个隐藏问题：Amdahl定律。你加速一个环节，瓶颈就会转移到下一个。代码写快了，code review堵车；实验跑快了，结果分析跟不上；分析快了，决策又拖后腿。Anthropic称他们内部正经历这个过程，每波提效后，新的瓶颈立刻出现。这意味着，人掌舵会越来越累、要求越来越高——你得在更快节奏中做出更好判断。Anthropic认为这是近期最可能发生的情景，且他们已在路上。

第三种情况：才是那个让人脊背发凉的版本——完整RSI，人类退居二线。AI自主构建后续模型，进度只由算力决定，人类从主导者变为监督者。好处是可能极快实现医疗突破、科学加速；坏处是，训练中的微小目标偏差，在自我迭代中可能被指数放大，直到人类彻底失去干预能力。这是最不确定、也最不可逆的一种。

讲完三种结局，报告末尾Anthropic开始呼吁：希望建立某种全球协调机制，在风险上升时能有序放缓、甚至暂停前沿AI开发。

翻译一下：势头太猛，我们很担心，觉得该有人出面让大家一起停下——但我们不会单方面停。

回到开头那个问题——这篇报告，到底有多真。

数据是真的：80%的代码、52倍的提速、800小时干赢人类一周，这些都不是吹出来的，AI确实在深度参与AI的研发。

但"AI马上就要自己造自己、奇点近在眼前"这层叙事，是被舆论放大的。真实进度卡在"研究品味"这道坎上，而这道坎，恰恰是人类目前最难被替代的部分。

至于那句"呼吁全球放缓"，值得多想一层。这套叙事Anthropic不是第一次用了：一边制造焦虑，一边把自己摆在"威胁发现者"和"最有能力应对威胁的人"这个位置上。担忧可能是真的，但它同时也是一门生意——你越相信AI危险得需要全球踩刹车，就越相信只有最前沿的那几家公司，才有资格握住方向盘。

所以真正值得你关注的，不是"奇点哪天到"，而是那个正在悄悄逼近的现实——当AI把执行环节压到极致快，人类唯一不能丢的，是判断力。会不会问对问题、信不信得过结果、敢不敢及时放弃，这些"研究品味"，在AI时代非但不会贬值，反而会成为越来越稀缺的硬通货。

这一点，对工程师如此，对你我做的每一份工作，恐怕都一样。

如果这篇帮你把这场喧嚣看清楚了一点，欢迎点个"在看"，也分享给那个一看到"奇点"二字就焦虑的朋友。

当执行被无限加速，你手里那份"判断力"，还够不够用？评论区聊聊。

← 上一篇：月入三千竟变身 AI 巨头的数据合伙人？下一篇：熊星科技助力上海大学科学画廊AI+实验室正式落成 →