AI自我进化的真相与焦虑营销
一个AI安全研究项目,交给AI自己完成:它耗时约800小时、花费约1.8万美元算力,恢复了97%的性能差距;而两名人类研究员用整整一周时间,仅恢复了23%的效果。
这组数据来自Anthropic最新发布的内部报告,标题颇具科幻感——《当AI开始构建自身》。除了这项实验,报告开头还抛出了几个关键数字:截至2026年5月,Anthropic代码库中超过80%的代码由Claude自主编写;2026年第二季度,工程师的人均日代码产出是2024年的8倍;Claude可连续自主工作超过16小时。
报告得出的结论令人震惊:按照当前趋势,AI自主设计并制造下一代AI完全可能实现。基于这一判断,Anthropic甚至建议全球暂停前沿AI研发。
社交媒体瞬间沸腾。"AI即将自我创造"、"递归自我改进,奇点将至"——熟悉的配方,熟悉的味道。如果你在AI圈混迹多年,一定对这种节奏不陌生:每隔数月,总有头部公司高呼"时代要变天",引发一轮集体焦虑,然后一切照旧。
巧合的是,OpenAI刚宣称"AI展现出递归自我改进的早期迹象",紧接着Anthropic就发布了"AI正在创造下一个自己"。连营销话术都开始互相较劲了。
我仔细研读了这份报告。哪些是事实、哪些是被舆论放大的焦虑,下面逐条分析。
递归自我改进(Recursive Self-Improvement,简称RSI),是AI圈讨论了近二十年的话题。其逻辑简单明了:AI能自我优化,优化后的版本继续改进下一代,无需人工干预,形成自我加速的飞轮效应。这正是奇点理论的核心。
关键在于,RSI不是开关,而是一个渐进过程。学界将其分为六个阶段,从"AI辅助人类"逐步发展到"AI完全自主迭代"。Anthropic也绘制了时间轴,分为五个阶段,并将自己定位在第四阶段——距离终点仅一步之遥。
用业界的六阶段标准重新评估,Anthropic的实际位置大约在第3到第4阶段之间。虽然略有折扣,但这个位置已经相当扎实。
支撑这一判断的不是PPT,而是两个公开的内部实验。
第一个实验,即开篇提到的"是否会做研究"测试。Claude Agent全程自主完成了AI安全研究项目,从提出假设、运行实验到分析结果,实现全自动化。800小时恢复97%、人类一周恢复23%的背后,是一个真实运转的半自动研究闭环——称其已站稳第3阶段毫不为过。
第二个实验关注"是否会自我提速"。Anthropic让Claude拿到一段训练小模型的代码,自己运行、计时、改写、再运行。最终它将速度提升了52倍——而熟练的人类研究员只能做到4倍。改进工具链、运行基准测试、选择更优版本,这条路径已非常接近"自改进Agent"的逻辑。
52倍对4倍,97%对23%。这两组对比并非炒作,而是已发生的事实。因此那句"AI大规模参与AI研发",并非危言耸听,而是事实。
报告中隐藏着一个词:research taste,即判断"什么问题值得研究"的能力。Anthropic用了个贴切的比喻:
初级员工接到的任务是"这个按钮坏了,去修一下";有经验的员工接到的是"网络有时卡顿,查查原因";而资深专家思考的是"下个季度该做什么"。
第一层,Claude已很擅长;第二层,它在快速追赶;但第三层——判断问题价值、结果可信度、何时该放弃——这种研究直觉,人类仍有明显优势。只要这个环节仍由人类主导,AI就还不是真正的自改进Agent,离完整的RSI还差一步。
报告中有个数据专门衡量这一点:在"判断研究方向"方面,Claude的新预览版在64%的情况下被另一个Claude裁判认为提出了更好的方案;而五个月前这一比例仅为51%。
趋势确实在上升。但请注意两点:一是64%离"完全自主判断"还远;二是这个数据是在问题边界清晰的实验环境下测得。现实中多为模糊、矛盾、无标准答案的问题,AI能判断到什么程度尚无定论。
换句话说:AI已成为极其高效的"执行者"和"加速器",但尚未成为能决定"做什么"的决策者。飞轮的核心仍掌握在人类手中。
报告未给出明确结局,而是列出了三种可能——这反而是其最可信之处。
第一种情况:趋势停在S曲线上。Transformer架构遇到瓶颈、算力能源跟不上、地缘政治阻碍全球合作,指数曲线变成S形,逐渐平缓。Anthropic认为这是最不可能的情况。但他们承认,即使停在这里,当前能力已足以让百人公司完成过去千人公司才能做的事——社会结构的变革不会因AI停滞而停止,只是形式会变化。
第二种情况:飞轮转动,但人类仍掌舵。AI负责执行和生成选项,人类负责判断和最终决策。听起来理想,但报告指出了一个隐藏问题:Amdahl定律。你加速一个环节,瓶颈就会转移到下一个。代码写快了,code review堵车;实验跑快了,结果分析跟不上;分析快了,决策又拖后腿。Anthropic称他们内部正经历这个过程,每波提效后,新的瓶颈立刻出现。这意味着,人掌舵会越来越累、要求越来越高——你得在更快节奏中做出更好判断。Anthropic认为这是近期最可能发生的情景,且他们已在路上。
第三种情况:才是那个让人脊背发凉的版本——完整RSI,人类退居二线。AI自主构建后续模型,进度只由算力决定,人类从主导者变为监督者。好处是可能极快实现医疗突破、科学加速;坏处是,训练中的微小目标偏差,在自我迭代中可能被指数放大,直到人类彻底失去干预能力。这是最不确定、也最不可逆的一种。
讲完三种结局,报告末尾Anthropic开始呼吁:希望建立某种全球协调机制,在风险上升时能有序放缓、甚至暂停前沿AI开发。
翻译一下:势头太猛,我们很担心,觉得该有人出面让大家一起停下——但我们不会单方面停。
回到开头那个问题——这篇报告,到底有多真。
数据是真的:80%的代码、52倍的提速、800小时干赢人类一周,这些都不是吹出来的,AI确实在深度参与AI的研发。
但"AI马上就要自己造自己、奇点近在眼前"这层叙事,是被舆论放大的。真实进度卡在"研究品味"这道坎上,而这道坎,恰恰是人类目前最难被替代的部分。
至于那句"呼吁全球放缓",值得多想一层。这套叙事Anthropic不是第一次用了:一边制造焦虑,一边把自己摆在"威胁发现者"和"最有能力应对威胁的人"这个位置上。担忧可能是真的,但它同时也是一门生意——你越相信AI危险得需要全球踩刹车,就越相信只有最前沿的那几家公司,才有资格握住方向盘。
所以真正值得你关注的,不是"奇点哪天到",而是那个正在悄悄逼近的现实——当AI把执行环节压到极致快,人类唯一不能丢的,是判断力。会不会问对问题、信不信得过结果、敢不敢及时放弃,这些"研究品味",在AI时代非但不会贬值,反而会成为越来越稀缺的硬通货。
这一点,对工程师如此,对你我做的每一份工作,恐怕都一样。
如果这篇帮你把这场喧嚣看清楚了一点,欢迎点个"在看",也分享给那个一看到"奇点"二字就焦虑的朋友。
当执行被无限加速,你手里那份"判断力",还够不够用?评论区聊聊。