AI 自主迭代时代已至
Anthropic 八成代码由 Claude 生成,
田渊栋新创半年获资 6.5 亿美金
——递归自进化,已然降临。
今年五月,Anthropic 在一份内部文件中披露了一个令人惊愕的数据:其代码库中逾八成的内容,现已由 Claude 自行编写。
这并非偶尔为之。而是日复一日、持续不断。工程师每天合并的代码量较 2024 年激增 8 倍。在某次训练优化测试中,Claude 将一段代码的运行效率提升了 52 倍,而资深人类工程师通常需耗时 4 至 8 小时,仅能实现 4 倍提升。
这绝非一篇商业软文。Anthropic 在发布此文的同时,还呼吁业界应做好"紧急叫停"的预案。
"递归自进化"并非新概念。虽已提及多年,但多数时候仅停留在理论论文阶段。
Anthropic 这份报告的价值在于,它陈述的是已发生的事实,而非预测。他们的 Claude,已在实际生产环境中参与下一代 Claude 的训练与开发。换言之,AI 正在协助 AI 变得更聪明。这一链条,确实已经运转起来。
关键数据
· Claude 代码撰写占比:超 80%(截至 2026 年 5 月)
· 工程师日均代码产出:为 2024 年的 8 倍
· 训练代码优化:Claude 实现 52 倍加速,人类工程师通常仅达 4 倍
他们同时采取了一项罕见举措:限制最新的 Claude Fable 5 不得用于开发更前沿的 AI。这既是一种自我约束,也是一个警示信号。
在同一时间线上,另一件事也在悄然发生。
2026 年 5 月,一家名为 Recursive Superintelligence 的公司从隐秘状态走向台前。获融资 6.5 亿美元,估值 46.5 亿。由谷歌风投和 Greycroft 领投,英伟达、AMD 跟投。
创始团队阵容令人咋舌,完全不似初创公司:田渊栋(前 Meta FAIR 研究科学家总监)、Peter Norvig(《人工智能:一种现代方法》作者)、Alexey Dosovitskiy(Vision Transformer 论文第一作者,谷歌学术引用超 16 万)……这支约 10 人的创始团队,每位成员的名字都是论文界的常客。
他们要做的事,表述起来很简单:让 AI 自动运行科研闭环。提出构想→编写代码→执行实验→分析结果→再提构想,全部由 AI 完成,并行推进,并在跨任务中复用发现。
Recursive 系统与传研究流程对比
传统(人力驱动):提构想 → 写代码 → 跑实验 → 分析 → 再提构想(串行,缓慢)
Recursive(AI 驱动):多线并行推进 + 自动构想 + 自动验证 + 跨任务复用 + 奖励作弊检测
Recursive 公开了三项基准测试成绩,均刷新了 SOTA 记录。
NanoGPT Speedrun:该竞赛社区运行两年有余,历经 83 次社区贡献,最佳成绩被压缩至 79.7 秒。Recursive 的系统跑出了 77.5 秒。节省了 2.2 秒,听起来不多,但在这种极限竞速的语境下,意味着找到了人类研究员两年内未曾发现的优化路径。
GPU 内核优化(SOL-ExecBench,英伟达出题):此前最佳公开成绩为 0.699,Recursive 跑出了 0.754。他们在博客中写道:"这些构想源自系统本身,而非我们的专业背景。" 团队承认自己并非内核领域的专家。
Recursive 并非孤例。同一季度内,另有两家公司也在从事"AI 自动科研"这一事业。
AMI Labs,由 Yann LeCun 挂名,2026 年 3 月获得 10 亿美元融资。Ineffable Intelligence,由 David Silver(AlphaGo 之父)创立,4 月完成了 11 亿美元种子轮。三家公司,创始人均为 AI 史上留名的人物,合计融资近 30 亿美元。
资本正在押注同一方向:让 AI 参与 AI 的研发。
AI 自动科研赛道融资对比(2026 年 Q1-Q2)
Recursive Superintelligence(田渊栋):6.5 亿美元,2026 年 5 月,GV+ 英伟达领投
AMI Labs(Yann LeCun 挂名):10 亿美元,2026 年 3 月
Ineffable Intelligence(AlphaGo 作者 David Silver):11 亿美元种子轮,2026 年 4 月
三家公司所做之事虽有微妙差异,但核心命题一致:若 AI 能参与自身研发,研究速度将发生何种变化?
从 Anthropic 的数据来看,答案已现:快得多。
先澄清一个易被误解的点:AI 自动科研,并非旨在替代研究员。至少现阶段并非如此。
Recursive 明确表示,当前系统最擅长的是"指标清晰、反馈迅速、作弊可检测"的场景。运行基准测试是其优势场景,但在推进真正开放性的科学问题上仍相去甚远。
但"代码层面的脏活"——反复调整超参数、测试不同精度组合、验证新的内核写法——这些事,AI 如今确实可以替代。研究员腾出的时间,该投向何处?应投向更难的问题。
「这些构想源自系统本身,而非我们的专业背景。」
——Recursive Superintelligence 团队,记录于 GPU 内核优化成果博客
这句话其实让人不知该如何解读。是一种谦逊,还是某种程度的警觉?在一个你不擅长的领域,系统自行找到了突破口,且是在你可视范围内——目前仍是如此。
Anthropic 在报告结尾表示,他们愿意在必要时支持行业协调,包括临时叫停前沿 AI 开发。这是从事 AI 安全的人在说这话,而非外部监管者。
同时,他们的系统仍在每日向代码库合并代码。
这并不矛盾。这便是他们当前的状态:深知此事可能的走向,却无力停下脚步。