AI 自主迭代时代已至

发布时间：2026-06-23 13:16阅读：2

Anthropic 八成代码由 Claude 生成，

田渊栋新创半年获资 6.5 亿美金

——递归自进化，已然降临。

今年五月，Anthropic 在一份内部文件中披露了一个令人惊愕的数据：其代码库中逾八成的内容，现已由 Claude 自行编写。

这并非偶尔为之。而是日复一日、持续不断。工程师每天合并的代码量较 2024 年激增 8 倍。在某次训练优化测试中，Claude 将一段代码的运行效率提升了 52 倍，而资深人类工程师通常需耗时 4 至 8 小时，仅能实现 4 倍提升。

这绝非一篇商业软文。Anthropic 在发布此文的同时，还呼吁业界应做好"紧急叫停"的预案。

"递归自进化"并非新概念。虽已提及多年，但多数时候仅停留在理论论文阶段。

Anthropic 这份报告的价值在于，它陈述的是已发生的事实，而非预测。他们的 Claude，已在实际生产环境中参与下一代 Claude 的训练与开发。换言之，AI 正在协助 AI 变得更聪明。这一链条，确实已经运转起来。

关键数据

· Claude 代码撰写占比：超 80%（截至 2026 年 5 月）

· 工程师日均代码产出：为 2024 年的 8 倍

· 训练代码优化：Claude 实现 52 倍加速，人类工程师通常仅达 4 倍

他们同时采取了一项罕见举措：限制最新的 Claude Fable 5 不得用于开发更前沿的 AI。这既是一种自我约束，也是一个警示信号。

在同一时间线上，另一件事也在悄然发生。

2026 年 5 月，一家名为 Recursive Superintelligence 的公司从隐秘状态走向台前。获融资 6.5 亿美元，估值 46.5 亿。由谷歌风投和 Greycroft 领投，英伟达、AMD 跟投。

创始团队阵容令人咋舌，完全不似初创公司：田渊栋（前 Meta FAIR 研究科学家总监）、Peter Norvig（《人工智能：一种现代方法》作者）、Alexey Dosovitskiy（Vision Transformer 论文第一作者，谷歌学术引用超 16 万）……这支约 10 人的创始团队，每位成员的名字都是论文界的常客。

他们要做的事，表述起来很简单：让 AI 自动运行科研闭环。提出构想→编写代码→执行实验→分析结果→再提构想，全部由 AI 完成，并行推进，并在跨任务中复用发现。

Recursive 系统与传研究流程对比

传统（人力驱动）：提构想 → 写代码 → 跑实验 → 分析 → 再提构想（串行，缓慢）

Recursive（AI 驱动）：多线并行推进 + 自动构想 + 自动验证 + 跨任务复用 + 奖励作弊检测

Recursive 公开了三项基准测试成绩，均刷新了 SOTA 记录。

NanoGPT Speedrun：该竞赛社区运行两年有余，历经 83 次社区贡献，最佳成绩被压缩至 79.7 秒。Recursive 的系统跑出了 77.5 秒。节省了 2.2 秒，听起来不多，但在这种极限竞速的语境下，意味着找到了人类研究员两年内未曾发现的优化路径。

GPU 内核优化（SOL-ExecBench，英伟达出题）：此前最佳公开成绩为 0.699，Recursive 跑出了 0.754。他们在博客中写道："这些构想源自系统本身，而非我们的专业背景。" 团队承认自己并非内核领域的专家。

Recursive 并非孤例。同一季度内，另有两家公司也在从事"AI 自动科研"这一事业。

AMI Labs，由 Yann LeCun 挂名，2026 年 3 月获得 10 亿美元融资。Ineffable Intelligence，由 David Silver（AlphaGo 之父）创立，4 月完成了 11 亿美元种子轮。三家公司，创始人均为 AI 史上留名的人物，合计融资近 30 亿美元。

资本正在押注同一方向：让 AI 参与 AI 的研发。

AI 自动科研赛道融资对比（2026 年 Q1-Q2）

Recursive Superintelligence（田渊栋）：6.5 亿美元，2026 年 5 月，GV+ 英伟达领投

AMI Labs（Yann LeCun 挂名）：10 亿美元，2026 年 3 月

Ineffable Intelligence（AlphaGo 作者 David Silver）：11 亿美元种子轮，2026 年 4 月

三家公司所做之事虽有微妙差异，但核心命题一致：若 AI 能参与自身研发，研究速度将发生何种变化？

从 Anthropic 的数据来看，答案已现：快得多。

先澄清一个易被误解的点：AI 自动科研，并非旨在替代研究员。至少现阶段并非如此。

Recursive 明确表示，当前系统最擅长的是"指标清晰、反馈迅速、作弊可检测"的场景。运行基准测试是其优势场景，但在推进真正开放性的科学问题上仍相去甚远。

但"代码层面的脏活"——反复调整超参数、测试不同精度组合、验证新的内核写法——这些事，AI 如今确实可以替代。研究员腾出的时间，该投向何处？应投向更难的问题。

「这些构想源自系统本身，而非我们的专业背景。」

——Recursive Superintelligence 团队，记录于 GPU 内核优化成果博客

这句话其实让人不知该如何解读。是一种谦逊，还是某种程度的警觉？在一个你不擅长的领域，系统自行找到了突破口，且是在你可视范围内——目前仍是如此。

Anthropic 在报告结尾表示，他们愿意在必要时支持行业协调，包括临时叫停前沿 AI 开发。这是从事 AI 安全的人在说这话，而非外部监管者。

同时，他们的系统仍在每日向代码库合并代码。

这并不矛盾。这便是他们当前的状态：深知此事可能的走向，却无力停下脚步。

← 上一篇：管理类联考AI助手：近课AI，助你一战成硕下一篇：AI赛道上演魔幻一日 →