AI正在自己造AI——这不再是科幻,而是已成现实

发布时间：2026-06-06 16:42阅读：37

全文约 2200 字，阅读约需 7 分钟

6 月 4 日， Anthropic 发布了一份报告，标题叫《当 AI 开始建造自己》。

报告里有两组数字，放在一起读，会产生一种很奇怪的眩晕感。

第一组：今年 5 月， Claude 自主编写了 Anthropic 生产代码库中超过 80%的代码。工程师每个季度交付的代码量翻了 8 倍。 Claude 完成开放式工程任务的成功率达到了 76%，半年内涨了 50 个百分点。它现在能连续自主工作 16 小时以上——一年前这个数字是 1.5 小时。

第二组：同一份报告里， Anthropic 警告说， AI"递归自我改进"——也就是 AI 设计并训练下一代 AI——可能"比大多数机构预期的时间更早到来"，并呼吁建立全行业的"暂停开发机制"。

一边加速踩油门，一边公开呼吁装刹车。

这不是虚伪。这比虚伪复杂得多——说实话，也比虚伪更让人后背发凉。

这 80%的代码意味着什么，比数字本身更值得琢磨。

不是说 Claude 写了 80%的代码行。意思是，在 Anthropic 的生产流程中，工程师的主要工作不再是写代码，而是做两件事：目标规划和审查。人定义"要做什么"和"做得好不好"， AI 负责"怎么做"。

这听起来好像只是分工调整。但如果你观察过任何一个组织，你会知道：当你不再亲手做一件事的时候，你判断这件事好坏的能力，会随时间退化。

一个从来不写代码的工程师，三年以后还知道什么叫"好代码"吗？他审查的依据是什么——是代码本身的品质，还是 AI 提供的审查清单？

说实话，我不确定。如果他三年来只做"审"和"批"，他的判断力靠什么维持？靠直觉？直觉也是练出来的。

这件事在律师行业已经有征兆了。在我的上一篇文章已经聊过，依赖 AI 做案件分析的律师，在庭上被问到分析报告没覆盖的细节时，会出现那种"脑子知道要看哪里、手翻不到"的停顿。不是态度问题，是他跳过了亲自动手的过程，所以消化不了别人替他总结的东西。

写代码也是一样。而且代码的问题比法律文书更隐蔽——法律文书在庭上会当场露馅，代码的缺陷可能在生产环境里潜伏几个月。

Anthropic 自己也承认了这一点。报告里提到，他们部署了 Claude 做自动化代码审查，能抓住大约三分之一的 bug 。三分之一，不是全部——说"三分之一"的时候我自己都在想，这个数字靠谱吗？反正报告里是这么写的，但剩下的三分之二怎么办？

比 80%更值得关注的，是报告里一个叫"递归自我改进"的概念。

这个词听起来很学术，翻译成大白话就是： AI 自己设计下一代的 AI 。

目前这还没有发生——Anthropic 明确说了，完全自主的递归自我改进"尚未实现"。但他们同时说，这"可能比大多数机构预期的时间更早到来"。

这里有一个时间线，放在一起看会让人不太舒服：

2024 年 3 月， Claude 3 Opus 能连续工作 4 分钟。 2025 年， Claude 3.7 Sonnet 能工作 1.5 小时。今年 3 月， Claude 4.6 Opus 能工作 12 小时。到了今年年中的 Mythos 预览版，这个数字是 16 小时以上。

从 4 分钟到 16 小时，也就两年。

两年， 240 倍。这要是一个投资回报率，你做梦都能笑醒。问题是它不是——它是你控制不了的东西的成长速度。

如果这个趋势继续——不是线性的，而是加速的——那么"AI 连续工作一周"、"AI 连续工作一个月"、"AI 独立完成整个项目的设计和开发"，大概不会太远。

到那个时候，"递归自我改进"就不是科幻了。 AI 有足够长的注意力窗口去理解自己的架构、设计改进方案、训练下一代模型——人在这条链条上的角色，可能从"审批者"进一步退到"旁观者"。

Anthropic 显然意识到了这个风险。报告里那些关于"暂停机制"的措辞，不是一个 PR 姿态，而是一个正在亲手建造这个东西的团队，对即将到来的事情的真实恐惧。

而我担心的是：等这个恐惧被验证的时候，我们可能已经没有喊停的资格了。

但问题就在这里。意识到风险，不代表能停下来。

Anthropic 在报告里呼吁建立"暂停开发机制"的同时，自己还在全力推进 Mythos 模型的研发。他们不是口是心非。他们是困在了一个经典的囚徒困境里。

这个困境，用军事类比最直观。

两个国家都在研发一种新武器。双方都知道，这种武器失控的风险极高——一旦部署，连锁反应可能超出任何一方的控制。但双方也都知道，如果自己单方面停下来而对方没有，那自己就会在下一轮博弈中处于绝对劣势。

于是双方都做着同样的事情：一边扩军，一边呼吁谈判。

AI 行业的现状就是如此。 Anthropic 、 OpenAI 、 Google DeepMind 、 Meta——每一家都在公开场合表达过对 AI 失控的担忧。同时每一家都在加紧投入下一代模型的军备竞赛。不是因为不担心，而是因为不加入的代价似乎是退出牌桌。

这大概是商业史上最奇怪的一种竞争：所有参赛者都承认终点线可能存在危险，但没有一个人愿意减速。

而在这场竞赛的喧嚣中，一个更安静的问题很少被认真讨论：如果真的可以暂停，应该停在哪个节点？

是在"AI 能写 80%代码"的时候停？还是在"AI 能写 100%代码"的时候停？是在"AI 能设计下一代 AI"之前停？还是在"AI 已经设计出一代比一代强的 AI"之后停？

这些节点一旦错过，就不再是按钮能控制的了。

不对，"按钮"这个比喻本身就是错的。从来就没有一个按钮。我们不是在坐电梯，我们是在一条没有刹车的下坡路上——每个人都在踩油门，然后互相喊"慢一点"。

回到那份报告。

我觉得最值得关注的，不是技术本身有多惊人，而是一个很容易被忽略的事实： Anthropic 选择在公开发布这份报告的同一时刻，既展示能力，又发出警告。

这是一个矛盾的动作，但也是一个诚实的动作。

诚实在哪里？在于它暴露了 AI 伦理讨论中最核心的难题：这个难题不发生在 AI 和人类之间，而发生在人类和人类之间。

AI 没有"野心"，没有"计划"，没有"想要控制一切"的欲望。 AI 只是一面镜子，反映的是建造它的人类的集体行为模式——我们既想要安全，又想要赢；既知道应该装刹车，又害怕装刹车的时候别人超车。

这不是 AI 的伦理问题。这是人的伦理问题。

说到底， Anthropic 这份报告最有价值的地方，不在于报告里写了什么，而在于它把那个所有人都知道但没人愿意大声说出来的矛盾，摆到了台面上。

剩下的问题是：看到了，然后呢？

如果不解决"谁先停"这个囚徒困境，所有关于 AI 安全的讨论都会变成一种仪式——每年发几份白皮书，开几次峰会，签几份宣言，然后继续加速。

而加速度本身，是不会自己停下来的。

邬辉林| 海泰律师事务所主任，一级律师， CIETAC 仲裁员

← 上一篇：AI驱动创业新纪元：菁英荟沙龙圆满落幕下一篇：湘楚产教融合新篇：正枘科技启动 AI 中台大赛，共育智能人才 →