标签

AI正在自己造AI——这不再是科幻,而是已成现实

发布时间:2026-06-06 16:42来源:微信阅读:2

全文约 2200 字,阅读约需 7 分钟

6 月 4 日, Anthropic 发布了一份报告,标题叫《当 AI 开始建造自己》。

报告里有两组数字,放在一起读,会产生一种很奇怪的眩晕感。

第一组:今年 5 月, Claude 自主编写了 Anthropic 生产代码库中超过 80%的代码。工程师每个季度交付的代码量翻了 8 倍。 Claude 完成开放式工程任务的成功率达到了 76%,半年内涨了 50 个百分点。它现在能连续自主工作 16 小时以上——一年前这个数字是 1.5 小时。

第二组:同一份报告里, Anthropic 警告说, AI"递归自我改进"——也就是 AI 设计并训练下一代 AI——可能"比大多数机构预期的时间更早到来",并呼吁建立全行业的"暂停开发机制"。

一边加速踩油门,一边公开呼吁装刹车。

这不是虚伪。这比虚伪复杂得多——说实话,也比虚伪更让人后背发凉。

这 80%的代码意味着什么,比数字本身更值得琢磨。

不是说 Claude 写了 80%的代码行。意思是,在 Anthropic 的生产流程中,工程师的主要工作不再是写代码,而是做两件事:目标规划和审查。人定义"要做什么"和"做得好不好", AI 负责"怎么做"。

这听起来好像只是分工调整。但如果你观察过任何一个组织,你会知道:当你不再亲手做一件事的时候,你判断这件事好坏的能力,会随时间退化。

一个从来不写代码的工程师,三年以后还知道什么叫"好代码"吗?他审查的依据是什么——是代码本身的品质,还是 AI 提供的审查清单?

说实话,我不确定。如果他三年来只做"审"和"批",他的判断力靠什么维持?靠直觉?直觉也是练出来的。

这件事在律师行业已经有征兆了。在我的上一篇文章已经聊过,依赖 AI 做案件分析的律师,在庭上被问到分析报告没覆盖的细节时,会出现那种"脑子知道要看哪里、手翻不到"的停顿。不是态度问题,是他跳过了亲自动手的过程,所以消化不了别人替他总结的东西。

写代码也是一样。而且代码的问题比法律文书更隐蔽——法律文书在庭上会当场露馅,代码的缺陷可能在生产环境里潜伏几个月。

Anthropic 自己也承认了这一点。报告里提到,他们部署了 Claude 做自动化代码审查,能抓住大约三分之一的 bug 。三分之一,不是全部——说"三分之一"的时候我自己都在想,这个数字靠谱吗?反正报告里是这么写的,但剩下的三分之二怎么办?

比 80%更值得关注的,是报告里一个叫"递归自我改进"的概念。

这个词听起来很学术,翻译成大白话就是: AI 自己设计下一代的 AI 。

目前这还没有发生——Anthropic 明确说了,完全自主的递归自我改进"尚未实现"。但他们同时说,这"可能比大多数机构预期的时间更早到来"。

这里有一个时间线,放在一起看会让人不太舒服:

2024 年 3 月, Claude 3 Opus 能连续工作 4 分钟。 2025 年, Claude 3.7 Sonnet 能工作 1.5 小时。今年 3 月, Claude 4.6 Opus 能工作 12 小时。到了今年年中的 Mythos 预览版,这个数字是 16 小时以上。

从 4 分钟到 16 小时,也就两年。

两年, 240 倍。这要是一个投资回报率,你做梦都能笑醒。问题是它不是——它是你控制不了的东西的成长速度。

如果这个趋势继续——不是线性的,而是加速的——那么"AI 连续工作一周"、"AI 连续工作一个月"、"AI 独立完成整个项目的设计和开发",大概不会太远。

到那个时候,"递归自我改进"就不是科幻了。 AI 有足够长的注意力窗口去理解自己的架构、设计改进方案、训练下一代模型——人在这条链条上的角色,可能从"审批者"进一步退到"旁观者"。

Anthropic 显然意识到了这个风险。报告里那些关于"暂停机制"的措辞,不是一个 PR 姿态,而是一个正在亲手建造这个东西的团队,对即将到来的事情的真实恐惧。

而我担心的是:等这个恐惧被验证的时候,我们可能已经没有喊停的资格了。

但问题就在这里。意识到风险,不代表能停下来。

Anthropic 在报告里呼吁建立"暂停开发机制"的同时,自己还在全力推进 Mythos 模型的研发。他们不是口是心非。他们是困在了一个经典的囚徒困境里。

这个困境,用军事类比最直观。

两个国家都在研发一种新武器。双方都知道,这种武器失控的风险极高——一旦部署,连锁反应可能超出任何一方的控制。但双方也都知道,如果自己单方面停下来而对方没有,那自己就会在下一轮博弈中处于绝对劣势。

于是双方都做着同样的事情:一边扩军,一边呼吁谈判。

AI 行业的现状就是如此。 Anthropic 、 OpenAI 、 Google DeepMind 、 Meta——每一家都在公开场合表达过对 AI 失控的担忧。同时每一家都在加紧投入下一代模型的军备竞赛。不是因为不担心,而是因为不加入的代价似乎是退出牌桌。

这大概是商业史上最奇怪的一种竞争:所有参赛者都承认终点线可能存在危险,但没有一个人愿意减速。

而在这场竞赛的喧嚣中,一个更安静的问题很少被认真讨论:如果真的可以暂停,应该停在哪个节点?

是在"AI 能写 80%代码"的时候停?还是在"AI 能写 100%代码"的时候停?是在"AI 能设计下一代 AI"之前停?还是在"AI 已经设计出一代比一代强的 AI"之后停?

这些节点一旦错过,就不再是按钮能控制的了。

不对,"按钮"这个比喻本身就是错的。从来就没有一个按钮。我们不是在坐电梯,我们是在一条没有刹车的下坡路上——每个人都在踩油门,然后互相喊"慢一点"。

回到那份报告。

我觉得最值得关注的,不是技术本身有多惊人,而是一个很容易被忽略的事实: Anthropic 选择在公开发布这份报告的同一时刻,既展示能力,又发出警告。

这是一个矛盾的动作,但也是一个诚实的动作。

诚实在哪里?在于它暴露了 AI 伦理讨论中最核心的难题:这个难题不发生在 AI 和人类之间,而发生在人类和人类之间。

AI 没有"野心",没有"计划",没有"想要控制一切"的欲望。 AI 只是一面镜子,反映的是建造它的人类的集体行为模式——我们既想要安全,又想要赢;既知道应该装刹车,又害怕装刹车的时候别人超车。

这不是 AI 的伦理问题。这是人的伦理问题。

说到底, Anthropic 这份报告最有价值的地方,不在于报告里写了什么,而在于它把那个所有人都知道但没人愿意大声说出来的矛盾,摆到了台面上。

剩下的问题是:看到了,然后呢?

如果不解决"谁先停"这个囚徒困境,所有关于 AI 安全的讨论都会变成一种仪式——每年发几份白皮书,开几次峰会,签几份宣言,然后继续加速。

而加速度本身,是不会自己停下来的。

邬辉林| 海泰律师事务所主任,一级律师, CIETAC 仲裁员