从工具到协作者：AI正在深度参与自身研发

发布时间：2026-06-06 14:53阅读：40

把一家AI企业比作医疗机构会更清晰：过去的AI研发类似于传统门诊模式。

人提出问题，人设计方案，人执行实验，人分析结果，人再决定下一步。

AI只是那个“帮忙查资料、写些文档、补充几段代码”的辅助角色。

但Anthropic Institute近期发布的这篇文章，值得关注的核心在于：他们认为，这种分工正在发生变化。

并非“AI已经完全能够自主构建自身”。

而是：AI正在日益深入地参与AI研发链条本身。从编写代码，到执行实验，到发现缺陷，到为后续研究提供建议。也就是说，AI不再仅仅帮人完成任务，开始帮人缩短“提出问题—实验—反馈—修正”的循环周期。

这正是原文标题的那句话：When AI builds itself。

“递归自我改进”听起来颇具科幻色彩。

但我们可以将其分解理解。

在医疗工作中，一个流程如果日趋成熟，往往会演变成这样：

第一次依赖人工监督执行。

第二次制定成标准操作流程。

第三次形成表格、路径、质量检查清单。

随后，系统开始自动提醒、自动汇总、自动识别异常。

这还不算“系统自主管理自身”，但它已经在减少人工手动干预。

AI研发中的递归自我改进，指的是更进一步的方向：一个AI系统不仅帮助人开发工具，还能协助开发下一代AI系统。如果闭环足够完整，未来甚至可能实现“AI设计并训练自己的继承者”。

Anthropic文章中也相当审慎：他们明确表示，目前尚未达到这一阶段，而且这件事不一定会发生。

但他们认为，这一趋势已经值得提前讨论。

这张图的含义很明确：

早期是人在电脑前编写代码。

后来chatbot帮人生成片段。

再后来coding agents能自主修改文件、执行命令。

现在autonomous agents可以运行代码，还能将数小时的工作分配给其他agent。

未来那个问号，就是closing the loop：模型能否参与构建和训练下一代模型。

Anthropic提供了一组内部数据：截至2026年5月，超过80%合并到Anthropic生产代码库的代码，可归因于Claude。

这个数字令人惊讶，但要审慎理解。

它不是说“工程师没用了”，也不是说“代码质量必然更好”。原文自己也提醒，代码行数不是完美指标，可能高估真实生产力。

更合理的理解是：

工程师从“亲自敲字的人”，转变为“设定目标、审查方案、判断风险的人”。

这类似于科室引入信息系统后，护士不再手工抄录所有记录，但更需要核对医嘱、处理异常、判断流程风险。

自动化没有消除责任，反而将人的责任推向了更高层级。

这张图显示，Anthropic工程师人均代码合并量在2025年开始上升，2026年进一步变陡。原文称，2026年第二季度，典型工程师每天合并的代码量大约是2024年的8倍。

对医护读者而言，可以这样理解：

过去一个人一天只能完成1份复杂质量控制报告。

后来AI帮他准备材料、运行统计、生成初稿，他一天可以审核4份、8份。

真正增加的并非“手速”，而是一个人能驾驭的工作范围扩大了。

原文里还有一个很重要的区分：任务分层。

低难度任务像“修复一个明确的按钮bug”。

中等任务像“将某个模块升级到新版本”。

更开放的任务像“训练任务突然大面积崩溃，请找出原因”。

差异在哪里？

明确任务依赖执行力。

开放任务依赖定位、排除、假设验证和判断。

这就很像临床工作：按照医嘱执行是一种能力；遇到患者病情突然变化，能否提出合理鉴别、找到关键证据、判断下一步，才是真正困难的部分。

Anthropic指出，Claude在开放任务上的表现进步显著。原文举了一个例子：一次训练任务大面积崩溃，工程师仅给予Claude一些文本上下文和集群访问能力，Claude逐步排查运行中的jobs，最终定位到一个隐蔽的debug flag，在约2小时内完成了通常需要2到3天的工作。

这类案例表明，AI agent的价值不只是“生成答案”，而是能进入真实环境，持续尝试、观察反馈、修正路径。

这和我们前面一直讲的Codex、Skill、Workflow是同一脉络：

不是让AI只写一段漂亮文字。

而是让它读资料、做步骤、跑工具、检查结果，把一个流程闭环。

文章最核心的问题不是“AI能不能写代码”。

而是：AI能不能判断下一步该做什么。

在科研中，这叫research taste。中文中可以粗略译为“研究判断力”。

比如一个实验结果不对，你可以继续调整参数，也可以质疑数据，也可以更换评价指标，还可以意识到这个方向本身没有价值。

这些判断，过去主要依赖有经验的人。

Anthropic做了一个内部分析：他们找出129个真实Claude Code研究会话中的“分岔点”。这些地方，人类研究者当时的选择后来被证明有改进空间。然后他们让不同Claude模型只看分岔点之前的信息，判断下一步该怎么走，再由一个能看到完整结果的Claude judge评估谁的建议更好。

结果是：2025年11月的Opus 4.5，有51%的时候建议优于人类当时选择；2026年4月的Mythos Preview，提高到64%。

注意，这不是公平的人机全面对决，因为样本本来就挑选了“人类可能走偏”的时刻。它更像是在问：

当研究已经有些偏离时，模型能否指出一条更好的路？

这就是递归自我改进最敏感的地方。

如果AI只会执行，人仍然掌握方向盘。

如果AI开始能做研究判断，人类的角色就会进一步收缩到更高层级：选择哪些问题值得做，哪些结果值得信，哪些风险不能碰。

你可能会说：这不是AI公司自己的事吗？和医院有什么关系？

关系很大。

因为同一类能力，会很快扩散到所有知识工作。

对医院和科研团队来说，未来几年最先变化的可能不是“AI独立诊疗”，而是这些更日常的工作：

科研立题前，AI帮你扫文献、找争议点、列出可行实验路径。

教学备课时，AI把高密度英文论文改成分层讲义和课堂提问。

科室质控时，AI帮你把病历抽查、问题归类、整改建议先做一轮。

公众号和患者宣教时，AI帮你从

← 上一篇：智能纪元中的守牧者下一篇：AI Agent领域单日爆增1万星标 →