从工具到协作者:AI正在深度参与自身研发
把一家AI企业比作医疗机构会更清晰:过去的AI研发类似于传统门诊模式。
人提出问题,人设计方案,人执行实验,人分析结果,人再决定下一步。
AI只是那个“帮忙查资料、写些文档、补充几段代码”的辅助角色。
但Anthropic Institute近期发布的这篇文章,值得关注的核心在于:他们认为,这种分工正在发生变化。
并非“AI已经完全能够自主构建自身”。
而是:AI正在日益深入地参与AI研发链条本身。从编写代码,到执行实验,到发现缺陷,到为后续研究提供建议。也就是说,AI不再仅仅帮人完成任务,开始帮人缩短“提出问题—实验—反馈—修正”的循环周期。
这正是原文标题的那句话:When AI builds itself。
“递归自我改进”听起来颇具科幻色彩。
但我们可以将其分解理解。
在医疗工作中,一个流程如果日趋成熟,往往会演变成这样:
第一次依赖人工监督执行。
第二次制定成标准操作流程。
第三次形成表格、路径、质量检查清单。
随后,系统开始自动提醒、自动汇总、自动识别异常。
这还不算“系统自主管理自身”,但它已经在减少人工手动干预。
AI研发中的递归自我改进,指的是更进一步的方向:一个AI系统不仅帮助人开发工具,还能协助开发下一代AI系统。如果闭环足够完整,未来甚至可能实现“AI设计并训练自己的继承者”。
Anthropic文章中也相当审慎:他们明确表示,目前尚未达到这一阶段,而且这件事不一定会发生。
但他们认为,这一趋势已经值得提前讨论。
这张图的含义很明确:
早期是人在电脑前编写代码。
后来chatbot帮人生成片段。
再后来coding agents能自主修改文件、执行命令。
现在autonomous agents可以运行代码,还能将数小时的工作分配给其他agent。
未来那个问号,就是closing the loop:模型能否参与构建和训练下一代模型。
Anthropic提供了一组内部数据:截至2026年5月,超过80%合并到Anthropic生产代码库的代码,可归因于Claude。
这个数字令人惊讶,但要审慎理解。
它不是说“工程师没用了”,也不是说“代码质量必然更好”。原文自己也提醒,代码行数不是完美指标,可能高估真实生产力。
更合理的理解是:
工程师从“亲自敲字的人”,转变为“设定目标、审查方案、判断风险的人”。
这类似于科室引入信息系统后,护士不再手工抄录所有记录,但更需要核对医嘱、处理异常、判断流程风险。
自动化没有消除责任,反而将人的责任推向了更高层级。
这张图显示,Anthropic工程师人均代码合并量在2025年开始上升,2026年进一步变陡。原文称,2026年第二季度,典型工程师每天合并的代码量大约是2024年的8倍。
对医护读者而言,可以这样理解:
过去一个人一天只能完成1份复杂质量控制报告。
后来AI帮他准备材料、运行统计、生成初稿,他一天可以审核4份、8份。
真正增加的并非“手速”,而是一个人能驾驭的工作范围扩大了。
原文里还有一个很重要的区分:任务分层。
低难度任务像“修复一个明确的按钮bug”。
中等任务像“将某个模块升级到新版本”。
更开放的任务像“训练任务突然大面积崩溃,请找出原因”。
差异在哪里?
明确任务依赖执行力。
开放任务依赖定位、排除、假设验证和判断。
这就很像临床工作:按照医嘱执行是一种能力;遇到患者病情突然变化,能否提出合理鉴别、找到关键证据、判断下一步,才是真正困难的部分。
Anthropic指出,Claude在开放任务上的表现进步显著。原文举了一个例子:一次训练任务大面积崩溃,工程师仅给予Claude一些文本上下文和集群访问能力,Claude逐步排查运行中的jobs,最终定位到一个隐蔽的debug flag,在约2小时内完成了通常需要2到3天的工作。
这类案例表明,AI agent的价值不只是“生成答案”,而是能进入真实环境,持续尝试、观察反馈、修正路径。
这和我们前面一直讲的Codex、Skill、Workflow是同一脉络:
不是让AI只写一段漂亮文字。
而是让它读资料、做步骤、跑工具、检查结果,把一个流程闭环。
文章最核心的问题不是“AI能不能写代码”。
而是:AI能不能判断下一步该做什么。
在科研中,这叫research taste。中文中可以粗略译为“研究判断力”。
比如一个实验结果不对,你可以继续调整参数,也可以质疑数据,也可以更换评价指标,还可以意识到这个方向本身没有价值。
这些判断,过去主要依赖有经验的人。
Anthropic做了一个内部分析:他们找出129个真实Claude Code研究会话中的“分岔点”。这些地方,人类研究者当时的选择后来被证明有改进空间。然后他们让不同Claude模型只看分岔点之前的信息,判断下一步该怎么走,再由一个能看到完整结果的Claude judge评估谁的建议更好。
结果是:2025年11月的Opus 4.5,有51%的时候建议优于人类当时选择;2026年4月的Mythos Preview,提高到64%。
注意,这不是公平的人机全面对决,因为样本本来就挑选了“人类可能走偏”的时刻。它更像是在问:
当研究已经有些偏离时,模型能否指出一条更好的路?
这就是递归自我改进最敏感的地方。
如果AI只会执行,人仍然掌握方向盘。
如果AI开始能做研究判断,人类的角色就会进一步收缩到更高层级:选择哪些问题值得做,哪些结果值得信,哪些风险不能碰。
你可能会说:这不是AI公司自己的事吗?和医院有什么关系?
关系很大。
因为同一类能力,会很快扩散到所有知识工作。
对医院和科研团队来说,未来几年最先变化的可能不是“AI独立诊疗”,而是这些更日常的工作:
科研立题前,AI帮你扫文献、找争议点、列出可行实验路径。
教学备课时,AI把高密度英文论文改成分层讲义和课堂提问。
科室质控时,AI帮你把病历抽查、问题归类、整改建议先做一轮。
公众号和患者宣教时,AI帮你从