Anthropic 最新文章:AI 正在从工具升级为制造者——它已深度参与下一代 AI 开发
Anthropic 这篇最新发布的文章指出一个重要趋势:AI 正在逐步渗透到 AI 自身的研发链条中。传统模式下,AI 的开发完全依赖人类:工程师负责编码、团队搭建环境、研究人员设计实验、最终由人评估成果。但今天,在 Anthropic 的实际工作中,Claude 已经能够独立承担大量工程与研究任务,显著提升了 AI 的迭代效率。
过去,人们对 AI 的认知停留在"人类创造工具"这一层面。
开发者编写程序,研究人员设计实验方案,产品团队确定研发方向,最终训练出更强大的模型。AI 不过是人类劳动的结晶,是被制造出来的产品。
然而 Anthropic 近期发表的文章提出了一个更值得深思的问题:假如 AI 不再仅仅是被人类制造,而是开始参与制造下一个 AI 呢?
这篇文章的标题为《When AI builds itself》,即:当 AI 开始构建自身。
它探讨的并非虚构的科幻情节,而是一个正在上演的现实:在 Anthropic 内部,AI 已经逐步融入 AI 研发的核心环节。从代码编写、代码优化,到实验运行、系统调优、研究分析,Claude 正在重塑 AI 公司的内部工作模式。
Anthropic 将这一趋势推向极致后,给出了一个关键概念:递归自我改进。
所谓递归自我改进,简而言之就是:一个 AI 系统不仅能辅助人类开发 AI,更能在充足算力的支撑下,逐步设计、训练、优化自身的下一代版本。
这听起来像是科幻作品中的情节,但 Anthropic 的立场相当审慎:他们既未声称此事已然发生,也未断言它必然发生。他们真正想传达的是:我们或许比想象中更接近这一临界点。
文章首先列举了一系列外部趋势。
AI 独立完成任务的持续时间正在快速延长。过去,模型只能处理几分钟的简短任务,比如编写一小段代码或修复一个简单错误;如今,模型已经能够处理跨越数小时甚至更长时间的复杂任务。
这背后的本质变化,不仅仅是模型"会对话"了,而是它们日益演变为能够持续执行工作的智能代理。
它们能够阅读代码、修改代码、运行测试、定位问题、再次修复。更为关键的是,它们不再仅仅向人类提供建议,而是真正进入实际执行阶段。
过去,人类对 AI 说:"这段代码怎么写?"
现在,人类可能只需说:"这个系统出了故障,你去排查一下。"
中间的方案设计、路径选择、测试验证、问题修复,越来越多的环节可以由 AI 独立完成。
这正是文章最核心的论断:AI 不仅在改变普通人的工作方式,也在重塑 AI 公司自身的研发范式。
这篇文章最具价值的部分,是 Anthropic 披露了一批内部数据。
截至 2026 年 5 月,Anthropic 合并至代码库的代码中,超过 80% 可追溯至 Claude。换言之,Claude 已经不再是工程师身旁的"辅助工具",而是在相当程度上成为代码产出的主力。
与此同时,Anthropic 的典型工程师在 2026 年第二季度每日合并的代码量,大约是 2024 年的 8 倍。
文章也指出,代码行数并非衡量生产力的完美标准。代码数量增加不一定意味着质量提升,也不代表产品必然更好。
但这些数据至少说明了一点:AI 已经使工程团队的产出效率产生了质的飞跃。
过去,一名工程师的核心工作是亲自编写代码。如今,他的角色日益转变为"AI 工作流导演":设定目标、分解任务、审核成果、判断是否可以合并。
这意味着,人的定位正在发生转变。
人类不再需要站在每一行代码之前,而是逐步站到更高的层面:把控方向、评估质量、控制风险。
Anthropic 将 AI 研发工作划分为两大类别:工程与研究。
工程涵盖代码编写、环境搭建、训练流程管理。
研究包括确定实验方向、如何解读实验结果、下一步应探索哪些路径。
在工程领域,Claude 已经能够处理越来越开放性的问题。例如,一个系统发生故障,原因尚不明确,工程师只需提供一些背景信息和权限,它就能自主排查运行环境、测试不同配置、定位问题并提出修复方案。
在研究执行层面,Claude 的进步同样显著。文章提到了一个实验:让模型优化一段训练小模型的代码,在保证正确性的前提下尽可能提升运行速度。2025 年 5 月,Claude Opus 4 大约能达到 3 倍加速;到 2026 年 4 月,Claude Mythos Preview 已经能够实现约 52 倍加速。
这说明在"目标明确、评价标准清晰"的任务中,AI 已经可以表现得极为出色。
但文章也反复强调一个关键差异:AI 尚未完全具备人类研究员的判断能力。
哪些问题值得关注?
哪些实验值得开展?
哪些结果值得信赖?
何时应该终止?
这些并非简单的执行任务,而是涉及"研究品味"与"方向洞察"。Anthropic 认为,这仍然是人类目前最核心的竞争优势。
换言之,AI 已经很擅长"如何做",但尚未完全学会"为何做"与"是否应该做"。
这篇文章真正令人深思的地方,并非 AI 会编写代码,而是:人类在 AI 研发流程中的位置,正一步步被压缩到更有限的环节。
当 AI 生成的代码质量逼近人类水平,人类就会从"编写代码"转向"审核代码"。
当 AI 能够独立运行实验,人类就会从"执行实验"转向"筛选值得开展的实验"。
当 AI 能够同时产出大量想法、工具、模拟和方案,人类就会从"生产"转向"筛选"。
这带来一个新兴瓶颈:人类的审核速度,可能无法赶上 AI 的产出速度。
如果 AI 一天能够生成海量代码、实验和研究思路,人类真正稀缺的就不再是执行能力,而是判断力、验证能力和组织协调能力。
这实际上对所有知识工作都具有启发意义。
未来真正关键的能力,可能不是"我能否亲手完成每个步骤",而是:
我能否提出恰当的问题?
我能否评估结果的质量?
我能否设计有效的验证机制?
我能否管理一群 AI 代理,使它们朝着正确方向推进?
Anthropic 在文章中设想了三种可能的未来走向。
第一种,趋势减缓。
目前许多 AI 能力看似指数级增长,但也可能只是 S 型曲线的初始阶段。或许 AI 很快会遭遇瓶颈,例如算力、电力、芯片、数据、架构限制,或者研究判断力本身难以通过规模扩展继续提升。
如果是这样,人类社会将有更充裕的时间来适应。
第二种,AI 实验室持续获得复利式效率提升。
在此情境下,AI 不一定完全取代人类研究员,但会大幅放大每个人的产出能力。一个 100 人团队,可能完成过去 1000 人、10000 人甚至更大规模组织才能完成的工作。
这将彻底改变知识工作、企业组织和政府服务的形态,也可能带来新的风险,例如更大规模的网络攻击、舆论操控、自动化监控等。
Anthropic 认为,我们很可能正在走向这一情景。
第三种,AI 实现完整的递归自我改进。
即 AI 系统不仅辅助研发,而是真正能够自主设计和优化下一代 AI。到了这一阶段,AI 的进步速度可能主要取决于算力,而非人类的工作时间。
这将是最难预料的世界。
它可能带来科学、医疗、工程领域的巨大突破,也可能使人类丧失对系统的理解和掌控。
文章最为担忧的是:如果模型中目前仅仅是偶发的对齐问题,在一代代自我改进中被逐步放大,人类可能越来越难以知晓系统究竟在朝着什么方向演进。
文章最终回归到一个现实问题:我们应当如何应对?
Anthropic 的立场是:如果能有效放缓前沿 AI 的发展,让社会治理、安全研究和公共讨论跟上技术进步的速度,那可能是理想的状态。
但问题在于,单方面放慢并不一定意味着安全。
如果只有谨慎的实验室暂停,而其他不够谨慎的参与者继续推进,结果可能只是让更危险的一方取得优势。
因此,真正需要的是一种可验证的协调机制。
也就是说,多个处于前沿的 AI 实验室、政府和国际社会,需要有办法确认:大家是否真的同步放慢了?是否存在偷偷继续训练的情况?何时暂停?何时恢复?由谁来判定?
这很难实现。因为 AI 训练不像导弹发射井那样容易被发现,算力、芯片、数据和模型训练的隐蔽性更强。
但文章认为,正因为困难,才更应该尽早开始探讨。
这篇文章并非简单宣扬"AI 要失控了"。它真正重要的地方在于,它清晰阐述了 AI 发展中的一个关键转变:
AI 不再仅仅是工具,正在演变为生产工具的工具。
当 AI 开始辅助开发 AI,技术进步就可能进入一种自我加速的状态。对普通人而言,这不意味着明天所有工作都会消失。
但它意味着,我们理解工作、学习和能力的方式需要改变。过去,一个人的竞争力来自"我会做什么"。
未来,一个人的竞争力可能更多取决于:
我会提出什么问题?
我会评估什么结果?
我能否借助 AI 放大自身能力?
我能否在一个日益自动化的系统中,依然保持方向感?
这或许才是 Anthropic 这篇文章最值得我们深入思考的核心所在。