Anthropic 最新文章:AI 正在从工具升级为制造者——它已深度参与下一代 AI 开发

发布时间：2026-06-07 23:19阅读：28

Anthropic 这篇最新发布的文章指出一个重要趋势：AI 正在逐步渗透到 AI 自身的研发链条中。传统模式下，AI 的开发完全依赖人类：工程师负责编码、团队搭建环境、研究人员设计实验、最终由人评估成果。但今天，在 Anthropic 的实际工作中，Claude 已经能够独立承担大量工程与研究任务，显著提升了 AI 的迭代效率。

过去，人们对 AI 的认知停留在"人类创造工具"这一层面。

开发者编写程序，研究人员设计实验方案，产品团队确定研发方向，最终训练出更强大的模型。AI 不过是人类劳动的结晶，是被制造出来的产品。

然而 Anthropic 近期发表的文章提出了一个更值得深思的问题：假如 AI 不再仅仅是被人类制造，而是开始参与制造下一个 AI 呢？

这篇文章的标题为《When AI builds itself》，即：当 AI 开始构建自身。

它探讨的并非虚构的科幻情节，而是一个正在上演的现实：在 Anthropic 内部，AI 已经逐步融入 AI 研发的核心环节。从代码编写、代码优化，到实验运行、系统调优、研究分析，Claude 正在重塑 AI 公司的内部工作模式。

Anthropic 将这一趋势推向极致后，给出了一个关键概念：递归自我改进。

所谓递归自我改进，简而言之就是：一个 AI 系统不仅能辅助人类开发 AI，更能在充足算力的支撑下，逐步设计、训练、优化自身的下一代版本。

这听起来像是科幻作品中的情节，但 Anthropic 的立场相当审慎：他们既未声称此事已然发生，也未断言它必然发生。他们真正想传达的是：我们或许比想象中更接近这一临界点。

文章首先列举了一系列外部趋势。

AI 独立完成任务的持续时间正在快速延长。过去，模型只能处理几分钟的简短任务，比如编写一小段代码或修复一个简单错误；如今，模型已经能够处理跨越数小时甚至更长时间的复杂任务。

这背后的本质变化，不仅仅是模型"会对话"了，而是它们日益演变为能够持续执行工作的智能代理。

它们能够阅读代码、修改代码、运行测试、定位问题、再次修复。更为关键的是，它们不再仅仅向人类提供建议，而是真正进入实际执行阶段。

过去，人类对 AI 说："这段代码怎么写？"

现在，人类可能只需说："这个系统出了故障，你去排查一下。"

中间的方案设计、路径选择、测试验证、问题修复，越来越多的环节可以由 AI 独立完成。

这正是文章最核心的论断：AI 不仅在改变普通人的工作方式，也在重塑 AI 公司自身的研发范式。

这篇文章最具价值的部分，是 Anthropic 披露了一批内部数据。

截至 2026 年 5 月，Anthropic 合并至代码库的代码中，超过 80% 可追溯至 Claude。换言之，Claude 已经不再是工程师身旁的"辅助工具"，而是在相当程度上成为代码产出的主力。

与此同时，Anthropic 的典型工程师在 2026 年第二季度每日合并的代码量，大约是 2024 年的 8 倍。

文章也指出，代码行数并非衡量生产力的完美标准。代码数量增加不一定意味着质量提升，也不代表产品必然更好。

但这些数据至少说明了一点：AI 已经使工程团队的产出效率产生了质的飞跃。

过去，一名工程师的核心工作是亲自编写代码。如今，他的角色日益转变为"AI 工作流导演"：设定目标、分解任务、审核成果、判断是否可以合并。

这意味着，人的定位正在发生转变。

人类不再需要站在每一行代码之前，而是逐步站到更高的层面：把控方向、评估质量、控制风险。

Anthropic 将 AI 研发工作划分为两大类别：工程与研究。

工程涵盖代码编写、环境搭建、训练流程管理。

研究包括确定实验方向、如何解读实验结果、下一步应探索哪些路径。

在工程领域，Claude 已经能够处理越来越开放性的问题。例如，一个系统发生故障，原因尚不明确，工程师只需提供一些背景信息和权限，它就能自主排查运行环境、测试不同配置、定位问题并提出修复方案。

在研究执行层面，Claude 的进步同样显著。文章提到了一个实验：让模型优化一段训练小模型的代码，在保证正确性的前提下尽可能提升运行速度。2025 年 5 月，Claude Opus 4 大约能达到 3 倍加速；到 2026 年 4 月，Claude Mythos Preview 已经能够实现约 52 倍加速。

这说明在"目标明确、评价标准清晰"的任务中，AI 已经可以表现得极为出色。

但文章也反复强调一个关键差异：AI 尚未完全具备人类研究员的判断能力。

哪些问题值得关注？

哪些实验值得开展？

哪些结果值得信赖？

何时应该终止？

这些并非简单的执行任务，而是涉及"研究品味"与"方向洞察"。Anthropic 认为，这仍然是人类目前最核心的竞争优势。

换言之，AI 已经很擅长"如何做"，但尚未完全学会"为何做"与"是否应该做"。

这篇文章真正令人深思的地方，并非 AI 会编写代码，而是：人类在 AI 研发流程中的位置，正一步步被压缩到更有限的环节。

当 AI 生成的代码质量逼近人类水平，人类就会从"编写代码"转向"审核代码"。

当 AI 能够独立运行实验，人类就会从"执行实验"转向"筛选值得开展的实验"。

当 AI 能够同时产出大量想法、工具、模拟和方案，人类就会从"生产"转向"筛选"。

这带来一个新兴瓶颈：人类的审核速度，可能无法赶上 AI 的产出速度。

如果 AI 一天能够生成海量代码、实验和研究思路，人类真正稀缺的就不再是执行能力，而是判断力、验证能力和组织协调能力。

这实际上对所有知识工作都具有启发意义。

未来真正关键的能力，可能不是"我能否亲手完成每个步骤"，而是：

我能否提出恰当的问题？

我能否评估结果的质量？

我能否设计有效的验证机制？

我能否管理一群 AI 代理，使它们朝着正确方向推进？

Anthropic 在文章中设想了三种可能的未来走向。

第一种，趋势减缓。

目前许多 AI 能力看似指数级增长，但也可能只是 S 型曲线的初始阶段。或许 AI 很快会遭遇瓶颈，例如算力、电力、芯片、数据、架构限制，或者研究判断力本身难以通过规模扩展继续提升。

如果是这样，人类社会将有更充裕的时间来适应。

第二种，AI 实验室持续获得复利式效率提升。

在此情境下，AI 不一定完全取代人类研究员，但会大幅放大每个人的产出能力。一个 100 人团队，可能完成过去 1000 人、10000 人甚至更大规模组织才能完成的工作。

这将彻底改变知识工作、企业组织和政府服务的形态，也可能带来新的风险，例如更大规模的网络攻击、舆论操控、自动化监控等。

Anthropic 认为，我们很可能正在走向这一情景。

第三种，AI 实现完整的递归自我改进。

即 AI 系统不仅辅助研发，而是真正能够自主设计和优化下一代 AI。到了这一阶段，AI 的进步速度可能主要取决于算力，而非人类的工作时间。

这将是最难预料的世界。

它可能带来科学、医疗、工程领域的巨大突破，也可能使人类丧失对系统的理解和掌控。

文章最为担忧的是：如果模型中目前仅仅是偶发的对齐问题，在一代代自我改进中被逐步放大，人类可能越来越难以知晓系统究竟在朝着什么方向演进。

文章最终回归到一个现实问题：我们应当如何应对？

Anthropic 的立场是：如果能有效放缓前沿 AI 的发展，让社会治理、安全研究和公共讨论跟上技术进步的速度，那可能是理想的状态。

但问题在于，单方面放慢并不一定意味着安全。

如果只有谨慎的实验室暂停，而其他不够谨慎的参与者继续推进，结果可能只是让更危险的一方取得优势。

因此，真正需要的是一种可验证的协调机制。

也就是说，多个处于前沿的 AI 实验室、政府和国际社会，需要有办法确认：大家是否真的同步放慢了？是否存在偷偷继续训练的情况？何时暂停？何时恢复？由谁来判定？

这很难实现。因为 AI 训练不像导弹发射井那样容易被发现，算力、芯片、数据和模型训练的隐蔽性更强。

但文章认为，正因为困难，才更应该尽早开始探讨。

这篇文章并非简单宣扬"AI 要失控了"。它真正重要的地方在于，它清晰阐述了 AI 发展中的一个关键转变：

AI 不再仅仅是工具，正在演变为生产工具的工具。

当 AI 开始辅助开发 AI，技术进步就可能进入一种自我加速的状态。对普通人而言，这不意味着明天所有工作都会消失。

但它意味着，我们理解工作、学习和能力的方式需要改变。过去，一个人的竞争力来自"我会做什么"。

未来，一个人的竞争力可能更多取决于：

我会提出什么问题？

我会评估什么结果？

我能否借助 AI 放大自身能力？

我能否在一个日益自动化的系统中，依然保持方向感？

这或许才是 Anthropic 这篇文章最值得我们深入思考的核心所在。

← 上一篇：AI信任观|01 当AI化身数字员工，企业将面临何种挑战？下一篇：人工智能时代下的铜资源电气化困境 →