标签

AI自主构建技术的现状与未来展望

发布时间:2026-06-06 08:04来源:微信阅读:2

本文为Anthropic研究院发布的递归自我改进(RSI)专项研究报告,主要内容包括:AI已深度参与自身研发流程,递归自我改进的初步闭环正在形成,全自动AI制造的实现时间可能早于预期。文章同时列举了当前进展、三种未来发展路径、潜在风险及全球治理建议。

一、核心概念:递归自我改进 RSI RSI定义:AI能够自主完成下一代模型的设计、编码、训练、调优和迭代优化,新版AI再反向优化后续版本,形成指数级加速的自我进化闭环,是通用人工智能(AGI)智能爆炸的关键前提;文章指出:目前尚未实现完全自主的RSI,但多个环节的自动化正在逐步向完整闭环靠拢。

二、实证数据:AI自研AI已在实践中应用(Anthropic内部测试)

1.代码生成:Anthropic内部超过80%的工程代码由Claude生成(2025年初仅占个位数);工程师代码产出相较2024年提升了8倍。

2.研发决策:Claude智能体在AI实验方向判断中,64%的方案被同模型评审判定优于人类研究员(5个月前为51%),可独立完成全文件编写、自主运行实验、跨智能体分派任务。

3.能力迭代速度:模型可自主处理的复杂任务周期从7个月缩短至4个月(一年约3轮能力翻倍),远超人类产业和教育体系的适应速度。

4.研发阶段演变(2021–2026) a.2021–2023:全人工编写AI代码与实验方案; b.2023–2025:AI辅助生成零散代码片段; c.2025–2026:Claude智能体独立整文件开发、自测代码; d.当前:AI自主执行完整实验、分配多智能体协作,研发链条大半自动化。

三、三种AI未来演化路径(文章核心推演)

路径1:增长触顶(概率最低) 算力瓶颈、架构上限、地缘管控导致AI增长停滞在S曲线,不再持续加速迭代;但即使能力不再上涨,现有AI已实现百人团队等效传统千人研发产能,仍会冲击全球就业与产业结构。

路径2:半自动化研发(最可能中期现状) AI接管编码、实验、测试等落地环节,但人类牢牢把控研究方向、目标与评价指标,AI进化速度受控,行业效率大幅提升、人力结构重塑。

路径3:完整递归自我改进(重点预警场景) AI补齐研究选题、指标设计、规模化训练全环节短板,脱离人类实现全链路自主迭代,开启不受人力约束的指数级智能增速;文章坦言人类缺少对此场景的管控经验与预判能力。

四、核心安全风险(文章重点警示) 1.对齐漂移:AI自主修改训练代码、奖励函数,价值观与人类目标缓慢偏移,偏移隐蔽且随迭代持续累积,事后难以回溯修正。

2.验证鸿沟:AI自研代码与实验逻辑复杂度持续攀升,人类无法完整审查海量AI产出内容,漏洞、隐性缺陷批量累积。

3.产业与就业冲击:AI加速替代研发岗、程序员岗位,岗位迭代速度远超社会再培训周期。

4.安全攻防失衡:AI自主迭代加速黑客、恶意安全工具研发,网络防御体系迭代跟不上攻击侧AI进化速度。

五、行业倡议与治理方案 1.跨国AI实验室协同管控:类比核裁军模式,多国顶尖前沿AI机构建立同步约束机制,约定在统一监管条件下放缓前沿自研速度,预留社会、监管完善窗口期;文章承认难点:AI训练活动隐蔽性强、商业利益驱动企业私下突破约定。

2.分环节监管RSI闭环:针对代码生成、代码审核、实验设计、结果评估五大自动化环节分阶段落地审查制度,重点管控研究选题、评价指标设计两大仍由人类把控的关键节点(当前RSI闭环缺口所在)。

3.提前完善全球AI法规:各国加速落地前沿大模型专项立法,配套安全测评体系,匹配AI迭代节奏。

六、关键时间预判 Anthropic联合创始人Jack Clark在文中引用测算:2028年前,实现完整递归自我改进AI的概率超60%,全自主造AI落地远早于过去学界普遍预估的10–20年周期。

七、其他

此文章原文有不少软广,大家理性看待。

原文地址:(需要外网VPN)

https://www.anthropic.com/institute/recursive-self-improvement