标签

AI或将在短期内实现自主进化

发布时间:2026-06-06 16:13来源:微信阅读:2

手机屏幕上看到的 Anthropic 和《复仇者联盟2:奥创纪元》仍然盖蒂图片社和漫威娱乐

几十年来,我们在电影和流行文化中已经看到了这种趋势;科幻似乎不再是虚构。根据 Anthropic 最新发布的研究,人工智能系统正开始帮助构建下一代人工智能模型。该公司表示,这一趋势最终可能使人工智能系统能够在极少人工干预的情况下进行自我设计和改进。

人类学研究所(Anthropic Institute)在其最新博客文章中发出警告。该公司表示,该行业可能会比许多政府和机构预期的更快地迈向“递归式自我改进”。

这一概念描绘了一个未来:一个人工智能模型能够自主开发出自身的下一个版本。目前,研究人员仍然在指导这一过程。然而,Anthropic公司表示,人工智能已经在公司内部承担了越来越多的编码、调试和技术研究工作。

更快的AI开发

我们的内部数据显示,Claude正在加速人工智能的发展——这可能是一条通往递归式自我改进,或者说人工智能自主构建更强大后继者的途径。

这一进程比我们预想的要快得多,其影响值得更多关注。https ://t.co/OVVPJO7VQx

— Anthropic (@AnthropicAI) 2026年6月4日

Anthropic公司援引内部数据显示,人工智能工具如今对软件工程工作的贡献速度惊人。该公司表示,截至2026年5月,Claude生成的代码占Anthropic系统合并代码总量的80%以上。而在2025年初Claude Code上线之前,这一比例仅为个位数。

该公司还表示,随着这些变革,工程效率也大幅提升。Anthropico 的工程师现在每天合并的代码量大约是 2024 年的八倍。

人类组织联合创始人兼政策主管杰克·克拉克表示,该公司希望立法者和机构了解接下来可能发生的情况。“我们一直认为,最好的做法是普及这一概念,让人们了解即将发生的事情,”克拉克在一份声明中说。

克拉克补充说,人工智能的发展似乎正在加速而非放缓。他表示,这种转变可能会在医学、科学和其他技术领域带来重大进步。

基准指数快速变化

Anthropic 还重点介绍了跟踪人工智能在软件工程和科学研究任务中表现的公开基准。

该公司表示,人工智能系统现在无需人工干预即可在更长的时间内完成日益复杂的任务。Anthropic 声明,模型能够可靠处理的任务时长大约每四个月翻一番。

据该公司称,Claude Opus 3 在 2024 年初就能完成耗时仅几分钟的编码任务。一年后,Claude Sonnet 3.7 可以处理耗时约 90 分钟的工作。Anthropic 表示,Claude Opus 4.6 后来能够处理耗时长达 12 小时的任务。

该公司还提到了SWE-bench,这是一个软件工程基准测试,用于测试人工智能能否修复开源项目中实际存在的编码问题。Anthropic表示,其前沿模型在两年内就从该基准测试中的低分跃升至接近饱和。

另一项基准测试 CORE-Bench 用于衡量人工智能能否复现已发表的科学研究。Anthropic 公司表示,人工智能系统复现结果的准确率预计在 2024 年约为 20%,而大约 15 个月后,其性能将接近完美。

风险与监管

Anthropic强调,目前的系统与完全自主的人工智能发展之间仍然存在重大差距。该公司表示,人类仍然在定义目标、评判结果,并决定哪些研究方向最为重要。

不过,该公司警告称,如果监管工具跟不上,更强大的自主系统可能会带来新的风险。

克拉克表示:“作为组织,最终可能作为社会,我们需要找到验证和确认人工智能生成成果的工具。”他还补充说,未来的系统必须始终与人类目标和公共利益保持一致。

人为因素公司计划在未来几个月与美国立法者讨论这一问题。该公司表示,各国政府应该做好准备,应对人工智能系统最终可能在几乎无需人类直接参与的情况下,帮助创造出更强大的继任者的可能性。

阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

上下滑动查看更多