标签

AI自我迭代能力爆发:逼近人类难以掌控的未来

发布时间:2026-05-06 02:03来源:微信阅读:7

昨日,Anthropic(即Claude开发公司的联合创始人)Jack Clark发布了一篇引人深思的文章:

截止2028年末,递归自我改进技术出现的概率高达六成。换言之,人工智能系统可能即将具备自主构建自身的能力。

这一推测并非凭空想象,Jack明确表示是基于"研读了上百份关于人工智能发展的公开资料"得出的科学结论。

AI的持续工作能力,短短四年提升了1440倍之多。

有一家名为METR的机构,专门负责测试AI能够独立处理复杂任务的时长。

测试结果令人惊讶:

· 2022年,GPT-3.5仅能维持30秒

· 2024年,GPT-4增强版达到了40分钟

· 2025年,GPT-5.2延长至6小时

· 2026年,Claude Opus 4.6(Anthropic最新模型)已经能够坚持12小时不间断工作

在不足四年的时间内,AI独立完成复杂任务的能力从30秒跃升到了12小时。

按照这种发展趋势,到2026年底突破100小时似乎并非天方夜谭......

另一项关于AI编程能力的测试同样不容忽视。

多场测评的数据显示:

1.SWE-Bench(测试AI解决实际GitHub编程问题的能力):2023年底Claude 2仅获得2分(满分100),而今的Claude Mythos Preview已飙升至93.9分,几乎接近满分。

2.CORE-Bench(让AI根据论文自行复现实验结果):15个月内,AI的正确率从21.5%跃升至95.5%,出题方坦言这场测试已被AI彻底征服。

3.MLE-Bench(评估AI参与数据科学竞赛的表现):2024年10月最高分仅16.9%,到2026年2月已猛增至64.4%。

4.此外,Anthropic内部测试显示:让AI优化训练代码运行速度,不到一年时间,其提速能力从2.9倍飞跃至52倍。

以上这些都是专业级别的测评结果。

从另一个角度看,AI已经能够扮演"项目经理"的角色来管理其他AI系统。

AI研究的大部分工作实际上就是"数据处理、实验执行、参数调优、文献阅读、结果复现",真正的创新思维可能仅占1%。

目前那99%的工程任务正迅速被AI接管。

以Claude Code这类工具为例,面对复杂任务,AI能够自主将大任务拆解,分配给多个子AI并行处理(在我们理解中即多Agent架构模式),然后汇总结果并输出最终成果。

这不正像是一个人带领团队协作完成工作的模式吗?

与此同时,Anthropic还进行了一项有趣的实验。

他们让一群AI自行研究如何提升AI的安全性。结果显示,AI提出的方案大部分已经超越了人类研究员的水平。

Jack在文章中写道:

这是一件具有重大意义的事件。

我不知道该如何理解它。其影响太过深远,让我感到自身的渺小,而且我不确定,社会是否已经准备好迎接自动化AI研发所带来的变革。

我本人从互联网行业转向AI领域,明显感受到整个人工智能行业正在全速前进。

一家成立仅四个月的公司Recursive Superintelligence(递归超级智能)已成功获得5亿美元融资,估值高达40亿美元。

谷歌和英伟达纷纷抢着投资,其目标明确而直接:打造能够自主学习、自我进化的AI,让机器自主进行科学研究......

当我们还在困惑AI究竟能做些什么,是否需要学习AI知识和技能时,Jack已经将这个问题从科幻领域带入现实。

就连我都觉得这发展速度,确实令人不寒而栗!

留给人类讨论对策、制定规则的时间窗口比大多数人想象的要短得多。

当然,我们在关注前沿科技进展的同时,每个人都会有自己的思考、担忧和期望。

对我而言,我对这种"自我创造"的AI抱有期待,它真能帮助人类解决那些我们一直无法破解的难题吗?

比如:

癌症的个性化治疗方案......

气候变化中那些错综复杂的模型......

城市治理背后那盘根错节的问题......

问题来了:如果"递归自我改进"真的在2028年实现,且AI的安全研究方案已经超越人类研究员水平,那么谁又有能力去为这台机器设置限制、制定规则呢?

那个"超越人类水平的AI安全方案"它符合人类的伦理准则,还是遵循AI自身的逻辑?

这个问题恐怕暂时无人能给出确切答案。

但我仍然期待科技在加速发展的同时,能有相应的机制来加以约束。

作为一名从互联网行业转行AI的产品经理,我见过太多技术先行、规则滞后的尴尬局面。

每个人都在这场科技浪潮中感到焦虑,却找不到出路。

科技发展日新月异,那么多被解放出来的人将何去何从?

如何提升全民AI素养以适应未来社会?

而不是等到AI取代了大多数人的工作,这些人只能面临失业......

至少在过渡期,许多像我这样的人已经失业了......

这次,能否让规则和伦理走在前面?

哪怕只领先半步。

我始终希望自己不只是这场变革的旁观者。

我不想像以前那样,等到浪潮临近才匆忙学习游泳。我希望在浪涛尚未兴起时就看清方向,然后主动占据那个位置。

哦,不!

不是主动占据那个位置,可能更深刻的是那个"位置"本身可能是AI无法定义、需要人类去开创的......

科技迭代的速度是惊人的。

但比速度更可怕的,是我们误以为还有充足的时间。

最高层次的参与不是预测浪头方向,而是成为那个在岸边播种、让新大陆从海洋中涌现的人。

所以,一边恐惧、一边学习。

一边不安、一边前行。