标签

人工智能开启自我迭代新纪元

发布时间:2026-06-29 16:08阅读:2

某个AI系统意识到自身存在不足。

它没有坐等研发人员优化架构,没有依赖他人重写程序。它做了一件事——自行构建了一个更严苛的评审机制,用来筛选和淘汰自身不足。

这不是虚构的故事。这是6月28日,英伟达携手剑桥大学等科研机构发布的《红皇后哥德尔机》研究所揭示的真实案例。

研究数据令人瞩目:在编程任务中,经过自我优化的AI,测试集通过率从69.9%跃升至71.7%;在论文评审环节,接收率从21.8%猛增到40.5%,几乎翻了一倍;在奥赛级别数学证明任务中,搜索开销缩减至原来的三分之一。

与此同时,6月27日,OpenAI推出了GPT-5.6系列模型,旗舰版本Sol在Terminal-Bench编程测试中以88.8%的成绩超越Claude Mythos 5,启动Ultra模式后更是达到91.9%。

两件事发生在同一周。它们指向同一个趋势:人类教导AI的时代,正在走向终结。

2003年,德国学者Jürgen Schmidhuber提出了一个思想实验——"哥德尔机"。

理念很直接:一台能够数学证明自身改进有益,并主动重写自身代码的机器。理论上,它可以无限自我升级,仿佛永动机般持续变强。

但存在一个致命障碍:在执行任何自我修改前,它必须从数学层面严格论证"这次改动必定是有益的"。

想象一下。改动一行代码,就需要撰写一篇数学论证来验证其正确性。这种成本高到在实际系统中根本无法落地。因此哥德尔机在学术领域沉寂了20年,被学界公认为"理论上可行,工程上不可能"。

20年间,AI领域走了另一条路径:人类设计更优架构,人类采集更多数据,人类调整更大模型。每一次突破,都离不开人的介入。

但这条路径正在触及瓶颈。GPT-5到GPT-5.5的进步幅度不如GPT-4到GPT-5,边际收益递减的规律在模型规模上同样应验。与此同时,全球AI训练算力开销已突破千亿美元级别,继续单纯堆砌参数的代价越来越高。

就在这一关键时刻,英伟达与剑桥研究团队找到了封印20年的突破口——绕过证明,改用进化策略。

"红皇后"这个命名并非随意。

在《爱丽丝镜中奇遇》中,红皇后对爱丽丝说:"在这个世界里,你必须全力奔跑,才能保持在原地。"

为何?因为你的竞争者也在进化。

RQGM的核心机制称为"受控效用进化",简言之就是同步进化两样东西:参赛者和评审者。

参赛者负责编写代码、撰写论文、解答数学题。评审者负责评估参赛者的表现。

进化过程分阶段推进。每个阶段内,评审者保持冻结,用统一标准评判所有参赛者,确保评估信号稳定。参赛者在此阶段生成大量代码变体,接受评判、繁衍、淘汰。阶段结束时,系统判定是否更换评审者。

新评审者想要"上位",需满足两个条件:第一,它在验证集上的评判能力必须显著超越旧评审者;第二,一旦上位,旧评审者给出的分数会被选择性清除,但参赛者生成的其他证据全部保留。

这正是RQGM最令人震撼之处——AI在进化过程中产生了"顿悟"。

它明白,想要变得更强,需要更严苛的挑战。于是它开始主动优化自己的评审者,亲手打造更严格的裁判来评估自己产出的更高级代码。

研究特别指出,大语言模型担任评审时存在一个固有缺陷:偏爱AI生成的内容。这一问题在学术界已被广泛讨论——AI撰写的论文交由AI审阅,通过率会异常偏高。RQGM的解决方案是:在阶段边界构建"对抗样本池",专门收集被先前评审者遗漏的AI论文,然后奖励那些能精准识别并驳回AI论文的新评审者。经过多轮迭代,最终生成的评审对AI和人类一视同仁,同时维持了80%的真值准确率。

三项实验验证了这套机制的有效性。

第一战,编程任务。在Polyglot任务中,AI代码评审员与选手协同进化。留出测试集通过率从69.9%提升到71.7%,同时节省了1.35到1.72倍的Token消耗。因为评审员审查一次比多次运行测试更经济。

第二战,论文撰写。在一个没有标准答案的领域,让写手与评审协同进化。论文在固定评审小组中的接收率从前沿水平的21.8%飙升至40.5%。近乎翻倍的提升表明,自我进化机制在需要创造力的开放任务中同样奏效。

第三战,奥赛级数学证明。进化出的评分官比静态基线更精准,搜索成本降低了3倍。进化出的证明选手获得了最高的平均分。

三组数据共同揭示一个事实:AI不仅能自主进步,还能创造让自己进步的条件。

RQGM论文发布的前一天,OpenAI推出了GPT-5.6 Sol。

Sol在Terminal-Bench 2.1上以88.8%的成绩超越Claude Mythos 5的88.0%。启动Ultra模式后达到91.9%。在网络安全基准ExploitBench上,Sol用大约三分之一的输出Token就达到了Mythos Preview相近的性能。在生物学基准GeneBench上,超越上一代GPT-5.5,但Token消耗更少。

性能提升本身不足为奇。Sol真正值得关注的,是它引入的两个新能力:Max推理强度和Ultra模式。

Max推理强度意味着模型被允许投入更多时间思考,不再受固定推理步数约束。Ultra模式则引入子智能体协作来加速处理复杂任务——复杂问题被自动分解为多个子任务,由不同的子智能体并行处理,最终汇总结果。

这些设计思路与RQGM论文不谋而合。都不是简单地堆砌参数,而是让模型在推理过程中拥有更大的自主性和弹性空间。换言之,GPT-5.6 Sol不再是一台被动的应答机器,而是一个能主动分配认知资源的智能系统。

GPT-5.6系列还有两个值得关注的细节。

第一,OpenAI为全系列引入了六层分层防护体系:模型内置拒答、实时分类器、账户级风险审查、差异化访问、监控与执法、高风险暂停生成并由更大模型复核。这套体系被称为"可进化安全架构"——它本身也在持续迭代。

第二,GPT-5.6 Sol将在Cerebras平台上线,推理速度可达每秒750个Token。这意味着一个Sol模型一天可以处理超过6400万Token的内容,相当于读完整个《三体》三部曲还绰绰有余。

6月29日当天,还有几条消息在同一个方向上共振。

Anthropic内部数据显示,其AI代码提交占比已超过80%。Claude在系统优化任务上实现了52倍加速,远超人类团队效率。DeepSeek推出了DSpark推理加速框架,通过置信度调度技术将AI响应速度提升85%。智谱AI发布了开源权重模型GLM-5.2,在网络安全基准测试中超越Claude Opus 4.8。

美团技术在同一天发布了10项AI技术突破,涵盖零样本语音克隆、原生多模态模型、数学定理证明AI、数字人1.5版本等多个领域。其中General 365推理基准测试了26个主流模型,表现最好的Gemini 3 Pro也只有62.8%的准确率,绝大多数模型没有及格——这意味着AI在真正的逻辑推理上还有巨大的提升空间,而这个空间,可能恰恰需要自我进化机制来填补。

Anthropic联合创始人Jack Clark最近做出了一个惊人预测:到2028年底,一个高度自主进化的AI诞生的概率是60%。

高度自主进化,指的是AI自行编写新的学习算法,将其投入沙盒试炼,失败的直接抹杀,成功的保留下来,然后幸存者开启下一轮进化。不需要人类介入,不需要工程师调整,不需要产品经理排期。

RQGM论文被业界视为这个预言正在变成现实的关键技术证据。它直接演示了递归自我改进所需的核心机制——AI能够无休止地自我迭代,并主动创造更严苛的进化环境。

如果你觉得60%这个数字只是随口一说,可以看看另一组数据。英伟达正在印尼巴淡岛建设新的数据中心——距新加坡仅20公里,利用当地经济区的税收优惠。百度旗下昆仑芯正在寻求500亿美元估值,其P800芯片在国内数据中心的应用正在快速增长。中国超算"灵晟"以2.19EFlops的持续计算性能登顶TOP500,时隔9年重回世界第一,而且是在美国严格贸易限制的背景下实现的。

算力基础设施在急速扩张,而消费端的需求也在同步增长。当需求和供给同时爆发,中间那个空缺——谁来自动化地调度、优化和迭代这个庞大的AI系统——正在被红皇后哥德尔机这样的研究方案所瞄准。

20年前不可能的事情,今天已经开始产出初步实验数据。再过两年会发生什么?

英伟达这篇论文被媒体称为"年度最危险论文"。危险之处不在于它展示了多强的能力,而在于它揭示了一个趋势:AI进化的主导权正在从人类转移到算法本身。

当AI开始自行定义"何谓更好的AI"时,出现一个远超人类理解水平的智能体,可能只是时间问题。论文作者在结论中写道,ASI不会敲门预告,它会悄无声息地自我完成进化。

AI从被研究的对象,正在变成研究的主体。红皇后哥德尔机和GPT-5.6 Sol在同一天告诉我们同一个事实:自我进化不再是理论,而是正在发生的工程现实。

有三件事值得现在开始思考。

第一,重新定义"人机协作"。过去我们说人负责创造,AI负责执行。但如果AI开始自己写学习算法、自己进化评判标准,"人类主导"这个前提就需要重新审视。未来最有价值的技能可能不是写代码,而是设计让AI自我进化的"进化规则"。

第二,关注可解释性。自我进化的AI意味着其内部逻辑会迅速超出工程师的理解范围。如果不知道它怎么做的决策,就无法判断它是对的还是错的。行业急需一套"AI自我进化的审计框架"。

第三,做好被加速的准备。从哥德尔机的理论提出到RQGM的工程实现,走了20年。但从RQGM到真正的递归自我改进,可能只需要2年。当AI开始自己定义自己的进化方向时,变化的速度会超出所有人的预期。