人工智能开启自我迭代新纪元

发布时间：2026-06-29 16:08阅读：2

某个AI系统意识到自身存在不足。

它没有坐等研发人员优化架构，没有依赖他人重写程序。它做了一件事——自行构建了一个更严苛的评审机制，用来筛选和淘汰自身不足。

这不是虚构的故事。这是6月28日，英伟达携手剑桥大学等科研机构发布的《红皇后哥德尔机》研究所揭示的真实案例。

研究数据令人瞩目：在编程任务中，经过自我优化的AI，测试集通过率从69.9%跃升至71.7%；在论文评审环节，接收率从21.8%猛增到40.5%，几乎翻了一倍；在奥赛级别数学证明任务中，搜索开销缩减至原来的三分之一。

与此同时，6月27日，OpenAI推出了GPT-5.6系列模型，旗舰版本Sol在Terminal-Bench编程测试中以88.8%的成绩超越Claude Mythos 5，启动Ultra模式后更是达到91.9%。

两件事发生在同一周。它们指向同一个趋势：人类教导AI的时代，正在走向终结。

2003年，德国学者Jürgen Schmidhuber提出了一个思想实验——"哥德尔机"。

理念很直接：一台能够数学证明自身改进有益，并主动重写自身代码的机器。理论上，它可以无限自我升级，仿佛永动机般持续变强。

但存在一个致命障碍：在执行任何自我修改前，它必须从数学层面严格论证"这次改动必定是有益的"。

想象一下。改动一行代码，就需要撰写一篇数学论证来验证其正确性。这种成本高到在实际系统中根本无法落地。因此哥德尔机在学术领域沉寂了20年，被学界公认为"理论上可行，工程上不可能"。

20年间，AI领域走了另一条路径：人类设计更优架构，人类采集更多数据，人类调整更大模型。每一次突破，都离不开人的介入。

但这条路径正在触及瓶颈。GPT-5到GPT-5.5的进步幅度不如GPT-4到GPT-5，边际收益递减的规律在模型规模上同样应验。与此同时，全球AI训练算力开销已突破千亿美元级别，继续单纯堆砌参数的代价越来越高。

就在这一关键时刻，英伟达与剑桥研究团队找到了封印20年的突破口——绕过证明，改用进化策略。

"红皇后"这个命名并非随意。

在《爱丽丝镜中奇遇》中，红皇后对爱丽丝说："在这个世界里，你必须全力奔跑，才能保持在原地。"

为何？因为你的竞争者也在进化。

RQGM的核心机制称为"受控效用进化"，简言之就是同步进化两样东西：参赛者和评审者。

参赛者负责编写代码、撰写论文、解答数学题。评审者负责评估参赛者的表现。

进化过程分阶段推进。每个阶段内，评审者保持冻结，用统一标准评判所有参赛者，确保评估信号稳定。参赛者在此阶段生成大量代码变体，接受评判、繁衍、淘汰。阶段结束时，系统判定是否更换评审者。

新评审者想要"上位"，需满足两个条件：第一，它在验证集上的评判能力必须显著超越旧评审者；第二，一旦上位，旧评审者给出的分数会被选择性清除，但参赛者生成的其他证据全部保留。

这正是RQGM最令人震撼之处——AI在进化过程中产生了"顿悟"。

它明白，想要变得更强，需要更严苛的挑战。于是它开始主动优化自己的评审者，亲手打造更严格的裁判来评估自己产出的更高级代码。

研究特别指出，大语言模型担任评审时存在一个固有缺陷：偏爱AI生成的内容。这一问题在学术界已被广泛讨论——AI撰写的论文交由AI审阅，通过率会异常偏高。RQGM的解决方案是：在阶段边界构建"对抗样本池"，专门收集被先前评审者遗漏的AI论文，然后奖励那些能精准识别并驳回AI论文的新评审者。经过多轮迭代，最终生成的评审对AI和人类一视同仁，同时维持了80%的真值准确率。

三项实验验证了这套机制的有效性。

第一战，编程任务。在Polyglot任务中，AI代码评审员与选手协同进化。留出测试集通过率从69.9%提升到71.7%，同时节省了1.35到1.72倍的Token消耗。因为评审员审查一次比多次运行测试更经济。

第二战，论文撰写。在一个没有标准答案的领域，让写手与评审协同进化。论文在固定评审小组中的接收率从前沿水平的21.8%飙升至40.5%。近乎翻倍的提升表明，自我进化机制在需要创造力的开放任务中同样奏效。

第三战，奥赛级数学证明。进化出的评分官比静态基线更精准，搜索成本降低了3倍。进化出的证明选手获得了最高的平均分。

三组数据共同揭示一个事实：AI不仅能自主进步，还能创造让自己进步的条件。

RQGM论文发布的前一天，OpenAI推出了GPT-5.6 Sol。

Sol在Terminal-Bench 2.1上以88.8%的成绩超越Claude Mythos 5的88.0%。启动Ultra模式后达到91.9%。在网络安全基准ExploitBench上，Sol用大约三分之一的输出Token就达到了Mythos Preview相近的性能。在生物学基准GeneBench上，超越上一代GPT-5.5，但Token消耗更少。

性能提升本身不足为奇。Sol真正值得关注的，是它引入的两个新能力：Max推理强度和Ultra模式。

Max推理强度意味着模型被允许投入更多时间思考，不再受固定推理步数约束。Ultra模式则引入子智能体协作来加速处理复杂任务——复杂问题被自动分解为多个子任务，由不同的子智能体并行处理，最终汇总结果。

这些设计思路与RQGM论文不谋而合。都不是简单地堆砌参数，而是让模型在推理过程中拥有更大的自主性和弹性空间。换言之，GPT-5.6 Sol不再是一台被动的应答机器，而是一个能主动分配认知资源的智能系统。

GPT-5.6系列还有两个值得关注的细节。

第一，OpenAI为全系列引入了六层分层防护体系：模型内置拒答、实时分类器、账户级风险审查、差异化访问、监控与执法、高风险暂停生成并由更大模型复核。这套体系被称为"可进化安全架构"——它本身也在持续迭代。

第二，GPT-5.6 Sol将在Cerebras平台上线，推理速度可达每秒750个Token。这意味着一个Sol模型一天可以处理超过6400万Token的内容，相当于读完整个《三体》三部曲还绰绰有余。

6月29日当天，还有几条消息在同一个方向上共振。

Anthropic内部数据显示，其AI代码提交占比已超过80%。Claude在系统优化任务上实现了52倍加速，远超人类团队效率。DeepSeek推出了DSpark推理加速框架，通过置信度调度技术将AI响应速度提升85%。智谱AI发布了开源权重模型GLM-5.2，在网络安全基准测试中超越Claude Opus 4.8。

美团技术在同一天发布了10项AI技术突破，涵盖零样本语音克隆、原生多模态模型、数学定理证明AI、数字人1.5版本等多个领域。其中General 365推理基准测试了26个主流模型，表现最好的Gemini 3 Pro也只有62.8%的准确率，绝大多数模型没有及格——这意味着AI在真正的逻辑推理上还有巨大的提升空间，而这个空间，可能恰恰需要自我进化机制来填补。

Anthropic联合创始人Jack Clark最近做出了一个惊人预测：到2028年底，一个高度自主进化的AI诞生的概率是60%。

高度自主进化，指的是AI自行编写新的学习算法，将其投入沙盒试炼，失败的直接抹杀，成功的保留下来，然后幸存者开启下一轮进化。不需要人类介入，不需要工程师调整，不需要产品经理排期。

RQGM论文被业界视为这个预言正在变成现实的关键技术证据。它直接演示了递归自我改进所需的核心机制——AI能够无休止地自我迭代，并主动创造更严苛的进化环境。

如果你觉得60%这个数字只是随口一说，可以看看另一组数据。英伟达正在印尼巴淡岛建设新的数据中心——距新加坡仅20公里，利用当地经济区的税收优惠。百度旗下昆仑芯正在寻求500亿美元估值，其P800芯片在国内数据中心的应用正在快速增长。中国超算"灵晟"以2.19EFlops的持续计算性能登顶TOP500，时隔9年重回世界第一，而且是在美国严格贸易限制的背景下实现的。

算力基础设施在急速扩张，而消费端的需求也在同步增长。当需求和供给同时爆发，中间那个空缺——谁来自动化地调度、优化和迭代这个庞大的AI系统——正在被红皇后哥德尔机这样的研究方案所瞄准。

20年前不可能的事情，今天已经开始产出初步实验数据。再过两年会发生什么？

英伟达这篇论文被媒体称为"年度最危险论文"。危险之处不在于它展示了多强的能力，而在于它揭示了一个趋势：AI进化的主导权正在从人类转移到算法本身。

当AI开始自行定义"何谓更好的AI"时，出现一个远超人类理解水平的智能体，可能只是时间问题。论文作者在结论中写道，ASI不会敲门预告，它会悄无声息地自我完成进化。

AI从被研究的对象，正在变成研究的主体。红皇后哥德尔机和GPT-5.6 Sol在同一天告诉我们同一个事实：自我进化不再是理论，而是正在发生的工程现实。

有三件事值得现在开始思考。

第一，重新定义"人机协作"。过去我们说人负责创造，AI负责执行。但如果AI开始自己写学习算法、自己进化评判标准，"人类主导"这个前提就需要重新审视。未来最有价值的技能可能不是写代码，而是设计让AI自我进化的"进化规则"。

第二，关注可解释性。自我进化的AI意味着其内部逻辑会迅速超出工程师的理解范围。如果不知道它怎么做的决策，就无法判断它是对的还是错的。行业急需一套"AI自我进化的审计框架"。

第三，做好被加速的准备。从哥德尔机的理论提出到RQGM的工程实现，走了20年。但从RQGM到真正的递归自我改进，可能只需要2年。当AI开始自己定义自己的进化方向时，变化的速度会超出所有人的预期。

← 上一篇：AI+OPC 赋能！杭州构建创业新中心丨首届大会洞察：城市转型新路径下一篇：AI编程工具格局重塑：Cursor遇挑战，Claude与GPT-5.6激战 →