标签

AI 爆发!三巨头联手攻克80年数学难题,OpenAI推翻猜想

发布时间:2026-05-27 08:43来源:微信阅读:5

Paul Erdős 数学家经典影像

Erdős 单位距离问题 - AI数学证明示意图

难得的周末,AI 领域却爆出一件让人震惊的消息。

在过去的一周里,OpenAI、Anthropic、Google DeepMind 这三家科技巨头接连宣布,自家 AI 成功攻克了数学家 Paul Erdős 留下的百年谜题。

这不是简单的辅助推导,也不是提供解题思路。而是 AI 从零起步,构建了完整的、经过形式化验证器确认的数学证明。

更令人称奇的是,这并非发生在严谨的实验室环境中,而是在周末。Anthropic 工程师 Sholto Douglas 表示,Claude Mythos 就是在一个周末内完成了这项工作。

我反复琢磨,始终想不通。一个困扰人类顶尖数学家八十年的猜想,竟被一个 AI 模型在服务器上轻松搞定。

01 起源:Erdős 与平面上的点阵

首先,我们来看看这个问题的背景。

1946 年,匈牙利数学家 Paul Erdős 提出了一个看似简单的平面几何问题。

在平面上随机分布若干点,若任意两点间距离为 0 或 1,那么这些点中距离为 1 的点对最多有多少?

Erdős 猜测其上限大约是 n 的 4/3 次方。然而,数学界为此耗费了整整 80 年。

2026 年 5 月 20 日,OpenAI 宣布其内部推理模型推翻了这一猜想。它采用了一种优于正方形网格的构造法,涉及深层代数数论。这是 AI 首次自主解决著名数学开放问题。

OpenAI 官方声称,若由人类独立完成,该证明极有可能发表在顶级数学期刊上。

此事已足够轰动,但后续发展更为戏剧性。

02 Claude Mythos 登场:周末的简洁证明

OpenAI 公布结果后不久,Anthropic 工程师 Sholto Douglas 称,Claude Mythos 也攻克了该问题。

其证明被描述为“巧妙且简洁”。

更令人细思极恐的是时间点。Claude 仅在周末两天内完成。

Sholto Douglas 指出,AI 在数学发现领域存在严重的超前性。

这意味着 AI 能解的数学题,远超人类公开认知的范畴。

我反复审视这句话,深感后背发凉。AI 仅用周末时间就解决了人类 80 年的难题,且工程师暗示这或许并非首次发生。

OpenAI 采用通用推理模型,通过自然语言推理自主发现构造并推导证明。

Claude Mythos 则采用形式化证明路线,输出更紧凑、可机器验证的证明,路径更优雅。

03 Google DeepMind 动手:九道难题仅需几百美元

若你觉得两家还不够,Google DeepMind 也加入了竞争。

其系统 AlphaProof Nexus 采用了 Lean 形式化验证器,每步证明均经编译器自动校验。

它一口气解决了 9 个 Erdős 开放问题,其中两个悬置了 56 年。

且每个问题的推理成本仅几百美元。

没错,困扰半个世纪的难题,现在 AI 仅需几百元推理费即可通过。

不过别急,AlphaProof Nexus 的整体成功率仅 2.5%。

但数学证明讲究一次成功。即便尝试 40 次才成功一次,一旦证明成立,问题即告终结。

这正是数学与体育竞技的区别:体育需要持续获胜,而数学只需证明一次,问题即永久关闭。

04 三种技术路径,三种解题哲学

这三家采用了截然不同的技术路径。

OpenAI 依赖通用推理模型,无需专门数学训练,实现零样本数学推理。

Claude Mythos 侧重形式化证明,输出紧凑结果,避免自然语言推理的弯路。

Google 的 AlphaProof Nexus 依赖 Lean 编译器,追求 100% 正确性,尽管成功率低。

坦率地讲,这代表了 AI 做数学的三大哲学。

OpenAI 强调通用推理能力的涌现。

Claude 侧重模型架构与训练,追求证明的简洁性。

Google 则坚持形式化验证,宁慢求对。

这正如人类做数学:有人靠直觉,有人靠推导,有人靠工具。AI 如今三者皆能。

05 数学家的未来

一个关键问题浮现:AI 自主证明数学定理后,数学家何去何从?

其实更好的问题是:AI 将把数学推向何种高度?

回想 1880 年代电力普及时,工厂主仅用它替代蒸汽机。

数学亦是如此。AI 是为数学装上涡轮,而非替代数学家。

过去,数学家一生攻克几个猜想;现在,AI 可在几天内筛选死路,寻找通路。

剩余工作是数学家理解通路、发现结构、提出新问题。

AI 证明猜想不代表数学家失业,而是工作被重新定义。

正如 OpenAI 所言,人类完成该证明或许能发顶级期刊,但 AI 完成则需调整评审与发表体系。

这一切才刚刚开始。

最后总结

这个周末的变局,可能比我们想象的更为深远。

三巨头在一周内接连宣布 AI 解决 80 年前难题,标志着 AI 推理能力集体突破临界点。

我并非认为 AI 即将统治世界。AlphaProof Nexus 成功率仅 2.5%,Claude 使用未公开模型,OpenAI 亦为内部模型。

它们尚未成为大众产品。

但我坚信,当工具在它最不擅长的领域(抽象数学)超越人类时,其表现将更惊人。

AI 正在证明数学定理,而你还在用它写周报。

原文链接:https://openai.com/index/model-disproves-discrete-geometry-conjecture/

以上,既然读到这,若觉不错,请点赞、在看、转发三连。想第一时间收到推送,请加星标⭐。

感谢阅读,我们下次见。

/ 作者:黄美丽