标签

AI首次破解经典数学难题

发布时间:2026-05-26 23:44来源:微信阅读:5

先别急着喊 AGI。

但也别把这条新闻当成“AI 又刷了一个数学 benchmark”。

2026 年 5 月 20 日,OpenAI 发布了一篇研究公告:一个内部通用推理模型,反证了离散几何里一个接近 80 年的老猜想。这个问题最早由 Paul Erdős 在 1946 年提出,叫 planar unit distance problem,中文可以粗略叫“平面单位距离问题”。

听起来很学术,问题本身却简单得吓人:

在平面上放 n 个点,最多能有多少对点的距离刚好等于 1?

就这么一句话。

可正是这种“中学生能听懂,数学家卡几十年”的问题,最能暴露一件事:真正的数学发现,难的往往不是算,而是找到一条别人没押注、但最后能站住的路。

这次 OpenAI 的模型做的事,恰好就在这里。

图:作者制作。参考 OpenAI 2026 年 5 月 20 日发布的 Erdős unit distance 研究公告。

想象你在纸上点很多点。

如果两个点之间的距离刚好是 1,就把它们连起来。问题是:同样数量的点,怎样摆放,能连出最多条这样的线?

最朴素的想法是方格。

你把点排成横平竖直的网格,左右相邻、上下相邻的点之间距离都是 1,于是能得到很多单位距离点对。几十年来,数学界普遍相信,类似方格的构造已经差不多到了极限。

更正式一点说,Erdős 猜想单位距离点对的增长率大致不会超过 n^(1+o(1))。这个表达式看着吓人,翻译成人话就是:它可以比线性多一点,但多得不会太夸张。

OpenAI 这次说模型找到了一个反例:存在无限多组点集,可以做到至少 n^(1+δ) 个单位距离点对,其中 δ 是某个固定正数。OpenAI 公告还提到,Will Sawin 后续给出一个可取 δ=0.014 的改进版本。

这意味着什么?

不是说 AI 把这个问题的全部上下界都解决了,也不是说数学从此结束了。它真正击穿的是那个长期直觉:方格式构造并没有接近极限。

图:作者制作。参考 OpenAI 公告对 planar distance problem 的解释。

如果这个问题叫“平面单位距离”,普通人会自然以为它应该靠几何来解决。

画图、摆点、找角度、做组合计数。

但 OpenAI 公告里最有意思的一句话,是这次证明把“代数数论”的工具用到了一个看上去很初等的几何问题上。

这就很反常识。

你本来以为自己在研究一张地图上点和点的距离,结果最后用到的是 CM 域、类域塔、Golod-Shafarevich 这类非常深的数论工具。通俗地说,证明不是在二维平面里硬摆点,而是先去更高维、更抽象的数论结构里制造出“有大量好性质的对象”,再把它们投影回平面,变成很多距离刚好为 1 的点对。

这才是这条新闻最硬的地方。

很多 AI 演示看起来很惊艳,但本质上是在已有套路里更快地搜索。比如做题、写代码、查文档、整理信息。可这次的亮点不只是快,而是把两个相隔很远的数学区域连在了一起。

这更像一个研究者在说:你们一直在这条路堵车,我从山后面绕过来了。

图:作者整理。参考 OpenAI proof、arXiv 2605.20695 与 Will Sawin 后续论文。

这件事不能讲得太玄。

OpenAI 的说法是:证明来自一个新的通用推理模型,不是专门为数学训练的系统,也不是针对单位距离问题定制的搜索框架。模型在一组 Erdős 问题上被测试时,给出了这个证明方向。

但这个结果不是模型一吐出来,世界就直接承认。

OpenAI 公告明确说,证明经过外部数学家检查。随后,Noga Alon、Thomas F. Bloom、W. T. Gowers、Will Sawin、Arul Shankar、Jacob Tsimerman 等数学家在 arXiv 上发布了《Remarks on the disproof of the unit distance conjecture》,把这个反例做了更短、更易消化、经过人类验证的版本,并写下各自的评注。

Nature 也在 2026 年 5 月 22 日报道了这件事,标题很直接:AI cracks 80-year-old mathematics challenge。

这里的关键词不是“取代”,而是“接力”。

模型提出路线,专家检查论证,数学家把它改写成人类共同体能读懂的证明,后续研究者继续把界限做得更明确。

如果把科研看成一个流程,这次更像是 AI 第一次真正打进了“提出有效新路线”的环节,而不只是帮人整理文献、写代码、跑实验。

图:作者整理。用于说明 AI 科研发现从生成到共同体吸收的路径。

过去几年,AI 在数学上的很多突破都容易被误解。

模型在竞赛题上得高分,很厉害,但那仍然是被设计出来、可在较短时间内解决的问题。它证明模型有很强的形式推理能力,却不一定说明它能进入真正的研究前沿。

开放问题不一样。

开放问题没有标准答案,没有出题人保证“这题一定能在三页内解完”,也没有一个漂亮套路等着你发现。它可能需要跨领域知识,可能要走一条社区长期不看好的路,也可能一开始看起来完全不像解法。

Erdős 单位距离问题的意义就在这里。

它不是冷门到没人关心的问题。OpenAI 公告里提到,外部数学家把它视作组合几何里非常著名、又容易解释的问题。它也不是只有蛮力枚举就能解决的问题。关键路线来自深层数论结构,而不是简单把平面点集排列组合试一遍。

所以这件事真正说明的不是“AI 终于会算数学了”。

它说明:当模型的推理长度、试错能力、跨领域联想能力继续增强时,它可能会在某些研究问题上先找到人类不愿意、没时间、没直觉去试的路径。

这对科研很重要,对科研以外的行业也重要。

很多复杂问题都不是缺一个答案,而是缺一条新路线。药物设计、材料发现、芯片架构、软件验证、供应链优化、金融风控,甚至组织管理,很多时候卡住的不是“信息不够”,而是没人知道该从哪个角度重新建模。

如果 AI 开始能提出新建模方式,它的角色就会从助手变成研究合作者。

这条线一定要讲清楚。

第一,这是 OpenAI 内部模型的一次具体结果,不等于所有模型都具备稳定科研能力。一次重大突破很重要,但它不是普遍能力证明。

第二,数学是 AI 推理最友好的领域之一。因为数学命题清楚,证明可以被检查,一条推理链错了就是错了。换到生物、医学、经济、社会系统,很多问题没有这么干净的验证边界。

第三,证明被专家检查和消化,不等于我们已经完全理解模型如何找到它。OpenAI 公告提到有 abridged chain of thought,但真正的发现路径是否可复现、是否能迁移到其他问题,仍然要看后续更多案例。

第四,正式学术共同体的吸收也需要时间。arXiv 备注、专家评注、后续改进很重要,但学术论文的正式发表、长期引用和更多独立验证,会决定这件事最终被写进历史时有多重。

所以最稳妥的判断是:

它不是终点,但它是一个信号。

以前我们说 AI 能帮科研,很多时候指的是“帮科学家更快做事”。现在要开始认真考虑另一种可能:AI 能在某些问题上提出真正有原创性的路线,而人类专家负责判断它是否成立,并把它变成可传承的知识。

如果你不是数学专业,这件事也不是离你很远。

它其实在提醒我们:AI 的竞争正在从“回答得像不像人”,变成“能不能进入复杂问题的核心”。

聊天机器人时代,普通人最容易感受到的是表达能力。会写文章,会总结,会翻译,会生成图片。

Agent 时代,大家开始关心执行能力。会不会调用工具,会不会写代码,会不会操作系统,会不会完成任务。

科研型 AI 的出现,则把问题推到更深一层:它能不能发现人类没想到的结构?

这会改变很多行业里的“能力价值”。

未来最值钱的人,不一定是记住最多知识的人,也不一定是最会写提示词的人,而是能提出好问题、能判断结果真假、能把机器发现翻译成人类组织能用的人。

因为 AI 给出一个看似惊人的答案并不难。难的是你知道它为什么惊人,哪里可能错,怎样验证,验证之后又该如何把它接进现实工作。

这次 OpenAI 的数学突破,最可怕的不是它解了一道老题。

最可怕的是,它让我们第一次更具体地看见:未来的知识生产,可能不再只是人类独自推进。机器会提出路线,人类负责审判路线;机器会进入无人区,人类决定哪些发现值得被带回来。

这才是“AI 真的开始做科研了”的含义。