AI破解数学难题：从解题工具到发现新知

发布时间：2026-05-24 10:27阅读：12

你是否曾思考，AI何时能够自主提出问题？

不是人类给它题目求解，而是它自行发现问题、探索未知路径，并指出人类认知的不足之处？

昨日，OpenAI完成了一项令数学界震惊的工作——其内部通用推理模型独立证明了埃尔德什于1946年提出的几何猜想存在错误。

八十年来，无数数学家在“平面单位距离问题”上屡战屡败。埃尔德什曾悬赏500美元征集解答——如今，一台尚未公开的AI用前所未有的方法推翻了这一猜想。

更令人震惊的是：该AI所采用的方法，连专研此问题的数学家都未曾设想过。

究竟发生了什么

首先明确“单位距离问题”的核心——

在平面上任意放置n个点，这些点之间距离为1的点对最多能有多少对？

这听起来简单，却困扰了数学家八十年之久。埃尔德什最初认为方形网格构造是最优解，单位距离对数量的增长“几乎”呈线性。

八十年间，无人能将其推翻。

接着，OpenAI的模型出手了。

它的证明并非修补，而是直接给出无限反例序列——单位距离对数量可获得多项式级别的改进。普林斯顿大学的Will Sawin随后精炼出改进幅度约为δ = 0.014。

你或许会问，仅1.4%，有何激动之处？

关键在于定性而非定量。埃尔德什的猜想称“不可能比线性好多少”，而模型证明了“确实可以比线性更好”——这叫推翻，而非改进。

证明方法本身才真正让数学家们倒吸一口凉气。

模型没有沿用组合几何或图论的老路，而是借用了代数数论领域的工具——研究整数扩张、因子分解等。这就像你想证明一道几何题，结果用了代数思路，且这种代数方法之前根本没人想过能如此使用。

哈佛大学的数学家Melanie Matchett Wood曾说：如果给予人类数学家相同时间，“他们也能找到一个反例”。

但关键是——AI先找到了。

为何这不是“人类又输了”的故事

你可能已经听腻了“AI又赢了人类”的新闻，但这次真的不同。

以往的AI做数学，听话归听话，但它本质上是个超级搜索引擎——你给它题目，它在人类已有知识库中寻找相似解法，然后缝合出答案。这是“能做题”。

这一次，模型是在一个开放性的研究问题上给出原创构造——你问它一道未解之题，它没去翻任何人的作业本，而是自己想出了连专门研究此问题的数学家都没想到的方法，然后算出答案。

这是“能发现”。

菲尔兹奖得主蒂姆·高尔斯（Tim Gowers）评价道：

“如果这篇论文出自人类作者，投到《数学年刊》，我会建议接受。”

《数学年刊》是全球最顶级的数学期刊之一。高尔斯不是随便说话的人，他也是之前公开质疑AI数学能力的那批人之一。

而且有趣的是，七个月前OpenAI刚因一次虚假宣传被打脸。当时他们前副总裁Kevin Weil声称GPT-5解决了十个埃尔德什未解问题，结果被曼彻斯特大学的Thomas Bloom当场揭穿——那只是检索到已有文献，根本不是原创证明。Weil后来删帖跑路了。

这一次，OpenAI学聪明了。他们直接邀请了9位数学家联合署名，包括Bloom本人。

Bloom这次的态度很有意思，他说AI“正在帮助人类更充分地探索几个世纪以来构建的数学殿堂，还有哪些尚未被看见的奇迹正等候登场”。但他也补了一刀：AI的原始证明虽然完全有效，但被人类数学家“显著改进”了——人类在消化和改进证明方面仍扮演关键角色。

翻译成人话：AI负责发现，人类负责消化。

这意味着什么

我看到一些自媒体已经开始喊“数学家要失业了”，这种说法既蠢又无聊。

但有一些更深的问题值得认真想——

第一，AI开始走人类没想过的路了。

组合几何领域的专家们多少年来都在用图论、组合方法死磕这个猜想，没人想过借用代数数论。但AI没被人类的“领域偏见”污染，它在跨领域的知识库里找到了连接，然后拼出了一个路径。

这说明什么？AI不是简单地更努力地尝试人类已知的方法，它是真的在建立新的知识连接。

第二，“原创性”的定义可能要重新考虑了。

MIT的一个23岁学生Lime Price，用GPT-5.4 Pro在80分钟内解决了一个困扰数学家60年的埃尔德什问题。菲尔兹奖得主陶哲轩亲自验证了这个证明，还把它扩展为新理论的起点。

过去，“解决开放问题”是衡量一个数学家研究能力的核心指标。现在这个门槛被AI一夜之间碾平了。

高尔斯说了一句很重的话：“未来对数学的贡献门槛，将变成证明一些LLM无法证明的东西，而不是仅仅证明一些还没有人证明过的东西。”

这意味着什么？意味着数学研究的方向会发生根本性转向——人类数学家可能要更多地去做那些“AI够不到的地方”，而不是和AI抢地盘。

第三，人机协作的新模式正在形成。

OpenAI发布的那篇验证论文本身就是证明。AI生成原始证明，人类数学家负责消化、改进、写出人类能理解的版本。模型跑出了结果，人类负责“翻译”成数学共同体能接受的语言。

陶哲轩把这种现象叫做“证明消化不良”——AI生成和验证证明的速度越来越快，但人类理解、解释、拓展结果的效率跟不上。这不是某一个环节的问题，这是整个数学实践的节奏正在被打乱。

我们应该担心还是期待

我既不是AI万能论者，也不是AI威胁论者。

这次的事件让我最兴奋的不是“AI打败了人类”，而是——数学研究有了一个新的探索工具。

几百年来，数学家最大的瓶颈是什么？是想象力。你需要知道哪个方向可能是对的，你需要敢赌一个没人走过的路。人类数学家的知识面是有限的，跨领域的连接靠的是天才般的直觉和运气。

现在AI可以帮你做这个。

它可以遍历不同领域的知识连接，找到人类没想过的路径，然后把这个路径扔给人类专家去判断、去消化、去发展。

这不叫替代。这叫协作升级。

当然，这也带来一些严肃的问题：

博士生怎么办？那些曾经需要数年训练才能叩开的研究大门，现在可能只需要一个提示框和两个小时。数学教育体系需要重新思考自己在培养什么能力。

学术评价体系怎么办？arXiv目前明确拒绝接收AI撰写的内容，那这些突破性的AI证明该往哪投？同行评审的标准怎么定？

知识产权怎么算？这次OpenAI的论文，原始证明是AI生成的，人类数学家负责验证和改进，这个成果算谁的？

这些问题没有标准答案。但它们真实存在，而且很快就需要有人来回答。

最后说一句

过去两年，类似的“AI攻克数学”叙事出现过好几次，仔细看都有各种条件限制。

但这一次，说话的人里有菲尔兹奖得主，有专门打假OpenAI的数学家，有普林斯顿、哈佛、多伦多等顶级机构的学者。他们的评价出奇一致：这确实是AI首次在开放性研究问题上给出可同行审查的原创构造。

从“能做题”到“能发现”，这不只是能力的量变，这是范式的转移。

我不知道数学家的未来会怎样。但我知道，数学这门最古老、最纯粹的理性探索，正在被重新定义。

这挺让人激动的。

← 上一篇：物理AI发展现状：迈向真实世界下一篇：人工智能浪潮 →