标签

AI破解数学难题:从解题工具到发现新知

发布时间:2026-05-24 10:27来源:微信阅读:6

你是否曾思考,AI何时能够自主提出问题?

不是人类给它题目求解,而是它自行发现问题、探索未知路径,并指出人类认知的不足之处?

昨日,OpenAI完成了一项令数学界震惊的工作——其内部通用推理模型独立证明了埃尔德什于1946年提出的几何猜想存在错误。

八十年来,无数数学家在“平面单位距离问题”上屡战屡败。埃尔德什曾悬赏500美元征集解答——如今,一台尚未公开的AI用前所未有的方法推翻了这一猜想。

更令人震惊的是:该AI所采用的方法,连专研此问题的数学家都未曾设想过。

究竟发生了什么

首先明确“单位距离问题”的核心——

在平面上任意放置n个点,这些点之间距离为1的点对最多能有多少对?

这听起来简单,却困扰了数学家八十年之久。埃尔德什最初认为方形网格构造是最优解,单位距离对数量的增长“几乎”呈线性。

八十年间,无人能将其推翻。

接着,OpenAI的模型出手了。

它的证明并非修补,而是直接给出无限反例序列——单位距离对数量可获得多项式级别的改进。普林斯顿大学的Will Sawin随后精炼出改进幅度约为δ = 0.014。

你或许会问,仅1.4%,有何激动之处?

关键在于定性而非定量。埃尔德什的猜想称“不可能比线性好多少”,而模型证明了“确实可以比线性更好”——这叫推翻,而非改进。

证明方法本身才真正让数学家们倒吸一口凉气。

模型没有沿用组合几何或图论的老路,而是借用了代数数论领域的工具——研究整数扩张、因子分解等。这就像你想证明一道几何题,结果用了代数思路,且这种代数方法之前根本没人想过能如此使用。

哈佛大学的数学家Melanie Matchett Wood曾说:如果给予人类数学家相同时间,“他们也能找到一个反例”。

但关键是——AI先找到了。

为何这不是“人类又输了”的故事

你可能已经听腻了“AI又赢了人类”的新闻,但这次真的不同。

以往的AI做数学,听话归听话,但它本质上是个超级搜索引擎——你给它题目,它在人类已有知识库中寻找相似解法,然后缝合出答案。这是“能做题”。

这一次,模型是在一个开放性的研究问题上给出原创构造——你问它一道未解之题,它没去翻任何人的作业本,而是自己想出了连专门研究此问题的数学家都没想到的方法,然后算出答案。

这是“能发现”。

菲尔兹奖得主蒂姆·高尔斯(Tim Gowers)评价道:

“如果这篇论文出自人类作者,投到《数学年刊》,我会建议接受。”

《数学年刊》是全球最顶级的数学期刊之一。高尔斯不是随便说话的人,他也是之前公开质疑AI数学能力的那批人之一。

而且有趣的是,七个月前OpenAI刚因一次虚假宣传被打脸。当时他们前副总裁Kevin Weil声称GPT-5解决了十个埃尔德什未解问题,结果被曼彻斯特大学的Thomas Bloom当场揭穿——那只是检索到已有文献,根本不是原创证明。Weil后来删帖跑路了。

这一次,OpenAI学聪明了。他们直接邀请了9位数学家联合署名,包括Bloom本人。

Bloom这次的态度很有意思,他说AI“正在帮助人类更充分地探索几个世纪以来构建的数学殿堂,还有哪些尚未被看见的奇迹正等候登场”。但他也补了一刀:AI的原始证明虽然完全有效,但被人类数学家“显著改进”了——人类在消化和改进证明方面仍扮演关键角色。

翻译成人话:AI负责发现,人类负责消化。

这意味着什么

我看到一些自媒体已经开始喊“数学家要失业了”,这种说法既蠢又无聊。

但有一些更深的问题值得认真想——

第一,AI开始走人类没想过的路了。

组合几何领域的专家们多少年来都在用图论、组合方法死磕这个猜想,没人想过借用代数数论。但AI没被人类的“领域偏见”污染,它在跨领域的知识库里找到了连接,然后拼出了一个路径。

这说明什么?AI不是简单地更努力地尝试人类已知的方法,它是真的在建立新的知识连接。

第二,“原创性”的定义可能要重新考虑了。

MIT的一个23岁学生Lime Price,用GPT-5.4 Pro在80分钟内解决了一个困扰数学家60年的埃尔德什问题。菲尔兹奖得主陶哲轩亲自验证了这个证明,还把它扩展为新理论的起点。

过去,“解决开放问题”是衡量一个数学家研究能力的核心指标。现在这个门槛被AI一夜之间碾平了。

高尔斯说了一句很重的话:“未来对数学的贡献门槛,将变成证明一些LLM无法证明的东西,而不是仅仅证明一些还没有人证明过的东西。”

这意味着什么?意味着数学研究的方向会发生根本性转向——人类数学家可能要更多地去做那些“AI够不到的地方”,而不是和AI抢地盘。

第三,人机协作的新模式正在形成。

OpenAI发布的那篇验证论文本身就是证明。AI生成原始证明,人类数学家负责消化、改进、写出人类能理解的版本。模型跑出了结果,人类负责“翻译”成数学共同体能接受的语言。

陶哲轩把这种现象叫做“证明消化不良”——AI生成和验证证明的速度越来越快,但人类理解、解释、拓展结果的效率跟不上。这不是某一个环节的问题,这是整个数学实践的节奏正在被打乱。

我们应该担心还是期待

我既不是AI万能论者,也不是AI威胁论者。

这次的事件让我最兴奋的不是“AI打败了人类”,而是——数学研究有了一个新的探索工具。

几百年来,数学家最大的瓶颈是什么?是想象力。你需要知道哪个方向可能是对的,你需要敢赌一个没人走过的路。人类数学家的知识面是有限的,跨领域的连接靠的是天才般的直觉和运气。

现在AI可以帮你做这个。

它可以遍历不同领域的知识连接,找到人类没想过的路径,然后把这个路径扔给人类专家去判断、去消化、去发展。

这不叫替代。这叫协作升级。

当然,这也带来一些严肃的问题:

博士生怎么办?那些曾经需要数年训练才能叩开的研究大门,现在可能只需要一个提示框和两个小时。数学教育体系需要重新思考自己在培养什么能力。

学术评价体系怎么办?arXiv目前明确拒绝接收AI撰写的内容,那这些突破性的AI证明该往哪投?同行评审的标准怎么定?

知识产权怎么算?这次OpenAI的论文,原始证明是AI生成的,人类数学家负责验证和改进,这个成果算谁的?

这些问题没有标准答案。但它们真实存在,而且很快就需要有人来回答。

最后说一句

过去两年,类似的“AI攻克数学”叙事出现过好几次,仔细看都有各种条件限制。

但这一次,说话的人里有菲尔兹奖得主,有专门打假OpenAI的数学家,有普林斯顿、哈佛、多伦多等顶级机构的学者。他们的评价出奇一致:这确实是AI首次在开放性研究问题上给出可同行审查的原创构造。

从“能做题”到“能发现”,这不只是能力的量变,这是范式的转移。

我不知道数学家的未来会怎样。但我知道,数学这门最古老、最纯粹的理性探索,正在被重新定义。

这挺让人激动的。