AI模型突破组合几何经典难题:80年悬案终被解开
OpenAI Research · 2026 年 5 月 20 日 · 研究里程碑
近 80 年来,数学家们始终在探索一个看似简洁的问题:当平面上分布着 n 个点时,最多能形成多少对恰好相距 1 个单位长度的点?
这就是著名的平面单位距离问题(planar unit distance problem),由匈牙利数学家保罗·埃尔多什(Paul Erdős)于 1946 年首次提出。该问题是组合几何(combinatorial geometry)领域最具影响力的难题之一——表面上看似直白,实则极度复杂难解。2005 年 Brass、Moser 和 Pach 合作的专著《离散几何研究问题》将其描述为"组合几何中知名度最高(也最容易阐述)的问题"。普林斯顿大学著名组合数学家诺加·阿隆(Noga Alon)称这是"埃尔多什最为钟爱的问题之一"。埃尔多什甚至为攻克此问题设置了悬赏奖金。
今天,我们宣布在单位距离问题上取得了重大突破。
自埃尔多什的开创性工作以来,学术界一直认为下文所述的"正方形网格"构造在实现单位距离对数量最大化方面,从本质上已是最优方案。OpenAI 的一个内部模型成功颠覆了这一长期共识,构建出一个无穷序列的构造方法,实现了多项式级别的提升。该证明已由外部数学家团队审核验证。他们还发表了一篇补充论文,对论证逻辑进行了解读,并进一步阐述了该成果的重要意义。
这一发现之所以引人注目,还在于其发现过程的独特性。证明出自一个全新的大语言推理模型(general-purpose reasoning model)——并非专为数学领域训练的专项系统,也没有通过辅助框架引导其搜索证明策略,更没有针对单位距离问题进行过特别调优。作为评估前沿模型对尖端研究贡献能力的更大规模项目之一,我们在一系列埃尔多什相关问题上对该模型进行了测试。在这一问题上,它提交了一份成功解决该开放问题的完整证明。
这份证明对数学界和人工智能界均具有里程碑式的意义。这是首次由人工智能独立解决了一个处于数学某个分支核心位置的著名开放问题,充分展示了当前系统所能达到的推理深度。数学为推理能力提供了极为理想的检验场景:问题定义精确、潜在证明可被严格验证,且一个冗长论证只有在从头至尾的每一步推理都站得住脚时才被视为有效。
证明所采用的方法本身同样值得关注。它将代数数论(algebraic number theory)中那些出人意料的、精妙的理论,引入到了一个本质上属于初等几何范畴的问题中。菲尔兹奖得主蒂姆·高尔斯(Tim Gowers)在补充论文中评价这一成果为"人工智能数学的一座里程碑"。知名数论学家 Arul Shankar 则指出:"在我看来,这篇论文证明了当前的人工智能模型已超越了单纯作为人类数学家辅助工具的角色——它们具备了产生原创且精妙的思想、并将其付诸实践的能力。"
— 诺加·阿隆(Noga Alon)
— 蒂姆·高尔斯(Tim Gowers),菲尔兹奖得主
— Arul Shankar
— Jacob Tsimerman
设 u(n) 表示平面上 n 个点之间单位距离对数的最大可能值。
达到线性增长率的构造非常容易实现:将 n 个点排成一条直线可得到 n−1 对;排列成正方形网格则大约能获得 2n 对。此前已知的最佳构造源自经过缩放处理的正方形网格,实际上效果更好:n^(1 + C/log log(n)),其中 C 为常数。由于 log log(n) 随 n 趋向无穷大而趋于无穷,指数中的附加项趋向于 0,意味着这些构造的增长率仅比线性稍快一些。
数十年来,学界普遍认为这一增长率本质上已是最优的,没有任何构造能够显著超越正方形网格的表现。用专业术语来说,埃尔多什猜想存在一个 n^(1+o(1)) 的上界,其中 o(1) 表示一个随 n 趋于 0 的附加项。
更为精确地,对于无穷多个 n 值,该证明成功构造出了包含至少 n^(1+δ) 个单位距离对的 n 点配置,其中 δ > 0 为一个固定常数。(最初的人工智能证明未给出 δ 的具体数值;但普林斯顿大学数学教授 Will Sawin 即将发表的改进版本表明,可取 δ = 0.014。)
了解该问题的历史背景有助于理解为何这一成果如此出人意料。最佳已知下界自埃尔多什 1946 年的原始构造以来本质上未曾改变。最佳上界 O(n^(4/3)) 源自 Spencer、Szemerédi 与 Trotter 1984 年的研究成果;尽管 Székely、Katz 与 Silier、Pach、Raz、Solymosi 等人后续进行了改进和相关的结构性研究,上界本质上保持稳定。作为支持该猜想的间接证据,Matoušek 与 Alon-Bucić-Sauermann 研究了平面上非欧几里得距离的变体,证明了"大多数"这类非欧距离在某种意义上符合该猜想。
令人惊讶的是,这一构造的核心要素源自一个截然不同的数学分支——代数数论,该领域研究的是整数的扩张(被称为代数数域,algebraic number fields)中的因子分解等概念。
在验证了初始证明后,我们研究了模型在不同测试时算力(test-time compute)条件下的成功率。
从宏观角度来看,证明从一个我们熟悉的几何概念出发,并将其引向了一个出人意料的方向。
埃尔多什最初的下界可以通过高斯整数(Gaussian integers)来理解:形如 a+bi 的数,其中 a 和 b 为整数,i 是 −1 的平方根。高斯整数扩展了普通整数的概念,并与普通整数类似,享有"唯一素因子分解"等性质。这类对普通整数或有理数的扩展被称为代数数域。
新论证采用代数数论中更为复杂的扩展替代了高斯整数:这些更丰富的对称性能够产生更多的单位长度差值。精确的论证运用了无限类域塔(infinite class field towers)与 Golod–Shafarevich 理论等工具,证明了该论证所需的数域确实存在。这些理论对代数数论专家而言并不陌生,但它们竟能对欧几里得平面上的几何问题有所启发,实在令人称奇。
这一成果标志着人工智能与数学互动历史上的重要时刻:一个人工智能系统独立解决了一个处于活跃数学领域核心位置的长期悬而未决的开放问题。它也预示着一种新型人工智能与人类数学家协作模式的雏形。在本案例中,外部数学家撰写的补充工作描绘出了一幅比原始解答本身丰富得多的图景。
正如 Thomas Bloom 在补充笔记中所写:
— Thomas Bloom
这一成果所揭示的代数数论与离散几何之间出人意料的联系,正是其引人入胜之处。它不仅仅是解决了一个具体猜想,更可能为数学家们搭建起一座桥梁,去探索更多相关的问题。
Bloom 还提出了更广泛的展望:
— Thomas Bloom
更深远的启示超出了这一具体成果本身。
更强的数学推理能力可以使人工智能成为更有价值的研究伙伴:能够将复杂的思想链条完整保持连贯、连接相隔甚远的知识领域、浮现专家可能未曾优先考虑的有希望路径,并在那些原本因过于复杂或耗时而难以攻克的难题上助研究者一臂之力。
这些能力的意义远超出数学范畴。如果一个模型能让复杂论证保持自洽、跨越遥远领域连接想法,并产出经得起专家审视的成果,那么这些能力在生物学、物理学、材料科学、工程学和医学领域同样具有重要价值——它们也是我们迈向更自动化研究的更长期路径的一部分:能帮助科学家和工程师探索更多想法、追问更难技术问题的系统。
尽管这一进展并非完全出乎意料,但它增强了我们对理解人工智能发展的下一阶段、对齐高度智能系统所面临的挑战、以及人机协作未来的紧迫感。
那个未来仍然取决于人类的判断。专业知识变得更有价值,而非贬值。人工智能可以帮助搜索、建议与验证。而人类则负责选择重要的问题、诠释结果,并决定接下来要追问什么。
原文:OpenAI Research · An OpenAI model has disproved a central conjecture in discrete geometry 发布于 2026 年 5 月 20 日 原文链接、证明全文、补充论文与模型思维链摘要均可在 openai.com 官方博客中找到。 中文编译:Apex Learn