标签

AI模型有望成为数学界的通用语

发布时间:2026-04-14 22:10来源:微信阅读:6

星期二 多云 31℃/21℃

AI模型有望成为数学界的通用语

· 核心摘要

不少人寄希望于AI简化证明验证流程。

· 正文

验证过程往往漫长。同行数学家耗费十余载反复推敲,才确认黑尔斯的计算无误。数学结论要获“证明”地位,每一步都得逐符号、逐命题核查。美国国防高级研究计划局(DARPA)的帕特里克・沙夫托指出,这凸显了数学界的“核心瓶颈:信任问题”。

沙夫托博士率领团队,旨在利用AI加速纯数学发展,其中关键在于简化“形式化”流程。若具备高深数学素养的大语言模型(LLM)真能验证既有证明并协助构建新证明,众多数学家相信这将大幅提速这一本就缓慢的发现过程。

沙夫托博士带领团队,致力于利用人工智能推动纯数学进步,其中一项核心工作便是简化形式化流程。倘若拥有深厚数学功底的大语言模型(LLM)能够验证现有证明、并辅助推导新证明,许多数学家期望它能加快这一领域本就进展缓慢的发现步伐。

有一点已十分明确:大语言模型处理数学逻辑的方式与人类大相径庭。在处理复杂计算前,人类习惯先构思大致框架,明确意图,确保每一步的证明都可追溯。

有一点已十分明确:大语言模型处理数学逻辑的方式与人类截然不同。在着手复杂运算前,人类通常会先制定大致思路,明确意图,写出每一步都可验证的证明。

加州大学洛杉矶分校数学家陶哲轩表示,相反,大模型更像是在进行“意识流”运行。它们基于对“下一步应有何物”的预测推进问题,而非规划后续步骤;其推导过程更像是即兴对话,而非预设剧本。

加州大学洛杉矶分校数学家陶哲轩则指出,与之相反,大模型更倾向于以“意识流”方式运作。它们依据对“接下来该出现什么”的预判来解决问题,而非规划后续步骤;其推导过程更像即兴对话,而非预设脚本。

但这种即兴方式依然成效显著。近期数月,AI模型已能攻克诸多长期悬而未决的公开数学难题,甚至应对专门设计的刁钻新问题。陶哲轩评价道:“这一领域发展极为迅猛。”

但这种即兴方式依然带来了显著回报。近几个月,AI模型已能解决一些长期未解的公开数学难题,以及专门用来难倒它们的全新问题。陶哲轩表示:“这一领域发展极为迅速。”

谷歌 DeepMind 负责“AI for Science”项目的普什米特・科利认为,进展的关键在于确保这些模型以数学家能理解的方式表达推理。他团队为此开发的工具之一是AlphaEvolve,旨在为优化问题生成证明——即寻找最符合特定条件的数学对象(如最密球体堆积)。尽管已有解决此类问题的技术,但往往仅限专家使用。

对谷歌 DeepMind 负责“AI for Science”的普什米特・科利而言,关键在于让模型以数学家可理解的方式表达推理。他和团队为此研发的工具之一是AlphaEvolve,致力于为优化问题生成证明——也就是寻找最契合给定条件的数学对象(例如最密球体堆积)。虽然已有解决此类问题的技巧,但仅专家可用。

相比之下,AlphaEvolve 可用自然语言提示,非专家也能操作。参与开发的陶哲轩表示,其推理有时难以捉摸,但他认为谷歌另一款工具 DeepThink AI 能够充分解释自身运作机制。

与之相对,AlphaEvolve 可通过自然语言进行提示,非专业人士也能使用。参与开发的陶哲轩提到,它的推理过程有时难以理解,但他认为谷歌另一款工具 DeepThink AI 能够充分解释其工作原理。

该领域还有众多参与者。美国初创公司 Harmonic 就是其中一员。其机器人程序亚里士多德(Aristotle)在验证证明时,会尽力遵循用户提交的步骤。它首先将证明转化为严谨的符号与公理语言,以便逐一核对。

该领域还有许多竞争者。美国初创公司 Harmonic 便是其中之一。其名为亚里士多德(Aristotle)的机器人程序在验证证明时,会尽量遵循用户提交的步骤。它首先将证明转化为严谨的符号与公理语言,以便逐步检查。

Aristotle 采用了一款受数学家欢迎的开源编程语言 Lean。若人类写证明时出现小错误,Aristotle 会尝试修正;若人类跳过某些步骤(数学家常做直觉性跳跃),它会填补细节。Harmonic 负责人图多尔・阿奇姆指出,最终会得到一个与原证明思路一致、但逻辑严密无懈可击的证明。他解释说,人类若想理解仍需自己拆解,“但他们能确信每一步都是正确的”。

Aristotle 使用了受数学家青睐的开源编程语言 Lean。若人类撰写证明时出现小瑕疵,Aristotle 会尝试修正;若人类省略了某些步骤(数学家常有直觉跳跃),它会补全细节。Harmonic 负责人图多尔・阿奇姆表示,最终会得到一个与原证明思路一致、却逻辑严密的证明。他解释,人类若想理解仍需自行拆解,但“可以确信每一步都正确”。

另一家 AI 初创公司 Math, Inc. 也在致力于同一目标。它正在研发一个名为高斯(Gauss)的模型,同样具备将人类手写证明转换为 Lean 代码的能力。它的一个研究目标是将 2016 年柏林洪堡大学数学家玛丽娜・维亚佐夫斯卡取得的高维球体堆积问题证明进行形式化。

另一家 AI 初创公司 Math, Inc. 也在追求这一目标。它正在开发一个名为高斯(Gauss)的模型,同样能将人类手写证明转化为 Lean 代码。它的研究目标之一,是将 2016 年柏林洪堡大学数学家玛丽娜・维亚佐夫斯卡获得的高维球体堆积问题证明形式化。

高斯模型在数周内成功完成了 8 维和 24 维球体堆积证明的形式化。尽管这些证明早已被验证,无需 AI 辅助,但高斯的工作仍帮助数学家更好地理解了维亚佐夫斯卡证明中使用的工具。

高斯模型在数周内成功完成了 8 维和 24 维球体堆积证明的形式化。尽管这些证明早已在无 AI 辅助下被验证,但高斯的工作仍有助于数学家更好地理解维亚佐夫斯卡证明中使用的工具。

· 文章