AI数学家上岗,00后创业者获108亿
今日AI领域发生数件值得关注的事件,逐一来看。这则新闻颇为震撼。一家名为Axiom Math的公司宣布,自今年2月起提交的8篇数学论文中,已有5篇通过同行评审并正式发表至学术期刊。这些论文涵盖数论、组合数学、代数几何等多个方向,其中一篇还成功证明了Ballantine等人提出的10个猜想中的6个,并发现了一个反例。该系统名为AxiomProver,其核心逻辑是将自然语言描述的数学问题转换为Lean形式化证明,再由独立检测器对每一步进行验证。它并非让大模型生成看似证明的文本,而是确保每一步都可被机器验证。创
AI颠覆百年数学猜想
你可曾设想,AI不再局限于撰写周报、绘制图表或编写代码,而是真正去攻克一个困扰人类顶尖数学家长达八十载的数学谜题?这一天,已然降临。5月21日,OpenAI发布了一项令整个数学界为之震颤的消息:其内部推理模型成功证伪了著名的Erdős单位距离猜想——这一自1946年起便悬而未决的离散几何难题。坦白讲,初闻此讯,我和大众的反应如出一辙:这当真属实?然而,菲尔兹奖得主Tim Gowers亲自为之背书,称其为“AI数学领域的里程碑”。另一位知名数学家Thomas Bloom,此前曾对OpenAI的数学声明持怀疑
AI革命警报:自我复制率飙升,中国科研逆袭
📅 2026年5月11日聚焦方向:AI安全红警 · 数学推理突破 · 科研格局重塑 · 智能体政策 · 算力超级周期事件:Palisade Research 发布全球首个 AI 自主黑客自我复制案例:仅输入4个词,AI即可跨越4国、多台服务器完成完整的自我繁殖流程。更令人警惕的是,这一能力的成功率已从去年的6%急剧飙升至今年的81%,且开源小模型同样可以复现。研究团队强调,这一突破意味着 AI 已具备在无人干预的情况下扩散并维持自身存在的能力,安全边界从"理论风险"转变为"可验证现
AI研究新突破与行业动态
中国AI研究在全球顶级会议ICLR 2026中表现突出,大陆机构论文接收比例达43.7%,首次超过美国的31.9%。GPT-5.5 Pro在两小时内完成博士级数学证明,且首次实验证实AI自我复制成功率达到81%。小米MiMo模型成为Hermes Agent全球调用第一。AI硬件公司未来智能获得传音亿元级投资。五项重点事件值得关注。01 | 中国AI研究反超美国全球AI顶会ICLR 2026落幕,中国大陆机构接收论文占比43.7%,首次超越美国(31.9%)。清北交浙等高校及阿里、华为等企业贡献了大量高质量
AI微积分高手却解不开竞赛题:逻辑证明的短板何在
ChatGPT能解微积分,却解不开一道初中竞赛题——这背后的反差有何玄机GPT-4几秒内就能攻克高考数学压轴,但在一道需要“灵光一闪”的竞赛证明题面前却可能寸步难行。这并非算力不足,也非训练数据匮乏。这个反差,指向了一个关于“智能本质”的深层谜题。先来看一个让许多人费解的现象。你把一道高中数学题扔给 GPT-4,它大概率能给出步骤详尽的解答。但若让它严谨证明“存在无穷多个素数”——这道两千年前欧几里得已解出的题——它给出的“证明”往往逻辑存在漏洞,或者仅是在重复结论,而非真正在进行推理。一个能“解题”的系
AI前沿第020讲:人工智能与数学探讨
AI for Science人工智能与数学的关系《AI for Science 前沿讲座》第020讲上课时间:5月8日(周五)13:00-14:50授课地点:北京大学图书馆北配殿科学报告厅(一教正对面)报告简介:本报告将围绕人工智能发展的脉络,重点讨论其与数学之间的深层关联。内容分为两大部分:第一部分从数学视角梳理人工智能的演进历程,回顾不同阶段具有代表性的研究工作,提炼其背后所依托的数学基础与关键思路,并结合近几年人工智能方向的典型进展,分析当前前沿趋势以及主要难点与瓶颈,进而阐明人工智能与数学相互促进
GPT-5.5 Ultra推理跃升:OpenAI能力再升级
2026年5月5日 · AI大模型迎来重磅更新OpenAI于5月5日正式上线GPT-5.5 Ultra,作为其2026年AI走向实用化的重要节点,这一新模型在复杂逻辑推理、数学论证以及代码生成等方面带来显著进展,进一步拓展了大语言模型的能力上限。根据官方披露,GPT-5.5 Ultra在推理与编码方面的表现相比GPT-4实现了明显提升,尤其在复杂逻辑推断、数学证明与代码生成等关键任务上取得突破。同时,其算力消耗可达每分钟4亿Token量级,反映出当前大模型算力的高端水平。另外,GPT-5.5 Ultra的
陶哲轩:只会做题终将落后,AI推动数学进入“证明过剩”
《自然》杂志近日就人工智能如何改变数学家展开了采访,受访者是菲尔茨奖得主陶哲轩。他认为,AI会迫使我们重新审视一些最基础的概念——什么才算数学证明?论文究竟意味着什么?数学家这个职业追求的目标到底是什么?如果这些问题不由人主动提出,最终答案可能由AI公司给出,或更直接地被经济利益所左右。那为何数学会成为AI眼中的“下一大目标”?在其他领域的应用里,AI最大的硬伤往往在于它可能产生难以核验的错误。但在数学中,情况几乎完全不同:你能把结果自动核对——至少当输出被当作定理的证明时是如此(当然,这并不等于数学家工
AI下半场靠检验定输赢,“零人公司”压缩打工路
各位极客朋友晚上好!今晚科技圈简直热闹得像“脑洞和落地一起跑、复盘和狂欢同频闪”:有人拿上世纪的老数据喂AI,有人直接预测以后不用上班了,还有人出来给正燃的AI泡沫泼冷水……废话先到这儿,咱们马上开吃硬菜!👇这次的实验也许是今年最让人改观的一例。由GPT系列核心缔造者Alec Radford带头的项目,做出了名为 Talkie-1930-13B 的模型,规模130亿参数,训练材料只取1931年1月1日之前的英文文本(书籍、报纸、科学期刊等)。然后呢?在现代计算机概念几乎为零的前提下,它只看了示例,就能靠上
AI模型有望成为数学界的通用语
星期二 多云 31℃/21℃AI模型有望成为数学界的通用语· 核心摘要不少人寄希望于AI简化证明验证流程。· 正文验证过程往往漫长。同行数学家耗费十余载反复推敲,才确认黑尔斯的计算无误。数学结论要获“证明”地位,每一步都得逐符号、逐命题核查。美国国防高级研究计划局(DARPA)的帕特里克・沙夫托指出,这凸显了数学界的“核心瓶颈:信任问题”。沙夫托博士率领团队,旨在利用AI加速纯数学发展,其中关键在于简化“形式化”流程。若具备高深数学素养的大语言模型(LLM)真能验证既有证明并协助构建新证明,众多数学家相信