AI奥数满分却读不准时钟:斯坦福报告揭示能力断层
若让当前AI解答一道国际数学奥赛题,它有望斩获金牌。若让它识别模拟时钟,其准确率仅有50.1%。这并非我杜撰,而是斯坦福大学4月14日发布的《2026年人工智能指数报告》中,最为讽刺的一组数据。这份422页的报告涵盖了全球AI发展的方方面面。然而,若要读懂其精髓,仅需关注一个核心数字:AI拥有最强大的大脑,却长着最笨拙的手脚。先来看完整的数据:AI模型在国际数学奥林匹克竞赛(IMO)中能取得金牌级分数,在编程能力测试(SWE-bench)中得分率从60%飙升至接近100%——这表明其已超越绝大多数人类工程
AI进军数学界,奥数赛场大放异彩,研究范式迎来巨变
数学界的人工智能变革浪潮已然席卷而来2025年的盛夏,人工智能在数学界迎来了真正的里程碑。在当年的国际数学奥林匹克竞赛中,多款AI模型在六道题目中成功攻克五道,其表现远超许多专家的预料。虽然奥数题属于有确定答案的难题,并非开放性研究问题,但这一成绩足以让整个数学界重新审视AI的巨大潜力。过去那些认为AI容易出错、难以胜任严肃数学研究的专家学者,如今纷纷开始将AI融入日常工作。实际应用效果令人惊喜:AI不仅解题能力出色,更能协助研究者探索全新的研究方向,将原本需要数周甚至数月才能完成的工作,大幅压缩至一天之