AI周观察 | 2026年5月22日—29日:AI攻克数学堡垒,变革已至还是泡沫将破?
本周的人工智能领域仿佛开启了倍速模式。Anthropic携带着9000亿美元估值和Karpathy的加盟高调归来;OpenAI的模型独立证明了困扰学界80年的平面单位距离猜想;Google I/O将「Agent」作为全场唯一核心主题。我们正身处一个特殊的时刻——AI不再仅仅是「更优质的工具」,它正在演变为「另一种思维方式」。
━━━━━━━━━━━━━━━━
Anthropic正在推进一轮高达300亿美元的融资,估值逼近9000亿美元。Andrej Karpathy正式加入Anthropic Claude团队。
小P点评:9000亿估值超越大多数国家的GDP。Anthropic以「安全优先」的叙事赢得资本青睐——Mythos因安全风险被刻意隐藏不公开,反而成了最有力的安全背书。Karpathy的到来填补了Anthropic在工程实践方面的最后一块短板。OpenAI、Google、Anthropic三强争霸的格局正从技术较量升级为「资金+人才」的双重竞争。
━━━━━━━━━━━━━━━━
OpenAI宣布其最新推理模型独立证明了Paul Erdős在1946年提出的平面单位距离猜想。Fields奖得主Tim Gowers称之为「AI数学的里程碑」。模型不仅解决了难题,还提出了比传统「方格构造」更优的多项式改进方案。Hacker News上获得1295分、943条评论。
小P点评:这可能是我们首次见证AI在纯数学领域做出原创性贡献——不是验证人类已有的证明,而是独立发现新的证明路径。如果AI能在数学这样高度抽象的领域取得突破,那么它在密码学、材料科学等依赖数学基础的领域同样可能引发连锁反应。人类数学家需要重新定义自身角色:从「解题者」转向「问题提出者」。
━━━━━━━━━━━━━━━━
Gemini 3.5 Flash现已成为所有AI功能的默认模型。76.2% Terminal-Bench、83.6% MCP Atlas、1656 Elo GDPval——推理速度是其他前沿模型的4倍,价格仅为GPT-5.5的约一半。Gemini Spark被嵌入Gmail、Calendar、Docs,Google Antigravity成为全新的Agent-first开发平台。
小P点评:Google的战略非常清晰——用Flash的性价比冲击市场,用Spark的生态粘性锁定用户。把「快速且经济」的模型打造为Agent旗舰,而不是继续在参数规模上内卷,这是一个反直觉但极为明智的选择。当大多数公司在追求「更强」时,Google在追求「更无处不在」。
━━━━━━━━━━━━━━━━
支持100万token上下文窗口,GPQA Diamond得分92.4(超越Claude Opus 4.6),HMMT数学竞赛得分97.1,定价仅为GPT-5.5的一半。Artificial Analysis智能指数全球前十,最强中文开源模型。
小P点评:Qwen 3.7 Max的意义不在于某个单项指标的领先,而在于它证明了中国团队在前沿模型训练上已经具备了与硅谷正面竞争的实力。百万上下文窗口对Agent场景是刚性需求。当性能接近而价格减半时,企业用户的迁移成本将变得极具吸引力。中国AI的「国产替代」叙事正在从政策驱动转向市场驱动。
━━━━━━━━━━━━━━━━
Mythos在USAMO 2026数学竞赛中取得97.6%的惊人得分(Opus 4.6仅为42.3%),SWE-bench 93.9%。但它没有公开发布——而是被限制在Project Glasswing计划中,供AWS、Apple、Microsoft、NVIDIA等50家合作伙伴用于漏洞挖掘。首月已发现超过10000个安全漏洞。
小P点评:这是AI安全领域最具争议也最具前瞻性的实验。Anthropic承认「当前没有任何safeguards能防止Mythos级别模型被大规模滥用」,选择主动延迟发布。但当最强的AI能力只服务于50家巨头时,AI的「民主化」叙事是否正在瓦解?安全与开放之间的张力,将是未来几年最大的行业命题。
━━━━━━━━━━━━━━━━
2180亿参数的稀疏MoE模型(仅250亿活跃参数),Apache 2.0许可,可在2张H100上运行。目前开源社区中规模最大的商用级MoE模型之一。
小P点评:Apache 2.0许可意味着几乎零限制的商业使用。MoE架构的「稀疏激活」特性让推理成本大幅下降。Cohere此举措既是对闭源路线的回应,也是在为企业私有化部署铺路。当开源模型的性能逼近闭源、成本远低于闭源时,「要不要自建模型」将从技术问题变成财务问题。
━━━━━━━━━━━━━━━━
欧盟就AI法案简化方案达成一致:延迟高风险AI规则、增加监管沙盒、减少重复合规,同时禁止「换脸裸露」类应用。教皇利奥十四世将发布历史上首份关于AI与人类尊严的通谕。
小P点评:欧盟的「简化」本质上是务实的调整——在美国行业压力和中国竞争面前,过度监管只会让欧洲AI产业失去竞争力。而教皇的通谕提醒我们:AI治理不只是政府和科技公司的事,它触及人类对自身价值和尊严的根本理解。当宗教领袖开始讨论AI伦理时,说明这个问题已经进入了文明层面的对话。
━━━━━━━━━━━━━━━━
本周的7条新闻指向一个共同的主题:AI正在从「对话工具」进化为「行动主体」。Google的Spark、Anthropic的Managed Agents、OpenAI的Codex Mobile、xAI的Grok Build——所有巨头都在押注同一个方向:让AI不只是「告诉你怎么做」,而是「替你去做」。
但在这个狂热的进程中,我们更需要冷静思考: • 当AI能独立证明数学猜想时,人类知识的生产方式将被如何重塑? • 当最强的模型被「锁起来」只服务少数巨头时,AI民主化是否已成空话? • 当每个AI订阅都在消耗企业预算时,ROI的临界点在哪里?
这些问题没有标准答案,但值得每个关注AI的人持续追问。