AI发展遭遇三重挑战

发布时间：2026-06-11 02:32阅读：22

01 6月10日最重要的3件事

6月10日有三件事放在一起看，让我后背有点发凉。

AI 生成的代码，九成被有经验的程序员拒了。

Anthropic在6月10日发了Claude Fable 5，几乎在所有基准上拿了SOTA。Stripe的反馈很硬——"将数月工程压缩至数天"。听起来很厉害对吧？你先记住这个评价。

然后也在6月10日，Cognition发了一个新基准叫FrontierCode。这个名字你可能会越来越常听到。它不是又一个跑分榜。它是请了20多位顶级开源维护者，手工做了150个真实任务——每个任务平均花40小时以上，依据3000多条规则来判定"如果是你，你愿不愿意合并这段代码？"

结果：Claude Opus 4.8在最高难度上的通过率，13.4%。GPT-5.5是 6.3%。其余的模型，1%到5%。

你看，同一个模型，在一个基准上是SOTA，在另一个基准上九成代码过不了关。不是模型不行——是标准不一样。SWE-Bench量的是"能不能跑通"，FrontierCode量的是"值不值得长期维护"。这两个标准之间的鸿沟，6月10日之前没人认真量过。

算力不是工程问题了，是地缘政治资源。

Elon Musk 在6月10日第一次把SpaceX轨道AI数据中心的方案讲清楚了：单星峰值150千瓦，激光互联，低轨延迟6到8毫秒，计划打上百万颗卫星，2027年量产，目标是从吉瓦级往太瓦级推。

也在这一天，中国传出消息——五年内投大概2950亿美元建全国AI数据中心。华尔街的Apollo和Blackstone联手做了笔350亿美元的AI融资交易。台湾在考虑限制 AI 芯片出口大陆。

四条消息，四个方向。向上——往轨道走。向下——往地下数据中心走。向外——往地缘封锁走。向深——往新型融资模式走。算力这件事，正在同时从工程、金融和地缘政治三个维度被重新定义。它不再只是一个"多买几张GPU"的问题了。

Agent越自由，责任越没人认。

德国一个地方法院在6月10日裁了：Google对AI概览生成的内容承担法律责任。关键细节是——涉案的 AI 概览把两家出版商错误地跟欺诈关联在一起，而这些声明在任何一个链接