AI发展遭遇三重挑战
01 6月10日最重要的3件事
6月10日有三件事放在一起看,让我后背有点发凉。
AI 生成的代码,九成被有经验的程序员拒了。
Anthropic在6月10日发了Claude Fable 5,几乎在所有基准上拿了SOTA。Stripe的反馈很硬——"将数月工程压缩至数天"。听起来很厉害对吧?你先记住这个评价。
然后也在6月10日,Cognition发了一个新基准叫FrontierCode。这个名字你可能会越来越常听到。它不是又一个跑分榜。它是请了20多位顶级开源维护者,手工做了150个真实任务——每个任务平均花40小时以上,依据3000多条规则来判定"如果是你,你愿不愿意合并这段代码?"
结果:Claude Opus 4.8在最高难度上的通过率,13.4%。GPT-5.5是 6.3%。其余的模型,1%到5%。
你看,同一个模型,在一个基准上是SOTA,在另一个基准上九成代码过不了关。不是模型不行——是标准不一样。SWE-Bench量的是"能不能跑通",FrontierCode量的是"值不值得长期维护"。这两个标准之间的鸿沟,6月10日之前没人认真量过。
算力不是工程问题了,是地缘政治资源。
Elon Musk 在6月10日第一次把SpaceX轨道AI数据中心的方案讲清楚了:单星峰值150千瓦,激光互联,低轨延迟6到8毫秒,计划打上百万颗卫星,2027年量产,目标是从吉瓦级往太瓦级推。
也在这一天,中国传出消息——五年内投大概2950亿美元建全国AI数据中心。华尔街的Apollo和Blackstone联手做了笔350亿美元的AI融资交易。台湾在考虑限制 AI 芯片出口大陆。
四条消息,四个方向。向上——往轨道走。向下——往地下数据中心走。向外——往地缘封锁走。向深——往新型融资模式走。算力这件事,正在同时从工程、金融和地缘政治三个维度被重新定义。它不再只是一个"多买几张GPU"的问题了。
Agent越自由,责任越没人认。
德国一个地方法院在6月10日裁了:Google对AI概览生成的内容承担法律责任。关键细节是——涉案的 AI 概览把两家出版商错误地跟欺诈关联在一起,而这些声明在任何一个链接