马斯克预言:中国最强AI模型明年一季度问世
► 文 观察者网陈济深 编辑 张广凯
近日,有用户在社交平台提问:“中国大模型何时能赶上Anthropic的Fable水平?智谱GLM-5.2已显著缩小差距。”特斯拉CEO马斯克回应称:“可能在(2027年)一季度。”
针对马斯克的看法,AI领域专家指出,其预测略显保守,中美模型差距或小于7个月。谷歌DeepMind首席执行官德米斯·哈萨比斯此前也表示,中国AI模型能力可能“仅差几个月”就能追上国外水平。
马斯克的评论正值Anthropic新模型引发全球热议之时。
6月9日,美国AI企业Anthropic推出其史上最强模型——Claude Fable 5和Claude Mythos 5,在软件工程、长程智能体闭环、复杂系统理解等领域展现行业领先性能,并引发关于其是否接近通用人工智能(AGI)边界的讨论。
对全球开发者而言,这类能力意味着模型不仅能回答问题或补全代码,还能参与实际工程流程,承担更复杂的开发任务。
6月13日,美国商务部发布出口管制令,禁止向“非美籍用户”提供服务,最终Anthropic全面下架两款模型,并回应称“这是一个误会,相关漏洞已知且轻微”,暗示Fable 5系列后续会回归。
美国“一刀切”政策不仅影响Anthropic的非美籍员工,也将传统盟友排除在外。加拿大总理卡尼警告“只有一个选择绝非好事”,直言欧洲和加拿大过度依赖少数美国AI模型是“错误”。
出口管制伴随而来的是美国头部闭源模型访问机制的收紧。
Anthropic近期更新身份验证政策,Claude用户未来可能被要求验证年龄或身份,材料涉及政府证件、面部照片或视频等。几乎同时,OpenAI也开始对部分ChatGPT用户触发身份核验。
这些变化共同指向一个趋势:前沿闭源模型的访问权,正从账户订阅转向更强调身份、地区和资格审核的准入机制。
就在美国对Anthropic下达出口管制当天,智谱预告其最强模型GLM-5.2即将上线,并留下意味深长的话:“在一些前沿模型突然不可用时,我们选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应开放、可用、可构建,并服务于每位开发者。”
6月17日,智谱官宣GLM-5.2上线,以最宽松的MIT协议开放,允许免费商用,且模型训练与线上推理均未依赖海外算力。实现了可用的1M稳定上下文长程编程能力量级跃升。
架构层面,GLM-5.2提出IndexShare机制,每四层稀疏注意力共享同一个indexer,从而在百万token上下文下将每token计算量降低约2.9倍。
在Artificial Analysis综合榜单上,GLM-5.2取得51分,跻身全球模型前三,并位列开源模型SOTA;在FrontierSWE、Terminal-Bench等代码和长程任务权威基准上,GLM-5.2与国际顶尖模型Claude Opus 4.8的差距收窄至1%–4%。
从多个基准评测来看,基本达到比肩Claude Opus、Fable 5的水平。这也代表开源模型的代码能力首次达到行业认可的顶尖闭源模型水平。
长程任务评测中,GLM-5.2在FrontierSWE等任务上比肩Claude Opus 4.8
在DeepSeek出现后一年间,中国大模型企业纷纷拥抱开源,开源模型军团迅速崛起,中国模型迅速拉平了与美国头部模型的差距。
在广受欢迎的AI模型访问平台OpenRouter上,中国模型的调用量从2024年底的1.2%升至超过50%,在总量上全面超越美国模型。
上周,使用量排名前四的模型均来自中国公司:DeepSeek、MiniMax、腾讯和小米。这些中国开源模型不仅在国内广受欢迎,其高性价比和接近头部模型的性能也使其在全球许多地区备受青睐。
不过,调用量反超并不等同于前沿能力全面领先。很长一段时间里,中国模型更多被视为性价比平替、开源补充或单项能力追赶者。
随着今年年初OpenClaw(龙虾)和一人公司(OPC)引发的热潮,市场对AI的需求也升级到如何满足智能体时代下真正复杂的开发者工作流和长程复杂任务。
GLM-5.2的不同之处在于,它试图在智能体编程和长程复杂任务这些过去由Claude、GPT等闭源模型占优的场景中,进入同一竞争区间。
在今年春节期间,智谱GLM-5模型曾以Pony Alpha的隐身身份上线OpenRouter,面向全球开发者免费开放API调用与体验。在全球技术圈引发大范围身份猜测,大量开发者将其视为OpenAI、Anthropic、DeepSeek下一代旗舰模型,其从‘单轮代码补全’到‘智能体工程’的范式跃迁,奠定了国产开源模型的全球头部地位。
三月底发布的GLM-5.1则进一步强化了代码性能,8小时长程工作的能力也让中国大模型真正冲过了由Anthropic树立的编程可用基本线,本次GLM-5.2的出现不仅补齐了5.1的短板,更凭借扎实的后训练和泛化场景覆盖,将代码能力直接推进到世界一流模型的门口。
美国开源模型研究员Nathan Lambert评论称:“智谱GLM-5.2在当下智能体能力超过了谷歌Gemini,这是一份极具分量的成就”,这也意味着曾经垄断全球模型头部能力的谷歌、OpenAI、Anthropic“御三家”铁三角,首次出现来自中国的模型企业。
在过去相当一段时间内,由于客观条件限制,美国AI巨头每次模型迭代都会重新拉开与中国头部模型的差距,无论是Gemini 3.5、GPT-5.5还是Opus 4.8的出现,而最新的Fable 5模型则再次拉高了行业天花板。GLM-5.2已在核心开发场景中接近Claude Opus 4.8、Fable 5等国际顶级闭源模型。其在智能体编程、长程任务执行等关键赛道上,进入了可与头部闭源模型正面比较的区间。
智谱GLM-5.2的发布是中国AI大模型阶段性发展成果的一个缩影。
马斯克关于中国大模型可能在“一季度”达到Fable水平的判断,真正值得关注的并非具体时间点是否精确,而是它反映出全球市场对中国前沿模型追赶速度的重新估值。
美国财富对此报道称:“美国对Fable和Mythos的禁令证明了中国在科技自给自足方面所采取的更广泛举措是正确的。自2022年拜登政府对先进芯片和芯片制造设备的销售实施管制以来,中国科技自给自足的步伐加快了。”
Counterpoint Research研究副总裁尼尔·沙阿(Neil Shah)表示:“由于出口管制,中国目前并非处于技术前沿,但他们拥有自己的芯片和模型。”
值得关注的是,上线首日,GLM-5.2即完成与华为昇腾、平头哥、摩尔线程(669.000, 30.00, 4.69%)、寒武纪(1507.460, 187.46, 14.20%)、昆仑芯、沐曦、海光、壁仞等国产算力平台的全适配;此前发布的国产大模型DeepSeek V4也已完成该类国产算力生态的全栈适配,这也意味着,来自中国的全栈开放生态,正在赋能全球AI产业实现开放包容、互利共赢的生态繁荣。
当美国闭源前沿模型越来越像一张需要审核资格的通行证,GLM-5.2给出的答案是另一条路:前沿能力不一定只能封闭在少数平台里,也可以被开源出来,交给全球开发者重新构建。
全球大模型竞争的格局里,第一次出现了一个既接近顶级闭源体验、又选择开放路线的中国变量。
马斯克那个引发热议的“2027年一季度”预测。从代际落后,到单点突破,再到如今在最硬核的智能体和长程复杂任务上“上桌同博”,中国大模型把追赶的计价单位从“年”缩短到了“月”。
从这个意义上说,GLM-5.2不只是智谱的一次旗舰模型发布,而是国产大模型从“追赶叙事”进入“同桌竞争”的一个标志性节点。






