AI世界模型中国夺冠,中美发展路径分化明显
剥开迷雾,我们只看核心。我是AI洞见的主理人,一个在科技圈挖掘八卦的观察者。
大模型竞赛已经变得乏味。MMLU、HumanEval、HLE……这些指标每隔几个月就会刷屏,冠军席位轮换,已经没人感到兴奋。然而,最近出现了一个新榜单——WorldArena,让我感到惊讶。
你可能第一次听说这个名字,但它发布的Track 1结果发出了一个强烈的信号:第一名和第二名都是中国的。
第一名是智元机器人的GenieEnvisioner-Sim2.0,68.26分。第二名是考拉悠然的BWM-Fast,67.87分。两个团队,都是中国实体。
坦白讲,单看这个分数,普通人看不出来。68分和67分,差在哪里?
但如果你把这件事,置于过去三年中美AI竞争的背景下,视角就完全改变了。
为什么世界模型赛道,
中国跑得比美国快?
要回答这个问题,得先搞清楚:世界模型和普通大模型,到底有何不同?
世界模型要"懂物理",什么意思呢。举个例子:你问GPT“把一个杯子从桌子左边推到右边,会发生什么?”,它会用文字描述这个过程。但,如果你问世界模型同样的问题,它要生成一段视频——杯子的轨迹对不对,会不会穿模,掉下去会不会弹一下,这些都得符合物理规律。
这个区别,就决定了两件完全不同的事:
大模型比拼的是“智力”——谁能答对更多题,谁能写出更通顺的文章。
世界模型比拼的是“能不能干活”——机器人看了这段视频,能不能学会把真实的杯子推到正确的位置。
所以世界模型评测,本质上是具身智能的入场券考试。
那具身智能又是什么?就是人形机器人、机械臂这些“有身体的AI”。
所以如今看来,是不是路线分化就清晰了——
美国在比拼“大脑”:让AI更聪明,能做更复杂的推理、写代码、做研究。
中国在比拼“身体+大脑+场景”:让AI能进工厂、能搬箱子、能装上产线真的干活。
这两条路,没有谁对谁错,但时间点非常微妙。
据公开报道,2025年中国人形机器人出货量约1.44万台,占全球总出货量的84.7%。全球前六大人形机器人厂商,五家是中国公司:宇树科技(32.4%)、智元机器人(23.5%)、乐聚、加速进化、优必选。
这组数据意味着什么?意味着当美国还在讨论“具身智能会不会到来”的时候,中国的机器人已经在不止一个工厂里,开始真的搬运东西了。
而根据WorldArena榜单来看,只是把这个差距,用学术打分的方式,正式确认了一遍。
美国的优势究竟在哪?
我们是否在"偏科"?
坦白讲,这个问题比上一个更重要。
因为若只看前半段,可能会得出一个错误结论:“中国AI已经超越美国了。”
其实并非如此。
我查阅了2026年5月LMSYS Chatbot Arena的最新榜单——这是目前公认最权威的大模型真人盲测榜单,结果是:
数据