AI世界模型中国夺冠，中美发展路径分化明显

发布时间：2026-06-01 16:06阅读：17

剥开迷雾，我们只看核心。我是AI洞见的主理人，一个在科技圈挖掘八卦的观察者。

大模型竞赛已经变得乏味。MMLU、HumanEval、HLE……这些指标每隔几个月就会刷屏，冠军席位轮换，已经没人感到兴奋。然而，最近出现了一个新榜单——WorldArena，让我感到惊讶。

你可能第一次听说这个名字，但它发布的Track 1结果发出了一个强烈的信号：第一名和第二名都是中国的。

第一名是智元机器人的GenieEnvisioner-Sim2.0，68.26分。第二名是考拉悠然的BWM-Fast，67.87分。两个团队，都是中国实体。

坦白讲，单看这个分数，普通人看不出来。68分和67分，差在哪里？

但如果你把这件事，置于过去三年中美AI竞争的背景下，视角就完全改变了。

为什么世界模型赛道，

中国跑得比美国快？

要回答这个问题，得先搞清楚：世界模型和普通大模型，到底有何不同？

世界模型要"懂物理"，什么意思呢。举个例子：你问GPT“把一个杯子从桌子左边推到右边，会发生什么？”，它会用文字描述这个过程。但，如果你问世界模型同样的问题，它要生成一段视频——杯子的轨迹对不对，会不会穿模，掉下去会不会弹一下，这些都得符合物理规律。

这个区别，就决定了两件完全不同的事：

大模型比拼的是“智力”——谁能答对更多题，谁能写出更通顺的文章。

世界模型比拼的是“能不能干活”——机器人看了这段视频，能不能学会把真实的杯子推到正确的位置。

所以世界模型评测，本质上是具身智能的入场券考试。

那具身智能又是什么？就是人形机器人、机械臂这些“有身体的AI”。

所以如今看来，是不是路线分化就清晰了——

美国在比拼“大脑”：让AI更聪明，能做更复杂的推理、写代码、做研究。

中国在比拼“身体+大脑+场景”：让AI能进工厂、能搬箱子、能装上产线真的干活。

这两条路，没有谁对谁错，但时间点非常微妙。

据公开报道，2025年中国人形机器人出货量约1.44万台，占全球总出货量的84.7%。全球前六大人形机器人厂商，五家是中国公司：宇树科技（32.4%）、智元机器人（23.5%）、乐聚、加速进化、优必选。

这组数据意味着什么？意味着当美国还在讨论“具身智能会不会到来”的时候，中国的机器人已经在不止一个工厂里，开始真的搬运东西了。

而根据WorldArena榜单来看，只是把这个差距，用学术打分的方式，正式确认了一遍。

美国的优势究竟在哪？

我们是否在"偏科"？

坦白讲，这个问题比上一个更重要。

因为若只看前半段，可能会得出一个错误结论：“中国AI已经超越美国了。”

其实并非如此。

我查阅了2026年5月LMSYS Chatbot Arena的最新榜单——这是目前公认最权威的大模型真人盲测榜单，结果是：

数据