世界杯预测AI从1/48到45/48的惊天逆转
6月17日,世界杯又把“预测”这件事翻了一面。
就在前一天,联想集团与咪咕视频联合发起的“世界杯预测人机大战”刚刚经历开赛以来最惨烈的一段:西班牙0-0佛得角、比利时1-1埃及、沙特1-1乌拉圭、伊朗2-2新西兰,连续四场平局让12大AI几乎集体失准,48次方向判断中只命中1次。
但一天之后,剧本突然反转。
法国3-1塞内加尔,挪威4-1伊拉克,阿根廷3-0阿尔及利亚,奥地利3-1约旦。四场比赛,12大AI合计48次预测命中45次,单日方向命中率达到93.75%。其中,阿根廷和奥地利两场均为12/12全中,法国一战11/12命中,挪威一战10/12命中。
从1/48到45/48,只隔了一个比赛日。
这可能是“世界杯预测人机大战”20场以来最有解释力的一组数据:AI不是稳定地“准”或“不准”,它的表现会随着比赛类型剧烈变化。当强弱关系清晰、比赛按照实力展开时,AI出错概率极小;当足球进入平局、冷门、临场波动和情绪变量主导的时刻,AI又会迅速失去把握。
6月17日的四场比赛,几乎都是AI更熟悉的题型。
法国赢下塞内加尔,是强队兑现;阿根廷3-0阿尔及利亚,是实力差距足够清晰后的顺势判断;奥地利面对队史首次参加世界杯的约旦,虽然一度被扳平,但最终仍凭借经验和阵容厚度重新掌控比赛;挪威4-1伊拉克,则更像是一次巨星变量对比赛秩序的直接重写。
哈兰德等这一刻等了很久。挪威上一次参加世界杯还是1998年,时隔28年重返世界杯,他用两个进球把等待变成了现实。第29分钟铲射破门,第43分钟补射梅开二度,随后又参与制造进球。对伊拉克来说,这是40年后重回世界杯的第一战,艾曼·侯赛因的进球一度点燃希望,但最终还是被挪威的个人能力和冲击力击穿。
这场比赛也终结了本届世界杯亚洲球队此前的不败走势。此前韩国、卡塔尔、澳大利亚、日本、沙特、伊朗打出2胜4平的不败开局,伊拉克没能继续把这条线延长下去。对AI而言,这同样是一场“可理解”的比赛:强队、核心球星、实力差距、比赛走势,几乎都指向同一个方向。
约旦则留下了属于自己的历史。第50分钟,乌勒万打进扳平一球,这是约旦足球在世界杯正赛中的第一粒进球。对于一支首次站上世界杯舞台的球队来说,这粒进球的意义远超过比分本身。但温情瞬间没有彻底改变比赛逻辑,奥地利最终3-1取胜,12大AI也全部命中方向。
这可能是6月17日的共同特征:比赛可以有动人的支线,但最终结果大多仍服从实力结构。
而此前连续四场平局,恰好是另一面。西班牙被佛得角逼平,比利时战平埃及,乌拉圭没能拿下沙特,伊朗与新西兰打成2-2。那些比赛里,名气、纸面实力、历史战绩并没有转化成最终胜利。AI更愿意给出一个胜者,也更擅长在强弱关系中做排序,但当比赛走向“双方都赢不了”的局面,它就会明显失灵。
所以,20场之后,人机大战真正揭开的并不是“哪个AI最懂球”,而是AI预测足球时的能力边界:它擅长判断确定性,却不擅长处理不确定性;它熟悉强队逻辑,却容易低估平局和冷门;它能在概率清晰的时候显得很聪明,也会在足球最不可控的部分集体翻车。
榜单也在这种波动中重新分层。
截至20场,百度文心以11/20、55.0%的命中率继续领跑,是目前唯一突破55%的模型。联想天禧AI、中移九天、腾讯混元同为10/20,命中率50.0%,站上第一梯队。MiniMax、DeepSeek、通义千问、智谱、商汤小浣熊均为9/20,命中率45.0%。Kimi、讯飞星火为8/20,阶跃星辰则以6/20暂列末位。
对联想天禧AI来说,50.0%是一个重要节点。此前经历“平局泥潭”后,天禧AI一度被拉低至37.5%,如今重新回到第一梯队,也说明这场人机大战的排名并不会线性变化。世界杯每一个比赛日,都可能改变榜单结构。
更重要的是,20场之后,第一名与第二梯队之间只差一场。AI阵营还没有跑出真正的“懂球王”。
6月17日,世界杯回到了AI熟悉的节奏。强队赢球,概率兑现,模型集体回血。但这并不意味着AI已经重新掌控了世界杯。上一个“AI全对日”之后,紧接着就是连续平局带来的集体翻车。足球从来不会只写一种剧本。
这也是“世界杯预测人机大战”的价值所在:它不只是展示AI猜对了多少场,更是在104场比赛的持续样本里,把AI擅长什么、不擅长什么,一场一场摊开给所有人看。
20场之后,一个阶段性结论已经出现:当世界杯按照实力运行,AI会显得非常聪明。当世界杯回到足球本身,AI依然会被冷门和平局教育。
明天,剧本会站在哪一边?
打开联想天禧AI及咪咕视频APP,参与世界杯预测人机大战——站在AI一边,或者站在AI的对面,选择权在你。
本文为“世界杯预测人机大战”滚动播报,由新浪财经联合联想集团、咪咕视频共同呈现。