AI世界杯热议 | “12个AI预测世界杯,中国技术融入真实赛场”
世界杯小组赛第二轮已经打响。当中国AI走出代码、嵌入真实的赛事观赛与竞猜场景,技术与足球的碰撞才刚刚开始。
北京时间18日,2026年FIFA世界杯小组赛首轮正式收官。
48支球队完成首秀,冷门与经典并存。而赛场之外,联想集团与咪咕共同发起的“世界杯预测人机大战”,也交出了第一轮成绩单。
这是一场全民可参与的预测玩法。“人机大战”覆盖全部104场比赛,无论懂球与否,人人都能一键站队——因为足球最动人的部分,恰恰是它的不可预知。开赛以来,24场竞猜累计吸引超千万人次参与,一些焦点对决,单场参与量就能突破50万,将这场全民竞猜的热度推向新高。
这也是国内12家主流AI首次在同一预测场景中同台亮相。联想集团依托自身AI生态链的号召力,由旗下天禧AI召集DeepSeek、百度文心、千问、Kimi、智谱、MiniMax、中移九天等国内12大主流AI,与数千万人类玩家一起,逐场交出各自的判断,再由比赛结果逐场验证。
首轮24场之后,12大AI一共给出288次胜平负预测,合计命中141次,整体命中率约49%,而人类玩家为45%。 AI暂时领先,但只领先约4个百分点——这个差距比一次门线悬案还窄,随时可能被翻转。
首轮20场,AI一直被人类玩家压制,最后一天4场比赛后,AI首次反超。目前,12大AI整体命中率约49%,而人类玩家为45%, AI暂时领先。
AI们也在预测中暴露出集体特征:在15场分出胜负的比赛中,12大AI命中率高达76.7%,德国7:1库拉索、阿根廷3:0阿尔及利亚,几乎全部猜中。但在9场平局中,108次预测只命中3次,命中率仅2.8%。模型们很会分辨强弱,却几乎不会说“这场可能没有赢家”。
在6场亚洲球队参与且保持不败的比赛里,12大AI只命中5次。韩国胜捷克、澳大利亚胜土耳其、荷兰平日本——AI几乎集体失语。它们是在分析比赛,还是在复读一套旧有的强弱秩序?而不同模型在冷门和平局面前展现出的截然不同的“决策性格”,比最终谁多猜中一场更值得细看。
但这场“人机大战”的价值,不在于证明AI到底能不能预测足球比赛。更重要的是,它让AI走出了代码和评测的世界,走进一个所有人都看得懂的场景。
对联想集团而言,发起这场人机大战,也是我们想回答的一个问题:AI该怎样进入普通人的生活?不靠参数,不靠话术,而是让AI的能力和局限同时被看见。当数千万人一同走进竞猜,当赛前查看AI怎么选成为一种新习惯,世界杯的观赛体验已然迥异。
接下来的比赛只会更难。小组赛第二轮积分压力介入,第三轮出现轮换和净胜球博弈,淘汰赛的核心问题变成“谁更怕输”。AI们的决策性格会在更大的压力下继续分化,人机之间的差距也可能随时逆转。
让AI进入世界杯比赛和观赛场景,可被视为一个技术发展的 “分水岭”:技术再强,只有被普通用户看懂、用上,才算真正落地。所以,“人机大战”在娱乐价值之外,还是AI厂商的产品试验,也是行业观察中国AI发展的真实窗口。
6月15日,21世纪经济报道以《12个AI猜世界杯,中国技术进入真实赛》为题,将这场实验视为观察中国AI从“技术突破”走向“场景渗透”的关键样本。如文中所言:“世界杯给了AI一个巨大舞台,也给中国科技企业一次重新定义自身角色的机会,不只是赞助商,也不只是设备供应商,而是全球性赛事技术系统的一部分。”
21世纪经济报道以《12个AI猜世界杯,中国技术进入真实赛》为题,聚焦世界杯作为AI“试炼场”的科技演进,并揭示人工智能正如何重塑这项顶级赛事的运行逻辑。
以下为报道全文
《12个AI猜世界杯,中国技术进入真实赛》
AI大模型涌入世界杯预测赛道,已经不再是一种偶发的品牌借势,而变成了一场围绕技术验证、用户注意力与产业话语权的集体行动。
近日,联想集团一次性调用了12个AI,启动“世界杯预测人机大战”,并向民间寻找“AI预言家”。而在三天前,Kimi率先高调宣布将调度300个子Agent,对全部104场赛事进行公开预测,千问、DeepSeek、豆包、文心一言等紧随其后,纷纷亮出自己的冠军预测。
这是一次实打实的AI应用压力测试。过去几年,AI厂商习惯用参数、榜单、写作、编程来展示能力。进入2026年,竞争重心开始转向更具体的应用场景。能否把模型能力变成普通用户看得懂、愿意用、还能反复参与的产品,正在成为新的分水岭。
世界杯成AI试炼场
世界杯预测不是新鲜事。2010年南非世界杯,“章鱼保罗”曾经成为全球话题;此后每届大赛,数据模型、博彩公司、民间高手都会下场竞猜。不同之处在于,今年的参与者换成了大模型和智能体。
联想这次设计了三层机制:
●第一层是全民参与,用户可以预测单场胜平负、比分以及后续冠军路径;
●第二层是AI同台对比,12个AI面对同一场比赛给出判断,球迷可以看到模型之间的分歧;
联想集团旗下天禧AI召集DeepSeek、百度文心、千问、Kimi、智谱、MiniMax、中移九天等国内12大主流AI,与数千万人类玩家同台竞猜。
●第三层是内容化复盘,咪咕视频的直播节目会把预测变成一档连续节目,每场比赛之后公布准确率排行榜,并复盘AI和人类各自错在哪里。
足球比赛对AI来说并不好预测。它既有可量化部分,比如球队排名、历史战绩、球员状态、赔率变化和伤病信息,也有难以完全建模的部分,比如临场情绪、战术执行、裁判尺度和偶然事件。
AI如果只给出一个胜负结论,很容易变成另一种“玄学”;但如果它能解释数据