酷阅新闻

AI预测英超实力榜：Claude Opus 4.6表现稳健居首,Grok表现糟糕

发布时间：2026-04-13 18:03阅读：10

冠军Claude Opus 4.6，亏得最少就是赢

在测评过程中，Anthropic研发的Claude Opus 4.6展现出最为稳定的表现。

三次模拟测试平均亏损11.0%，最终平均资金为8.9万英镑（约合人民币81.5万元）。

虽然未能实现盈利，但在所有参与测试的模型中，Claude的亏损幅度最小。

研究团队强调，在该测试环境下，AI整体"系统性落后于人类"。

也就是说，即使是表现最优秀的模型，也远未达到专业人类投注者的水平。

垫底Grok，一次亏光

GPT-5.4稳健，Gemini大起大落

AI在动态环境中的真实能力？

·········· ····· ······ ···············

一个能写诗、能聊天、能讲段子的 AI，不代表它能做好预测和决策。

Grok 在企业级应用方面或许仍有自己的市场。但在体育预测这个领域，它交出了一份令人尴尬的成绩单。

毕竟语言能力与判断能力是两回事。

而对于我们普通用户来说，认清"聊天"和"判断"之间的差距，或许比盲目信任某款模型更重要。

你怎么看？欢迎在评论区留下你的看法。

← 上一篇：AI时代创业新模式：一人公司注册全流程指南下一篇：教育部推进人工智能与教育融合教师资格考试将迎来新变革 →