LMAr_标签-酷阅新闻

人工智能时代主流大模型实力分层

“AI模型排名”没有唯一标准。有人按综合智商（benchmark）、有人按编程、有人按中文能力、有人按性价比、还有人按实际用户体验来排。现在行业里更接近真实的做法，是把不同领域拆开看，而不是给一个绝对总榜。下面这份是基于近几个月公开排行榜（Artificial Analysis、LMArena、人类偏好测试、SWE-Bench 等）以及行业实际使用情况整理的“截至目前相对客观的主流模型排名”。(Polylabs)本文收集的信息的排名日期 2026-06-21.趋势：Claude 和 GPT 已经不是像 G

2026-06-23 22:19:53 | 2 阅读