标签

人工智能时代主流大模型实力分层

“AI模型排名”没有唯一标准。有人按综合智商(benchmark)、有人按编程、有人按中文能力、有人按性价比、还有人按实际用户体验来排。现在行业里更接近真实的做法,是把不同领域拆开看,而不是给一个绝对总榜。下面这份是基于近几个月公开排行榜(Artificial Analysis、LMArena、人类偏好测试、SWE-Bench 等)以及行业实际使用情况整理的“截至目前相对客观的主流模型排名”。(Polylabs)本文收集的信息的排名日期 2026-06-21.趋势:Claude 和 GPT 已经不是像 G

2026-06-23 22:19:53  |  2 阅读