标签

国产大模型强势崛起:开源领域全面领跑

发布时间:2026-03-30 23:55来源:新浪新闻阅读:5

【TechWeb】中文大模型竞争已进入白热化阶段。随着SuperCLUE发布2026年3月最新测评结果,22款国内外顶尖AI模型完成了一场全面能力检验。尽管海外巨头仍占据总分榜前列,但国产模型已实现从追赶者到并跑者的跨越,在多个维度完成反超。

在涵盖数学推理、科学推理、代码生成等六大高难度任务的测试中,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)与OpenAI的GPT-5.4(xhigh)依旧稳居前三,展现强大技术实力。然而,紧随其后的中国模型表现令人瞩目。

字节跳动旗下的豆包大模型以71.53分位居国内首位,跻身全球第一梯队。其总分仅落后第三名GPT-5.4不到1分,标志着国产头部模型已与国际顶尖水平实现实质并跑。尤其在智能体任务规划方面,豆包更是反超部分海外模型,跃居全球前五。

除字节外,小米集团的MiMo-V2系列也强势入榜。其中MiMo-V2-Pro以60.67分位列闭源模型前列,数学推理单项得分高达84.03分,展现深厚推理能力。轻量版MiMo-V2-Flash虽总分略低,但在代码生成等细分场景中表现出色。若闭源赛道是激烈对抗,那么开源赛道则已成为国产模型的“主场”。

测评数据显示,国产开源模型整体表现突出,呈现断层领先优势。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等模型包揽开源榜单前三,大幅领先海外同类产品。

从豆包的全面逼近,到小米的单科突破,再到国产开源阵营集体登顶,SuperCLUE这份3月榜单不仅是成绩展示,更是一份宣言——在全球大模型竞争中,“中国力量”已具备重塑格局的硬核实力。