标签

WPS AI登顶SpreadsheetBench,首超人类专家基准

发布时间:2026-06-19 02:30阅读:1

新浪科技讯 6月18日午后,全球电子表格自动化领域的权威基准SpreadsheetBench发布了最新成绩单,WPS AI表格Agent(Seed 2.0)拿下73.46%的分数,成功问鼎Full 912(全量榜单),位居全球首位。在此次竞争中,它不仅力压Google、Microsoft、OpenAI、Anthropic等国际科技巨头的同类产品,更是首次打破了该榜单设定的人类专家基线(71.33%)。这标志着WPS AI在处理复杂表格任务方面的水平,已经突破了一个至关重要的分水岭。

SpreadsheetBench被公认为业界评估表格AI实战水平的关键标尺,其源自2024年发表在AI顶级会议NeurIPS上的学术研究。该基准测试汇集了912个源自真实Excel论坛的难题,其中42.7%的表格结构非标准,35.7%涉及多表格操作,还包含颜色填充、跨表引用等高难度任务。简而言之,这项测试考察的并非AI是否具备“读取”表格的能力,而是看其能否像人类专家那样,精准理解任务意图并输出结果。论文发布时确立的Excel专家人类基线为71.33%,这也成为了后续评估AI表格能力的重要参考标准。

据了解,此次夺冠的WPS AI(Seed 2.0),是金山办公基于自主研发的表格AI基座Qingqiu Agent构建的业务Agent。早在今年5月,Qingqiu Agent便已在SpreadsheetBench Verified 400(专家精标榜)上以94.75%的优异成绩拔得头筹;而在此次Full 912(全量榜单)的比拼中,它再次夺冠,并首次突破了71.33%的人类专家基准线,成功完成了从底层基座能力到终端产品能力的全链路验证。(文猛)

编辑:宋雅芳

新浪财经声明:本文系转载自合作媒体,新浪财经登载此文旨在传递更多资讯,文章内容仅供参考,不构成任何投资建议。

郑重声明:1.依据《证券法》要求,严禁编造、散布虚假或误导性信息以扰乱证券市场;2.用户在本社区发布的所有资料及言论仅代表个人立场,与本网站无关,不构成任何投资建议。用户应结合独立判断自主决策证券投资并自行承担相应风险。