AI 挑战高考:分数咬紧,短板仍存
AI 也去参加了高考?今年高考结束后,公众号「数字生命卡兹克」组织了 12 款主流 AI 共同应试语文与数学,并邀请教师进行盲评。最终,MiMo 以 256.3 分位居榜首,Kimi 以 256.29 分紧随其后,两者分差仅为 0.01 分。从单科成绩来看,GLM 与 Gemini 在语文科目中并列第一,而 DeepSeek、MiMo 及 ERNIE 则在数学科目中共同夺魁。这一结果既展示了 AI 的强大实力,也揭示了其明显的局限性。在数学方面,AI 善于审题、拆解条件及推导步骤;而在语文方面,特别是作文环节,教师更关注文体规范、结构布局、观点立意及论证逻辑。AI 虽能写出形似文章的内容,却未必能获得高分。量子位此前也对高考数学进行了测试,发现豆包和 ChatGPT 表现稳健,但在压轴题与证明题上仍需人工复核。