百川M4登顶HealthBench,AI问诊能力首次超越GPT
百川M4问鼎HealthBench:当AI不再局限于答题,而是学会了“问诊” 我上周看到一则新闻,差点笑喷——百川智能携手清华推出的Baichuan-M4,在OpenAI主导的医疗基准HealthBench上,包揽三个子榜的冠军,完胜GPT-5.5与Claude Opus 4.7。 诚然,“第一”在国内AI界屡见不鲜,但此次数据颇为亮眼:综合分68.6,甩开GPT-5.5近10分;在最具挑战性的Hard子榜中,优势更是拉大到15.9分。这绝非小胜,而是绝对压制。 值得注意的是其幻觉率仅3.3%,对比之下G