百川M4_标签-酷阅新闻

百川M4登顶HealthBench，AI问诊能力首次超越GPT

百川M4问鼎HealthBench：当AI不再局限于答题，而是学会了“问诊” 我上周看到一则新闻，差点笑喷——百川智能携手清华推出的Baichuan-M4，在OpenAI主导的医疗基准HealthBench上，包揽三个子榜的冠军，完胜GPT-5.5与Claude Opus 4.7。诚然，“第一”在国内AI界屡见不鲜，但此次数据颇为亮眼：综合分68.6，甩开GPT-5.5近10分；在最具挑战性的Hard子榜中，优势更是拉大到15.9分。这绝非小胜，而是绝对压制。值得注意的是其幻觉率仅3.3%，对比之下G

2026-06-24 12:15:52 | 2 阅读