标签

顶尖AI医学诊断能力遭哈佛实测:误诊率高达八成

哈佛医学院的一个研究团队近期开展了一项颇具挑战性的实验:他们选取了超过二十款当前最前沿的人工智能大语言模型——涵盖ChatGPT、DeepSeek、Google Gemini以及Anthropic Claude——并为这些模型安排了一场医学"入学考核"。考核题目采用单一形式:根据患者的初始症状和体征,进行"鉴别诊断"——即列出患者可能罹患的所有疾病种类。考核成果如何?误诊率:高达80%。诚然,这一数字看起来相当惊人——但有必要深入探究这项研究的实际意义。研究重点测试的是&#

2026-04-16 08:57:33  |  6 阅读