AI在医疗诊断中表现优异但推理能力仍存短板
“智网文摘”是智网互联实验室的中拉科技互鉴品牌项目之一。通过精选编译西葡语媒体科技板块的文章,让中文读者能够了解拉美与加勒比海地区对科技的关注点和相关动态。欢迎联系智网互联实验室,向本项目推荐内容和提供意见建议。尽管用于医疗服务的人工智能(inteligencia artificial,IA)聊天机器人在掌握完整临床信息时,通常能够作出正确诊断,但当它们面对信息不足的情况,或需要进行鉴别诊断时,仍然表现出明显缺陷。根据本周一发表于《JAMA网络开放获取》(JAMA Network Open)的一项研究,这
顶尖AI医学诊断能力遭哈佛实测:误诊率高达八成
哈佛医学院的一个研究团队近期开展了一项颇具挑战性的实验:他们选取了超过二十款当前最前沿的人工智能大语言模型——涵盖ChatGPT、DeepSeek、Google Gemini以及Anthropic Claude——并为这些模型安排了一场医学"入学考核"。考核题目采用单一形式:根据患者的初始症状和体征,进行"鉴别诊断"——即列出患者可能罹患的所有疾病种类。考核成果如何?误诊率:高达80%。诚然,这一数字看起来相当惊人——但有必要深入探究这项研究的实际意义。研究重点测试的是
生成式AI临床应用能力仍存局限
尽管人工智能(AI)在医疗健康领域的运用愈发普遍,但其“仿效医师思维”的本领仍有显著缺陷。美国麻省总医院MESH孵化器团队开展的最新研究表明,生成式AI在临床推断的关键步骤仍显薄弱,尚无法独立承担临床诊疗工作。研究成果刊登在最新一期《JAMA Network Open》上。 团队选取包括ChatGPT、DeepSeek、Claude、Gemini和Grok在内的21种大语言模型,在29个已公开的临床病例中进行测评,并通过逐步给予患者信息(从基础症状到实验室及影像学结果)来复现真实诊疗流程。结果显示,当获取