标签

急诊诊断新突破:OpenAI模型准确率超人类医生

发布时间:2026-05-02 10:43来源:微信阅读:6

哈佛医学院领衔的一项重磅研究,于 2026 年 4 月 30 日刊载于《Science》杂志,结论显示:OpenAI 的 o1-preview 推理模型在真实急诊场景下的诊断准确率,明显超越了人类医生。

一、研究概览(权威、前沿)

发布:Science(2026-04-30)

机构:哈佛医学院、贝斯以色列女执事医学中心、斯坦福大学

模型:OpenAI o1-preview(2024 年末推出,强推理大语言模型)

对照组:2 位资深急诊主治医师(专家级别)

样本:76 份波士顿医院真实急诊病历(纯文本:主诉、生命体征、护理记录)

场景:急诊早期分诊(信息匮乏、最为关键)

二、核心数据:AI 对比 人类医生

早期分诊(信息稀缺阶段)

AI(o1-preview):67.1% 诊断准确率

人类医生 A:55.3%

人类医生 B:50.0%

→ AI 领先 12–17 个百分点,差异具备统计学显著性

信息补充后(随访阶段)

AI:82%

医生:70–79%

→ 依然领先,但差距缩小、无统计学显著性

经典难题库(NEJM 143 例)

AI:78.3% 正确率

→ 远超传统临床决策软件及普通医师水平

三、AI 为何在急诊更精准?(核心优势)

碎片化信息整合能力极强

急诊病历杂乱、主诉不清、数据缺失。AI 擅长将非结构化文本快速关联、进行概率加权。

无疲劳感、无偏见、无情绪波动

不受夜班、压力、经验盲区、认知偏差的干扰。

知识储备无限

瞬间检索海量指南、罕见病、合并症,人类医生记忆力有限。

“不确定环境” 下更稳健

信息越少、越混乱,AI 的相对优势越显著 ——这正是急诊的痛点。

四、典型案例(AI 助力)

患者:肺栓塞治疗后病情反复恶化

医生:怀疑药物失效

AI 从病历中捕捉到隐匿狼疮病史 → 诊断为狼疮导致的心肌炎

结果:纠正误诊、挽救生命

五、研究明确结论(并非 “取代医生”)

✅ AI ≠ 替代医生,而是高级临床决策辅助工具

✅ 最适用:早期分诊、鉴别诊断、第二意见、防漏诊误诊

✅ 医生仍不可替代:面诊、查体、沟通、伦理、最终决策、操作

✅ 方向:人机协作 → 医生更准、更快、更安全

六、意义与影响

全球首次:在真实急诊、纯文本、盲测、顶级专家对照下证实 LLM 诊断优势

每年美国急诊约 740 万例误诊,AI 可大幅降低

推动全球医院急诊 AI 分诊加速落地

中国也在布局:阿里达摩院 iAorta 等在急诊影像诊断已达国际领先水平

总结:

AI 并非来抢医生饭碗,而是让好医生变得更强、让急诊更安全。