急诊诊断新突破:OpenAI模型准确率超人类医生
哈佛医学院领衔的一项重磅研究,于 2026 年 4 月 30 日刊载于《Science》杂志,结论显示:OpenAI 的 o1-preview 推理模型在真实急诊场景下的诊断准确率,明显超越了人类医生。
一、研究概览(权威、前沿)
发布:Science(2026-04-30)
机构:哈佛医学院、贝斯以色列女执事医学中心、斯坦福大学
模型:OpenAI o1-preview(2024 年末推出,强推理大语言模型)
对照组:2 位资深急诊主治医师(专家级别)
样本:76 份波士顿医院真实急诊病历(纯文本:主诉、生命体征、护理记录)
场景:急诊早期分诊(信息匮乏、最为关键)
二、核心数据:AI 对比 人类医生
早期分诊(信息稀缺阶段)
AI(o1-preview):67.1% 诊断准确率
人类医生 A:55.3%
人类医生 B:50.0%
→ AI 领先 12–17 个百分点,差异具备统计学显著性
信息补充后(随访阶段)
AI:82%
医生:70–79%
→ 依然领先,但差距缩小、无统计学显著性
经典难题库(NEJM 143 例)
AI:78.3% 正确率
→ 远超传统临床决策软件及普通医师水平
三、AI 为何在急诊更精准?(核心优势)
碎片化信息整合能力极强
急诊病历杂乱、主诉不清、数据缺失。AI 擅长将非结构化文本快速关联、进行概率加权。
无疲劳感、无偏见、无情绪波动
不受夜班、压力、经验盲区、认知偏差的干扰。
知识储备无限
瞬间检索海量指南、罕见病、合并症,人类医生记忆力有限。
“不确定环境” 下更稳健
信息越少、越混乱,AI 的相对优势越显著 ——这正是急诊的痛点。
四、典型案例(AI 助力)
患者:肺栓塞治疗后病情反复恶化
医生:怀疑药物失效
AI 从病历中捕捉到隐匿狼疮病史 → 诊断为狼疮导致的心肌炎
结果:纠正误诊、挽救生命
五、研究明确结论(并非 “取代医生”)
✅ AI ≠ 替代医生,而是高级临床决策辅助工具
✅ 最适用:早期分诊、鉴别诊断、第二意见、防漏诊误诊
✅ 医生仍不可替代:面诊、查体、沟通、伦理、最终决策、操作
✅ 方向:人机协作 → 医生更准、更快、更安全
六、意义与影响
全球首次:在真实急诊、纯文本、盲测、顶级专家对照下证实 LLM 诊断优势
每年美国急诊约 740 万例误诊,AI 可大幅降低
推动全球医院急诊 AI 分诊加速落地
中国也在布局:阿里达摩院 iAorta 等在急诊影像诊断已达国际领先水平
总结:
AI 并非来抢医生饭碗,而是让好医生变得更强、让急诊更安全。