标签

人机对决揭晓:15 位检验医师不敌 AI,仅一人突围

发布时间:2026-05-19 17:29来源:微信阅读:5

形态学检验素来被视为检验医学的核心壁垒,是彰显检验医师专业素养的关键所在。

近些年,人工智能在形态学领域突飞猛进,然而其实际临床应用水准究竟距离人类专家还有多远,始终是行业热议的焦点。

日前,由复旦大学附属华山医院关明教授领衔,携手吉林大学第一医院、上海瑞金医院、武汉同济医院、广州南方医院及中山一院等五家顶尖三甲医院,共同完成了一项重磅多中心研究。该成果聚焦 AI 阅片机白细胞分类与细胞形态学医师的对比,已发表于顶级期刊《npj Digital Medicine》(影响因子 15.1)。

这项研究首次让国产 AI 阅片系统与来自全国五家顶级医院的 15 位形态学检验医师展开正面交锋,其结论或将彻底颠覆我们对 AI 能力的既有认知。

形态学人机巅峰对决

战况究竟如何?

本次研究共收录 104 例外周血涂片,涵盖 19174 个有效细胞,涉及 14 类白细胞及有核红细胞。最终金标准由三位拥有 15 至 35 年资历的顶级形态学专家独立研判,遇分歧时按 2:1 原则达成共识而确立。

参与比拼的 15 位检验医师中,含初级职称 4 人、中级 8 人、副高级 1 人及高级 2 人。正式测试前,全员均接受了标准化预培训,涵盖实验流程、细胞分类标准(对标 ICSH 建议及 H20 指南)以及拖放分类界面的操作规范。

1. 综合分类成效

最终数据显示,1 位检验医师精准识别 18710 个细胞,准确率达 97.58%,位居榜首;AI 系统总体准确率为 95.97%(位列第二),而在异常细胞亚群识别上,其准确率为 91.38%(排名第五)。

图 1 15 名检验医师与 AI 系统的分类表现对比

2. 正常白细胞分类表现

在识别中性杆状核、分叶核粒细胞,淋巴、单核、嗜碱及嗜酸性粒细胞等正常白细胞方面,AI 系统表现优于大多数形态学专家。

15 位医师与 AI 系统对 16020 个正常细胞的识别准确率均超九成;其中 AI 系统总体准确率高达 98.57%,胜过其中 13 位专家。

AI 系统对中性杆状核、分叶核、淋巴细胞及嗜酸性粒细胞的识别准确率均突破 98%;尤其在嗜酸性粒细胞识别上表现卓越(准确率 99.65%),超越所有人类专家。但在单核细胞识别上,AI 准确率为 86.75%,与 9 位专家水平相当(均低于 90%)。

3. 异常细胞分类表现

针对晚幼粒、中幼粒、早幼粒、原始细胞、反应性淋巴、浆细胞、异常淋巴、异常早幼粒及有核红细胞等 9 类临床相关异常细胞,AI 系统识别准确率达 91.38%,优于 10 位医师,检出率为 92.74%。

其中表现亮眼的包括有核红细胞(准确率 96.76%)、原始细胞(90.63%)以及异常早幼粒细胞(94.65%,这对急性早幼粒细胞白血病的快筛与早诊具有关键临床意义)。

然而在反应性淋巴细胞(55.56%)、异常淋巴细胞(68.67%)及浆细胞(56.44%)等高异质性细胞类型上,AI 表现略显逊色。

这场人机较量

到底谁才是赢家?

事实上,此项研究的核心价值并非简单的胜负定论,而是深刻揭示了 AI 与检验医师在分类逻辑上的本质分野。

1. “保守派”对阵“激进派”

研究显示,AI 在形态分类中更像“保守派”,倾向将临界细胞归为更早期的发育阶段。例如,将介于早幼粒与中幼粒之间的细胞判为早幼粒。

相比之下,检验医师则是相对的“激进派”,更倾向于将临界细胞归为较晚的发育阶段。同样的临界细胞,医师更可能判定为中幼粒细胞。

这种“宁早勿晚”的策略虽带来更高的灵敏度与假阳性,却也意味着极低的漏诊率,显然更契合临床高质量初筛的需求。

2. “单细胞思维”对比“全局思维”

更为关键的是,本研究点明了 AI 与人类医师的核心差距:AI 仅具备“单细胞思维”,仅凭单个细胞的形态特征做判断;而检验医师拥有“全局思维”,能结合全片背景、细胞群体分布及临床信息进行综合评估。

这也解释了为何在单核细胞、反应性淋巴细胞及原始细胞等形态相似的类型上,AI 与人类结果差异显著,因为资深医师会依据整张涂片的细胞谱系做出更精准的判断。

这也启示我们,AI 对检验人而言绝非简单的替代,而是催生新的协作模式:AI+ 人工协同。即由 AI 进行预分类并预警异常,再由检验医师审核确认。

我们也应清醒认识到,检验医师的成长路径正被 AI 重塑。过去培养一名优秀专家需数十年经验积累,而 AI 及其背后海量标准化图像库,不仅打破了学习资源的局限,更大幅提升了检验人的自我进阶效率。

我们坚信,夯实基础,将重复劳动交付 AI,让人类精力聚焦于真正需要的诊断决策,检验人迎来的绝非职业消亡,而是职业新生。