AI阅片系统临床验证重大突破:复旦大学研究团队发布白细胞分类AI与形态学医师对照研究成果
外周血白细胞形态分析在血液疾病及感染性疾病的筛查与辅助诊断中具有关键作用,也是检验医学领域高度依赖经验积累、主观判断较强、重复性工作挑战明显的传统技术方向。传统人工镜检存在耗时费力、易疲劳、结果一致性欠佳等长期困扰,而基于深度学习卷积神经网络(CNN)的血细胞图像高精准识别方法,通过多级多通道卷积核自动提取图像特征,将低阶特征逐步分解升级为高阶特征后进行融合分析,构建细胞类型与多维特征间的对应关联,使CNN网络完成自主学习,显著提升细胞分类性能。这些技术正在为外周血白细胞形态分析带来系统性变革。
2026年4月11日(当地时间),复旦大学附属华山医院关明团队与上海交通大学医学院附属瑞金医院王剑飚合作,在npj Digital Medicine期刊发表题为"Evaluating AI in leukocyte classification: performance of the AI system against 15 morphology experts"的研究论文。该成果为AI辅助外周血细胞分析走向真实诊疗场景提供了重要的循证支持。
研究采用严格的对照设计方案,将国产AI阅片系统与15位临床形态学医师进行平行对比,由3位拥有15至35年经验的资深专家共同建立判读金标准,客观评估AI系统在白细胞分类任务中的实际性能、判读偏好与临床应用潜力。
研究设计与核心方法
该研究共纳入104例外周血涂片,包含19174个有效细胞,覆盖14类白细胞及有核红细胞,其中包括9类临床关键异常细胞,如原始细胞、异常早幼粒细胞、异常淋巴细胞等。样本包括36例体检标本与68例触发复检规则的异常标本,其中36例为急性白血病,4例为骨髓增生异常综合征,7例为骨髓增殖性肿瘤,3例为贫血,2例淋巴瘤,1例浆细胞白血病,1例多发性骨髓瘤,2例慢性白血病,12例为其它疾病。覆盖所有真实临床检验场景。
为确保结果科学、客观、可复现,研究采用标准化对照流程:
1)金标准:3位顶级形态学专家独立判读,意见不一致时按2:1共识确定,组间Kappa=0.98。
2)评估对象:AI形态学分析系统与15位来自全国三甲医院的形态学医师。
核心研究结果
总体性能:AI准确率达95.97%,排名第二,优于14位形态学医师
AI系统整体分类准确率高达95.97%,在全部参与者中位列第二,仅低于1位资深形态学医生。统计学分析证实,人工智能判读效果显著优于14名形态学检验从业人员,其中与1名检验人员的结果差异幅度超过10%。
正常白细胞性能优越:嗜酸性粒细胞识别性能最佳,单核细胞识别难度略大
在6类常见正常白细胞识别中,AI整体准确率98.57%,优于13位形态学检验医生。
▸中性杆状核、中性分叶核粒细胞及淋巴细胞的准确率均超过98%;
通过Grad-CAM与SHAP分析可清晰可视化AI的判读依据,实现识别过程可解释、可追溯。AI能稳定捕捉颗粒、核形等微观特征,减少染色差异、阅片疲劳带来的偏差,一致性更优。
异常细胞:高危细胞识别能力优异,疑难异质细胞仍有局限
针对临床高度关注的9类异常细胞,AI整体准确率91.38%,优于10位形态学检验医生。
▸原始细胞:F1-score=0.979,灵敏度98.38%;
深入分析疑难细胞判读:AI与形态学检验医生策略差异明确
研究进一步发现,AI与人工判读的不一致很多时候并非识别错误,而是判断逻辑存在系统性差异:
▸幼稚粒细胞:形态学医师对交界细胞多判定为偏成熟分期,AI则采取保守判读策略,倾向划分至偏早期阶段,既能规避漏诊风险,也更符合筛查工作的逻辑要求。
▸形态高度相似细胞(反应性淋巴细胞、单核细胞、原始细胞):形态学检验人员内部本身具有显著判读差异。AI以单细胞局部形态特征为主要判读依据;人工形态学诊断则可综合参考全片背景、细胞群体分布及相关临床信息进行整体分析。
这也说明,AI并非简单替代人工,而是在标准化、稳定性上具备优势,未来更适合与形态学检验医生形成互补协作。
临床价值与应用启示
该研究系统对比国产AI形态学分析系统与15位形态学检验医生的细胞识别表现,全面展现AI在外周血细胞分类中的专业能力,清晰揭示当前AI识别的技术特征与规律,深度阐明AI系统的识别偏好,为行业提供了客观、权威的AI应用现状参考,也为后续技术升级指明方向。但AI不是替代形态学医生,而是成为医生的高效、稳定、标准化助手。
▸AI可承担常规涂片的高质量初筛,一致性优于多数人工判读,大幅提升实验室效率。