标签

AI病理新突破:泛癌模型实现33类肿瘤淋巴转移精准识别

发布时间:2026-06-26 06:55阅读:2

AI病理新突破:泛癌模型实现33类肿瘤淋巴转移精准识别

发表刊物:The Lancet Digital Health(柳叶刀子刊,IF=24.1,中科院1区)

上线日期:2026年3月5日(在线首发)

研究团队:Wu S, Hong G, Wang Y, Zeng H, Lin Z, Yang J, Chen J, Chen H, 等;通讯作者:林天歆教授(中山大学孙逸仙纪念医院)

DOI:10.1016/j.landig.2025.100961

PMID:41792018

临床注册号:NCT06517979

一、研究背景

淋巴结转移是评估恶性肿瘤预后极为关键的指标,其精准判定直接关乎肿瘤的病理分期(pTNM分期)及后续辅助治疗策略的规划[1]。然而,传统病理筛查面临一个隐蔽且严峻的临床难题:微小转移灶(直径<2 mm)极易漏诊。在日常高强度的临床作业中,病理医师需对每个淋巴结逐层切片并在镜下细致排查,单次肿瘤根治术标本往往包含数十枚淋巴结,任务极其繁重。在这种超负荷状态下,微小转移灶与孤立肿瘤细胞常被忽略,致使患者实际分期被低估,进而错失最佳辅助治疗时机,殃及远期生存[2]。

近些年,人工智能(AI)于数字病理界屡获突破。2024年,哈佛医学院之CHIEF模型(Nature, 2024)与微软之GigaPATH模型(Nature, 2024)各自印证了AI在泛癌病理诊断及超大尺寸全切片图像解析上的卓越潜能[3,4]。2025年,斯坦福大学之CONCH模型(Nature Medicine, 2024)更是将视觉-语言模型成功引入病理学范畴[5]。纵然如此,上述探索多聚焦于原发灶诊断或生物标志物预测,针对淋巴结转移检测的泛癌种AI模型依旧匮乏——尤其是经前瞻性临床验证的模型更是寥若晨星。

2026年3月5日,中山大学孙逸仙纪念医院林天歆教授团队携手赛维森科技及全国17家医疗中心,于国际顶尖期刊The Lancet Digital Health(IF=24.1)重磅发布一项里程碑式成果——PanCAM(Pan-Cancer Artificial Intelligence Diagnostic Model)[6]。此模型涵盖33类癌种,依托9,256名患者、69,502张全切片图像及153,985枚淋巴结的庞大数据集完成训练与验证,前瞻性敏感度高达0.93-1.00,更额外筛查出4.0%被病理医师漏判的淋巴结转移病例。

二、研究创新点

PanCAM的核心突破涵盖以下五大维度:

1. 首创泛癌种淋巴结转移AI病理模型。 有别于以往仅锚定单一癌种(如乳腺癌前哨淋巴结或结直肠癌区域淋巴结)的AI系统,PanCAM囊括9类常见癌与24类罕见癌,总计33类癌种,达成了真正意义上的"一模型、多癌种"泛化效能[6]。

2. 监督学习叠加增量学习的双轨训练。 PanCAM依托DeepLabv3+语义分割架构与RegNet-Y40编码器,率先借由像素级精细标注开展监督学习,随后运用"模型自发生成软标签→专家审核修正"的增量学习策略循环优化,稳步提升模型于复杂情境下的鲁棒性[6]。

3. 前瞻性多中心临床验证。 异于多数仅做回顾性验证的AI病理探索,PanCAM在9家医院落地了前瞻性真实世界验证(NCT06517979),博取了AI病理模型临床效价的高级别循证[6]。

4. 罕见癌种零样本泛化。 纵然仅凭9类常见癌种数据受训,PanCAM对24类罕见癌的淋巴结转移侦测敏感度仍高达0.98,彰显了非凡的跨癌种泛化本领[6]。

5. 以临床终点为导向的考量。 该研究不仅披露敏感度与特异度等常规指标,更将"额外检出的被漏判转移患者数"设为核心评估终点——回顾性额外揪出120例、前瞻性额外揪出21例,正面回应了病理医师最关切的临床痛点[6]。

三、技术原理

PanCAM的底层架构围绕三大核心模块铺展,打通了从数字病理全切片图像至淋巴结转移诊断的端到端链路:

模块一:全切片图像预处理与组织区域侦测。 每张淋巴结全切片图像(Whole Slide Image, WSI)率先接受组织区域自动甄别,剔除空白背景及伪影干扰。继而,借助滑动窗口把WSI裁切为512×512像素之图像块(patch),充作模型输入单元。此预处理策略保障模型锚定含淋巴结组织的有效区域,免受背景噪声侵扰[6]。

模块二:DeepLabv3+语义分割与RegNet-Y40编码。 PanCAM把DeepLabv3+用作语义分割框架,该架构仰仗其空洞空间金字塔池化(ASPP)模块,得以在多尺度上抓取淋巴结组织内的肿瘤细胞特征。编码器端择定RegNet-Y40,此乃经由网络架构搜索(NAS)雕琢的轻量级卷积神经网络,于维系高准度之际大幅削减算力开销。模型输出为像素级肿瘤区域概率图,可精准勾勒转移灶边界与范畴[6]。

模块三:监督学习与增量学习双轨策略。 训练划为两步。首步:依托病理专家像素级精细标注数据推进监督学习,促使模型构筑初步的肿瘤形态学辨识力。次步:导入增量学习策略——模型向未标注数据派发"软标签"(soft label),再由资深病理专家核验修正,校正后数据重归训练集。此般"AI预标注→专家审核→迭代训练"闭环机制,促使模型在持续吸纳新数据之际不断蜕变,渐次包罗更多罕见癌种与繁杂形态学变体[6]。

训练与验证数据体量。 研究总计纳入源自17家中国医院的9,256名患者,数据集囊括69,502张WSI与153,985枚淋巴结。训练集1,303例,内部验证集558例,外部回顾性验证集6,006例(源自15家外院),前瞻性验证集1,389例(源自9家医院),另附CAMELYON16公开数据集(399张WSI)充作独立外部验证[6]。

四、实验结果

PanCAM在多重维度展露了卓绝表现,以下为关键实验结果的系统汇总:

1. 回顾性验证效能。 于16家医院(含内部验证及15家外院)的回顾性验证里,PanCAM侦测淋巴结转移的敏感度区间为0.97(95% CI: 0.92-0.99)至1.00(0.98-1.00),于CAMELYON16公开数据集上的敏感度为0.96(0.92-0.99)。在患者维度,PanCAM于回顾性验证中额外甄别出120名被常规病理报告遗漏的淋巴结转移患者,占全体转移患者的4.0%[6]。

2. 前瞻性验证效能。 在9家医院的前瞻性真实世界验证中,PanCAM的敏感度区间为0.93(0.78-0.99)至1.00(0.98-1.00),皆胜过常规病理报告。在前瞻性验证期内,PanCAM成功辅助发掘21例常规阅片极难辨识的微小转移灶,平均每位患者仅添13秒审核耗时。此结果径直证实了AI辅助于真实临床工作流中的可行性与增益实效[6]。

3. 罕见癌种泛化本领。 虽PanCAM仅在9类常见癌症(如乳腺癌、肺癌、结直肠癌、胃癌、膀胱癌等)数据上受训,其在24类罕见癌症里的淋巴结转移侦测敏感度仍达0.98(0.95-1.00),在回顾性与前瞻性验证里均发挥平稳。此发现打破了"AI模型必针对各类癌症独立训练"之刻板认知,展露了深度学习模型在病理形态学层面习得的跨癌种通用特征[6]。

4. 与癌种特定模型之比肩。 在膀胱癌数据集中,PanCAM敏感度为0.99、特异度为0.98、阳性预测值0.81;相较之下,专对膀胱癌训练的特定模型(BCa model)敏感度为0.98、特异度为0.94、阳性预测值0.62。泛癌模型在膀胱癌此一特定癌种上反超专设训练的癌种特定模型,印证了多癌种联合训练或可借由共享形态学知识催生正向迁移效应[6]。

5. 亚组剖析。 PanCAM于不同淋巴结尺寸(<5 mm、5-10 mm、>10 mm)、不同肿瘤类别(癌 vs 肉瘤 vs 淋巴瘤)、不同转移灶大小(宏转移 vs 微小转移 vs 孤立肿瘤细胞)的亚组皆维系了平稳的高水准,验明了模型的宽泛适用性[6]。

五、技术优势

1. 泛癌种通用性。 单一模型覆盖33类癌症,免却为每种癌症单独研发与部署AI系统之虞,大幅削减病理科的AI运维成本及操作繁复度[6]。

2. 罕见癌种零样本泛化。 仅凭常见癌症训练即可在罕见癌症中斩获0.98的敏感度,此对罕见肿瘤的病理诊断意义非凡——罕见癌种常因样本稀缺而难于独立训练AI模型[6]。

3. 前瞻性循证支撑。 作为少数达成前瞻性多中心验证的AI病理系统,PanCAM的临床证据层级远超仅仰赖回顾性验证的同侪研究,为临床采信与监管核准筑牢了根基[6]。

4. 无缝衔接现有工作流。 系统可与主流数字病理扫描设备无缝适配,达成"扫描数字化→AI自动剖析→结果预警"的一体化部署,平均每位患者仅增13秒审核耗时,于不添工作负荷之际拔高诊断精度[6]。

5. 以临床价值为锚。 额外揪出4.0%被漏判的转移患者,此指标直指患者能否适时接纳恰当的辅助治疗,比单追AUC拔高更具临床现实意蕴[6]。

六、应用前景

1. 临床病理诊断辅佐。 PanCAM堪当病理医师的"AI第二阅片者",于常规病理报告签发前自动筛查全部淋巴结切片,标注可疑转移区供医师重点复核,切实压降微小转移灶的漏诊率[6]。

2. 基层医院病理赋能。 于病理医师急缺的基层医院与偏远地带,PanCAM可输出媲美三甲医院水准的淋巴结转移筛查力,弥合城乡与区域间的病理诊断鸿沟[6]。

3. 肿瘤精准分期。 精准的淋巴结转移侦测乃践行精准pTNM分期之前提。PanCAM借由压降微小转移灶的漏诊率,裨益更精准测度患者预后及定制个体化辅助治疗方略[6]。

4. 临床试验病理质控。 于抗癌新药临床试验里,淋巴结转移状态系关键的入组门槛与疗效考量准绳。PanCAM可供给标准化、可复现的病理评估,削减多中心试验内的评估者间差异[6]。

5. 病理教学与带教。 PanCAM的像素级肿瘤区域标注可充作病理住院医师规培之教具,襄助年轻病理医师速览淋巴结转移的形态学辨识要诀[6]。

七、研究局限性与未来方向

虽PanCAM博取了耀眼成绩,然尚存如下短板:

1. 地域代表性受限。 训练与验证数据悉数源自中国医疗机构,虽涵纳17家医院多中心数据,却未在欧美、非洲等异族裔与异地域人群中验证。异域的组织处理流程、染色方案及扫描设备或存偏差,模型的跨地域泛化能耐亟待进一步检视[6]。

2. 淋巴结外转移评估缺位。 PanCAM当下仅评判淋巴结内转移,未收揽淋巴管侵犯(LVI)、神经侵犯(PNI)与淋巴结外扩展(ENE)等其余要紧的病理预后指标。日后需拓充模型以覆盖更周全的病理评估维度[6]。

3. 前瞻性验证体量受限。 前瞻性验证队列仅1,389例,虽已覆盖9家医院,样本量仍显单薄。更广规模的前瞻性随机对照试验(RCT)乃验证PanCAM临床获益之必行下一步[6]。

4. 与分子分型之交融。 当前PanCAM仅依凭H&E染色形态学特征下诊,未融合免疫组化(IHC)与分子病理信息。未来若将AI形态学解析与分子分型相融,有望兑现更精准的淋巴结转移评判[6]。

5. 临床落地航向。 从学术探究至临床常规启用,PanCAM仍需闯过医疗器械注册审批、医院信息系统嵌合、医保定级与临床医师培训等多重关卡,商业化落地征途依然挑战重重[6]。

八、结论

PanCAM系首个依托大规模多中心数据孕育的泛癌种淋巴结转移AI病理检测模型,覆盖33类癌症,于回顾性与前瞻性验证中皆展露了超群的诊断敏感度(0.93-1.00)。该模型在真实临床情境中额外揪出4.0%被病理医师漏判的转移患者,且对罕见癌种展露了绝佳的零样本泛化能耐。PanCAM之问世标定了AI病理自"专病专模型"向"泛癌通用模型"的范式跃迁,为全球病理诊断的智能化迭代替立了关键的技术基石与临床循证。伴随更多前瞻性验证之铺展及临床落地路径之推进,PanCAM极有望化身病理科日常作业中缺之不可的AI辅佐利器,终将泽被更广大的肿瘤病患[6]。

参考文献

1. Amin MB, et al. The Eighth Edition AJCC Cancer Staging Manual: Continuing to build a bridge from a population-based to a more "personalized" approach to cancer staging. CA Cancer J Clin. 2017;67(2):93-99. PMID: 28094848.

2. Weaver DL. Pathology evaluation of sentinel lymph nodes in breast cancer: protocol recommendations and rationale. Mod Pathol. 2010;23 Suppl 2:S26-S32. PMID: 20436499.

3. Wang X, et al. A pathology foundation model for cancer diagnosis and prognosis prediction. Nature. 2024;634:970-978. PMID: 39260416.

4. Xu H, et al. A whole-slide foundation model for digital pathology from real-world data. Nature. 2024;630:181-188. PMID: 38778098.

5. Lu MY, et al. A visual-language foundation model for computational pathology. Nat Med. 2024;30(8):2256-2267. PMID: 38886623.

6. Wu S, Hong G, Wang Y, et al. Artificial intelligence-based pathological model for pan-cancer lymph node metastasis detection: a multicentre diagnostic study with retrospective and prospective validation. Lancet Digit Health. 2026;8(3):100961. PMID: 41792018. DOI: 10.1016/j.landig.2025.100961.