AI病理新突破：泛癌模型实现33类肿瘤淋巴转移精准识别

发布时间：2026-06-26 06:55阅读：2

发表刊物：The Lancet Digital Health（柳叶刀子刊，IF=24.1，中科院1区）

上线日期：2026年3月5日（在线首发）

研究团队：Wu S, Hong G, Wang Y, Zeng H, Lin Z, Yang J, Chen J, Chen H, 等；通讯作者：林天歆教授（中山大学孙逸仙纪念医院）

DOI：10.1016/j.landig.2025.100961

PMID：41792018

临床注册号：NCT06517979

一、研究背景

淋巴结转移是评估恶性肿瘤预后极为关键的指标，其精准判定直接关乎肿瘤的病理分期（pTNM分期）及后续辅助治疗策略的规划[1]。然而，传统病理筛查面临一个隐蔽且严峻的临床难题：微小转移灶（直径<2 mm）极易漏诊。在日常高强度的临床作业中，病理医师需对每个淋巴结逐层切片并在镜下细致排查，单次肿瘤根治术标本往往包含数十枚淋巴结，任务极其繁重。在这种超负荷状态下，微小转移灶与孤立肿瘤细胞常被忽略，致使患者实际分期被低估，进而错失最佳辅助治疗时机，殃及远期生存[2]。

近些年，人工智能（AI）于数字病理界屡获突破。2024年，哈佛医学院之CHIEF模型（Nature, 2024）与微软之GigaPATH模型（Nature, 2024）各自印证了AI在泛癌病理诊断及超大尺寸全切片图像解析上的卓越潜能[3,4]。2025年，斯坦福大学之CONCH模型（Nature Medicine, 2024）更是将视觉-语言模型成功引入病理学范畴[5]。纵然如此，上述探索多聚焦于原发灶诊断或生物标志物预测，针对淋巴结转移检测的泛癌种AI模型依旧匮乏——尤其是经前瞻性临床验证的模型更是寥若晨星。

2026年3月5日，中山大学孙逸仙纪念医院林天歆教授团队携手赛维森科技及全国17家医疗中心，于国际顶尖期刊The Lancet Digital Health（IF=24.1）重磅发布一项里程碑式成果——PanCAM（Pan-Cancer Artificial Intelligence Diagnostic Model）[6]。此模型涵盖33类癌种，依托9,256名患者、69,502张全切片图像及153,985枚淋巴结的庞大数据集完成训练与验证，前瞻性敏感度高达0.93-1.00，更额外筛查出4.0%被病理医师漏判的淋巴结转移病例。

二、研究创新点

PanCAM的核心突破涵盖以下五大维度：

1. 首创泛癌种淋巴结转移AI病理模型。有别于以往仅锚定单一癌种（如乳腺癌前哨淋巴结或结直肠癌区域淋巴结）的AI系统，PanCAM囊括9类常见癌与24类罕见癌，总计33类癌种，达成了真正意义上的"一模型、多癌种"泛化效能[6]。

2. 监督学习叠加增量学习的双轨训练。 PanCAM依托DeepLabv3+语义分割架构与RegNet-Y40编码器，率先借由像素级精细标注开展监督学习，随后运用"模型自发生成软标签→专家审核修正"的增量学习策略循环优化，稳步提升模型于复杂情境下的鲁棒性[6]。

3. 前瞻性多中心临床验证。异于多数仅做回顾性验证的AI病理探索，PanCAM在9家医院落地了前瞻性真实世界验证（NCT06517979），博取了AI病理模型临床效价的高级别循证[6]。

4. 罕见癌种零样本泛化。纵然仅凭9类常见癌种数据受训，PanCAM对24类罕见癌的淋巴结转移侦测敏感度仍高达0.98，彰显了非凡的跨癌种泛化本领[6]。

5. 以临床终点为导向的考量。该研究不仅披露敏感度与特异度等常规指标，更将"额外检出的被漏判转移患者数"设为核心评估终点——回顾性额外揪出120例、前瞻性额外揪出21例，正面回应了病理医师最关切的临床痛点[6]。

三、技术原理

PanCAM的底层架构围绕三大核心模块铺展，打通了从数字病理全切片图像至淋巴结转移诊断的端到端链路：

模块一：全切片图像预处理与组织区域侦测。每张淋巴结全切片图像（Whole Slide Image, WSI）率先接受组织区域自动甄别，剔除空白背景及伪影干扰。继而，借助滑动窗口把WSI裁切为512×512像素之图像块（patch），充作模型输入单元。此预处理策略保障模型锚定含淋巴结组织的有效区域，免受背景噪声侵扰[6]。

模块二：DeepLabv3+语义分割与RegNet-Y40编码。 PanCAM把DeepLabv3+用作语义分割框架，该架构仰仗其空洞空间金字塔池化（ASPP）模块，得以在多尺度上抓取淋巴结组织内的肿瘤细胞特征。编码器端择定RegNet-Y40，此乃经由网络架构搜索（NAS）雕琢的轻量级卷积神经网络，于维系高准度之际大幅削减算力开销。模型输出为像素级肿瘤区域概率图，可精准勾勒转移灶边界与范畴[6]。

模块三：监督学习与增量学习双轨策略。训练划为两步。首步：依托病理专家像素级精细标注数据推进监督学习，促使模型构筑初步的肿瘤形态学辨识力。次步：导入增量学习策略——模型向未标注数据派发"软标签"（soft label），再由资深病理专家核验修正，校正后数据重归训练集。此般"AI预标注→专家审核→迭代训练"闭环机制，促使模型在持续吸纳新数据之际不断蜕变，渐次包罗更多罕见癌种与繁杂形态学变体[6]。

训练与验证数据体量。研究总计纳入源自17家中国医院的9,256名患者，数据集囊括69,502张WSI与153,985枚淋巴结。训练集1,303例，内部验证集558例，外部回顾性验证集6,006例（源自15家外院），前瞻性验证集1,389例（源自9家医院），另附CAMELYON16公开数据集（399张WSI）充作独立外部验证[6]。

四、实验结果

PanCAM在多重维度展露了卓绝表现，以下为关键实验结果的系统汇总：

1. 回顾性验证效能。于16家医院（含内部验证及15家外院）的回顾性验证里，PanCAM侦测淋巴结转移的敏感度区间为0.97（95% CI: 0.92-0.99）至1.00（0.98-1.00），于CAMELYON16公开数据集上的敏感度为0.96（0.92-0.99）。在患者维度，PanCAM于回顾性验证中额外甄别出120名被常规病理报告遗漏的淋巴结转移患者，占全体转移患者的4.0%[6]。

2. 前瞻性验证效能。在9家医院的前瞻性真实世界验证中，PanCAM的敏感度区间为0.93（0.78-0.99）至1.00（0.98-1.00），皆胜过常规病理报告。在前瞻性验证期内，PanCAM成功辅助发掘21例常规阅片极难辨识的微小转移灶，平均每位患者仅添13秒审核耗时。此结果径直证实了AI辅助于真实临床工作流中的可行性与增益实效[6]。

3. 罕见癌种泛化本领。虽PanCAM仅在9类常见癌症（如乳腺癌、肺癌、结直肠癌、胃癌、膀胱癌等）数据上受训，其在24类罕见癌症里的淋巴结转移侦测敏感度仍达0.98（0.95-1.00），在回顾性与前瞻性验证里均发挥平稳。此发现打破了"AI模型必针对各类癌症独立训练"之刻板认知，展露了深度学习模型在病理形态学层面习得的跨癌种通用特征[6]。

4. 与癌种特定模型之比肩。在膀胱癌数据集中，PanCAM敏感度为0.99、特异度为0.98、阳性预测值0.81；相较之下，专对膀胱癌训练的特定模型（BCa model）敏感度为0.98、特异度为0.94、阳性预测值0.62。泛癌模型在膀胱癌此一特定癌种上反超专设训练的癌种特定模型，印证了多癌种联合训练或可借由共享形态学知识催生正向迁移效应[6]。

5. 亚组剖析。 PanCAM于不同淋巴结尺寸（<5 mm、5-10 mm、>10 mm）、不同肿瘤类别（癌 vs 肉瘤 vs 淋巴瘤）、不同转移灶大小（宏转移 vs 微小转移 vs 孤立肿瘤细胞）的亚组皆维系了平稳的高水准，验明了模型的宽泛适用性[6]。

五、技术优势

1. 泛癌种通用性。单一模型覆盖33类癌症，免却为每种癌症单独研发与部署AI系统之虞，大幅削减病理科的AI运维成本及操作繁复度[6]。

2. 罕见癌种零样本泛化。仅凭常见癌症训练即可在罕见癌症中斩获0.98的敏感度，此对罕见肿瘤的病理诊断意义非凡——罕见癌种常因样本稀缺而难于独立训练AI模型[6]。

3. 前瞻性循证支撑。作为少数达成前瞻性多中心验证的AI病理系统，PanCAM的临床证据层级远超仅仰赖回顾性验证的同侪研究，为临床采信与监管核准筑牢了根基[6]。

4. 无缝衔接现有工作流。系统可与主流数字病理扫描设备无缝适配，达成"扫描数字化→AI自动剖析→结果预警"的一体化部署，平均每位患者仅增13秒审核耗时，于不添工作负荷之际拔高诊断精度[6]。

5. 以临床价值为锚。额外揪出4.0%被漏判的转移患者，此指标直指患者能否适时接纳恰当的辅助治疗，比单追AUC拔高更具临床现实意蕴[6]。

六、应用前景

1. 临床病理诊断辅佐。 PanCAM堪当病理医师的"AI第二阅片者"，于常规病理报告签发前自动筛查全部淋巴结切片，标注可疑转移区供医师重点复核，切实压降微小转移灶的漏诊率[6]。

2. 基层医院病理赋能。于病理医师急缺的基层医院与偏远地带，PanCAM可输出媲美三甲医院水准的淋巴结转移筛查力，弥合城乡与区域间的病理诊断鸿沟[6]。

3. 肿瘤精准分期。精准的淋巴结转移侦测乃践行精准pTNM分期之前提。PanCAM借由压降微小转移灶的漏诊率，裨益更精准测度患者预后及定制个体化辅助治疗方略[6]。

4. 临床试验病理质控。于抗癌新药临床试验里，淋巴结转移状态系关键的入组门槛与疗效考量准绳。PanCAM可供给标准化、可复现的病理评估，削减多中心试验内的评估者间差异[6]。

5. 病理教学与带教。 PanCAM的像素级肿瘤区域标注可充作病理住院医师规培之教具，襄助年轻病理医师速览淋巴结转移的形态学辨识要诀[6]。

七、研究局限性与未来方向

虽PanCAM博取了耀眼成绩，然尚存如下短板：

1. 地域代表性受限。训练与验证数据悉数源自中国医疗机构，虽涵纳17家医院多中心数据，却未在欧美、非洲等异族裔与异地域人群中验证。异域的组织处理流程、染色方案及扫描设备或存偏差，模型的跨地域泛化能耐亟待进一步检视[6]。

2. 淋巴结外转移评估缺位。 PanCAM当下仅评判淋巴结内转移，未收揽淋巴管侵犯（LVI）、神经侵犯（PNI）与淋巴结外扩展（ENE）等其余要紧的病理预后指标。日后需拓充模型以覆盖更周全的病理评估维度[6]。

3. 前瞻性验证体量受限。前瞻性验证队列仅1,389例，虽已覆盖9家医院，样本量仍显单薄。更广规模的前瞻性随机对照试验（RCT）乃验证PanCAM临床获益之必行下一步[6]。

4. 与分子分型之交融。当前PanCAM仅依凭H&E染色形态学特征下诊，未融合免疫组化（IHC）与分子病理信息。未来若将AI形态学解析与分子分型相融，有望兑现更精准的淋巴结转移评判[6]。

5. 临床落地航向。从学术探究至临床常规启用，PanCAM仍需闯过医疗器械注册审批、医院信息系统嵌合、医保定级与临床医师培训等多重关卡，商业化落地征途依然挑战重重[6]。

八、结论

PanCAM系首个依托大规模多中心数据孕育的泛癌种淋巴结转移AI病理检测模型，覆盖33类癌症，于回顾性与前瞻性验证中皆展露了超群的诊断敏感度（0.93-1.00）。该模型在真实临床情境中额外揪出4.0%被病理医师漏判的转移患者，且对罕见癌种展露了绝佳的零样本泛化能耐。PanCAM之问世标定了AI病理自"专病专模型"向"泛癌通用模型"的范式跃迁，为全球病理诊断的智能化迭代替立了关键的技术基石与临床循证。伴随更多前瞻性验证之铺展及临床落地路径之推进，PanCAM极有望化身病理科日常作业中缺之不可的AI辅佐利器，终将泽被更广大的肿瘤病患[6]。

参考文献

1. Amin MB, et al. The Eighth Edition AJCC Cancer Staging Manual: Continuing to build a bridge from a population-based to a more "personalized" approach to cancer staging. CA Cancer J Clin. 2017;67(2):93-99. PMID: 28094848.

2. Weaver DL. Pathology evaluation of sentinel lymph nodes in breast cancer: protocol recommendations and rationale. Mod Pathol. 2010;23 Suppl 2:S26-S32. PMID: 20436499.

3. Wang X, et al. A pathology foundation model for cancer diagnosis and prognosis prediction. Nature. 2024;634:970-978. PMID: 39260416.

4. Xu H, et al. A whole-slide foundation model for digital pathology from real-world data. Nature. 2024;630:181-188. PMID: 38778098.

5. Lu MY, et al. A visual-language foundation model for computational pathology. Nat Med. 2024;30(8):2256-2267. PMID: 38886623.

6. Wu S, Hong G, Wang Y, et al. Artificial intelligence-based pathological model for pan-cancer lymph node metastasis detection: a multicentre diagnostic study with retrospective and prospective validation. Lancet Digit Health. 2026;8(3):100961. PMID: 41792018. DOI: 10.1016/j.landig.2025.100961.

← 上一篇：职场大洗牌！非程序员AI用户激增，OpenAI重磅发布智能体报告下一篇：AI重塑注册流程效率 →