AI赋能眼科超声诊断|npj Digit. Med.(IF=15.1)浙大二院突破:病灶识别与报告生成一键搞定
研究速览
眼科超声影像解析是视网膜脱离、玻璃体出血等眼底疾病诊断的核心环节,但长期以来需要资深专科医师亲自把关,不仅耗时而且对专业经验要求极高。随着超声检查数据呈爆发式增长,传统人工智能方案仅能完成疾病初筛,难以同步实现病灶精确定位与诊断报告自动撰写,临床应用价值受到明显制约。
浙江大学医学院附属第二医院金凯研究团队携手多家医疗机构,在国际权威期刊《NPJ Digital Medicine》发布重磅成果,创新性地研发出视觉-语言分割模型——通过融合视觉-语言模型与Segment Anything Model技术,开创性地在眼科超声领域实现了「病灶智能勾画+诊断报告同步生成」的突破性应用。该研究汇集三家中心共计64,098幅超声影像及21,355份诊断报告进行模型训练与验证,内部测试集BLEU4评分达66.37,外部验证集分别取得85.36和73.77的优异成绩;病灶分割平均Dice系数为59.6%,特异性超过97%。
尤为引人注目的是,人工智能生成单份诊断报告仅需1.3美元,而资深眼科专家完成同等工作需花费39美元,成本降幅高达30倍;图像阅读时间从70秒大幅缩减至6秒。在涵盖200例病例的人机对比测试中,初级医师借助该人工智能系统后,诊断准确率从原本的86.3%显著提升至94.7%。这一成果为眼科超声检查的智能化普及、成本优化以及基层医疗机构的广泛应用提供了切实可行的技术方案。
研究亮点
一体化「分割+报告」设计:VLS模型首次将病灶精确定位与文本报告自动生成深度整合,彻底解决传统人工智能「仅分类不解释」的困扰,输出结果可直接服务于临床诊疗的图文报告
跨机构泛化性能卓越:在两家外部医疗中心数据验证中,VLS模型的BLEU4和ROUGE-L评分均显著优于纯语言模型,充分证实了对不同超声设备及报告书写习惯的强大适应能力
成本骤降30倍:人工智能生成单份报告成本仅1.3美元,远低于资深医师的39美元,为基层眼科筛查工作的经济可行性提供了有力支撑
低年资医师获益明显:人工智能辅助诊断使低年资医师的准确率从86.3%提升至94.7%,尤其在视网膜脱离、玻璃体出血等高发疾病的诊断中改善尤为突出
代码开放可复现:全部核心源代码已同步发布至GitHub平台,便于其他医疗科研机构验证学习与二次开发
研究结果
图注:研究整体流程图。数据