AI驱动的肺动脉高压超声诊断技术
点击上方蓝字关注我们
健心知著
刘健、周海燕、孙宇彤
北京大学人民医院
健心荐语
超声心动图是肺动脉高压评估的核心影像学手段,但右心形态不规则、肌小梁明显、室间隔运动异常等因素使其人工判读耗时长、重复性差,成为临床工作中的长期痛点。近年来,深度学习技术在左心超声自动化分析中已取得显著进展,但在右心尤其是肺动脉高压患者中的应用尚缺乏系统验证。
文章介绍
研究方法
本研究为回顾性、单中心诊断准确性研究,分为三个部分。第一部分为病例-对照研究,纳入213名健康志愿者和221名经右心导管确诊的肺动脉高压患者,比较深度学习与核心实验室在右心超声指标上的偏倚和精度。第二部分为转诊队列研究,纳入196名疑似肺动脉高压患者(排除平均肺动脉压>35 mmHg者),评估深度学习对轻度肺动脉高压的判别能力。第三部分由核心实验室随机重分析50例,评估重复测量变异性。
深度学习分析使用Us2.ai软件(版本1.4.5),其算法分别在5,498至6,336张图像上完成训练。自动化流程依次完成视图分类、图像分割和参数测量,并生成置信度评分。测量参数包括峰值三尖瓣反流速度、右心室基底内径、右心室舒张末期面积、右心室收缩末期面积、右心室面积变化分数、三尖瓣环平面收缩期位移和右心房面积。
核心实验室判读由两名三级超声专家独立完成,分别采用无视图偏倚和同视图偏倚两种方式,遵循美国超声心动图学会标准,图像质量按五级量表评分。偏倚以中位数差异表示,精度以百分位精度(第84与第16百分位数差值的一半除以√2)表示,采用Bootstrap方法计算95%置信区间。判别能力采用曲线下面积评估,组间比较使用DeLong方法。图像质量对偏倚和精度的影响分别使用Kruskal-Wallis检验和Levene检验。
图 1 研究设计与分析流程。三阶段验证:阶段1(算法开发):测试深度学习(DL)模型的初始性能;阶段2(独立验证):在健康组(213例)和肺动脉高压(PAH)组(221例)中,对比DL与核心实验室(CL)的测量一致性;阶段3(临床场景应用):在196例转诊疑似PAH患者中评估DL的鉴别能力。
研究结果
肺动脉高压患者平均年龄48岁,78%为女性,平均肺动脉压52 mmHg。深度学习在峰值三尖瓣反流速度和三尖瓣环平面收缩期位移上的检出率均超过90%,而右心室面积变化分数最低(78.5%)。高质量图像比例方面,右心房为74%,右心室为67%,峰值三尖瓣反流信号仅为44%。
偏倚分析显示,深度学习在峰值三尖瓣反流速度(0.90%)、右心房面积(1.71%)和三尖瓣环平面收缩期位移(1.28%)上无显著偏倚,但右心室基底内径被轻度低估(-6.35%),右心室面积变化分数被明显高估(11.46%)。精度方面,除右心室面积变化分数(17.34%)外,所有参数精度均低于15%,其中峰值三尖瓣反流速度为6.70%,右心室基底内径为10.13%,三尖瓣环平面收缩期位移为11.49%。
图像质量对测量有显著影响,低质量图像会增大偏倚并降低精度。在病例-对照队列中,核心实验室和深度学习对峰值三尖瓣反流速度的曲线下面积分别为0.99和0.98。在转诊队列(171例有可测量信号)中,临床判读的曲线下面积为0.79,深度学习为0.75,差异无统计学意义(P = 0.068)。各参数中,峰值三尖瓣反流速度判别能力最强(0.74),其次为右心室基底内径(0.64)、右心房面积(0.62)和右心室面积变化分数(0.59)。重复测量分析显示,核心实验室第二次判读时峰值三尖瓣反流速度偏低(-4.5%),右心室面积变化分数偏高(14.1%),且后者精度高达21.2%,进一步证实其高变异性。
图 2 参数分布与图像质量。A-C图:展示健康组与PAH组的关键参数范围:(A)峰值TRV:PAH组显著升高(均值4.1 vs 2.1 m/s);(B)RV基底径:PAH组扩张明显(均值54.8 vs 37.8 mm);(C)RA面积 :PAH组增大(均值23.3 vs 15.9 cm²)。D图:TR信号优质率仅44%,RA图像优质率达74%,说明右心参数测量质量差异较大。
表 1 研究对象特征
表 2 右心和三尖瓣速度参数产量(n = 434)
图 3 系统差异与精度。(A)偏差:DL对峰值TRV、TAPSE、RA面积的偏差<5%(满足临床标准);RVFAC偏差达11.46%(显著高估);(B)精度:除RVFAC外,所有参数的百分位精度<15%,其中峰值TRV精度最佳(6.7%)。
表 3 DL 和 CL2 读数与 CL1 读数的系统差异和按比例百分位精度
图 3 质量对变异性的影响。核心信息是图像质量和被测量参数本身的数值范围是影响AI在肺动脉高压超声心动图评估中准确性和精度的关键因素。低质量图像会显著增加系统偏差(尤其对小梁结构如右心室基底径)和随机变异度(尤其对关键的血流动力学指标,如peak TRV);同时,某些参数(如RVFAC)的分析精度会随其数值水平高低而变化。
图 4 转诊队列的PH鉴别效能。(A):DL与临床读片的AUC无显著差异(0.745 vs 0.789, p=0.068);(B):补充标准(如RA扩大、室间隔变平)小幅提升DL判别力(AUC 0.745→0.754)。
结 论
本研究显示,全自动化深度学习工作流程在超声心动图右心分析中具有良好的准确性(低偏倚)和可接受的精度(变异系数在15%以内),尤其是在峰值三尖瓣反流速度、右心室基底内径、三尖瓣环平面收缩期位移和右心房面积等欧洲心脏病学会/欧洲呼吸学会指南推荐的指标上。然而,右心室面积变化分数的测量存在较大变异和较低的检出率,提示该指标在自动化分析中仍需改进。图像质量对偏倚和精度有显著影响,低质量图像会导致更大的测量差异,因此未来需要在自动化判读中集成质量控制和置信度评分。研究还指出,偏倚与精度的区分具有重要临床意义,即系统性偏倚可通过校准解决,而精度则定了纵向监测中参考变化值的阈值。
本研究的局限性包括单中心设计、仅使用飞利浦超声设备、单一版本的深度学习软件,以及缺乏多中心外部验证。未来需要在更大规模、多中心的研究中验证该工作流程在诊断、治疗监测和预后评估中的价值。
点个在看你最好看