
这篇文章提出了一种新颖的基于决策的人工智能视觉导航系统,用于心脏超声检查中下腔静脉(IVC)的实时定位,旨在克服传统超声心动图检查对专业技师和高质量设备的依赖,从而扩展超声诊断的应用范围。
目前,心脏超声检查(超声心动图)是诊断心脏疾病的重要手段,但其依赖于经验丰富的超声技师和高质量的超声设备,这些资源通常只在医院才能获得。虽然近年来出现了一些基于人工智能的导航系统,辅助新手技师获取标准化的心脏视图,但这些系统大多采用基于方向的引导方式,预测探头的旋转角度,缺乏对下腔静脉的直接视觉定位。

本文提出的系统则有所不同,它结合了离线训练的决策模型和实时运行的定位算法,实现了对下腔静脉的实时空间定位和标注。
系统架构:该系统主要由两个部分组成:
●决策模型: 该模型通过离线训练,利用心脏超声视频数据进行二元分类,判断视频中是否存在下腔静脉。文章中使用了两种不同的深度学习模型架构:X3D和SlowFast。X3D模型轻量级,时空理解能力强,更适合实时应用;SlowFast模型则通过快速和慢速通路分别学习视频的时空特征和空间特征,用于右心房压力分类任务,以验证定位算法的泛化能力。
●定位算法: 该算法利用决策模型学习到的特征表示,对下腔静脉进行实时定位。它并非直接使用带有空间标注的数据进行训练,而是巧妙地利用了决策模型中间层的特征图。该算法首先对特征图进行通道维度的归一化,然后通过三维样条插值将其映射回原始像素空间,找到特征值最大的像素点集,并计算其空间平均值作为下腔静脉的中心位置,最后在超声图像上用绿色圆圈标注出来。这种方法避免了复杂的像素对应或其他像素重要性方法,具有较高的计算效率,能够满足实时定位的需求。为了理解模型学习到的特征,研究者使用了“沙普利加法解释”SHAP方法进行模型解释,结果表明模型确实学习到了下腔静脉相关的局部特征。

实验结果与分析:文章对该系统进行了多组实验,验证了其有效性和鲁棒性:
●临床试验(仅决策模型): 在一次临床试验中,仅使用决策模型(不进行定位)的导航系统,在91例患者中,下腔静脉检测准确率达到62%,与现有商业系统相当。
●高品质超声视频数据集(含定位): 在高质量的医院级超声视频数据集上,该系统能够以97%的准确率定位下腔静脉。
●低品质超声视频数据集(含定位,零样本): 在使用Butterfly iQ便携式超声设备采集的低质量视频数据集上,该系统实现了99.67%的零样本定位准确率,这充分展现了其在不同数据质量和图像形状下的鲁棒性。
●右心房压力分类模型上的零样本测试(含定位): 将定位算法零样本应用于一个用于预测右心房压力值的SlowFast模型上,结果显示在30例患者的测试集上仍能达到100%的定位准确率,进一步验证了该算法的泛化能力。

结论:这项研究提出了一种新颖的、基于决策的人工智能视觉导航系统,能够实时、准确地定位心脏超声图像中的下腔静脉,并具有良好的鲁棒性和泛化能力。该系统无需依赖大量的带有空间标注的数据,降低了数据标注的成本和难度。其在便携式超声设备上的良好表现,有望将超声诊断扩展到医院以外的医疗环境,例如基层医疗机构。该系统目前正在进行临床试验,并已集成到Butterfly iQ应用中。该研究提出的定位算法也为其他医学图像引导系统提供了新的思路。