
一、研究背景与问题提出
随着可穿戴设备(如智能手表、医疗级手环)的普及,基于人工智能的健康监测已成为现实。这些设备能够实时监测心率、皮肤电活动、体温、加速度等多模态生理信号,为癫痫发作检测、运动状态评估、自主神经系统监测等应用提供了前所未有的机会。然而,当前主流的人工智能模型,尤其是深度神经网络,虽然在性能上表现优异,但其“黑箱”特性严重制约了其在医疗领域的应用。临床医生、患者和模型开发者不仅需要知道模型的预测结果,更需要对预测结果背后的逻辑进行解释,以建立信任、辅助决策并避免误诊或漏诊带来的严重后果。
可解释人工智能旨在打开这一黑箱。然而,针对时间序列数据(尤其是多模态可穿戴信号)的解释面临诸多挑战。传统的基于显著性的方法(如特征重要性图、时间点扰动)往往只能回答“哪里重要”,却无法回答“为什么重要”。这类方法在时间序列上尤其受限,因为重要信息可能并非集中在某个时间点,而是隐含在信号的模式、趋势或跨模态的相互作用中。概念性解释方法虽然更具可理解性,但通常需要牺牲模型性能或依赖复杂的后处理流程。
为应对上述挑战,本文提出了一种新颖的、模型无关的可解释人工智能方法,称为基于内在可解释组件的可解释人工智能方法。该方法旨在融合基于显著性的方法的性能优势与概念性解释方法的可理解性,实现高性能与高解释性的统一。

二、方法论:内在可解释组件
2.1 核心思想
本文的核心创新在于提出了一种新的解释空间构建与优化机制。与传统的在原始时间点或频域上进行解释不同,作者提出将原始时间序列通过可逆变换分解为多个内在可解释组件。每个组件对应一个具有明确生理意义的信号特征,例如心率均值、心率变异性、皮肤电活动的强直性成分、温度变化趋势等。这些组件本身具有可解释性,因此不再需要额外的局部解释方法来进一步说明。
该方法的实现基于以下三个关键步骤:
1、可逆分解:定义分解函数,将原始时间序列映射为一组可解释组件。同时保证分解是可逆的,即可以由组件重建原始信号。
2、扩展模型:构建一个扩展模型,该模型以可解释组件为输入,通过逆变换重建原始信号,再输入到原始预测模型中。由于逆变换的存在,原始模型无需重新训练。
3、权重优化:为每个可解释组件引入一个可学习的权重向量,并通过优化目标函数来消除对模型输出影响较小的组件。优化目标包括两部分:一是最小化权重总和(鼓励稀疏性),二是限制输出变化(确保关键组件不被移除)。最终得到的权重向量即为解释结果,权重非零的组件被视为对当前预测重要的概念。
2.2 自主神经系统的内在可解释组件设计
为实现该方法的实际应用,作者针对可穿戴设备常见的四种传感器信号,分别设计了相应的可解释组件集合:
●加速度信号:分解为静态重力分量、运动活动分量和离群运动分量,其中活动分量采用平均振幅偏差进行表征。
●心率信号:通过将心率从每分钟心跳转换为RR间期,分解为均值分量(反映整体心率水平)和变异性分量(反映心率变异性)。
●皮肤电活动信号:分解为强直性分量(反映基线水平变化)和相位性分量(反映快速应激反应),其中强直性分量进一步拆分为均值和变化趋势。
●皮肤温度信号:分解为均值分量(反映整体温度水平)和升降分量(反映温度变化趋势)。
所有分解均保证可逆性,且每个组件都具有明确的生理学意义,便于领域专家理解。

三、实验设计与评估
3.1 实验任务与数据集
本文在两个真实场景下对所提方法进行了验证:
1、状态评估任务:区分受试者处于“仰卧休息”与“行走”两种状态,使用长短期记忆网络(LSTM)模型进行分类。
2、癫痫发作检测任务:区分癫痫患者的“发作期”与“发作间期”,使用转换模型进行分类。
3.2 对比方法
由于尚无直接与本文方法对应的基线,作者构建了两个代表性对比方法:
●线性概念瓶颈模型:将可解释组件压缩为标量,输入线性回归模型进行预测,解释来自线性权重。
●特征提取+ SHAP:从时间序列中提取统计特征,输入全连接神经网络,使用“沙普利加法解释”(SHAP)进行解释。
3.3 评估指标
●分类性能:通过准确率与F1分数评估模型预测能力。
●解释保真度:通过移除重要性最高的组件,观察模型预测翻转的比例。
●解释充分性:通过移除被认为不重要的组件,观察模型预测变化程度。

四、结果与讨论
4.1 分类性能
在状态评估任务中,本文方法取得了99.0%的准确率,显著高于线性概念瓶颈模型(81.1%)和特征提取+SHAP方法(95.4%)。在癫痫发作检测任务中,本文方法的准确率为87.8%,同样优于对比方法(82.6%和63.6%)。结果表明,使用原始时间序列数据的模型显著优于基于特征提取的模型,验证了时间序列模型在保留完整信息方面的优势。
4.2 解释质量
●局部解释:在正确分类的实例中,本文方法识别出的重要组件(如心率均值、皮肤电活动强直性分量)与对比方法一致,且与生理学知识高度吻合。在错误分类的实例中,本文方法能清晰地揭示模型依赖的误导性特征,为模型调试提供依据。
●全局解释:通过对所有样本的组件重要性进行汇总,本文方法能够揭示模型在整体人群中的行为模式。例如,在状态评估任务中,心率均值和皮肤电活动强直性分量是模型最依赖的特征;在癫痫检测任务中,加速度离群分量和心率变异性分量占据主导地位。
●数值验证:保真度和充分性实验表明,本文方法的解释与模型真实行为高度一致。移除重要组件显著影响模型输出,而移除不重要组件则几乎不产生影响。这一结果验证了解释的有效性。
4.3 方法比较与优势
与线性概念瓶颈模型相比,本文方法无需牺牲模型性能即可实现概念级解释;与特征提取+SHAP方法相比,本文方法能够保留时间序列中的完整信息,同时提供更直观、更具生理学意义的解释。此外,本文方法具有模型无关性、后验可调整性等优势,使其在实际临床应用中更具灵活性。

五、结论与展望
本文提出了一种基于内在可解释组件的可解释人工智能方法,专门用于可穿戴设备时间序列数据的健康监测任务。该方法通过将原始信号分解为具有明确生理意义的组件,并结合权重优化机制,实现了高性能与高解释性的统一。在两个真实数据集上的实验结果表明,该方法在分类性能上优于基于特征提取的方法,同时能够提供局部与全局的、与领域知识一致的解释。
未来的研究可进一步扩展该方法至无监督学习场景,并将其应用于脑电图、心电图等其他类型的时间序列数据。此外,组件设计仍需结合更广泛的临床知识,以避免引入确认偏误,并提升方法的通用性与可迁移性。
本文在可穿戴健康监测这一关键应用领域,提出了一种兼具高性能与强解释性的新型可解释人工智能方法。通过引入内在可解释组件,该方法成功打破了“性能与解释不可兼得”的传统困境,为人工智能在临床实践中的可信应用提供了有力支撑。
如需要《基于内在可解释组件的可解释AI:穿戴式健康监测新范式》(英文,共22页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。



Doing less,achieve more. 为少而得多,顺势而功成。早上好!
