《函数时间变换模型及其在数字健康中的应用》
2024年7月16日
![图片]()
可穿戴和传感器技术的进步实现了为个人用户量身定制的实时、详细的生理和行为信号的采集。这些连续采集的观测结果可视为函数数据,这些数据本质上是无限维的,可以用于更深入地了解人类行为与健康和疾病之间的联系。函数数据分析(FDA)是指统计分析的一个分支,它以曲线或曲面的形式在连续指标(如时间或空间)上分析数据。函数数据分析已应用于生物科学的多个领域,如数字健康、全基因组关联研究、医学影像、生态学、干预研究等。
![图片]()
在许多生物医学和临床研究中,目标是通过量化一组风险因素与生存或事件发生时间结果之间的关联来增强和优化临床决策和解释。目前的生物医学和数字健康研究通常通过可穿戴或传感技术采集高维生理信号,如通过加速度计采集的身体活动数据、利用连续葡萄糖监测设备采集的血糖浓度、使用脑电图采集的脑活动数据等,这些都可以视为希尔伯特空间值功能预测因子。现有的功能数据和生存结果方法主要依赖于成熟的Cox模型及其扩展。然而,迫使风险比随时间恒定比例风险假设可能不适用于许多现实世界的应用,对风险本身进行建模可能会使从业者面临缺乏可解释性的问题。
![图片]()
本文作者提出了一种“函数时间变换模型”来估计具有函数协变量和标量协变量的条件生存函数。所提出的函数时间变换模型通过一个未知的单调变换和一个已知的误差分布直接对老年人的生存时间进行建模。主要组件包括:
1、函数协变量和标量协变量:该模型结合了函数协变量(如生理信号)和标量协变量(如年龄、性别)。
2、单调变换:生存时间通过一个未知的单调函数进行变换,使用伯恩斯坦多项式建模。
3、采用了最大似然估计的筛选方法:该方法用于估计模型参数,确保结果平滑可解释。
![图片]()
1、NHANES研究:利用《2011-2014年美国国家健康与营养讯查调研(NHANES)》数据库的加速度计数据,调查日间身体活动模式与全因死亡率之间的关联。该研究基于日间身体活动情况和其他生物学因素对老年人的生存时间进行建模。
2、连续血糖监测(CGM)研究:利用连续血糖监测(CGM)数据对糖尿病患者队列中发生低血糖事件的时间进行建模。该研究利用葡萄糖浓度数据的分布表示来分析不良事件发生的时间。
![图片]()
1、泛化:它泛化了Cox比例风险模型和其他生存模型,在现实应用中提供了更大的灵活性。
2、可解释性:通过直接对生存时间进行建模,协变量的影响更具可解释性。
3、性能提升:在案例研究中,与传统的基于摘要的生物标志物相比,“函数时间变换模型”显示出更优的预测性能。
4、流行病学见解:该模型揭示了功能性生物标志物与生存时间之间的动态关联,为设计有针对性的干预措施提供了宝贵的深刻见解。
![图片]()
本文最后讨论了所提出模型的意义和可能的扩展。“函数时间变换模型”为在数字健康背景下分析生存数据提供了一个强大的工具,利用了可穿戴和传感器技术功能数据中包含的丰富信息。该方法为理解生理信号与健康结果之间的复杂关系提供了一个灵活且可解释的框架。