图片

《在机器学习中利用临床和社会特征进行脑卒中预测》一文探讨了利用机器学习方法预测脑卒中风险的可能性,重点分析了临床和社会特征在脑卒中预测中的作用。脑卒中作为全球第二大死因和致残原因,每年在美国就有80万人罹患,即每40秒就有一人患脑卒中,每四分钟就有一人因脑卒中死亡。因此,基于生活方式等因素预测脑卒中风险,对于推动个体改变生活习惯、预防脑卒中具有重要意义。

 

文章首先指出,脑卒中的发生受多种内外部因素影响。外部因素包括婚姻状况、工作类型、居住地等;内部因素则涉及年龄、高血压、心脏病、平均血糖水平和体重指数(BMI)等。目前,已有多个数据集被收集用于评估这些可测量因素对脑卒中风险的影响。此外,计算医学领域正在不断开发新的脑卒中预测机器学习模型,这些模型若能在临床环境中应用,将能在常规体检中提供实时风险评估。

 

图片

本研究主要聚焦于两种预测模型:逻辑回归和神经网络。在神经网络中,又进一步比较了卷积神经网络和密集神经网络的差异。这些模型使用来自Kaggle的脑卒中预测数据集进行训练,该数据集包含约5000个个体,每个个体都有各自的脑卒中预测因子,并根据是否发生过脑卒中进行二元分类。
数据集包括数值型变量(如年龄、平均血糖水平、BMI)和非数值型变量(如性别、婚姻状况、工作类型和居住地)。非数值型变量通过Sklearn(即Scikit-learn简称SklearnPython中一个广泛使用的机器学习库,它提供了大量的算法和工具,帮助开发人员解决各种复杂的机器学习问题)的“标签编码器”进行编码,转换为0到潜在选项数-1之间的数值,以便模型能够准确利用这些变量。数据集被分为训练集(80%)和测试集(20%)。

 

图片

逻辑回归模型特别适用于脑卒中预测任务,因为它可以对十个不同的医疗特征进行标准化缩放处理,并通过sigmoid函数将输出转换为概率。模型评估采用了准确率、召回率、精确度、AUCROC曲线和混淆矩阵等指标。尽管准确率是衡量整体正确性的指标,但在数据不平衡的情况下可能会产生误导,因此召回率(评估模型识别实际脑卒中病例的能力)也被纳入考量。结果显示,年龄是脑卒中的首要预测因子,但BMI在逻辑回归模型中的重要性较低,这与背景知识不符,可能导致模型准确性下降。逻辑回归模型的准确率为74.95%,召回率为75.81%,但精确度仅为16.31%,表明存在较高的假阳性率。
神经网络模型由于其复杂的架构和调优的超参数,预期表现会优于逻辑回归模型。研究选择了交叉熵作为损失函数,因为它在模型对预测非常自信但错误时会分配较大的惩罚,有助于减少假阴性,同时自然处理类不平衡问题。密集神经网络中包含了“批量归一化”层,以允许选择更高的学习率同时保持稳定性。

 

图片

神经网络模型的评估指标包括训练和测试准确率、F1分数、训练损失、混淆矩阵、精确度和召回率历史。结果显示,尽管神经网络模型的准确率高于逻辑回归模型,但在召回率方面表现较差。具体而言,密集神经网络在大多数指标上表现更好,但召回率较低,意味着它预测真正脑卒中病例的能力较弱。卷积神经网络虽然准确率略低,但召回率相对较高。
研究结果发现,逻辑回归模型提供了稳定且可解释的基线性能,而神经网络模型则表现出了更高的准确性,但在召回率和计算成本方面存在权衡。为了评估结果的统计稳健性,研究计算了95%的置信区间,结果显示准确率测量相对稳定,但召回率测量存在更多不确定性,这可能与数据集中阳性病例数量有限有关。

 

图片

在比较逻辑回归、密集神经网络和卷积神经网络三种脑卒中预测模型时,每种模型都各有优势。为了提高模型准确性,最关键的下一步是收集更多关于真实脑卒中患者的数据,以及他们发病前的生活习惯。这将有助于缓解当前数据不平衡的问题,使模型能够更准确地预测脑卒中风险。逻辑回归因其可解释性和高召回率,在详细患者评估中具有价值;卷积神经网络则因其平衡的性能,可作为验证工具;而密集神经网络在高风险病例的精确评估中可能更有用。因此,建议构建一个综合的脑卒中风险评估管道,结合每个模型的优点,同时减轻其各自的弱点。具体来说,可以先使用逻辑回归进行初步筛查,然后使用密集神经网络对高风险病例进行更精确的评估,最后使用卷积神经网络进行验证。本文提供的代码和数据均可在GitHub上公开获取,方便其他研究人员进行复现和进一步研究。