《利用大型语言模型增强电子病历对阿尔茨海默病发病风险的预测》
2024年7月19日
![图片]()
阿尔茨海默病(AD)是65岁及65岁以上美国人的第五大死因。筛查和早期发现阿尔茨海默病和相关痴呆症对于及时干预和确定临床试验参与者至关重要。电子病历的广泛采用为开发基于机器学习的预测模型等阿尔茨海默病相关痴呆症筛查工具提供了重要资源。大语言模型(LLM)的最新进展表明,它们具有前所未有的知识编码和推理能力,这为它们增强何优化风险预测提供了巨大的潜力。
![图片]()
阿尔茨海默病和阿尔茨海默病相关痴呆症是主要影响记忆和认知功能的神经退行性疾病。它们逐渐侵蚀整体功能能力,最终导致死亡。由于阿尔茨海默病和阿尔茨海默病相关痴呆症的病理和临床表现复杂,因而治疗进展缓慢。记忆和认知功能的下降与大脑的病理进展和结构变化有关,这可以从神经影像或脑脊液的生物标志物中识别出来。然而,这类检查很昂贵且属侵入性的,不太可能为无症状患者所接受。对于现实世界的患者,通常只有从常规医疗服务中收集的电子病历可用。这些数据包括人口统计数据、检查检验数据、诊断、药物和治疗等信息,它们为阿尔茨海默病和阿尔茨海默病相关痴呆症的风险预测提供了可能的机会。![图片]()
电子病历的风险预测通常被描述为有监督学习问题,人们可以利用现有的有监督学习(SLs)工具(例如逻辑回归、极限梯度提升和多层感知器)进行建模。然而,由于医疗问题的复杂性和数据的嘈杂性,有监督学习方法在预测电子病历风险方面面临着重大挑战。此外,电子病历不包含对特定病症进行风险预测所需的所有关键信息。例如,轻度认知障碍(MCI)的诊断需要对认知功能进行全面的评估,如记忆、执行功能和语言。在早期阶段,当症状很不易察觉且没有在电子病历中大量记录时,利用传统的机器学习方法进行风险预测可能很困难。不过,电子病历中的一些信息可能与风险相关性较弱,因而有监督学习模型也许能够或者可能无法检测到这些信息。
![图片]()
预训练大语言模型的最新进展表明,它们能够提供强大的推理能力,特别是在丰富的语境信息和领域知识的情况下。直白地说,大语言模型可以利用其推理能力和灵活的语境学习(ICL)策略,能更好地从电子病历中获得有价值的见解。然而,要实现这一目标,仍存在一些技术挑战。第一个问题是如何使用电子病历数据库进行有效的推理。虽然将外部知识微调到大语言模型中是许多领域的主要方法,但将电子病历中的知识微调到大语言模型中并非易事。电子病历包括个体患者的临床信息,并随着时间的推移而演变,而大语言模型通常是使用静态信息学习和调整的。
![图片]()
第二个挑战是用于推理的医疗记录的表示。大语言模型是经过训练的概率模型,可以用自然语言理解和推理,目前尚不清楚结构化的电子病历数据(如生命体征、诊断代码和处方)如何在大语言模型中得到最好的表示,以实现有效推理。第三个挑战源于电子病历数据中固有的数据质量问题,这些数据可能存在噪声,因为它们最初是为计费目的而设计的。此类事件的存在可能会损害并极大地误导大语言模型的推理。
![图片]()
●确定了有监督学习和大语言模型在电子病历风险预测中的优缺点。从有监督学习的角度来看,它们为置信样本提供了准确的预测,这些样本通常与训练数据分布很好地一致。然而,当样本不常见或特征稀疏时,有监督学习通常对预测没有信心,产生的预测比大语言模型差,这显示了大语言模型在电子病历分析中的推理价值。
●根据本研究的结果,提出了一种协作方法,通过信心驱动的选择过程将有监督学习和大语言模型结合起来,以增强阿尔茨海默病和阿尔茨海默病相关痴呆症风险预测。该方法基于置信度在有监督学习和大语言模型预测之间进行动态选择,有效地利用了有监督学习在高置信度情况下的优势和大语言模型在低置信度情况中的优势。此外,本研究采用了精心设计的语境学习演示去噪策略,以节省大语言模型的语境学习效能,从而提高了该“管道”的整体效率。
●使用俄勒冈健康与科学大学医院的真实电子病历数据集验证了本研究所提出的方法,证实了该方法的有效性及其在预测阿尔茨海默病和阿尔茨海默病相关痴呆症方面优于传统的有监督学习和大语言模型的优势。
![图片]()
总之,本项研究证明了大语言模型在增强电子病历对阿尔茨海默病风险预测方面的潜力,强调了结合有监督学习和大语言模型的优势以提高预测性能的重要性。该方法有可能改变阿尔茨海默病的筛查和早期检测实践。