《召唤GPT医生:从临床记录中提取信息以优化患者预测》2025年4月19日这篇文章探讨了如何利用大语言模型,从临床记录中提取信息来改进患者预后预测。传统的医疗预测模型主要依赖于电子病历中的结构化数据,而忽略了包含诊断、治疗、进展、药物和护理计划等重要信息的非结构化临床记录。该研究证明,通过巧妙设计提示词,让GPT从患者的出院小结中提取关键信息,可以显著提高患者死亡率预测的准确性,为医疗人工智能的落地提供了透明、可解释的新范式。研究使用了MIMIC-IV Note数据集,包含14011例首次入住冠状动脉重症监护室或心血管重症监护室的患者数据。研究人员构建了一个透明的框架,将GPT对三个临床问题的回答(患者死亡风险、再入院风险和整体健康状况)作为特征,输入逻辑回归模型进行预测。这三个问题的设计基于临床医生的专业知识,经过迭代测试和优化。提示词包含四个关键部分:上下文、临床记录文本、三个问题以及答案格式说明,以确保输出的一致性。研究结果表明,仅使用GPT回答的模型就能优于仅使用70个结构化电子病历特征的模型。更重要的是,结合两种数据源(结构化数据和GPT回答)的模型预测能力得到了进一步提升,平均AUC值提高了5.1个百分点,最高风险组(前10%)的阳性预测值(PPV)提高了29.9%。这表明GPT能够有效地从非结构化文本中提取对预测至关重要的信息。为了深入理解GPT回答的优势,研究人员比较了不同模型的预测结果,并详细分析了GPT对死亡风险的评估。结果显示,虽然两种模型(仅使用电子病历特征的模型和结合电子病历和GPT特征的模型)对大多数患者的风险评估结果基本一致,但对于一些患者,结合GPT特征的模型能够更准确地预测高风险患者。人工审查这些患者的出院小结发现,GPT模型能够识别出一些电子病历模型无法捕捉到的关键信息,例如停止治疗、对症治疗、姑息治疗或拒绝侵入性治疗等。这说明GPT能够更好地理解临床记录中隐含的治疗和预后信息。此外,本研究发现,GPT对“患者死亡风险”的回答仅有八个独特的数值,涵盖了超过99%的患者。这些数值与实际死亡率之间存在显著的指数关系,仅基于这一个问题的回答训练的逻辑回归模型,其AUC值就能达到0.82,与仅使用完整电子病历特征的模型相当。这进一步证明了GPT能够有效地将非结构化文本数据转化为可用于预测模型的定量信息。研究还分析了不同模型在预测90天死亡率和1年死亡率方面的阳性预测值。结果显示,在识别最高风险患者方面,结合GPT特征的模型显著优于仅使用EMR特征的模型。例如,对于90天死亡率预测,在最高风险的2.5%患者中,结合GPT特征的模型的阳性预测值达到63%,而仅使用电子病历特征的模型仅为43%。最后,研究讨论了该方法的优势、局限性和未来的研究方向。该方法简单、透明、易于实施和部署,可以集成到现有的电子病历系统中,为临床医生提供快速、准确的患者风险预测信息。本研究也承认算法公平性在临床应用中的重要性,并进行了公平性分析,结果表明该方法的优势在不同人口统计学群体中都得到了体现。未来的研究方向包括将该方法扩展到更广泛的患者群体,并探索其他大语言模型的应用潜力。总之,这项研究为将大型语言模型应用于医疗预测提供了一种简单有效的方法,它利用了临床记录中的非结构化数据,显著提高了患者预后预测的准确性,并为改善医院运营和患者护理提供了新的途径。该方法的透明性和可解释性使其易于在临床实践中应用,并有望在医疗领域产生广泛的影响。如需要《召唤GPT医生:从临床记录中提取信息以优化患者预测》(英文,共26页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。★ 每日鲜鸡汤 ★If you truly want to change your life, you first must be willing to change your mind. 欲改人生,须先愿更易己心。早上好!