《迈向用于疾病管理的会话式人工智能》2025年3月13日这篇题为《迈向用于疾病管理的会话式人工智能》文章探讨了大语言模型(LLM)在疾病管理中的应用潜力,特别是其在管理推理方面的能力,这包括疾病进展、治疗反应和安全用药等方面。本文重点介绍了一个名为“清晰的医学智能探索者”的基于大语言模型的智能系统,该系统在之前的诊断对话能力基础上进行了改进,使其能够进行更有效的疾病管理推理。“清晰的医学智能探索者”系统的一个关键改进是其对疾病纵向演变和多次患者就诊的推理能力。它能够综合考虑患者在多次就诊中的病史、治疗反应以及药物处方等信息,从而制定更全面的管理计划。为了确保其推理的权威性和准确性,“清晰的医学智能探索者”利用Gemini模型的长上下文能力,结合上下文检索和结构化推理,使其输出与最新的临床实践指南和药物处方集保持一致。为了验证“清晰的医学智能探索者”的能力,研究团队进行了一项随机、双盲的虚拟“客观结构化临床考试”研究,将“清晰的医学智能探索者”与21名全科医生进行了比较。研究设计了100个多次回访的病例场景,这些场景的设计参考了英国国家卫生与临床优化研究所指南和《英国医学杂志》最佳实践指南。结果显示,在专家医生的评估中,“清晰的医学智能探索者”在管理推理方面不劣于全科医生,并且在治疗和检查的精确性以及管理计划与临床指南的一致性和依据性方面得分更高。为了对“清晰的医学智能探索者”的药物推理能力进行基准测试,研究人员开发了一个名为“处方问答”的多项选择题基准测试,该测试来源于美国和英国的两个国家药物处方集,并由持证药剂师进行了验证。结果表明,虽然“清晰的医学智能探索者”和全科医生都受益于访问外部药物信息的能力,但在难度较高的题目中,“清晰的医学智能探索者”的表现优于全科医生。“清晰的医学智能探索者”系统采用了一种多智能体架构,由两个智能体组成:1、会话智能体: 负责与患者进行快速、直观和富有同理心的对话,并维护跨多次就诊的持续对话状态。它利用Gemini模型进行快速响应,并通过细致的推理链来提高响应质量。2、管理推理智能体: 负责制定患者护理计划。它利用Gemini模型的长上下文能力,综合分析患者的病例、权威临床知识(例如临床指南)以及多次就诊的信息,生成详细且结构化的管理方案。该方案包含了检查、干预措施以及随访建议等,并附有相应的参考文献,以提高可解释性和可追溯性。管理推理智能体通过多个阶段运作:检索临床指南、生成多个管理方案草稿、以及最终整合和完善这些草稿,形成最终的管理方案。为了确保输出结构的一致性和可控性,该系统使用了解码约束,将模型输出约束到预定义的JSON结构中。本文的评估方法除了虚拟“客观结构化临床考试”研究外,还包括“处方问答”药物推理基准测试(涵盖了600个问题)。“客观结构化临床考试”研究中,专家医生和患者参与者分别对“清晰的医学智能探索者”和全科医生的咨询质量、指南遵循情况以及诊断和管理决策的合理性进行了评估。评估指标涵盖了管理方案的整体质量、检查建议的质量、治疗建议的质量以及临床指南的使用情况等多个方面。结果表明,“清晰的医学智能探索者”在多个评估维度上均表现出色,其管理计划的质量不逊于全科医生,甚至在某些方面表现更好。“处方问答”基准测试则侧重于评估“清晰的医学智能探索者”的药物推理能力。结果显示,“清晰的医学智能探索者”在难度较高的题目中表现优于全科医生,这表明“清晰的医学智能探索者”在处理复杂的药物信息和推理方面具有优势。总之,这项研究表明,基于大语言模型的会话式人工智能系统在疾病管理方面具有显著的潜力。“清晰的医学智能探索者”系统在虚拟“客观结构化临床考试”和“处方问答”基准测试中的出色表现,标志着会话式人工智能作为疾病管理工具迈出了重要的一步 然而,论文也指出了这项研究的局限性,例如虚拟“客观结构化临床考试”场景的局限性、以及仅使用文本界面进行交互等。未来的研究需要在真实世界环境中对“清晰的医学智能探索者”系统进行更广泛和更严格的评估,以验证其临床应用的可行性和安全性,并进一步改进其能力,使其能够更好地满足临床需求。文章最后强调了负责任创新和与研究伙伴、监管机构以及医疗机构或医务人员合作的重要性,以确保“清晰的医学智能探索者”系统能够安全有效地用于医疗实践。如需要《迈向用于疾病管理的会话式人工智能》(英文,共62页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。★ 每日鲜鸡汤 ★Believe you can and you're halfway there. 坚信己能,事功半成。早上好!