《对话式诊断AI在全科门诊的前瞻性临床可行性研究》

随着全球范围内全科医疗人力资源日益紧张，尤其是全科医疗医生的短缺问题愈发突出，探索人工智能在医疗领域的应用成为缓解这一困境的重要方向。由谷歌研究院、谷歌DeepMind与位于美国马萨诸塞州波士顿市的贝斯以色列女执事医院联合开展的一项前瞻性临床可行性研究，首次在实际门诊环境中评估了一种基于大语言模型的对话式诊断AI系统——“智能诊疗探询助手”（AMIE）。该研究旨在探讨AMIE在真实医疗流程中与患者进行临床对话的安全性、可行性、用户体验以及临床推理能力。

一、研究背景与目的

全球范围内，全科医生的短缺已成为一个日益严峻的公共卫生问题。医生工作负担加重、患者老龄化趋势加剧，导致医生倦怠现象频发。虽然电子病历和远程医疗等技术在一定程度上提升了医疗服务效率，但患者与医生之间的沟通质量仍面临挑战。大语言模型技术的发展为实现高质量的医患对话提供了新的可能性。AMIE系统正是基于这一背景，旨在通过自然、结构化、适应性的对话，帮助患者在就诊前整理病史、理解可能的诊断，并为医生提供有价值的临床信息。

本研究的核心目标是评估AMIE在真实门诊环境中进行患者对话的安全性和可行性，具体包括：是否存在需要人工干预的安全事件、对话质量如何、患者与医生的使用体验、以及AI生成的诊断与治疗方案的质量。

二、研究方法

研究在贝斯以色列女执事医院的全科门诊进行，时间为2025年4月至11月。共招募并完成100名成年患者的AMIE对话，这些患者均已预约急症医疗门诊并符合纳入标准。研究采用单臂前瞻性设计，所有患者在就诊前0至5天内通过文本聊天界面与AMIE完成一次远程对话。AMIE的任务包括采集病史、理解患者主诉、提供可能的诊断建议，并引导患者准备与医生的面对面或远程会诊。

为保障患者安全，所有AMIE对话均由一位经过培训的内科医生通过屏幕共享实时监控，并设定明确的干预标准，包括：患者存在自伤或伤人风险、情绪极度波动、存在临床安全隐患、或患者主动要求中断对话。若出现以上情况，监控医生可立即介入。研究还设立了安全性试验阶段，首先对10名患者进行试点，确认安全后再扩大至100人。

研究收集的数据包括患者对话前后的态度变化（使用GAAIS量表）、对话质量评分（包括GMCPQ、PACES、PCCBP等标准）、患者和医生的访谈反馈、以及AMIE生成的诊断和治疗方案。最终诊断由三位内科医生在八周后通过EHR回顾确定，并与AMIE的诊断进行比较。所有评分均采用盲法，确保评估的客观性。

三、主要发现

1、安全性

在所有100次AMIE对话中，未发生任何需要人工干预的安全事件。监控医生仅在三次对话中进行轻微干预，如纠正AMIE对手术日期的错误表述、提醒患者注意急症医疗指征等。这表明，在严密的人工监控下，AMIE能够在真实环境中安全地与患者进行临床对话。

2、对话质量

AMIE的对话质量得到了患者和临床评估者的高度评价。患者在对话后对AI的态度显著改善（p < 0.001），这种积极态度在看诊后仍然保持。患者普遍认为AMIE能够耐心倾听、使用通俗易懂的语言、表现出同理心，并能有效帮助他们梳理病史。部分患者甚至形容AMIE“比某些医生更具人情味”。

临床评估者对AMIE在病史采集、信息解释、关注患者情绪等方面的表现给予了积极评价。尽管在某些方面，如家族史采集，AMIE有时被判定为“未执行”或“执行不充分”，但总体评分仍处于较高水平。

3、临床推理能力

研究将AMIE的诊断与八周后通过电子病历确认的最终诊断进行比较。结果显示，AMIE的诊断列表中包含最终诊断的比例为90%（前7个候选诊断），前3个候选诊断中包含最终诊断的比例为75%。这一表现与医生相比并无显著差异，显示出AMIE在诊断推理方面的潜力。

在治疗方案方面，AMIE与医生的整体质量相近，尤其是在治疗的安全性和适宜性方面。但医生在治疗方案的“成本效益”和“实用性”方面表现更优（p < 0.01）。这可能与AMIE缺乏对患者具体医疗背景、经济状况、医疗资源可及性等因素的理解有关。

4、患者与医生体验

患者在访谈中普遍表示，与AMIE的对话帮助他们更好地准备看诊，理清了思路，减少了对医生的焦虑。部分患者表示，AMIE的提问比传统电子问卷更具人性化，能更深入地理解他们的症状。

医生方面，尽管部分医生表示未能在看诊前及时查阅AMIE生成的对话记录（约27%），但在查阅过的医生中，大多数人认为AMIE提供的摘要对看诊准备有帮助（75%），并认为其信息可信（64%）。医生普遍反映，与AMIE互动过的患者在看诊时更加有条理，沟通更顺畅，医生因此能将更多时间用于病情讨论和治疗决策。

四、讨论与局限性

本研究首次在真实临床环境中验证了基于大语言模型的对话式AI在全科医疗中的可行性与安全性。尽管结果令人鼓舞，但研究也存在一定局限性。例如，样本量较小（仅100人），且为单中心研究；患者群体偏向年轻、技术素养较高；排除了孕妇和精神健康问题的患者，限制了结果的普适性。此外，AMIE仅通过文本与患者互动，缺乏对语音、图像、电子病历等多模态信息的整合，也限制了其在复杂病例中的表现。

尽管如此，本研究为未来AI在医疗对话中的广泛应用奠定了基础。随着模型能力的提升、与电子病历系统的深度整合、以及对成本效益和实用性的进一步优化，AI有望成为医生的重要助手，提升诊疗效率，改善患者体验。

五、结论

本研究证明，在严格的人工监控下，AMIE系统能够在真实门诊环境中安全、有效地与患者进行临床对话，提供高质量的诊断建议，并获得患者和医生的积极反馈。虽然仍需更大规模、更多样化的研究验证其广泛适用性，但本研究无疑是推动AI在临床对话中应用的重要一步。

如需要《对话式诊断AI在全科门诊的前瞻性临床可行性研究》（英文，共63页），请在本微信公众号中赞赏（点喜欢或稀罕作者后按本公众号设定打赏）后，发来email地址索取。

★ 每日鲜鸡汤 ★

Those who don't move won't notice their chains. 不迈步者，难察己身之桎梏。早上好！

《对话式诊断AI在全科门诊的前瞻性临床可行性研究》

《评估大语言模型在动态、多模态临床决策中的应用》

《从数天到几分钟：自主AI智能体实现远程患者监测中的可靠临床分诊》

《人工智能在居家照护中的未来》

《“康尔”：面向临床问责的多模态医学推理证据驱动的智能体框架》

《2026年医疗行业关键趋势前瞻》