
《纸上谈兵易,实践行路难:大语言模型在临床记录撰写中的困境》一文深入探讨了大语言模型在辅助医护人员撰写临床记录时所面临的挑战。尽管大语言模型在理论上有潜力简化临床文档流程,但实际应用中却暴露出诸多问题。本文通过在加拿大安大略省一家叫“儿童能力”的儿科康复机构的定性研究,揭示了大语言模型在临床记录撰写中的复杂性和局限性。
研究背景与方法
●研究背景
随着大语言模型在医疗领域的广泛应用,其被视为减轻医护人员文档负担的重要工具。然而,临床笔记撰写这一看似简单的任务,实则蕴含着复杂的社会技术因素。本研究在“儿童能力”这家机构开展,旨在评估大语言模型在减少儿科职业治疗师医疗文书负担方面的可行性和效果。
●研究方法
研究采用定性研究方法,对20名参与大语言模型试点项目的临床人员进行了深入访谈。这些临床人员分别来自机构的早期干预项目、学校康复项目和学龄期项目。研究还涉及两种人工智能技术的使用:一种为通用专有大语言模型,另一种为基于历史文档微调的定制模型。

主要发现
●文档工作流程的异质性
研究发现,临床人员之间的文档工作流程存在显著差异。这种异质性不仅体现在不同项目之间,还体现在同一项目内部的临床人员之间。例如,早期干预项目的临床人员通常能在中心内使用详细的草稿记录,而学校康复项目的临床人员则常常在不可预测的环境中工作,难以制作详细的草稿记录。这种异质性对大语言模型的统一应用构成了挑战。
●系统性文书负担
许多参与者表示,医疗文书负担并非源于撰写SOAP记录本身,而是源于更广泛的系统性因素,如组织政策、技术限制和工作流程低效。例如,新的电子病历平台的引入增加了文书记录的复杂性,导致临床人员需要重复输入相同的信息。此外,组织政策对文书格式和传播方式的严格要求也降低了临床人员记录文书的积极性。

●灵活性与临床人员自主权的需求
临床人员普遍强调,在使用大语言模型辅助文书记录时需要保持灵活性和自主权。许多临床人员已经发展出了高度个性化的工作流程和工具,以适应不同的客户需求。他们担心大语言模型会破坏这些经过时间检验的工作流程,从而降低工作效率。因此,临床人员希望在使用大语言模型时能够保持对文书记录过程的控制。
●相互学习的必要性
研究发现,成功的大语言模型集成需要临床人员和人工智能系统之间的相互学习。临床人员需要了解人工智能系统的能力和局限,以便更有效地使用这些工具。同时,人工智能系统也需要通过不断的学习来适应临床人员多样化的工作流程和文书记录习惯。然而,在实际应用中,这种相互学习的过程往往受到技术设计假设和临床人员实际行为不匹配的限制。

讨论与分析
●社会技术匹配的重要性
研究采用FITT框架(个体-任务-技术匹配框架)进行分析,强调了社交技术匹配在大语言模型集成中的重要性。研究发现,当技术设计假设与临床人员实际行为不匹配时,会导致集成失败和工作效率下降。例如,大语言模型工具通常假设临床人员会提供结构化的草稿记录,但实际上临床人员的草稿记录往往是非正式的、零散的,甚至根本没有。
●组织政策与技术接受度的关系
组织政策对技术接受度有显著影响。研究发现,当组织政策对文书记录提出严格要求时,临床人员可能会对大语言模型工具产生抵触情绪。此外,新的电子病历平台的引入也增加了临床人员的认知负担,降低了他们对新技术的接受度。

结论与启示
本研究揭示了大语言模型在辅助临床记录撰写时所面临的复杂社会技术挑战。尽管大语言模型在理论上具有简化文档流程的潜力,但其成功应用取决于多种因素的综合作用,包括临床人员工作流程的异质性、系统性文书负担、灵活性和自主权的需求以及相互学习的必要性。
未来,在部署和开发用于临床工作流程的大语言模型时,需要采取更加全面的策略。这包括构建能够适应多样化工作流程的灵活工具、投资于面向临床人员的人工智能素养培训以及促进临床人员、开发人员和管理人员之间的持续合作。本研究不仅为儿科职业治疗领域的文书记录提供了见解,也为其它医疗领域的人工智能工具集成提供了重要参考。
如需要《纸上谈兵易,实践行路难:大语言模型在临床记录撰写中的困境》(英文,共14页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。



Whenever you find yourself doubting how far you can go, just remember how far you have come. Remember everything you have faced, all the battles you have won, and all the fears you have overcome. 当你心生疑虑,不知前路还有多远时,不妨回首过往,铭记自己已走过的漫漫长路。回想起那些曾经面对的艰难险阻,那些你一一攻克的挑战,以及那些你成功克服的所有恐惧。早上好!
