
这篇题为《从提示词到平台:用于医疗模拟场景设计的智能体型人工智能工作流》的文章,探讨了一种创新的人工智能驱动型智能体工作流,旨在显著提高医疗模拟场景设计的效率和一致性。该研究由意大利诺瓦拉“辛诺瓦”模拟中心完成,旨在解决传统医疗模拟场景设计耗时费力的问题——通常需要24小时准备一个10-20分钟的场景。
文章首先回顾了大语言模型如ChatGPT在简化场景设计方面的潜力,但也指出了人工智能(AI)生成内容在准确性、相关性和结构连贯性方面的潜在问题。为解决这些问题,研究人员开发了一个基于AI的智能体工作流程,该流程从最初基于ChatGPT的原型发展到一个利用多个专业AI智能体的复杂平台实现。
该系统的第一阶段是一个基于ChatGPT的自定义GPT,名为“场景设计器”。该原型通过一系列结构化提示词引导用户,系统地获取关键参数,如临床病例类型、目标学习者群体和具体的学习目标。这种结构化方法确保了AI生成的内容符合标准化格式,并全面涵盖了有效模拟场景所需的所有关键要素。该原型允许教育者在每个开发阶段审查和改进AI的输出,确保了严格的人工监督和临床及教学准确性。2024年12月,该原型通过利用ChatGPT的Canvas功能进行了增强,允许用户直接在Web界面中修改场景结构,从而实现更动态和响应式的设计过程。

然而,第一阶段的ChatGPT原型也存在局限性:它完全包含在ChatGPT环境中,限制了与外部系统和工作流程的集成;它仅依赖于OpenAI模型,无法探索其它大语言模型架构;它缺乏与文档创建工具的连接;其输出仅限于文本,无法自动生成视觉元素。
为了克服这些限制,研究人员转向了第二阶段,即开发了一个完全代理的AI工作流程,该流程利用了n8n——一个无代码开源平台。n8n平台的开放源码特性消除了许可成本,并提供了对工作流程操作的完全透明度;其自托管能力使模拟中心能够完全控制其数据和基础设施;n8n与各种大语言模型提供商(包括OpenAI、Anthropic、Google等)的集成能力避免了供应商锁定,并允许随着新模型的出现进行调整。
值得注意的是,整个开发过程由一位具有基本编码知识但没有专门AI专业知识的重症监护医生和医疗模拟教育者完成。这证明了具有适度技术技能的医疗模拟教育者可以在无需专门的AI专家或软件工程师的情况下成功实施复杂的AI工作流程。

该工作流程利用了AI模型的战略组合,以优化性能和成本效益。系统主要利用GPT-4o进行需要特殊功能的工具调用智能体,利用Gemini 2.0 Flash和Pro进行主要工作流程组件(由于其广泛的上下文令牌容量和免费可用性),并利用Anthropic Claude 3.7 Sonnet进行审查和最终编辑,以确保高质量的输出。研究人员还测试了一个由Qwen QWQ 32B和Mistral Small 3驱动的完整的本地大语言模型系统,取得了类似的结果,但由于硬件限制,执行时间更长。
n8n中的智能体工作流程旨在模仿复杂的多步骤推理过程,大量借鉴了基于智能体的AI系统的原理。其核心概念包括:分解(子智能体)、提示链(具有上下文传递的顺序执行)、并行化(并发执行)、检索增强生成(RAG)、工具使用(外部API调用和数据转换)以及迭代细化(审阅者智能体和反馈循环)。
该工作流程通过类似于熟悉聊天体验的对话界面运行,确保最终用户不会遇到复杂编码界面或技术障碍。核心是一个具有高级检索增强生成功能和对专用工具访问权限的初始智能体,作为前端界面。教育者提供基本场景要求,包括标题、主要问题/诊断、目标学习者群体、SimZone分类、模拟位置、具体的学习目标、所需的关键行动、详细的患者特征和首选语言输出。该智能体执行检索增强生成,搜索相关数据库并将结果综合成一个全面的研究输出参数,为后续工作流程提供信息。

之后,系统激活专门的场景设计器n8n工作流程,该流程协调一系列相互关联的AI智能体:场景大纲和目标智能体、角色和资源智能体、场景患者和简报创建智能体、场景状态智能体、教育内容智能体、审阅者智能体和编辑器智能体。这些智能体并行工作,生成一个连贯的、符合标准的模拟场景。
该系统具有广泛的潜在应用范围,可应用于各种临床环境和学习者水平,并支持多语言输出能力。该文详细介绍了实施和使用说明,包括访问n8n平台、获取AI模型的API密钥以及对AI生成场景进行严格审查的必要性。
文章还讨论了潜在的陷阱和解决方法,例如AI生成内容中的不准确性、AI模型输出中的偏差以及n8n平台或AI模型本身的技术问题。为了减轻这些风险,研究人员强调了人工监督、提示词改进和公平代表权的重要性。

资源需求和成本估算方面,文章指出,实施需要访问n8n平台和AI模型的API,这会产生成本。然而,显著减少场景开发时间所带来的潜在成本节省可能抵消平台和API访问的直接成本。初步估计表明,该系统将场景开发时间减少了约70-80%。自托管方法与本地大语言模型为具有频繁场景开发需求的中心提供了最具成本效益的长期解决方案,因为它消除了持续的API费用。
最后,文章总结了经验教训,强调了跨学科合作、迭代提示词改进、必要的人工监督以及在医疗教育中普及AI工具的重要性。该项目证明,复杂的AI实现对于医疗模拟来说是可行的,即使没有专门的技术专业知识或外部顾问。这对于在医疗教育中普及AI工具具有深远的影响,可能会加速不同环境和资源水平的创新和采用。
如需要《从提示词到平台:用于医疗模拟场景设计的智能体型人工智能工作流》(英文,共9页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。



Keep your mind on the goal and your heart on the why. 心怀目标,情系初衷。早上好!
