
一、研究背景与意义
随着医疗信息化的深入发展,电子病历、临床信息系统、实验室数据及监测设备等生成了海量的医疗数据。这些数据蕴含了复杂的患者诊疗路径和临床工作流程,若能有效挖掘,将极大提升医疗质量与效率。然而,医疗数据的复杂性和非结构化特性,使得传统分析方法难以胜任。流程挖掘作为一种结合数据挖掘与业务流程管理的技术,已被广泛应用于医疗领域,如急诊流程分析、手术路径优化和慢性病进展研究。但现有工具如PM4PY和bupaR虽功能强大,却因其技术门槛高、输出结果难以解释、缺乏标准化教育框架等问题,限制了其在临床实践中的普及。
在此背景下,本文提出了一种名为“医疗流程AI”的新型技术框架,旨在通过集成多种大语言模型,增强医疗流程挖掘的可解释性和可访问性,为临床医生、数据科学家和研究人员提供一种智能化、模块化的分析工具。
二、研究目标与核心贡献
本研究的目标是验证将大语言模型与流程挖掘技术融合的可行性,构建一个能够自动生成临床可解释报告的智能化框架。其核心贡献包括以下三点:
1、多模型解释方法:提出了一种多大语言模型协同工作的流程挖掘结果自动解释方法,具备跨领域推广潜力;
2、结构化的可访问框架:设计了一个集成教育支持、多平台兼容与AI增强解释的标准化框架;
3、概念验证实证研究:以脓毒症进展和慢性肾病患者数据为例,验证了框架的技术可行性和报告生成能力。

三、方法设计:模块化架构与多模型集成
“医疗流程AI”采用模块化架构,包含六个核心模块,覆盖从数据准备到报告生成的全流程。该架构兼容Python和R两种主流数据科学语言,支持用户根据自身技术背景选择合适工具。
1、数据加载与准备模块
该模块支持CSV格式的医疗事件日志导入,具备临床数据质量检查、标准化列名定义和患者队列筛选功能,确保数据符合国际医疗信息标准。
2、流程挖掘分析模块
作为PM4PY和bupaR的封装模块,支持多种流程发现算法,如直接跟随图、启发式挖掘器、Alpha算法、归纳挖掘器等,并提供针对医疗场景的增强分析功能,如临床路径发现、治疗效果分析、风险分层和资源交接优化。
3、大语言模型集成模块
通过OpenRouter平台,集成了五种主流大语言模型:Claude Sonnet-4、GPT-4.1、Gemini 2.5 Pro、DeepSeek R1和Grok-4。每种模型根据其优势领域(如临床推理、统计分析、长文本理解等)被赋予不同任务角色,形成互补性解释能力。
4、报告编排模块
采用多模型共识机制,通过投票、差异性分析与信度评估,生成综合报告。该报告不仅汇总各模型的分析结果,还量化分析的不确定性,增强临床决策的可信度。
5、高级分析模块
支持临床路径一致性检测、患者分层、瓶颈识别、预测监控与绩效指标分析,为医疗质量改进提供数据支持。
6、验证框架
设计了六项评估指标(临床准确性、流程理解、可操作建议、统计解释、结构清晰性与循证推理),并通过Claude API实现自动化评估,具备高信效度(科恩κ 系数= 0.87)。

四、实验设计与数据来源
研究采用了两个主要数据源:
●PhysioNet 挑战 2019数据:包含40,336条ICU患者记录,用于构建脓毒症进展模型;
●SCREAM数据库:用于构建慢性肾病患者进展路径,支持PPI与H2B药物对比分析。
基于这些数据,研究设计了四个概念验证案例:
●案例1:感染/炎症进展分析:根据体温与白细胞状态划分患者路径;
●案例2:器官损伤进展分析:基于SOFA评分定义多器官功能障碍路径;
●案例3:中度肾病患者进展分析:对比PPI与H2B患者的eGFR变化;
●案例4:重度肾病患者进展分析:追踪从药物启动到KRT或死亡的完整路径。

五、实验结果与分析
1、流程挖掘算法性能对比
在五种算法中,直接跟随图表现最优,F1分数达0.89,临床可解释性评分为4.2/5.0,处理时间仅为1.2秒。启发式挖掘器和归纳挖掘器也表现良好,而ILP挖掘器因处理时间长、可解释性差,适用性较低。
2、大语言模型生成报告质量评估
共生成20份报告,由五种大语言模型分别评估。Claude Sonnet-4和Gemini 2.5 Pro表现最为稳定,平均得分分别为3.82和3.61。Gemini是唯一在所有案例中未出现幻觉的模型。GPT-4.1虽在某些案例中表现良好,但整体评分变异性大。
3、成本效益分析
通过OpenRouter平台,整体成本降低了76%。DeepSeek R1性价比最高,每份报告仅需0.02美元;GPT-4.1成本最高,达1.13美元/份。多模型协同策略在保证质量的同时,实现了成本控制。
4、多模型编排报告
编排报告整合了各模型的优势,如Gemini提出的“慢燃”假说、Claude识别的治疗窗口、DeepSeek的统计强化等。85%的主要发现获得多模型一致支持,增强了结论的可信度。

六、讨论与局限性
“医疗流程AI”首次将大语言模型与流程挖掘系统集成,构建了一个兼具技术深度与临床可解释性的分析平台。其模块化设计与教育支持功能,显著降低了技术门槛,提升了医疗数据的可用性。然而,本研究仍存在以下局限性:
1、缺乏临床验证:报告内容尚未经临床专家系统评估,自动化评估虽具高信度,但不等同于临床有效性;
2、样本量有限:仅基于四组案例,结论推广性受限;
3、模型泛化能力:目前仅在脓毒症与肾病中验证,需扩展至其他疾病领域;
4、未纳入实时数据:当前框架基于静态数据,未来需支持实时流式分析;
5、高级分析模块未充分应用:如一致性检验、因果推断等功能尚未在本研究中深入使用。

七、未来展望
研究团队计划开展以下方向的工作:
●与20-30名临床专业人员合作,进行可用性测试与报告质量评估;
●扩展至急诊、手术、慢病管理等更多临床场景;
●引入联邦学习,实现跨机构数据协同分析;
●开发实时流程监控模块,支持临床动态决策;
●探索大语言模型在教育与培训中的应用,提升医疗人员的数据素养。

八、结论
“医疗流程AI”是首个将大语言模型与医疗流程挖掘深度集成的技术框架。通过模块化设计、多模型协同与自动化报告生成,该框架有效提升了流程挖掘的可解释性和可访问性。尽管仍需临床验证,但其在教育支持、技术整合与成本控制方面的创新,为未来智能化医疗分析系统提供了坚实基础。随着数据驱动医疗的不断演进,“医疗流程AI”有望成为临床流程智能分析的重要工具。



If you spend your time chasing butterflies, they'll fly away. But if you spend your time making a beautiful garden, the butterflies will come to you. When you focus on improving yourself, everything you want will come to you. 若你虚掷光阴逐蝶影,蝶会翩然飞去;若你倾心营造绮花园,蝶自翩跹绕君来。当你专注于自我精进时,心之所念,皆会不期而至。早上好!
