图片

一、研究背景与意义

随着医疗信息化的深入发展,电子病历、临床信息系统、实验室数据及监测设备等生成了海量的医疗数据。这些数据蕴含了复杂的患者诊疗路径和临床工作流程,若能有效挖掘,将极大提升医疗质量与效率。然而,医疗数据的复杂性和非结构化特性,使得传统分析方法难以胜任。流程挖掘作为一种结合数据挖掘与业务流程管理的技术,已被广泛应用于医疗领域,如急诊流程分析、手术路径优化和慢性病进展研究。但现有工具如PM4PYbupaR虽功能强大,却因其技术门槛高、输出结果难以解释、缺乏标准化教育框架等问题,限制了其在临床实践中的普及。

在此背景下,本文提出了一种名为医疗流程AI”的新型技术框架,旨在通过集成多种大语言模型,增强医疗流程挖掘的可解释性和可访问性,为临床医生、数据科学家和研究人员提供一种智能化、模块化的分析工具。

二、研究目标与核心贡献

本研究的目标是验证将大语言模型与流程挖掘技术融合的可行性,构建一个能够自动生成临床可解释报告的智能化框架。其核心贡献包括以下三点:

1、多模型解释方法:提出了一种多大语言模型协同工作的流程挖掘结果自动解释方法,具备跨领域推广潜力;

2、结构化的可访问框架:设计了一个集成教育支持、多平台兼容与AI增强解释的标准化框架;

3、概念验证实证研究:以脓毒症进展和慢性肾病患者数据为例,验证了框架的技术可行性和报告生成能力。

图片

三、方法设计:模块化架构与多模型集成

医疗流程AI”采用模块化架构,包含六个核心模块,覆盖从数据准备到报告生成的全流程。该架构兼容PythonR两种主流数据科学语言,支持用户根据自身技术背景选择合适工具。

1、数据加载与准备模块

该模块支持CSV格式的医疗事件日志导入,具备临床数据质量检查、标准化列名定义和患者队列筛选功能,确保数据符合国际医疗信息标准。

2、流程挖掘分析模块

作为PM4PYbupaR的封装模块,支持多种流程发现算法,如直接跟随图、启发式挖掘器、Alpha算法、归纳挖掘器等,并提供针对医疗场景的增强分析功能,如临床路径发现、治疗效果分析、风险分层和资源交接优化。

3、大语言模型集成模块

通过OpenRouter平台,集成了五种主流大语言模型:Claude Sonnet-4GPT-4.1Gemini 2.5 ProDeepSeek R1Grok-4。每种模型根据其优势领域(如临床推理、统计分析、长文本理解等)被赋予不同任务角色,形成互补性解释能力。

4、报告编排模块

采用多模型共识机制,通过投票、差异性分析与信度评估,生成综合报告。该报告不仅汇总各模型的分析结果,还量化分析的不确定性,增强临床决策的可信度。

5、高级分析模块

支持临床路径一致性检测、患者分层、瓶颈识别、预测监控与绩效指标分析,为医疗质量改进提供数据支持。

6、验证框架

设计了六项评估指标(临床准确性、流程理解、可操作建议、统计解释、结构清晰性与循证推理),并通过Claude API实现自动化评估,具备高信效度(科恩κ 系数= 0.87)。

图片

四、实验设计与数据来源

研究采用了两个主要数据源:

PhysioNet 挑战 2019数据:包含40,336ICU患者记录,用于构建脓毒症进展模型;

SCREAM数据库:用于构建慢性肾病患者进展路径,支持PPIH2B药物对比分析。

基于这些数据,研究设计了四个概念验证案例:

●案例1感染/炎症进展分析:根据体温与白细胞状态划分患者路径;

●案例2器官损伤进展分析:基于SOFA评分定义多器官功能障碍路径;

●案例3中度肾病患者进展分析:对比PPIH2B患者的eGFR变化;

●案例4重度肾病患者进展分析:追踪从药物启动到KRT或死亡的完整路径。

图片

五、实验结果与分析

1、流程挖掘算法性能对比

在五种算法中,直接跟随图表现最优,F1分数达0.89,临床可解释性评分为4.2/5.0,处理时间仅为1.2秒。启发式挖掘器和归纳挖掘器也表现良好,而ILP挖掘器因处理时间长、可解释性差,适用性较低。

2、大语言模型生成报告质量评估

共生成20份报告,由五种大语言模型分别评估。Claude Sonnet-4Gemini 2.5 Pro表现最为稳定,平均得分分别为3.823.61Gemini是唯一在所有案例中未出现幻觉的模型。GPT-4.1虽在某些案例中表现良好,但整体评分变异性大。

3、成本效益分析

通过OpenRouter平台,整体成本降低了76%DeepSeek R1性价比最高,每份报告仅需0.02美元;GPT-4.1成本最高,达1.13美元/份。多模型协同策略在保证质量的同时,实现了成本控制。

4、多模型编排报告

编排报告整合了各模型的优势,如Gemini提出的慢燃假说、Claude识别的治疗窗口、DeepSeek的统计强化等。85%的主要发现获得多模型一致支持,增强了结论的可信度。

图片

六、讨论与局限性

医疗流程AI”首次将大语言模型与流程挖掘系统集成,构建了一个兼具技术深度与临床可解释性的分析平台。其模块化设计与教育支持功能,显著降低了技术门槛,提升了医疗数据的可用性。然而,本研究仍存在以下局限性:

1、缺乏临床验证:报告内容尚未经临床专家系统评估,自动化评估虽具高信度,但不等同于临床有效性;

2、样本量有限:仅基于四组案例,结论推广性受限;

3、模型泛化能力:目前仅在脓毒症与肾病中验证,需扩展至其他疾病领域;

4、未纳入实时数据:当前框架基于静态数据,未来需支持实时流式分析;

5、高级分析模块未充分应用:如一致性检验、因果推断等功能尚未在本研究中深入使用。

图片

七、未来展望

研究团队计划开展以下方向的工作:

●与20-30名临床专业人员合作,进行可用性测试与报告质量评估;

●扩展至急诊、手术、慢病管理等更多临床场景;

●引入联邦学习,实现跨机构数据协同分析;

●开发实时流程监控模块,支持临床动态决策;

●探索大语言模型在教育与培训中的应用,提升医疗人员的数据素养。

图片

八、结论

医疗流程AI”是首个将大语言模型与医疗流程挖掘深度集成的技术框架。通过模块化设计、多模型协同与自动化报告生成,该框架有效提升了流程挖掘的可解释性和可访问性。尽管仍需临床验证,但其在教育支持、技术整合与成本控制方面的创新,为未来智能化医疗分析系统提供了坚实基础。随着数据驱动医疗的不断演进,医疗流程AI”有望成为临床流程智能分析的重要工具。

如需要医疗流程AI”:大语言模型增强型医疗流程挖掘技术框架与概念验证》(英文,共24页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。
图片

图片

图片


★ 每日鲜鸡汤  ★

If you spend your time chasing butterflies, they'll fly away. But if you spend your time making a beautiful garden, the butterflies will come to you. When you focus on improving yourself, everything you want will come to you. 若你虚掷光阴逐蝶影,蝶会翩然飞去;若你倾心营造绮花园,蝶自翩跹绕君来。当你专注于自我精进时,心之所念,皆会不期而至。早上好!

图片