图片

本研究旨在开发并验证一种全自动化的多智能体人工智能(AI)工作流,用于从真实世界数据(特别是临床记录)中识别认知障碍。该研究采用了LLaMA 3 8 B这一大语言模型(LLM),针对来自布莱根妇女医院的3338份临床记录进行了深入分析。研究团队来自美国麻省总院、布莱根妇女医院、哈佛医学院等机构。

研究背景与意义

随着人口老龄化的加剧,认知障碍如痴呆症的发病率逐年上升,给社会和个人带来了巨大的负担。早期准确识别认知障碍对于制定有效的治疗和管理策略至关重要。然而,传统的识别方法往往依赖于医生的临床经验和患者的自我报告,这不仅耗时费力,而且容易受到主观因素的影响。因此,开发一种高效、准确的自动化识别工具显得尤为重要。

图片

研究方法

本研究提出了一种创新的多智能体AI工作流程,该流程由六个专门化的智能体组成,它们能够动态协作,从临床记录中提取有意义的信息。这些智能体包括初始提示生成器、特异性提升器、敏感性提升器、总结器、精确性提升器和最终决策者。每个智能体都承担着特定的任务,如优化提示、减少假阳性/假阴性案例等,以共同提高识别认知障碍的准确性。

在数据方面,研究团队收集了201611日至20181231日期间的3338份临床记录,这些记录来自200名患者。这些记录被用于训练和测试多智能体AI工作流程,并与专家驱动的工作流程进行了比较。

图片

研究结果
研究结果显示,多智能体AI工作流在识别认知障碍方面表现出色。与专家驱动的工作流相比,该流程在敏感性(0.87)、特异性(0.91)、精确性(正预测值为0.93,负预测值为0.93)和总体准确性(0.89)等方面均达到了较高水平。这意味着该流程能够准确地区分认知障碍患者和非患者,为临床决策提供了有力支持。

此外,研究还评估了多智能体AI工作流程的泛化能力。通过将工作流程应用于不同数据集,研究团队发现该流程在不同临床文书中具有良好的适应性和稳定性,进一步证明了其在实际应用中的潜力。

讨论与展望

本研究表明,全自动化的多智能体AI工作流程在识别认知障碍方面具有显著优势。与传统方法相比,该流程不仅提高了识别准确性,还大大提高了效率,降低了成本。这为认知障碍的早期筛查和管理提供了新的途径。

图片

然而,研究也存在一些局限性。例如,大语言模型的敏感性可能受到源数据(如电子病历)性质的限制,因为认知障碍在正式诊断前往往不被患者自我报告,而是由护理人员或家庭成员在常规初级保健访问期间观察到或专门护理期间偶然注意到。此外,虽然多智能体AI工作流程在多个数据集上表现出良好的泛化能力,但仍需进一步研究和验证以确保其在不同临床场景中的稳定性和可靠性。
未来研究可以进一步探索多智能体AI工作流程的优化和改进方法,如通过引入更多专门化的智能体来提高识别准确性;同时,也可以考虑将该工作流程与其他医疗信息系统相结合,以实现更加全面和高效的认知障碍管理策略。此外,随着大语言模型的不断发展和完善,未来有望开发出更加智能、高效的AI工具来辅助临床决策和患者管理。

图片

综上所述,这项研究为认知障碍的自动化识别提供了新的思路和方法,具有重要的理论和实践意义。随着技术的不断进步和应用场景的拓展,多智能体AI工作流程有望在认知障碍管理领域发挥更加重要的作用。
如需要《用于检测真实世界数据中认知问题的智能体AI工作流》(英文,共22页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。

图片


图片


图片


★ 每日鲜鸡汤  ★

The first to apologize is the bravest. The first to forgive is the strongest. The first to forget is the happiest. 最先道歉之人具勇者之姿,最先宽恕之人具强者之魄,最先释怀之人具乐者之境。早上好!

图片