
本文提出了一种基于智能体的人工智能端到端医疗数据推理框架,旨在解决当前医疗领域机器学习应用成本高、效率低以及数据隐私保护严格等问题。该框架通过一系列模块化、特定任务的智能体自动化整个临床数据处理流程,从数据采集到最终推理,无需人工干预。
传统的医疗领域机器学习应用流程碎片化且高度依赖人工操作。数据专家的大部分时间都花费在数据预处理、模型选择和管道设置等任务上,而不是模型开发和评估本身。这需要由临床医生、数据工程师、机器学习专家和隐私官组成的庞大跨学科团队,导致高昂的成本和时间延误。此外,医疗数据通常具有多模态、高维和稀疏标注的特点,增加了处理难度。现有的自动机器学习 (AutoML) 框架虽然能够自动化一些基本预处理步骤,但往往缺乏处理临床数据的上下文感知能力,难以应对数据异构性和模型-数据匹配等挑战。
为了克服这些挑战,本文提出的基于智能体AI框架采用了一种模块化、分布式的方法。该框架由多个独立的智能体组成,每个智能体负责一个特定的任务,例如数据采集、数据匿名化、特征提取、模型选择、预处理、模型推理和结果解释等。这些智能体可以协同工作,也可以自主运行,根据数据类型和任务需求动态调整其行为。

具体来说,该框架包含以下几个关键智能体:
●数据采集识别智能体:该智能体负责识别上传文件的类型(例如CSV、Excel、ZIP等),为后续处理提供上下文信息。它利用深度学习模型 Magika 进行文件类型检测,能够处理压缩文件并识别嵌套文件格式。
●数据匿名化智能体:该智能体负责自动检测和移除数据中的个人身份信息 (PII),以确保数据隐私合规。它利用 Google Cloud DLP API 对结构化和非结构化数据进行匿名化处理,对结构化数据进行字段级掩码,对图像数据进行区域级遮蔽。
●特征提取智能体:该智能体负责提取数据的语义特征。对于结构化数据,它直接使用列名作为特征描述符;对于非结构化图像数据,它利用 MedGemma 医学视觉语言模型进行多阶段分类,提取图像模态和疾病类型作为特征描述符。

●模型-数据匹配智能体:该智能体根据提取的特征,从预先构建的模型库中选择最合适的模型。对于结构化数据,它使用 SapBERT 模型生成特征嵌入向量,并利用余弦相似度计算用户数据和模型需求之间的语义相似度,选择最匹配的模型;对于图像数据,它根据图像模态和疾病类型选择合适的模型。
●预处理推荐智能体和预处理执行智能体:这两个智能体负责根据数据类型和模型需求推荐和执行预处理步骤。对于表格数据,预处理步骤基于列类型自动选择;对于图像数据,预处理步骤与所选模型紧密耦合。
●模型推理智能体:该智能体负责运行所选模型进行预测,并生成可解释的结果。它支持表格数据和图像数据,并集成了 SHAP、LIME 和 DETR 注意力图等可解释性工具,提供模型预测的解释性信息。

该框架在老年病学、姑息治疗和结肠镜检查图像等公共数据集上进行了评估,结果表明该框架能够有效地自动化整个数据处理流程,提高效率并降低成本。 例如,在处理结构化焦虑数据和非结构化结肠息肉图像数据时,该框架能够自动进行文件类型检测、数据匿名化、特征提取、模型选择和预处理,最终生成可解释的预测结果。
然而,该框架也存在一些局限性,例如模型-数据匹配过程依赖于语义相似度计算,在处理非标准或模糊的特征时可能存在问题;预处理推荐机制目前是基于规则的,缺乏学习能力;以及框架依赖云端基础设施等。未来的工作将着重于改进模型-数据匹配算法、开发更智能的预处理推荐机制、支持本地化部署以及建立更完善的评估标准和问责机制。

从伦理角度来看,该框架目前的匿名化机制主要依赖于 Google Cloud DLP API,未来需要增强其适应不同地区数据隐私法规的能力,并支持本地化数据处理,以确保数据主权。 此外,由于决策过程分散在多个智能体中,需要建立清晰的治理结构和审计跟踪机制,以确保责任可追溯。
总而言之,本文提出的基于智能体的AI框架为医疗领域的可扩展、语义智能和符合伦理的人工智能系统提供了一个蓝图。通过在数据处理流程的每个阶段嵌入自主推理能力,该框架有望加速安全、可解释和具有成本效益的临床人工智能的应用。然而,要实现其在真实临床环境中的广泛应用,还需要进一步解决其局限性并进行更全面的评估。