图片

随着人工智能系统在多个任务上超越人类表现,生成式人工智能工具在医疗领域的应用日益增多。这些工具能够创建文本、图像和其他内容,对于提高医疗工作效率具有显著潜力。然而,数字健康实践者必须理解这些工具及其局限性。本综述旨在识别和评估文献中讨论的与生成式人工智能技术相关的六大挑战,并提出潜在的解决方案。

 

本文通过对120篇相关文献的系统综述,提出了生成式人工智能在数字健康领域的六大核心挑战,并探讨了应对这些挑战的策略,为数字健康从业者和研究人员提供指导,推动生成式人工智能技术的负责任应用。

 

图片

六大挑战与应对策略:

 

1、算法偏倚

 

生成式人工智能模型可能因训练数据的代表性不足或算法设计缺陷而产生偏倚,导致医疗决策的不公平。例如,特定群体的医疗建议可能因数据不足而不准确。文献指出,目前的去偏倚技术(如数据预处理、算法调整和后处理)虽然有一定成效,但无法完全消除交叉属性的复杂偏倚。

 

应对策略

 

引入多样化数据集并开展多维公平性评估;

 

●跨学科合作,与伦理学家和社会科学家共同制定去偏倚方法;

 

●实施基于“专家反馈的强化学习”,并进行定期审计以确保模型的透明性和公平性。

 

图片

2、数据隐私

 

生成式人工智能的广泛应用对患者隐私提出了挑战。尤其在使用第三方云计算服务时,患者数据可能面临泄露风险。

 

应对策略

 

●推动本地化人工智能架构,减少对外部服务的依赖;

 

●引入联邦学习,允许多个医疗机构在不共享数据的情况下协同训练模型;

 

●开发轻量级人工智能模型,可在本地设备上运行,确保数据安全。

 

图片

3、提示误解与对抗性攻击
生成式人工智能对提示语的依赖可能导致误解用户意图,或被恶意用户通过对抗性提示语操控,生成有害内容。

 

应对策略

 

●加强用户提示语设计的培训,帮助从业人员学习有效提示语策略;

 

●部署防御性算法,如检测对抗性提示语的工具,确保生成内容符合医疗伦理。

 

图片

4、幻觉
生成式人工智能可能产生虚假或不准确的结果,这在医疗场景中尤为危险,可能误导医生或患者。

 

应对策略

 

●将专家纳入模型使用过程,确保关键医疗决策经过人工审核;

 

●调整模型参数,减少输出随机性;

 

●开发基于知识图谱的检索功能,提供有据可查的生成结果。

 

图片5、过度依赖文本模型

当前生成式人工智能的研发主要集中于大语言模型,而忽视了其他类型的数据(如医学影像、基因组数据等)在医疗中的重要作用。

 

应对策略

 

●开发多模态基础模型,支持同时处理文本、图像和生物数据;

 

●在药物研发和遗传学研究中,应用生成式对抗网络等技术生成合成数据,推动多样化应用。

 

6、动态系统的监管挑战

 

生成式人工智能系统具有动态性,可能在使用过程中发生自我调整,超出初始监管范围,增加了医疗设备安全性和有效性的验证难度。

 

应对策略

 

●加强法规建设,如遵守《医疗保险可携带与责任法案》和《通用数据保护条例》要求,明确责任分配;

 

●使用合成数据集代替真实患者数据,减少数据隐私风险;

 

●建立动态评估机制,持续监测模型性能与行为。

 

图片

综上所述,本文明确了生成式人工智能在数字健康应用中的核心挑战,强调了解决这些问题的紧迫性。通过推动多样化数据、加强隐私保护、改进提示语技术和开发多模态模型等措施,可显著提升生成式人工智能在医疗领域的安全性和有效性。随着技术的不断进步和跨学科合作的深入,我们有理由相信,生成式人工智能将在数字健康领域发挥更加重要的作用,为人类的健康事业贡献更多的力量。