研究报告:《生成式人工智能在健康经济学和结果研究中的应用:关键定义和新兴应用的分类》
2025年1月16日
![图片]()
这份由国际药物经济学和结果研究学会工作组撰写的研究报告《生成式人工智能在健康经济学和结果研究中的应用:关键定义和新兴应用的分类》探讨了生成式人工智能(Generative AI)在“健康经济学和结果研究”领域的应用,以及如何提高人工智能生成结果的准确性和可靠性。报告首先对人工智能、机器学习、生成式人工智能和基础模型(包括大语言模型)等核心概念进行了定义,阐明了它们在健康经济学和结果研究中的关联性。
报告的核心部分集中在生成式人工智能在健康经济学和结果研究中的应用,涵盖了系统综述、健康经济模型、真实世界证据生成和报告编写等多个方面。
![图片]()
●在系统综述方面:生成式人工智能可以辅助文献检索策略制定、摘要和全文文章筛选、偏倚评估、数据提取以及定量荟萃分析代码生成等。虽然人工智能可显著提高效率,但仍存在“幻觉”、虚假引用等问题,需要人工验证和监督。●在健康经济模型方面:生成式人工智能可以总结现有经济模型、提取模型参数、创建新的健康经济模型,甚至进行结构不确定性分析。一个例子是,基础模型可以复制已发表的健康经济模型,包括模型结构、参数识别、代码开发和结果评估。然而,人类专业知识仍然必不可少,需要建立人工智能生成模型的准确性和可靠性标准。
![图片]()
●在真实世界证据生成方面:生成式人工智能可以从非结构化的电子病历中提取信息,加速数据整合,减少人工干预和错误。一些专门针对临床文本训练的模型在提取信息方面表现更佳。然而,将描述性文本映射到医学代码的准确性仍然是一个挑战,需要进一步改进。通过整合多模态数据源(包括影像学和基因组信息),人工智能模型可以构建更全面的数据集。●在报告编写方面:生成式人工智能可以提高报告撰写效率,生成符合特定风格和要求的文档,并根据不同利益相关者定制信息。其语言无关性使其能够生成适用于不同国家的报告,并简化国际提交和沟通。
![图片]()
报告还介绍了几种提升和优化生成式人工智能在健康经济学和结果研究中应用的技术:●令牌化:理解大语言模型如何处理文本的基本单元(令牌),对于优化提示语、数据提取和报告生成至关重要。
●提示语工程:通过设计指令(提示语)来引导大语言模型生成特定输出,包括零样本提示、少样本提示、思维链提示和角色模式提示等多种策略。
●模型微调:使用目标数据集对预训练的大语言模型进行额外训练,以提高其在特定任务上的性能。这包括指令微调和基于人类反馈的强化学习。
●领域特定基础模型:使用特定领域的数据训练基础模型,例如,使用临床记录和生物医学文献训练的模型在临床命名实体识别、推理和文本摘要等任务上表现更佳。
●检索增强生成:将大语言模型的广阔知识库与精确的领域特定数据检索相结合,确保应答不仅来自内部数据集,而且还与最新的外部参考信息进行了交叉验证。
![图片]()
报告最后也指出了生成式人工智能在健康经济学和结果研究应用中的局限性:●科学有效性和可靠性:人工智能模型生成的输出在准确性和可靠性方面存在差异,需要人工监督和验证。
●偏倚和公平性:人工智能模型可能无意中延续或加剧训练数据中存在的偏倚,导致不公平的治疗或资源分配。需要持续监控和更新模型,以确保公平性和公正性。
![图片]()
总之,该研究报告为健康经济学和结果研究界提供了一个关于人工智能,特别是生成式人工智能的关键概念的分类体系。生成式人工智能和基础模型,通过简化工作流程、提高生产力,并为复杂问题提供创新解决方案,能够显著增强健康经济学和结果研究。然而,这项技术并非没有挑战。随着技术的发展,批判性地评估人工智能输出的有效性和可靠性、积极解决偏见问题,并确保遵守伦理和监管标准至关重要。报告提出了一些高级技术,用于提高使用生成式人工智能工具的输出准确性。对于健康经济学和结果研究专业人士来说,接受生成式人工智能和基础模型不仅涉及采用新技术,还需要对不断发展的领域进行持续教育和跨学科合作。未来,人工智能整合到健康经济学和结果研究中应伴随强大的验证框架、偏见缓解和伦理监督,确保这些强大工具的有用性、透明度、可信度,并最终通过识别公平和有效的医疗解决方案来改善患者健康结果,造福人类。