
这篇题为《在卫生经济学和结果研究中利用生成式人工智能:技术与突破的入门指南》探讨了生成式人工智能,特别是大语言模型,在卫生经济学和结果研究领域的应用潜力及其挑战。文章旨在为卫生经济学者提供使用生成式人工智能工具的入门指导,特别是针对那些缺乏生成式人工智能经验的研究人员。
文章首先介绍了人工智能、机器学习、深度学习和生成式人工智能的基本概念,并阐明了大语言模型作为生成式人工智能的一个分支,其核心功能是预测下一个词元(token),通过处理海量文本数据来理解上下文和含义,从而生成类似人类语言的文本。文章强调了大语言模型与传统AI的主要区别,包括训练过程、学习过程、数据集需求、成本、计算资源、应用范围和用途等方面。文章特别指出,大语言模型能够通过少量样本学习甚至零样本学习来执行任务,并能够通过复杂的提示词工程策略进行调整以适应特定任务。

文章接下来详细介绍了大语言模型在卫生经济学和结果研究中的应用,包括文献综述、数据提取、报告撰写、统计代码生成、问题解答和质量审查等方面。文章指出,对于生成式人工智能新手来说,ChatGPT等聊天机器人界面提供了一种易于上手的方式来探索大语言模型的潜力。然而,对于更复杂的项目,需要掌握应用程序编程接口,以实现可扩展性和集成能力,并掌握提示词工程策略,例如少样本提示和思维链提示,以确保准确高效的数据分析,提高模型性能,并根据具体的HEOR需求定制输出。检索增强生成技术可以进一步提高大语言模型的性能,因为它允许模型从外部来源(例如,政策文件或临床指南)检索事实信息,而不是仅仅依赖其训练数据集来生成应答。
文章也强调了大语言模型的局限性,例如产生不准确信息(“幻觉”)、安全问题、可重复性问题和偏差风险等。在卫生经济学和结果研究中实施大语言模型需要强大的安全协议来处理敏感数据,以符合欧盟的《通用数据保护条例》和美国的《健康保险携带和责任法案》。文章讨论了多种部署方案,例如本地托管、安全API使用或云托管的开源模型,每种方案在安全、可及性和技术要求方面都有其独特的权衡。

为了确保大语言模型生成内容的可信度,文章建议明确声明模型版本、提示词技术以及与既定标准的基准测试结果。鉴于大语言模型的“黑盒”特性,清晰的报告结构对于保持透明度和验证输出至关重要,使利益相关方能够评估大语言模型生成的卫生经济学和结果研究分析的可靠性和准确性。
文章还深入探讨了在卫生经济学和结果研究中使用人工智能(包括大语言模型)的伦理意义,包括问责制、偏见、知识产权以及对医疗保健体系的更广泛影响等问题。文章指出,卫生经济学者必须权衡采用人工智能的潜在益处与维持现有实践的风险,同时还要考虑问责制、偏见、知识产权以及对医疗保健体系的更广泛影响等问题。

文章展望了生成式人工智能在卫生经济学和结果研究中的未来作用,包括创建动态的、持续更新的卫生经济学和结果研究材料、为患者提供更易于获取的信息以及增强分析以更快地获得药物等。为了最大限度地发挥这些益处,卫生经济学者必须理解并解决数据所有权和偏差等挑战。文章鼓励卫生经济学者负责任地采用生成式人工智能,在创新与科学严谨性和伦理完整性之间取得平衡,以改善医疗保健洞察力和决策。文章最后总结指出,未来几年对于在卫生经济学和结果研究中建立生成式人工智能最佳实践至关重要,需要制定方法学标准和伦理框架,以确保生成式人工智能能够支持卫生经济学和结果研究实践的完整性和透明度,造福患者。 文章也强调了在使用大语言模型时,需要采取多种策略来提高可重复性和降低偏差,例如调整温度参数、采用自一致性方法、设置随机种子、使用不同的大语言模型以及选择合适的大语言模型等。