图片

本文作者团队来自哈佛医学院、阿斯利康公司等机构。该项研究提出了一种名为“迈瑞格”的多模态人工智能模型,旨在通过整合药物结构、分子路径、细胞活力和转录组数据等多模态临床前数据,预测药物组合的临床疗效和安全性。“迈瑞格”模型针对953种临床效果和21,842种化合物的药物组合进行预测,涵盖已批准药物和在研新药,显著提升了药物组合疗法设计的预测准确性和临床相关性。研究通过多种实验验证了“迈瑞格”在药物相互作用预测、癌症个性化治疗以及慢性代谢疾病多重用药管理中的应用潜力,为加速精准医疗的发展提供了重要工具。

 

现有方法的局限性:

 

现有的药物组合疗效预测模型主要依赖于基于结构或靶点的特征,无法充分整合预测临床疗效所需的多种模态数据。这些方法忽略了药物组合的复杂药效学相互作用,导致预测精度不足,尤其是在预测新型化合物疗效方面存在显著不足。新型化合物通常缺乏完整的临床安全数据、长期疗效和药代动力学数据,这给准确预测药物相互作用和治疗效果带来了巨大挑战。

 

图片

“迈瑞格”模型的创新:

 

“迈瑞格”模型的核心创新在于其多模态整合能力和对缺失数据的处理机制。该模型通过一个Transformer瓶颈模块来统一预临床药物数据的不同模态,并在训练和推理过程中有效地处理缺失数据——这是多模态学习中的一个主要挑战。“迈瑞格”采用对比学习方法对不同模态的药物表示进行对齐,学习一个统一的多模态潜在空间,从而提高了预测的准确性。此外,“迈瑞格”还可以与大语言模型 (LLM) 集成,从而能够处理超出预定义医学词汇和标准化本体的临床疗效描述。

 

图片

模型架构和训练过程:

 

“迈瑞格”模型包含三个主要阶段:

 

●模态特异性编码器初始化和适应: 使用不同类型的编码器(例如,异构图、Transformer、图同构网络、多层感知器等)分别处理不同模态的数据,并通过各自的预训练任务进行初始化和适应。

 

●对比预训练: 使用对比学习目标函数对不同模态的药物表示进行对齐,以确保不同模态的表示能够在统一的潜在空间中有效地融合。结构信息作为锚点,其他模态的表示与其进行对齐。

 

●模型微调: 使用Transformer编码器进行模态融合,并通过瓶颈模块处理转录组数据的高维性。最终,使用双线性解码器或大语言模型解码器来预测临床效果。

 

图片

实验结果和应用:

 

文章对“迈瑞格”模型进行了广泛的评估,结果表明其在预测药物相互作用方面优于单模态方法和现有的最先进模型。具体而言,“迈瑞格”在TWOSIDESDrugBank两个数据集上都取得了显著的性能提升,尤其是在处理缺失数据和预测新型化合物疗效方面表现出色。

 

“迈瑞格”模型的应用涵盖多个领域:

 

●药物安全性预测: “迈瑞格”能够准确预测药物组合的安全性,包括预测药物诱导的肝损伤、心脏毒性和QT间期延长等。它还能有效识别由转运蛋白介导的药物相互作用。

 

●肿瘤药物组合疗效预测: “迈瑞格”能够预测多聚ADP核糖聚合酶抑制剂等抗癌药物组合的疗效和安全性,并通过整合患者基因组信息,实现个性化癌症治疗。

 

●慢性代谢疾病治疗: “迈瑞格”被用于研究用于治疗II型糖尿病和代谢功能障碍相关性脂肪性肝炎的药物组合,并预测了瑞司美妥” (首个获批治疗代谢功能障碍相关性脂肪性肝炎的药物) 的安全性和疗效。

 

●与大语言模型集成: 将“迈瑞格”与大语言模型集成,可以利用自然语言描述临床疗效,从而提高安全性评估的灵活性,并预测超出预定义医学词汇的临床疗效。

 

图片

结论和未来展望:

 

“迈瑞格”模型为药物组合疗效和安全性的预测提供了一种多模态方法,显著提高了预测的准确性和临床相关性。它为药物组合的设计、安全性评估和治疗选择提供了新的工具。然而,该模型也存在一些局限性,例如训练数据在适应症方面缺乏特异性,以及没有明确考虑药物剂量等。未来的研究可以专注于解决这些局限性,例如整合适应症特异性信息、考虑药物剂量和给药方案,以及进一步提高模型的泛化能力。此外,整合更多类型的临床前数据和临床数据,以及利用更先进的模型架构,都有可能进一步提高“迈瑞格”模型的预测能力。