图片


66日,麻省理工学院与Recursion共同宣布推出一款突破性的AI+药物研发模型Boltz-2用于预测药物靶标 3D 结构以及结合亲和力。

 

新闻稿中称,Boltz-2 已经超越现有生物分子结构预测模型包括之前业界所熟知的AlpphaFold3

 

也就是说,Boltz-2是第一个接近基于物理的自由能扰动FEP的深度学习模型,在各项测试中预测性能媲美FEP,与此同时预测速度提高了 1000 

 

团队称,这项工作标志着计算机筛选的新时代能够显著提升分子筛选的速度和规模,直接解决了小分子发现的关键瓶颈。

 

目前,该项目已经开源,包括模型、权重可不受限制地用于学术和商业用途。


团队表示,已经迫不及待地看到科学家们发挥出想象力,将其集成到工作流中。

 

开源模型:github.com/jwohlwend/boltz
预印本:http://jeremywohlwend.com/assets/boltz2.pdf

 

业界首个媲美物理方法模型

 

当前小分子药物研发中,结合亲和力决定了药物能否与靶点相互作用,从而发挥治疗作用。

 

基于物理的FEP预测模型虽然准确,但速度很慢但成本高昂,而长期以来深度学习模型的可靠性和准确度无法匹敌。


因此,业界希望出现能够精准预测分子之间相互作用的模型。

 

如今,Boltz-2 作为下一代生物分子基础模型,被认为是有望解决这一难题的关键。

 

AI模型麻省理工学院计算机科学与人工智能实验室上市AI制药公司Recursion 一起开发双方在Boltz-1的基础之上,通过改进和拓展性能而来。

 

简单来说,Boltz 与 AlphaFold3 一样,均是一种全原子共折叠模型,它将蛋白质折叠或结构预测的概念扩展到DNARNA、配体。该模型不仅可以预测分子相互作用的 3D 结构,可用于分子设计等下游任务。

 

一般而言,结构和亲和力被视为单独的AI模块,但Boltz-2将亲和力预测与结构建模相结合,提高了预测结构的物理真实感。该模型还支持通过接触约束、模板引导和特定于方法让用


 

图片

Boltz-2 模型架构图

 


Boltz-2 在一个大型数据集上进行了训练,该数据集结合了 500 万个结合亲和力测量值、分子动力学模拟和蒸馏数据这些方法显著提高了预测结构的物理真实感。

 

在标准 FEP+ 亲和力基准测试中,Boltz-2 实现了 0.62 的平均 Pearson相关系数,能够与可开源 FEP 流程 OpenFE 相媲美在速度方面,Boltz-2 只需 20 秒即可计算出结合亲和值,比当前FEP 预测1000倍

 

 

图片

Boltz-2的测试性能表现

 

 CASP16 亲和力挑战测试中,Boltz-2 在预测 140 种复合物的结合亲和力方面优于所有专门方法。在回顾性筛选 (MF-PCBA) 中,Boltz-2 的表现显著优于机器学习和对接,平均精度提高了一倍。


图片

CASP16 亲和力挑战基准测试

 

以著名的TYK2靶点为例,通过Boltz-2AI分子生成模型连用,能够实现大规模进行筛选。而该组合预测所有排名前10的化合物均能与靶点结合,也证明了Boltz-2可集成到药物研发工作流中。


图片

预测TKY2结合亲和力


此外,它在 DNA-蛋白质、RNA 和抗体-抗原系统上也表现良好,由于Boltz-2 学习了大量分子动力学(MD)数据,更有效地捕捉到分子动态。

 

将达到实验室级的准确性

 

目前该项目已经开源,包含模型权重和训练代码,研究人员可以自行部署该模型,可广泛用于学术和科研用途。

 

尽管Boltz-2 目前定位于解决小分子药物发现团队希望随着该模型的发布结构生物学预测将不再是科学家们的拦路虎并且所有人都可以广泛使用。

 

第一作者Gabriele Corso甚至表示,该模型只是一个起点,他预计此类 AI 模型将在一到两年内达到实验级准确性的结合亲和力预测。

 

但显然,Boltz-2依旧无法取代湿实验,真实的实验结果仍然是判断分子亲和力的最终标准。

 

但团队已经迫不及待地看到,科学家们能够进一步构建该模型,并将其扩展到工作流中,切实地帮助药物研发。


推荐阅读