
2020年AlphaFold2横空出世横扫CASP14,彻底改变了AI+生物学。
基于AlphaFold2里程碑式研究成果,领导该项目的Demis Hassabis,也由此获得了2024年诺贝尔化学奖。
去年,Isomorphic Labs宣布与跨国制药巨头礼来和诺华达成了两项价值30亿美元的药物发现协议,涉及针对多种疾病和靶点的创新疗法,最近诺华还进一步扩大了双方的合作范围。
就在最近,该公司的首席人工智能官Max Jaderberg博士参加了红衫资本的播客节目,并和合伙人Stephanie Zhan进行对谈,分享了他对于AI+药物研发的看法。
在投身于AI+药物研发之前,Max Jaderberg是深度学习领域的大牛,与Demis Hassabis共事超过十几年。此前他主要研究强化学习(RL)在游戏领域的应用,取得了“夺旗”(Capture the Flag)和 AlphaStar 等里程碑式的突破。
关于AI+药物研发,他表示:
1、Isomorphic Labs正在试图用AI创建一个非常通用的药物设计引擎,不仅能用于单一靶点或单一药物类型,更能反复应用于任何不同的疾病领域。
3、如果要做到AI彻底改变生物学以及药物研发范式,需要6个AlphaFold2级别的成果。
4、生物学的GPT3时刻——意味着AI能够设计出基于物理现实、但又超出人类直觉的分子。就像AlphaGo与李世石对弈时下出的神之第37手。
5、随着AI在医药的逐渐成功,5年后,整个行业不借助AI就无法设计药物。就像不借助数学无法进行科学研究。
以下是对播客内容的编译(有删减)
构建通用AI药物研发引擎
Stephanie Zhan:如果一切顺利,你实现了对 Isomorphic 的愿景,那么世界会是什么样子?
Max Jaderberg:我们希望我们正在构建的AI技术,将彻底改变我们理解生物学的方式,以及我们研究化学以调节生物学的能力。
因此,我们真正考虑的是解决所有疾病,未来AI不仅帮助我们发现、创造和设计新的治疗方法,而且还更多地了解我们的生物世界,我们的细胞是如何工作的,疾病的根本原因是什么,从而开辟我们可以考虑调节的新途径。
所以我们从第一天成立公司开始,真正追求的不是针对特定适应症或特定靶点开发治疗方法,而是真正思考如何利用AI创建一个非常通用的药物设计引擎,不仅可以应用于单个靶点甚至单一疗法,而且可应用于任何不同的疾病领域。这就是我们目前正在努力的方向。
Stephanie Zhan:有着这样雄伟的目标,从第一天起,你的研究和构建AI的方式有什么变化?
Max Jaderberg:这是个好问题。当我考虑 AI 在药物设计中的一些现状时,机器学习模型在化学和生物学中得到了大量使用,但我会把这类应用程序的第一代很多称为更本地化的模型。
现在可能有一些关于特定靶点或特定类别分子行为的数据,人们根据这些数据拟合一个小型多层 MLP,以帮助你生成一些预测,从而产生下一轮设计。
当我考虑我们需要什么来获得我们一直在构建的这个突破性的药物设计引擎时,我们需要大约六次 AlphaFold级别的成果。
当前AlphaFold 显然是理解生物分子结构的巨大突破。那么蛋白质的结构是什么呢?现在有了 AlphaFold 3,可以模拟小分子以及 DNA 和 RNA 等物质构建过程。这是一个根本性的进步,它使我们能够获得生物化学真正核心概念的实验级准确性,从而为化学家解锁一大堆思考和设计工作。
但我实际上想要表达的是,我们可能需要更多这样的突破。他们在某种程度上达到了生物学和化学的不同核心概念的实验水平准确性。
合成数据的忠实粉丝
Stephanie Zhan:我们知道数据在生物制药领域非常重要,之前 Demis Hassabis在采访中表示,AI在生物学中不受数据限制。您能分享一下您的看法吗?
Max Jaderberg:实际上,无论机器学习应用哪个领域,都会有数据限制。
但我认为 Demis 的重点是,这并不是一个真正的瓶颈,因为我们可以利用现有的数据取得进展,我们可以生成数据,并且可以取得真正进展。
而不是我们必须坐等 50 年,让这个世界产生足够多的数据之后,才能做出有影响力的AI。毕竟现在人们取得的真正实质性的进步,超出了以前所经历的任何事情。
现在,这是否意味着数据生物学没有机会?绝对不是。这个领域有大量的历史数据,但这些历史数据并不是为了机器学习而创建的。因此,当你出去思考“如何创建数据来实际训练我的模型”时,你正在以一种与过去人们生成数据的方式截然不同的方式思考。这里有很大的机会可以探索。
Stephanie Zhan:您认为我们现在缺少什么样的数据?您认为我们需要合成数据吗?
Max Jaderberg:是的。所以我是合成数据的忠实粉丝。实际上,从我职业生涯的一开始,我就一直在生成合成文本数据。
我们在化学领域也看到了同样的趋势,基于量子化学和物理,我们可以近似计算并创建更具可扩展性的分子动力学模拟。这为大量合成数据提供了基础。
然后我们有模型本身,特别是我们有生成模型,这实际上可以生成数据,我们可以使用评分系统来帮助真正增强这些数据的信息内容。
但我认为其中一个很大的空间将是所谓的“体内数据”。当前动物实验数据在药物研发中非常重要,但很难生成大量的数据。
因此,寻找新的数据生成技术的机会很大。有一些了不起的人在做一些事情,比如器官芯片,但你知道,完全在芯片上测量的东西,我认为......
未来,生物学和化学领域的数据生成技术将有一大堆新的突破。你知道,这将对我们如何思考对生物化学世界进行建模产生重大影响。
Stephanie Zhan:您是否在内部进行任何工作,或者您希望其他参与者填补一些空白?
Max Jaderberg:我们实际上在 Isomorphic Labs 中没有任何自己的实验室,但我们与非常多公司进行合作。我们自己生成了大量数据,有很多专有数据,当前我们已经看到了它的巨大影响。
AlphaFold3正在影响药物研发
Stephanie Zhan:有一种观点认为,分子结构建模以及对其功能和调节功能进行建模非常重要,但不一定总是药物开发的限制因素。你对此有什么看法?
我认为整个行业都需要弄清楚如何在该领域进行创新,特别是作为我们关于这些分子将如何与人相互作用、它们的毒性的预测模型,随着这些预测模型变得越来越好,我们将不得不改变我们进行临床试验的方式才能真正利用它,最终将治疗方法送到真正迫切需要它们的患者手中。
从我的角度来看,真正令人兴奋的是,如果我们创建这些通用模型来了解这个分子如何与这个靶标相互作用,以及任何其他靶标如何相互作用,那么为什么我们不能使用相同的模型来了解这些分子如何与我们身体的其他部分相互作用呢?
Stephanie Zhan:AlphaFold 3 现在为药物设计师提供了哪些功能呢?您内部是如何使用它的?
Max Jaderberg:因此,AlphaFold 3 使我们的药物设计人员能够了解他们的分子设计如何真正与这种蛋白质靶标相互作用。
因此,我们的药物设计师可以对设计进行更改,然后立即看到它如何改变该分子与蛋白质靶标的物理交互方式。
这真的非常非常强大。在 AlphaFold3之前,人们实际上可能不知道分子是如何与蛋白质相互作用的,或许在药物设计项目的某个时候,会用特定的设计来结晶结构。
这意味着如果幸运的话,六个月后要去真正的实验室,得到一个解析的 3D 结构。但即便如此,这也只是单个设计的 3D 结构,而不是您所做的每一项更改。
AlphaFold 3 完全改变了化学家进行这种设计工作的方式。但我要强调的是,这远非我们想要达到的程度。因为这不仅仅是关于这些分子在相互作用方面是什么样子,我们实际上想知道这些分子与这种蛋白质的相互作用有多强。
我们想知道这些分子的其他特性。我们想了解这些分子与这种蛋白质相互作用的方式,以及它如何改变蛋白质的折叠或构象,它如何改变蛋白质的功能,它如何实际改变细胞的动力学。这些是我们正在努力实现的其他类似 AlphaFold 的突破。
Stephanie Zhan:有意思。所以你在内部开发的项目,专注于哪些目标和计划?
Max Jaderberg:我们有一些令人兴奋的药物设计项目,侧重于免疫学和肿瘤学。我们在那里取得了一些令人难以置信的进步,看到这一点真的很令人兴奋。尤其是这些模型如何改变了我们在这些项目中实际进行药物设计的方式。
Stephanie Zhan:公司还和礼来、诺华合作,您能分享一下这些合作伙伴关系是什么样的吗?
Max Jaderberg:是的,我们去年1月和两家公司签署了合作。他们给我们带来了一些非常非常具有挑战性的问题。这些靶点是该领域和诺华等公司已经研究了 10 多年的靶点。
所以这些不是“哦,我们会尝试一下”的问题。这些都是真正困难的事情。去年是了不起的一年,无论是对我们的内部项目来说,还是对这些合作伙伴项目来说,都能够真正看到这些模式的运作情况。它使我们能够真正发现新的化学物质,找出新的方法来调节人们长期研究的这些目标。近期我们扩大了与 诺华 的合作,我认为这真正证明了这些合作伙伴关系早期的一些成功。
Stephanie Zhan:您和 Demis Hassabis建立了长达十年的合作关系,与他合作是什么感觉?
Max Jaderberg:Demis 是一个了不起的人,他是一个真正的梦想家,而且他也非常有亲和力。他只需要五分钟的谈话,就能真正地流露出他所思考的雄心壮志的深度,并从一开始就确立了极其高远的目标。所以我认为他有这种强大的能力,为团队注入巨大能量。
Stephanie Zhan:你已经建立了一支真正优秀的团队,由人工智能、化学、生物学等许多不同领域的最优秀人才组成。您能分享一下您是如何看待这个问题的吗?
Max Jaderberg:AI在药物设计领域的应用并不长,因此既找到一位药物研发的世界级专家,同时也是机器学习或深度学习领域的世界专家的机会基本上是......零。
AI生物学中的GPT-3时刻
Max Jaderberg: GPT-3本质上是一个生成模型。 对我来说,GPT-3 的时刻是跨越了两者之间的界限,它们生成了一些东西,看起来像文本,但我不相信它是由人类生成的。
因此,当我考虑将其应用于生物学时,在 GPT-3 的那一刻,重新创建现实中事物的实际样子,这意味着AI生成的分子是稳定的,可以在我们的物理现实中工作和存在。但实际上AI能够生成超出人类理解范围的事物,但这些事物确实存在于现实世界中。
这真是太令人兴奋了。事实上,您知道,我们开始在内部看到,通过我们的生成模型,我们正在创造人类药物设计师会说,“嗯。我不太确定。我更喜欢这个。然后你在物理现实中测试它,生成模型是正确的,而人类是错误的。
Stephanie Zhan:这很有趣。我喜欢第 37 步的类比。当模型拥有创造力并超越人类。
Max Jaderberg:第 37 步是在 AlphaGo 对阵李世石的比赛中做出的惊人举动。对局的第 37 步,它震惊了世界,震惊了围棋世界,因为它无法被人类解释。
这看起来是个错误。你知道的,在人类数千年的围棋历史中,从来没有人下过这步棋。事实证明,当你展开游戏时,这是让 AlphaGo 在那场比赛中击败李世石的关键一步。
Stephanie Zhan:那么,我们什么时候才能在临床上看到我们的第一个 AI 生成的药物,以及第一、二和三期试验呢?
Max Jaderberg:我们在药物设计项目上取得了惊人的进展。当我们开始获得一大堆 AI 设计的资产、这些分子,进入临床阶段时,我们怎么能真正开始考虑参与临床开发,以尽可能快、尽可能安全地将这些分子提供给患者。
我在这里考虑的是,与监管机构合作的新方法,将采用哪些新方法来整合我们的预测模型,不仅了解这种分子如何对疾病起作用,而且正如我们所讨论的,它如何与身体的其他部分相互作用。 我认为会有很多机会来考虑简化和加快这个过程。
Max Jaderberg:从某种意义上说,制药公司将使用 AI。我认为,五年后你将无法在没有 AI 的情况下设计出一种药物。这就像尝试在不使用数学的情况下进行科学研究。
AI 将成为生物和化学的基本工具——至少在 Isomorphic 的世界里,它已经是每个人都会使用的程序。所以它不会是,“哦,是制药还是人工智能?从某种意义上说,这将是一体的,整个行业都将适应这一点。