AI虚拟细胞,又迎来重磅里程碑!


近日,融资10亿美元的AI+生物医药公司Xaira Therapeutics宣布,推出其首个虚拟细胞模型 X-Cell



该模型基于扩散模型打造,高达49亿参数,是迄今为止最大的虚拟细胞模型,各项性能全球领先。

团队表示,顶级数据与新颖架构结合后,结果是让模型具有极强的零样本推理能力:

未见的细胞类型、未见的暴露,以及来自不同实验室使用不同技术的结果。

该研究的预印本论文发布,文中分享了该工作的大量细节,以及验证过程。


图片

公司表示,Xaira计划将部分模型及其底层数据提供给其他科学家。

可以说,AI虚拟细胞领域,又向前迈进了一步。


最强细胞模型诞生

为什么需要虚拟细胞?


很多时候,人们想知道吃某种药对身体有没有用,科学家也想知道 “改变某个基因或药物,细胞会出现什么情况”。


但细胞太复杂了。


同样是敲掉一个基因,在皮肤细胞里和在免疫细胞里的效果可能完全不一样;而且能干预的基因、细胞类型太多,不可能一个个做实验。


虚拟细胞模型就是为了这一愿景而来,仅仅通过在电脑上调整几个数据,我们就能知道细胞对不同干预后的反应。


为了打造该模型,团队打造了有史以来最大的全基因组扰动数据集X-Atlas/Pisces 

该数据集涵盖 2560 万个扰动单细胞转录组,涵盖 15.2 万 + 独特的扰动 - 环境组合,分布在七个生物多样性的细胞环境中,规模是 Xaira 之前数据集X-Atlas/Orion 的三倍多。

于是基于X-Atlas/Pisces, Xaira训练了虚拟细胞X-Cell。

这是一款扩散模型,通过迭代扩散过程模拟从对照状态到扰动状态的转录组转变,还融合多模态生物先验知识。

图片
图: X-Cell模型框架

其数据规模相较于此前的细胞模型有了大幅度提升。

图片
图:虚拟细胞参数规模

数据显示,X-Cell具有性能优势。

 PearsonΔ核心指标它专门用来衡量模型预测"扰动"效果的能力X-Cell 较 STATE、scGPT 等现有最好模型提升最高 5 倍。

X-Cell还有较强的泛化能力。


例如,零样本的条件下,它成功预测激活态 Jurkat 细胞中 T 细胞失活扰动(如 CD3 复合物),准确识别 APPL2、LRBA 等潜在调控因子。

图片
图:X-Cell区分了JurkatT细胞中的生理状态转变

X-Cell还具有跨细胞类型迁移能力。对未见过的 iPSC 衍生黑素细胞祖细胞、多供体原代人 CD4+ T 细胞,零样本预测性能优于所有基线。

不仅如此,模型还具有预测从基因扰动预测信号通路和化学药物扰动效果,Tahoe-100M 药物数据集上 Pearson Δ 达 0.31(优于 STATE 的 0.22)。

预印本还表示,随着数据和模型容量的增加,性能可预测地提升,这对之后模型性能提升有重要意义。

能用来干什么?


很多人疑问,虚拟细胞能够用来干什么?


基础研究:它能帮助搞懂细胞运作规律,为基础生物学研究提供线索。


新药研发:可以先让模型预测 “关掉哪个基因能抑制癌细胞”,再针对性做实验,大大减少时间和成本。

精准治疗:比如同样一种药,模型能预测它在不同患者的细胞里效果如何,帮医生判断 这个患者适合用这个药。

事实上,很多大佬已经看到虚拟细胞的巨大潜力。

被誉为“女版巴菲特”木头姐,其创办的ARK Invest发布Big Ideas》报告中将虚拟细胞列为未来AI+生命科学最具有颠覆性的领域之一。

 

诺贝尔化学奖的Demis Hassabis曾表示,他的终极梦想之一是构建虚拟细胞,这将彻底改变生物学研究,可能需要长达10年的时间去实现。


扎克伯格旗下的-扎克伯格倡议(CZI)也正在将数亿美元投向虚拟细胞。该机构拥有全球最大的单细胞生物数据存储库之一。


为了这一宏大目标,全球多个组织和公司正积极探索AI虚拟细胞的构建与优化。

 

模型层面,近年来涌现了多个单细胞大模型,以及整合生命分子的生物学基础大模型,都极大地促进了技术突破与发展。

 

 

图片

图:单细胞以及生物学基础大模型



Xaira:AI制药梦之队


此次打造X-Cell的团队,也是AI制药公司Xaira Therapeutics成立2年来的重磅成果。


Xaira究竟是何方神圣?这家公司成立之初就获得10亿美元支持,轰动业界。


公司成立于20244月,其创始人、高管、投资人、顾问都是生命科学领域的顶级阵容,希望打造下一个颠覆生命科学行业的公司。


Xaira的使命是运用人工智能技术,创造下一个基因泰克。


公司科学联合创始人诺贝尔化学奖得主华盛顿大学蛋白质设计研究所所长David Baker博士,该实验室设计了多个全球领先的基于蛋白质的药物开发模型多位博士生全职加入了Xaira Therapeutics


公司的首席执行官Marc Tessier-Lavigne是前斯坦福校长,他还曾任基因泰克首席科学官。另一位联合创始人Hetu Kamisetty 博士,他曾供职于Meta和蛋白质设计研究所


图片

左:Marc Tessier-Lavigne;右:David Baker


去年4月, Xaira 宣布任命多伦多大学顶尖 AI 学者Bo Wang为生物医学 AI 负责人,也是上述项目的主要负责人。


这家最强初创则获得包括ARCHForesite LabsF-PrimeNEA、红杉资本、Lux CapitalLightspeed Venture PartnersMenlo 、 VenturesTwo Sigma Ventures、帕克癌症免疫治疗研究所 (PICI)、拜耳、Rsquared 和 SV Angel 等一众海外顶级投资机构的支持......


其中,著名的生物医药风险投资基金ARCH Venture Partners,押上了其成立以来的最大赌注,向该公司投了2亿美元


这样豪华的团队,正在引领AI+生物学的下一个圣杯。


—The End—

推荐阅读