2026年4月11日,一款叫ViraHInter的双模态AI模型正式发布。
该模型由上海人工智能实验室联合复旦大学、上海交通大学医学院附属瑞金医院及上海市病毒研究院共同推出,不用开展湿实验就能预判病毒将如何"劫持"人体蛋白的AI模型。
实测显示,ViraHInter比现有最强工具AlphaFold3精度高出4.5倍,比其他模型精度高出6倍。
病毒分子很小,新冠病毒只有约30个基因。但它能入侵人体、复制、传播——靠的是精准"劫持"我们细胞里的蛋白质。这个"劫持"过程,靠的就是病毒蛋白与宿主蛋白的相互作用(Virus-Host PPI)。
给定一个病毒蛋白和一个宿主蛋白,ViraHInter能告诉我们,它们会不会结合。
快速筛出候选靶点,工作时间压缩到几周
ViraHInter的核心架构是双模态深度学习框架,包含两大核心分支:
1. 结构生成分支负责生成病毒和宿主蛋白质的全原子三维复合物结构,理解病毒与宿主蛋白在空间上如何对接。
2. 序列表示分支处理氨基酸序列,提取序列层面的进化特征——利用蛋白语言模型,识别病毒在快速变异中仍保留的保守模式。
两个分支协同学习,最后融合成一套跨未见病毒的通用化相互作用规则。
这意味着,即使是一种全新的病毒,只要知道它的蛋白序列,ViraHInter模型就能推断它可能与哪些宿主蛋白相互作用。

图:ViraHInter对病毒蛋白与宿主蛋白的相互作用的验证
研发抗病毒药物,第一步是找到病毒的命门。ViraHInter能快速筛出候选靶点,把原本需要数年的工作压缩到几周。全原子三维复合物结构分子的出现,夸张地说可以直接拿去做药物研发。
当全新病毒出现时(比如当年的新冠),只需知道它的蛋白序列,ViraHInter就能推断它会攻击哪些人体蛋白,为防控争取时间。
对比AlphaFold3有多强
在测试中,ViraHInter的表现超过了当前最强的几个模型:面对病毒-人类蛋白相互作用时,模型精度高达0.50,比AlphaFold 3高4.5倍,比其他方法高6倍以上。
序列受控拆分那一列,它模拟的是从未见过的新型病毒。这时候AlphaFold3只有0.11,ViraHInter拿到了0.50,差距是4.5倍。AlphaFold3 每预测10对互作,约有3-4对是错的;ViraHInter把这个错误率大幅压低。
该模型在33种不同病毒上验证有效,包括新冠病毒、多种流感病毒等。

图:ViraHinter 识别出了保守存在以及各亚型特有的流感病毒-宿主蛋白互作网络
ViraHInter分析了多种流感病毒,发现了33个跨亚型共享的宿主因子。这些因子是病毒复制的核心依赖,是广谱抗病毒药物的最佳靶点。
病毒变异越来越快,人类应对的工具也在进化。
推荐阅读