图片

一、引言:预测的辉煌与局限

近年来,人工智能在生物医学领域取得了令人瞩目的成就。通过整合基因组、转录组、医学影像、临床记录等多模态数据,AI系统能够以越来越高的准确性预测患者预后、疾病进展和治疗反应,并在患者分层、临床试验优化等任务中展现出超越传统统计方法的能力。

然而,本文指出,这一成功背后隐藏着一个根本性的局限:当前的AI系统本质上是观察性的。它们从历史数据中学习统计关联,其输出——无论是风险评分、疾病分类还是预后预测——都只是对过去模式的提炼。即使数据规模不断扩大、模型能力不断增强,它们的运行模式仍然是基于过去推测未来

但医学不是一门观察性学科,它本质上是干预性的。临床决策的核心问题不是基于过去最可能发生什么,而是在施加某种特定干预后,会发生什么。例如,面对一种新的联合疗法,仅仅依赖历史数据训练的预测模型无法可靠地推断其效果,因为这种干预在训练数据中可能从未出现过。

这就形成了一个结构性缺口:预测与决策之间、观测与干预之间的鸿沟。本文作者认为,这一缺口无法仅靠扩大数据规模来填补。生物医学AI的下一个阶段,必须从预测走向干预,从观察性智能走向干预性智能

图片

二、当前范式的结构性局限

本文将当前主流的生物医学AI范式概括为预测性AI。这类系统通过在大规模回顾性数据集上学习输入与输出之间的统计关联,来完成风险分层、生存预测、生物标志物发现等任务。它们的技术基础包括深度学习、基础模型等,已在多个场景中取得良好效果。

但作者提出了一个关键命题(命题1):

在历史数据上训练以预测结果的系统,可以在观测到的分布内达到高准确率,但在面对新颖干预时,无法可靠地支持决策。

这一局限是结构性的,而非工程性的。原因在于:

预测模型没有编码干预的效果。它们可能捕捉到治疗X与结果Y相关,但不理解治疗如何改变系统的状态。

当临床条件发生变化(新疗法、新组合、新机制)时,模型的泛化能力会急剧下降。这不是偶然的,而是系统不建模干预效应的必然结果。

即使增加数据量,也只是在已知分布内插值,无法拓展到未观测的干预空间。

因此,预测性AI可以优化过去,但无法为未来的干预决策提供可靠基础

图片

三、新兴范式:疾病级模型

为了克服上述局限,本文作者提出了一个新兴范式——疾病级模型。这类模型不再将疾病视为静态特征的集合,而是将其理解为动态的生物学过程。它们旨在捕捉疾病在分子、细胞和临床维度上的状态、结构和演化

在这一范式中,核心概念是生物学状态空间。疾病状态对应于高维空间中的一个位置,疾病进展则是该空间中的一条轨迹。模型的目标不是直接预测结果,而是模拟系统在干预下的演化

作者进一步提出了疾病模型三元组),作为干预性智能的最小计算架构:

1、状态表示:编码肿瘤、免疫系统、微环境等的联合生物学配置。

2、状态动力学:描述状态如何随时间自发演化。

3、干预算子:将治疗行动映射为系统状态的转移。

缺少其中任何一个组件,系统就无法真正支持干预推理。这一框架将AI的任务从学习关联转向建模因果机制与动态响应

四、从预测到模拟:计算原语的转换

本文强调,从预测到模拟的转变,不是输出格式的变化,而是计算原语的根本转换

观察性AI回答:什么最可能发生?”——基于历史。

干预性AI回答:如果施加某种干预,会发生什么?”——通过模拟。

模拟成为干预性AI的核心计算操作。系统不再将输入直接映射到输出,而是:

1、表示当前系统状态;

2、施加一个扰动(干预);

3、计算由此产生的状态转移;

4、从模拟轨迹中推导出决策依据。

这种反事实推理能力,在当前的预测系统中几乎完全缺失。它使AI能够探索从未观测过的干预场景,如新疗法的组合、剂量调整、靶向特定通路等。作者指出,模拟并不意味着传统意义上的精确机理建模,而是指系统能够生成在生物学上合理且一致的轨迹,结合数据与学习到的结构和动力学知识。

图片

五、对药物开发的意义

在药物开发中,传统的试错模式越来越难以应对巨大的组合复杂性,尤其是在肿瘤学等需要联合治疗的领域。预测性AI可以优化患者分层和生物标志物发现,但仍局限于历史观测。

疾病级模型带来了新的操作模式

干预空间的模拟探索:在投入实验和临床验证之前,先通过模拟生成和评估假设。

靶点识别:通过系统级分析揭示易感性模式和相互作用网络。

试验设计:预测不同亚群的响应,实现更精准的入组标准和自适应策略。

这使药物开发从经验性迭代转向模型引导的探索,决策被前移至更早的阶段。虽然实验验证仍然不可或缺,但AI的角色从分析结果演变为塑造决策序列

六、对临床护理的意义

在临床实践中,当前的AI主要提供预测性工具:风险评估、疾病分型、预后预测。这些工具支持临床判断,但并未改变其结构——决策仍然依赖于回顾性证据、指南和医生经验。

疾病级模型使临床决策支持从静态走向动态

动态评估:随着新数据和患者状态变化,模型持续更新评估。

机制性个体化:治疗建议基于建模的生物学状态及其对干预的响应,而非仅依赖历史队列的相似性。

前瞻性推理:医生可以在应用治疗之前,模拟不同策略的预期效果,特别适用于标准方案无法覆盖的复杂病例。

本文作者强调,这一转变不是取代临床专家,而是通过一个结构化的干预推理框架来增强他们的决策能力。医生仍然负责解释模型输出、结合临床情境并做出最终判断。AI的角色从解释工具演变为参与决策推理的系统

图片

七、架构要求与开放挑战

要实现上述范式,不能仅仅扩展现有架构。本文作者提出了若干关键架构要求:

1、多模态整合需保留关系:不仅仅是特征融合,还要反映不同模态之间的依赖与交互。

2、必须捕捉生物学动力学:支持纵向建模、状态转移和轨迹跟踪。

3、显式建模干预:编码扰动及其机制性影响,支持反事实推理。

4、生成式建模成为核心:扩散模型、潜变量模型等用于生成合理的疾病演化轨迹。

5、表示需结构化与可解释:与生物学实体对齐,支持验证与精化。

6、新的评估标准:不能仅靠预测准确率,还需考虑模拟轨迹的一致性、干预响应的合理性以及对未观测场景的泛化能力。

同时,本文坦承了若干开放挑战:

验证生成生物学模型:需要实验研究、前瞻性试验和扰动实验。

数据稀缺:捕捉干预效应的分子和细胞动态数据相对稀疏。

临床工作流整合:必须适应真实世界的约束、时间压力、法规要求和可用性。

可解释性与保真度的权衡:高维潜变量模型可能难以直接解释。

鲁棒性与泛化性:在未观测条件下的可靠性仍需保障。

图片

八、核心结论

本文的结尾充满洞见与警示:

从历史数据中学习的系统,始终被束缚在过去;而建模干预的系统,将定义医学的未来。

作者明确指出,生物医学AI正在经历一场结构性转型:从观察性智能走向干预性智能。这一转型不是技术偏好问题,而是由生物医学决策本身的逻辑所决定的。随着干预空间的不断扩展,仅靠预测将越来越无法满足临床和研发的需求。

未来创造价值的地方,也将从数据处理和预测,转向能够定义和支持干预决策的系统。那些不能建模干预的系统,将在结构上被排除在决策层之外。

最终,问题不再是AI是否会影响医学决策,而是哪一种系统将定义这些决策——从而控制决策层。这不仅是技术竞争,更是对生物医学AI未来发展方向的深刻判断。

图片

九、现实启示

1、警惕预测即一切的误解。高准确率的预测模型不等于好的决策支持系统,尤其是在涉及新颖干预时。

2、推动从关联到机制的跃迁。下一阶段的AI需要理解系统如何对扰动做出响应,而不仅仅是捕捉模式。

3、重视模拟与反事实推理。这可能是AI在精准医学中真正发挥核心作用的关键能力。

4、重新思考数据策略。不仅需要大规模观察数据,更需要有目的地收集干预效应数据。

5、构建跨学科合作机制。机器学习、系统生物学、临床试验设计、临床实践需要深度协同,才能实现疾病级模型的落地。

这篇文章为理解生物医学AI的未来提供了一个清晰、深刻且具有指导意义的框架。它提醒我们:当医学的终极问题是该做什么而非会发生什么时,AI必须学会模拟、干预与决策,而不仅仅是预测。

如需要《从预测到干预:生物医学人工智能的演进》(英文,13页),请在本微信公众号中赞赏(点喜欢或稀罕作者后按本公众号设定打赏)后,发来email地址索取。
图片


图片

图片


★ 每日鲜鸡汤  ★

A meaningful life is not being rich, being popular, being highly educated, or being perfect. It's about being real, being humble, being able to share ourselves and touch the lives of others. 生命的厚重,不在于富甲一方,不在于簇拥声名,不在于满腹经纶,更不在于那虚妄的完美。它关乎:见素抱朴的真实,卑以自牧的谦逊;关乎倾心相予而不隐,润物无声以动人。早上好!

图片