《用于数字孪生实时仿真的基于热力学的图神经网络》
2024年12月22日
![图片]()
本文提出了一种新颖的混合模型,用于实时仿真数字孪生人体器官,特别是肝脏组织。该模型结合了图神经网络的几何偏差和基于热力学原理的物理偏差,实现了对先前未见解剖结构的显著泛化能力,并能在保持高反馈率的同时进行高效预测。这对于精准医疗和触觉渲染具有重要意义。
本文的核心在于将图神经网络与热力学约束相结合。传统的数值方法模拟软组织的粘弹性特性时,计算成本高且依赖网格划分,而纯粹的数据驱动方法(例如黑盒模型)则缺乏物理可解释性,泛化能力有限。该文提出的方法巧妙地解决了这两个问题。它利用图神经网络的拓扑结构来表示器官的几何信息,并通过引入“度量多重结构”,确保模型在推理过程中满足热力学定律,包括能量守恒和熵不等原理。这种“度量多重结构”是通过强约束和弱约束来实现的,即使对于训练数据中未见过的解剖结构,也能保证模型的物理一致性。
![图片]()
具体来说,该模型采用多图交互机制。一个图表示肝脏组织的网格结构,另一个图则表示手术工具与组织的交互作用。施加在接触区域的位移会引发信息流在整个图模型中传播,从而实现网络内高效的信息交换。每个节点代表肝脏组织的一部分,并与相邻节点交换能量和信息,这通过对“非平衡可逆不可逆耦合的一般方程”(GENERIC)形式的改进实现。GENERIC形式是一种描述非平衡系统动力学的框架,它将可逆过程(由泊松括号表示)和不可逆过程(由耗散括号表示)结合起来。论文中,通过将GENERIC形式应用于每个节点,并将其分解为体积贡献和边界贡献,避免了全局矩阵的组装,从而提高了计算效率。![图片]()
模型的架构包含三个主要部分:编码器、处理器和解码器。编码器将节点和边的特征向量映射到潜在空间;处理器通过消息传递机制在图中传播信息,迭代地更新节点和边的潜在表示;解码器则从潜在表示中提取系统的状态变量(例如位移、应力、速度)以及能量和熵的变化。值得注意的是,解码器在物理信息解码器中,会根据GENERIC框架,提取能量和熵的梯度信息,从而保证模型的热力学一致性。论文中,作者对该模型进行了验证,结果表明该模型能够在7.3毫秒(优化配置)甚至1.65毫秒(最有效情况)内完成正向传播预测,相对位置误差低于0.15%,应力张量和速度估计的相对误差均低于7%。这表明该方法具有很强的鲁棒性,能够有效处理不同的载荷状态和解剖结构。
![图片]()
1、结合几何偏差和物理偏差: 该模型同时利用图神经网络的几何偏差和热力学约束的物理偏差,在保证模型的物理一致性的同时提高了其泛化能力。
2、高效的实时模拟: 模型能够在毫秒级内完成预测,满足实时模拟的要求。
3、处理未见解剖结构的能力: 模型能够对训练数据中未见过的解剖结构进行准确预测。
4、基于GENERIC框架的热力学一致性: 模型通过满足GENERIC框架,确保了其热力学一致性,这对于模拟生物系统至关重要。
5、多图交互机制: 多图交互机制提高了模型的信息传递效率。
![图片]()
总之,本文提出了一种具有创新性和实用性的混合模型,为实时模拟数字孪生人体器官提供了新的途径。该模型的快速、准确和鲁棒性使其在精准医疗、手术规划和触觉渲染等领域具有巨大的应用潜力。未来的研究可以进一步探索该模型在其他生物系统中的应用,以及如何进一步提高其效率和精度。此外,研究如何处理更复杂的生物力学现象,例如组织损伤和修复,也是一个重要的方向。最后,模型的训练数据量和质量对模型性能的影响也值得进一步研究。