学习方程内部隐藏图景的神经网络
本周,一组数学家和工程师发布了一种方法,展示了机器学习如何准确地恢复隐藏在偏微分方程(描述热量、流体、种群等现象的核心数学工具)内部的未知函数。该团队在牛津大学(University of Oxford)研究人员的领导以及加拿大合作者的参与下,将一个神经网络作为未知空间函数的代理直接嵌入到偏微分方程(PDE)中,并利用观测到的稳态数据对整个系统进行训练。其结果不仅是一个拟合的数值或参数:它是一个模型可以在偏微分方程适用的任何地方进行评估的函数,从而将不完整的方程转变为有效的预测模型。
这一进展攻克了一个长期存在的逆问题。许多现实世界的偏微分方程都包含我们无法直接测量的项——例如环境刺激、种群模型中随空间变化的相互作用核,或流场中的非均匀性——而这些未被观测到的函数会导致预测失效。通过让神经网络替代缺失的部分,并优化正向模型的输出与观测状态的匹配程度,研究人员绕过了早期方法中常见的一些脆弱步骤,例如对带有噪声的测量值进行微分。他们的损失函数最小化了不动点残差——有效地迫使正向模型的数值计算稳态与数据相匹配——这稳定了训练过程,并减少了对严苛数据预处理的需求。
机器学习如何准确恢复嵌入偏微分方程中的函数
核心技术技巧在理念上很简单,在实践中却很微妙。团队没有调节几个标量系数,而是将未知的空间项表示为一个权重可调的神经网络。偏微分方程求解器与网络是耦合的:求解器将候选函数映射到稳态解,而训练循环则调整网络,使偏微分方程的解与测量值保持一致。这是被称为物理信息学习(physics-informed learning)的更广泛方法家族的一个例子,在这种方法中,物理约束被内置到架构中,而不是纯粹从头开始学习。
在实践中,他们使用的优化目标——不动点残差范数——在正向模型的平衡态下恰好消失。这一点至关重要,因为它避免了对带有噪声的观测数据进行数值求导,而数值求导是逆问题中不稳定的常见来源。这也使得该过程与稀疏、非规则采样的测量数据相兼容:团队表明,只要观测数据能够充分反映底层函数对解的影响,即使数据量出奇地少,恢复工作也能成功。这一理念的变体已经出现在其他领域:混合量子-经典物理信息神经网络已被提议用于油藏流体模拟,而可微算法模型则为组合问题带来了保证和规模。这些进展都有着共同的主题——利用物理学或算法的结构来引导学习,而不是让黑盒模型自由漂移。
从机器学习的角度来看,这是函数级别的方程发现,而不是整个算子的符号回归。神经网络充当通用近似器:给定足够的容量和正确的归纳偏置,它们可以表示平滑的未知函数,否则这些函数将需要定制的参数化。训练通过询问以下问题来提取这些函数:当插入偏微分方程时,哪种图景能产生我们观察到的数据?在需要符号提取的地方,研究人员可以在函数恢复后进行模型压缩或稀疏回归步骤,以生成人类可读的表达式,但其直接输出——一个可以在新点评估的有效函数——本身已经是一项宝贵的科学成果。
机器学习准确恢复的局限性——可辨识性、噪声和数据设计
撇开前景不谈,该方法有明确的边界。团队展示了在精确、无噪声模拟中的成功,随后探讨了性能随现实不完美情况下降的规律。其中两个问题尤为突出:结构可辨识性和测量噪声。结构可辨识性是偏微分方程-数据对的一种解析属性:某些函数无法从给定的一组观测值中被唯一确定,因为它们不会改变观测到的输出。研究人员强调,单次稳态快照通常是不够的;通常至少需要两个独立的解,或者探测不同系统响应的扰动,才能约束逆问题。
噪声和稀疏采样使问题进一步复杂化。在他们的许多合成测试中,在稀疏采样下恢复仍然可行,但随着观测噪声的增加,准确度会下降。敏感性因问题而异:某些偏微分方程会以可预测的方式放大测量误差,而另一些则会将其平均抵消。这意味着实际应用必须仔细关注实验设计:在何处以及何时采样,如何生成多个有信息量的解,以及在训练中加入哪些正则化项以防止网络拟合噪声而非信号。
可靠性是一个多层次的问题。当三个要素一致时,机器学习可以准确恢复隐藏函数:未知函数在可观测解中留有印记,训练协议编码了正确的物理约束,且数据样本跨越了足够的解流形以排除其他解释。当这些条件不满足时,恢复的函数可能看起来合情合理,实则错误。该研究对失效模式的系统性探索非常有用,因为它将含糊的警告转化为了从业者可测试的诊断工具。
技术、工具和互补方法
本文属于日益丰富的方程发现方法工具箱。物理信息神经网络(PINNs)及其量子-经典混合体是一个家族:它们将微分算子融入损失函数中,当控制偏微分方程已知但某些项未知时,它们特别具有吸引力。消息传递图神经网络为具有离散结构的问题(例如材料或网络化的生态系统)提供了不同的视角,并且可以设计为继承算法保证。符号回归技术——稀疏回归、基追踪和其他简约模型发现方法——当目标是可解释的解析表达式而非数值代理时,仍然具有价值。
从学习到的函数中提取符号表达式是一个活跃的研究领域。从业者通常使用两阶段流水线:首先学习一个拟合数据的柔性神经网络代理,然后通过稀疏拟合或修剪步骤对该代理进行后处理,以提取紧凑的解析形式。这种混合工作流程结合了两者的优点——神经网络处理噪声和复杂性的灵活性,以及科学家可以分析和验证的符号模型的可解释性。
在生态学、材料和流体力学中的应用
为什么这很重要:如果机器学习能准确恢复模型中看不见的部分,就可以将描述性的快照转化为预测工具。在生态学中,未知函数可能是环境场或塑造种群聚集的相互作用核;恢复它可以让管理人员预测新条件下的物种分布。在材料和凝聚态模型中,空间非均匀性(如变化的导电率)通常是决定宏观行为的未知因素,而恢复的函数为设计和控制提供了直接输入。该方法还补充了油藏工程领域的工作,在该领域,混合量子-经典 PINNs 已被提议用于在求解流动偏微分方程时降低计算成本并保持物理保真度。
在这些领域,该方法减少了数据收集与模型部署之间的摩擦。科学家可以利用结构引导学习,而无需从头开始重建物理学或过度拟合唯象项,并仍然获得可用的、可评估的模型。实际收益将取决于实验人员生成该方法所需的多个有信息量的系统响应的能力,以及使训练对现实噪声和建模误差具有鲁棒性的持续工作。
来源
- ArXiv (预印本: Learning functional components of PDEs from data using neural networks)
- 牛津大学数学研究所 (Torkel E. Loman, Jose A. Carrillo, Ruth E. Baker)
- 卡普顿大学(Cape Breton University)数学、物理与地质系
- 牛津大学工程科学系
- 长江大学;阿卜杜拉国王科技大学(King Abdullah University of Technology)(量子-经典 PINN 油藏模拟工作)
- 亚琛工业大学(RWTH Aachen University);慕尼黑工业大学(TU Munich);麻省理工学院(MIT);科隆大学(University of Cologne)(算法问题的图神经网络方法)
Comments
No comments yet. Be the first!