物理信息神经网络(PINNs)在预测和重建物理场方面展现出潜力,但在处理高阶微分项和存在陡峭梯度的区域(如应力集中)时,其表现往往不佳。这些局限性主要源于不同阶次微分项耦合所带来的数值不稳定性,导致模型过早收敛到局部极小值。当出现局部陡峭梯度时,这种不稳定性尤其成问题,会降低预测的准确性和可靠性。南京工业大学王爽教授团队联合河海大学提出了一种增强型PINN架构,用于重建具有陡峭梯度的力学场。通过采用多阶段损失设计和归一化策略,所提方法提高了预测的稳定性和准确性。在含非均匀夹杂物的应力集中和热弹性问题上进行的大量实验表明,该模型优于经典PINN,实现了高分辨率重建——最高可比有限元采样节点精细87倍。该方法通过在预训练阶段融入部分物理规律,并在后续阶段加入完整的物理约束,实现了更具针对性和更高效的训练过程。其结果是改善了收敛性,提高了预测精度,增强了对局部场特征的分辨能力,并提升了对局部极小值的鲁棒性。
研究成果以“A multi-stage physics-informed neural network for high-resolution reconstruction of physical fields with sharp gradients”为题发表于期刊Computer Methods in Applied Mechanics and Engineering。本文第一作者是南京工业大学Xin Jia。
物理信息神经网络(PINNs)通过将控制方程嵌入神经网络,能够利用稀疏或含噪声数据实现物理场的预测与重建,在科学计算与工程中具有广阔前景。然而,在处理具有陡峭梯度的物理场(如应力集中、裂纹尖端、热弹性不连续等)时,经典PINN常因高阶导数项与低阶项耦合导致的数值不稳定性和过早收敛到局部极小值而表现不佳。这种局限性在工程关键场景(如断裂力学、热冲击分析)中尤为突出,限制了PINN在高精度重建中的实际应用。如何在高阶导数项和陡峭梯度并存的情况下,提升PINN的数值稳定性与预测精度。如何在有限且稀疏的有限元节点数据基础上,实现对局部陡峭梯度特征的高分辨率重建(如超分辨率重建)。如何在不改变网络结构的前提下,通过改进训练策略增强模型对复杂物理场的适应能力。提出一种多阶段物理信息神经网络(Multi-stage PINN),核心思想是按导数阶数分组损失函数,分阶段依次训练:初始化阶段:所有损失项短暂训练,使各项达到初始平衡。逼近阶段:仅训练低阶项(如位移、温度),建立全局近似模型,提高泛化能力。细化阶段:逐步引入高阶项(如应力、热流),完成全场物理约束的精细调整,并可重复细化以提升精度。引入归一化策略,对不同量级的物理变量进行缩放,避免梯度冲突。采用模块化损失设计,将损失按导数阶数分组(如module0、module1、module2),便于分阶段训练。在阶段切换时采用小-大-小学习率调节策略,保证过渡平滑,避免总损失剧烈波动。在应力集中问题(含椭圆孔的薄板)中,多阶段PINN成功捕捉孔端的高应力梯度,而原始PINN完全失效。重建分辨率提升至有限元采样点的87倍(从1267点至110323点)。MSE误差降低至2.1×10⁻⁵,相比原始PINN(7.6×10⁻⁴)降低36倍。在二维多夹杂热弹性问题中,多阶段PINN在位移、Mises应力、温度、热流等物理场的重建精度与监督式mPINN相当,但计算时间减少约50%(535.3秒 vs 1083.2秒)。在三维椭球夹杂热弹性问题中,模型仍保持高精度(Mises应力相对误差1.18%),且无需手动调节损失权重。通过Hessian矩阵奇异值分析与Frobenius范数分析,验证了多阶段训练引导模型进入更平坦、泛化能力更强的损失景观。在高相衬比(20:1至100:1)条件下,模型仍能保持较好的重建性能,验证了其鲁棒性。提出按导数阶数分阶段训练的损失模块化策略,有效解耦高低阶项,避免了经典PINN中的数值不稳定性和过早收敛。实现了一种与现有PINN框架兼容的训练流程增强方法,无需改变网络结构,仅优化训练过程即可提升性能。通过归一化与渐进约束,实现了对陡峭梯度区域的高精度重建,显著提升分辨率(最高87倍)。在多物理场、高相衬比、三维复杂结构等挑战性场景中验证了方法的通用性和鲁棒性。强调PINN作为有限元结果的后处理增强工具的潜力,提供了一种物理一致的超分辨率重建路径,而非替代传统数值方法。本研究提出了一种用于重建具有陡峭梯度特征的物理场的多阶段物理信息神经网络(PINN)框架。通过根据导数阶数对损失项进行分组并应用顺序训练,所提出的方法解耦了高阶和低阶项,从而减少了经典PINN中固有的数值不稳定性。归一化方法和模块化损失函数的结合使用促进了优化的平衡,使模型能够避免局部极小值并获得更高的精度。在应力集中和热弹性场重建问题上的实验结果表明,与当前最先进的PINN相比,该框架实现了高达87倍的分辨率提升,并大幅降低了计算成本。这些发现凸显了结构化训练对复杂物理系统的影响,并为陡峭梯度场重建提供了一种可扩展的解决方案。我们在此提及,所提出的方法并非要替代有限元法(FEM),因为在单一正问题求解上,FEM显著快于基于PINN的方法。相反,将PINN与现有的FEM结果相结合,构建一个物理信息的代理模型,可以作为一种高效且准确的后处理工具。通过将PINN作为FEM结果的物理感知代理模型进行集成,我们可以在保持控制方程的前提下实现高保真插值,这与纯粹的数据驱动后处理不同。这种协同方法利用了现有的计算资源,在不替代传统求解器的情况下增强结果的物理一致性。尽管如此,当前方法尚未实现训练过程的完全自动化,并且准确捕捉局部物理场的精细结构仍具有挑战性。此外,该方法的理论基础尚未完全发展。未来的工作将致力于通过自适应学习率控制和代码模块的动态组装来增强自动化程度。进一步的努力将集中在提高预测精度、将框架扩展到多物理场场景,以及探索其在实时工程实践中的应用。—欢迎您的加入—
请扫码添加管理员微信,备注“力学说加群”,管理员会邀请你入群。《力学说》致力于打造一个综合、专业、深度的力学领域信息平台。我们关注固体力学、流体力学、生物力学、计算力学等核心方向,追踪力学与材料、能源、生物医学、航空航天等领域的交叉创新,坚持"严谨、探索、突破、应用"的理念,推动力学学科的高精尖发展。
原文链接:
https://doi.org/10.1016/j.cma.2025.118253「力学说」致力于打造一个综合、专业、深度的力学领域信息平台,为力学研究者、工程师及爱好者提供学科前沿动态、跨学科融合进展与工程应用突破。我们关注固体力学、流体力学、生物力学、计算力学等核心方向,追踪力学与材料、能源、生物医学、航空航天等领域的交叉创新,坚持“严谨、探索、突破、应用”的理念,推动力学学科的高精尖发展。
欢迎关注,投稿联系:13169611059@163.com
免责声明:本公众号致力于打造专属力学人的交流平台,分享力学领域相关资讯,相关内容仅供参考学习,所有发表内容,均不代表【力学说】的观点。如若本公众号侵犯了媒体或个人的知识产权,我们将立即予以删除。