
https://github.com/xgxgnpu/Physics-informed-vibe-coding
关键词:
风电预测,时空预测,图网络,多模态学习
准确的风电预测对于可再生能源稳定并入现代电网及有效的运行规划至关重要。然而,现有大多数预测模型未考虑云物理过程与边界层风过程的综合影响,也未考虑不同气象数据模态间的时空依赖性,这导致了多模态风电预测物理模型一致性研究的缺失。为克服这些不足,本研究旨在构建一个创新的深度学习框架,将大气物理与时空建模相结合,以实现更优的风电预测。本文提出了PSTG-Net,一种用于风电预测的物理信息时空多模态动态图网络。该架构通过三项基础性突破,协同整合了大气物理与先进的多模态机器学习。在方法论上,该方法包含三个核心组件:物理约束下的云-风交互模块通过辐射传输校正和动量参数化建模云微物理对边界层风的影响,从而增强基于卫星的风场反演;多模态动态图表示模块通过动态演化的循环图处理时间风序列,同时利用自适应相似度图分析空间风场结构,并与遥感观测无缝集成;时空-物理融合图注意力网络模块实现了一种复杂的注意力机制,在严格保持物理一致性的前提下,智能加权并融合时间模式、空间关系及图像衍生特征。基于真实风电场数据的实验表明,PSTG-Net的误差比最优基准模型降低了32.7%,且能有效捕捉云-风间的复杂交互及时空模式。总之,PSTG-Net提供了一套完整的解决方案,在单一框架内同时解决了云-风交互、时空依赖及跨模态特征融合问题,对于可再生能源管理和电网运行具有极高的实用价值。
自适应相似度图,在物理融合图注意力网络中智能加权并融合,在严格保持物理一致性的前提下,误差比最优基准模型降低了32.7%,能有效捕捉云-风交互及时空模式,在单一框架内同时解决了云-风交互、时空依赖及跨模态特征融合问题,具有极高的实用价值
缩写(续)
在全球向可持续能源系统转型的过程中,风能作为一种关键的清洁可再生能源,因其环境友好且资源丰富,有助于减缓全球变暖并减少温室气体排放(Fu et al., 2025)。随着风电装机容量的指数级增长,准确的风电预测对于保障电力系统的安全稳定运行至关重要,因为它有助于机组组合、经济调度及电网平衡(Lu et al., 2025)。尽管高精度的风速预测被视为大多数电力预测模型的重要输入,尤其是在超短期预测中,但电力系统的日前和短期风电预测仍需整合气象预报、风电机组特性及空间相关性分析(Ma et al., 2025)。然而,由于风能资源具有强烈的时空随机性和非线性动力学特征,传统方法往往难以充分刻画,实现可靠的功率预测依然极具挑战(Huang et al., 2025; Yan et al., 2025)。在当今可再生能源占比极高的电力系统中,这些问题尤为突出,因为预测偏差会直接导致调度决策失误、运行成本增加,并引发系统性风险(Wang et al., 2025)。因此,推广先进的高保真风电预测方法具有重要的理论与实践价值,对于实现大规模风电并网、确保电网韧性以及推动全球能源基础设施的脱碳进程至关重要(Wang et al., 2023)。
准确的风电预测对于优化电力系统调度和提升可再生能源并网水平至关重要。然而,风力发电固有的波动性和不确定性带来了一个核心难题。预测驱动气象变量——风速,在本质上依然极具挑战(Yang et al., 2025b)。因此,风电预测的发展在根本上取决于核心风速预测方法的改进。风速预测经历了物理建模、统计分析和机器学习技术三种基本方法的发展。物理方法基于大气动力学原理(Wang et al., 2025),通过数值求解纳维-斯托克斯方程来模拟风场行为,虽能提供具有物理可解释性的结果,但需要大量的计算资源(Xing and He, 2023)。统计方法(如自回归积分滑动平均模型 ARIMA 和卡尔曼滤波)(Zhang et al., 2025)从历史数据中提取时间模式,但在捕捉非线性大气现象方面存在局限。现代机器学习方法(Wang and He, 2022),特别是能有效建模时空关系的图神经网络,通过从多源气象数据中提取复杂的非线性模式,展现出了卓越的性能。这种方法论的演进推动了更精确、更符合物理规律的风电预测进程,通过更好地管理风电的波动性,为解决可再生能源并网问题提供了必要方案(Liu et al., 2025)。
风速预测的物理建模方法基于大气动力学基础,利用数值天气预报(NWP)系统求解控制流体运动的纳维-斯托克斯方程(Wang et al., 2024)。这些方法通过整合温度梯度、压力场和地形粗糙度等关键物理参数来模拟三维风场,为风电预测提供了一个具有物理可解释性的框架。欧洲中期天气预报中心(ECMWF)等机构开发的高分辨率全球环流模型,通过捕捉大规模大气过程,在中长期预测方面表现优异。然而,这些模型的预测精度本质上受限于对初始条件不确定性的敏感度,以及次网格尺度现象参数化方案中的近似处理(Yang et al., 2022)。此外,高保真模拟带来的极高计算成本使其不适用于实时预测,且可能产生微湍流,从而导致短期预测出现偏差。
物理建模的最新进展旨在通过整合遥感数据与基于物理的限制条件来克服这些局限,特别是在云动力学方面。例如“云动力学集成遥感反演与物理约束”方法,这是一项重要创新,通过物理信息驱动的高度校正和云动量建模改进,提高了风场反演的精度。该框架将云类型特定的风切变、边界层稳定性和地形效应纳入风廓线估计,而新型参数化方案则通过阻力和稳定性机制量化了云微物理过程对地表风的影响(Mi et al., 2025)。与传统的被动云漂移法不同,该方法主动模拟云-风相互作用,弥合了遥感与大气动力学之间的鸿沟。通过在保留卫星观测方法计算效率的同时嵌入业务系统中常缺失的关键物理过程,该方法在不牺牲空间覆盖范围的前提下实现了更高的精度。这些进展表明,通过整合观测数据和动力约束进行针对性的物理建模优化,能够克服传统局限,为更可靠的风能预测和电网管理铺平道路。这一演进凸显了理论大气物理学与应用气象学之间持续的协同效应,参数化和数据同化方面的创新不断增强了物理风预测模型的保真度和实用性。
统计方法作为物理建模的替代方案发展起来,后者计算成本高昂,而统计方法侧重于从历史风速观测中识别时间序列模式。诸如ARIMA(Liu et al., 2021)等技术建立线性传递函数以捕捉风速时间序列中的短期依赖关系,而广义自回归条件异方差(GARCH)模型(Jiang et al., 2018)则专门处理风速波动的波动聚集特征。这些方法在平稳条件下表现稳健,且相比复杂的物理模型具有显著的计算优势,使其特别适用于需要快速更新的业务预测。此外,卡尔曼滤波和指数平滑等统计方法因其能够通过递归更新机制适应不断变化的条件而得到广泛应用。
但传统统计模型的基本线性假设限制了其捕捉现实风系统中非线性、突发性变化的能力。诸如风暴等更复杂的天气事件以及由地形变化引起的湍流区域,往往无法通过简单的线性数据处理方式准确表征(Yang et al., 2023)。此外,统计学依赖高质量的历史数据,且无法在不同地理区域之间或针对非平稳气候进行泛化(Zhao et al., 2017)。这些局限性推动了更先进机器学习方法的发展(Fu and Chen, 2025),这些方法能够在不损失实际应用所需效率的前提下捕捉非线性关系的复杂性,有效地弥合了统计简洁性与物理真实性之间的差距。
现代机器学习方法改变了风速预测的方式,通过直接从观测数据中学习极其复杂的模式,避免了传统统计方法面临的许多问题。支持向量回归(SVR)可通过核技巧处理非线性关系,特别是利用径向基函数对非高斯风速分布进行建模(Xian and Che, 2022)。基于决策树的方法(如随机森林和极端梯度提升(XGBoost))对噪声测量具有鲁棒性,并能提供可解释的特征重要性分析(Wu et al., 2025)。深度学习架构进一步突破了预测精度的极限。长短期记忆(LSTM)网络擅长通过专门的门控机制捕捉时间依赖性(Yu et al., 2024; Geng et al., 2025b)。卷积神经网络(CNN)则从风场数据中提取局部空间模式(Zhang and Yin, 2024)。最近,基于Transformer的模型通过自注意力机制在建模长程依赖方面表现出更好的性能,更适合捕捉大规模大气过程(Zhao et al., 2024)。
然而,单一模型机器学习方法在风速预测中面临根本性局限 (Zhu et al., 2024)。其性能受限于孤立的数据源,无法全面表征控制风力动态的多尺度相互作用 (Hao et al., 2025; Zhang et al., 2025a)。2023年至2025年的研究趋势见证了时空建模架构的重大进展,其中图神经网络已成为表征风场复杂空间关系的主导范式。这些基于图的方法擅长捕捉分布式测量点之间的非欧几里得依赖关系,能有效建模控制风力动态的复杂大气过程 (Fu et al., 2025)。与此同时,基于Transformer的架构,尤其是其视觉导向的变体,通过复杂的自注意力机制在建模气象序列的长程时间依赖性方面展现出卓越能力。这些模型为捕捉传统循环神经网络难以有效表征的复杂时间模式树立了新标杆 (Zhang et al., 2025b)。最显著的进展是物理信息机器学习的兴起,这标志着将物理定律直接纳入深度学习的重大转变。这种融合方式在提升模型泛化能力和物理一致性方面非常有效,解决了仅依赖数据驱动训练所带来的关键问题。然而,即使是这些复杂的混合架构(如CNN-Transformer组合),在缺乏明确物理约束的情况下,也难以兼顾时间分辨率与空间代表性 (Bashir et al., 2025)。值得注意的是,将时空图、基于Transformer的序列建模和物理信息学习整合进一个统一的框架中,仍是一个待解决的挑战 (Luo et al., 2025)。此外,这些模型的黑箱特性阻碍了误差分析和运行可靠性,特别是在处理非平稳风况或极端天气事件时 (Liu et al., 2024)。这些缺陷凸显了开发更先进建模范式的迫切需求,即在保持物理一致性的同时整合多样化数据源。
近期,图神经网络(GNN)的发展为风速预测开辟了新可能,为建模大气系统中复杂的时空关系提供了结构化框架 (Gu et al., 2024)。与在欧几里得空间处理数据的传统机器学习方法不同,GNN在图结构数据上运行,使其特别适合表征气象观测的互联特性 (Song et al., 2025a)。当前的实现通常构建图结构,其中节点代表测量位置,边编码空间邻近性或时间相关性,并常采用动态时间规整算法来量化时间序列间的时间关系 (Li et al., 2025)。尽管这些同构图结构在捕捉单一数据模态内的空间依赖性方面已取得成功 (Xiao et al., 2025),但在应用于现代气象数据系统的异构特性时,它们表现出根本性的局限。
风速预测数据集的多模态特征对传统GNN架构提出了严峻挑战。现代风力预报系统集成了多种数据源,包括卫星遥感影像、地面观测网络和数值天气预报输出,每种数据源都具有不同的时空分辨率、测量不确定性和物理诠释 (Yao and Xu, 2025)。现有的基于图的方法难以有效表征这些本质上不同的数据类型之间的复杂相互作用,因为它们通常对所有节点强制执行统一处理,而忽略了其底层的物理特性 (Ala'F et al., 2025)。当试图将气象站的点数据与连续的卫星数据或模型合并时,这种约束尤为明显;单纯的图结构无法容纳每个数据源不同的信息内容和不确定性。现有图注意力机制的一个严重缺陷是无法考虑气象异构性。标准图注意力网络框架的特点是对所有节点进行统一的注意力计算,未考虑其物理性质、测量单位或数据可靠性方面的根本异构性。例如,基于云运动追踪的卫星风速估计代表了垂直积分测量,其误差分布与地面风速计读数截然不同,但现有架构缺乏在信息传播过程中适当加权这些差异的机制 (Mesri et al., 2025)。与数值模型输出整合观测数据类似,一个细微之处在于需要考虑每种数据的时空代表性,而当前的同构图结构对此捕捉不足。
下一代风力预测系统的开发需要图学习架构的根本性突破,以处理这种气象异构性(Shen et al., 2025)。有前景的方向包括创建能够同时表征局部尺度湍流过程和天气尺度天气模式的分层图结构,并辅以专门针对不同数据模态物理特性设计的注意力机制(Qin et al., 2026; Wang et al., 2025)。遥感技术的最新进展,特别是高分辨率静止卫星数据和多普勒激光雷达系统主动传感测量数据的日益普及,为这种多模态图学习提供了前所未有的机遇(Yang et al., 2025a)。最显著的是高分辨率静止卫星图像和多普勒激光雷达系统主动传感测量数据的可用性增加。将这些最新的技术升级与专门为理解极限等基本概念并捕获特定学科核心知识而设计的新型图架构相结合,或许能解决系统集成过程中遇到的某些互操作性挑战。该方法有望显著提高跨多个时间尺度的预测精度。表1和表2系统比较中的多种方法显示出了一定的发展轨迹,但仍存在重大脱节。
目前,风速预测研究在数据驱动方法方面取得了显著进展,但在充分利用大气物理和多模态数据集成方面仍存在重大不足。虽然众多研究已经探索了风力预测的各个方面(Geng 等人,2025a;Reshmi 等人,2026;Xia 等人,2026),但通过回顾现有研究发现,尚未有研究将云、先进的图表示以及异构数据融合整合到一个综合系统中。这些局限性不仅仅是技术难题,它们更是通过以新颖、更复杂的方式将现实世界的理念与智能机器相结合来改进预测的重大机遇。目前出现了三个有待解决的潜在研究空白:
表1
风速预测方法的技术总结。
(1) 云-大气耦合在风场反演系统中尚未得到充分利用。虽然以往研究将云信息作为辅助输入,但很大程度上忽略了云-风相互作用的动力学和微物理过程,例如云对边界层的辐射效应。现有工作尚未完全整合云微物理过程及其与边界层动力学的相互作用,特别是云通过辐射对近地面风的影响。一个关键空白在于开发能够通过物理约束学习,明确将云属性演变与风场调整相耦合的反演算法。
(2) 现有的图方法缺乏有效的多模态表征。尽管图神经网络已被应用于风场建模,但文献中多采用同构图结构。该领域缺乏构建混合型图结构的有效方法,无法真实反映卫星图像、地面观测数据和数值天气预报之间的交互关系,尤其是在保持各类数据特性的同时实现重要信息共享方面存在不足。
(3) 现有的注意力机制无法充分处理气象异构性。以往使用注意力机制的研究通常对所有节点/特征类型一视同仁。这导致其无法考量卫星图像像素点、定点风速测量仪以及数值天气预报网格点之间巨大的物理差异。如果所关注的气象变量具有截然不同的物理属性或测量不确定性,这一问题会更加严重。目前风能预测研究尚未实现能够处理这些不同类型输入且保持物理一致性的专用注意力机制。
为解决上述关键研究空白,特别是大气物理学与数据驱动学习之间的脱节,以及多模态气象数据融合不足的问题,本研究的主要目标是开发一种新型统一深度学习框架,协同整合云-大气物理学与先进的时空建模,以实现物理一致且高精度的短期风能预测。为实现这一主要目标,本研究设定了以下三个相互关联的子目标,它们直接对应本工作的核心创新点:
(1) 开发物理约束下的云-风相互作用模块。这一子目标旨在弥补云-大气耦合的空白,不再将云视为被动示踪物。它将构建一种反演算法,通过辐射效应和运动规律,明确表征水汽微物理过程如何影响大气底层风场。通过这种方式,我们将把大气中最关键的物理要素融入到计算信息中。
(2) 构建用于多模态数据的异构动态图表示。该子目标旨在克服同构图的局限性。其目标是建立一个统一的基于图的模型,能够表示并融合卫星影像、点测量数据以及数值模型数据;利用动态循环图捕捉不同类型数据的时间变化,并利用自适应相似度图捕捉不同数据间的空间关系。
表 2
风速预测方法的能力总结。
(3) 设计时空物理融合图注意力网络。最终的子目标是解决现有注意力机制在处理气象异构性方面能力不足的问题。通过构建专门的图注意力网络,在强制执行物理一致性的同时,智能地加权并结合来自不同类型数据的信息,从而实现对所有信息源的上下文感知且符合物理规律的融合。
随着这些子目标的成功实现,PSTG-Net 框架将得以完成。所提出的 PSTG-Net 框架是一个综合系统,旨在提升现有技术水平,同时解决物理保真度、多模态表示和异构特征融合等挑战。
本文其余部分安排如下。第 2 节描述了本研究提出的模型及各模块中实施的方法论。第 3 节描述实证研究。第 4 节进行讨论。第 5 节给出结论、贡献及未来展望。
本节介绍了为风电预测设计的物理信息时空多模态动态图网络,并详细阐述了其组成系统模块,包括物理约束云风交互模块、多模态动态图表示模块以及时空物理融合图注意力网络模块。所开发模型的框架如图 1 所示。
基于卫星观测云运动的风速估计长期以来是推导大气环流模式的重要方法,特别是在数据稀疏地区。然而,传统的云漂移风技术受限于其简化的物理假设,即将云仅视为气流的被动示踪物,而忽略了它们通过热力学过程改变边界层动力学的积极作用。准确表征地表风况对风能应用至关重要。未能考虑云与大气环境之间的动态耦合,可能导致对近地表风行为的严重误读。因此,若缺乏对云-大气相互作用的严谨物理理解,就难以诊断影响风力涡轮机的精确运行条件,从而削弱能源输出评估的可靠性。例如,云遮蔽会改变地表热通量和稳定性,而蒸发冷却产生的下沉气流会扰动近地表风。传统不考虑此类微物理效应的静态高度调整方法,往往会产生风速偏差,特别是在碎云情况或云生命周期转换期间。为克服这些缺陷,我们提出了一个物理约束云风交互模块,这是对以往被动追踪方法的改进。我们将云微物理属性反演及其与边界层的耦合纳入其中,从而在保持高效的同时获得更符合物理规律的反演结果。这一创新将卫星与天空联系起来,通过优化空气动力学计算,使我们更容易掌握大规模风能信息。该模块包含一个物理约束框架,通过 5 个严格的处理阶段,将被动云追踪转变为主动云风交互模型。详细信息如图 2 所示。
(a) 首先,云检测与分类;初始阶段利用多光谱阈值法识别云像素:
其中 CloudMask 表示像素坐标 处的二值云掩膜,值为 1 表示存在云。 表示像素 的云厚度值,作为云密度和云量的主要指标。threshold 表示用于云像素识别的预定义光谱阈值。本研究的主要云数据输入是源自卫星观测的云光学厚度产品,它定量地代表了云量和云密度。
(b) 其次,精确运动追踪;通过加权质心追踪推导云位移矢量:

图 1. 所开发模型的框架。
其中 表示时刻下被追踪云结构的加权质心坐标。 表示云结构内第 个像素的空间坐标。加权函数 通过梯度项结合了云光学厚度 与纹理相干性,在有效追踪相干云结构的同时,最大限度地减少了边缘消散带来的噪声。 表示 在像素 处的空间梯度幅值,代表局部纹理变化。 表示控制梯度幅值敏感度的缩放参数。
(c) 第三,大气校正后的风场转换;通过大气阻力补偿将云运动转换为风速:
其中 表示云底高度处由云运动推导出的风速。 表示连续卫星图像间云质心 的位移矢量除以时间间隔。 表示云底处的估计大气压。括号项用于校正与压力相关的阻力效应,余弦项则考虑了观测天顶角 。该公式明确解决了将云视为被动示踪物的常见过度简化问题。

图 2. 物理约束云-风相互作用模块框架。
(d) 第四,基于边界层物理的高度调整;通过稳定性相关缩放推导垂直风廓线:
其中 表示地表上方指定高度 处的估计水平风速。 表示云底高度。 为常规切变指数, 为莫宁-奥布霍夫长度, 表示基于 Businger-Dyer 关系的无量纲稳定性校正函数。该公式基于莫宁-奥布霍夫相似理论,这是边界层气象学的基石。稳定性校正函数 基于 Businger-Dyer 关系实现,根据大气静力稳定性动态调整风廓线,超越了固定切变指数的过度简化。
(e) 最后,计算 和 100 高度处的风速
其中 表示经度分辨率校正, 表示纬度分辨率, 表示卫星数据的标称空间分辨率, 表示 的标准参考高度,表示地表上方 标准高度处的估计风速。
该物理约束云-风相互作用模块代表了可再生能源应用中基于卫星的风速估算技术的重大进步。通过将传统的被动云追踪转变为主动的云-大气耦合模型,该框架在整个大气边界层内实现了更准确且物理一致的风速反演。云微物理、动态运动追踪、互补水汽风场以及稳定性感知高度调整的创新集成,解决了现有业务方法中的关键局限。如公式 4 和 5 所示,对既定物理定律的严格纳入,确保了反演过程的合理性与通用性。该模块在多种气象条件下的稳健表现,结合其计算效率,使其在风电预测系统中极具价值。其提供 和 风速估算的能力,直接满足了风能评估的需求。物理基础确保了在传统方法常出现显著偏差的复杂条件下,仍能保持可靠的性能。
这构成了一个原则性大气物理学辅助业务风场反演的案例,实现了前者与遥感技术的融合。该框架采用模块化结构,便于与现有预测系统结合,并能快速提升可再生能源管理水平,且不会影响未来的观测与模型改进。这些能力使该模块成为一种优势工具,通过更准确、可靠的风能资源评估,助力全球向清洁能源转型。
为了捕捉具有时空特征的复杂风行为,多模态动态图表示由多种不同模态的时间序列和遥感图像组成。该模块构建了两个不同的动态图:编码序列时间模式的动态时间依赖图(DTDG),以及捕捉跨时间特征相似性的动态拓扑相似图(DTSG)。同时,一系列遥感图像被处理并与节点级信息融合,以提供丰富的空间上下文。这些共同构成了三通道图输入,其中DTDG和DTSG分别反映时间与空间关系,第三通道提供辅助的图像空间信息。通过XGBoost分析计算特征重要性得分后,这些指标被纳入DTDG和DTSG架构的图像特征空间中。XGBoost通过其内置评估衡量时间特征重要性,从而全面了解特征在不同时间跨度上的短期和长期贡献(Philip and Marakkath, 2025)。具体公式如下:
其中,基于增益的特征重要性得分代表其对提高模型预测准确性的总体贡献。表示XGBoost集成模型中树的总数。表示树中所有使用特征的分割集合。计算过程考虑了,表示在数据集上于父节点处计算的损失值,表示在分割后划分为左右子节点的数据集上计算的损失值。对于每次分割,改进量衡量为父节点的损失与所得左和右子节点组合损失之间的差值。
其中,基于权重的特征重要性通过衡量特征在模型决策过程中的使用频率,提供了另一种视角。它计算特征被选择用于分割的次数,并由基数加权。
我们将多变量气象时间序列定义为,其中是时间步数,代表特征数量,包括和。时间处的DTDG定义为有向图(Song et al.,2025b):
其中表示时间处DTDG中的节点集合,表示时间处DTDG中的有向时间边集合。
每个节点代表时间处的气象状态,具有特征向量。时间边在滑动窗口内构建,使得:
其中表示DTDG中节点与节点之间的二元边指示符。表示代表特定回溯时间步的滞后变量,表示固定时间滑动窗口的大小,定义了因果连接的最大回溯范围。
这产生了一个反映跨时间因果依赖的有向无环图。节点嵌入通过非线性变换进行初始化(Dhankhar et al., 2025):
其中表示DTDG中节点的初始节点嵌入,表示可学习的嵌入函数。
为了捕捉非连续时间步之间的空间相关性,我们将DTSG构建为特征相似度图:
节点iii与节点之间的边权重使用高斯核计算:
其中是控制特征距离敏感度的带宽参数。
相应的加权邻接矩阵按行进行归一化:
其中 表示 DTSG 的行归一化邻接矩阵, 表示对角度矩阵, 。
这使得模型能够在结构相似的状态间传播信息,即使它们在时间上相距甚远。
同时,我们引入了遥感影像 ,其中每张图像 代表 时刻的大气空间模式。
每张图像均由卷积编码器 处理,以获得稠密嵌入:
其中 表示从 时刻的遥感图像中提取的稠密语义嵌入向量, 表示卷积神经网络编码器函数, 表示 时刻的遥感图像, 表示图像嵌入向量的维度。
随后,我们对每个时间步的气象特征和图像嵌入进行融合:
其中 表示时间步 的融合多模态特征向量,整合了气象和视觉信息, 表示拼接操作。
最终的多模态表示整合了三个互补通道,以全面捕捉风行为的时空动态。时间通道通过 DTDG 构建,通过将每个节点连接到固定时间窗口内的历史状态,对跨时间的因果和序列依赖进行建模。由 DTSG 表示的相似性通道基于特征相似性捕捉不同时间步之间的潜在结构相关性,从而实现跨时间轴的长程空间依赖建模。第三个组件图像通道利用遥感数据,将卫星图像嵌入为紧凑的语义向量,从而引入了补充数值气象观测的丰富空间背景。这三个通道共同构成了一个统一的三模态图表示,联合编码了时间顺序、空间相似性和外部视觉语义,并作为下游图神经网络的输入用于风速预测。
其中 表示从时间步 1 到 的输入多变量气象时间序列, 表示从时间步 1 到 的输入遥感图像序列。
该三通道输入被馈送到下游图神经网络中,以增强时空表示学习和风速预测。
所提出的 PSTG-Net 是一个端到端的深度学习框架,旨在通过结构化的处理组件层级整合多模态气象数据。如图 3 所示,该网络通过时间、空间和视觉三个并行编码分支运行,随后是物理信息融合核心和预测头。这种分层设计使得每个分支能够在智能组合提取的表示之前,专门处理其各自的数据模态。
图神经网络(GNN)是一类旨在通过在节点和边之间聚合及传播信息来处理图结构数据的深度学习模型。GNN 的基本原理是消息传递,即每个节点通过结合自身特征与其邻居特征来迭代更新其表示(Xie et al., 2024)。这使得模型能够捕捉图中局部和全局的结构依赖关系。
在图像分析中,图可以将像素或超像素表示为节点,并用边来编码空间关系。标准的 GNN 更新节点特征的方式为(Ma et al., 2025):
其中 是节点 在层 的特征,表示其邻居, 和 是可学习的权重, 是非线性激活函数。与依赖局部感受野的 CNN 不同,该公式使 GNN 能够建模图像中的长程依赖关系。
对于时间序列,图可以建模时间依赖关系。基于 GNN 的预测模型更新节点特征的方式为:
其中 表示时间 的状态,定义了时间邻居, 是可学习的邻接矩阵。这使得 GNN 能够捕捉超越传统 RNN 的动态时间模式。
将注意力机制引入图神经网络,通过动态学习图结构中节点的重要性,彻底改变了模型处理和解释关系数据的方式(Yang et al., 2025b)。图注意力网络(GAT)通过基于注意力的邻域聚合从根本上增强了传统的 GNN 架构,其中每个节点为其连接计算自适应权重,而不是依赖静态或统一的加权方案。这种方法使模型能够在信息传播过程中专注于最相关的邻近节点,同时抑制噪声或无关连接。GAT 中的核心注意力机制通过共享注意力函数运行,该函数计算节点对之间的归一化系数(Lin et al., 2024):

图 3. 时空物理融合图注意力网络架构。
其中 表示节点 和 之间的注意力系数, 是转换输入特征 的可学习权重矩阵,a 表示注意力机制的权重向量。LeakyReLU 非线性激活函数使模型能够学习有意义的注意力模式,而 softmax 归一化确保了每个节点邻域内权重的可比性。
多头注意力通过采用 K 个独立的注意力头来扩展该机制,从而捕捉不同类型的关系依赖:
其中每个注意力头 计算独立的注意力权重 和变换 ,最终的节点表示 由所有头的输出拼接而成。这种架构允许模型联合关注图中的不同结构模式和特征交互,与传统 GNN 方法相比,显著增强了表示能力。注意力机制的归纳特性使其能够有效地泛化到未见的图结构,同时通过稀疏邻域操作保持计算效率。
GAT 通过引入注意力机制在聚合过程中动态权衡邻近节点的重要性,从而扩展了 GNN(Lin et al., 2024)。与 GNN 中的静态聚合不同,GAT 计算自适应注意力系数,使其在学习复杂关系模式时更具表达力。
在图像图中,GAT 为边分配可学习的注意力权重,从而增强特征聚合:
其中, 是节点 和 之间的注意力得分,通过共享注意力机制 计算得出。这使得 GAT 能够专注于显著的图像区域,同时抑制噪声。
对于时间序列,GAT 通过关注相关的历史观测值来学习动态时间依赖关系:
其中 的计算方式与图像情况类似,但应用于时间邻居。这实现了对过去观测值的自适应加权,提高了相对于 LSTM 等固定权重模型的预测精度。
虽然标准的图注意力网络本身可以构成关系学习的强大基础,但在时空物理预测领域存在特定问题。单一的整体式 GAT 结构难以高效处理和组合不同类型的输入模态(如时间序列、空间图和图像),因为它们具有不同的结构和含义。直接将这些不同的数据放入同一个图中会丢失信息,或者过于复杂,无法表示我们为每种模态所期望的不同归纳偏置。为了解决这个问题,我们的工作没有简单地应用标准 GAT,而是设计了一种定制的异构融合架构。我们不仅将注意力用于单个图的节点聚合,还将其作为跨模态对齐和合成的一种方式。这使得模型能够以更灵活的方式关注不同的模态流。
我们的时空物理融合图注意力网络的整体架构如下。首先,三种异构输入流——时序依赖图(DTDG)、空间相似性图(DTSG)和遥感图像——由各自专用的基于注意力的编码器并行处理。这种并行处理实现了模态特定的特征提取,避免了过早或有损的压缩。随后,这三条并行路径的输出被送入作为融合核心的中央跨模态注意力门控。该门控负责实时计算各模态的自适应权重,并进行加权组合,以形成统一且具有上下文感知的表示。最后,融合后的表示被送入残差图注意力层进行精炼。最终回归结果可见。其架构呈现出清晰的层级堆叠:先并行编码,再融合,最后精炼并输出。
为了在复杂多变的气象条件下准确预测风速,我们提出了一种名为时空物理融合图注意力网络的新型异构图注意力框架。该模块旨在整合并自适应融合三种异构模态:捕捉大气演变时序模式的动态时序依赖图(DTDG)、建模风场间空间结构相似性的动态拓扑相似性图(DTSG),以及编码全局空间语义的遥感图像嵌入。每种模态均通过针对其内在特性定制的注意力机制进行处理,所得表示利用物理信息驱动的跨模态注意力门控模块进行融合。这种融合机制不仅确保了跨模态的语义一致性,还保持了各数据源的物理可解释性,从而增强了风速预测系统的鲁棒性与准确性。
令 表示时间 的多变量输入特征矩阵,令 为相应的遥感图像嵌入。每种模态被映射到潜在空间并由特定的注意力块进行处理。
给定 DTDG 图 ,我们使用 GAT 算子计算基于注意力的聚合:
这使得网络能够选择性地关注因果相关的过去状态,从而增强时序动态建模能力。
(b) 相似性图注意力 - DTSG
在 DTSG 图上,基于相似性的注意力定义为:
在此,注意力权重由基于相似性的边权重进行调制,以保留空间相关性。
图像特征使用 CNN 编码器 提取,随后进行空间注意力池化:
这产生了一个与时序节点对齐的上下文感知图像表示。
为了整合这三种模态,我们设计了一个带有物理感知约束的跨模态注意力门控。令 ,。我们通过以下方式计算融合权重:
(29)
最终的融合嵌入获取方式如下:
该门控机制确保了各通道中物理可解释的贡献得以保留,同时减少了冗余或冲突信息。
融合后的特征 通过一个残差图注意力层和一个线性回归头:
该模型旨在最小化一个集成了数据保真度与物理一致性的复合损失函数。除标准的监督损失外,我们引入了基于物理的约束项,以确保预测结果符合已知的大气动力学规律。总损失定义如下:
损失确保了数据保真度:
其中,模型通过最小化预测风速与真实值之间的MSE损失进行训练。
具体而言,我们基于模型预测风速与云风模块物理反演估计值之间的残差来定义损失:
其中表示模型在时间的预测风速,表示由公式(7)得出的云导风速,和分别表示预测风场与云导风场的空间梯度,是平衡幅值项与空间一致性项的权重系数。
以下伪代码概述了所提出的时空物理融合图注意力网络的核心架构。它展示了模型如何摄取时间图、相似性图和遥感影像这三种异构输入,并应用模态特定的注意力机制,随后通过物理信息融合生成精确的风速预测。
算法 1. 时空物理融合图注意力网络
(续)


本模块提出了一种新颖的异构注意力融合架构,利用物理先验和模态特定的归纳偏置,有效整合了多样的气象输入。通过物理信息注意力门控机制对时间动态、空间相关性和遥感图像进行对齐,该模型在保持可解释性、物理一致性以及对复杂多变大气条件适应性的同时,实现了卓越的预测精度。
本研究采用三种常用的评价指标来验证点值预测模型的准确性,并采用四种基于区间的评价指标来评估所提区间值模型的有效性。点值指标包括平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)(Geng et al., 2026)。
其中表示样本数量,表示第个样本的真实值,表示第个样本的预测值。
本研究通过不同的测量指标进行了测试与评估,并利用三种不同类型的多模态数据集开展了多项实验,以验证所提方法对既定研究方法的支持效果。
本研究采用欧洲中期天气预报中心(ECMWF)的ERA5再分析数据集作为主要数据源(https://cds.climate.copernicus.eu/)。为确保对模型泛化能力进行全面评估,我们的调查涵盖了中国主要气候带的三个代表性风电场。选定区域包括:江苏沿海地区,其特征为湿润亚热带季风气候,风况主要受季节性季风流支配,并受复杂海陆相互作用的显著调节;内蒙古高原地区代表了大陆性半干旱条件,在中纬度西风带内具有相对稳定的风况,且广阔的草原地形对风的影响较小;作为补充,新疆内陆盆地体现了极端干旱的大陆性气候,其风动力学深受复杂的盆山地形效应和强烈的日间热力强迫影响,产生了包括山谷风环流和热力驱动坡风在内的独特局地风系统。这种对地理和气候多样性区域的战略性选择,从东部沿海延伸至北部高原及西部内陆,为评估模型在根本不同的气象机制下的鲁棒性提供了严格的测试平台,确保了评估过程能够涵盖中国广袤多变地形下实际风电预测场景中遇到的广泛大气条件。
本分析纳入了多个关键气象参数: 和 高度的纬向与经向风分量,旨在捕捉地表及典型风力发电机轮毂高度的大气动力学特征。补充热力参数包括 露点温度 和 气温 ,有助于评估边界层稳定性;同时,平均海平面气压(msl)数据可用于考察天气尺度强迫机制。基于风场分量数据,本研究利用以下公式计算了 和 高度的风速:
这种综合多变量方法为评估不同气候区域的时空风能特征及其潜在气象驱动因素提供了稳健的基础数据。该数据集总结于下方的表 3-5 中。
本研究采用了从风云卫星遥感数据服务平台(https://satellite.nsmc.org.cn/DataPortal/cn/home/index.html)获取的重要遥感数据集。该数据集源自中国风云四号A星(FY-4A)静止气象卫星搭载的先进静止轨道辐射成像仪(AGRI),代表了中国新一代静止卫星观测系统,其光谱、空间和时间分辨率能力均有显著提升。具体而言,我们使用了 FY-4A 静止卫星 AGRI 传感器的云量产品(CLA),该产品能以高时间分辨率持续监测云分布模式。此时间分辨率与我们其他遥感输入的获取时间精确对齐,消除了融合框架中的时间错位。这种精确的时间配置使得从每个匹配时间步长获得的云导风估算值能够直接与同步的图神经网络预测结果集成,确保了跨模态物理同步的数据融合。FY-4A 平台为风能研究提供了独特优势,包括对云动力学的持续观测、适用于分析日变化的采样频率,以及可靠的多光谱云检测。当与再分析数据协同结合时,这些能力显著增强了对风能资源评估中云-大气相互作用的表征。作为代表性示例,下方的图 4 展示了该数据集中预处理遥感影像的子集,突显了其空间覆盖范围及光谱特征。
图 5 展示了江苏、内蒙古和新疆地区 10 米和 100 米高度的风速变化,揭示了沿海与内陆地区风能潜力的差异。在本实验中,我们将训练集设为 80%,测试集设为 20%。
本实验通过三种精心设计的测试配置评估了所提出的物理约束云-风相互作用模块,这些配置逐步引入了物理约束。#1 基准配置采用传统的云导风方法,将云视为被动示踪物,利用光流技术进行运动跟踪,同时保持云高和风切变指数的参数固定。该配置作为参考案例,刻意排除了所有物理修正,以确立传统方法的性能基线。#2 阻力配置引入了大气阻力补偿,同时仍保持关于高度分配和边界层稳定性的简化假设。该配置在基准基础上进行了修改,考虑了压力相关阻力效应和卫星观测几何,代表了向更符合物理实际的建模迈出的第一步。然而,它继续使用与基准相同的固定云高和中性稳定性假设,从而能够单独评估归因于阻力修正的特定改进。#3 稳定性缩放配置在阻力修正版本的基础上,纳入了边界层稳定性调整,同时仍使用相同的固定云高参数。通过在保持高度分配参数一致性的同时增加稳定性物理量,该配置专门评估了正确表征稳定性所带来的增量收益。
三种配置均采用相同的核心参数,如空间分辨率、时间观测间隔和标称云高,以确保性能差异均可归因于所引入的物理过程。实验设置能够清晰识别各项改进所对应的物理成因:基准模型提供参考状态,阻力修正版本展示了动量传递的影响,稳定性缩放版本则展示了热力学耦合的影响。这种从完全经验方法到物理约束模型的有序演进,为在业务化风场反演算法中提高物理约束的真实性提供了有力论证。对照实验结果见表6。
表6中的实验结果表明,随着物理约束逐步融入云风相互作用模型,性能呈现出清晰且持续的提升。在全部六个数据集中,基准模型#1的误差最高,其中DATA1的MAE达到0.068,DATA3的MAPE高达9.35%。这反映了传统云迹风方法将云视为被动示踪物而不考虑大气物理机制的固有局限性。在#2中引入阻力修正后,各数据集的MAE较基准模型降低了约12%至18%,证实了在云运动转换中正确建模压力相关阻力效应的重要性。值得注意的是,稳定性缩放模型#3进一步降低了误差,MAE较基准模型降低了20%至30%,在DATA2中尤为显著,MAE从0.054改善至0.038。这种渐进式的增强验证了以下假设:每增加一种物理机制,都能为风场反演精度带来独特且累积的收益。具体细节见图6。
表3
江苏省统计描述。
所有变量缩写名称均在缩写表中说明。
表4
内蒙古自治区统计描述。
所有变量缩写名称均在缩写表中说明。
表5
新疆维吾尔自治区统计描述。
所有变量缩写名称均在缩写表中说明。
所提模型在所有评估指标和数据集上均表现出优于其他三种实验配置的性能,误差最低。具体而言,其MAE值在0.008至0.042之间,MAPE值在0.94%至5.23%之间,表明在所有测试条件下均具有最高的预测精度。这种性能优势在DATA3上最为显著,所提模型的MAPE为5.23%,远低于稳定性缩放配置的6.51%,这表明物理约束的全面整合产生了超越增量式或孤立改进的协同效应。此外,该模型在不同高度层表现出一致的性能:DATA5显示出最小的绝对误差,而DATA6实现了最低的相对误差,且所有案例均保持了统一的相对改进趋势。这些模式证明了其在不同气象和垂直测量条件下的强大泛化能力。最后,从配置#1到#3观察到的系统性误差降低,以及最终所提模型的表现,为物理感知建模在业务化风场反演应用中的有效性提供了令人信服的实证依据。
本实验通过消融研究,对所提多模态动态图框架中各部分的贡献进行了深入分析。研究主要分为两部分:单模态消融测试,用于检验不同表示模态的独立影响;多模态组合测试,用于结合不同表示模态以测试其综合效果。
在单模态消融研究中,我们分别考察了三个基本组件。第一个#4动态循环图(仅限)仅采用动态循环图结构来捕捉风场的时间演变模式,完全忽略了空间关系和视觉特征。这种纯时间建模方法旨在建立仅通过序列数据建模所能达到的基准性能。第二个#5动态相似性图(仅限)仅关注通过动态相似性图进行空间信息建模,保留了观测点之间的几何关系,但忽略了时间动态和图像特征。第三个#6遥感图像(仅限)仅利用卷积神经网络提取的卫星图像特征,提取视觉模式,同时忽略了时间和空间图表示。结果见下表7。
表7显示的结果清楚地表明,与我们的模型相比,使用单一模态会导致性能下降,这验证了使用多模态的必要性。动态循环图模型#4在六个数据集上的MAE值在0.013-0.063之间,始终优于MAE值为0.015-0.068的遥感图像模型#6。这种性能模式表明,在序列风速模式中,相比于单纯的空间图像特征,存在更多可预测的信号。动态相似度图模型#5表现中等,其MAE在0.011到0.057之间。这表明观测值之间的关系很重要,但并不完整。性能差距:性能差距在DATA3中更为明显,所提模型的MAPE为5.23%,而最佳单模态模型#4为8.42%。此外,在DATA6中,所提模型相比模型#5保持了0.51个百分点的MAPE优势。这些结果强调,表征预测风速所需的所有复杂时空动态,需要的不是单一模态而是多种模态,这凸显了将不同模态结合起来的重要性。
多模态组合测试探索了整合完整模型部分能力的中间架构。#7 DTDG + DTSG结合了两种动态图结构,即用于时间建模的循环图和用于空间关系的相似度图,同时刻意排除了卫星图像特征。这种双图方法评估了在没有视觉线索的情况下时空建模的协同效应。#8 DTDG + RS Image将时间图建模与遥感特征配对,但省略了空间相似度图,以测试时间模式与视觉特征如何相互作用。相反,#9 DTSG + RS Image将空间图建模与图像特征集成,同时去除了时间分量,揭示了序列信息在融合过程中的重要性。结果如下表8所示。
如表8所示,部分多模态组合始终优于单模态配置,但在所有数据集上仍逊色于完整的三模态集成。在部分模型中,#7 DTDG + DTSG表现最佳,在六个数据集上的MAE值范围为0.010至0.049,其误差幅度仅比所提完整模型高出10%至15%。这一结果证实了时间动态和空间动态构成了风速预测的核心要素。将遥感与时间或空间图建模相结合的配置#8,以及仅依赖遥感数据的配置#9,表现相当,MAE值分别为0.011至0.052和0.011至0.051。然而,这两种设置产生的误差均比完整的三模态模型高出18%至25%。这种性能差距在DATA1上最为显著,因为缺乏时间或空间建模限制了对图像中缺失动态信息的补偿能力。总体而言,完整三模态集成在所有评估指标和数据集上的一致优越性,突显了每种模态对准确风速预测不可或缺的贡献。

图4. 不同时间点的数据集遥感图像样本。
所有实验设置均使用相同的数据源和指标进行不同模态间的比较。空间分辨率参数、时间采样间隔和基础网络架构始终保持不变,仅对所选部分进行包含或排除。因此,这种全方位的对比使得精确发现不同表征方式在作用上的差异成为可能,明确指出了哪些部分对于捕捉从过去到现在的时间移动模式、区域间的相互关系以及现实中的实际外观最为重要。此类系统性比较的结果有助于指导实际多模态风场模型在计算成本与表征能力之间达成平衡。
本实验从两个不同但互补的角度评估了所提时空-物理融合注意力机制的性能:不同模型架构的比较,以及与基准模型的对比。

图5. 数据概览。
在实验的第一部分,我们将研究应用于图的不同融合策略。# 10 GNN Fusion 采用标准的 GNN 方法,在没有专门注意力机制的情况下融合时间图、空间图和遥感图像这三种模态。#11 GCN Fusion 使用图卷积网络作为融合主干,#12 GAT Fusion 使用图注意力网络作为融合主干。这三种方法使用相同的输入特征,但组合方式不同。关键对比 #13 physics unconstrained fusion:从跨模态注意力门中移除所有物理方程,保持架构不变,以直接对比物理约束的贡献。结果如下表 9 所示。
表9的结果强调了图架构选择与物理约束引入的关键作用。所提方法在所有数据集上的MAE值介于0.008至0.042之间,始终优于所有对比方法。在基准融合策略中,基于GAT的融合模型#12表现最强,MAE值在0.011至0.052之间,凸显了注意力机制在多模态特征融合中的有效性。相比之下,无物理约束的融合模型#13表现最弱,在DATA1上的MAE值高达0.063,这清楚地表明引入物理约束对于实现最优多模态融合性能是必不可少的。
第二部分利用最先进的序列建模架构建立了性能基准。配置#14 BiLSTM采用双向长短期记忆网络,配置#15 GRU使用门控循环单元作为核心时间建模组件。基于Transformer的方法包括:配置#16采用标准自注意力的Transformer,
表6
物理约束云风相互作用验证对照实验结果。
配置#17采用改进Transformer架构的iTransformer,配置#18为针对长序列建模优化的Informer,配置#19为具备自动分解能力的Autoformer。这些基准实现均处理相同的输入特征,但采用了各自独特的架构;配置#20 ST-Transformer集成了时空注意力以实现统一的时空建模,配置#21 Graph WaveNet (GWNet) 实现了具有自适应图学习的图小波神经网络,配置#22 MTGNN采用了混合跳跃传播架构与图学习,配置#23基于扩散的GNN利用了具有预定义依赖结构的扩散卷积层。结果如下表10所示。
表7
单模态消融实验结果。

图6. 使用最先进序列建模架构的基准实验指标。
表8
多模态组合实验结果。
表10显示,尽管现代序列模型能达到合理的性能,但它们从根本上缺乏云风相互作用建模所需的专门设计。所提模型在所有六个数据集上均保持了对所有基准的持续优势,MAE值从0.008到0.042,而最佳基准性能范围为0.011到0.051。在DATA3等具有挑战性的案例中观察到了显著的性能差距,所提模型达到了0.016的MAE,而Autoformer为0.020。
在基准模型中,#19 Autoformer和#18 Informer表现最强,因为它们利用了专为气象时间序列建模定制的注意力机制,在不同数据集上实现了0.011至0.051的MAE值。然而,尽管有这些架构改进,所有基于Transformer的变体在大多数数据集上的MAE仍比所提模型差约10%至15%。相比之下,传统的循环架构如#14 BiLSTM和#15 GRU表现最差,在DATA1上的MAE值分别为0.065和0.062。同时,标准Transformer模型表现出明显的性能演进,从原始的#16 Transformer发展到更精细的变体#17、#18和#19。时空图模型#20至#23在不同数据集上表现出不同程度的有效性,其中#21 Graph WaveNet表现最为稳定。总体而言,这一综合比较强调了通用序列建模方法在没有引入显式物理约束和专门多模态融合策略的情况下,难以捕捉大气的内在物理动力学。所提模型的性能可视化见图7。
表9
不同基于图的融合策略实验结果。
所有实验配置均保持相同的评估协议,使用相同的训练集与测试集划分及相同的性能指标。空间分辨率参数像素和时间采样间隔在所有测试中保持一致。为确保公平比较,所有基准模型均以相当的参数量实现,并在相同的优化设置下进行训练。这一严谨的评估框架实现了对所提注意力机制的架构优势及其在现有最先进方法中的竞争力的全面评估。结果为时空物理融合策略的有效性提供了明确证据,并将其性能置于当代序列建模技术的更广阔背景中。
与现有的风场估计方法相比,所提方法在云风场估计中提供了更高的估计精度和物理一致性。该模型集成了动态图表示和物理信息注意力机制,以捕捉云运动与大气动力学之间复杂的相互作用。多种数据源的创新结合实现了更强大的风场重构,特别是在天气变化剧烈或观测数据稀缺等困难场景下。本研究在多项定量评估中与其他方法进行了对比。新方法相较于先前方法提升了评分,且具备良好的运行计算效率。
表 10
使用最先进序列建模架构的基准实验结果。
此外,该方法允许将物理约束直接编码到学习过程中,这是对纯数据驱动技术的改进。物理感知模块确保了预测结果符合大气科学的基本原理,从而提高了结果的质量与可解释性。这对风能领域非常有益,因为准确且符合物理规律的预测对于电网管理和风机运行至关重要。该模型在各种天气条件下表现良好,表明其在训练环境之外也具有良好的泛化能力。这意味着该模型可应用于实际场景,助力可再生能源获取及天气预报。
本节通过分析推理时间和内存占用这两个关键指标,评估所提模型的计算效率。这些指标对于评估模型在业务预报系统中的实际适用性至关重要,因为速度和资源限制在其中起着关键作用。
推理时间衡量处理单个输入样本并生成预测所需的挂钟时间。其计算公式为:
其中 和 分别表示 前向传播的开始和结束时间戳,N 为测试样本总数。
内存占用量化了推理过程中的峰值 GPU 内存消耗,这决定了模型能否部署在资源受限的硬件上。其记录方式为:
参数量化了模型中可学习参数的总数,直接反映了模型的复杂度和存储需求。该指标计算如下:
其中 和 分别表示第 1 层的权重和偏置参数, 表示参数的基数, 为网络架构中的总层数。参数量是评估模型在存储容量受限设备上部署可行性的重要指标。
计算效率的结果如下表 11 和图 8 所示。
计算效率指标的评估对于可再生能源应用具有重要的实际意义。在实时风力预测系统中,低延迟推理对于支持电网管理中的及时决策至关重要,风场预报的快速更新直接影响发电调度和电网稳定性。模型的内存效率直接决定了其可扩展性,使其能够部署在边缘设备上进行局部预报,或在不产生过高硬件需求的情况下集成到高分辨率全球预报系统中。
此外,降低计算开销意味着业务机构可大幅节省成本,因为更低的 GPU 内存需求和更快的处理速度减少了云计算费用,同时保持了预报质量。当系统投入持续业务使用时,这些效率考量尤为关键,必须在维持计算性能与日益复杂的物理参数化之间取得平衡。所提模型在所有计算指标上均表现出卓越的效率,同时实现了具有竞争力的预报精度,代表了在弥合研究创新与可再生能源领域业务预报需求之间差距方面迈出的重要一步。

图 7. 所提方法的结果。
尽管所提框架已证明其有效性,但仍存在一些局限性,有待进一步研究。首先,当前的物理约束云风交互模块采用整体参数化策略来表征云对边界层动力学的影响。虽然该公式捕捉到了主要的物理效应,但在极端或快速演变的大气条件下,可能无法完全解析高度非线性的云微物理过程。其次,尽管动态图结构在时间上是自适应的,但其构建仍依赖于预定义的相似性度量和固定的时间窗口,这可能会限制模型完全捕捉大气流场中突发状态转换的能力。
未来的研究将重点从两个主要方向解决这些局限性。在物理建模方面,扩展云风交互模块以纳入更详细的微物理过程,如云冰相热力学和气溶胶-云相互作用,这些过程有望进一步提升预测性能,特别是在极端天气事件中。在数据表征方面,为多模态动态图表征模块开发自适应机制,使图拓扑和连通性能够根据演变的大气稳定性指标自动调整,从而实现对时空依赖关系更灵敏且物理一致的学习。总而言之,这些进展可以进一步增强所提框架的适用性,并为下一代可再生能源系统中的业务化风能预测建立新的基准。
本研究开发了一个创新框架,通过在大气物理原理与前沿深度学习方法之间建立协同桥梁,显著提升了风速预测能力。其核心创新在于各互联组件的无缝集成:物理约束云风交互模块通过引入动态云动量传递和稳定性感知边界层调整,革新了传统方法;该模块与多模态动态图表征模块协同工作,通过动态演变的图结构捕捉复杂的时空模式;此外,时空物理融合图注意力网络模块利用物理引导的注意力机制,实现了异构气象数据流的最优组合。该架构在物理基础参数化与数据驱动特征学习之间建立了持续对话,在不牺牲计算可行性或物理可解释性的前提下,实现了前所未有的预测精度。实验验证证实了该系统在多种业务场景下的卓越性能,特别是在复杂地形和快速演变天气系统等传统方法存在根本局限性的挑战性条件下,增益尤为显著。这种整体性方法成功协调了物理建模与机器学习的互补优势,代表了风能预测领域的一次范式转移。
表 11 表 11(续)
(下页续)
表 11(续)
当前的风速预测系统面临若干根本性局限,限制了其精度和业务效用。尽管数据驱动方法已取得显著进展,但在有效整合大气物理与现代机器学习技术方面仍存在关键差距,特别是在处理不同大气成分与观测模态之间的复杂相互作用时。这些挑战为通过物理原理与人工智能方法的更深层融合来提升预测能力提供了重要机遇。本研究通过四项关键创新解决了这些差距,共同构成了风速预测方法论的一次范式转移。
(1) 结合物理约束的云动力学遥感反演。本研究通过将物理约束整合到高度校正和云动量建模中,增强了基于云的风场反演。该框架将云类型特定的风切变、边界层稳定性和地形效应纳入风廓线估计,并提出了新的参数化方案,通过阻力和稳定性机制量化云微物理对地表风的影响。这使方法论从被动的云追踪演进为主动的云风交互建模。在保持卫星方法计算效率的同时,该方法纳入了业务系统中通常缺乏的关键大气物理要素,从而在不牺牲空间覆盖范围的前提下,提高了风场估计的精度。

图 8. 计算效率结果。
(2) 用于多模态气象数据的异构图表征。该方法将动态图学习与遥感影像相结合,以增强风场表征。它采用双动态图结构对时间演变和空间模式进行建模,并通过跨模态注意力机制与卫星影像进行自适应融合。这实现了对点位风数据和空间云特征的联合分析,同时捕捉时间动态和空间相互作用。该方法克服了静态图的局限性,比传统的单模态技术产生了更准确且物理一致的表征。
(3) 针对异构气象输入的增强型图注意力机制。本研究引入了一种注意力网络,通过专门的注意力机制将动态时空图与遥感影像集成。时间注意力捕捉序列演变,自适应相似性注意力维持空间相干性,卷积注意力提取图像特征,所有这些均通过物理信息驱动的跨模态注意力门进行融合。该设计在保持各数据模态独特特征的同时,实现了物理一致的融合,并能动态适应演变的气象条件。该框架克服了传统图注意力机制的局限性,以更高的计算效率提供了更准确的风场系统表征。
(4) 统一风能预测的集成系统架构。本研究提出了一种集成云物理反演、动态图表示及时空物理注意力的统一端到端框架。该架构具备双向模块交互功能:云动力学为图学习提供物理约束,而动态图通过自适应拓扑更新增强云特征表示。共享潜在空间促进了持续的信息交换,跨模块注意力门控则根据实时条件动态平衡各部分贡献。通过并行处理底层传感器数据与高层物理关系的分层特征融合,系统保持了计算效率。这种内聚式设计通过在单一可训练架构中联合利用物理原理、多模态关系及动态特征自适应,优于传统的阶段式方法。