当前位置：首页>南京>【文萃札记39】JHydrol | 南京大学-王栋-基于残差网络的径流预测特征提取与动态融合

【文萃札记39】JHydrol | 南京大学-王栋-基于残差网络的径流预测特征提取与动态融合

2026-05-10 22:02:52

南京大学研究王栋教授团队联合Vijay Singh于2026年3月在Journal of Hydrology期刊发表“基于残差网络的径流预测特征提取与动态融合框架” 研究成果

1、基本信息

标题	ReDF-net: a feature extraction and dynamic fusion framework based on residual networks for runoffforecasting (ReDF-net：基于残差网络的径流预测特征提取与动态融合框架)
期刊	Journal of Hydrology（水文学国际顶刊，中科院一区 TOP，水文领域权威期刊）
时间	2026 年 3 月在线发表，卷 673，文章编号 135422
一作	Zhuo Yang（南京大学地球科学与工程学院表生地球化学教育部重点实验室）
通讯	王栋（南京大学，邮箱：wangdong@nju.edu.cn）
合作作者	Vijay P. Singh、张阿龙、Chenlu Yu、Xiaoyu Ye、Qingwen Deng、曾献奎、蒋建国、吴吉春
单位	1. 南京大学地球科学与工程学院；2. 美国德州农工大学；3. 阿联酋大学国家水与能源中心
DOI	10.1016/j.jhydrol.2026.135422
关键词	双向门控循环单元、图像特征提取、动态特征融合、SHAP 可解释性分析、降雨 - 径流模拟

2、研究思维导图

3、研究概述

论文摘要

深度学习已成为降雨-径流模拟预测的重要工具，凭借其捕捉复杂非线性关系的能力，在不同流域与气候条件下均取得了优异的预测效果。近年来，卫星遥感与再分析产品的快速发展提供了更丰富的水文气象信息，推动径流预测从单模态输入向多模态融合转变，以更完整地刻画水文过程。但现有方法仍存在诸多局限：栅格特征提取与时序预测往往相互独立开展，缺乏面向预测任务的定向优化；传统卷积架构难以处理高维时空依赖关系，模型训练稳定性差；且针对多模态输入，鲜有统一的机制来量化不同模态的相对贡献。为解决上述问题，本文提出ReDF-Net— 一种基于残差网络的动态融合框架。改进型残差网络（ResNet）模块中的可学习注意力参数，可实现空间特征提取与时序建模的自适应耦合；优化后的残差块在提升复杂多模态特征表达能力的同时，增强了模型训练的稳定性；统一的贡献量化模块可系统评估各类输入的相对重要性，提升模型的物理一致性与可解释性。本文将 ReDF-Net 与长短期记忆网络（LSTM）、门控循环单元（GRU）、双向门控循环单元（BiGRU）三种主流时序预测模型相结合，并在我国两个气候特征迥异的流域开展了验证。结果表明，ReDF-Net 与 BiGRU 耦合的模型表现最优，两个流域的纳什效率系数（NSE）均超过 0.97，显著优于传统数据驱动基准模型（如随机森林）、SWAT 物理水文模型、基础对照模型以及前沿的 iTransformer 模型。基于 SHAP 的可解释性分析进一步验证了该框架的可解释能力。综上，ReDF-Net 可作为一种通用范式应用于多模态径流预测，实现预测精度与可解释性的双重提升。

通俗概述

咱们搞水文的都知道，给河流做径流预报，就跟给老天爷 “猜心思” 差不多，既要报得准，还得说清为啥准。以前的法子各有各的毛病：物理水文模型像老水利人靠经验开方，参数一大堆，换个流域就 “水土不服”；纯深度学习模型像黑匣子算命，准是准了，但说不出个所以然，水文业务上不敢随便用；好不容易有了站点观测、遥感卫星这些多源数据，结果各玩各的，栅格数据和时序数据搭不上话，特征提取和预报任务两张皮，训练起来还动不动就 “崩了”。这篇论文直接搞了个叫 ReDF-Net 的 “水文预报智能融合神器”，说白了就是给 LSTM、GRU 这些主流时序预报模型，装了个万能 “性能增强插件”。它用改进的残差网络把遥感土壤湿度栅格数据的关键信息扒得明明白白，再用可学习的注意力机制给不同数据源动态 “打分加权”，让特征提取和预报任务从头到尾绑定优化，彻底解决了 “两张皮” 的问题。最厉害的是，这玩意儿在长江宜昌、黄河兰州两个气候、尺度完全不同的流域，都把预报精度 NSE 干到了 0.97 以上，吊打了传统随机森林、前沿 iTransformer 甚至 SWAT 物理模型，尤其洪水峰值得抓得贼准；更绝的是，它还能通过 SHAP 分析，把每个数据源对预报结果的贡献算得清清楚楚，彻底打破了 “黑匣子” 魔咒，既准又有理，还能随便往主流时序模型上套，给咱们多模态水文预报领域，趟出了一条“高精度 + 高可解释性” 双在线的新路子。

4、研究背景及意义

核心研究背景	对应研究意义
1. 径流预报是流域防洪减灾、水库优化调度、水资源精细化管理的核心技术支撑，极端水文事件频发背景下，对预报的精度、可靠性、时效性提出了更高要求	1. 为径流预报提供了全新的技术框架，显著提升了预报精度，尤其强化了对洪水峰值的捕捉能力，可为流域防洪安全、水资源管理业务提供关键技术支撑
2. 卫星遥感、再分析产品的快速发展，为水文模拟提供了更丰富的多源水文气象信息，径流预报从传统单模态站点输入，向多模态数据融合转型成为行业必然趋势	2. 突破了传统单模态数据的信息局限，实现了站点时序数据与遥感栅格数据的端到端深度融合，为多源水文信息的高效挖掘与利用提供了通用范式
3. 现有物理水文模型存在参数多、区域适配性差、校准难度大的问题；传统数据驱动模型存在严重的 “黑匣子” 特性，可解释性不足，难以满足水文业务对物理一致性的核心要求	3. 兼顾了数据驱动模型的高精度优势与水文过程的物理可解释性，解决了传统深度学习模型 “唯精度论”、物理意义缺失的行业痛点，提升了数据驱动模型的业务可信度
4. 现有多模态融合方法存在三大核心瓶颈：栅格特征提取与时序预测相互脱节、传统卷积架构训练不稳定、多模态特征贡献无法系统量化，严重制约了多源数据的应用效果	4. 针对性破解了现有多模态融合方法的核心缺陷，构建了 “特征提取 - 动态融合 - 可解释性分析” 一体化的框架，推动多模态水文预报从 “简单数据拼接” 向 “智能深度融合” 升级

5、研究创新点

过往研究核心空白与局限	论文对应核心创新点
1. 栅格特征提取与时序序列建模相互独立，用于特征提取的 CNN 未针对径流预报任务做定向优化，提取的特征与预报目标相关性弱、冗余度高，严重干扰后续时序建模	1. 提出 ReDF-Net 通用框架，在残差块中引入可学习的注意力参数，将栅格特征提取与时序预测进行端到端紧耦合，实现了面向径流预报任务的定向特征学习，从根源上解决了特征与预报目标脱节的问题
2. 传统卷积架构（如 AlexNet）难以捕捉水文数据的高维时空依赖关系，处理复杂水文数据时易出现梯度消失 / 爆炸问题，模型训练稳定性差，对长序列输入的适配性弱	2. 重新设计了残差块结构，基于改进的 ResNet18 构建特征提取模块，通过残差跳接有效缓解了梯度消失问题，大幅提升了高维时空特征的捕捉能力与模型训练稳定性，对长序列输入的适配性显著增强
3. 现有研究多聚焦于提升预报精度，对模型可解释性关注严重不足；多模态输入场景下，缺乏统一的机制量化不同数据源的相对贡献，模型的物理合理性与可迁移性严重受限	3. 构建了统一的多模态特征贡献量化模块，结合 SHAP 可解释性分析方法，实现了跨模态特征的全局贡献评估，不仅量化了不同输入因子的预报作用，还揭示了不同流域的水文响应机制，大幅提升了模型的物理一致性与可解释性
4. 现有多模态融合模型多为定制化架构，与主流时序预测模型兼容性差，通用性、可拓展性弱，难以在业务中快速落地	4. ReDF-Net 为插件式通用框架，可无缝耦合 LSTM、GRU、BiGRU 等主流时序预测模型，无需对原有模型架构做大规模定制化修改，通用性与可拓展性极强，具备快速业务化落地的条件

6、研究区概况和数据

研究区概况

研究站点	所属流域	核心气候特征	控制集水面积	关键水文特征
宜昌站	长江中游（葛洲坝大坝下游）	亚热带湿润季风气候，降水主要集中在 5-9 月	3974 km²	以丘陵河谷地形为主，汛期径流响应快；受上游大型水利工程调控显著，土壤水与河道调蓄能力强，基流稳定
兰州站	黄河上游（刘家峡水库下游）	半干旱大陆性气候，年降水量更低、季节性更强	35201 km²	以山地地形为主；受上游水库长距离调蓄影响，基流稳定，枯水期最小流量较高，径流过程受干旱区能水耦合机制主导

研究

站点

所属流域

核心气候特征

控制

集水面积

关键水文特征

宜昌站

长江中游（葛洲坝大坝下游）

亚热带湿润季风气候，降水主要集中在 5-9 月

3974 km²

以丘陵河谷地形为主，汛期径流响应快；受上游大型水利工程调控显著，土壤水与河道调蓄能力强，基流稳定

兰州站

黄河上游（刘家峡水库下游）

半干旱大陆性气候，年降水量更低、季节性更强

35201 km²

以山地地形为主；受上游水库长距离调蓄影响，基流稳定，枯水期最小流量较高，径流过程受干旱区能水耦合机制主导

数据来源

数据类型	数据内容	时空尺度	数据来源	作用
站点实测时序数据	日尺度降水、潜在蒸散发（PET，Penman 公式计算）、上游站点历史径流、目标站点日径流	日尺度；宜昌站 2012-2020 年，兰州站 2010-2018 年	中国国家气象信息中心《中国地面气候资料日值数据集 (V3.0)》	模型核心表格型（tabular）输入，目标输出为目标站点的日径流数据
遥感再分析栅格数据	表层土壤湿度	日尺度；原生空间分辨率 0.1°（约 10km），未做重采样 / 插值处理	哥白尼气候数据存储中心 ERA5-Land 再分析数据集	模型核心栅格型（raster）输入，用于空间特征提取，表征流域下垫面干湿状态
地理空间辅助数据	30m 分辨率中国年度土地覆盖数据、世界和谐土壤数据库 (HWSD) 土壤属性信息	30m 空间分辨率	土地覆盖数据：Yang and Huang (2021)；土壤数据：HWSD	仅用于 SWAT 物理水文模型的构建与校准，未纳入数据驱动模型的输入

7、研究方法

方法模块	核心原理	主要实施步骤
改进ResNet18 栅格特征提取模块	针对水文栅格数据的时序特性改造 ResNet18 架构，通过残差跳接缓解梯度消失问题，实现面向径流预报任务的空间特征自适应提取	1. 调整首层卷积核数量，从默认 3 改为 30，适配多通道时序栅格输入； 2. 经 7×7 大核卷积、批归一化、ReLU 激活、最大池化完成初步特征提取与下采样； 3. 依次通过 4 组残差块完成深层多尺度特征提取； 4. 经全局平均池化与全连接层，输出固定维度的栅格特征向量
基于注意力机制的动态特征融合模块	引入全局可学习的注意力参数，通过 softmax 归一化生成动态权重，实现栅格特征与表格时序数据的自适应融合，完成端到端联合优化	1. 将提取的栅格特征与站点表格数据按时间维度对齐； 2. 引入全局可学习注意力参数，经 softmax 归一化生成特征权重； 3. 对栅格特征进行加权聚合，沿时间维度扩展后与表格数据拼接，形成模型联合输入；4. 通过反向传播，实现特征提取、注意力权重、时序预测模块的端到端联合优化
时序模型耦合与超参数优化	将 ReDF 框架与 LSTM、GRU、BiGRU 三种主流时序模型耦合，通过网格搜索完成超参数优化，验证框架的通用性	1. 分别构建 ReDF-LSTM、ReDF-GRU、ReDF-BiGRU 三种耦合模型； 2. 采用网格搜索优化核心超参数：输入序列长度（10-60 天）、批次大小（4-32）、隐藏层单元数（8-64）； 3. 固定学习率 0.001，采用 Adam 优化器，最大迭代 200 轮，加入早停机制防止过拟合； 4. 数据集按 6:2:2 划分为训练集、验证集、测试集
模型性能综合评估体系	选取 4 项互补的评价指标，通过消融实验、横向对比实验，全面验证模型性能	1. 采用 NSE（纳什效率系数）、RMSE（均方根误差）、MAE（平均绝对误差）、MAPE（平均绝对百分比误差）4 项核心指标；2. 开展消融实验，对比有无 ReDF 框架的基础模型性能差异；3. 与随机森林 (RF)、iTransformer、SWAT 物理模型开展横向对比；4. 分析不同输入序列长度下模型的性能稳定性
基于 SHAP 的模型可解释性分析	采用 SHAP（沙普利加和解释）方法，量化多模态特征的全局贡献，分析特征交互作用，验证模型行为与水文物理机制的一致性	1. 以性能最优的 ReDF-BiGRU 为代表，计算各输入特征的 SHAP 值； 2. 基于平均绝对 SHAP 值，完成特征全局重要性排序； 3. 分析 SHAP 值分布规律，揭示单特征对径流预报的影响机制； 4. 开展特征交互作用分析，挖掘多因子间的协同效应，验证模型的物理合理性

8、主要结论

模型性能核	1. ReDF 框架可稳定提升 LSTM、GRU、BiGRU 三种主流时序模型的径流预报性能，宜昌站 NSE 平均提升约 0.03，兰州站平均提升约 0.02，误差指标同步显著下降； 2. ReDF-BiGRU 模型取得最优预报效果，在宜昌、兰州两个流域的 NSE 均超过 0.97，显著优于随机森林、iTransformer 等数据驱动基准模型，以及 SWAT 物理水文模型； 3. ReDF 框架大幅降低了模型对输入序列长度的敏感性，在 10-60 天输入长度范围内均保持稳定高性能，长序列输入场景下优势尤为突出；4. ReDF 框架显著提升了模型对洪水峰值的捕捉能力，对汛期径流突变的响应更灵敏，更适配流域防洪预报的业务需求
方法通用性与创新性	1. ReDF-Net 为插件式通用框架，无需对原有基础时序模型做大规模定制化修改，即可实现性能的稳定提升，具备极强的通用性与可拓展性； 2. 改进的残差块结构有效缓解了梯度消失问题，大幅提升了高维水文时空数据的特征提取能力与模型训练稳定性； 3. 端到端的紧耦合架构，实现了栅格特征提取与径流预报任务的定向优化，从根源上解决了传统方法 “特征提取与预报目标脱节” 的核心问题
可解释性与水文机制	1. 两个流域中，上游径流均为最核心的预报影响因子，表层土壤湿度为第二大重要因子，其贡献超过降水与潜在蒸散发，验证了土壤湿度对径流生成的关键调控作用； 2. 模型学习到的特征规律与经典水文机制高度一致：土壤湿度接近饱和时，对径流的正向贡献显著增强，降水与土壤湿度存在显著的协同效应； 3. 揭示了湿润区与半干旱区差异化的水文响应机制：宜昌站（湿润区）径流主要受降水与流域干湿状态调控，PET 影响微弱；兰州站（半干旱区）径流对土壤湿度的敏感性更高，PET 呈现复杂的非线性影响，反映了干旱区独特的能水耦合机制
应用价值	1. ReDF-Net 为多源遥感数据与站点观测数据的融合应用提供了全新范式，可有效挖掘多源水文信息的预报价值； 2. 框架在不同气候、不同尺度、不同调控程度的流域均表现出优异的性能与鲁棒性，具备广泛的业务化应用潜力； 3. 高精度与高可解释性兼备的特性，解决了数据驱动模型在水文业务应用中 “可信度不足” 的核心痛点，可为防洪减灾、水库优化调度、水资源精细化管理提供关键技术支撑

9、主要图表

表 1 不同输入长度下各模型的最优超参数组合

表 2 验证期宜昌站 SWAT 模型与所选数据驱动模型的性能指标

图1 研究区及兰州、宜昌水文站位置图

图 2 研究使用的数据类型示意图

图 3 (a) 传统单模态输入深度学习径流预报模型、先进多模态输入模型与 ReDF 框架增强模型的对比；(b) ReDF 框架构建的技术流程；(c) ReDF 框架与传统深度学习径流预报模型的耦合

图 4 改进的残差网络架构

图 5 栅格数据信息提取与模型输入新数据集构建（以LSTM 为例）

图 6 宜昌站不同历史输入序列长度下，ReDF-LSTM 模型纳什效率系数 (NSE) 的变化规律

图 7 宜昌站不同历史输入序列长度下，ReDF-GRU 模型纳什效率系数 (NSE) 的变化规律

图 8 宜昌站不同历史输入序列长度下，ReDF-BiGRU模型纳什效率系数 (NSE) 的变化规律

图 9 宜昌站有无 ReDF 框架的循环神经网络模型性能对比

图 10 兰州站有无 ReDF 框架的循环神经网络模型性能对比

图 11 宜昌站不同历史输入序列长度下各模型的预报性能

图 12 兰州站不同历史输入序列长度下各模型的预报性能

图 13 验证期宜昌站流量过程线对比，展示洪水事件与非洪水期的模型表现

图 14 基于 SHAP 的宜昌站特征重要性与分布

图 15 基于 SHAP 的兰州站特征重要性与分布

图 16 基于 SHAP 的宜昌站特征交互作用分析

图 17 基于 SHAP 的兰州站特征交互作用分析

10、借鉴意义

应用维度	核心借鉴价值	落地与拓展建议
学术研究层面	1. 为多模态水文预报领域提供了 “特征提取 - 动态融合 - 可解释性分析” 三位一体的全新研究范式，突破了传统多模态融合的核心瓶颈； 2. 首次实现了残差网络与循环神经网络的端到端紧耦合，为水文时空数据融合建模提供了新的技术思路； 3. 建立了多模态水文模型可解释性分析的标准化流程，推动数据驱动水文模型从 “黑箱” 向 “灰箱”“白箱” 发展； 4. 揭示了受水库调控流域，湿润区与半干旱区差异化的水文响应机制，为变化环境下的流域水文过程研究提供了新视角	1. 可将该框架拓展至土壤湿度、地下水埋深、水质预测等其他水文要素模拟场景； 2. 可融合植被覆盖、积雪、蒸散发等更多遥感数据源，进一步丰富模型输入维度； 3. 可将框架与Transformer、Mamba 等新兴时序模型耦合，验证其通用性；4. 可基于该框架开展无资料 / 缺资料流域的径流预报迁移学习研究
工程应用层面	1. 插件式的框架设计可快速适配现有水文业务预报系统，无需重构原有模型架构，即可实现预报精度的显著提升； 2. 模型对洪水峰值的优异捕捉能力，可为流域防洪减灾、水库汛期调度提供高精度技术支撑； 3. 高可解释性的特性满足了水文业务对模型物理合理性、可信度的要求，大幅降低了数据驱动模型的业务化应用门槛； 4. 模型在不同气候区、不同尺度流域均表现出强鲁棒性，具备大范围推广应用的潜力	1. 可结合流域现有水文监测站网，构建本地化的 ReDF-Net 径流预报模型，嵌入业务化预报系统； 2. 可拓展至 3 天、7 天、15 天等多预见期的径流预报，满足水库调度、水资源管理的不同业务需求； 3. 可结合数值天气预报产品，实现滚动式的实时径流预报； 4. 可基于模型的特征贡献分析，优化流域水文监测站网布局，提升关键要素的监测能力
行业发展层面	1. 推动了水文预报从 “单源数据驱动” 向 “多源信息深度融合” 的转型，加速了遥感、再分析产品在水文业务中的深度应用； 2. 兼顾了模型精度与可解释性，为人工智能在水文水资源领域的合规化、标准化应用提供了示范； 3. 为物理模型与数据驱动模型的融合发展提供了新思路，通过可解释性分析实现数据驱动模型与水文物理机制的双向印证	1. 可基于该框架构建多模型集合预报系统，进一步提升极端水文事件的预报可靠性； 2. 可结合水文物理机制对模型架构进行约束，构建更具物理意义的混合水文模型； 3. 可将该方法推广至城市内涝预报、山洪预警等场景，拓展其应用边界； 4. 可基于该框架开发开源工具包，推动水文人工智能技术的普惠化应用