
1、基本信息
标题 | ReDF-net: a feature extraction and dynamic fusion framework based on residual networks for runoffforecasting (ReDF-net:基于残差网络的径流预测特征提取与动态融合框架) |
期刊 | Journal of Hydrology(水文学国际顶刊,中科院一区 TOP,水文领域权威期刊) |
时间 | 2026 年 3 月在线发表,卷 673,文章编号 135422 |
一作 | Zhuo Yang(南京大学地球科学与工程学院表生地球化学教育部重点实验室) |
通讯 | 王栋(南京大学,邮箱:wangdong@nju.edu.cn) |
合作作者 | Vijay P. Singh、张阿龙、Chenlu Yu、Xiaoyu Ye、Qingwen Deng、曾献奎、蒋建国、吴吉春 |
单位 | 1. 南京大学地球科学与工程学院;2. 美国德州农工大学;3. 阿联酋大学国家水与能源中心 |
DOI | 10.1016/j.jhydrol.2026.135422 |
关键词 | 双向门控循环单元、图像特征提取、动态特征融合、SHAP 可解释性分析、降雨 - 径流模拟 |
2、研究思维导图

3、研究概述
论文摘要 | 深度学习已成为降雨-径流模拟预测的重要工具,凭借其捕捉复杂非线性关系的能力,在不同流域与气候条件下均取得了优异的预测效果。近年来,卫星遥感与再分析产品的快速发展提供了更丰富的水文气象信息,推动径流预测从单模态输入向多模态融合转变,以更完整地刻画水文过程。但现有方法仍存在诸多局限:栅格特征提取与时序预测往往相互独立开展,缺乏面向预测任务的定向优化;传统卷积架构难以处理高维时空依赖关系,模型训练稳定性差;且针对多模态输入,鲜有统一的机制来量化不同模态的相对贡献。为解决上述问题,本文提出ReDF-Net— 一种基于残差网络的动态融合框架。改进型残差网络(ResNet)模块中的可学习注意力参数,可实现空间特征提取与时序建模的自适应耦合;优化后的残差块在提升复杂多模态特征表达能力的同时,增强了模型训练的稳定性;统一的贡献量化模块可系统评估各类输入的相对重要性,提升模型的物理一致性与可解释性。本文将 ReDF-Net 与长短期记忆网络(LSTM)、门控循环单元(GRU)、双向门控循环单元(BiGRU)三种主流时序预测模型相结合,并在我国两个气候特征迥异的流域开展了验证。结果表明,ReDF-Net 与 BiGRU 耦合的模型表现最优,两个流域的纳什效率系数(NSE)均超过 0.97,显著优于传统数据驱动基准模型(如随机森林)、SWAT 物理水文模型、基础对照模型以及前沿的 iTransformer 模型。基于 SHAP 的可解释性分析进一步验证了该框架的可解释能力。综上,ReDF-Net 可作为一种通用范式应用于多模态径流预测,实现预测精度与可解释性的双重提升。 |
咱们搞水文的都知道,给河流做径流预报,就跟给老天爷 “猜心思” 差不多,既要报得准,还得说清为啥准。以前的法子各有各的毛病:物理水文模型像老水利人靠经验开方,参数一大堆,换个流域就 “水土不服”;纯深度学习模型像黑匣子算命,准是准了,但说不出个所以然,水文业务上不敢随便用;好不容易有了站点观测、遥感卫星这些多源数据,结果各玩各的,栅格数据和时序数据搭不上话,特征提取和预报任务两张皮,训练起来还动不动就 “崩了”。这篇论文直接搞了个叫 ReDF-Net 的 “水文预报智能融合神器”,说白了就是给 LSTM、GRU 这些主流时序预报模型,装了个万能 “性能增强插件”。它用改进的残差网络把遥感土壤湿度栅格数据的关键信息扒得明明白白,再用可学习的注意力机制给不同数据源动态 “打分加权”,让特征提取和预报任务从头到尾绑定优化,彻底解决了 “两张皮” 的问题。最厉害的是,这玩意儿在长江宜昌、黄河兰州两个气候、尺度完全不同的流域,都把预报精度 NSE 干到了 0.97 以上,吊打了传统随机森林、前沿 iTransformer 甚至 SWAT 物理模型,尤其洪水峰值得抓得贼准;更绝的是,它还能通过 SHAP 分析,把每个数据源对预报结果的贡献算得清清楚楚,彻底打破了 “黑匣子” 魔咒,既准又有理,还能随便往主流时序模型上套,给咱们多模态水文预报领域,趟出了一条“高精度 + 高可解释性” 双在线的新路子。 |
4、研究背景及意义
核心研究背景 | 对应研究意义 |
1. 径流预报是流域防洪减灾、水库优化调度、水资源精细化管理的核心技术支撑,极端水文事件频发背景下,对预报的精度、可靠性、时效性提出了更高要求 | 1. 为径流预报提供了全新的技术框架,显著提升了预报精度,尤其强化了对洪水峰值的捕捉能力,可为流域防洪安全、水资源管理业务提供关键技术支撑 |
2. 卫星遥感、再分析产品的快速发展,为水文模拟提供了更丰富的多源水文气象信息,径流预报从传统单模态站点输入,向多模态数据融合转型成为行业必然趋势 | 2. 突破了传统单模态数据的信息局限,实现了站点时序数据与遥感栅格数据的端到端深度融合,为多源水文信息的高效挖掘与利用提供了通用范式 |
3. 现有物理水文模型存在参数多、区域适配性差、校准难度大的问题;传统数据驱动模型存在严重的 “黑匣子” 特性,可解释性不足,难以满足水文业务对物理一致性的核心要求 | 3. 兼顾了数据驱动模型的高精度优势与水文过程的物理可解释性,解决了传统深度学习模型 “唯精度论”、物理意义缺失的行业痛点,提升了数据驱动模型的业务可信度 |
4. 现有多模态融合方法存在三大核心瓶颈:栅格特征提取与时序预测相互脱节、传统卷积架构训练不稳定、多模态特征贡献无法系统量化,严重制约了多源数据的应用效果 | 4. 针对性破解了现有多模态融合方法的核心缺陷,构建了 “特征提取 - 动态融合 - 可解释性分析” 一体化的框架,推动多模态水文预报从 “简单数据拼接” 向 “智能深度融合” 升级 |
5、研究创新点
过往研究核心空白与局限 | 论文对应核心创新点 |
1. 栅格特征提取与时序序列建模相互独立,用于特征提取的 CNN 未针对径流预报任务做定向优化,提取的特征与预报目标相关性弱、冗余度高,严重干扰后续时序建模 | 1. 提出 ReDF-Net 通用框架,在残差块中引入可学习的注意力参数,将栅格特征提取与时序预测进行端到端紧耦合,实现了面向径流预报任务的定向特征学习,从根源上解决了特征与预报目标脱节的问题 |
2. 传统卷积架构(如 AlexNet)难以捕捉水文数据的高维时空依赖关系,处理复杂水文数据时易出现梯度消失 / 爆炸问题,模型训练稳定性差,对长序列输入的适配性弱 | 2. 重新设计了残差块结构,基于改进的 ResNet18 构建特征提取模块,通过残差跳接有效缓解了梯度消失问题,大幅提升了高维时空特征的捕捉能力与模型训练稳定性,对长序列输入的适配性显著增强 |
3. 现有研究多聚焦于提升预报精度,对模型可解释性关注严重不足;多模态输入场景下,缺乏统一的机制量化不同数据源的相对贡献,模型的物理合理性与可迁移性严重受限 | 3. 构建了统一的多模态特征贡献量化模块,结合 SHAP 可解释性分析方法,实现了跨模态特征的全局贡献评估,不仅量化了不同输入因子的预报作用,还揭示了不同流域的水文响应机制,大幅提升了模型的物理一致性与可解释性 |
4. 现有多模态融合模型多为定制化架构,与主流时序预测模型兼容性差,通用性、可拓展性弱,难以在业务中快速落地 | 4. ReDF-Net 为插件式通用框架,可无缝耦合 LSTM、GRU、BiGRU 等主流时序预测模型,无需对原有模型架构做大规模定制化修改,通用性与可拓展性极强,具备快速业务化落地的条件 |
6、研究区概况和数据
研究区概况
研究 站点 | 所属流域 | 核心气候特征 | 控制 集水面积 | 关键水文特征 |
宜昌站 | 长江中游(葛洲坝大坝下游) | 亚热带湿润季风气候,降水主要集中在 5-9 月 | 3974 km² | 以丘陵河谷地形为主,汛期径流响应快;受上游大型水利工程调控显著,土壤水与河道调蓄能力强,基流稳定 |
兰州站 | 黄河上游(刘家峡水库下游) | 半干旱大陆性气候,年降水量更低、季节性更强 | 35201 km² | 以山地地形为主;受上游水库长距离调蓄影响,基流稳定,枯水期最小流量较高,径流过程受干旱区能水耦合机制主导 |
数据来源
数据 类型 | 数据 内容 | 时空尺度 | 数据来源 | 作用 |
站点实测时序数据 | 日尺度降水、潜在蒸散发(PET,Penman 公式计算)、上游站点历史径流、目标站点日径流 | 日尺度;宜昌站 2012-2020 年,兰州站 2010-2018 年 | 中国国家气象信息中心《中国地面气候资料日值数据集 (V3.0)》 | 模型核心表格型(tabular)输入,目标输出为目标站点的日径流数据 |
遥感再分析栅格数据 | 表层土壤湿度 | 日尺度;原生空间分辨率 0.1°(约 10km),未做重采样 / 插值处理 | 哥白尼气候数据存储中心 ERA5-Land 再分析数据集 | 模型核心栅格型(raster)输入,用于空间特征提取,表征流域下垫面干湿状态 |
地理空间辅助数据 | 30m 分辨率中国年度土地覆盖数据、世界和谐土壤数据库 (HWSD) 土壤属性信息 | 30m 空间分辨率 | 土地覆盖数据:Yang and Huang (2021);土壤数据:HWSD | 仅用于 SWAT 物理水文模型的构建与校准,未纳入数据驱动模型的输入 |
7、研究方法
方法模块 | 核心原理 | 主要实施步骤 |
改进ResNet18 栅格特征提取模块 | 针对水文栅格数据的时序特性改造 ResNet18 架构,通过残差跳接缓解梯度消失问题,实现面向径流预报任务的空间特征自适应提取 | 1. 调整首层卷积核数量,从默认 3 改为 30,适配多通道时序栅格输入; 2. 经 7×7 大核卷积、批归一化、ReLU 激活、最大池化完成初步特征提取与下采样; 3. 依次通过 4 组残差块完成深层多尺度特征提取; 4. 经全局平均池化与全连接层,输出固定维度的栅格特征向量 |
基于注意力机制的动态特征融合模块 | 引入全局可学习的注意力参数,通过 softmax 归一化生成动态权重,实现栅格特征与表格时序数据的自适应融合,完成端到端联合优化 | 1. 将提取的栅格特征与站点表格数据按时间维度对齐; 2. 引入全局可学习注意力参数,经 softmax 归一化生成特征权重; 3. 对栅格特征进行加权聚合,沿时间维度扩展后与表格数据拼接,形成模型联合输入;4. 通过反向传播,实现特征提取、注意力权重、时序预测模块的端到端联合优化 |
时序模型耦合与超参数优化 | 将 ReDF 框架与 LSTM、GRU、BiGRU 三种主流时序模型耦合,通过网格搜索完成超参数优化,验证框架的通用性 | 1. 分别构建 ReDF-LSTM、ReDF-GRU、ReDF-BiGRU 三种耦合模型; 2. 采用网格搜索优化核心超参数:输入序列长度(10-60 天)、批次大小(4-32)、隐藏层单元数(8-64); 3. 固定学习率 0.001,采用 Adam 优化器,最大迭代 200 轮,加入早停机制防止过拟合; 4. 数据集按 6:2:2 划分为训练集、验证集、测试集 |
模型性能综合评估体系 | 选取 4 项互补的评价指标,通过消融实验、横向对比实验,全面验证模型性能 | 1. 采用 NSE(纳什效率系数)、RMSE(均方根误差)、MAE(平均绝对误差)、MAPE(平均绝对百分比误差)4 项核心指标;2. 开展消融实验,对比有无 ReDF 框架的基础模型性能差异;3. 与随机森林 (RF)、iTransformer、SWAT 物理模型开展横向对比;4. 分析不同输入序列长度下模型的性能稳定性 |
基于 SHAP 的模型可解释性分析 | 采用 SHAP(沙普利加和解释)方法,量化多模态特征的全局贡献,分析特征交互作用,验证模型行为与水文物理机制的一致性 | 1. 以性能最优的 ReDF-BiGRU 为代表,计算各输入特征的 SHAP 值; 2. 基于平均绝对 SHAP 值,完成特征全局重要性排序; 3. 分析 SHAP 值分布规律,揭示单特征对径流预报的影响机制; 4. 开展特征交互作用分析,挖掘多因子间的协同效应,验证模型的物理合理性 |
8、主要结论
模型性能核 | 1. ReDF 框架可稳定提升 LSTM、GRU、BiGRU 三种主流时序模型的径流预报性能,宜昌站 NSE 平均提升约 0.03,兰州站平均提升约 0.02,误差指标同步显著下降; 2. ReDF-BiGRU 模型取得最优预报效果,在宜昌、兰州两个流域的 NSE 均超过 0.97,显著优于随机森林、iTransformer 等数据驱动基准模型,以及 SWAT 物理水文模型; 3. ReDF 框架大幅降低了模型对输入序列长度的敏感性,在 10-60 天输入长度范围内均保持稳定高性能,长序列输入场景下优势尤为突出;4. ReDF 框架显著提升了模型对洪水峰值的捕捉能力,对汛期径流突变的响应更灵敏,更适配流域防洪预报的业务需求 |
方法通用性与创新性 | 1. ReDF-Net 为插件式通用框架,无需对原有基础时序模型做大规模定制化修改,即可实现性能的稳定提升,具备极强的通用性与可拓展性; 2. 改进的残差块结构有效缓解了梯度消失问题,大幅提升了高维水文时空数据的特征提取能力与模型训练稳定性; 3. 端到端的紧耦合架构,实现了栅格特征提取与径流预报任务的定向优化,从根源上解决了传统方法 “特征提取与预报目标脱节” 的核心问题 |
可解释性与水文机制 | 1. 两个流域中,上游径流均为最核心的预报影响因子,表层土壤湿度为第二大重要因子,其贡献超过降水与潜在蒸散发,验证了土壤湿度对径流生成的关键调控作用; 2. 模型学习到的特征规律与经典水文机制高度一致:土壤湿度接近饱和时,对径流的正向贡献显著增强,降水与土壤湿度存在显著的协同效应; 3. 揭示了湿润区与半干旱区差异化的水文响应机制:宜昌站(湿润区)径流主要受降水与流域干湿状态调控,PET 影响微弱;兰州站(半干旱区)径流对土壤湿度的敏感性更高,PET 呈现复杂的非线性影响,反映了干旱区独特的能水耦合机制 |
应用价值 | 1. ReDF-Net 为多源遥感数据与站点观测数据的融合应用提供了全新范式,可有效挖掘多源水文信息的预报价值; 2. 框架在不同气候、不同尺度、不同调控程度的流域均表现出优异的性能与鲁棒性,具备广泛的业务化应用潜力; 3. 高精度与高可解释性兼备的特性,解决了数据驱动模型在水文业务应用中 “可信度不足” 的核心痛点,可为防洪减灾、水库优化调度、水资源精细化管理提供关键技术支撑 |
9、主要图表

















10、借鉴意义
应用维度 | 核心借鉴价值 | 落地与拓展建议 |
学术研究层面 | 1. 为多模态水文预报领域提供了 “特征提取 - 动态融合 - 可解释性分析” 三位一体的全新研究范式,突破了传统多模态融合的核心瓶颈; 2. 首次实现了残差网络与循环神经网络的端到端紧耦合,为水文时空数据融合建模提供了新的技术思路; 3. 建立了多模态水文模型可解释性分析的标准化流程,推动数据驱动水文模型从 “黑箱” 向 “灰箱”“白箱” 发展; 4. 揭示了受水库调控流域,湿润区与半干旱区差异化的水文响应机制,为变化环境下的流域水文过程研究提供了新视角 | 1. 可将该框架拓展至土壤湿度、地下水埋深、水质预测等其他水文要素模拟场景; 2. 可融合植被覆盖、积雪、蒸散发等更多遥感数据源,进一步丰富模型输入维度; 3. 可将框架与Transformer、Mamba 等新兴时序模型耦合,验证其通用性;4. 可基于该框架开展无资料 / 缺资料流域的径流预报迁移学习研究 |
工程应用层面 | 1. 插件式的框架设计可快速适配现有水文业务预报系统,无需重构原有模型架构,即可实现预报精度的显著提升; 2. 模型对洪水峰值的优异捕捉能力,可为流域防洪减灾、水库汛期调度提供高精度技术支撑; 3. 高可解释性的特性满足了水文业务对模型物理合理性、可信度的要求,大幅降低了数据驱动模型的业务化应用门槛; 4. 模型在不同气候区、不同尺度流域均表现出强鲁棒性,具备大范围推广应用的潜力 | 1. 可结合流域现有水文监测站网,构建本地化的 ReDF-Net 径流预报模型,嵌入业务化预报系统; 2. 可拓展至 3 天、7 天、15 天等多预见期的径流预报,满足水库调度、水资源管理的不同业务需求; 3. 可结合数值天气预报产品,实现滚动式的实时径流预报; 4. 可基于模型的特征贡献分析,优化流域水文监测站网布局,提升关键要素的监测能力 |
行业发展层面 | 1. 推动了水文预报从 “单源数据驱动” 向 “多源信息深度融合” 的转型,加速了遥感、再分析产品在水文业务中的深度应用; 2. 兼顾了模型精度与可解释性,为人工智能在水文水资源领域的合规化、标准化应用提供了示范; 3. 为物理模型与数据驱动模型的融合发展提供了新思路,通过可解释性分析实现数据驱动模型与水文物理机制的双向印证 | 1. 可基于该框架构建多模型集合预报系统,进一步提升极端水文事件的预报可靠性; 2. 可结合水文物理机制对模型架构进行约束,构建更具物理意义的混合水文模型; 3. 可将该方法推广至城市内涝预报、山洪预警等场景,拓展其应用边界; 4. 可基于该框架开发开源工具包,推动水文人工智能技术的普惠化应用 |
【水文科学前沿·顶刊赏析】往期回顾:
【顶刊赏析18】Nature Commun. | 北科-王赛鸽-全球供水系统运维中的水-能-碳-协同效益
【顶刊赏析17】npj Natural Hazards | UIUC-Ashish Sharma-面向实时决策的GPU加速城市洪水预报
【顶刊赏析16】Nature Sustain | 北师大-赵文武-全球贸易如何影响“水-能-粮”纽带关系?
【顶刊赏析15】Nature Commun | 北师大-孟凡鑫-屋顶光伏的“能-水-碳-地”纽带关系未来如何变化?
【顶刊赏析14】Nature Cities | 中国水科院-邵薇薇-城郊植被如何影响城市降水?
【顶刊赏析13】Nature | 北师大-缪驰远-降水观测网络的缺口制约气候变化影响评估
【顶刊赏析12】Nature Water | NASA-Kashif Shaad-全球淡水生态系统制图指导生态修复
【顶刊赏析11】Nature EE | 北大-张尧-绿化与干旱背景下植物更依赖历史降水吗?
【顶刊赏析10】Nature Commun. | 宾州州立-申朝鹏-融合物理嵌入学习的微分水文模型δHBV
【顶刊赏析09】Innovation | 发展中国家水资源压力日益加剧
【顶刊赏析08】NC | 全球雨水收集挖潜助力安全饮用水获取
【顶刊赏析07】PNAS| 我国人类用水减缓及其关键驱动因素
【顶刊赏析06】Nature Geoscience| 日益增长的社会经济不平等正威胁全球水安全
【顶刊赏析05】Nature Cities| 基于306个中国城市的城市洪涝级联经济影响压力测试
【顶刊赏析04】Nature Sustainability | 气候变化下环境与农业水资源可用性的协同效应研究
【顶刊赏析03】Nature | 全球湿度指数与侧向水文流动
【顶刊赏析02】Nature | 奥地利小时强降雨量的增加反映了洪水变化
【顶刊赏析01】Nature Cities | 基于遥感技术的绿色屋顶健康植被研究
【水文科学前沿·文萃札记】往期回顾:
【文萃札记38】WRR | 中山大学团队-基于图深度学习的我国日尺度山洪易发性模拟
【文萃札记37】JHydrol | 河海大学团队-河网实时多场景水动力模拟
【文萃札记36】WRR | 米兰理工-Andrea Castelletti-人工智能在干旱科学中的发展综述
【文萃札记35】HESS | 中国水科院-高希超-城市洪涝时空动态实时预报
【文萃札记34】J.Hydrol | 河海-徐斌-物理过程与深度学习耦合的概率洪水预报方法
【文萃札记33】WRR | 阿姆斯特丹自由大学-Veerle Bril-NBS解决方案与洪水风险降低措施的效能评估
【文萃札记32】WRR | 北林-张守红-基于前景理论与双层优化的农业水资源配置研究
【文萃札记31】KBS | 高丽大学-田昌炫-基于优化驱动机器学习模型的小时径流预报
【文萃札记30】HESS | 川大-王根绪-基于多机器学习集成水文参数区域化方法的无资料山区流域洪水预报
【文萃札记29】JHydrol | 武大-熊立华-基于可解释神经网络的非平稳洪水频率分析
【文萃札记28】WRR | 北师大-缪驰远-大尺度洪水分布分析算法
【文萃札记27】HESS | 瑞士WSL研究所-Eduardo-径流极值及旱涝转换模拟
【文萃札记26】JH | 华工-王兆礼-基于Transformer-CNN的城市洪水快速预测
【文萃札记25】WRR | 融合物理信息的可微水文模型用于极端事件模拟与预测
【文萃札记24】SCS | 基于社会-水-能源-环境关联的城市群可持续发展评估
【文萃札记23】WRR | 从谱分析视角理解多尺度水文相互作用:以美国大样本研究为例
【文萃札记22】STOTEN | “四水四定” 原则下基于层次分析法和系统动力学建模的河南省水资源承载力预测
【文萃札记21】WRR | 洪水时空演化快速预测的增强型U-Net 模型
【文萃札记20】Sustainable Development | 聚焦水安全生态系统服务的社会-生态系统可持续性分析概念框架
【文萃札记19】HESS | 澳大利亚大陆尺度径流预测优化:LSTM 作为陆面模型后处理器及独立水文模型
【文萃札记18】Ecological Indicators | 基于“四水四定”-系统动力学与改进 TOPSIS 模型的我国河西内陆河流域水资源承载力研究
【文萃札记17】水科学进展 | 灌区多水源系统碳排放核算及水-能-碳关联分析
【文萃札记16】WRR | 从全球到局部流域的径流预测中深度学习知识迁移
【文萃札记15】EMS | NSE与KGE评价指标在水文模型验证中长期被误用?
【文萃札记14】GRL | 大语言模型在水文模型参数率定中的应用:可行性与局限性
【文萃札记13】WRR | 融合物理参数化与注意力机制的循环神经网络在水文模拟中应用
【文萃札记12】WRR | 基于多水文模型与机器学习方法的径流预测改进研究
【文萃札记11】WARM/UNU Report | 全球水资源破产 (Global Water Bankruptcy)
【文萃札记10】Earth's Future | 基于数据增强的迁移学习提升数据稀缺区域水文极端事件预测能力
【文萃札记09】中国科学:地球科学 | 小流域综合治理研究进展与发展趋势
【文萃札记08】JHydrol | 知识引导的LSTM水库出流模型及其在库区径流模拟中的应用
【文萃札记07】中国科学基金 | 变化环境下洪水预报面临的挑战与应对
【文萃札记06】WRR | 深度学习与物理模型耦合解译青藏高原南部非线性水文过程
欢迎大家扫码关注“水文科学前沿” 微信公众号,我们将为您持续提供水文科学领域科研相关的优质、实用的会议、招生、论文、资讯等信息。如需投稿,欢迎给公众号留言。
