中科院南京地湖所 Journal of Hydrology: Regional Studies 发文:基于 XGBoost 和多源遥感构建中国综合干旱指数
DOI:
10.1016/j.ejrh.2026.103623
文献信息:
Huang X., Li X., Song Y., Lv Z., Xu L., Zhang D. A XGBoost-based composite drought index combining multi-source remote sensing data for drought monitoring in China. Journal of Hydrology: Regional Studies, 66 (2026): 103623.
通讯作者:李相虎;主要单位:中国科学院南京地理与湖泊研究所、中国科学院大学、鄱阳湖湿地观测研究站等。
研究背景:
干旱是影响农业生产、水资源管理和生态安全的重要自然灾害。传统干旱监测常依赖 SPI、SPEI、PDSI 等站点或气候指标,也常使用 NDVI、VHI、TVDI 等遥感指标。但单一指标通常只强调某一类过程,例如降水亏缺、土壤水分不足、植被胁迫或地表热状况,难以完整反映干旱的发生、发展和恢复。
中国地形、气候和土地覆盖差异显著,从西北干旱区到南方湿润区,从东北农区到青藏高原,不同区域的干旱形成机制并不相同。因此,构建一个融合多源信息、能够适应不同区域条件的综合干旱指数,对全国尺度干旱监测和分区风险评估具有重要意义。
科学问题:
本文关注的核心问题是:能否利用多源遥感和再分析数据,结合机器学习方法,构建一个月尺度综合干旱指数CDI,既反映气象干旱信号,又能吸收土壤水分、植被状态、蒸散发、热红外、地形和土地覆盖等信息,从而更稳定地监测中国区域干旱?
进一步的问题是:该 CDI 在不同自然子区表现如何?它与 SPI-1、SSI-1 等单一指标相比,能否更连贯地刻画典型干旱事件的空间扩展、峰值和缓解过程?
创新点:
第一,文章将 11 个变量纳入 XGBoost 框架,包括 PCI、TCI、VCI、NDVI、LAI、SIFCI、SMCI、CWSI、TVDI、NDEMZ 和 LC,覆盖大气-土壤-植被-地形-土地覆盖多个干旱相关过程。
第二,研究没有采用简单线性加权,而是利用 XGBoost 捕捉多变量与 SPEI-1 之间的非线性关系,构建月尺度复合干旱指数 CDI。
第三,文章按中国七个自然子区分别建模与评估,使模型能够更好适应区域间气候和地表差异。
第四,研究不仅评价模型拟合效果,还结合 SPI-1、SSI-1、典型干旱事件和游程理论,系统分析 2001-2020 年中国干旱的严重度、强度、持续时间和频率。
方法:
研究首先将中国划分为七个自然子区:中南地区、内蒙古、华北、东北、西北、华南和青藏高原。随后整合多源遥感与再分析数据,计算降水、温度、植被、土壤水分、作物水分胁迫、温度-植被干旱、SIF 条件指数、地形和土地覆盖等变量。
模型构建上,作者以 SPEI-1 作为月尺度干旱训练目标,以 11 个变量为输入,使用 XGBRegressor 分区训练 CDI。每个子区样本按 80% 训练集和 20% 验证集划分,并用 EVS、RMSE、MAE 等指标评价拟合和泛化能力。
干旱等级划分上,研究根据各子区 CDI 和SPEI-1 的分布拟合结果,使用百分位阈值定义 D0、D1 和 D2 等级。干旱事件识别上,若 CDI 连续至少 3 个月低于 D0 阈值,则判定为一次干旱事件,并提取严重度、强度、持续时间和频率。
数据:
目标变量:HSPEI 数据集中的 1 个月尺度 SPEI,时间范围为 2001-2020 年。
预测变量数据源包括:MODIS LST、ERA5-Land ET/PET、CHIRPS 降水、MODIS NDVI、GLASS LAI、GOSIF、GLDAS土壤水分、DEM 和土地覆盖数据。
对比验证指标包括 SPI-1 和 SSI-1;典型干旱事件则参考中国水利部旱灾记录及相关文献资料。
主要结论:
一是 CDI 在中国七个自然子区表现稳定。验证集EVS 为 0.54-0.82,其中内蒙古、东北和华北表现较好;青藏高原最低,主要与复杂地形和地表异质性有关。
二是 CDI 能同时反映气象干旱和土壤水分胁迫。CDI与 SPI-1 的相关系数为 0.36-0.81,与 SSI-1 的相关系数为 0.42-0.70,且均达到显著正相关。北方干旱和半干旱区 CDI 更接近 SPI-1,南方湿润区CDI 更接近 SSI-1。
三是 CDI 对典型干旱事件的时空演变刻画更连贯。在 2007 年南方秋冬连旱和 2017 年东北春夏干旱中,CDI 能捕捉干旱发展、峰值和缓解过程,相比单一指标表现出更好的空间连续性和过渡细节。
四是 2001-2020 年中国干旱具有显著季节和区域差异。全国平均来看,秋季干旱最严重,严重度为 1.67,持续时间最长,为 3.44 个月;春季干旱相对最轻,严重度为 1.17。区域上,内蒙古是主要干旱高风险区,东北干旱持续时间最长。
五是该 CDI 更适合作为月尺度综合筛查和早期预警工具,而不是完全替代农业干旱或水文干旱独立指标。若要扩展到 3 个月或 12 个月尺度,需要重新构建相应时间尺度的目标变量和模型。
主要图表:

图1 中国七个自然子区的地理位置。

图2 XGBoost 模型预测变量之间的 Pearson 相关矩阵,基于 2001-2020 年月尺度栅格样本计算。

图3 月尺度 CDI 构建、验证与应用流程图。

图4 XGBoost 训练集上模拟 CDI 与观测 SPEI-1 的散点密度关系,展示七个子区的模型拟合表现。

图5 XGBoost 验证集上模拟 CDI 与观测 SPEI-1 的散点密度关系,展示模型外推表现。

图6 CDI 与 SPI-1 在不同子区的相关关系,用于检验 CDI 对短期气象干旱的表征能力。

图7 CDI 与 SSI-1 在不同子区的相关关系,用于检验 CDI 对土壤水分相关干旱的表征能力。

图8 2001-2020 年七个子区 CDI、SPI-1 和 SSI-1 月尺度时间序列对比。

图9 2007 年南方秋冬连旱中CDI、SPI-1 和 SSI-1 表征的干旱时空分布。

图10 2017 年东北春夏干旱中 CDI、SPI-1 和 SSI-1 表征的干旱时空分布。

图11 2001-2020 年中国不同季节平均干旱严重度空间分布。

图12 2001-2020 年中国不同季节平均干旱强度空间分布。

图13 2001-2020 年中国不同季节平均干旱持续时间空间分布。

图14 2001-2020 年中国不同季节平均干旱频率空间分布。
一句话总结:
这篇文章的核心贡献,是用 XGBoost 将多源遥感、气象、土壤水分、植被、地形和土地覆盖信息融合为中国月尺度 CDI,让全国干旱监测从单一指标判断走向多过程综合诊断。
干旱区气象生态拥有近2w活跃粉丝,是干旱区资源环境领域最大的自媒体平台,致力于帮助科研人员和团队宣传成果,促进学术交流。由于微信修改了推送规则,请大家将本公众号加为星标,一键三连,可以第一时间收到我们每日的推文!您的鼓励是我们最大的动力😊