
严清赟1, 郭紫璇1, 潘元进1, 贾燕2, 金双根1,3
1.南京信息工程大学遥感与测绘工程学院,江苏 南京 210044
2.南京邮电大学地理与生物信息学院,江苏 南京 210023
3.河南理工大学测绘与国土信息工程学院,河南 焦作 454003
摘要:
关键词
基金项目
作者简介
严清赟(1992—),男,博士,副教授,研究方向为GNSS-R遥感。 E-mail:003257@nuist.edu.cn
通信作者: 金双根 E-mail:sgjin@hpu.edu.cn
本文引用格式
阅读全文
http://xb.chinasmp.com/article/2026/1001-1595/1001-1595-2026-02-0315.shtml
全球导航卫星系统反射测量(global navigation satellite system-reflectometry,GNSS-R)技术是一种利用导航卫星(如GPS、北斗、Galileo等)反射信号进行地表遥感探测的新兴技术[1]。它通过接收并处理导航卫星系统直射与地表反射信号,提取相关环境参数,属于L波段微波遥感范畴。该系统主要由信号源、接收平台、接收机硬件及数据处理算法等部分构成[2]。与传统遥感手段相比,GNSS-R凭借其全球覆盖、高时空分辨率、低成本等优势[3-5],已被广泛应用于海面风场[6-7]、有效波高[8]、海冰[9-10]、海啸监测[11]等领域。
在海洋应用取得显著成果的基础上,GNSS-R技术逐步向陆表领域拓展,文献[12]基于GNSS-R技术,结合旋风全球导航卫星系统(cyclone global navigation satellite system,CYGNSS)反射信号与土壤水分主动被动遥感卫星(soil moisture active passive,SMAP)、土壤水分与海洋盐度卫星(soil moisture and ocean salinity,SMOS)辐射计数据,提出了地表水体覆盖率反演方法,并在2022年巴基斯坦洪水中得到验证,研究发现该方法的反演精度为64.44%,平均误差为17.78%。文献[13]利用GPS与北斗信噪比观测实现雪深反演,结果与新奥松尔松气象站实测高度一致,精度可达5 cm,验证了方法的可靠性。文献[14]提出基于CYGNSS数据、无须辅助数据输入的直接反演方法,通过构建神经网络模型反演植被光学厚度(vegetation optical depth,VOD),并采用双模型交叉验证提升可靠性。在2018年与2020年测试中,反演结果与SMAP高度一致(皮尔逊相关系数均为0.98,均方根误差分别为0.079与0.084),表明CYGNSS可作为热带地区独立反演VOD的有效数据源。文献[15]基于GNSS-R技术,结合CYGNSS反射信号与地形因子提出洪水淹没范围检测方法,并在印度和印度尼西亚案例中验证,结果与哨兵-1号合成孔径雷达卫星洪水范围高度一致。这些研究表明,基于CYGNSS卫星反射信号并结合多源数据,可有效反演相关陆表参数,结果在时空尺度上均表现出较好的一致性与稳定性。
相比于海洋应用领域,陆表环境在不同空间区域存在较强烈的复杂性与不均匀性[16]。土壤类型、植被覆盖度、地形起伏、粗糙度变化等因素均会在不同尺度上共同影响信号的传播与散射,从而使GNSS-R在陆表参数反演时面临更复杂的挑战[17]。为提高反演精度,多数研究采用分区建模解决以上问题。文献[18]通过土地类型分区建模,实现地表特征精准提取并降低外部数据依赖,结果显示CYGNSS数据可独立且高精度反演土壤湿度(soil moisture,SM)。考虑气候与地形对SM影响显著,文献[19]以气候带分区,结合CYGNSS反射率(surface reflectivity,SR)与气候数据的装袋回归树模型(bagged regression trees,BRT)实现SM反演,满足近实时监测,并在多气候区保持稳定泛化能力。分区建模同样在土壤重金属污染[20]、水文过程模拟[21]、植被动态研究[22]等领域得到应用。
在空间异质性显著的系统中,合理分区可以提升模型性能,由此也为在陆表参数反演中处理异质性提供了思路。基于土地覆盖类型与气候带的分区方法,可以有效反映不同区域的宏观异质性,为大范围反演模型的构建奠定基础。然而,宏观气候-地表分区法存在一定局限性:一方面难以有效解耦GNSS-R观测中多地表参数的复杂耦合效应;另一方面,假设分区内部均质性忽略了复杂地形或多样地表覆盖带来的局部差异。而GNSS-R SR受SM、植被衰减等因素的影响,但是这些因素在空间上通常呈明显的非平稳性特征。若将其视为均一过程,则可能削弱SR与地表变量之间的真实动态联系,并引入系统性误差。
据此,本文提出一种驱动因子量化的分区方法,通过地理探测器定量识别主导驱动因子,构建因子分区框架,实现了从“经验性分类”到“机制性量化”的分区模式转变。该方法不仅显著提升了GNSS-R SR的区域建模精度,更重要的是为多源遥感数据协同、地表参数反演及陆面过程模型中的空间异质性表征提供了可量化、可迁移的分区解决方案,对推动GNSS-R技术从观测走向机理理解与业务化应用具有实质性意义。
CYGNSS为美国国家航空航天局(National Aeronautics and Space Administration,NASA)主导的地球科学任务,已于2016年12月15日成功发射。该任务由8颗小卫星组成星座,轨道高度约520 km、轨道倾角35°,可对热带地区(南北纬38°之间)进行高频次观测,平均重访时间约7 h[23]。研究采用2020—2024年的L1级数据,在预处理中,依据信噪比(<2 dB)、接收机天线增益(<0 dB)及入射角(>65°)对原始观测数据进行质量控制,以剔除低质量数据[24]。在此基础上,通过时间平均与空间网格化插值,生成与SMAP SM产品空间一致的9 km等面积可扩展地球网格(equal-area scalable earth grid,EASE-Grid)静态SR分布。具体而言,采用线性插值法将原始CYGNSS SR数据重采样至规则网格。图1(a)为2020—2024年9 km分辨率CYGNSS SR平均分布。

图1 空间数据分布
Fig. 1 Spatial data distribution
研究选用PN(pixel number)值表征时延多普勒图(delay-Doppler map,DDM)的延展度,该值定义为归一化DDM中功率大于0.2的像素总数。阈值设定参考了GNSS-R在陆表遥感应用中的相关研究[25-26],已被广泛应用于土壤湿度及地表水体探测。作为关键的中间观测量,PN值对地表粗糙度高度敏感:光滑地表通常引发强镜面反射,导致DDM能量集中,PN值较低;而粗糙地表则主导漫散射,导致DDM能量弥散,PN值较高。因此,PN值有效地将地表物理属性的变化映射至GNSS-R的信号响应中[9]。图1为空间数据分布。
SMAP由美国航天局于2015年1月31日发射,是首个以SM为核心目标的卫星任务,能够在全球尺度产出多分辨率的日尺度SM产品,重访周期为2~3 d[27]。本文使用的是对应CYGNSS数据集时间段的9 km EASE-Grid内的SM数据集,其中包含了SM、质量标识、植被含水量(vegetation water content,VWC)、VOD及地表粗糙度等数据,其中SM、VWC及地表粗糙度数据用于后续分区研究。
MCD12Q1(MODIS土地覆盖类型)产品具有500 m空间分辨率与年度时序特性,可提供全球范围的土地覆盖分布。该产品基于Terra/Aqua卫星的MODIS SR数据进行监督分类,并结合多源辅助信息后处理以提升特定类别的判别精度[28]。产品包含13个科学数据集,涵盖8种土地覆盖分类体系,本文采用国际地图生物圈计划(international geosphere-biosphere programme,IGBP)分类体系[29],共划分17种土地覆盖类型。本文使用2022年土地覆盖类型数据,并将其空间分辨率统一重采样至9 km。图1(b)为研究区的土地覆盖类型。
美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)发布的全球地形数据集(global land one-kilometer base elevation,GLOBE,Version 1),空间分辨率为30″(约0.008 333°),水平坐标采用WGS-84,垂直单位为m,地表高程变化范围为-407~8752 m,数据可免费获取(
归一化植被指数(normalized difference vegetation index,NDVI)和叶面积指数(leaf area index,LAI)数据均来自Google Earth Engine(GEE)。NDVI采用MODIS的MOD13A2产品(1 km、16 d、WGS-84),LAI采用MOD15A2H产品(500 m、8 d、WGS-84)。
生物量数据来自欧洲航天局气候变化倡议发布的Biomass数据集(
本文使用的全球树高数据来源于全球土地分析与发现实验室(Global Land Analysis and Discovery,GLAD),可从其官网获取(
双基地雷达散射模型描述了GNSS信号在地表反射后被地面、低轨平台接收的过程,其核心思路是:通过观测反射波幅度与极化随入射条件的变化,反演与介电性质、地表几何粗糙以及植被覆盖相关的参数[30]。接收功率计算公式如下

(1)
式中,Pt表示卫星发射功率;Gt和Gr分别表示发射和接收天线增益;Rst和Rrs表示星-地与地-接收机路径长度;λ表示GNSS信号波长(如GPS L1波段为19.042 cm);Γlr为地表反射率。
地表反射率Γlr受菲涅尔反射系数Rlr、地表粗糙度因子Λ(θ)及植被衰减因子γ共同控制,表达式为

(2)
式中,θ为入射角。
菲涅尔反射系数Rlr与入射角θ及地表介电常数εr有关,可进一步表示为

(3)
式中,Rvv和Rhh分别为垂直和水平极化条件下的反射系数。
基于式(1)—式(3),GNSS-R信号的物理响应机制可概括为:土壤的介电常数对其含水量变化极为敏感[31],地形因素塑造散射的相干性[30],植被覆盖调控信号的透过与衰减[32]。由于这些因子在空间上高度不均且作用强度各异,SR由此表现出显著的空间分异。因此有必要建立定量评估框架,系统量化各因子对该空间分异的解释力。
地理探测器模型通过对中国山西省和顺县神经管畸形发病风险的分析,验证了模型在识别地理要素与现象关联性、探测空间分异性驱动因子等方面的有效性,为后续模型的推广和应用奠定了基础[33]。地理探测器包括因子探测、交互作用探测等4个模块,本文采用因子探测模型系统量化各驱动因子对SR空间分异的贡献。该模型用q值衡量自变量X对因变量Y的解释力,范围为[0,1],q越大,解释力越强,q=1与q=0分别对应完全控制与无关[34]。q的计算公式为

(4)

(5)

(6)
式中,h=1,2,…,L为变量Y或因子X的分层,即分类或分区;Nh和N分别为层h和全区的单元数;
根据式(2)的耦合关系,本文以SR为因变量,构建了涵盖SM、植被与地形3类要素的自变量体系。地理探测器要求自变量为类型量,本文将SM、植被参数(NDVI、LAI、生物量、树干高度、VWC、VOD)及地形参数(坡度、坡向、粗糙度、DEM)等连续变量进行地理分区离散化,并与土地覆盖类型这一天然类别数据整合,实现了多体系变量的统一空间分析。模型中的因子探测据此可直接量化各环境因子对SR空间分异的q值,从而在多元参数中识别出主导SR空间格局的关键环境要素。驱动因子的选取见表1。
表1地理探测器模型驱动因子选取
Tab. 1
本文基于2020—2024年的逐日平均数据,通过时间序列重采样与聚合,将日尺度数据转换为月均值并计算5 a整体年均值,实现日-月-年尺度的连续转换,为后续分析提供基础。月尺度数据经Z-score标准化(均值为0、标准差为1),以消除量纲差异并提升变量间可比性,用于后续回归分析;年均值数据则用于地理探测器试验,识别关键影响因子。
在识别出SR空间分异的主导因子后,本文据此构建分区框架,并在各分区内开展回归建模以深化机理理解。在以SR为因变量的线性模型中,为与式(2)中的物理机制保持一致,选取影响菲涅尔反射系数的SM、表征植被透射与衰减的VWC,以及反映地表粗糙度效应的PN作为核心回归变量进行分步纳入,从而量化在主导因子控制的相对均质环境下,其余参数对SR的独立响应与边际贡献。该方法有效剥离宏观空间背景干扰,通过一元至三元回归模型系统评估不同驱动因子的独立效应及综合作用。
一元线性回归用于探讨单个因子与SR之间的线性关系,模型形式为

(7)
式中,Y为SR;X1为SM;β0为截距项;β1为回归系数;ε为随机误差。二元线性回归模型形式为

(8)
式中,X1、X2分别为SM和VWC;β1、β2分别为X1、X2对应的回归系数。
三元线性回归进一步引入PN值,构建三元回归模型

(9)
式中,X1、X2、X3分别为SM、VWC和PN值;β1、β2、β3分别为X1、X2、X3对应的回归系数。
模型性能以决定系数R2为主要评价指标,通过比较一元至三元回归模型的R2及系数变化,可识别各因子在单独作用与协同作用下对SR的解释力差异,为多因子驱动机制的分析提供依据

(10)
式中,yi为实测SR;

研究的回归分析侧重解释而非预测精度,通过考察回归系数及R2的空间变化,揭示SM、植被结构与地形起伏在不同空间单元中对SR的差异化作用;同时通过对比分区回归结果,检验空间异质性对模型拟合的影响,从而论证分区建模策略的合理性。
基于时间聚合所得的年平均数据开展地理探测器试验及相关分析,为保持与IGBP方案一致的17类分类体系,连续型变量采用分位数法离散化[35]为17种分区类型。
单因子探测结果见表2。粗糙度、地形高程和土地覆盖类型对SR空间分异的解释力(q值)最高,分别为0.203 3、0.18和0.146 3,其影响强度整体高于植被类与土壤类因子。
表2各驱动因子对反射率空间分异的解释力(q值)
Tab. 2
| q | |
|---|---|
3.2 分区与特征组合回归分析对比
为构建各分区时空一致的输入数据集,将2020—2024年(60个月)的回归变量数据统一至EASE-Grid 9 km网格,并与分区数据进行空间匹配。针对每个分区及月份,提取同时具备有效SR、SM、VWC和PN值的公共像元,确保输入数据的严格空间对齐与一致性。
图1(c)展示了基于SMAP卫星地表粗糙度数据集的分区结果。一元回归(图2)结果表明:SR与SM在17个区域均呈显著正相关(P<0.001),回归系数从区域1约0.64逐步下降至区域17约0.05,R2亦由约0.44递减至接近0,说明SM对SR的线性敏感性随地表粗糙度增大而减弱。

图2 土壤湿度一元回归
Fig. 2 Univariate regression of SM
在引入VWC后,拟合平面沿SM方向的倾角仍明显大于沿VWC方向;VWC回归系数为稳定的小幅正值[0.02,0.08],对模型有次级增益,但增益主要体现在低、中粗糙度区域,高粗糙度下提升有限(图3),SM仍为主导因子。

图3 湿度+植被含水量二元回归
Fig. 3 Bivariate regression of SM+VWC

图4 湿度+植被含水量+PN值三元回归
Fig. 4 Multiple regression of SM+VWC+PN
模型拟合优度(表3)随粗糙度升高显著下降(R2从区域1的0.490降至区域17的0.039),各区均通过显著性检验(F检验,P<0.01)。
表3三元回归模型的拟合与统计检验结果
Tab. 3
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P | |||
| P |
粗糙度分区回归结果与地理探测器所揭示的粗糙度主导性相一致。各类回归模型的R2均随粗糙度升高而单调下降,表明高粗糙度增强了散射效应,从而削弱SR对陆面变量的可解释性。而三元回归中PN的影响在粗糙度较高的区域呈现增强趋势,反映出表面结构在粗糙度上升时的相对贡献提高。这些规律说明粗糙度通过调节SR对其他因子的响应强度,塑造了不同粗糙度区间之间的显著差异,并在回归结果中得到系统体现。
其余分区(如数字高程模型、土地覆盖类型等)的统计规律与上述粗糙度分区一致:SM为主效应,VWC回归系数在不同分区均较小且方向不稳定(正负均有,绝对值多小于0.1),PN值为负向校正;各分区R2处于相近区间并呈起伏。为避免冗余,下文仅给出文字概述与结果对比(表4),不再逐一配图。
表4不同分区、不同输入参数下加权R2对比
Tab. 4
3.2.2 地形高程分区回归结果
一元回归显示:SM回归系数随分区号整体递减但存在起伏,取值范围由区域1的0.488降低至区域17的0.093;模型拟合度R2位于[0.011,0.312]之间(低DEM区较高,如区域7约0.312;高DEM区最低,如区域17约0.011),随着DEM升高,线性解释能力呈现总体下降趋势但存在局部起伏。
引入VWC的二元回归表明:SM依旧为主导因子,回归系数由区域1的0.48降低至0.08,明显高于VWC的回归系数[0.02,0.09];R2与一元模型同量级,取值范围为[0.012,0.318],增益主要体现在低、中DEM分区。
进一步的三元回归给出更稳定的系数结构:SM系数保持正向并整体递减回归系数取值范围为(0.09,0.48),VWC为持续的小幅正值(0,0.07],而PN系数为负(-0.35,-0.10);各区模型均通过F检验(P<0.01),R2在低DEM区达到约0.39(区域7),在高DEM区降至0.034(区域17)。综上,DEM分区的统计规律与粗糙度分区一致:SM为首要控制因子,VWC提供稳定但次要的增益,PN值为负向校正。
总体上,不管输入几个特征参数,除永久积雪冰川区域外,SR与SM均呈显著正相关,敏感性与拟合优度在不同地表类型间差异明显。一元回归结果显示开阔、低冠层类型最优,其中郁闭灌丛、开放灌丛、农田、草地、稀树草原的回归系数在[0.50,0.67]之间波动,R2为[0.28,0.52];农田、自然植被镶嵌、永久性湿地、城市和建筑用地、荒漠、水体居中,回归系数为[0.21,0.45],R2为[0.10,0.33];森林最低,常绿针叶林、常绿阔叶林、混交林的回归系数在[0.11,0.31]区间波动,R2取值范围为[0.01,0.12]。
引入VWC的二元回归表明:SM仍为主导因子,其回归系数普遍大于VWC;VWC回归系数在不同类型间方向不稳定(正负均有)且幅度较小[-0.05,0.08]。
三元回归进一步纳入PN后,PN系数基本为负(-0.45,0),在多数类型上体现为对SR的负向校正,且在闭合灌丛、农田、草地等类型中的R2提升尤为显著(分别为0.519、0.445、0.417)。
在叠加分区方案中,为评估不同分类等级数量对结果的影响,本文采用分位数法将地表粗糙度、年平均SM与VWC数据依次划分为3、4、5个等级,相应构建了9、16和25种分区类型。基于不同分区尺度开展的回归分析结果显示,各尺度下模型的回归特征总体保持一致,未出现结构性差异;然而,随着分区精细度的提高,R2呈现逐步上升的趋势。综合比较表明,25类分区的解释力最优,因此后续分析主要基于该分区方案展开。为便于全面对比,表5同时列出了9类和16类分区下的关键结果,以供参考。
表5叠加分区下的模型拟合优度(R2)对比
Tab. 5
“粗糙度+土壤湿度”叠加分区结果如图5(a)所示。一元线性回归中SM的回归系数在0.13~0.68间变化:低粗糙度/SM适中区域(如区域2—4、区域7—9)斜率在[0.63,0.68]间波动,R2取值范围为[0.42,0.48];而高粗糙度区域,无论SM干湿状况如何(区域21—25),回归系数(0.13,0.21]与R2[0.019,0.06)显著降低。

图5 分区分布
Fig. 5 Zones distribution
在引入VWC的二元模型中,SM仍为主导项,系数变化范围在[0.12,0.7]之间,VWC回归系数整体为小幅正值[-0.01,0.11],对模型贡献稳定但次要;R2与一元模型量级接近,增益主要出现在低、中粗糙度与中等湿度分区。
三元模型进一步纳入PN后,系数结构保持一致:SM为正且随分区整体递减,VWC为零附近的小幅正值,PN值为负,范围为(-0.40,-0.10);各区均通过F检验(P<0.01),R2范围为[0.07,0.55](如区域8最高、区域22最低)。
“粗糙度+植被”叠加分区结果如图5(b)所示。“粗糙度+植被”与“粗糙度+土壤湿度”叠加分区的回归结果在整体规律上基本一致。这一现象主要源于研究区SM与VWC在宏观生态水文格局上存在的空间协同性(即高SM区域通常对应高VWC),导致二者与粗糙度叠加形成的空间分区框架高度相似。然而,二者在物理机制上的差异决定了其模型性能的细微区别:SM主要通过调节地表介电常数影响反射,而VWC主要通过植被层的衰减与体散射调制信号。VWC与粗糙度之间的交互效应更弱,使其在“粗糙度+植被”分区中能提供独立性更强、信息互补性更高的局地修正信息,从而获得了相对更优的整体拟合性能。
多尺度分区结果(表5)表明,随着分区精细化,模型R2呈稳健上升趋势。
不同分区、不同输入参数下加权拟合优度(加权R2)结果见表4。在所有分区策略中,引入3个特征参数(SM、VWC、PN)的模型拟合度均显著高于单一或双因子模型。“粗糙度+植被”分区组合在三元回归中取得了最高的加权R2(0.326 8)。
地理探测器表明,粗糙度、地形高程与土地覆盖是SR空间分异的主导因子(表2)。这与文献[30]提出的散射物理一致:粗糙度通过调制相干/非相干散射比例直接影响信号强度;地形高程通过水热条件、植被格局与入射几何间接作用;土地覆盖综合表征介电特性与结构差异,从而塑造空间格局。
分区回归(表4)显示,仅依据地理探测器所揭示的单因子解释力的分区方案,其建模性能并未与之完全对应,说明全域解释力高并不必然对应最优分区。这主要有两方面原因:一是子域内部条件相对同质,使得因变量对该因子的敏感性下降;二是分区内样本量不均衡可能影响回归稳健性,样本量较少的子域容易受到随机波动干扰。由此可见,分区回归的拟合效果既取决于因子的全域相关性,也受子域条件和主导机制一致性的制约。
粗糙度分区呈现明显的物理规律:回归系数随粗糙度单调变化,从低粗糙度区以SM为主导逐渐过渡到高粗糙度区以地形散射为主导(PN系数超过SM)。这一规律表明,粗糙度是控制相干-非相干散射转换的一级因子,因此各分区内部机制高度一致,而不同分区间则存在明显差异。
与粗糙度相比,DEM分区中SM回归系数随高程波动较大,VWC与PN的贡献也更难区分。这反映出地形所塑造的SR空间梯度具有更强的复杂性,高程不仅影响径流汇集和水分分布,还通过局部坡向、坡度等地形因子调节散射,导致低海拔区SR驱动机制以水文主导为主,而高海拔区则呈现多元复杂控制的格局,解释力因此下降。
土地覆盖分区显示,地表类型对SR的控制模式影响显著。在开阔低矮植被区(如灌丛、农田),SM是SR的主要驱动因子,模型解释力较高,说明地表水分直接影响SR变化,规律清晰且易于捕捉。森林区则不同,树冠结构复杂且覆盖层厚,信号散射过程中同时受到叶片、枝干及其引起的信号衰减与多径效应的综合调节,SM的直接作用被削弱,模型解释力下降,SR变化呈现多因子共同作用的模式。因此,地表类型通过自身结构与组分(如植被高度、冠层密度等)调节水分与信号散射过程,从而决定了SM与SR之间关系的强弱和规律性。
基于表4,复合分区“粗糙度+植被”和“粗糙度+土壤湿度”的整体回归效果优于单因子分区,其中“粗糙度+植被”表现最佳。这种叠加分区体现了物理过程的互补性:粗糙度控制地表散射模式(相干/非相干),而VWC反映覆盖层对信号的衰减,两者结合能够同时捕捉SR变化的核心过程——散射与衰减。相比之下,“粗糙度+土壤湿度”的提升有限,主要由于湿度与粗糙度存在耦合关系(湿土通常更平滑),削弱了分区间的差异性。
在复合分区下,三元回归系数呈现“每5个分区为一组”的周期性波动,这与粗糙度为背景的分区设计一致,使组间差异主要反映粗糙度效应:SM回归系数在组内先升后降,但整体为正,表明水分对SR具有正向响应并存在阈值效应;VWC回归系数规律性不强,反映其在多因子作用下受覆盖层结构和厚度限制而影响复杂;PN回归系数绝对值随粗糙度先增后减的非单调趋势,揭示了地表散射机制从相干散射到非相干散射增强,最终进入多重散射饱和状态的全过程。由此可见,复合分区不仅提高了回归拟合效果,也反映了地表散射-衰减机制在空间上的互补与耦合。
在三元回归中,土地覆盖分区的加权R2为0.316 5,表面上优于地形高程分区的0.303 1,但这并非分区原理更优,而是由样本量极不均衡所致。与分位数分区各部分样本量近似均衡不同,土地覆盖类型的样本量差异巨大:如草地样本量达11 972 972且拟合较好(R2=0.417),其超大权重显著抬高整体加权R2;相反,永久性积雪和冰川区域仅4227条,且拟合极差(R2=0.000 51),对总体几乎无影响。因此,在评估分区策略的效能时,不应仅依赖整体加权指标,还需综合考虑各子区域的具体表现及其样本量分布,以避免整体评估结果被样本量过大的区域所主导或掩盖。
无论分区方式如何,模型在高海拔、地形复杂区(如科迪勒拉山系、青藏高原)拟合较差,而在低海拔、平坦区(如北非、刚果盆地)拟合较好。这主要因为高粗糙度区域以非相干散射为主,地形起伏和粗糙度增加了信号散射的复杂性与非线性,使参数响应关系难以被线性模型捕捉。系数层面也反映了这一点:在高粗糙度或高海拔分区,SM回归系数显著减小甚至不显著,同时残差增大,说明湿度信号容易被地形和散射复杂性掩盖。对于此类区域,应考虑非线性或分层模型,并结合物理先验以更好刻画SR变化规律。
在所有三元回归模型中,PN值的引入均显著提高了拟合优度(表4)。其回归系数普遍为负,印证了PN作为地表散射损耗指示量的物理意义,即能够有效表征由粗糙度引起的信号衰减,补足仅依靠SM与VWC建模的信息缺失。进一步分析表明,PN值的解释能力受到先验粗糙度背景的明显调控。随着粗糙度等级升高,PN回归系数绝对值整体呈现先增后减趋势,且过程存在一定波动。这反映出在粗糙地表条件下,PN作为衰减表征参数的灵敏度随散射机制转变而增强;然而,高粗糙度区域通常兼具更复杂的地形与植被结构,进一步削弱了PN在模型中的独立贡献及其估计稳定性。
本文系统揭示了GNSS-R SR空间分异的多元驱动机制,并构建了基于驱动因子解释力量化的新型分区模式。地理探测器结果表明,地表粗糙度、地形高程和土地覆盖是主导CYGNSS SR分异的关键因子,这一结论与散射物理一致:粗糙度调控相干与非相干散射的转换,而地形与土地覆盖共同决定SR的宏观格局。在此基础上开展的多因子回归显示,“粗糙度+植被”分区具有最优表现。然而,在高海拔与地形复杂区域,各分区模型普遍出现拟合下降,说明基于均质假设的线性回归方法难以刻画此类地区由极端地形起伏主导的强非线性散射过程。与此同时,土地覆盖分区较高的加权R2主要受大样本地类的主导影响,提示单纯依赖整体指标可能造成偏差,必须结合子区样本结构与参数稳定性进行判断。值得注意的是,无论采用何种分区方式,引入PN值均能显著提升模型性能。
总之,本文证实了“以驱动因子量化为核心的地表多特征融合分区”策略对于提升GNSS-R陆表参数反演精度的有效性,为超越宏观气候-地表分区法提供了方法学支撑。然而,必须指出的是,本文研究仍面临挑战:①驱动因子的表征维度有待拓展,本文选取的地形、植被、土壤等驱动因子虽具代表性,但未能涵盖全部影响散射过程的关键参数;②模型泛化能力需进一步验证,本文模型在低海拔平坦区表现优异,但在高海拔地形复杂区精度下降,表明模型对强异质性下垫面的适用性受限。
因此未来研究将在不同空间尺度验证和优化分区方案,同时系统性地开展不确定性量化分析,厘清各驱动因子输入误差、模型结构误差及空间异质性本身对最终SM等参数反演结果不确定性的贡献,为业务化产品的误差界定提供科学依据。

往期推荐
资讯
