Climatology and Hydrology

Applicability of reanalysis data in runoff simulation of Manas River

  • Bo LIU , 1, 2 ,
  • Fulong CHEN , 1, 2 ,
  • Hao TANG 1, 2 ,
  • Long JIANG 3 ,
  • Tongxia WANG 1, 2
Expand
  • 1. College of Water Conservancy & Architectural Engineering, Shihezi University, Shihezi 832000, Xinjiang, China
  • 2. Key Laboratory of Cold and Arid Regions Eco-Hydraulic Engineering of Xinjiang Production & Construction Corps, Shihezi 832000, Xinjiang, China
  • 3. Shihezi Hydrology Bureau, Shihezi 832000, Xinjiang, China

Received date: 2023-11-21

  Revised date: 2024-02-04

  Online published: 2026-03-11

Abstract

Meteorological data is a crucial factor in the study of hydrological processes. However, due to the complex terrain, meteorological stations in the upper reaches of the basin are scarce, limiting the study of hydrological processes in the basin due to the lack of measured data. This paper takes the Manas River Basin, Xinjiang, China as the research area and selects ERA5-Land, CMFD, and CFSR reanalysis data for analysis. The SWAT model, based on physical processes, and the AdaBoost model, based on data-driven approaches, are constructed to verify the applicability of different datasets in runoff simulation for two types of hydrological models. The Nash efficiency coefficient (NSE) and the determination coefficient (R2) are selected for quantitative analysis. The results show that: (1) The performance of the datasets in the AdaBoost model is better than that in the SWAT model. During the verification period, the NSE and R² of the ERA5-Land dataset increased by 4% and 2%; the NSE and R² of the CFSR dataset increased by 14% and 15%; the NSE and R2 of the CMFD dataset changed by -10% and 8%. The NSE and R2 of the meteorological station data increased by 8% and 10%. For datasets lacking data, the AdaBoost model is more applicable due to fewer restrictions on input data. (2) In the AdaBoost model, the simulation accuracy of all datasets decreased to a certain extent during the validation period, with CMFD showing the most significant decrease and ERA5-Land the least. These results indicate that the generalization ability of the AdaBoost model is weak. (3) Using ERA5-Land, CFSR, CMFD, and meteorological station data as inputs for the AdaBoost model, the simulation results show that ERA5-Land achieved good results during the verification period. The simulation accuracy of CFSR is comparable to that of meteorological stations, while CMFD performed the worst due to its inaccurate description of meteorological data in the mountainous area of the Manas River Basin. The reanalysis dataset ERA5-Land can provide a reference for runoff simulation in arid areas with insufficient measured meteorological data in northwest China.

Cite this article

Bo LIU , Fulong CHEN , Hao TANG , Long JIANG , Tongxia WANG . Applicability of reanalysis data in runoff simulation of Manas River[J]. Arid Land Geography, 2024 , 47(8) : 1348 -1357 . DOI: 10.12118/j.issn.1000-6060.2023.658

在当前水文研究领域中,径流模拟是一项重要研究方向,在探求流域径流变化过程中,利用水文模型来深入研究分析河流的径流趋势,最终实现水资源保护、水灾预警和防治等。在水文科学研究过程中,水文模型是一种重要的径流模拟研究途径,不过其对气象数据的依赖度较高。因为无法提供足够的气象资料,开展径流模拟的难度较大,在资料不足的地区就难以深入开展径流模拟研究,国际水文科学协会(IAHS)也十分重视无资料地区水文过程研究,是当前水文研究领域的一项重大课题[1]。遥感技术的不断发展,实现了利用卫星产品对资料稀疏地区进行观测和获取数据[2]。如今TRMM[3-4]以及GPM[5]遥感卫星降水数据在流域水文研究使用得较为广泛[6]。一些研究人员为了让数据精准度再上一个层次,在气候模式和卫星遥感数据源基础上开发出了再分析数据。
与传统实测数据对比来看,大气再分析数据对通常的地面、高空以及卫星资料进行了同化,具有不受地形地貌条件限制、覆盖面广以及时间序列长等优势的同时也能够满足高分辨率要求[7]。当前水文模拟研究过程中,将实测气象数据替换为再分析数据作为气象输入已经是一种常见方式[8-9]。Hou等[10]评估了ERA5数据集对中国北方沙漠(DNC)气候变化条件,为ERA5在DNC上的使用提供了参考。谭秋阳等[11]使用CMFD数据集在楚江河流域构建了SRM模型,结果表明其在高寒地区的融雪径流模拟中具有一定的参考价值。黄艳伟等[12]使用CFSR数据集驱动SWAT模型研究其在辉河流域水文模拟中的可行性,结果表明CFSR在径流模拟方面表现较好。因此可见,由于不同的再分析数据集使用的同化算法有区别以及可利用的资料也有所差异,所以各再分析数据集的空间分辨率和数据准确性方面表现都不一样,但在不同类型区域使用的可行性还需进一步探究。由于技术不断更迭,在Al以及机器学习为基础建立的水文模型功能在不断完善,不再局限于单一模型的使用,已经能够支持集成学习模型的使用[13]。AdaBoost算法[14],一个在Boosting框架中实现的经典算法,通过连续训练一系列弱学习器来增强模型的准确性。在每一步中,基于前一个学习器的错误分类情况,调整样本权重:错误分类的样本权重增加,而正确分类的样本权重减少。这样调整后的样本集用于训练下一个学习器,不断优化整体的预测能力[15]。由于考虑了所有弱学习器结果,对表现较差的弱学习器误差进行了削弱,提升了模型预测结果的精准度。
基于此,构建基于过程驱动的SWAT模型与数据驱动的AdaBoost模型,探究再分析数据在2种类型水文模型径流模拟中的适用性,有助于更为深入了解玛纳斯河流域的水文特征,评估其在中国西北干旱区内陆河径流模拟中的适用性。

1 数据与方法

1.1 研究区概况

玛纳斯河流域(图1)位于我国西北地区,属于干旱区,流域总面积2.67×106 hm2,天山北麓在玛纳斯河流域南侧,准噶尔盆地位于其北侧,区域纬度范围为43°~46°N,经度范围为84.6°~86.6°E。玛纳斯河长度达到3.24×103 m,年平均径流量12.9×108 m3。玛纳斯河干流出山口控制站为肯斯瓦特水文站,海拔约900 m,站点监测面积4.64×105 hm2
图1 流域概况图

Fig. 1 Overview map of the watershed

1.2 数据来源

1.2.1 实测数据

使用的气象数据均由国家青藏高原科学数据中心发布的中国国家级地面气象站基本气象要素日值数据集V3.0获取;实测流量数据来自石河子水文勘测局。

1.2.2 再分析数据

(1) ERA5-Land数据
ERA5(ECMWF reanalysis v5)是欧洲中期天气预报中心最新发布的第五代全球气候再分析数据集,其在海量历史观测资料基础上,融合了更加智能的模式,采用了资料同化系统,能够实现对资料匮乏地区采集更多有效数据[16-17]。ERA5-Land数据集能够包含地面以上2 m到地下2.89 m范围内的能量以及水量的循环数据,包括气温、相对湿度、降水、太阳辐射、风速等,分辨率能够达到0.1°×0.1°。
(2) CFSR数据
CFSR(Climate forecastsystem reanalysis)是一套全球性的再分析数据集,由美国环境预报中心(NCEP)在2009年发布。该数据集由T382L64大气模式生成,该模式不仅整合了常规的观测资料和卫星遥感数据,还融合了CO2的观测变化、气溶胶以及太阳辐射的变化等因素。这种综合考虑多种环境变量的方法使得CFSR数据在气候模拟和预测中具有较高的准确性和可靠性[18]。CFSR数据包含1979年1月一直到2009年年底的数据,CFSv2数据后在2011年被发布,从2010年1月之后的所有气象数据都包含在内[19]。因为两者使用同样的模式,因此两者属于是同一数据集。
(3) CMFD数据
CMFD[20](China meteorological forcing dataset)结合了中国气象局气象数据服务中心约700个气象站的日常观测数据和美国国家海洋与大气管理局(NOAA)国家环境信息中心(NCEI)提供的数据。此外,该数据集还整合了遥感信息与多源网格数据,形成一个全面的气象数据资源。这种高效的数据融合提供了广泛的应用前景,尤其适用于气候分析和模拟研究。其中有我国1979—2018年所有包含2 m气温、10 m风速、向下长波辐射、地表压力和比湿度、降水率、向下短波辐射在内的近地表气象要素数据。

1.3 研究方法

1.3.1 SWAT模型原理

SWAT模型是在物理过程基础上建立的,其类型属于分布式水文模型。SWAT模型对流域进行了细化,得到一系列子流域,而后按照土地利用类型、土壤类型以及坡度对子流域进行细化得到水文响应单元(Hydrologic response unit,HRU)。SWAT模型使用HRU作为其基础计算单位。在该模型中,各HRU独立模拟水流、泥沙与营养物的量。这些数据随后经由汇流过程整合,以估算整个流域在出口处的水流、泥沙及营养物含量[21]。具体的模型结构可参见图2
图2 SWAT模型结构图

Fig. 2 Structure diagram of SWAT model

1.3.2 AdaBoost模型构建

建立AdaBoost模型主要有2个模块,分别是特征变量的处理和选择合适的弱学习器。通过主成分分析法处理特征变量,解决输入数据存在时间序列长,纬度高以及数据要素过多的问题。在模型弱学习器选择上,决策树具有抗噪声干扰性强和训练数据需求量小的优点,较为适合AdaBoost模型。
模型输入数据中通常是高维度且存在线性相关的变量,使用主成分分析(PCA)可对高维数据降维处理并保留原本数据中的特征信息。特征变量经过PCA处理能提高模型训练的速度,减少训练时长[22]。PCA步骤如下:
(1) 假设时间序列长度为n,也就是有n个样本,各个样本存在m个变量,最终得到原始数据矩阵X
X = x 11 x 12 . . . x 1 m x 21 x 22 . . . x 2 m . . . . . . . . . . . . x n 1 x n 2 . . . x n m
(2) 对原始数据矩阵X标准化处理:
Y = ( y i j ) n × m y i j = x i j - x - j S j
式中: y i j为标准化后的数据; x i j为原始数据; x - j为变量的样本均值; S j为变量的标准差。
x - j = 1 n i n x i j
S j = 1 n - 1 i = 1 n x i j - x - j 2
(3) 计算相关系数矩阵R
R = ( r i j ) m × m r i j = k = 1 n x k j - x - i x k j - x - j k = 1 n x k j - x - i 2 x k j - x - j 2
式中: r i j为变量i和变量j之间的相关系数; x k j为样本k的第i个变量的值; x - i为变量i的样本均值。
(4) 对矩阵R的特征值 λ以及特征向量 α进行计算,从大到小对R特征值排列 λ 1 λ 2 λ m α 1 , α 2 , , α m表示各自的特征向量。
(5) 计算第k个主成分方差贡献率 β k累计方差贡献率 β k
β k = λ k i = 1 m λ i
β ( k ) = i = 1 k λ i i = 1 m λ i
公式(6)通过累计方差来设定主成分的数量k,并使用前k个特征向量来计算主成分。然后,把标准化后的数据矩阵Y与包含这些特征向量的矩阵进行相乘,以此获得经过主成分分析(PCA)处理的数据。
选择决策树模型为AdaBoost模型中的弱学习器,决策树模型是分类与回归的基础方法之一,根据问题的不同包括回归树以及分类树2种[23]。具体步骤如下:
(1) 输入训练样本集:
D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x N , y N ) }
式中: x NN维向量,即每个样本有N个特征变量; y N为样本N对应的目标变量值。
(2) 确定最优切变量s和最优切分点j。定义x的第j个特征变量为 x j,根据切分点将 x j划分为 R 1 R 22个区域:
R 1 ( j , s ) = { x | x j s }
R 2 ( j , s ) = { x | x j > s }
遍历变量js,求解公式(11)取得最小值时对应的js
m i n j , s m i n c 1 x i R 1 ( y i - c 1 ) 2 + m i n c 2 x i R 2 ( y i - c 2 ) 2
式中: c 1 c 2 R 1 R 2对应y的均值。
(3) 对划分的2个子区域重复步骤(1)、(2)直至满足条件。
(4) 最终将输入样本训练划分为M个区域即M个叶节点,生成决策树:
f ( x ) = m = 1 M c m I ( x R m )
式中: c mm区域对应y的均值;I为常数项。

1.3.3 精度评价指标

在对模型模拟效果进行评价时,采用决定系数(R2)以及纳什效率系数(NSE),决定系数表示模拟值与实测值的相关程度,纳什效率系数表示模拟值的拟合程度。在对实测站点和不同数据集偏差开展不确定性分析时,使用到相对误差、平均绝对误差评价(表1)。
表1 评价指标计算方法

Tab. 1 Evaluation index calculation method

评价指标 公式计算 最优值 注释
纳什效率系数(NSE) N S E = 1 - i = 1 n ( Q i - Q ' i ) 2 i = 1 n ( Q i - Q - ) 2 1 Q i为径流观测值; Q -为径流观测值均值; Q ' i为径流模拟值; Q ' ¯为径流模拟值均值; P ' i为偏差分析中径流模拟值; P i为偏差分析中径流观测值



决定系数(R2 R 2 = i = 1 n ( Q i - Q - ) ( Q ' i - Q ' ¯ ) 2 i = 1 n ( Q i - Q - ) 2 i = 1 n ( Q ' i - Q ' ¯ ) 2 1
相对误差(BIAS) B I A S = i = 1 n ( P ' i - P i ) i = 1 n P i × 100 % 0
平均绝对误差(MAE) M A E = 1 n i = 1 n P i - P ' i 0

2 结果与分析

2.1 SWAT模型模拟

SWAT模型以4种数据类型作为气象数据输入,以1979年和1980年为预热期,训练期为1981—1999年,验证期为2000—2012年。各项评价指标结果(表2)可以看出,实测径流相关性最高的是以ERA5-Land数据集输入的模拟结果,在训练期和验证期,纳什效率系数(NSE)为0.84和0.83,决定系数(R2)是0.86和0.85。而后是在气象站数据基础上开展的模拟,在训练期和验证期,NSE分别为0.77和0.74,R2分别为0.78和0.74。CMFD数据集训练期在所有数据类型中表现最差,NSE和R2仅为0.52和0.77,在验证期NSE反倒得到了提升,可能是存在的异常值对模拟结果产生了影响。CFSR数据集整体表现略差于CMFD,训练期R2和NSE为0.79和0.76,验证期R2和NSE为0.64和0.61,分别下将了13%和15%,在4种数据类型中验证期相较于训练期下将最多。
表2 SWAT模拟结果评价表

Tab. 2 Evaluation table of SWAT simulation results

数据类型 训练期 验证期
R2 NSE R2 NSE
ERA5-Land 0.86 0.84 0.85 0.83
CMFD 0.77 0.52 0.75 0.67
CFSR 0.79 0.76 0.64 0.61
气象站点 0.78 0.77 0.74 0.74

2.2 AdaBoost模型模拟

训练期选为1981—1999年,验证期选为2000—2012年,AdaBoost模型的气象输入是4种数据,从下表3可以看到模拟结果的各项评价指标。在训练期,AdaBoost模型在各类型数据集驱动下,R2以及NSE都超过0.90,与训练期模拟精度相比,验证期的AdaBoost模型模拟结果精度降低,数据集中验证期间下滑程度最大的是CMFD,NSE只有0.57,R2只有0.83。使用AdaBoost进行模拟过程中,模拟精度所受再分析数据集高分辨率影响程度不高,但是模拟结果受到数据准确程度的影响比较大。因为在产流区CFSR和CMFD数据集准确性不高,并且噪声信号和异常值对AdaBoost模型存在较大影响,使得验证期间基于气象站数据的AdaBoost模拟结果比CMFD和CFSR数据集模拟结果要更好。
表3 AdaBoost模拟结果评价表

Tab. 3 Evaluation table of AdaBoost simulation results

数据类型 训练期 验证期
R2 NSE R2 NSE
ERA5-Land 0.95 0.94 0.87 0.87
CMFD 0.95 0.93 0.83 0.57
CFSR 0.93 0.93 0.79 0.75
气象站点 0.93 0.92 0.84 0.82

2.2.1 基于ERA5-Land数据模拟

以ERA5-Land数据集为气象数据输入AdaBoost模型中,径流模拟趋势如图3所示。验证期相较于SWAT模型,AdaBoost模型模拟径流与实测径流相关性更高,在极值的模拟表现更好。且模型对于流域枯水期的模拟精度较高,由于多种情况的影响,汛期模拟精度则会有所下降。ERA5-Land在所有数据集模拟结果中表现最优,验证期相较于训练期下降最小,训练期R2和NSE为0.95和0.94,验证期R2和NSE分别下降了8.42%和7.44%。
图3 基于ERA5-Land数据集AdaBoost模型径流模拟结果

Fig. 3 Runoff simulation results of AdaBoost model based on ERA5-Land dataset

2.2.2 基于CMFD数据模拟

图4可知,CMFD可以较好地模拟枯水期径流变化趋势,但在所有输入数据类型中CMFD验证期模拟结果最差,是由于在汛期的模拟值比实测值偏高。同时,相比于另外3种数据,CMFD在验证期模拟精度下降最多,训练期R2和NSE为0.95和0.93,验证期R2和NSE下降了12.63%和38.70%。这可能是由于实测径流存在异常值(如1999年流量)而CMFD数据集无法准确表达异常值的存在,因此AdaBoost模型对汛期极值的模拟准确性偏低,影响了对流域整体径流模拟的精度。
图4 基于CMFD数据集AdaBoost模型径流模拟结果

Fig. 4 Runoff simulation results of AdaBoost model based on CMFD dataset

2.2.3 基于CFSR数据模拟

图5可知,与SWAT模型中相比,CFSR数据在AdaBoost模型拥有更好的表现,NSE和R2在验证期分别增大了22.95%和23.43%,不过在峰值部分还是有偏差影响。与CMFD数据比较而言,CFSR模拟结果更好,但与气象站数据模拟结果相比就较差,与ERA5-Land模拟结果比较而言,NSE和R2分别差了12%和8%。与训练期相比,CFSR在验证期的拟合效果更差,NSE和R2分别降低了19.35%和15.05%。尤其是在部分丰水年CFSR的模拟结果无法到达实测流量的峰值,导致其模拟精度降低。
图5 基于CFSR数据集AdaBoost模型径流模拟结果

Fig. 5 Runoff simulation results of AdaBoost model based on CFSR dataset

2.2.4 基于气象站数据模拟

图6可知,与SWAT模型相比,模型输入为气象站数据的AdaBoost模型模拟结果的表现更好,验证期AdaBoost模型的NSE和R2各自提高了10.81%和13.51%,主要原因是AdaBoost的模拟效果在汛期极值部分的表现更好。不过AdaBoost模拟值与实测值的差值在2002年汛期还是较大,这表明在部分年份,特征变量对目标变量的可预测性以及相关性会出现一定程度下降,只用流域中下游的气象站数据来对AdaBoost模型模拟进行驱动会出现一定误差。
图6 基于气象站数据AdaBoost模型径流模拟结果

Fig. 6 Runoff simulation results of AdaBoost model based on weather station data

2.3 偏差分析

为了分析再分析数据集在不同流量区间的模拟偏差,本研究将径流数据按流量大小排序,并将20%以下的流量定义为极低值流量(Q20),80%以上的流量定义为极高值流量(Q80),介于两者之间的部分称为常规流量(Q20-80)。根据表4的数据,CFSR数据集在极低值流量序列中表现出最大的偏差和平均绝对误差(BIAS=0.18,MAE=1.83),而其他数据集在这一区间的偏差相对较小。在所有测试序列中,ERA5-Land数据集的表现最为出色,其偏差均处于可接受范围,适合作为模型输入。对于CMFD数据集,由于其降水量数据普遍低于实测值,导致在极高值和常规流量区间的模拟偏差较大,这也影响了其在AdaBoost模型中的模拟效果。
表4 AdaBoost模拟结果偏差表

Tab. 4 AdaBoost simulation result deviation table

数据类型 Q20 Q20-80 Q80
MAE BIAS MAE BIAS MAE BIAS
ERA5-Land 1.56 0.05 3.62 -0.01 33.99 -0.06
CFSR 1.83 0.18 6.15 0.05 40.98 -0.29
CMFD 1.63 0.03 5.58 0.13 56.20 0.26
气象站 0.92 0.03 3.42 -0.12 39.55 -0.18

3 讨论

应用3种再分析数据集驱动模型在玛纳斯河流域径流模拟情况良好,与气象站实测数据进行对比模拟精度达到要求。证明在构建水文模型过程中,再分析数据具有适用性,特别是在稀缺资料地区缺乏气象数据的情况下,再分析数据可以解决构建水文模型难度较大的问题。但再分析数据集也存在一些问题,其中CMFD数据集由于对玛纳斯河流域山区气象数据描述不够准确,AdaBoost模型易受到异常值影响,在极值的模拟上表现不好导致其模拟结果不理想。非极值序列就是历年出现的来水与退水过程,和实际情况相比,CFSR在非极值序列的拟合要高,这是因为和其他数据集相比,CFSR春季降水要更强,流量上升速度更快。CFSR数据集对于极低值序列的模拟时偏大,而在极高值序列上又偏小,偏差总体无规律性。ERA5-Land整体表现最好,无论是在模拟精度上还是模拟结果偏差上都可满足输入要求。
在模型表现上,由于玛纳斯河流域缺乏详细的水文地质参数,SWAT等模型利用数学途径将复杂水文过程开展简化处理,最终实现对水文过程的描述。这类基于物理过程的水文模型,对于数据精度以及种类都具有很高的要求,并且调参过程难度也较大,甚至因为模拟机制的差异,一部分模型无法对客观水文过程进行精准全面的描述,使其无法产生较强的适用性。唐豪等[24]、谷新晨等[25]使用SWAT模型选择不同数据集通过调整参数来降低下垫面变化对模拟的影响,提高了模拟精度。基于数据驱动水文模型对于输入数据的要求相比较而言并不高,其更多是在数据层面对降水、蒸发、气温等数据关系进行深层次挖掘。对比了基于数据驱动的AdaBoost模型与基于物理成因驱动的SWAT模型,发现AdaBoost模型在资料稀缺的玛纳斯河径流模拟表现更好,可能是由于地下水等数据无法准确获得导致SWAT模型无法达到最好的模拟效果。而AdaBoost模型会受到不同训练期的影响,后续研究过程中,通过交叉验证能够对训练数据过拟合产生一定抑制,强化模型泛化能力,实现模型预测精准度的进一步提升。
玛纳斯河流域径流补给主要来源既有高山冰川和永久积雪的补给,又有中低山季节性积雪和夏季雨水的补给,径流量的35.3%来自高山冰雪融水[26]。AdaBoost模型没考虑此方面对模拟的影响,这也造成夏季汛期峰值模拟出现偏差,肖森元等[27]则认为出现低估峰值流量可能是基于空间插值的地面日值格点数据集弱化了大雨和中雨日的降水强度。如何进一步提高再分析数据集驱动AdaBoost模型在汛期拟合能力,使其更适用于西北干旱区流域将是接下来的研究方向。

4 结论

(1) 数据集在AdaBoost模型中的表现要好于SWAT模型,验证期ERA5-Land数据集NSE和R2提高了4%和2%;CFSR数据集NSE和R2提高了14%和15%;CMFD数据集NSE和R2提高了-10%和8%;气象站数据NSE和R2提高了8%和10%。对于缺乏资料地区AdaBoost模型由于对输入数据的限制更少其适用性更强。
(2) 以ERA5-Land、CFSR、CMFD和气象站点4种数据类型作为AdaBoost模型气象数据输入,根据模拟结果可知验证期ERA5-Land取得了较好的模拟效果,CFSR与气象站模拟精度相差不大,而CMFD由于其对玛纳斯河流域山区气象数据描述不够准确模拟结果最差。模拟结果定量地证明了玛纳斯河流域再分析数据集ERA5-Land可作为水文模拟输入数据。
(3) 在AdaBoost模型中,所有数据集模拟结果在验证期模拟精度均有一定程度的下降,其中CMFD下降最为显著,ERA5-Land下降最少,结果表明AdaBoost模型的泛化能力较弱。
[1]
夏军, 左其亭. 国际水文科学研究的新进展[J]. 地球科学进展, 2006, 21(3): 256-261.

DOI

[Xia Jun, Zuo Qiting. Advances in international hydrological science research[J]. Advances in Earth Science, 2006, 21(3): 256-261.]

[2]
金倩芳. 无资料地区短期水文预报方法研究与应用[D]. 武汉: 华中科技大学, 2020.

[Jin Qianfang. Research and application on the short-term hydrological forecasting methods in the ungauged basins[D]. Wuhan: Huazhong University of Science & Technology, 2020.]

[3]
Santra M S, Santra A, Kumar A. Catchment specific evaluation of Aphrodite’s and TRMM derived gridded precipitation data products for predicting runoff in a semi gauged watershed of tropical India[J]. Geocarto International, 2021, 36(11): 1292-1308.

[4]
Himanshu S K, Pandey A, Patil A. Hydrologic evaluation of the TMPA-3B42V7 precipitation data set over an agricultural watershed using the SWAT model[J]. Journal of Hydrologic Engineering, 2018, 23(4): doi: 10.1061/(ASCE)HE.1943-5584.0001629.

[5]
Zhang Y, Hanati G, Danierhan S, et al. Application and assessment of a downscaled GPM dataset in the simulation of snowmelt runoff in alpine mountainous areas[J]. Journal of Hydrology: Regional Studies, 2022, 41: 101107, doi: 10.1016/j.ejrh.2022.101107.

[6]
Behrangi A, Khakbaz B, Jaw T C, et al. Hydrologic evaluation of satellite precipitation products over a mid-size basin[J]. Journal of Hydrology, 2011, 397(3-4): 225-237.

[7]
蒋慧敏, 刘春云, 贾健, 等. 新疆夏季对流性降水时空分布特征及成因分析[J]. 高原气象, 2019, 38(2): 340-348.

DOI

[Jiang Huimin, Liu Chunyun, Jia jian, et al. The temporal and spatial characteristics of convective precipitation in Xinjiang among the summer and causes analysis[J]. Plateau Meteorology, 2019, 38(2): 340-348.]

DOI

[8]
牛怡莹, 李春兰, 王军, 等. 内蒙古ERA5再分析降水数据性能评估与极端降水时空特征分析[J]. 干旱区地理, 2023, 46(9): 1418-1431.

[Niu Yiying, Li Chunlan, Wang Jun, et al. Performance evaluation of ERA5 reanalysis precipitation data and spatiotemporal characteristics of extreme precipitation in Inner Mongolia[J]. Arid Land Geography, 2023, 46(9): 1418-1431.]

[9]
成硕, 李艳忠, 星寅聪, 等. 遥感降水产品对黄河源区水文干旱特征的模拟性能分析[J]. 干旱区地理, 2023, 46(7): 1063-1072.

[Cheng Shuo, Li Yanzhong, Xing Yincong, et al. Simulation performance of remote sensing precipitation products on hydrological drought characteristics in the source region of the Yellow River[J]. Arid Land Geography, 2023, 46(7): 1063-1072.]

[10]
Hou C Z, Huang D Q, Xu H, et al. Evaluation of ERA5 reanalysis over the deserts in northern China[J]. Theoretical and Applied Climatology, 2022, 151(1-2): 801-816.

[11]
谭秋阳, 徐宗学, 赵彦军, 等. CMFD数据集在雅江年楚河流域的适用性分析[J]. 北京师范大学学报(自然科学版), 2021, 57(3): 372-379.

[Tan Qiuyang, Xu Zongxue, Zhao Yanjun, et al. Applicability of China meteorological forcing dataset to the Nianchu River Basin[J]. Journal of Beijing Normal University (Natural Science Edition), 2021, 57(3): 372-379.]

[12]
黄艳伟, 李颖, 朱红雷, 等. CFSR数据集在辉发河流域水文模拟中的应用[J]. 水土保持研究, 2021, 28(1): 300-306.

[Huang Yanwei, Li Ying, Zhu Honglei, et al. Application of CFSR dataset to hydrological simulation of Huifa River Basin[J]. Research of Soil and Water Conservation, 2021, 28(1): 300-306.]

[13]
张淑芬, 董燕灵, 徐精诚, 等. 基于目标扰动的AdaBoost算法[J]. 通信学报, 2023, 44(2): 198-209.

DOI

[Zhang Shufen, Dong Yanling, Xu Jingcheng, et al. AdaBoost algorithm based on target perturbation[J]. Journal on Communications, 2023, 44(2): 198-209.]

DOI

[14]
Tyralis H, Papacharalampous G. Boosting algorithms in energy research: A systematic review[J]. Neural Computing and Applications, 2021, 33(21): 1-17.

[15]
张圆圆, 侯艳, 李康. 多分类研究中的boosting算法[J]. 中国卫生统计, 2018, 35(1): 142-145.

[Zhang Yuanyuan, Hou Yan, Li Kang. Boosting algorithm in multi-classification research[J]. Chinese Journal of Health Statistics, 2018, 35(1): 142-145.]

[16]
孟宪贵, 郭俊建, 韩永清. ERA5再分析数据适用性初步评估[J]. 海洋气象学报, 2018, 38(1): 91-99.

[Meng Xiangui, Guo Junjian, Han Yongqing. Preliminarily assessment of ERA5 reanalysis data[J]. Journal of Marine Meteorology, 2018, 38(1): 91-99.]

[17]
Zhao B, Zhang B, Shi C, et al. Comparison of the global energy cycle between Chinese reanalysis interim and ECMWF reanalysis[J]. Journal of Meteorological Research, 2019, 33(3): 563-575.

DOI

[18]
Kang M, Chun H, Song B. Contributions of convective and orographic gravity waves to the Brewer-Bobson circulation estimated from NCEP CFSR[J]. Journal of the Atmospheric Sciences, 2020, 77(3): 981-1000.

[19]
刘自牧, 李国平. 高原切变线的客观识别与时空分布的统计分析[J]. 大气科学, 2019, 43(1): 13-26.

[Liu Zimu, Li Guoping. Objective identification of the Tibetan Plateau shear line and statistical analysis of its spatiotemporal evolution features[J]. Chinese Journal of Atmospheric Sciences, 2019, 43(1): 13-26.]

[20]
温婷婷, 郭英香, 董少睿, 等. 1979—2017年CRU、ERA5、CMFD格点降水数据在青藏高原适用性评估[J]. 干旱区研究, 2022, 39(3): 684-697.

[Wen Tingting, Guo Yingxiang, Dong Shaorui, et al. Assessment of CRU, ERA5, CMFD grid precipitation data for the Tibetan Plateau from 1979 to 2017[J]. Arid Zone Research, 2022, 39(3): 684-697.]

[21]
张银辉. SWAT模型及其应用研究进展[J]. 地理科学进展, 2005, 24(5): 123-132.

[Zhang Yinhui. Development of study on model-SWAT and its application[J]. Progress in Geography, 2005, 24(5): 123-132.]

[22]
Fan J Z, Fan Z Y. A time series regression model via improved PCA and bagging algorithms[J]. Academic Journal of Engineering and Technology Science, 2023, 6(5): 23-29.

[23]
尹儒, 门昌骞, 王文剑, 等. 模型决策树: 一种决策树加速算法[J]. 模式识别与人工智能, 2018, 31(7): 643-652.

DOI

[Yin Ru, Men Changqian, Wang Wenjian, et al. Model decision tree: An accelerated algorithm of decision tree[J]. Pattern Recognition and Artificial Intelligence, 2018, 31(7): 643-652.]

DOI

[24]
唐豪, 王晓云, 陈伏龙, 等. 基于ERA5-Land数据集的玛纳斯河径流模拟研究[J]. 地学前缘, 2022, 29(3): 271-283.

DOI

[Tang Hao, Wang Xiaoyun, Chen Fulong, et al. Simulation of Manas River runoff based on ERA5-Land dataset[J]. Earth Science Frontiers, 2022, 29(3): 271-283.]

DOI

[25]
谷新晨, 肖森元, 杨广, 等. 基于CMADS和SWAT模型的玛纳斯河流域水文过程模拟[J]. 水资源与水工程学报, 2021, 32(2): 116-123.

[Gu Xinchen, Xiao Senyuan, Yang Guang, et al. Hydrological process simulation of Manas River Basin based on CMADS and SWAT model[J]. Journal of Water Resources & Water Engineering, 2021, 32(2): 116-123.]

[26]
陈伏龙, 王怡璇, 吴泽斌, 等. 气候变化和人类活动对干旱区内陆河径流量的影响——以新疆玛纳斯河流域肯斯瓦特水文站为例[J]. 干旱区研究, 2015, 32(4): 692-697.

[Chen Fulong, Wang Yixuan, Wu Zebin, et al. Impacts of climate change and human activities on runoff of continental river in arid areas: Taking Kensiwate hydrological station in Xinjiang Manas River Basin as an example[J]. Arid Zone Research, 2015, 32(4): 692-697.]

[27]
肖森元, 杨广, 何新林, 等. 玛纳斯河流域MIKE SHE水文模型率定[J]. 山地学报, 2021, 39(1): 1-9.

[Xiao Senyuan, Yang Guang, He Xinlin, et al. Calibration of hydrological modelling by MIKE SHE for the Manas River Basin, Xinjiang, China[J]. Mountain Research, 2021, 39(1): 1-9.]

Outlines

/