第三次新疆综合科学考察

新疆天山北坡城市群土地覆被数据产品精度评价

  • 闫兆进 , 1, 2, 3 ,
  • 孙雨晴 , 1 ,
  • HE Rong 4 ,
  • 王冉 1, 3 ,
  • 阮晓光 5 ,
  • 杨慧 1, 3 ,
  • 慈慧 1, 3
展开
  • 1.中国矿业大学资源与地球科学学院,江苏 徐州 221116
  • 2.中国矿业大学江苏省煤基温室气体减排与资源化利用重点实验室,江苏 徐州 221008
  • 3.中国矿业大学煤层气资源与成藏过程教育部重点实验室,江苏 徐州 221116
  • 4.圣克拉拉大学土木、环境与可持续工程系,美国 加州 95053
  • 5.浙江水利水电学院测绘与市政工程学院,浙江 杭州 310018
孙雨晴(2000-),女,硕士研究生,主要从事土地利用、遥感等方面的研究. E-mail:

闫兆进(1991-),男,博士,预聘副教授,主要从事地学大数据挖掘与空间分析建模等方面的研究. E-mail:

收稿日期: 2023-12-20

  修回日期: 2024-01-02

  网络出版日期: 2026-03-11

基金资助

新疆维吾尔自治区重点研发计划项目课题(2022B01012-1)

科技部第三次新疆综合科学考察项目课题(2022xjkk1006)

国家自然科学基金项目(42201451)

中国博士后科学基金面上项目(2022M723379)

中央高校基本科研业务费专项(2024ZDPYCH1003)

浙江省社科联项目(2024N085)

Evaluation of land cover data product accuracy in urban agglomeration on the northern slope of Tianshan Mountains in Xinjiang

  • Zhaojin YAN , 1, 2, 3 ,
  • Yuqing SUN , 1 ,
  • Rong HE 4 ,
  • Ran WANG 1, 3 ,
  • Xiaoguang RUAN 5 ,
  • Hui YANG 1, 3 ,
  • Hui CI 1, 3
Expand
  • 1. School of Resources and Geosciences, China University of Mining and Technology, Xuzhou 221116, Jiangsu, China
  • 2. Jiangsu Key Laboratory of Coal-Based Greenhouse Gas Control and Utilization, China University of Mining and Technology, Xuzhou 221008, Jiangsu, China
  • 3. Key Laboratory of Coal Bed Gas Resources and Forming Process of Ministry of Education, China University of Mining and Technology, Xuzhou 221116, Jiangsu, China
  • 4. Department of Civil, Environmental and Sustainable Engineering, Santa Clara University, Cingifornia 95053, USA
  • 5. College of Geomatics and Municipal Engineering, Zhejiang University of Water Resources and Electric Power, Hangzhou 310018, Zhejiang, China

Received date: 2023-12-20

  Revised date: 2024-01-02

  Online published: 2026-03-11

摘要

土地覆被产品为全球各种地球系统科学应用提供了重要的地表覆被信息,如CLCD30(30 m)、GlobeLand30(30 m,简称 Globe30)、GLC_FCS30(30 m)、FROM-GLC10(10 m)、Esri_Land_Cover_2020(10 m,简称 Esri10),以及ESAWorldCover2020(10 m,简称 ESA10),然而其在局地的精度和适用性如何尚不明确。基于Sentinel-2影像,通过样本精度评价和类别混淆评价对上述6套土地覆被数据产品在天山北坡城市群的精度及误差情况进行了研究和分析,并探讨了误差成因和不同数据产品的适用性。结果表明:(1)6套数据产品中,除Esri10外,其余5套数据产品的类型构成、面积占比相对一致。(2)GLC-FCS30、Globe30、CLCD30、FROM-GLC10、ESA10、Esri10的总体精度分别为0.8080、0.8147、0.7880、0.8531、0.8047、0.4725。(3)从产品适用性来看,GLC_FCS30适用于对耕地、裸地的分析,CLCD30适用于对林地、裸地的分析,FROM-GLC10适用于对草地、水体、冰/雪以及建筑的分析,ESA10适用于对耕地和草地的分析,Esri10适用于对林地、冰/雪以及建筑的分析,Globe30在各类别精度评价结果上更均衡。(4)类别混淆主要是耕地、林地以及草地之间及与其他类别的相互混淆,尤其是在土地覆被复杂的地区,如城市边缘区域。

本文引用格式

闫兆进 , 孙雨晴 , HE Rong , 王冉 , 阮晓光 , 杨慧 , 慈慧 . 新疆天山北坡城市群土地覆被数据产品精度评价[J]. 干旱区地理, 2024 , 47(11) : 1852 -1862 . DOI: 10.12118/j.issn.1000-6060.2023.721

Abstract

Land cover data products, including CLCD30 (30 m resolution), GlobeLand30 (30 m, referred to as Globe30), GLC_FCS30 (30 m), FROM-GLC10 (10 m), Esri_Land_Cover_2020 (10 m, referred to as Esri10), and ESAWorldCover2020 (10 m, referred to as ESA10), provide essential surface cover information for various earth system science applications globally. However, their accuracy and suitability for specific local areas remain uncertain. This study evaluates the accuracy and errors of these six land cover products in the northern slope of the Tianshan Mountains in Xinjiang, China, based on Sentinel-2 imagery, using sample accuracy assessment and category confusion evaluation. Furthermore, the causes of errors and the applicability of different products were analyzed. The results indicate that: (1) Among the six data product sets, except for Esri10, the composition and area percentages of land cover types are relatively consistent across the other five products. (2) The overall accuracies of these products are: GLC_FCS30 (0.8080), Globe30 (0.8147), CLCD30 (0.7880), FROM-GLC10 (0.8531), ESA10 (0.8047), and Esri10 (0.4725). (3) Regarding product applicability, GLC_FCS30 is effective for analyzing cropland and bareland; CLCD30 is optimal for forest and bareland; FROM-GLC10 excels in representing grassland, water bodies, snow/ice, and built-up areas; ESA10 is suitable for cropland and grassland; Esri10 performs well in forest, snow/ice, and built-up areas; and Globe30 maintains overall stability in accuracy across all categories. (4) Major category confusion occurs between cropland, forest, grassland, and other categories, especially in areas with complex land cover, such as urban fringes.

土地利用/土地覆盖变化(LUCC)是人类活动对地球表面变化影响的直观表现,在模拟气候和环境动态以及预测未来土地利用、粮食安全、气候和生物多样性等应用上起着至关重要作用,因而成为全球变化研究的关键领域之一[1-4]。随着卫星遥感技术和GIS技术的高速发展,涌现出大量优质、公开共享的土地覆被数据集,如武汉大学研制的年度中国土地覆被数据集CLCD30[5]、国家基础地理信息中心研制的GlobeLand30[6]、中国科学院研制的GLC_FCS30[7]数据,以上均为30 m级的数据产品,10 m级的产品也研制出了许多,如清华大学的FROM-GLC10[8]、Esri公司的Esri_Land_Cover_2020[9]数据以及欧空局联合全球多家科研机构共同制作的ESAWorldCover2020[10]
然而,各数据集在来源、覆盖区域和空间分配算法等方面存在差异,对同一区域内土地覆被类型的描述也有所不同,因而精度评价也需要同步发展[11]。相关研究的区别大多在于选取的研究区不同、分析的数据产品不同,可将类似研究归为以下3类:(1)以国家、行政区划等为尺度,如欧盟[12]、中国[13-14]以及南亚、东南亚地区[15],或福建省[16]、云南省普洱市[17]等;(2)以自然区域为研究区,如以北极地区为研究区[18],或分析全球土地覆被数据产品在全球海岸带[19]、黄河流域[20]、甘南地区[21]的准确性;(3)针对特定的土地覆被类型进行研究,如分析耕地覆被产品在中南半岛[22]或新疆地区的精度情况[23]。此外,在样本点的选取上,现有的方法可以划分为2类:一类是随机采样或者格网划分研究区获得均匀分布的样本点[24-25];另一类是采用已有的影像样本点数据集,如Google Earth影像样本[26-27]、相关机构提供的自发地理信息[28-29]等。
由此可见,现有的研究缺少对城市群、经济带这类以经济为区划的土地覆被产品的精度评价,并且缺乏对验证样本点数量的分析,而且10 m级的产品已投入使用,但对这类高精度数据产品的精度评价较少。因此,本文以天山北坡城市群为研究区域,分析CLCD30、GlobeLand30(简称Globe30)、GLC_FCS30、FROM-GLC10、Esri_Land_Cover_2020(简称Esri10)、ESAWorldCover2020(简称ESA10)这6套数据产品在城市群尺度上的精度和误差情况。本文的创新点体现在2个方面:(1)通过样本精度评价和类别混淆评价对6套土地覆被数据产品在天山北坡区域的精度及误差情况进行了研究和分析,并探讨了误差成因和不同数据产品的适用性;(2)评价了10 m级土地覆被产品在局地区域的精度和使用性,探究了不同分辨率土地覆被产品在天山北坡城市群的分类精度,从而为该区域选择和使用土地覆被数据产品提供参考和建议。

1 数据与方法

1.1 研究区概况

天山北坡城市群(42°44′~46°19′N,81°44′~91°33′E)自西向东包括乌苏市、克拉玛依市、奎屯市、沙湾市、石河子市、玛纳斯县、呼图壁县、昌吉市、五家渠市、乌鲁木齐市、阜康市11个县市(图1)。天山北坡城市群是19个国家重点开发区之一,集中了新疆大部分的工业,具有良好的城镇、交通、能源等基础条件,是新疆突出的人口分布聚集单元[30],对带动、辐射、示范新疆经济具有重要作用。而天山北坡城市群是典型的干旱绿洲经济区[31],生态系统稳定性差、抗逆性弱[32],主要自然植被有草地、灌木等,林地主要分布在南部的山区,冰川、冻土广泛分布于中高海拔的山区。
图1 研究区示意图

注:基于新疆标准地图服务网站审图号为新S(2021)046号的标准地图制作,底图边界无修改。下同。

Fig. 1 Schematic diagram of the study area

1.2 数据及预处理

本文选取的参考数据为30幅2020年7月1日—10月31日的Sentinel-2 L2A遥感影像,影像从欧空局网站(https://scihub.copernicus.eu/dhus/#/home)免费下载。考虑到冬季时冰/雪覆盖了研究区大面积区域,因此将遥感影像的时间集中在夏秋季。选择的土地覆被分类产品的详细参数如表1所示。6套产品的投影坐标系均为WGS84坐标系,因此预处理主要包括拼接、裁剪、合并分类体系和剔除特殊值(如0值或填充值255等),以保证后续研究中不存在像元干扰、采样点不为空值。
表1 土地覆被数据产品参数

Tab. 1 Parameters of land cover data products

产品名称 来源 分辨率/m 区域 制图单位 生产年份 分类方法 参考数据 分类体系
(类别数量)
FROM-GLC10 http://data.ess.tsinghua.edu.cn/fromglc2017v1.html 10 全球 清华大学 2017 随机森林 Sentinel-2 LCCS(10)
ESA10 https://viewer.esa-worldcover.org/worldcover 10 全球 欧空局及全球多家科研机构 2020 随机森林 Sentinel-1
Sentinel-2
LCCS(8)
Esri10 https://esri.maps.arcgis.com/ 10 全球 Esri,撞击观测站 2020 深度学习 Sentinel-2 LCCS(11)
GLC_FCS30 http://doi.org/10.5281/zenodo.4280923 30 全球 中国科学院空天信息创新研究院 2020 监督分类 Landsat、Sentinel-1 LCCS(29)
Globe30 https://GlobeLand30/ 30 全球 国家基础地理信息中心等 2020 监督分类 Landsat LCCS(10)
CLCD30 https://zenodo.org./ 30 中国 武汉大学 2020 随机森林 Landsat LCCS(9)

注:ESA10、Globe30、Esri10分别为ESAWorldCover2020、GlobeLand30、Esri_Land_2020的简称。下同。

统一的分类体系是比较不同土地覆被数据产品的前提,本文选取的6套产品均采用了LCCS分类体系,细化程度上存在不同,因此以CLCD30的分类体系为基准,对分类体系进行了统一,将土地覆被类别聚合成图表中的“统一类型”,各土地覆被产品的类别对应如表2所示。
表2 6套土地覆被数据产品的分类系统和统一分类系统

Tab. 2 Classification system and harmonized classification system for the six land cover data products

产品 FROM-GLC10 GLC_FCS30 CLCD30 ESA10 Globe30 Esri10 统一类别
类型 耕地 旱作农田、灌溉农田 耕地 耕地 农地 耕地 耕地
草地 草地、稀疏草丛、稀疏植被、草本覆盖 草地 草地 草地、苔原 牧场 草地
灌木 灌木地、常绿灌木地 灌木 灌木 灌丛 牧场 草地
林地 开阔常绿阔叶林、封闭落叶阔叶林、开阔常绿针叶林、封闭常绿针叶林、开阔落叶针叶林、封闭落叶针叶林、 林地 林地 森林 树木 林地
湿地 地衣苔藓、湿地 湿地 湿地、苔藓 湿地 淹没植被 湿地
水体 水体 水域 永久水体 水体 水体 水体
不透水面 不透水表面 建设用地 建筑 不透水层 建筑 建筑
裸地 裸地、固定裸地、不固定裸地 裸地 荒漠 裸地 裸地 裸地
雪/冰 永久冻土/雪原 冰川 雪和冰 冰雪 冰/雪 冰/雪
- - - - - -

1.3 研究方法

1.3.1 样本精度评价

本文选择了599个样本点(去掉了1个无法识别地类的点),样本点基于空白区域最大的GLC_FCS30生成,通过Sentinel-2 L2A遥感影像进行目视解译。为排除样本点个数对精度评价结果的影响,以数量100为间隔,建立了从100至800的8套样本点,对6套产品重复进行精度评价。在分析了各类别的面积占比后,考虑到面积占比过小的类别样本点数量过少,影响精度结果的准确性,将水体、冰/雪、建筑和湿地4个类别分离出来再次进行样本精度评价,着重分析其类别精度,以50为间隔,建立了数量从50至400的8套样本点,最终选择300个样本点进行评价。
通过6套土地覆被数据的共12个混淆矩阵,计算了6套数据的总精度、Kappa系数、各类别的制图精度(PA)及使用者精度(UA),其中总精度和Kappa系数用于评价数据产品的总体情况,使用者精度和制图精度用于评价各套土地覆被类型的精度及混淆状况。

1.3.2 类别混淆评价

虽然各种精度评价指标可以从统计角度评估6套产品的精度情况,但难以描述各土地覆被类别之间的混淆程度。因此,将各数据产品的混淆矩阵可视化为堆叠图,定量分析不同地类的混淆程度。而后,将3套30 m级的数据产品、3套10 m级的数据产品分别叠合分析,获得不同产品之间逐像元的空间对应关系,以确定地类混淆的空间位置,将空间对应关系划分为:1-完全一致性(像元处3套产品分类均相同)、2-部分一致性(像元处有2套产品分类相同)、3-无一致性(像元处3套产品分类均不相同),并从数据源、制图方法、分类系统、光谱特征等方面深入研究地类混淆的原因。

2 结果与分析

2.1 天山北坡城市群土地覆被特征

经数据预处理后,可得到天山北坡城市群土地覆被的基本情况(图2)。6套产品对研究区内各地类的描述存在差别,除Esri10中草地面积占比达到66%、裸地仅11%外,其他产品各地类的比例较为一致。总体而言,土地覆被类别以裸地为主,占研究区总面积的44%以上,主要分布在古尔班通古特沙漠、准噶尔盆地南缘以及城市与天山之间的区域。裸地、耕地和草地3类的总和占研究区总面积的90%。其中,耕地主要集中在城区周围。草地除了大面积分布在天山山区低海拔地区、城市周边外,还广泛分布在了古尔班通古特沙漠区域,但植被与裸地混杂,影像上难以分辨清晰。水体大部分分布在湖泊以及水库、山脉中的天池。建筑类别的覆盖区域约为1%~3%。冰/雪类别约为1%~2%,集中在天山山脉的高海拔区域。湿地类别在遥感影像上辨析明确,但面积占比过少,使得精度评价结果不具有明确的代表性,因此本文不对其进行讨论。
图2 6套土地覆被数据产品各土地类型面积占比

Fig. 2 Area proportion of each land type in the six land cover data products

2.2 样本精度评价结果

通过Sentinel-2影像对600个样本点以及针对特殊类别的300个样本点进行目视解译(图3),形成了12套土地覆被数据产品的混淆矩阵。
图3 样本点分布

Fig. 3 Sample point distribution

6套土地覆被数据产品的总精度和Kappa系数如表3所示。除Esri10外,其余5套产品的总精度和Kappa系数相差并不大,总精度均在0.75以上,Kappa系数均在“较高的一致性”范围内。数值最高的是FROM-GLC10(总精度和Kappa系数分别为0.8531和0.7624),其次是Globe30(总精度和Kappa系数分别为0.8147和0.7142),GLC-FCS30和ESA10的总精度(均为0.80左右)接近,但GLC-FCS30的Kappa系数比ESA10高,具有更好的一致性。由上述各地类面积占比分析可知,Esri10的总精度和Kappa系数与其他产品差异巨大的原因是将大面积的裸地划分为了草地,尤其是古尔班通古特沙漠、准噶尔盆地盆地南缘等区域。总体而言,除Esri10外,其他土地覆被数据产品在天山北坡城市群均具有较高的可靠性。
表3 6组数据产品的总精度和Kappa系数

Tab. 3 Total accuracy and Kappa coefficient of the six land cover data products

精度指标 GLC-FCS30 Globe30 CLCD30 FROM-GLC10 ESA10 Esri10
总精度 0.8080 0.8147 0.7880 0.8531 0.8047 0.4725
Kappa系数 0.7128 0.7142 0.6802 0.7624 0.6986 0.3038
大部分产品的总精度和Kappa系数差别不大,但在各土地覆被类型上,不同数据产品的使用者精度和制图精度差异明显(图4)。
图4 6套土地覆被数据产品的分类精度

Fig. 4 Classification accuracy of the six land cover data products

对应面积占比较大的3个类别:耕地类别的使用者精度和制图精度均很高,都在0.83以上,其中,制图精度最高的是Esri10(0.9268),其次是GLC-FCS30(0.9146);使用者精度最低的是CLCD30(0.8315),其次是Globe30和Esri10(分别为0.8333和0.8352)。草地类别的精度差异较大,数值大部分集中在0.5左右和0.70~0.85之间,除FROM-GLC10的制图精度为1.000外,Esri10的使用者精度(0.8571)、GLC-FCS30和Globe30的制图精度(均为0.8462)均较高。因Esri10产品对草地与裸地的混淆,导致该数据产品草地类别的使用者精度和制图精度差异巨大,其制图精度最低(0.4615),其次是GLC-FCS30的使用者精度(0.5)。裸地类别的精度值大部分在0.75~0.95之间,制图精度最低的是Esri10(0.1495),其次是CLCD30的制图精度(0.7445);使用者精度最高的是GLC-FCS30(0.9684),其次是CLCD30的使用者精度(0.9637)和FROM-GLC10的制图精度(0.9564)。
在面积占比较小的4个类型中:林地类别的最高值为CLCD30的制图精度(0.8676),其次是Esri10的制图精度(0.8543),并且Esri10的使用者精度最低(0.3170),其次是CLCD30的使用者精度(0.5848)。水体类别的精度值均在0.72以上,使用者精度最高的是FROM-GLC10(0.9718),其次是Globe30和FROM-GLC10的制图精度(均为0.8497),这也说明FROM-GLC10对水体类别的描述很准确。冰/雪类别的精度值除ESA10和FROM-GLC10的使用者精度外(分别为0.6306和0.6667),其余均在0.77以上,最高值是FROM-GLC10的制图精度(0.9737),其次是GLC-FCS30和Esri10的使用者精度(分别为0.9550和0.9505)。对于建筑类别,各数据产品的精度差异较大,差异最大的是FROM-GLC10(分别为0.8636和0.2879),制图精度最高的是GLC-FCS30(1.000),其次是Esri10的制图精度(0.9091),CLCD30的制图精度也较低(0.3333)。

2.3 类别混淆评价结果

将以上各数据产品精度评价结果的混淆矩阵可视化为堆叠图(图5)。总体上看:(1)耕地、草地、林地之间的相互混淆;(2)建筑、草地、耕地之间的混淆;(3)冰/雪类别与裸地、水体之间的混淆。耕地、草地、林地是因为三者均为植被,特征光谱相似,而且草地夹杂在耕地之间,又往往与林地一同分布在天山山脉的低海拔区域,增加了分类的难度。其中,建筑、草地和耕地3个类别的类别混淆情况较高,究其原因是建筑和草地零散地分布在耕地中,地类复杂度的提升导致了类别混淆严重。而冰/雪类别是动态变化的,在不同的时节分布的面积、区域有所区别,在冬季大面积分布的冰雪将在春夏季转变为裸地和水体(山脉中的天池),土地覆被数据产品往往是年际产品,因此参考影像的时间不同会影响冰/雪类别的识别结果。
图5 6套土地覆被数据产品的类别混淆情况

Fig. 5 Category confusion for the six land cover data products

在面积占比较大的3个类别中:耕地类别的一致性较好,类别混淆中与草地类别混淆的比例最高,CLCD30中混淆比例达到了12.195%,其余产品也在3%~8%之间,其次是耕地与建筑的混淆;对于草地类别,混淆程度大部分在13%~20%之间,FROMG-GLC10的混淆程度最高,为31.778%,主要是与耕地、裸地的混淆;裸地类别主要是与草地类别的混淆,大部分在14%~20%之间,一致性最好的是FROM-GLC10,Ersi10产品将大部分裸地分类为草地,因此混淆程度最高,为82.866%。
面积较小的4个类别中:林地类别的空间混淆程度较高,主要是与草地类别的混淆,二者往往一同分布在天山山脉的低海拔区域,二者同为植被又夹杂分布,增加了分类的难度;水体类别与裸地、湿地的混淆较多,在ESA10和Ersi10中裸地的混淆比例最高达到了10.526%,与湿地的混淆均在2%~7%左右;针对冰/雪类别:主要是与裸地的混淆程度较高,FROM-GLC10与ESA10都达到了30%,一致性最好的是GLC-FCS30,仅与水体类别有4.505%的混淆;对于建筑类别,除GLC-FCS30和Ersi10外,其余产品的一致性均较低,FROM-GLC10与CLCD30混淆程度分别达到了71.212%、66.667%,与草地、耕地、裸地的混淆是主要原因,也导致了FROM-GLC10和CLCD30的制图精度较低。
将相同分辨率的数据产品进行叠加,可得到土地覆被产品一致性的空间分布(图6)。分析结果显示,Esri10产品与其他2套10 m级分辨率产品一致性较差,草地、裸地的混淆是主要原因,影响了一致性分布的分析(图6a)。为更好地分析10 m级的产品,将ESA10和FROM-GLC10 2套产品叠加。
图6 6套土地覆被数据产品的空间一致性

注:图b因GLC-FCS30数据缺失,而出现空白。

Fig. 6 Consistent spatial distribution of the six land cover data products

(1)完全一致性区域:10 m级3套产品的完全一致性区域主要分布在城市的耕地、天山山脉的草地、林地、艾比湖以及东北方向的部分裸地区域;30 m级的3套产品叠加后,大部分区域为完全一致,在囊括了10 m级的完全一致性区域外,多了土地覆被类型单一的裸地、草地区域,占比为70.4%,而ESA10和FROM-GLC10 2套产品的一致性区域分布与30 m级产品的一致性分布相似,占比为75.18%,说明二者有较好的一致性,可能与这2套产品分类方法均为随机森林而且分类体系的细化程度接近有关。
(2)部分一致性区域:30 m级的部分一致性区域在荒漠区域较集中,其原因可能是荒漠中植被多为耐旱植物,难以与裸地区分,提升了分类难度,其余的部分一致性区域零散分布在城市和山脉中,与10 m级2套产品叠加的无一致性区域分布相似。
(3)无一致性区域:分布零散,主要为城市边缘,耕地、草地、建筑、裸地混杂的区域,10 m级的3套产品无一致性的区域比30 m级的多(分别为4.482%和1.663%),这与分辨率提升、同面积区域内地类复杂程度提升有关;艾比湖的一致性较差主要是由于水位逐年下降和不同产品参照的遥感影像时间不同导致的,水体覆盖面积的变化会影响一致性结果,集中在了艾比湖边缘区域。

2.4 验证样本点个数对精度评价结果影响

土地覆被数据产品的精度评价结果受采样点数量的影响(图7)。当采样点数量小于500时,土地覆被数据产品的总精度上升趋势明显,6套产品精度波动的平均值为7.937%;采样点数量大于500时,各产品的总精度的趋势逐渐稳定,6套产品精度波动的平均值为2.183%。由此可知,研究区土地覆被分类精度评价较合理的采样点个数为500个,因此研究选择的600个采样点足以反映各数据产品在天山北坡城市群的总精度特征及面积占比较大的3个地类的类别精度。
图7 不同采样点数量下土地覆被数据产品的总精度

Fig. 7 Overall accuracy of land cover data products at different numbers of sampling points

对于面积占比较少的4个类别,即水体、冰/雪、建筑和湿地,将其分离出来重复上述操作,除去湿地类别的精度结果后,以采样点数量为250个为分界线,采样点数量小于250时,6套产品各类别精度波动的平均值为20.317%;采样点数量大于250时,平均值为8.619%。由此可知,用于评价水体、冰/雪、建筑这3个类别的合理的采样点个数为250个,因此研究选择的300个采样点足以反映各数据产品水体、冰/雪和建筑的类别精度。

3 讨论

本文选择了GLC-FCS30、Globe30、CLCD30、FROM-GLC10、ESA10、Esri10 6套土地覆被数据产品在天山北坡城市群进行样本精度评价和类别混淆评价。从精度评价的结果上看:(1)6套数据产品中,除Esri10外,其余5套产品的类型构成、面积比例相差不大,均是裸地占比最大,其次是草地、耕地,建筑、水体以及冰/雪面积占比在1%~3%之间。(2)6套数据产品中有5套精度均较高且差距不大,最高的为FROM-GLC10,总精度和Kappa系数分别为0.8531、0.7624,对数据产品分辨率要求不高的情况下,30 m级的Globe30和GLC_FCS30也能满足使用,这5套产品中对耕地、水体、冰/雪、裸地的分类结果更好,林地、草地以及建筑类别有待优化。(3)从面向用户需求的产品适用性来看,GLC_FCS30适用于对耕地、裸地的分析,CLCD30适用于对林地、裸地的分析,FROM-GLC10适用于对草地、水体、冰/雪以及建筑的分析,ESA10适用于对耕地和草地的分析,Esri10适用于对林地、冰/雪以及建筑的分析,Globe30在各类别精度评价结果上更均衡。(4)由于湿地类别面积占比过小,精度评价结果不稳定,后期可结合其他方法和数据对此类别进行分析和评价。
从类别混淆评价结果来看,主要的类别混淆是耕地、林地以及草地之间及与其他类别的相互混淆,尤其是在城市边缘、山脉与平原的过渡地等土地覆被类型复杂度高的区域,这与在黄河流域[18]、长三角[21]、河南省[23]的分析结果类似,植被类别精度的提升依旧是重难点,而且间接导致了6套数据产品中建筑类别的精度结果较差。
根据乌鲁木齐市在各数据产品中的分类情况(图8),将数据产品按分辨率分类来看,分辨率的提升能够将各地类刻画得更加细致、更贴合真实地表,避免了30 m级产品大面积图斑覆盖的问题,但各地类的分布更零碎,而采样点获取的是单像素值,因此在精度评价结果上,10 m级的产品相对于30 m级的产品优势并不明显。此外,FROM-GLC10与ESA10在城市区域对建筑类别的描述细致准确,但精度结果相差甚远,从堆叠图和无一致性区域的分布中可知,其原因在于FROM-GLC10将城市区域范围外的部分裸地、草地划分为了建筑,而目前10 m级的数据产品较少,FROM-GLC10产品与其他数据产品在时间上的不一致会引入误差,未来应寻找更多来源的产品,以弥补时间不一致的不足。
图8 各数据产品在城市区域的对比

Fig. 8 Comparison of urban regions for each data product

4 结论

本文选择了GLC-FCS30、Globe30、CLCD30、FROM-GLC10、ESA10、Esri10 6套土地覆被数据产品在天山北坡区域进行理论样本精度评价和类别混淆评价。主要结论如下:
(1)6套数据产品中,除Esri10外,其余5套产品的类型构成、面积比例相差不大,均是裸地占比最大,其次是草地、耕地,建筑、水体以及冰/雪,面积占比在1%~3%之间。
(2)从样本精度评价结果来看,除Esri10外,6套数据产品的总体精度均在0.8左右,质量相差不大。
(3)从面向用户需求的产品适用性来看,此区域的研究可更多地参考FROM-GLC10数据产品,在对数据产品的分辨率要求不高的情况下,30 m级的Globe30和GLC_FCS30也能满足使用需求。这5套产品中对耕地、水体、冰/雪、裸地的分类结果更好,对林地、草地以及建筑分类结果有待优化。Globe30各类别精度评价结果整体更稳定,其余产品在各类别上有各自的优势。
(4)从类别混淆评价结果来看,主要的类别混淆是耕地、林地以及草地之间及与其他类别的相互混淆,尤其是城市与山脉的过渡区域,这也导致了6套数据产品中建筑类别的评价精度不高。
[1]
Wei H, Xiong L Y, Tang G A, et al. Spatial-temporal variation of land use and land cover change in the glacial affected area of the Tianshan Mountains[J]. CATENA, 2021, 202: 105256, doi: 10.1016/j.catena.2021.105256.

[2]
Li M J, He F N, Zhao C H, et al. Evaluation of global historical cropland datasets with regional historical evidence and remotely sensed satellite data from the Xinjiang area of China[J]. Remote Sensing, 2022, 14(17): 4226, doi: 10.3390/rs14174226.

[3]
MohanRajan S N, Loganathan A, Manoharan P. Survey on land use/land cover (LU/LC) change analysis in remote sensing and GIS environment: Techniques and challenges[J]. Environmental Science and Pollution Research, 2020, 27(24): 29900-29926.

[4]
郭紫燕, 杨康, 刘畅, 等. 巴基斯坦土地覆盖数据产品季节性精度评价[J]. 遥感技术与应用, 2020, 35(3): 567-575.

DOI

[Guo Ziyan, Yang Kang, Liu Chang, et al. Seasonal accuracy assessments of three land cover datasets in Pakistan[J]. Remote Sensing Technology and Application, 2020, 35(3): 567-575.]

[5]
Yang J, Huang X. The 30 m annual land cover dataset and its dynamics in China from 1990 to 2019[J]. Earth System Science Data, 2021, 13(8): 3907-3925.

DOI

[6]
Yu L, Du Z R, Dong R M, et al. FROM-GLC plus: Toward near real-time and multi-resolution land cover mapping[J]. GIScience & Remote Sensing, 2022, 59(1): 1026-1047.

[7]
Zhang X, Liu L Y, Chen X D, et al. GLC_FCS30: Global land-cover product with fine classification system at 30 m using time-series Landsat imagery[J]. Earth System Science Data, 2021, 13(6): 2753-2776.

DOI

[8]
Gong P, Liu H, Zhang M N, et al. Stable classification with limited sample: Transferring a 30 m resolution sample set collected in 2015 to mapping 10 m resolution global land cover in 2017[J]. Science Bulletin, 2019, 64(6): 370-373.

[9]
Karra K, Kontgis C, Statman-Weil Z, et al. Global land use/land cover with Sentinel 2 and deep learning[C]// IEEE International Geoscience and Remote Sensing Symposium IGARSS. Brussels, Belgium: IEEE, 2021: 4704-4707.

[10]
Daniele Z, van de Ruben K, de Wanda K, et al. ESA World Cover 10 m 2020 v100[DB/OL]. [2023-12-10]. https://doi.org/10.5281/zenodo.5571936.

[11]
Stehman S V, Foody G M. Key issues in rigorous accuracy assessment of land cover products[J]. Remote Sensing of Environment, 2019, 231(10): 111199, doi: 10.1016/j.rse.2019.05.018.

[12]
Gao Y, Liu L Y, Zhang X, et al. Consistency analysis and accuracy assessment of three global 30 m land cover products over the European Union using the Lucas dataset[J]. Remote Sensing, 2020, 12(21): 3479, doi: 10.3390/rs12213479.

[13]
Ran Y H, Li X, Lu L. Evaluation of four remote sensing based land cover products over China[J]. International Journal of Remote Sensing, 2010, 31(2): 391-401.

[14]
Li Z W, Chen X Y, Qi J, et al. Accuracy assessment of land cover products in China from 2000 to 2020[J]. Scientific Reports, 2023, 13(1): 12936, doi: 10.1038/s41598-023-39963-0.

PMID

[15]
康军梅. 多源遥感土地覆被产品一致性评价及要素提取分析应用研究[D]. 西安: 长安大学, 2020.

[Kang Junmei. Research on consistency assessment of multi-source land cover poducts and application of element extraction analysis[D]. Xi’an: Chang’an University, 2020.]

[16]
付东光, 李登秋, 陆灯盛, 等. 基于调查数据的福建省3种30 m全球土地覆盖产品精度评价[J]. 福建师范大学学报(自然科学版), 2023, 39(2): 122-136.

[Fu Dongguang, Li Dengqiu, Lu Dengsheng, et al. Accuracy assessment of three 30 m resolution global land cover products in Fujian Province based on survey data[J]. Journal of Fujian Normal University (Natural Science Edition), 2023, 39(2): 122-136.]

[17]
闫明, 庞勇, 何云玲, 等. 普洱多源土地覆盖产品一致性分析与精度评价[J]. 林业资源管理, 2023(1): 173-182.

[Yan Ming, Pang Yong, He Yunling, et al. Consistency analysis and accuracy evaluation of multi-source land cover products in Pu’er[J]. Forest Resource Management, 2023(1): 173-182.]

[18]
Liang L, Liu Q S, Liu G H, et al. Accuracy evaluation and consistency analysis of four global land cover products in the Arctic region[J]. Remote Sensing, 2019, 11(12): 1396, doi: 10.3390/rs11121396.

[19]
侯婉, 侯西勇. 全球海岸带多源土地利用覆盖遥感分类产品一致性分析[J]. 地球信息科学学报, 2019, 21(7): 1061-1073.

DOI

[Hou Wan, Hou Xiyong. Consistency of the multiple remote sensing-based land use and land cover classification products in the global coastal zones[J]. Journal of Geo-information Science, 2019, 21(7): 1061-1073.]

[20]
吴宗洋, 蔡卓雅, 郭英, 等. 黄河流域多源遥感土地覆被数据精度评价与一致性分析[J]. 中国生态农业学报, 2023, 31(6): 917-927.

[Wu Zongyang, Chai Zhuoya, Guo Ying, et al. Accuracy evaluation and consistency analysis on multi-source remote sensing land cover data in the Yellow River Basin[J]. Chinese Journal of Eco-Agriculture, 2023, 31(6): 917-927.]

[21]
夏文韬, 王莺, 冯琦胜, 等. 甘南地区MODIS土地覆盖产品精度评价[J]. 草业科学, 2010, 27(9): 11-18.

[Xia Wentao, Wang Ying, Feng Qisheng, et al. Accuracy assessment of MODIS land cover product of Gannan Prefecture[J]. Grassland Science, 2010, 27(9): 11-18.]

[22]
Wang X, Wang J, Wang W, et al. Consistency and accuracy evaluation analysis of four cropland cover products: A case study of Indochina Peninsula[J]. Journal of Sensors, 2022(24): 1-25.

[23]
李美娇, 何凡能, 赵彩杉, 等. 全球历史LUCC数据集新疆地区耕地数据可靠性评估[J]. 生态环境学报, 2022, 31(6): 1215-1224.

DOI

[Li Meijiao, He Fanneng, Zhao Caishan, et al. Credibility assessment of cropland data in Xinjiang area in global historical LUCC datasets[J]. Journal of Ecology and Environment, 2022, 31(6): 1215-1224.]

[24]
陈逸聪, 邵华, 李杨. 多源土地覆被产品在长三角地区的一致性分析与精度评价[J]. 农业工程学报, 2021, 37(6): 142-150.

[Chen Yicong, Shao Hua, Li Yang. Consistency analysis and accuracy assessment of multi-source land cover products in the Yangtze River Delta[J]. Journal of Agricultural Engineering, 2021, 37(6): 142-150.]

[25]
Lu M, Wu W B, Zhang L, et al. A comparative analysis of five global cropland datasets in China[J]. Science China Earth Sciences, 2016, 59(12): 2307-2317.

[26]
黄亚博, 廖顺宝. 首套全球30 m分辨率土地覆被产品区域尺度精度评价——以河南省为例[J]. 地理研究, 2016, 35(8): 1433-1446.

DOI

[Huang Yabo, Liao Shunbao. Regional accuracy assessments of the first global land cover dataset at 30-meter resolution: A case study of Henan Province[J]. Geography Research, 2016, 35(8): 1433-1446.]

[27]
宋宏利, 张晓楠. 国家尺度异源土地覆被遥感产品精度评价[J]. 国土资源遥感, 2018, 30(3): 26-32.

[Song Hongli, Zhang Xiaonan. Precision validation of multi-sources land cover products derived from remote sensing[J]. Remote Sensing of Land Resources, 2018, 30(3): 26-32.]

[28]
黄亚博. 基于多源数据融合的MODIS土地覆被产品精度评价与改进方法研究[D]. 开封: 河南大学, 2017.

[Huang Yabo. Research on MODIS land cover product accuracy evaluation and improvement method based on mult-source data fusion[D]. Kaifeng: Henan University, 2017.]

[29]
宋宏利, 张晓楠. 基于VGI的土地覆被遥感产品精度验证[J]. 河北工程大学学报(自然科学版), 2016, 33(4): 98-102.

[Song Hongli, Zhang Xiaonan. Analysis of land cover category accuracy based on volunteered geographic information[J]. Journal of Hebei University of Engineering (Natural Science Edition), 2016, 33(4): 98-102.]

[30]
杨梅花, 程锦涛, 郭佳星, 等. 新疆城市规模分布与自然地理相关性分析[J]. 干旱区地理, 2022, 45(6): 1958-1967.

DOI

[Yang Meihua, Cheng Jintao, Guo Jiaxing, et al. Correlation analysis between urban scale distribution and physicalgeography in Xinjiang[J]. Arid Land Geography, 2022, 45(6): 1958-1967.]

DOI

[31]
Ma H L, Sun J G. The influence of LUCC on water demand in the north slope of Tianshan Mountain, IOP Conference Series: Earth and environmental science[J]. IOP Publishing, 2020, 560(1): 012079, doi: 10.1088/1755-1315/560/1/012079.

[32]
孙桂丽, 陆海燕, 郑佳翔, 等. 新疆生态脆弱性时空演变及驱动力分析[J]. 干旱区研究, 2022, 39(1): 258-269.

DOI

[Sun Guili, Lu Haiyan, Zheng Jiaxiang, et al. Spatio-temporal variation of ecological vulnerability in Xinjiang and driving force analysis[J]. Arid Zone Research, 2022, 39(1): 258-269.]

DOI

文章导航

/