Biology and Environment

Remote sensing extraction of jujube planting area in Xinjiang based on RF classification optimization and SNIC clustering

  • Guobing ZHAO , 1, 2 ,
  • Jianghua ZHENG 1, 3 ,
  • Lei WANG , 2 ,
  • Jian GAO 2 ,
  • Lei LUO 2 ,
  • TUERXUN Nigela 1 ,
  • Wanqiang HAN 1 ,
  • Jingyun GUAN 1
Expand
  • 1. College of Geography and Remote Sensing Sciences, Xinjiang University, Urumqi 830046, Xinjiang, China
  • 2. Institute of Modern Forestry, Xinjiang Academy of Forestry Sciences, Urumqi 830063, Xinjiang, China
  • 3. Xinjiang Key Laboratory of Oasis Ecology, Urumqi 830046, Xinjiang, China

Received date: 2023-07-23

  Revised date: 2023-10-07

  Online published: 2026-03-11

Abstract

This study aims to efficiently extract the distribution information and planting area of jujube crops in Xinjiang, China, providing essential data support for predicting yield and price, consolidating poverty alleviation achievements, and aiding rural revitalization. Utilizing the Google Earth Engine cloud platform, this research accesses Sentinel-1 radar images, Sentinel-2 optical images, and SRTM terrain data covering Xinjiang. From these data, 44 features including spectral, textural, and terrain attributes are extracted, followed by a feature selection process. The optimized random forest classifier, after hyperparameter tuning, produces a spatial distribution map of Xinjiang’s jujube planting areas with a 10 m resolution for the year 2021. Superpixel clustering method further processes the major jujube planting areas to determine the exact planting extents. The findings are as follows: (1) Employing a simple non-iterative clustering algorithm for classification and post-processing, the identified jujube cultivated area in Xinjiang spans 4253 km², predominantly located in the southern regions of Aksu, Kashgar, Hotan Prefectures, and Bayingolin Mongol Autonomous Prefecture, as well as Turpan and Hami Cities in the east. (2) The accuracy of feature extraction is significantly enhanced through hyperparameter optimization of the random forest classifier, yielding an average overall classification accuracy of 0.86, a Kappa coefficient of 0.82, a producer accuracy for jujube extraction of 0.87, and a user accuracy of 0.80, as assessed via the confusion matrix. (3) Features from the Sentinel-1 polarization band are crucial for jujube information extraction, supplemented effectively by spectral and textural features. Leveraging multisource remote sensing data, this method facilitates rapid acquisition of distribution and area data for jujube planting in Xinjiang, markedly benefiting agricultural modernization, resource conservation, and regional economic development.

Cite this article

Guobing ZHAO , Jianghua ZHENG , Lei WANG , Jian GAO , Lei LUO , TUERXUN Nigela , Wanqiang HAN , Jingyun GUAN . Remote sensing extraction of jujube planting area in Xinjiang based on RF classification optimization and SNIC clustering[J]. Arid Land Geography, 2024 , 47(6) : 1004 -1014 . DOI: 10.12118/j.issn.1000-6060.2023.382

红枣作为一种卫生部批准的药食兼用品种,在中国的食品供应和水果出口贸易中扮演着重要角色,其丰富的营养和药用价值备受关注[1]。因此,准确把握果树种植区的空间分布及种植面积信息对于促进社会经济的发展和实现乡村振兴至关重要。
卫星遥感数据由于其广泛覆盖、丰富光谱信息和较强周期性已成为监测红枣的重要手段[2]。随着遥感技术的进步和云计算平台(如Google Earth Engine,简称GEE)的应用,遥感解译的精度和效率得到了显著提升。国内科学研究人员已在GEE平台上开展了许多遥感科学研究。例如,徐晗泽宇等[3]利用GEE平台,针对赣南地区的柑橘果园,采用随机森林算法进行植被提取,准确率达到93.15%,证明了GEE平台可以有效处理和挖掘大规模遥感影像数据;乔海浪[4]在GEE平台上利用NDVI时间序列重建了桉树分布信息并得到了认证。这些研究结果表明云计算技术推动了遥感技术的广泛应用,提供了快速高效提取大面积植被信息的新方法。
尽管已有部分研究利用GEE平台的MODIS、Landsat、Sentinel数据对区域进行时空演变、土地利用和物种提取分析[5-6],但在省域及更大范围内结合云平台进行红枣树提取的研究相对较少。在红枣面积提取方面,一些研究使用MODIS和GF影像数据,但MODIS影像数据空间分辨率较低,容易产生混合像元;而GF影像数据分辨率较高,但研究区域多限定在县级尺度[7],难以覆盖全疆进行面积快速提取,同时无法完整展现全疆红枣空间信息分布特征[8]
本研究利用GEE云平台,结合Sentinel-1和Sentinel-2影像数据,构建多源特征,并采用机器学习算法对新疆红枣面积进行提取,定量估算研究区红枣种植面积,分析新疆红枣的空间分布规律。此举不仅有效避免了大尺度人工监测枣树成本高、传统遥感监测运算能力弱等问题,而且提高了红枣空间分布提取的准确性,兼顾了运算效率及成本。因此,该研究对于新疆红枣产业的发展和预测可提供重要的决策支持。

1 研究区概况

新疆维吾尔自治区,简称“新疆”(图1),地理位置介于73°40′~96°18′E,34°25′~48°10′N之间,地处亚欧大陆腹地,新疆总面积占据中国陆地面积的1/6,是中国陆地面积第一大的省级行政区[9]。由于其特殊的地理环境,新疆是哈密瓜、葡萄、大枣等瓜果的主要产地[10]。在新疆的林果业中,红枣种植业是一项具有突出优势、鲜明特色、广阔前景和巨大潜力的农村经济支柱产业[11]
图1 研究区示意图

注:该图基于国家测绘地理信息局标准地图服务网站下载的审图号为GS(2019)3333号的标准地图制作,底图边界无修改。下同。

Fig. 1 Schematic diagram of the study area

2 数据与方法

2.1 影像数据集及预处理

本研究使用了GEE平台进行遥感数据处理与调用,所有数据处理和调用的代码均在线编写(表1)。研究结果显示,将Sentinel-1(S1)雷达数据和Sentinel-2(S2)光学数据融合可以有效提高分类精度[12]。此外,针对新疆山脉与盆地相间的地理环境,为了提高红枣种植区域的分类精度,引入了地形特征,SRTM是美国奋进号航天飞机用雷达测图技术获取的陆地地表数据,它提供了数字高程模型(Digital elevation model,DEM),用于描述地球表面各个点的高度信息。本研究所选取的影像都经过了2020年新疆行政边界(来源于国家基础地理信息数据库)的裁剪处理。
表1 影像数据

Tab. 1 Image data

影像数据集 选取数据 预处理 目的
Sentinel-1(S1) 选取干涉模式为IW,极化方式为VV+VH,时间为 2021-06-01至2021-08-01,共108景 标定轨道参数、边界噪音去除、去除热噪声、辐射定标、地形校正等,最终得到数据产品的空间分辨率为10 m 选用后向散射系数VV和VH作为独立波段参与特征构建
Sentinel-2(S2) 选取Level-2A产品数据,时间为 2021-06-01至2021-08-01,共2018景 辐射定标、几何校正、大气校正等,空间分辨率为10 m;其中QA60波段用来去云 提取原始12个波段并计算22个指数特征,基于Sentinel-2的B8近红外波段生成4种主要的纹理特征
SRTMGL1_003 空间分辨率为30 m 使用resample函数进行重采样,并用reproject函数将分辨率调整至10 m 计算4种常用的地形特征
生育期是进行作物识别的关键信息,通常情况下,利用关键生育期的影像进行作物分类更加高效实用[13];6—8月是枣树生长最旺盛的时期,同样也是利用遥感影像提取枣树种植面积的最适宜时期[14],能更好地区分枣树和其他地物(如:水田、耕地等),此次影像的选取保证了影像的光谱差异性和完整性。

2.2 样本数据及验证数据

在分类过程中,样本的选取至关重要。根据实际地类分布情况,本研究将研究区的土地覆盖类型划分为7个类别,包括水体(湖泊、河流等)、裸地(少植被的裸露地区)、人工地表(建筑物、道路等人工结构区域)、耕地(种植棉花、水稻、辣椒、小麦等农作物的地区)、红枣、雪地及其他植被,基于新疆区划矢量边界,根据分散、随机的原则通过目视在影像上选择目标样本,并根据Sentinel影像数据的获取时间,对于影像中的样本点,采用目视判读的方式在Google earth高清时序影像中进行逐点判定,其影像最高空间分辨率可达0.3 m,满足选取样本的准确性。此外,通过2021年7月实地采集到了南疆各地红枣以及其他植被样本数据共1973个。综上,共获得样本数量5293个(表2)。另外,将混淆矩阵作为最终分类结果可靠性的评价手段之一,并2021年野外调查矢量数据与本次实验所提取的红枣地块作对比。
表2 样本数据

Tab. 2 Sample data

地类代码 地类名称 样本数量/个
0 水体 180
1 裸地 456
2 人工地表 308
3 耕地 1356
4 红枣 1363
5 雪地 300
6 其他植被 1330
总计 5293

2.3 研究方法

2.3.1 技术流程

研究利用GEE云平台,对覆盖新疆全境的S1、S2和SRTM数据进行快速获取与处理,基于以上数据进行特征构建,采用随机森林机器学习算法进行了分类,并对各种分类特征的重要性进行评价,运用SNIC超像素聚类对各个典型种植区进行分类后处理,得到新疆2021年红枣面积与分布结果。基于混淆矩阵利用野外调查数据对提取结果进行精度验证,并与新疆2021年统计年鉴中的红枣种植面积数据进行对比,具体技术路线如下图(图2)。
图2 技术路线图

Fig. 2 Technology route diagram

2.3.2 特征优选

特征提取是遥感分类的重要步骤之一,使用多种变量特征进行组合,可以有效提高遥感分类精度[15]。本研究通过利用有效数据构建了44种特征变量(表3),基于序列前向选择算法,首先,将构建的特征变量全部加入特征子集X中,根据特征变量的贡献程度依次从高到低排列,然后,将特征子集X从空集开始,由高到低依次选择一个特征x加入特征子集X,在添加特征变量时,直至分类精度曲线初次达到最高值,即可停止添加特征变量,使得特征函数J(X)最优,此时的特征变量集合即为最佳特征子集。
表3 参与分类的特征

Tab. 3 Features involved in classification

简称 分类特征 简称 分类特征
B1 气溶胶 LSWI812 地表水分指数B8&B12
B2 MNDWI 改进的归一化水指数
B3 绿 EVI 增强植被指数
B4 RVI 比值植被指数
B5 红边1 DVI 差值植被指数
B6 红边2 GCVI 绿色叶绿素植被指数
B7
B8
B8A
B9
B11
B12
NDVI
NDWI
LSWI811
红边3
近红外
红边4
水蒸气
短波红外1
短波红外2
归一化植被指数
归一化水体指数
地表水分指数B8&B11
REP
SAVI
NIRv
CIg
LSWI8A11
LSWI8A12
B8_asm
B8_contrast
B8_corr
红边位置指数
调节土壤亮度植被指数
新型植被指数
叶绿素绿光植被指数
地表水分指数B8A&B11
地表水分指数B8A&B12
二阶矩
相关性
对比度
NDTI
MNDVI
MTCI
NDRE1
NDRE2
CIr
NDBI
归一化差异耕作指数
修正型归一化植被指数
地面叶绿素指数
归一化差异红边1
归一化差异红边2
红边叶绿素指数
归一化建筑指数
B8_entropy
VV
VH
Slope
Aspect
Elevation
Hillshade

垂直极化
垂直-水平极化
坡度
坡向
海拔高度
山体阴影
(1) 光谱特征。在预处理后的S2光学影像集合中,提取12个原始波段的特征,并计算在植被指数研究中常用的22个指数(表3),包括:归一化植被指数(NDVI)、地面叶绿素指数(MTCI)、归一化水体指数(NDWI)、地表水分指数(LSWI)、归一化差异耕作指数(NDTI)、红边位置指数(REP)等[16-18],这些指数被视为独立的光谱波段,参与分类任务。
(2) 纹理特征。灰度共生矩阵(GLCM)是由Haralick[19]提出,因其具有简单易实现、适应能力强和具有鲁棒性的特点,在遥感影像提取纹理特征时得到广泛应用。本研究基于Sentinel-2的B8近红外波段,选取GLCM灰度共生矩阵生成4种主要的纹理特征,包括角二阶矩(ASM)、相关性(CORR)、对比度(CON)、熵(ENTROPY),计算公式如下:
A S M = i = 0 k - 1   j = 0 k - 1   M ( i ,   j ) 2
C O R R = i = 0 k - 1   j = 0 k - 1   ( i - μ ) ( j - μ ) M ( i ,   j ) 2 σ
C O N = i = 0 k - 1   j = 0 k - 1   M ( i ,   j ) ( i - j ) 2
E N T R O P Y = i = 0 k - 1   j = 0 k - 1   M ( i ,   j ) × l n   M ( i ,   j ) 4
μ = i = 0 k - 1   i j = 0 k - 1   M ( i ,   j )
σ = i = 0 k - 1   i = 0 k - 1   M ( i ,   j ) × ( i - μ ) 2
式中: k为B8波段图像的灰度级数; M ( i ,   j )为基于B8波段图像生成的灰度共生矩阵; i j分别为灰度级别的索引; μ为均值; σ为方差。分别选择GLCM算法的纹理特征邻域值为4、8和16。其中,邻域值为4时,能够更明显地展现地物细节。这是因为新疆地区的地块像素变化不规律,当选择较大的邻域值时,计算将会加入更多周围像素,其纹理特征的细节表现会更粗糙。
(3) S1极化波段特征。Sentinel-1的极化方式分为单极化方式(HH或VV)和双极化方式(HH+HV或VV+VH),数据模式包括SM、IW、EW和WV。相关研究表明[20],IW模式适用于陆地表面的遥感研究,特别是VV与VH极化,本研究选用后向散射系数VV和VH作为独立波段参与特征构建。
(4) 地形特征。枣树的种植通常也受地形因素的限制,加入地形相关参数能提高分类精度。通过调用GEE平台中的SRTMGL1_003数据,计算4种常用的地形特征:坡度(Slope)、坡向(Aspect)、海拔高度(Elevation)及山体阴影(Hillshade),这4种特征将作为独立波段参与特征空间构建。

2.3.3 分类算法

随机森林(RF)是一种多决策树集合分类的监督分类法[21]。随机森林方法在遥感影像分类中具有良好的抗噪性能,可以有效避免决策树的过拟合,且无需进行决策树的剪枝操作,从而减轻了计算负担,适用于多类别与多特征[22]。以高空间分辨率影像进行分类时,在支持向量机、分类回归树、朴素贝叶斯、随机森林等分类器中,随机森林分类效果更好,优势更明显[23-24]
提高机器学习模型准确性的最佳做法是调整不同的参数,此次分类对随机森林算法进行超参数调优[25]。参数的设置是以编程方式尝试一系列值,先选择对应精度最高的参数值,并在精度相同的条件下选择尽可能小的值,从而获得最高的效率与准确性[26]。经反复调试分析(图3),调整随机森林参数中树数为150,为了综合考虑精度、统计数据误差和计算效率,在红枣种植信息提取过程中采取了一些措施:首先,我们将最大叶节点数设为无限制,以确保不会限制分类结果的复杂性。其次,我们将分割节点的特征数量设定为输入特征总数的平方根,这样可以在保持有效性的同时减少计算负担,这些措施有助于提高红枣提取的效果。
图3 参数调整

Fig. 3 Parameter tuning

2.3.4 面积统计方法

在此次红枣种植面积的统计过程中,因GEE平台计算能力的限制,无法一次性全部计算出结果,因此,采用分区统计的方法,挑选分类结果影像中典型红枣种植区进行小面积区域划分,从而计算红枣种植面积。
基于像元的随机森林分类结果图中会存在诸多的独立噪声点,为去除图像噪声,可采用分类后处理方法来更完整地展示分类结果。简单线性迭代聚类(Simple linear iterative clustering,SLIC)是使用较为广泛的超像素分割算法,在其基础上,简单非迭代聚类(Simple non-iterative clustering,SNIC)作为SLIC算法的改进版本,无需占用大量内存,节省超像素生成时间且精度更高,更适合GEE平台的运行环境[27]
SNIC算法经过参数的调整和优化,图像的分割结果更优。在这个设置中,有3个重要参数需要考虑:紧凑性、连通性和邻域大小。紧凑性参数影响超像素的形状,值越大其生成的超像素越接近方形。连通性参数即在合并周围像素时的连通方向,可选择4方向或8方向。邻域大小代表所生成超像素的最大像素数,这些参数的选择将直接影响超像素分割的结果。在调整参数的基础上,种子点的分布对分割效果的影响也是很大的,即在需要分割精细的地方,种子点应多一些,在同种地物区域较大的地方,种子应少一些,根据区域划分的结果进行参数调整[28]

2.3.5 精度评价方法

本研究将选取的样本数据按照7:3的比例分配训练数据和验证数据,从而评价分类精度。通过使用混淆矩阵评价验证数据的识别结果,并计算得到分类相关的精度指标,分别有生产者精度、用户精度、总体精度和 Kappa系数,这些指标从不同的角度反映了图像分类的准确性。总体精度和Kappa系数用于评估整体的分类准确性,而生产者精度和用户精度用于衡量各类别的遗漏和误判误差。通过这些指标的计算,可以全面评估图像分类的准确性。

3 结果与分析

3.1 精度评价

基于混淆矩阵(表4)计算的平均总体精度为0.86,平均Kappa系数为0.82,红枣的生产者精度为0.87,用户精度为0.80。稀疏耕地和稀疏果树与红枣树具有较为相似的光谱特征和纹理特征,易产生混淆。错分、误分现象主要出现在北疆的伊犁哈萨克自治州直属县市(伊犁州直)、博乐市、塔城市、克拉玛依市、沙湾市,此地种植面积分散,在地图上呈现“零星分布”。
表4 混淆矩阵

Tab. 4 Confusion matrix

预测类别 真实类别
水体 裸地 人工地表 耕地 红枣 其他植被 雪地 总计 用户精度
水体 55 1 1 0 0 0 0 57 0.98
裸地 0 133 7 2 0 0 0 142 0.93
人工地表 1 4 80 0 1 0 0 86 0.90
耕地 0 1 0 380 48 22 0 451 0.87
红枣 0 1 0 29 364 25 0 419 0.80
其他植被 0 1 1 26 47 310 1 386 0.86
雪地 0 2 0 0 0 2 57 61 0.86
总计 56 143 89 437 460 359 58 1602 0.98
生产者精度 0.96 0.94 0.93 0.84 0.87 0.80 0.93 - -
总体精度 0.86 - - - - - - - -
Kappa系数 0.82 - - - - - - - -
随机抽取红枣提取结果进行细节展示,与野外调查数据作对比(图4)。可以看出,基于本文方法提取的红枣地块边界与2022年野外实测矢量数据较为吻合,有较高的准确性。
图4 若羌县局部提取结果对比

Fig. 4 Comparison of local extraction results of Ruoqiang County

3.2 特征对分类的贡献分析

基尼系数可以用来度量节点的杂质,表示一个随机实例被错误分类的频率,因此,基尼系数可以用来评价每个变量的重要性。此次分类共选择了44种特征,从图中直观看出(图5),重要性从大到小排前5的特征依次为Elevation、B8_contrast、REP、VV、B1。整体来看的话,S1雷达特征对于此次分类重要性较大,这说明S1数据的雷达特征在枣树分类提取方面优势明显;重要性从小到大排在前5的特征依次为Hillshade、Aspect、Slope、SAVI、GCVI,说明在此次分类过程中,除了高程外,地形特征对于分类的重要性最小,这可能反映了地物在垂直方向上的差异,因此在分类中起到了重要的区分作用。新疆地域辽阔,作物多处于平坦的地理条件下,这与实际情况相符合;整体特征重要性排序:S1极化波段特征>光谱特征>纹理特征>地形特征。
图5 特征优选

注:图中分类特征简称含义见表3

Fig. 5 Feature optimization

在处理遥感影像进行分类时,特征冗余反而会降低分类精度,因此为了去除冗余特征,特征选择是必要的。特征选择能够对数据做降维处理,在保证运行时间的同时还能达到较高的分类精度,提高模型的性能。基于序列前向选择的方法,44个候选特征最终减少为26个,通过序列前项选择方法,可以去除冗余特征,提高分类器的性能,并获得最优的特征子集。

3.3 空间分布及面积统计

本文基于GEE平台,利用随机森林算法,提取出新疆2021年10 m分辨率红枣的分布区域。从全疆红枣分布图可以看出(图6),种植区聚集性分布在南疆的阿克苏地区、喀什地区、和田地区、巴音郭楞蒙古自治州(巴州)和东疆的吐鲁番市、哈密市等地,与实际情况相符。进一步的县域分析显示,红枣主要集中在巴州地区的若羌县、且末县,阿克苏地区的阿克苏市、库车县、阿瓦提县、温宿县、新和县、沙雅县和阿拉尔市,和田地区的和田县、墨玉县、策勒县、洛浦县和于田县,喀什地区的巴楚县、伽师县、麦盖提县等地,并且呈现出聚集性分布的趋势。这些地区具备适宜红枣种植业发展所需的土地和气候条件。
图6 2021年新疆红枣空间分布

Fig. 6 Spatial distribution of jujube in Xinjiang in 2021

新疆2021年统计年鉴(https://navi.cnki.net/knavi/yearbooks/YXJTJ/detail)显示,新疆红枣种植面积约为4452.25 km2。观察此次GEE分类结果,北疆的伊犁州直、昌吉回族自治州、克拉玛依市、塔城市等地区红枣的分布较为分散,在地图上呈现为“零星分布”,并且出现噪声现象相对严重,统计结果不佳,因此对于北疆极少的红枣种植面积,本研究对其忽略,提取的红枣分布结果主要围绕南疆和东疆,提取的种植面积为4253 km2,忽略北疆地区相对南疆极少的红枣种植区分布,相对误差约为5%;此次通过GEE遥感监测方法提取的结果其年份为2021年,而年鉴所记录的数据年份为2020年,由于市场管理水平以及监测手段的差异,各地上报的数据可能发生各种变动,因此二者存在的误差在合理范围内(表5)。
表5 分区统计

Tab. 5 Partition statistics

地区 细分 面积/km2 地区 细分 面积/km2
巴音郭楞
蒙古自治州
(若羌县)
若羌镇 71 喀什
地区
巴楚县 257
瓦石峡镇 62 伽师县 242
米兰镇 35 麦盖提县 297
- - 泽普县 96
巴音郭楞
蒙古自治州
(且末县)
且末镇 165 疏附县 140
塔提让镇 岳普湖县 144
阿热勒镇 疏勒县 191
- 喀什市 106
巴音郭楞
蒙古自治州
其余地区
- 150 叶城县 -
和田地区 皮山县 107 - -
墨玉县 172 阿克苏地区 温宿县 219
和田县 71 新和县 111
和田市 19 阿克苏市 200
洛浦县 86 阿拉尔市 238
策勒县 62 库车县 209
于田县 88 沙雅县 161
民丰县 14 阿瓦提县 174
- - - -
吐鲁番市 托克逊县 51 哈密市 - 234
高昌区 57 北疆 - -
鄯善县 24 - - -
- - - 共计 4253

注:“-”表示此处内容省略。

对于哈密市,GEE提取结果为234 km2,统计年鉴显示结果为73 km2,误差较大,经过分析,有2个原因导致,第一个是由于此次分类的红枣样本点分布在南疆周围,而对于哈密市和吐鲁番市的样本点较少,因此对于哈密市的分类结果误差较大;第二个是哈密市的红枣品种与南疆具有较大差别,哈密大枣在红枣家族中是一个相对独立的优良品种,因此可能导致哈密市分类结果误差较大,后续仍需深入研究。

4 讨论

4.1 云计算平台

GEE云平台在云端处理数据,相比本地处理数据的优势很明显,但是也存在着一些问题:平台每秒提供给用户的访问次数有限,在导出数据时会产生超时错误并且不会及时提醒。另外,云平台需要稳定的网络支持,当网络状况不佳时运算会受到影响,并且目前提供的遥感数据主要是国外开放获取的,国内诸多数据源还未开放。另外,在使用GEE平台的免费资源时,其算力并非无限制,对大区域且高分辨率的分析过程中,会提示计算超时、计算能力超限或浏览器崩溃等异常,希望随着平台的后续改进,能够逐渐完善这些问题。

4.2 不确定性分析

(1) 随机森林分类器产生的分类结果具有不确定性,算法中的每个决策树模型都是基于随机抽取的样本数据和特征量进行构建的,每次计算的结果和数值均在发生小幅度变化(数值误差维持在1%以内)。
(2) 采样过程会受到人为主观因素以及环境的影响,因此会对分类器造成干扰,影响分类精度。对于出现噪声现象较为明显的地区,采用基于SNIC超像素聚类的方法可以将每个聚类中的多数值替换分类值,但在设置种子点的分布以及调整参数时存在人为因素。为了进一步提取,可以划分区域,结合新疆各地域植被作物差异,因地制宜,用GEE针对小区域结合面向对象、尺度分割的方法作对比[29]
(3) “同物异谱”和“异物同谱”现象会对分类精度造成重要影响,在分类后的混淆矩阵中可以看出,耕地与其他植被容易对红枣产生混分,并且稀疏林地和稀疏灌丛相比枣地在影像上具有较为相似的光谱特征和纹理特征,易产生混淆,产生误分、漏分现象。此次红枣种植区域的提取只是选择了6—8月中的单期影像,之后进一步的研究可以运用植被指数阈值进行长时间序列监测。

4.3 特征对精度的影响分析

在特征选择方面,要充分利用可以获取的遥感数据进行分类特征的选择。本研究综合多源特征,发现S1数据极化特征及红枣种植区域的纹理特征在红枣提取方面效果显著。在不同情况下使用少量特征即可完成分类,但要求所选特征能够有效地区分不同类别,从而避免分类在高维特征空间中进行,减少分类特征之间产生多重共线性的可能。在之后的研究可以由不同的数据源来加入更多的分类特征,对比分类精度的变化。

5 结论

(1) 在红枣信息提取的过程中,S1的雷达后向散射系数特征占据重要的地位,光谱特征和纹理特征次之,前5名的特征分别为Elevation、B8_contrast、REP、VV、B1,对红枣种植区的信息提取具有重要作用。
(2) 随机森林算法在红枣种植区提取中具有很好的效果,通过超参数调优,能够高效的找出最佳参数,在保证效率的同时也提升了精度,并且使用SNIC超像素聚类进行分类后处理,能够有效克服由错误分类导致的椒盐噪声,从而去除局部突兀点。
(3) 新疆红枣种植分布呈现聚集性趋势,主要种植地皆分布在南疆的喀什地区、阿克苏地区、和田地区和巴音郭楞蒙古自治州,以及东疆的吐鲁番市、哈密市。
[1]
Tiecheng B, Nannan Z, Mercatoris B, et al. Jujube yield prediction method combining Landsat 8 vegetation index and the phenological length[J]. Computers and Electronics in Agriculture, 2019, 162: 1011-1027.

DOI

[2]
徐翔燕, 侯瑞环, 牛荣. 基于GF-1号的红枣种植面积提取方法[J]. 塔里木大学学报, 2019, 31(3): 32-38.

[Xu Xiangyan, Hou Ruihuan, Niu Rong. Extraction method of Chinese jujube planting area based on GF-1[J]. Journal of Tarim University, 2019, 31(3): 32-38.]

[3]
徐晗泽宇, 刘冲, 王军邦, 等. Google Earth Engine平台支持下的赣南柑橘果园遥感提取研究[J]. 地球信息科学学报, 2018, 20(3): 396-404.

DOI

[Xu Hanzeyu, Liu Chong, Wang Junbang, et al. Study on extraction of citrus orchard in Gannan region based on Google Earth Engine platform[J]. Journal of Geo-information Science, 2018, 20(3): 396-404.]

[4]
乔海浪. 基于NDVI时间序列重构的经济型人工林时空分布信息提取研究[D]. 北京: 中国科学院大学(中国科学院遥感与数字地球研究所), 2017.

[Qiao Hailang. The extraction of spatial and temperal information of economic man-made forests based on NDVI time series[D]. Beijing: University of Chinese Academy of Sciences (Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences), 2017.]

[5]
Li R, Fang P, Xu W, et al. Classifying forest types over a mountainous area in southwest China with Landsat data composites and multiple environmental factors[J]. Forests, 2022, 13(1): 135, doi: 10.3390/f13010135.

[6]
美合日阿依·莫一丁, 买买提·沙吾提, 李金朝. 基于Sentinel-2时间序列数据及物候特征的棉花种植区提取[J]. 干旱区地理, 2022, 45(6): 1847-1859.

[Moyidin Mihray, Sawut Mamat, Li Jinzhao. Extraction of cotton planting area based on Sentinel-2 time series data and phenological characteristics[J]. Arid Land Geography, 2022, 45(6): 1847-1859.]

[7]
沈江龙, 郑江华, 尼格拉·吐尔逊, 等. 若羌绿洲特色林果种植信息遥感提取方法适用性分析[J]. 中国农业资源与区划, 2022, 43(2): 206-219.

[Shen Jianglong, Zheng Jianghua, Tuerxun Nigela, et al. Applicability analysis of remote sensing extraction method for planting information of characteristic forest fruit in Ruoqiang oasis[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2022, 43(2): 206-219.]

[8]
王来刚, 郭燕, 贺佳, 等. 遥感数据辅助下县域耕地质量评价与空间分布研究[J]. 中国农业资源与区划, 2022, 43(12): 137-146.

[Wang Laigang, Guo Yan, He Jia, et al. Cultivated land quality evaluation and spatial distribution in Anyang County supported by remote sensing data[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2022, 43(12): 137-146.]

[9]
杨梅花, 程锦涛, 郭佳星, 等. 新疆城市规模分布与自然地理相关性分析[J]. 干旱区地理, 2022, 45(6): 1958-1967.

[Yang Meihua, Cheng Jintao, Guo Jiaxing, et al. Correlation analysis of urban scale distribution and physical geography in Xinjiang[J]. Arid Land Geography, 2022, 45(6): 1958-1967.]

[10]
李金叶, 袁强, 蒋慧. 基于区域适应性的特色林果业发展探讨[J]. 新疆农业科学, 2010, 47(4): 741-749.

[Li Jinye, Yuan Qiang, Jiang Hui. A discussion on development of featured forestry and fruit growing based on the regional adaptability[J]. Xinjiang Agricultural Sciences, 2010, 47(4): 741-749.]

[11]
李曦光, 王蕾, 刘平, 等. 基于MaxEnt模型的新疆红枣生态适宜性与区划分析[J]. 新疆农业科学, 2020, 57(10): 1785-1791.

DOI

[Li Xiguang, Wang Lei, Liu Ping, et al. Study on ecological suitability and regionalization of Xinjiang jujube based on MaxEnt model[J]. Xinjiang Agricultural Sciences, 2020, 57(10): 1785-1791.]

DOI

[12]
马战林, 刘昌华, 薛华柱, 等. GEE环境下融合主被动遥感数据的冬小麦识别技术[J]. 农业机械学报, 2021, 52(9): 195-205.

[Ma Zhanlin, Liu Changhua, Xue Huazhu, et al. Identification of winter wheat by integrating active and passive remote sensing data based on Google Earth Engine platform[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(9): 195-205.]

[13]
王林江, 吴炳方, 张淼, 等. 关键生育期冬小麦和油菜遥感分类方法[J]. 地球信息科学学报, 2019, 21(7): 1121-1131.

DOI

[Wang Linjiang, Wu Bingfang, Zhang Miao, et al. Winter wheat and rapeseed classification during key growth period by integrating multi-source remote sensing data[J]. Journal of Geo-information Science, 2019, 21(7): 1121-1131.]

[14]
张学艺, 戴小笠, 张玉兰, 等. 用EOS/MODIS-NDVI监测枣树生长状况的分析[J]. 宁夏大学学报(自然科学版), 2012, 33(2): 201-204.

[Zhang Xueyi, Dai Xiaoli, Zhang Yulan, et al. Study of jujube growth situation to be monitored with EOS/MODIS-NDVI data[J]. Journal of Ningxia University (Natural Science Edition), 2012, 33(2): 201-204.]

[15]
熊皓丽, 周小成, 汪小钦, 等. 基于GEE云平台的福建省10 m分辨率茶园专题空间分布制图[J]. 地球信息科学学报, 2021, 23(7): 1325-1337.

DOI

[Xiong Haoli, Zhou Xiaocheng, Wang Xiaoqin, et al. Mapping the spatial distribution of tea plantations with 10 m resolution in Fujian Province using Google Earth Engine[J]. Journal of Geo-information Science, 2021, 23(7): 1325-1337.]

[16]
Yelu Z, Dalei H, Alfredo H, et al. Optical vegetation indices for monitoring terrestrial ecosystems globally[J]. Nature Reviews Earth & Environment, 2022, 3(7): 477-493.

[17]
敖登, 杨佳慧, 丁维婷, 等. 54种植被指数研究进展综述[J]. 安徽农业科学, 2023, 51(1): 13-21, 28.

[Ao Deng, Yang Jiahui, Ding Weiting, et al. Review of 54 vegetation indices[J]. Anhui Agricultural Sciences, 2023, 51(1): 13-21, 28.]

[18]
Jinru X, Baofeng S. Significant remote sensing vegetation indices: A review of developments and applications[J]. Journal of Sensors, 2017: 1-17, doi: 10.1155/2017/1353691.

[19]
Haralick R M. Statistical and structural approaches to texture[J]. Proceedings of the IEEE, 1979, 67(5): 786-804.

[20]
Vizzari M. PlanetScope, Sentinel-2, and Sentinel-1 data integration for object-based land cover classification in Google Earth Engine[J]. Remote Sensing, 2022, 14(11): 2628, doi: 10.3390/rs14112628.

[21]
Zhao Y, Zhu W, Wei P, et al. Classification of Zambian grasslands using random forest feature importance selection during the optimal phenological period[J]. Ecological Indicators, 2022, 135: 108529, doi: 10.1016/j.ecolind.2021.108529.

[22]
Agarwal S, Nagendra H. Classification of Indian cities using Google Earth Engine[J]. Journal of Land Use Science, 2019, 14(4-6): 425-439.

DOI

[23]
马玥, 姜琦刚, 孟治国, 等. 基于随机森林算法的农耕区土地利用分类研究[J]. 农业机械学报, 2016, 47(1): 297-303.

[Ma Yue, Jiang Qigang, Meng Zhiguo, et al. Classification of land use in farming area based on random forest algorithm[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(1): 297-303.]

[24]
何昭欣, 张淼, 吴炳方, 等. Google Earth Engine支持下的江苏省夏收作物遥感提取[J]. 地球信息科学学报, 2019, 21(5): 752-766.

DOI

[He Zhaoxin, Zhang Miao, Wu Bingfang, et al. Extraction of summer crop in Jiangsu based on Google Earth Engine[J]. Journal of Geo-information Science, 2019, 21(5): 752-766.]

[25]
Pelletier C, Valero S, Inglada J, et al. Assessing the robustness of random forests to map land cover with high resolution satellite image time series over large areas[J]. Remote Sensing of Environment, 2016, 187: 156-168.

[26]
Loukika K N, Keesara V R, Sridhar V. Analysis of land use and land cover using machine learning algorithms on Google Earth Engine for Munneru River Basin, India[J]. Sustainability, 2021, 13(24): 13758, doi: 10.3390/su132413758.

[27]
Tassi A, Vizzari M. Object-oriented LULC classification in Google Earth Engine combining SNIC, GLCM, and machine learning algorithms[J]. Remote Sensing. 2020, 12(22): 3776, doi: 10.3390/rs122-23776.

[28]
孙玮婕, 杨军. 改进的简单非迭代聚类的遥感影像分割研究[J]. 计算机工程与应用, 2021, 57(13): 185-192.

DOI

[Sun Weijie, Yang Jun. Research on remote sensing image segmentation based on improved simple non-iterative clustering[J]. Computer Engineering and Applications, 2021, 57(13): 185-192.]

DOI

[29]
黄文静, 蔡兴航, 张严磊, 等. 基于面向对象分类法的陕西佳县大枣种植面积提取研究[J]. 中国中药杂志, 2019, 44(19): 4116-4120.

[Huang Wenjing, Cai Xinghang, Zhang Yanlei, et al. Research on extraction of Zizyphus jujuba planting area in Jia County of Shaanxi[J]. China Academy of Chinese Medical Sciences, 2019, 44(19): 4116-4120.]

Outlines

/