南方地区复杂条件下的耕地面积遥感提取方法
1.
2.
3.
Method of Remote Sensing Extraction of Cultivated Land Area under Complex Conditions in Southern Region
1.
2.
3.
通讯作者:
收稿日期: 2019-10-16 修回日期: 2020-07-21 网络出版日期: 2020-11-26
基金资助: |
|
Received: 2019-10-16 Revised: 2020-07-21 Online: 2020-11-26
作者简介 About authors
牟昱璇(1993-),女,新疆乌鲁木齐人,硕士研究生,主要从事农业遥感和生态遥感研究E⁃mail:
关键词:
Keywords:
本文引用格式
牟昱璇, 邬明权, 牛铮, 黄文江, 杨尽.
Mu Yuxuan, Wu Mingquan, Niu Zheng, Huang Wenjiang, Yang Jin.
1 引 言
耕地与粮食安全密切相关,是人类生存发展的重要基础资源[1-2]。及时准确的耕地信息,是农业发展与调控的重要科学依据,具有重要意义[3-5] 。国内外专家学者对耕地分类提取方法已有大量研究,大多为基于像元的、以统计识别函数为基础、依据典型样本训练方法进行的监督分类,包括最大似然法、决策树分类法等方法,Lewisgonzales[6]利用最大似然法对非洲撒哈拉沙漠以南地区进行耕地识别;王连喜等[7]利用决策树基于物候信息提取了宁夏复种指数;Gong等[8]利用随机森林分类器分类制作全球土地利用覆盖产品,但是在我国南方地区精度只有72.9%。上述基于像元的方法存在同一地块可能会被分成不同类型的问题,同时基于像元的决策树分类方法需要人工确定阈值,方法适应性差。
我国南方地区由于植被丰富、地类信息繁多,无论是基于像元的还是面向对象的耕地提取方法,都容易受到影像同物异谱、同谱异物等现象的影响[17],仅用单一方法、单一数据难以满足复杂条件下耕地信息的提取[18],导致识别精度较低。如由于耕地种植作物的种类繁多,不同生长阶段的作物,往往会体现不同的物候和光谱特征,导致耕地光谱特性差异大,难以识别[19]。特别是南方耕地果树较多,不同种植期的果树由于栽种期的不同,导致同一类型果树光谱和纹理特征都有明显的差异。因此,需要融合多源数据才能获得较好的效果,特别是Sentinel-2A卫星等新型卫星设置了专门提取农作物类型的波段,为解决复杂条件下的耕地提取问题提供了新的数据基础[20]。然而,Sentinel-2A等新型卫星数据与其他数据融合,特别是在数据融合基础上,将CART决策树自动分类和面向对象方法结合的,对复杂地区耕地识别还鲜有研究。针对上述问题,以广西隆安县与武鸣县地区为研究区,采用Sentinel-2A影像和DEM与归一化植被(NDVI)指数组成的多源数据,提出一种面向对象和CART决策树结合的复杂条件下耕地面积遥感提取方法,通过面向对象的分割提取光谱、形状、纹理等特征信息,利用CART决策树自动建立分类规则进行耕地提取研究。
2 研究区和数据预处理
2.1 研究区域概况
研究区位于隆安县与武鸣县,两县相邻,如图1,地理坐标分别为107°21′~108°6′ E,22°51′~23°21′ N,22°59′~23°33′ N、107°49′~108°37′E。两县土地总面积共5 653.65 km2,土地利用类型主要有耕地、林地、建设用地和其他用地;主要农作物有水稻、玉米以及香蕉、火龙果、柑橘等;水稻、玉米等农作物每年种植两季,其中第二季种植的农作物在每年10~11月成熟收获。水果从产果到收获时间大部分在4~11月之间。
图1
2.2 数据获取及预处理
2.2.1 遥感数据及预处理
采用欧空局数据中心下载的Sentinel-2A数据,红绿蓝和近红外4个10 m空间分辨率的波段。选取能够覆盖研究区日期为2018年10月3日的高质量影像,云量为10%以下。利用ENVI软件对影像进行投影转换、镶嵌和裁剪。
2.2.2 验证样本数据
验证样本由实地采集数据与目视解译数据两部分组成,耕地验证数据来源于2018年10月在研究区利用GPS采集得到101个耕地样本数据,其他3种地类验证样本在高分影像上通过目视解译选取。样本共计541个点,其中耕地样本101个,林地253个,建设用地98个,水体89个。
3 研究方法
主要以Sentinel-2A数据和DEM数据构建的多源数据,提出了一种面向对象和 CART决策树结合的复杂条件下的耕地面积遥感提取方法。利用eCognition对Sentinel-2A、DEM与NDVI组成的多源数据集进行面向对象的分割,综合考虑各类特征将研究区分割成相对同质的对象地块,选取训练样本,以地块为单位,利用CART工具自动构建决策树,实现耕地面积的面向对象提取,最后利用地面调查数据进行精度评价,并对比分析了利用面向对象的CART决策树分类法和未入面向对象分割的CART决策树分类法的提取效果。技术流程如图2所示。
图2
3.1 多源数据集构建
3.2 多尺度分割与最优分割尺度选择
对象异质性
形状异质性
分割尺度的设置是否合适直接影响分割的精确性,也决定了分割后对象的大小和细碎程度;部分地物的光谱特征较为相近,分割尺度选取偏差会造成建设用地、林地和耕地之间的混淆,通常需要根据研究区的实际情况进行多次分割实验。尺度越小,分割得到的单个对象越小,数量越多。根据前期技术路线的调研以及相关文献查阅结果,目前对于面向对象分割的最优尺度数值依赖于反复试验测试[24-25],由于分类的数据、分类的目的不同,所需要的尺度大小也不尽相同,通常分辨率较高的影像适合较小的分割尺度,分辨率较低的影像适合较大的分割尺度;本文研究区影像分辨率较高,耕地细碎,因此使用较小的分割尺度能够精确得将耕地信息分割到同一对象中,利于后期分类,图3是形状因子0.1,紧致因子0.5,分割尺度分别为90、60、30、20的对比图,经过反复对比分析得出,分割尺度为20最适合。
图3
图3
不同分割尺度效果对比
Fig.3
Comparison of the effects of different segmentation scales
3.3 地物特征指标
通过设置波段的权重、分割尺度、形状因子和紧致因子等对影像进行分割并对特征指数计算,特征指数主要包括光谱、纹理、面积、亮度、形状指数、同质性和矩形拟合度。
3.4 CART决策树自动分类
3.4.1 分类原理
CART决策树构成原理是在复杂无规律的数据中建立二分支模型,通过计算Gini系数选择某个属性,将这个属性当做待分类的样本集,并循环将样本集分为两个子集,直到当前待分类样本集被判断为叶节点或是达到分类条件。
基尼系数定义如下:
其中:
CART决策树模型的每一分裂节点的异质性下降程度是该节点是否生成的判定标准,节点异质性越低,杂质含量越少,分类的精度越高[28]。
3.4.2 训练样本选择
CART决策树是监督分类的一种,因此分类前需要选择训练样本。CART算法学习样本集结构如下:
其中:X1,X2,…,Xm称为属性向量(Attribute Vectors),Y称为标签向量(Label Vectors),两者的属性可连续可离散,当Y是连续数值时,称为回归树,是离散值时,称为分类树[29]。相较于传统的决策树,大大减少了人为干扰,自动化程度高,分类效率更高。
采用实地采集的耕地样本与目视解译选取的混合样本建立分类模型。耕地样本包括有作物的耕地、休耕地和已收割的耕地;林地包括除耕地以外的所有植被覆盖区域;水体有湖泊、河流和人工水塘等;道路、居民点和工厂等人工建筑设施统一归类于建设用地。通过面向对象多尺度分割获取的分割对象包含光谱信息和形状等多种特征,利用这些信息通过eCognition软件的CART决策树分类器自动建立分类规则进行分类。
3.4.3 构建决策树
将带有光谱、形状、纹理等特征信息的样本加入CART算法自动提取阈值并分类。由于CART决策树采用贪心算法,在大量属性中选择最优组合构成分类模型,数据的特征变量增加会导致决策规则的改变。因此,本文根据初步分类结果及分类精度采用专家决策的方式对样本进行调整,进一步优化模型,直到满意分类结果和精度;如图4是调整至最优结果的决策树模型,首先利用Band4 NIR提取水体,设置Band3 Red阈值,通过SLOPE区分耕地和林地,以Band1 Blue为阈值,以SLOPE和NDVI为规则,SLOPE阈值区分剩下的林地和耕地,NDVI区分耕地与建设用地。
图4
3.5 精度评价
从541个样本中随机选取2/3样本用来建模,剩余1/3样本用于精度评价,采用eCognition软件的混淆矩阵方法对分类结果进行精度评价。
4 结果与分析
4.1 分类结果分析
利用面向对象的CART决策树分类结果如图5(a),分类结果总体精度为96.1,Kappa系数为0.94。采用CART决策树分类的结果如图5(b),总体精度为71.0,Kappa系数为0.40。为了进一步验证,采用清华大学全球2017年分辨率为10 m的土地覆盖产品数据[8]对两种分类方法的结果进行对比,根据广泛查阅各类数据产品结果,目前没有2018年10 m分辨率土地覆盖产品,仅有2017年10 m分辨率Sentinel-2A数据制作的土地覆盖产品,该数据产品与本文实验的时间点以及采用数据精度类型最为接近;2017年至2018年仅差1 a,同一地区1 a内的土地利用变化极小,其中微小变化的误差可忽略不计,因此利用2017年的土地覆盖产品数据能够进行对比说明。表1是本文两种分类方法和土地覆盖产品精度评价结果,均用同一样本进行混淆矩阵评价得到,可以看出,土地覆盖产品数据总体精度为72.9,Kappa系数为0.46。从评价精度来看,本文采用的面向对象的CART决策树在总体精度上最高,在耕地类别提取精度能够达到92.2%。
图5
表1 不同分类方法的耕地分类精度
Table 1
分类方法 | 总体 精度/% | Kappa系数 | 类别 | 生产者精度 /% | 用户精度 /% |
---|---|---|---|---|---|
面向对象的CART决策树分类法 | 96.1 | 0.94 | 耕地 | 92.2 | 93.3 |
建设用地 | 96.2 | 85.3 | |||
林地 | 97.4 | 99.2 | |||
水体 | 96.5 | 99.5 | |||
CART决策树分类法决策树 | 71.0 | 0.40 | 耕地 | 66.5 | 99.8 |
建设用地 | 98.6 | 58.9 | |||
林地 | 99.8 | 19.2 | |||
水体 | 100.0 | 100.0 | |||
土地覆盖产品 | 72.9 | 0.46 | 耕地 | 76.4 | 94.8 |
建设用地 | 49.4 | 50.0 | |||
林地 | 97.6 | 30.2 | |||
水体 | 78.1 | 98.5 |
研究区耕地主要广泛分布在中部平原地带,少量在山谷间分布,这些特征与3种方法分类结果相一致。东西部山谷地带,林地与耕地交错分布,像元较为复杂,图6和图7(c)中可以发现,加入面向对象分割结果明显比无面向对象分割结果以及土地覆盖产品所用随机森林分类法在地类复杂区域效果更好,对其他地类中夹杂的小块耕地能够识别。此外,如图3分割尺度为20的情况下,面向对象的分割能有效识别田坎。田坎在南方耕地中占有相当的数量,其特点是在影像上相对狭窄细小,因此仅通过分析像元难以准确识别 [30]。通过面向对象的分割方法针对耕地对象与田坎对象内部同质性与异质性的特点加以区分并识别出田坎,在选取耕地样本时能够避免田坎被划入耕地类别中,进一步提升了耕地识别的精确性与可信度。
图6
图6
研究区西部林地主导区域分类结果细节对比
Fig.6
A comparative study on the classification results of the leading regional forest land in the western region of the study area
图7
图7
本文分类结果与土地覆盖产品数据以及影像数据的部分区域对比
Fig.7
Comparison of classification results with land cover product data and some regions of image data
4.2 不同方法对比分析
如图7,分别选择实验区中部、南部)和东部3个耕地广泛分布的区域进行对比。可以明显看到,加入面向对象分割的结果对耕地提取效果最好;从影像数据中可以看出,选取的3个区域除耕地以外还包含河流、建设用地、林地,其中林地最易于与耕地混淆,混杂于耕地之中,面向对象的CART决策树分类有效区分耕地与其他地类,尤其是与林地区分的较好;耕地多为整片分布,在结果中也得到了体现,加入面向对象的分割结果不同于其他结果,保持了大面积耕地的完整性,减少破碎,提高整体制图的美观性。
4.3 分类方法讨论
本文采用多源数据,提出的CART决策树与面向对象方相结合的方法,弥补了单一方法使用存在的缺陷[26],在人工提取阈值不便或者地类复杂的情况下具有下述优点:①利用面向对象的分割方法,结合对象尺度,能够克服地物波谱相似、光谱混淆、像元混合严重等问题[21]。②利用CART算法,从多源数据中充分挖掘特征信息并自动建立决策树规则,充分利用特征信息并自动高效的提取阈值[10],解决了因地类复杂人工选取阈值操作繁琐、效率低、不充分的问题。③相比较未采用面向对象方法的CART决策树,能够消除光谱相似性的影像,减少噪声,避免分类结果“椒盐现象”的产生,为后期处理降低难度,缩短了提取制图的时间,提高了耕地信息识别的精确度。
但该方法也存在以下不足:①由于地物具有尺度效应,不同的分割尺度会影响分割对象间的异质性以及形状大小,对分类结果有一定影响,目前对于最优尺度的获取依赖于反复实验与测试,如何高效、快速获取最优尺度是面向对象分割的重要问题。②CART决策树能够充分挖掘数据中潜在的定量与之信息,同时由于其算法以“多数表决”方式选择叶节点中样本数量最多的类别进行标记,会屏蔽小类属性对分类结果的影响。
5 结 论
本文以Sentinel-2A影像、DEM数据及归一化植被指数(NDVI)构成的数据源,采用面向对象的CART决策树分类方法,能够有效提取研究区的耕地信息。通过对比单一CART决策树分类法以及现有土地覆盖产品数据的南方地区部分,发现与传统方法相比,本研究提出的面向对象的CART决策树方法在南方复杂背景下对耕地识别有较大的优势,具体结论如下:
(1)Sentinel-2A数据具有专门提取农作物类型的波段,结合坡度因子和NDVI等辅助信息能够丰富分类特征集,有利于提高分类的精确性。
(2)面向对象所使用的多尺度分割方法在一定程度上减少了“同物异谱,同谱异物”现象的发生,具有其他以像元为单元的分类方法不具备的优越性。
(3)面向对象的分割能有效减少复杂背景对分类带来的影响,结合CART决策树的自动提取阈值,可有效识别南方地区混合在复杂背景中的耕地。本文以广西隆安县、武鸣县为研究区用该方法进行测试,总体精度达到96.1%,耕地制图精度达到92.2%,相比较使用单一CART决策树分类法,有效提高了耕地分类精度。
本文采用多源数据以目标对象为单位挖掘耕地的特征信息,并以自动选取阈值的方法进行分类,得到较好的耕地提取精度,但是缺乏时间维度上的特征信息提高识别的精确性。在今后的工作中考虑采用更多时相数据进行更大范围的特征信息补充并做进一步的研究和讨论。
参考文献
Validation of Synthetic Daily Landsat NDVI Time Series Data Generated by The Improved Spatial and Temporal Data Fusion Approach
[J].
Evaluation of Using Sentinel-1 and -2 Time-series to Identify Winter Land Use in Agricultural Landscapes
[J].
Estimation of Methane Emissions based on Crop Yield and Remote Sensing Data in a Paddy Field
[J].
GeoEye-1 and WorldView-2 Pan-Sharpened Imagery for Object-based Classification in Urban Environments
[J].
Object based Image Analysis and Data Mining Applied to A Remotely Sensed Landsat Time-Series to Map Sugarcane over Large Areas
[J].
Accuracy of Supervised Classification of Cropland in Sub-Saharan Africa
[D].
Decision Tree Classification for Extraction of Ningxia Multiple Cropping Index
[J].
决策树分类提取宁夏耕地复种指数
[J].
Stable Classification with Limited Sample: Transferring a 30 m Resolution Sample Set Collected in 2015 to Mapping 10 m Resolution Global Land Cover in 2017
[J].
Object-oriented Forest Classification of Linzhi County based on CART Decision Tree with Texture Information
[J].
基于纹理信息CART决策树的林芝县森林植被面向对象分类
[J].
Desertification Information Extraction Method Research based on The CART Decision Tree Classification
[J].
基于CART决策树分类的沙漠化信息提取方法研究
[J].
Spatial Pattern Evolution of Abandoned Arable Land Its Influencing Factor in Industrialized Region
[J].
工业化区域撂荒耕地空间格局演变及影响因素分析
[J].
Research on Land Use Classification Monitoring through the Remote Sensing Data of ZY-3 Satellite based on CART Decision Tree
[J].
基于CART决策树的ZY-3卫星遥感数据土地利用分类监测
[J].
Definiens Imaging GmbH: Object-Oriented Classification and Feature Detection
[J].
Method Research on Cultivated Land Extraction based on Object One-class Classification of High-spatial-resolution Image
[J],徐世武
,面向对象的高分辨率影像单值分类耕地提取方法研究
[J].
Object-oriented Farmland Extraction from High Spatial Resolution Imagery
[J].
面向对象的高分辨率影像耕地信息提取
[J].
Based on ICA Object-Oriented Farmland Extraction
[J].
基于ICA面向对象的耕地信息提取
[J].
Extraction of Banana Orchards based on GF-2 Satellite Imagery and Its Accuracy Analysis
[J].
利用高分二号数据提取香蕉林信息及精度分析
[J].
Extraction of Cropland Information based on Multi-temporal TM Images
[J].
基于多时相TM图像的耕地信息提取
[J].
Extraction of Cultivated Land Using Objected-Oriented Classification Method based on MODIS-NDVI Time Series Data
[J].童新华
基于MODIS-NDV I时序数据集的面向对象分类提取广西耕地面积的方法研究
[J].
Monitoring Cotton Root Rot by Synthetic Sentinel-2 NDVI Time Series Using Improved Spatial and Temporal Data Fusion
[J].
Research on Object-oriented Classification Method Assisted with NDVI/DEM in ExtractingCassava:Taking Wuming County for Example
[J].
辅以 NDVI/DEM 的面向对象木薯提取方法研究——以广西壮族自治区武鸣县为例
[J].
Object Recognition and Image Segmentation: The Feature Analyst® Approach
[M].
Optimized Methodology for Classification of Remote Sensing Images based on Object-oriented:Applicatication to the Typical Forest of Milin in Tibet
[J].
基于改进的面向对象遥感影像分类方法研究——以西藏米林县典型林区为例
[J].
An Object-based Approach for Mapping Crop Coverage Using Multiscale Weighted and Machine Learning Methods
[J].
Identifying Rapeseed Planting Area Using an Object-oriented Method and Crop Phenology
[J].
利用物候差异与面向对象决策树提取油菜种植面积
[J].
Extraction of Paddy Field Using Objects-Oriented Fuzzy Classification Approach based on Texture Characteristic
[J].
应用基于纹理的面向对象分类模糊方法提取水田信息
[J].
Study on Crops Remote Sensing Classification based on Multi-Temporal Landsat 8 OLI Images
[J].
基于多时相Landsat 8 OLI影像的农作物遥感分类研究
[J].
Wetland Change Detection based on Object-oriented and CART Decision Tree Method——A Case Study of Wetlands in Longxiang Island
[J].马宇龙, 林志垒
基于面向对象和CART决策树方法的遥感影像湿地变化检测研究——以龙祥岛地区为例
[J].
Application of Texture Enhancement Extraction and Object-oriented High-resolution Image Classification
[D].
纹理增强提取与面向对象结合的高分影像分类的应用
[D].
/
〈 |
|
〉 |
