遥感技术与应用, 2023, 38(1): 163-172 doi: 10.11873/j.issn.1004-0323.2023.1.0163

数据与图像处理

中国南方典型湿润山区植被类型的无人机多光谱遥感机器学习分类研究

张妮娜,1,2, 张珂,1,2,3,4,5, 李运平1,2, 李曦1,2, 刘涛2,1

1.河海大学 水文水资源与水利工程科学国家重点实验室,江苏 南京 210098

2.河海大学 水文水资源学院,江苏 南京 210098

3.长江保护与绿色发展研究院,江苏 南京 210098

4.中国气象局-河海大学水文气象研究联合实验室,江苏 南京 210098

5.水利部水利大数据重点实验室,江苏 南京 210098

Study on Machine Learning Methods for Vegetation Classification in Typical Humid Mountainous Areas of South China based on the UAV Multispectral Remote Sensing

ZHANG Nina,1,2, ZHANG Ke,1,2,3,4,5, LI Yunping1,2, LI Xi1,2, LIU Tao2,1

1.State Key Laboratory of Hydrology-Water Recourses and Hydraulic Engineering,Hohai University,Nanjing 210098,China

2.College of Hydrology and Water recourses,Hohai University,Nanjing 210098,China

3.Yangtze Institute for Conservation and Development,Nanjing 210098,China

4.CMA-HHU Joint Laboratory for Hydrometeorological Studies,Nanjing 210098,China

5.Key Laboratory of Water Big Data Technology of Ministry of Water Resources, Hohai University, Nanjing 210098, China

通讯作者: 张珂(1979-),男,湖北利川人,教授,主要从事水文水资源研究。E⁃mail: kzhang@hhu.edu.cn

收稿日期: 2021-10-27   修回日期: 2022-02-11  

基金资助: 国家自然科学基金项目.  51879067
江苏省杰出青年基金项目.  BK20180022
江苏省“六大人才高峰”高层次人才项目.  NY-004

Received: 2021-10-27   Revised: 2022-02-11  

作者简介 About authors

张妮娜(1997-),女,江苏苏州人,硕士研究生,主要从事遥感水文研究E⁃mail:ninazhang@hhu.edu.cn , E-mail:ninazhang@hhu.edu.cn

摘要

为探究不同机器学习模型在我国南方典型湿润山区的植被类型分类效果,基于无人机遥感影像、实地观测数据、数字高程模型建立遥感特征,选用决策树、随机森林、支持向量机和AdaBoost模型在安徽屯溪流域构建植被类型遥感分类模型;选择总体精度、Kappa系数、均方误差、用户精度和生产者精度等评价指标,分析对比4种机器学习模型在典型小流域的适用性。结果表明:对于林地类型,AdaBoost模型分类精度最高,表明AdaBoost模型在林地分类中有明显的优势;对于非林地类型,模型之间精度差异较大,随机森林模型精度最高;整体而言,4种模型在南方典型湿润山区典型小流域均可获得较好的分类效果,其中AdaBoost模型总体精度为95.55%、Kappa系数为0.9419,均为最高,支持向量机模型表现均最低。地形因子、纹理特征等辅助特征为分类过程提供了重要信息,有助于提高分类精度。

关键词: 无人机遥感 ; 植被分类 ; 机器学习 ; 决策树 ; 随机森林 ; 支持向量机 ; AdaBoost

Abstract

To explore the capabilities of a set of machine learning methods for vegetation classification in typical humid mountainous areas of south China, four types of the machine learning models, including Decision Tree (DT), Random Forest (RF), Support Vector Machine (SVM) and Adaptive Boosting (AdaBoost), were used to build the vegetation classification methods based on the UAV remote sensing images, field observation data, and digital elevation models. A suit of performance matrics such as classification accuracy, kappa coefficient, mean square error, user accuracy, and producer precision were selected to quantify the performance of the four machine learning methods. The results show that the AdaBoost model has the highest classification accuracy for identifying the forest vegetation types indicating that the AdaBoost model has an obvious advantage for distinguishing the forest vegetation types. Regarding the classification of non-forest types, the performances of the four methods differ relatively large with the highest accuracy in the RF model. In general, the four models can achieve good classification results in the typical humid mountainous areas of south China. The AdaBoost model has the highest classification accuracy and Kappa coefficient, while the SVM model has the relatively lowest accuracy. Auxiliary feature information such as topographic factors and texture features provide important information for improving the classification accuracy.

Keywords: UAV remote sensing ; Vegation classification ; Machine learning ; Decision tree ; Random forest ; Support vector machine ; AdaBoost

PDF (3257KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张妮娜, 张珂, 李运平, 李曦, 刘涛. 中国南方典型湿润山区植被类型的无人机多光谱遥感机器学习分类研究. 遥感技术与应用[J], 2023, 38(1): 163-172 doi:10.11873/j.issn.1004-0323.2023.1.0163

ZHANG Nina, ZHANG Ke, LI Yunping, LI Xi, LIU Tao. Study on Machine Learning Methods for Vegetation Classification in Typical Humid Mountainous Areas of South China based on the UAV Multispectral Remote Sensing. Remote Sensing Technology and Application[J], 2023, 38(1): 163-172 doi:10.11873/j.issn.1004-0323.2023.1.0163

1 引 言

我国南方湿润山区地形起伏大,下垫面空间异质性明显,复杂的地形条件极大影响着植被分布、组成和功能,对生态水文过程影响明显1。湿润山区气候温暖湿润,高强度降水频繁,产流汇流时间短,径流响应迅速2-3,表明我国南方湿润山区的生态水文过程机理研究具有重要的科学价值。陆地水文过程与生态过程联系紧密4,植被是流域下垫面重要组成部分,直接影响着产流和汇流过程5-6,所以建立精细植被分布组成信息提取方法对揭示下垫面空间异质性对生态水文过程的控制机理具有重要的作用7

传统的植被组成信息获取方法存在主观性强、误差大、耗费大量人力物力等缺点8。卫星遥感影像成本低、覆盖范围广9,在植被分类中有着广泛的应用,但是主要应用于获取中低分辨率的遥感影像10,高分辨率遥感影像下的植被精细分类研究较少。无人机遥感影像具有分辨率高、灵活性较强等特点11-12,具有丰富的光谱信息,适合下垫面复杂地区作业以及精细尺度下的植被分类13,是对传统遥感技术的有力补充。

目前遥感图像分类方法有基于光谱的计算机分类14,包括监督分类与非监督分类15,还有基于机器学习的分类16、专家系统分类17、面向对象的分类18等,其中基于机器学习的分类是分类效果较好的方式之一。Gilbertson等19基于Landsat 8多时相影像,用决策树、随机森林、K最近邻算法和支持向量机对南非开普酒乡7种主要植被类型分类,其中支持向量机分类效果最好;Raczko等20比较分析了支持向量机、随机森林和人工神经网络模型在波兰南部5种常见树种(云杉、落叶松、桤木、山毛榉、桦木)的分类结果,其中人工神经网络的总体分类准确率最高。非参数机器学习模型可以使用已知数据结合空间数据对图像进行分类21,具有较强的处理非正态分布的输入变量的能力,探究不同非参数机器学习模型对不同植被的适用性具有重要意义22。地物分类过程中易出现“同物异谱”和“同谱异物”的现象,仅用光谱信息进行植被分类存在较大的局限性,地形因子、纹理特征等辅助信息可以有效地提高分类精度23。王怀警等24基于Hyperion影像,综合利用光谱信息和纹理特征等辅助信息,建立了C5.0决策树模型对研究区地物进行分类,获得较好的分类效果。

本研究以位于南方典型湿润山区的屯溪流域中的典型小流域为研究区,综合利用光谱信息和辅助信息,开展基于决策树、随机森林、支持向量机和AdaBoost机器学习模型的植被类型识别方法研究,对比分析各个模型在研究区的分类结果和适用性,寻找在典型小流域最适用的机器学习模型。

2 数据与研究区

2.1 研究区概况

选择屯溪流域中的典型小流域为研究区,位于安徽省黄山市休宁县,地理坐标为29º39′~29º40′ N,117º58′~117º59′ E。该地区四季分明,气候温和,多年平均气温约17 ℃。流域多年平均降雨量约1 800 mm,雨量充沛,属于典型的湿润区域,流域洪水陡涨陡落,是黄山的典型流域;该地区地形复杂,植被类型主要有森林、农作物、灌木丛、裸地和水体等,灌木丛类型以茶树为主,森林类型主要以杉树和竹子为主,其他乔木类型包括栗子树、杉树、松树以及冬青等。

2.2 无人机影像获取与处理

研究采用影像数据于2019年4月拍摄,拍摄当天天气状况良好,使用旋翼飞行平台大疆M600,搭载索尼A7RⅢ相机,采集高空间分辨率的多光谱影像。影像处理软件为Pix4D,坐标系为WGS1984;数据进行空三加密,即解析空中三角测量,自动获取像点坐标,拼接获得研究区无人机遥感影像,包括红波段、绿波段、红边、近红外波段单波段影像以及可见光影像,影像分辨率为0.29 m。考虑到0.29 m空间分辨率下树木冠层叠加会影响精细尺度的植被类型信息识别,2 m的分辨率可以较好地保留丰富的光谱信息,避免冠层叠加对复杂混合林中纯样本判别的影响,故利用ArcGIS10.2将单波段影像空间分辨率重采样至2 m。

2.3 样点数据

2019年3月在研究区开展野外实地考察,利用手持GPS等仪器对研究区部分进行树木样本和控制点信息采集。研究区树木样本共采集到1 533个,有效点为1 411个,其中杉树林432个,竹林375个,杉树竹子混合林318个,乔木混合林236个,灌木丛50个。另外根据研究区的实地考察现状,结合无人机可见光影像和相关资料,利用ArcGIS10.2选取48个非林地类型样本点,其中农作物33个,裸地10个,水体5个。野外调查共采集无人机遥感影像覆盖区域下样点1 459个,按7∶3比例随机抽取训练样本和验证样本,其中训练样本有1 021个,验证样本有438个。

图1

图1   研究区地理位置、无人机遥感影像及样点示意图

Fig. 1   Geographical location of the study area, the UAV remote sensing image, and locations of the sample points


3 研究方法

3.1 分类系统

参考《森林资源规划设计调查技术规程》25中林地分类系统,根据实地探测研究区和对可见光影像的目视解译,综合考虑无人机遥感影像对森林类型的识别能力,本实验将研究区的森林类型主要划分为:杉树林、竹林、杉竹混合林、乔木混合林和灌木丛共5类。非林地类型不是本文研究重点,根据实际情况分为农作物、裸地、水体共3类。其中杉树竹子混种林主要指杉树和竹子的混合林,乔木混合林主要指杉树、冬青、栗子树以及松树等乔木的混合林。

3.2 遥感特征选取

3.2.1 光谱特征

光谱特征是分析遥感影像数据的基础。本研究利用ArcGIS10.2提取无人机影像的红波段、绿波段、近红外波段3个波段的点反射率值作为光谱特征。

3.2.2 植被指数

植被指数是指利用光谱遥感数据通过一系列计算得到的一些对植被类型和生物量有一定指示作用的数值26。不同植被类型具有不同的植被指数值。归一化植被指数NDVI是反映土地覆盖植被状况的一种遥感指标,在提取遥感植被信息方面、检测植被生长状态有着广泛的应用27

NDVI=ρNir-ρRedρNir+ρRed

比值植被指数RVI是绿色植被的灵敏指示参数28, RVI对植被敏感,植被覆盖度的高低影响其敏感性,当植被覆盖度较高时,RVI对植被十分敏感,绿色植被覆盖地区的RVI远远大于1。

RVI=ρNirρRed

土壤调节植被指数SAVI是在NDVI指数的基础上增加了土壤调节指数L,在NDVI的基础上进一步消除土壤反射率带来的不良影响29。L=0时,表示植被覆盖率为零,土壤背景影响非常大;L=1时,表示植被覆盖率很高,土壤背景的影响为零。本文根据研究区实地情况设定L为0.5。

SAVI=(ρNir-ρRedρNir+ρRed+L)*(1+L)

其中:ρNirρRed分别代表近红外波段、红波段反射率值。

3.2.3 地形因子

研究区地形地貌复杂,植被的生态学特征垂直向分布特征较为明显。坡度、坡向、高程等地形因子通过控制植被的生长发育环境和条件间接地影响植被的组成分布。植物生长发育要求不同的日照条件,因此将日照时数作为地形因子加入计算可以提高分类的准确率。根据DEM数据(空间分辨率2 m)计算其坡度、坡向、日照时数,并提取每个样点的地形因子信息作为遥感分类特征。

3.2.4 纹理特征

高分辨率影像具有丰富的纹理信息,对植被分类具有重要作用。本研究利用ENVI5.3对无人机遥感影像做主成分变换,取第一主成分,使用灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)方法30选取了均值(Mean,MEA)、方差(Variance,VAR)、同质性(Homogeneity,HOM)、对比度(Contrast,CON)、相异性(Dissimilarity,DIS)、熵(Entropy,ENT)、二阶矩(Second Moment,SM)、相关性(Correlation,COR)共8种纹理特征。灰度级设置为64,窗口大小为7×7,步长为1,提取方向为45°。

综上,本研究选取了4类遥感特征:光谱特征(3个)、植被指数(3个)、地形因子(4个)和纹理特征(8个)参与研究区植被分类(表1)。

表1   遥感特征选取列表

Table1  Remote sensing feature selection list

特征类别参数个数
光谱特征ρNirρRedρGreen3
植被指数NDVI、RVI 、SAVI3
地形因子DEM、Slope、Aspect、日照时数4
纹理特征

MEA、VAR、HOM、CON、

DIS、ENT、SM、COR

8

新窗口打开| 下载CSV


3.3 机器学习模型
3.3.1 决策树

决策树(Decision Tree,DT)31是一种非参数的有监督学习方法,采用自顶向下的递归方法,从一系列带有特征值和标签的数据中总结出决策规则,并以树状图的形式解决分类问题。建立决策树模型通常有基于信息增益的ID3、基于信息增益率的C4.5和基于基尼系数的CART等。研究采用CART算法的优化版本,以信息熵作为分类规则,比起基尼系数,信息熵对不纯度更加敏感,决策树的生长会更加精细。。

信息熵计算方法如下:

Entropy(t)=-i=0c-1p(i|t)log2p(i|t)

其中:t代表给定的节点,i代表标签的任意分类,p(i|t)代表标签分类i在节点t上所占的比例。

3.3.2 随机森林

随机森林(Random Forest,RF)32是具有代表性的袋装法(Bagging)集成算法。随机森林的基评估器是DT,随机森林分类器通过将许多相互独立的DT模型结合起来采用多数表决原则提升分类的准确率。随机森林模型因样本随机和特征随机的特点,使得其不容易过拟合,具备了较好的抗噪能力。

3.3.3 支持向量机

支持向量机(Support Vector Machine,SVM)33的分类方法是在数据空间中找出一个超平面作为决策边界,利用该决策边界对数据进行分类,使得模型在保证分类精度的同时使分类误差尽可能小。对于本实验中非线性可分数据,支持向量机通过将数据升维的非线性的变化,确保数据在自己的空间中能够线性可分。SVM中常用的核函数有线性、多项式、Sigmoid内积和RBF核函数,本实验采用多项式核函数,以解决非线性问题。

多项式核函数下的SVM决策函数计算方法如下:

f(xtest)=sign(ωΦ(xtest)+b)    =sign(i=1NαiyiK(x,xtest)+b)
K(x,xtest)=(γ(x,xtest)+r)d

其中:sign(h)h>0时返回正1,h<0时返回-1的符号函数,Φ是一个映射函数,αi是拉格朗日乘数,yi是样本i的真实标签,xtest是测试样本,r为常数项,d为函数的次数,ωbγ均为需要调整的参数。

3.3.4 自适应提升算法

自适应提升算法(Adaptive Boosting,AdaBoost)34是集成学习中提升法(Boosting)的代表算法之一,主要通过控制样本分布的权重来改变得到不同的测试样本。本实验中弱分类器为单层DT,算法在每次迭代后会改变训练样本的权重赋值,最终将弱分类器进行合理的结合成为一个强分类器。

最终获得的强分类器计算公式可表示为:

Hfinal=sign(f(x))=sign(t=1TαtHt(x))

其中:sign是符号函数;αt是弱分类器的权重;Ht(x)是基本分类器。

机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。本实验使用的DT、RF、SVM和AdaBoost模型均属于有监督学习。SVM模型属于黑箱模型,DT、RF和AdaBoost模型均为树结构模型。集成学习因为可集成多个模型的建模结果,因此使用效果好、应用广泛,其中RF模型是集成学习中袋装法的代表之一,AdaBoost模型是集成学习中提升法的代表之一,二者的基评估器均为DT模型,属于同质集成。

3.4 评价指标

为了定量描述各个机器学习模型在分类精度上的差异以及分类结果与实际样本之间的混淆程度,本文建立混淆矩阵进行分类精度评价,获得用户精度(User Accuracy,UA)、生产者精度(Producer Accuracy,PA)、总体精度、Kappa系数和均方误差(Mean Squared Error,MSE)5种评价指标。其中总体精度指所有分类的准确率,用户精度和生产者精度反映了单个植被的判断准确率,Kappa系数可以针对分类过程中易出现样本不平衡的情况衡量分类的效果,均方误差反映了数据序列与真实值之间的关系,其值越小,表明该分类模型具有更好的精确度。

4 结果与分析

4.1 不同模型分类结果评价

本研究采用DT、RF、SVM、AdaBoost模型分别对典型小流域杉树林、竹林、杉竹混合林、乔木混合林、灌木丛、农作物、裸地、水体8种植被类型的无人机遥感影像进行分类,通过网格搜索以及绘制学习曲线以模型整体准确率即整体的泛化误差为标准调整模型参数值,得到单个机器学习算法分类结果图(图2)。

图2

图2   单个机器学习模型下植被分类结果

Fig. 2   Maps of the classified LULC based on the four machine learning methods


从单个机器学习模型分类结果上看,RF、SVM、AdaBoost模型林地与非林地整体分布较为一致,其中RF、AdaBoost模型整体分类效果与目视解译和实测采集样点区域情况最贴切:农作物分布在研究区中部,形状规则;灌木丛集中分布在农作物和树林之间以及道路两侧;水体边界清晰;杉树林和竹林面积相比较少,呈零散或者成片分布;杉竹混合林和乔木混合林呈片状分布,集中在半山坡上和山顶的区域。DT模型与其他3种模型分类结果相差较大,各植被类型呈片状条状分布,尤其是将许多森林类型判别为了灌木丛,分析原因是因为DT模型相比其他树模型结构简单,依赖单一树的特征重要性,简化结构过程中易局部最优,泛化性能差。结合研究区现状和可见光影像的目视解译,DT、RF及AdaBoost模型对非林地类型判别较为准确;SVM模型对林地类型中的灌木丛判别较为准确;AdaBoost模型对林地类型中的杉树林、竹林、杉竹混合林和乔木混合林判别较为准确,与实际情况贴近。综合来讲,AdaBoost模型在4个模型中对典型小流域的分类效果最优。

4.2 不同模型分类精度评价

研究利用样点数据中的验证样本,计算不同机器学习模型下的混淆矩阵,获得用户精度、生产者精度、总体精度、Kappa系数和均方误差5个精度指标(表2)。

表2   基于不同机器学习模型的分类精度评价

Table 2  Comparison of the classification accuracy of the four machine learning methods

类别DTRFSVMAdaBoost
UA/%PA/%UA/%PA/%UA/%PA/%UA/%PA/%
杉树80.3188.7087.3990.4383.0885.7190.3794.57
竹林90.8383.1990.3294.1279.6678.3397.5496.74
杉竹混合林94.5192.4796.6793.5578.9580.6597.7595.60
乔木混合林96.1097.3797.3396.0595.8392.0097.5098.73
灌木丛100.0076.47100.0064.7192.3185.71100.00100.00
农作物80.2694.7490.48100.0092.3192.31100.0076.92
裸地83.3371.43100.0085.7157.14100.00100.0066.67
水体100.00100.00100.00100.00100.0025.00100.00100.00
总体精度/%89.8792.4383.5295.55
Kappa系数0.861 60.903 70.787 60.941 9
均方误差0.305 10.405 30.514 50.376 4

新窗口打开| 下载CSV


从单个机器学习模型上看,DT、RF、SVM和AdaBoost模型的总体准确率均较高,分别为89.87%、92.43%、83.52%、95.55%,均大于80%;Kappa系数分别为0.861 6、0.903 7、0.787 6、0.941 9,均在0.8左右,表现出了极高的一致性,其中AdaBoost模型在总体准确率和Kappa系数上表现都最优,在均方误差上也表现优异,表明AdaBoost模型在分类效果上明显好于其他3个模型,在典型小流域上具有更好的适用性。

从单个植被的评价精度上看,AdaBoost模型对杉树林和灌木丛分类效果最好,精度均在90%和100%及以上;RF和AdaBoost模型对竹林分类效果最好,精度均在90%以上;DT、RF和AdaBoost模型对杉竹混合林和水体分类效果最好,精度均在93%和100%及以上;RF模型对农作物和裸地,两项精度分别均在90%和85%以上;DT、RF、SVM和AdaBoost模型对乔木混合林分类精度均在92%以上。林地类型中,4种机器学习模型的杉树林精度均在80%以上,竹林和杉竹混合林精度均在78%以上,乔木混合林和灌木丛精度均在90%以上。综合用户精度和生产者精度,AdaBoost模型在林地类型上的用户精度和生产者精度均高于90%,高于或者等于其他模型,表明在林地类型上AdaBoost模型具有很好的分类效果。非林地类型中,AdaBoost模型的3种非林地类型植被用户精度均最高,农作物和裸地的生产者精度最高的分别是RF和SVM模型,DT、RF和AdaBoost模型对水体的识别准确率均为100%。整体来说,AdaBoost模型在林地和非林地类型上都表现出了较高的准确度,具有较好的适用性。

4.3 遥感特征重要性分析

DT、RF和AdaBoost模型均属于树结构模型,可查看分类过程中特征的贡献度,SVM模型是基于复杂的数学系统的黑箱模型,结果和计算过程难以解释,本研究中使用的树结构模型精度优于黑箱模型中的SVM模型,故本研究基于DT、RF和AdaBoost模型计算特征重要性,得出18个遥感特征对研究区植被分类的贡献度(图3)。DT模型中贡献度前三的特征依次是高程、均值和相关性,RF模型中贡献度前三的特征依次是高程、日照时数和均值,AdaBoost模型中贡献度前三的特征依次是日照时数、坡向和均值。

图3

图3   DT、RF、AdaBoost模型中遥感特征贡献度

Fig. 3   Contributions of the remote sensing features in the DT, RF, and AdaBoost models


图3表明,在DT、RF和AdaBoost模型中,地形因子和纹理特征中的均值的特征重要性远高于其他特征,对分类起着至关重要的作用。为了进一步体现地形因子和纹理特征对分类结果的重要性,研究在原有方案的基础上提出其他特征组合方案,分别为:方案1,光谱特征、植被指数、地形因子和纹理特征的组合;方案2,光谱特征、植被指数和纹理特征的组合,无地形因子;方案3,光谱特征、植被指数和地形因子的组合,无纹理特征;方案4,光谱特征和植被指数的组合,无地形因子和纹理特征。将方案1、2、3、4分别代入4种模型中,得到结果(图4)。

图4

图4   不同组合方案下DT、RF、SVM、AdaBoost模型的总体精度、Kappa系数和均方误差

Fig.4   Classification accuracy, Kappa coefficient and mean square error of the DT, RF, SVM and AdaBoost models under different combination schemes


在DT、RF和AdaBoost模型中,总体精度和Kappa系数由高到低、均方误差由低到高的方案依次是:1、3、2、4;在SVM模型中,总体精度和Kappa系数由高到低、均方误差由低到高的方案依次是:1、2、3、4。综合而言,加入了地形因子和纹理特征后的分类精度远高于不加入时的方案,结合图3表明,地形因子和纹理特征有助于大幅度提高分类精度。在DT、RF和AdaBoost模型中,方案3的分类精度大于方案2,表明在这3个模型中地形因子相比纹理特征更有助于提高分类精度,在SVM模型中情况相反。°

5 讨 论

屯溪流域典型小流域位于南方典型湿润山区,下垫面类型繁多,植被类型丰富,植物生长习性相差较大。不同植被类型在不同季节下具有不同的光谱特征,易出现“同物异谱”和“同谱异物”的现象。本研究使用春季拍摄的无人机遥感影像进行植被分类,原因是春季的植物生长旺盛,表现为典型的植物光谱特征。无人机影像具有较高的分辨率,有清晰丰富的信息,但是波段比高光谱以及多光谱影像波段数目少,单时相光谱影像相较于多时相影像光谱信息单一。目视解译和实测数据在一定程度上减少了分类的错误,加入地形因子和纹理特征也有助于大幅度提高分类精度,但若想得到更高一步的分类精度和更优的分类效果,可结合多时相多光谱数据以获得更全面的信息。

结合特征重要性和分类图分析不同模型下的分类结果,分类图较为破碎,林地类型之间混分较多,主要发生在杉树与乔木混合林、竹林与杉树中,这是因为在乔木混合林中树木种类繁多,树龄差异较大,伴有一些杉树,纹理特征相似;竹子与杉树相互错杂,部分竹子叶子形状与杉树针叶相似,使单个模型在判别的过程中受到了干扰。另外,研究区地形地貌复杂,多为山地,阴影区分布较多。在地形因子的影响下,在相同坡度坡向、阴影区不同类型的林地类型可能会具有相似的光谱特征和纹理特征,导致分类出现错误。对比可见光影像,DT和AdaBoost模型均将部分地势平坦的杉树林判别成了灌木丛,原因可能是杉树与茶树光谱纹理特征相似,且受到地形因子的影响,出现了误分的情况。

AdaBoost模型不论在计算精度还是分类效果上都取得了比其他3个模型更好的结果,在典型小流域上具有更好的适用性,分析原因是AdaBoost模型对基评估器进行了很好的关联,相对于袋装法它充分考虑了每个分类器的权重,所以在分类上会具有更高的精度。本研究使用的机器学习模型涉及需调整的参数较多,不同的参数组合对结果有影响,如何根据特定的遥感影像和研究区选择合适的参数组合需要进一步研究。

6 结 论

(1)4种模型在黄山湿润山区典型小流域分类结果差异较小,AdaBoost模型分类精度最高,总体精度为95.55%、Kappa系数为0.941 9,其次是RF模型,然后依次是DT、SVM模型,表明本研究使用的树结构模型比黑箱模型中的SVM模型效果要好,其中AdaBoost模型更优;与目视判别情况比较,AdaBoost和RF模型分类效果图最贴切,说明AdaBoost模型在南方湿润山区典型小流域上分类效果上有显著优势,有更好的适用性,其中AdaBoost模型因为其充分考虑了每个弱分类器的权重而在分类上具有更高的精度。

(2)4种模型对植被中的林地类型判别精度均较高,差异较小,林地类型中的杉树林、竹林、杉竹混合林和灌木丛判别效果最好的模型是AdaBoost模型,乔木混合林的判别效果最好的模型是DT和AdaBoost模型;4种模型对非林地类型的判别精度差异较大,非林地类型中的农作物和裸地判别效果最好的模型是RF模型,水体判别效果最好的模型是DT、RF和AdaBoost模型。

(3)模型特征变量重要性结果说明在分类中光谱特征和植被指数贡献度较低,地形因子和纹理特征在研究区植被分类中起着重要的作用。在光谱特征和植被指数的基础上,再引入辅助信息(地形因子和纹理特征)参与分类,分类精度有不同程度的提高,表明加入辅助信息对分类精度的提高起到了积极的作用。

参考文献

ZHANG KALI AANTONARAKIS Aet al.

The sensitivity of North American Terrestrial carbon fluxes to spatial and temporal variation in soil moisture:An analysis using radar‐derived estimates of root‐aone soil moisture

[J]. Journal of Geophysical Research:Biogeosciences,201912411):3208-3231.

[本文引用: 1]

LIU HongweiGAO FeiYU Zhongboet al.

Study on temporal-spatial variability of soil moisture content on hillslope in a humid area

[J]. Water Resources Protection,2016325): 17-23.

[本文引用: 1]

刘宏伟高菲余钟波.

湿润地区坡面土壤含水率时空变异性研究

[J]. 水资源保护,2016325):17-23.

[本文引用: 1]

LI QiongGONG JunfuWANG Hongxinet al.

Application and comparison of hydrological models in small watersheds of humid regions

[J]. South-to-North Transfers and Water Science & Technology, 2020184):81-86.

[本文引用: 1]

李琼龚珺夫王洪心.

湿润地区山区小流域水文模型应用与比较

[J]. 南水北调与水利科技(中英文), 2020184): 81-86.

[本文引用: 1]

LEE ELIVINO AHAN Set al.

Land cover change explains the increasing discharge of the Parana River

[J]. Regional environmental change, 2018186): 1871-1881.

[本文引用: 1]

ZHANG KKIMBALL J SNEMANI R Ret al.

Vegetation greening and climate change promote multidecadal rises of global land evapotranspiration

[J]. Scientific Reports, 201551): 1-9.

[本文引用: 1]

DU YongLI JianzhuNIU Kaijieet al.

Analysis of vegetation change and its impact on natural runoff in the mountain area of the Yongding River Basin from 1982 to 2015

[J], Journal of Hydraulic Engineering,20215211):1309-1323.

[本文引用: 1]

杜勇李建柱牛凯杰.

1982~2015年永定河山区植被变化及对天然径流的影响

[J]. 水利学报,20215211):1309-1323.

[本文引用: 1]

QIAO LZOU C BSTEBLER Eet al.

Woody plant encroachment reduces annual runoff and shifts runoff mechanisms in the tallgrass prairie, USA

[J]. Water Resources Research, 2017536): 4838-4849.

[本文引用: 1]

LIU HeGU LingjiaREN Ruizhi.

Research progress of forest parameter acquisition based on UAV remote sensing technology

[J]. Remote Sensing Technology and Application, 2021363): 489-501.

[本文引用: 1]

刘鹤顾玲嘉任瑞治.

基于无人机遥感技术的森林参数获取研究进展

[J]. 遥感技术与应用, 2021363): 489-501.

[本文引用: 1]

ZHANG KeLIU LinxinCHAO Lijunet al.

Spatiotemporal variations of terrestrial ecosystem water use efficiency in Yunnan Province from 2000 to 2014

[J], Water Resources Protection,2019355):1-5.

[本文引用: 1]

张珂刘林鑫晁丽君.

2000~2014年云南省陆地生态系统水分利用效率的时空变化

[J]. 水资源保护, 2019355):1-5.

[本文引用: 1]

FU WeiXU HanqiuWANG Meiyaet al.

Vegetation classification and variation assessment in a typical red soil erosion area in Southern China:Hetian, Changting Country of Fujian Province

[J]. Remote Sensing Technology and Application, 2017323): 546-555.

[本文引用: 1]

付伟徐涵秋王美雅.

南方红壤典型水土流失区植被分类及植被类型变化的遥感评估——以福建省长汀县河田地区为例

[J]. 遥感技术与应用, 2017323): 546-555.

[本文引用: 1]

YANG HongyanDU JianminRUAN Peiyinget al.

Vegetation classification of desert steppe based on unmanned aerial vehocle remote sensing and random forest

[J]. Transactions of the Chinese Society for Agricultural Machinery,2021526): 186-194.

[本文引用: 1]

杨红艳杜健民阮培英.

基于无人机遥感与随机森林的荒漠草原植被分类方法

[J]. 农业机械学报, 2021526):186-194.

[本文引用: 1]

COLOMINA IMOLINA P.

Unmanned aerial systems for photogrammetry and remote sensing: A review - ScienceDirect

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014922): 79-97.

[本文引用: 1]

HU YinaAN RuAI Zetianet al.

Researches on grass species fine identification based on UAV hyperspectral images in three-river source region

[J]. Remote Sensing Technology and Application,2021364):926-935.

[本文引用: 1]

胡宜娜安如艾泽天.

基于无人机高光谱影像的三江源草种精细识别研究

[J]. 遥感技术与应用,2021364):926-935.

[本文引用: 1]

LI HongdaGAO XiaohongTANG Min.

Land cover classification for different spatial resolution images from CNN

[J]. Remote Sensing Technology and Application, 2020354): 749-758.

[本文引用: 1]

李宏达高小红汤敏.

基于CNN的不同空间分辨率影像土地覆被分类研究

[J]. 遥感技术与应用, 2020354): 749-758.

[本文引用: 1]

WANG HongshuLI ShihuaGUO Jiaweiet al.

Retrieval of the leaf area density of Magnolia woody canopy with terrestrial Laser-scanning data

[J]. Journal of Remote Sensing, 2016204): 570578.

[本文引用: 1]

王洪蜀李世华郭加伟.

地基激光雷达的玉兰林冠层叶面积密度反演

[J]. 遥感学报, 2016204): 570-578.

[本文引用: 1]

LI Nan.

Long-term remote sensing dynamic monitoring and ecological assessment of the coastal wetland in Hangzhou Bay

[D]. NanjingNanjing Forestry University2020.

[本文引用: 1]

李楠.

杭州湾滨海湿地长时间尺度遥感动态监测及生态评估

[D]. 南京南京林业大学2020.

[本文引用: 1]

YAO Lianqiu.

Research on remote sensing image land cover classification based on expert knowledge and improved SEATH algorithm

[D]. NanjingNanjing Normal University2018.

[本文引用: 1]

姚恋秋.

基于专家知识和改进SEATH算法的遥感影像土地覆被分类研究

[D]. 南京南京师范大学2018.

[本文引用: 1]

SONG Minghui.

Object-oriented urban land classfication with GF-2 remote sensing image

[J]. Remote Sensing Technology and Application, 2019343): 547-552.

[本文引用: 1]

宋明辉.

基于高分二号数据的面向对象城市土地利用分类研究

[J]. 遥感技术与应用, 2019343): 547-552.

[本文引用: 1]

GILBERTSON J KKEMP JNIEKERK A V.

Effect of pan-sharpening multi-temporal Landsat 8 imagery for crop type differentiation using different classification techniques

[J]. Computers & Electronics in Agriculture,20171345):151-159.

[本文引用: 1]

RACZKO EZAGAJEWSKI B.

Comparison of support vector machine, random forest and neural network classifiers for tree species classification on airborne hyperspectral APEX images

[J].European Journal of Remote Sensing,2017501):144-154.

[本文引用: 1]

KUMAR PGUPTA D KMISHRA V Net al.

Comparison of support vector machine, artificial neural network, and spectral angle mapper algorithms for crop classification using LISS IV data

[J]. International Journal of Remote Sensing, 2015365-6): 1604-1617.

[本文引用: 1]

GILBERTSON J K.

Machine learning for object-based crop classification using multi-temporal Landsat 8 imagery

[D]. StellenboschStellenbosch University2017.

[本文引用: 1]

SHAO WenjingSUN WeiweiYANG Gang.

Comparison of texture feature extraction methods for hyperspectral imagery classification

[J]. Remote Sensing Technology and Application, 2021362): 431-440.

[本文引用: 1]

邵文静孙伟伟杨刚.

高光谱遥感影像纹理特征提取的对比分析

[J]. 遥感技术与应用, 2021362): 431-440.

[本文引用: 1]

WANG HuaijingTAN BingxiangFANG Xiufenget al.

Precise classification of forest types use Hyperion image based on the C5.0 decision tree algorithm

[J]. Journal of Zhejiang A&F University, 2018354): 147-157.

[本文引用: 1]

王怀警谭炳香房秀凤.

C5.0决策树Hyperion影像森林类型精细分类方法

[J]. 浙江农林大学学报, 2018354): 147-157.

[本文引用: 1]

Technical regulations for inventory for forest management planning and design [S]. 2011,GB/T 26424-201036.

[本文引用: 1]

森林资源规划设计调查技术规程 [S].2011,GB/T 26424-201036.

[本文引用: 1]

HUETE ADIDAN KMIURA Tet al.

Overview of the radiometric and biophysical performance of the MODIS vegetation indices

[J]. Remote Sensing of Environment, 2002831-2): 195-213.

[本文引用: 1]

LI XiangLIU KaiZHU Yuanhuiet al.

Study on the mangrove species classification based on ZY-3 image

[J]. Remote Sensing Technology and Application, 2018332):360-369.

[本文引用: 1]

李想刘凯朱远辉.

基于资源三号影像的红树林物种分类研究

[J]. 遥感技术与应用, 2018332):360-369.

[本文引用: 1]

ZHANG YuZHANG LiyuanZHANG Huihuiet al.

Crop coefficient estimation method ofmaize by UAV remote sensing and soil moisture monitoring

[J]. Transactions of the Chinese Society of Agricultural Engineering,2019351):83-89.

[本文引用: 1]

张瑜张立元Zhang Huihui.

玉米作物系数无人机遥感协同地面水分监测估算方法研究

[J]. 农业工程学报, 2019351): 83-89.

[本文引用: 1]

HUETE A R.

A Soil-Adjusted Vegetation Index(SAVI)

[J]. Remote Sensing of Environment, 1988253): 295-309.

[本文引用: 1]

FENG JianhuiYANG Yujing.

Research on extracting texture feature image based on gray level co-occurrence matrix

[J]. Beijing Surveying and Mapping, 200743): 19-22.

[本文引用: 1]

冯建辉杨玉静.

基于灰度共生矩阵提取纹理特征图像的研究

[J]. 北京测绘, 200743): 19-22.

[本文引用: 1]

FRIEDL M ABRODLEY C E.

Decision tree classification of land cover from remotely sensed data

[J]. Remote Sensing of Environment, 1997613): 399-409.

[本文引用: 1]

BREIMAN L.

Random forest

[J]. Machine Learning, 2001451): 5-32.

[本文引用: 1]

VAPNIK V.Statistical Learning Theory[M]. New YorkWiley1998.

[本文引用: 1]

FREUND YSCHAPIRE R E.

A decision-theoretic generali-zation of on-line learning and an application to boosting

[J]. Journal of Computer and System Sciences,1997551):119-139.

[本文引用: 1]

/