基于GF-1和Sentinel-1A的漓江流域典型地物信息提取
Identification of Typical Land Features in the Lijiang River Basin with Fusion Optics and Radar
通讯作者:
收稿日期: 2018-12-28 修回日期: 2020-03-16 网络出版日期: 2020-06-19
基金资助: |
|
Received: 2018-12-28 Revised: 2020-03-16 Online: 2020-06-19
作者简介 About authors
唐廷元(1995-),男,重庆人,硕士研究生,主要从事遥感图像智能处理研究E⁃mail:
关键词:
Keywords:
本文引用格式
唐廷元, 付波霖, 何素云, 娄佩卿, 闭璐.
Tang Tingyuan, Fu Bolin, He Suyun, Lou Peiqing, Bi Lu.
1 引 言
多光谱影像具有丰富的纹理和光谱信息,是河岸带监测的理想数据源[1]。对河流流域典型地物提取主要通过光谱特征、纹理特征等多特征分析识别,并统计典型地物数量。常用的河流流域地物提取的方法有最大似然法[2,3]、支持向量机(Support Vector Machine,SVM) [4]、随机森林算法(Random Forest,RF)[5,6,7]等,最大似然法优点在于简单且实施方便,但随着波段信息越多而分类时间越长;SVM分类虽提高了分类精度,但消耗大量时间;随机森林算法具有训练速度快、精度高等优点。张晓羽等[6]利用随机森林算法对漠河县林地植被进行分类,结果表明使用随机森林算法提高了分类精度。范驰等[7]利用随机森林算法对无锡新区高分辨率遥感影响建筑物信息提取,结果表明随机森林算法适用于高维数据分类,可充分挖掘目标对象的光谱、几何等信息。综上,随机森林算法在利用多源遥感数据提取流域地物信息方面具有优势。
如今,仅仅依靠单一遥感数据源难以满足复杂技术应用的要求[8]。光学遥感在多云、多雨和多雾的热带和亚热带地区很难获取高质量多光谱影像(云覆盖率≤30%)[1];而SAR数据具有全天候、全天时等优点,但缺少光谱信息[9]。优化综合利用主被动遥感影像提高地物识别精度,已经成为近年研究热点之一。多光谱影像和SAR影像的融合方法主要有主成分分析(Principal Component Analysis,PCA)变换方法[10]、高通滤波法(High Pass Filtering,HPF)[11]、小波变换方法[12,13]等,PCA方法有融合后的图像光谱特性保持比较好的优点,但计算量大、实时性比较差;HPF方法虽算法简单、计算量小,但融合图像包含比较大的噪声;小波融合算法有效地增强多光谱图像的空间细节表现能力并能保持图像融合前后的光谱特性。刘娜等[12]对2幅原始图像进行小波变换, 采用不同类型对图像融合结果进行测试和分析,结果表明小波变换融合后图像更加清晰,提高了图像信噪比。郭志强等[13]将图像采用小波进行分解后融合处理,最后采用小波逆变换得到融合图像,结果表明,该方法有较好的融合效果。综上所述,小波融合算法更适用于本文融合多光谱影像和SAR影像来研究河流流域典型地物提取。
桂林是国家旅游综合改革试验区,建设桂林旅游综合改革试验区主导战略就是保护漓江流域生态环境[14]。目前漓江流域生态环境监测,多采用人工实地调查,由于漓江流域属于典型的喀斯特地貌区,峰丛林立,洼地众多,植被茂密,人工调查难度极大,效率低,成本高,很难全面反映流域环境质量状况。同时,国内很少有学者利用主被动遥感对漓江流域生态环境中影响较大的地物进行高精度识别。为弥补以上研究空白,本研究以桂林市漓江流域作为研究区域,以GF-1影像和Sentinle-1A SAR影像为数据源,利用小波融合算法和随机森林算法,探究和定量分析不同数据源在漓江流域典型地物提取中的精度差异,为漓江流域生态环境遥感监测、合理开发和保护提供技术支撑。
2 研究区概况
漓江(24°40′~25°80′ N,110°10′~110°40′ E)位于广西壮族自治区东北部,它的源头在桂林市资源县猫儿山,全长426 km,整个漓江流域呈现出狭长带状分布。随着桂林的经济和旅游业发展,漓江流域的生态环境也日渐愈下。生态环境的破坏影响了漓江的水体质量和山水风光,居民的基本生活和桂林旅游业的发展已经受到了严重威胁。对漓江流域的保护已成为首要解决的问题,因此本文选定漓江流域为研究区域,如图1所示。
图1
3 数据源与数据预处理
3.1 GF-1多光谱和Sentinel-1A影像的数据预处理
采用的主要数据有GF-1多光谱影像、Sentinel-1A IW 模式的SAR影像和广西壮族自治区基础地理信息中心编制的漓江流域2015年1∶100 000的土地利用数据。
GF-1多光谱影像采用的是16 m空间分辨率,波段数为4,分别是蓝、绿、红和近红外,获取时间为2017年11月,影像数据质量良好,清晰且无云覆盖。在ENVI 5.2软件中对影像的预处理,主要包括辐射定标、大气校正、正射校正、图像增强以及影像剪裁生成流域配准的GF-1影像。
图2
在ArcGIS中利用Create Random Points工具在研究区内随机生成150个点,并与广西基础地理信息中心编制2015年漓江流域1∶100 000土地利用数据进行叠加,剔除多点在同一多边形内的情况,确保每个多边形只有唯一的随机点,提取每个点所在的多边形作为样本数据,利用Geostatistical Analyst 工具将样本数据随机等分为训练样本和验证样本,分别进行算法训练和精度验证。
3.2 基于GF-1图像和SAR图像的融合
图3
图3
GF-1和SAR融合图像中的喀斯特地貌
Fig.3
Karst landforms In the fusion of GF-1 images and SAR images
3.3 技术方案
利用随机森林机器学习算法,提取对漓江流域生态环境影响较大的典型地物,基于验证样本进行精度评价,对比论证GF-1多光谱影像、融合GF-1和VV极化方式的Sentinel-1A SAR后向散射影像在识别漓江流域典型地物上总体技术方案如图4所示。
图4
4 基于随机森林算法的漓江流域典型地物信息提取
4.1 随机森林算法基本理论
4.2 基于RF算法的典型地物识别模型构建
利用Rstudio算法执行平台,调用其Random forest工具包进行漓江流域典型地物的识别与分类,其步骤包括训练样本生成,算法模型训练及参数调试,典型地物分类、图像分类后处理和精度验证:
(2)算法的模型训练及参数调试:在ENVI软件中将训练样本导出为csv格式数据,并导入到Rstudio中,调用Random Forest工具包进行随机森林算法参数训练和调试:①参与节点分割的变量个数(mtry),②随机森林中树的数量(ntree),训练结果见表1。
表1 Random Forest 算法中mtry 和ntree参数
Table 1
数据集 | mtry | ntree |
---|---|---|
GF-1 | 17 | 1 500 |
GF-1&Sentinel-1A | 23 | 1 500 |
(3)典型地物识别模型构建:利用优化训练确定的算法参数分别构建单独GF-1多光谱影像、GF-1多光谱和Sentinel-1A SAR后向散射融合影像的高精度识别模型,并在Rstudio中进行漓江流域地物提取。
(4)分类后处理:在Rstudio中生成的分类图像存在一些孤立的细小斑块,为了消除该斑块,本文将分类结果导入到ENVI 软件中,利用Majority/Minority Analysis、Classification Aggregation、Clump和Sieve工具进行分类后处理,邻域窗口设置为5×5,生成最终的分类结果,见图5和6。将最终分类结果再次导入到Rstudio软件中,利用矢量验证样本数据进行分类结果的精度检验和分类精度的统计分析。
图5
5 精度结果分析
5.1 基于GF-1多光谱影像的分类精度验证
(1)总体分类精度和Kappa系数:基于GF-1影像的典型地物分类精度很高,在95%的置信区间内总体精度达到96.07%,且误差值较小,为0.04%(见表2)。从Kappa系数达到0.92,论证了RF算法对于漓江流域典型地物具有较高的识别精度。
表2 总体精度评价表
Table 2
精度指标 | 评估/% | 标准差/% | 95%置信区间/% | |
---|---|---|---|---|
总体分类精度 | 96.15 | 0.04 | 96.07 | 96.23 |
Kappa系数 | 91.95 | 0.08 | 91.79 | 92.11 |
(2)各地物用户精度(User’s Accuracy):在95%的置信区间,6类典型地物内用户精度都高于90%,阔叶林(92.42%)精度最低,河流(99.23%)精度最高;而分类误差都在0.05%以下,阔叶林(0.05%)和水田(0.05%)误差最大,河流(0.02%)误差最小(见表3)。阔叶林在95%的置信区间内精度低,由于河流(24个像素)、针叶林(4 633个像素)、水田(211个像素)、旱地(38个像素)、居民地(44个像素)错分为阔叶林(65 296个像素)(见表4),错分率为7.58%。基于GF-1多光谱影像的分类中,6类典型地物在95%的置信区间内用户精度都较高,接近真实分类情况。
表3 漓江流域各类地物分类精度
Table 3
用户精度/% | 生产者精度/% | |||||||
---|---|---|---|---|---|---|---|---|
地物类型 | 评估 | 标准差 | 95%区间 | 评估 | 标准差 | 95%区间 | ||
河流 | 99.23 | 0.02 | 99.19 | 99.26 | 97.74 | 0.32 | 97.12 | 98.36 |
针叶林 | 97.45 | 0.03 | 97.39 | 97.52 | 97.31 | 0.05 | 97.22 | 97.40 |
阔叶林 | 92.42 | 0.05 | 92.32 | 92.52 | 93.20 | 0.08 | 93.05 | 93.36 |
水田 | 93.98 | 0.05 | 93.89 | 94.07 | 81.17 | 0.35 | 80.47 | 81.86 |
旱地 | 95.30 | 0.04 | 95.21 | 95.38 | 90.90 | 0.22 | 90.47 | 91.34 |
居民地 | 97.22 | 0.03 | 97.16 | 97.29 | 98.93 | 0.05 | 98.82 | 99.04 |
表4 混淆矩阵表
Table 4
参考地物类型 | |||||||
---|---|---|---|---|---|---|---|
地物类型 | 河流 | 针叶林 | 阔叶林 | 水田 | 旱地 | 居民地 | 总和 |
河流 | 3 206 | 0 | 0 | 25 | 0 | 0 | 3 231 |
针叶林 | 2 | 167 601 | 4 372 | 0 | 4 | 0 | 171 979 |
阔叶林 | 24 | 4 633 | 60 346 | 211 | 38 | 44 | 65 296 |
水田 | 24 | 0 | 29 | 1 030 | 4 | 9 | 1 096 |
旱地 | 0 | 0 | 0 | 0 | 1 499 | 74 | 1 573 |
居民地 | 24 | 0 | 0 | 3 | 104 | 11 736 | 12 071 |
总和 | 3 280 | 172 234 | 64 747 | 1 269 | 1 649 | 11 863 | 255 303 |
5.2 基于GF-1和Sentinel-1A融合影像的分类精度验证
(1)总体分类精度和Kappa系数:基于融合GF-1和Sentinel-1A影像在漓江流域典型地物的分类中,在95%的置信区间内总体分类精度达到了94.40%,标准误差为0.05%(见表5);从Kappa系数的值达到了0.88,论证了RF算法对于漓江流域典型地物具有较高的识别精度。
表5 总体精度评价表
Table 5
精度指标 | 评估/% | 标准差/% | 95%置信区间/% | |
---|---|---|---|---|
总体分类精度 | 94.40 | 0.05 | 94.30 | 94.50 |
Kappa系数 | 88.05 | 0.11 | 87.84 | 88.27 |
表6 漓江流域各类地物分类精度
Table 6
用户精度/% | 生产者精度/% | |||||||
---|---|---|---|---|---|---|---|---|
地物类型 | 评估 | 标准差 | 95%区间 | 评估 | 标准差 | 95%区间 | ||
河流 | 99.49 | 0.02 | 99.46 | 99.53 | 90.17 | 0.68 | 88.83 | 91.51 |
针叶林 | 94.30 | 0.05 | 94.20 | 94.40 | 98.37 | 0.04 | 98.29 | 98.45 |
阔叶林 | 94.43 | 0.05 | 94.33 | 94.53 | 84.24 | 0.11 | 84.02 | 84.47 |
水田 | 98.57 | 0.03 | 98.52 | 98.62 | 81.35 | 0.69 | 79.99 | 82.72 |
旱地 | 91.71 | 0.06 | 91.59 | 91.83 | 89.68 | 0.33 | 89.04 | 90.32 |
居民地 | 94.30 | 0.05 | 94.20 | 94.40 | 99.54 | 0.04 | 99.46 | 99.61 |
表7 混淆矩阵表
Table 7
参考地物类型 | |||||||
---|---|---|---|---|---|---|---|
地物类型 | 河流 | 针叶林 | 阔叶林 | 水田 | 旱地 | 居民地 | 总和 |
河流 | 2 560 | 0 | 0 | 11 | 0 | 0 | 2 573 |
针叶林 | 7 | 136 075 | 8 210 | 0 | 7 | 0 | 144 299 |
阔叶林 | 112 | 2 260 | 43 895 | 173 | 31 | 10 | 46 483 |
水田 | 12 | 0 | 0 | 829 | 0 | 0 | 8 41 |
旱地 | 0 | 1 | 0 | 0 | 1 217 | 35 | 1 327 |
居民地 | 148 | 0 | 0 | 6 | 102 | 9 663 | 10 247 |
总和 | 2 839 | 138 336 | 52 105 | 1 019 | 1 357 | 9 708 | 205 818 |
5.3 分类精度对比分析
通过对比分析两种数据集分类精度,本文可得到如下结论:
(1)总体分类精度和Kappa系数:在95%置信区间内,基于GF-1图像的总体分类精度为96.15%,而基于融合GF-1和Sentinel-1A影像总体分类精度为94.40%,两者精度相差1.75%;基于GF-1图像的Kappa系数为0.92,而基于融合GF-1和Sentinel-1A影像的Kappa系数为0.88,两者相差0.04(见表8和图7)。究其原因,在6种地物类型中,GF-1多光谱影对针叶林、旱地和居民地的识别精度高于GF-1和Sentinel-1A融合影像,但对于阔叶林和水田,融合影像的识别精度高于单一的GF-1多光谱影像。综上所述,两种数据集在提取漓江流域典型地物中,总体分类精度较为相近,不存在显著性差异。
表8 总体分类精度比较表
Table 8
影像集 | 95%置信区间总体分类精度/% | Kappa 系数 |
---|---|---|
GF-1 | 96.15 | 0.92 |
GF-1&Sentinel-1A | 94.40 | 0.88 |
图6
图6
融合GF-1和Sentinel-1A图像的分类专题
Fig.6
Classification thematic map based on the fusion of GF-1 images and Sentinel-1A images
图7
图7
漓江流域各典型地物生产者精度对比分析
Fig.7
Comparative analysis of producer accuracy of typical features in the Lijiang River
(2)用户精度和制图精度: 在95%的置信区间内,①与GF-1和Sentinel-1A融合影像相比,GF-1图像对针叶林、旱地和居民地的用户精度提升了3.5%,河流和阔叶林的生产者精度相差较大,分别提升了7.57%和9.07%(见图7)。②两种数据集,6种地物用户精度的标准误差均在0.02~0.06之间,较为一致。但是生产者精度对应的标准误差差异较大,融合影像对河流和水田两种地物,分别产生了0.68和0.69的标准误差,明显高于其他地物类型。分析两种数据集产生的混淆矩阵发现,对于针叶林地物,GF-1图像有2.5%(4 372个像素)的验证样本数据被错分为阔叶林,而融合GF-1和Sentinel-1A有5.6%(8 210个像素)的验证样本错分为阔叶林,旱地与居民地也存在1%左右的错分情况。
综合以上精度分析,在对漓江流域的典型地物遥感识别研究中,随机森林算法对GF-1图像和GF-1和Sentinel-1A融合影像,总体分类精度没有显著差异,仅在河流和阔叶林两种地物的生产者精度,GF-1图像要好于GF-1和Sentinel-1A融合影像。
6 结 语
本文采用随机森林算法对利用小波变换融合GF-1和Sentinle-1A SAR的影像构建漓江流域典型地物高精度识别模型,并与GF-1图像构建漓江流域典型地物高精度识别模型作精度对比,结论如下:
(1)利用小波变换算法融合GF-1多光谱和VV极化的Sentinel-1A SAR后向散射系数影像,与光学影像相比,融合影像纹理特征明显,喀斯特地貌特征突出。
(2)在95%的置信区间内,随机森林算法利用两种遥感数据集对漓江流域各典型地物均具有较高的识别能力,总体分类精度不存在显著性差异,都达到94 %以上分类精度。但对于河流和阔叶林两种地物,GF-1图像数据的识别能力要好于GF-1和Sentinel-1A的融合图像。
(3)本文由于针叶林和阔叶林、旱地和居民地存在光谱相似性,导致地物之间存在不同程度的错分情况,分类精度不够准确。
后续研究将考虑引入纹理特征和多时相遥感数据集,通过整合面向对象的影像分析技术和深度学习算法,实现漓江流域典型地物的高精度智能识别,进而为漓江流域的合理开发和有效保护提供技术和理论参考。
参考文献
Crop Yield Estimation based on Unsupervised Linear Unmixing of Multidate Hyperspectral Imagery
[J].,
Soil Classification based on Maximum Likelihood Method and Features of Multi-temporal Remote Sensing Images in Bare Soil Period
[J].
基于裸土期多时相遥感影像特征及最大似然法的土壤分类
[J].,
Analysis on Spatial Variablity of Soil Organic Carbon and Nitrogen based on REML and MOM in a Small Watershed on Loess Plateau
[J]
基于最大似然法与矩法的黄土高原小流域土壤碳氮空间变异分析
[J].,
Stellar Spectra Classification Method based on Multi-Class Support Vector Machine
[J].
基于多类支持向量机的恒星光谱分类方法
[J].,
Classification of China Small Satellite Remote Sensing Image based on Random Forests
[J].
基于随机森林的国产小卫星遥感影像分类研究
[J].,
Forest Vegetation Classification of Landsat 8 Remote Sensing Image based on Random Forests Model
[J].
基于随机森林模型的陆地卫星-8遥感影像森林植被分类
[J].,
Images based on Random Forests
[J].
基于随机森林的WorldVew2i影像建筑物精细提取
[J].,
Winter Wheat Planting Area Extraction Using Multi-temporal Remote Sensing Images based on Field Parcel
[J].
基于地块尺度多时相遥感影像的冬小麦种植面积提取
[J].,
A Novel Remote Sensing Image Fusion Approach Research based on HSV Space and Bi-orthogonal Wavelet Packet Transform
[J]. ,
A Novel Algorithm of Remote Sensing Image Fusion based on Shearlets and PCNN
[J].,
A Novel Algorithm for Satellite Images Fusion based on Compressed Sensing and PCA
[J]. , .
Research on Image Fusion Algorithm based on Wavelet Transform
[J].
基于小波变换的图像融合算法研究
[J].,
Wavelet Transform Image Fusion based on Regional Features
[J].
基于区域特征的小波变换图像融合方法
[J].,
A Consideration of Country's Integrated Informing Experimental Area Construction of Guilin City from the View of Culture
[J].
从文化的视角思考桂林国家旅游综合改革试验区建设
[J].,
Image Fusion Scheme based on Quaternion Wavelet Transform and Sparse Representation
[J].
四元数小波变换联合稀疏表示的图像融合
[J].,
Remote Sensing Image Fusion based on Minimum Hausdorff Distance and Non-sampled Shearlet Transform
[J].
基于最小Hausdorff距离和NSST的遥感图像融合
[J].,
A Novel Scale-aware Pansharpening Method
[J].
一种尺度感知型遥感图像融合新方法
[J]. ,
Remote Sensing Images Fusion Algorithm based on Weighted Wavelet Analysis
[J].
基于加权小波分析的遥感图像融合算法
[J].,
Remote Sensing Image Fusion Algorithm based on Biorthogonal Wavelet Transform Coupled with Regional Gradient Features
[J].
基于双正交小波变换耦合区域梯度特征的遥感图像融合算法
[J].,
Fusion and Classification of SAR and Optical Image with Consideration of Polarization Characteristics
[J].
顾及极化特征的SAR与光学影像融合与分类
[J].,
Search Rank Model based on Random Forests and LambdaMART
[J].
基于随机森林与LambdaMART的搜索排序模型
[J].,
Information Extraction of Coastal Wetlands in Yellow River Estuary by Optimal Feature-based Random Forest Model
[J]
基于特征优选的随机森林模型的黄河口滨海湿地信息提取研究
[J].,
Object-oriented Wetland Classification based on Hybrid Feature Selection Method Combining with Relief F,Multi-objective Genetic Algorithm and Random Forest
[J].
基于多目标遗传随机森林特征选择的面向对象湿地分类
[J].,
The Random Forest Classification of Wetland from GF-2 Imagery based on the Optimized Feature Space
[J]
基于特征空间优化的随机森林算法在GF-2影像湿地分类中的研究
[J].,
Classification of Land Use in Farming Area based on Random Forest Algorithm
[J].
基于随机森林算法的农耕区土地利用分类研究
[J].,
Remote Sensing Information Extraction of Hydrophyte in Honghu Lake based on Decision Tree
[J].
基于决策树的洪湖水生植物遥感信息提取
[J].,
Research on Extraction of Winter Wheat based on Random Forest
[J].
基于随机森林算法的冬小麦提取研究
[J].,
Comparative Study on Neural Network Structures in Power Analysis
[J].
神经网络结构在功耗分析中的性能对比
[J].,
. Object-oriented Classification for Satellite Remote Sensing of Wetlands: A Case Study in Southern Hangzhou Bay Area
[J].
面向对象的湿地景观遥感分类——以杭州湾南岸地区为例
[J].,
Remote Sensing Classification for Zhalong Wetlands based on Support Vector Machine
[J].
基于支持向量机的扎龙湿地遥感分类研究
[J].,
/
〈 | 〉 |