基于特征优选的GF-3全极化数据积雪识别
Recognition of Snow Cover based on Features Selectionin GF-3 Fully Polarimetric Data
通讯作者:
收稿日期: 2019-12-27 修回日期: 2020-11-15 网络出版日期: 2021-01-25
基金资助: |
|
Received: 2019-12-27 Revised: 2020-11-15 Online: 2021-01-25
作者简介 About authors
马腾耀(1995-),男,山西长治人,硕士研究生,主要从事积雪遥感和数字图像处理研究E⁃mail:
关键词:
Keywords:
本文引用格式
马腾耀, 肖鹏峰, 张学良, 马威, 郭金金.
Ma Tengyao, Xiao Pengfeng, Zhang Xueliang, Ma Wei, Guo Jinjin.
1 引 言
基于SAR数据进行积雪识别的方法较多,大致可分为基于后向散射系数的方法、基于干涉测量的方法和基于极化分解的方法三类。第一类方法主要基于单频率、单极化数据的变化检测,计算同一地区湿雪和无雪图像的后向散射系数比值,再根据阈值识别湿雪[6,9]。但阈值不具有普适性,且该方法只针对湿雪制图,限制了其在积雪识别中的应用。在引入多频率、多极化数据后,可根据积雪与其它地物在不同极化方式和不同频率的后向散射系数差异识别积雪[8,10]。第二类方法利用干涉测量技术,根据降雪前后的相干系数差异识别积雪[11]。第三类方法利用极化分解技术获取多种散射信息,因不同地物在这些散射特征中具有不同表征,可利用积雪与其他地物的表征差异识别积雪[12];或将它们作为特征向量,利用机器学习方法识别积雪[13-14]。
2 研究区与数据
2.1 研究区
图1
2.2 数 据
研究采用国产GF-3卫星和美国Landsat 8卫星各一景影像。卫星过境时间分别为2017年11月15日0时19分和11月18日13时01分。此外,还使用了30 m 分辨率的航天飞机雷达地形测绘(Shuttle Radar Topography Mission, SRTM) DEM数据,将其用于GF-3数据的地理编码和地形校正。
使用的GF-3数据是L1A级单视复数图像,工作模式为全极化模式。每景数据包括图像数据文件、有理多项式系数(Rational Polynomial Coefficients, RPC)文件、图像元数据等,记录了4种极化方式(HH、HV、VH、VV)的回波信号。图像的像元值由复数构成,表示散射回波的强度和相位信息。Landsat 8数据使用蓝、绿、红和短波红外4个波段,主要利用Landsat 8图像辅助GF-3图像上的训练和验证样本选取。
为确定卫星过境时研究区的积雪干湿状态,使用了中国地面气候资料日值数据集(V3.0) (
2.3 数据预处理
GF-3数据的预处理是将回波信号转化为各种极化方式下的后向散射系数的过程。预处理包括多视、滤波、辐射定标、地理编码以及地形校正,这些步骤在PIE(Pixel Information Expert)软件完成,图1右图所示为GF-3图像预处理结果。
Landsat 8数据预处理是将DN值转换为大气层顶反射率值。预处理包括辐射亮度值转换、大气层顶反射率计算、图像配准、图像裁切,这些步骤在ENVI和ArcGIS软件完成。图2所示为Landsat 8图像预处理的结果,为了突出积雪与非积雪的差异,使用短波红外波段、红波段和绿波段进行RGB彩色合成,在合成图像中积雪区域显示为青色,非积雪区域显示为深浅不一的红色。
图2
图2
训练样本和验证样本在光学遥感图像上的分布
Fig.2
Distribution of training and validation samples in optical image
结合Landsat 8和GF-3图像共同确定训练和验证样本。训练样本以感兴趣区域的形式在GF-3图像上选取,由人机交互选择确定,共选取积雪样本52个区域(193像元)、非积雪样本60个区域(200像元)。统计显示,两类训练样本均各自服从正态分布。验证样本则是在GF-3图像上随机产生,生成验证样本347个区域(347像元),再根据光学图像确定验证样本的类别,包括积雪像元262个、非积雪像元85个。训练样本和验证样本的分布如图2所示。
3 方 法
3.1 散射机制分析
已有研究表明,在干雪且局部入射角低于60° 条件下,HH、HV、VH、VV极化有积雪覆盖的草地后向散射系数比无积雪覆盖的草地低2~3 dB[19]。研究区内的积雪主要分布在戈壁和耕地上,为探究识别干雪的可行性,在戈壁中选取了1 132个积雪像元、1 104个非积雪像元,在耕地中选取了829个积雪像元、812个非积雪像元进行表征分析。图3为戈壁和耕地的HH、HV、VV极化后向散射系数的分布,结果显示:各下垫面类型中积雪与非积雪样本均呈分离趋势。3种极化有积雪覆盖的戈壁后向散射系数比无积雪覆盖的戈壁低5 dB左右,两类具有很好的区分度;HH、VV极化有积雪覆盖的耕地后向散射系数比无积雪覆盖的耕地低2~3 dB左右,HV极化低3~4 dB左右。造成这些差异的原因很可能是电磁波穿透积雪介质时自身的衰减和干雪中含有微量的水分,这使得积雪覆盖地表的后向散射系数比无积雪覆盖的低,可为积雪识别提供依据。
图3
图3
不同下垫面类型积雪、无积雪覆盖地表后向散射系数分布
Fig.3
Distribution of backscattering coefficient of snow-covered and snow-free pixels under different surface conditions
积雪的后向散射由空气—雪界面面散射、雪层体散射、雪—地界面面散射和雪层体散射和雪—地界面面散射作用项组成。在干雪条件下,电磁波将穿透雪层,散射类型以雪—地界面的面散射为主,并包含少量的雪层体散射。当雪层中湿度较大时,将导致电磁波的穿透深度降低,此时散射包括空气—雪界面的面散射和雪层体散射。随着湿度的增加,穿透深度进一步降低,包含的雪层体散射会不断减少,空气—雪界面的面散射占主导地位。极化分解技术可将地物的后向散射系数分解为不同的散射类型,能提供更丰富的散射信息,可为积雪识别提供一种行之有效的方法。
3.2 极化特征获取
利用极化散射矩阵进行相干目标分解,利用极化相干矩阵或极化协方差矩阵进行非相干目标分解,以此得到积雪识别的特征。Pauli分解是常见的相干目标分解方法,H-A-
Pauli分解将极化散射矩阵转化为3种散射基的加权和。满足天线单站互易时,可得到Pauli分解的3种散射功率。从物理意义上可以理解为面散射功率、二面角散射功率和对应于非相干目标分解中的体散射功率[20]。
H-A-
Freeman分解对体散射、二面角散射和表面散射3种散射机制分别建模,将极化协方差矩阵分解为这3种散射的线性和[22]。该方法基于物理散射模型,对自然散射体的描述效果较好。求解极化协方差矩阵可得到二面角散射、体散射和面散射3种分量的散射功率。
为了对包含复杂几何散射结构的目标进行极化分解,克服Freeman分解在地形复杂区域适用性较差的问题,Yamaguchi等[23]向模型中加入第四种散射分量,该散射相当于螺旋体散射,弥补了Freeman分解无法应用于不对称散射的缺陷。并根据
利用上述5种极化分解方法对GF-3全极化数据进行极化分解,得到18种极化特征,加上4种极化后向散射系数,共计获取22种特征(表1)。根据相关文献和训练样本在各特征中的分布,大部分特征对积雪比较敏感,除散射各向异性度
3.3 特征优选与积雪识别
基于特征优选的积雪识别方法包括两部分。首先,使用全部特征利用随机森林方法进行积雪的初步识别,同时计算出各特征在积雪识别中的重要性;其次,根据特征的重要性进行特征优选,利用最优特征集识别积雪。
计算各特征的重要性采用的方法是向所有特征中逐一加入噪声,如果相应的特征对识别的贡献较强,分类器识别袋外数据时加入噪声前后的准确率会发生明显变化。利用识别准确率作为衡量标准反映特征的重要程度。利用样本集
其中:
通过上述过程,可以计算出每一特征在积雪识别中的重要性。特征优选是按照特征重要性大小向随机森林方法中逐个添加特征。每加入一个特征进行一次积雪识别,记录每次加入特征后积雪识别的总体精度,根据总体精度的变化确定最优特征集。利用最优特征集进行积雪识别,以期获得最优的识别结果。
3.4 积雪识别精度评价
本文基于随机产生的347个验证样本对积雪识别结果的精度进行评价。通过积雪识别结果与真值的比较,计算F测度和总体精度指标,以此评价积雪识别的精度。F测度包括准确率(Precision)、召回率(Recall)、F指数(F-score),其中准确率指积雪识别结果中积雪被正确识别的比例,记为
其中:
4 结果与讨论
4.1 特征优选前的积雪识别
特征优选前使用全部特征进行积雪识别。为了检验本文方法的性能,使用最大似然法、支持向量机和BP神经网络4种分类器作比较。基于选取的训练样本,利用十折交叉验证法对支持向量机和BP神经网络进行参数优化。使用径向基函数(Radial Basis Function, RBF)作为支持向量机的核函数,优化的参数为惩罚因子C和支持向量因子
图4
图4
特征优选前的积雪识别结果
Fig.4
Results of snow cover recognition before features selection
表2为精度评价结果。随机森林的F指数和总体精度均是最高的,达到了0.86和0.79。最大似然法的F指数和总体精度为0.83和0.75,识别效果次于随机森林。支持向量机的准确率最高,达到了0.90,但召回率仅有0.74,说明支持向量机的识别结果中虚警率低、漏检率高,导致识别结果中积雪范围有所低估。BP神经网络的识别结果最差,各指标均比其他分类器低。从积雪的初步识别结果来看,随机森林的识别精度最高。
表2 特征优选前不同分类器的识别精度比较
Table 2
分类器 | 准确率(P) | 召回率(R) | F指数(F) | 总体精度(A) |
---|---|---|---|---|
随机森林 | 0.87 | 0.84 | 0.86 | 0.79 |
最大似然法 | 0.88 | 0.77 | 0.83 | 0.75 |
支持向量机 | 0.90 | 0.74 | 0.81 | 0.74 |
BP神经网络 | 0.82 | 0.66 | 0.73 | 0.63 |
4.2 特征优选
特征优选是一个根据特定规则筛选特征的过程,包括特征的重要性评估和特征的筛选两个步骤。首先,对参与积雪识别的22个特征进行重要性评估,各特征的重要性在特征优选前进行积雪识别时产生,排序结果如图5所示。HH和VV极化后向散射系数的重要性最高,分别为0.88和0.64。其次,H-A-
图5
图5
特征重要性排序
(H3表示H-A-
Fig.5
Ranking of importance of features
进行特征重要性评估后,根据特征的重要性大小筛选最优特征集。随着特征数量的增加,总体精度的变化如图6所示。使用HH一个特征,总体精度仅为0.73;使用HH和VV两个特征,总体精度为0.77;使用重要性最高的3个特征时,总体精度达到最高值0.79。此后,总体精度在0.76~0.79之间变化。因此确定最优特征集为同极化后向散射系数(HH、VV)和H-A-
图6
图6
特征个数及积雪识别总体精度图
Fig.6
The number of features and overall accuracy of snow cover recognition
4.3 特征优选后的积雪识别
为了更准确地分析和对比4种分类器使用最优特征集时的识别结果,在图像中选取了3处有代表性的区域开展进一步分析(图8)。黄色框表示所选区域在研究区中的位置。
图8
图8
Landsat 8和GF-3图像及积雪识别结果细节图
Fig.8
Details of Landsat-8, GF-3 and results of snow cover recognition
区域1位于研究区东北部,属于地形起伏较大的山区,土地覆盖主要以草地、林地为主,因此积雪信号受地形和下垫面影响比较严重。比较4种分类器的识别结果发现,效果最好的是随机森林和支持向量机,可识别出主要的积雪范围;最大似然法效果最差,只有少部分积雪像元被正确识别。
区域2位于研究区东部,包含了农田及少量村庄,地势平坦。比较4种分类器的识别结果发现,最大似然法的识别结果中,规则农田的轮廓识别的比较完整,但积雪范围被低估;随机森林可识别出主要的积雪范围,但农田的轮廓不完整;支持向量机的识别结果精度最差,出现了大量的误判现象。
区域3位于研究区的西南部,平均海拔比周边地区高百米左右,主要以戈壁、草地和少量灌木组成。比较识别结果发现,随机森林的结果最佳,积雪与非积雪区域的边界比较清晰;其他分类器的识别结果中,积雪与非积雪的边界区域误判现象较多,其中BP神经网络的识别结果最差。
4种分类器识别结果和真值的比较结果如表3所示,粗体数值表示特征优选后的精度比特征优选前的高,正体数值表示特征优选前后精度不变,正体数值加下划线表示特征优选后精度降低。随机森林方法使用最优特征集与使用全部特征时精度基本保持不变。此外,4种分类器的召回率均有所提高,即漏检率减少,说明特征优选后对积雪识别有用的特征增多,从而提高了识别精度。从结果来看,基于特征优选和随机森林方法进行积雪识别时效果最佳。
表3 特征优选后不同分类器的识别精度比较
Table 3
分类器 | 准确率(P) | 召回率(R) | F指数(F) | 总体精度(A) |
---|---|---|---|---|
随机森林 | 0.87 | 0.86 | 0.79 | |
最大似然法 | 0.88 | 0.79 | 0.83 | 0.76 |
支持向量机 | 0.77 | 0.82 | 0.75 | |
BP神经网络 | 0.87 | 0.76 | 0.81 | 0.73 |
5 结 论
本文利用国产GF-3数据提出了一种基于特征优选的积雪识别方法。首先,通过极化分解技术提取积雪识别的候选特征;然后,利用随机森林方法计算各候选特征的重要性;再根据特征的重要性选择对识别贡献较大的特征,构建最优特征集进行积雪识别。
分析特征的重要性发现,在使用最重要的3个特征时积雪识别精度达到最高,因此确定最优特征集为HH、VV和H-A-
虽然在实验中,特征优选前后积雪识别的精度只有较小幅度的提高,但是因为随机森林的训练速度快,可利用特征优选进行数据的降维处理,所以本文方法在进行大尺度、大样本的积雪识别时具有很大的潜力。
参考文献
The Spatial and Temporal Variations of Snow Cover over the Qilian Mountains based on MODIS Data
[J].
基于MODIS的祁连山区积雪时空变化特征
[J].
Comparison and Analysis on Methods of Snow Cover Mapping by Using Satellite Remote Sensing Data
[J].
卫星遥感雪盖制图方法对比与分析
[J].
Long-term Change of Seasonal Snowcover and Its Effects on Runoff Volume in the Upper Reaches of the Tarim River
[J].
塔里木河上游地区积雪长期变化趋势及其对径流量的影响
[J].
A Review of the Progresses of Avalanche Hazards Research
[J].
国内外雪崩灾害研究综述
[J].
Temporal and Spatial Distribution of Snow Cover in Xinjiang from 2002 to 2011
[J].
2002~2011年新疆积雪时空分布特征研究
[J].
Retrieval of Wet Snow by Means of Multitemporal SAR Data
[J].
Research Progresses of High-resolution Remote Sensing of Snow in Manasi River Basin in Tianshan Mountains,Xinjiang Province
[J].
新疆天山玛纳斯河流域高分辨率积雪遥感研究进展
[J].
Recognition of Supraglacial Debris in the Tianshan Mountains on Polarimetric SAR Images
[J].
Wet Snow Cover Mapping Algorithm based on Multitemporal COSMO-SkyMed X-Band SAR Images
[J].
SAR Interferometry Coherence Analysis and Snow Mapping
[J].
SAR干涉测量的相干性特征分析及积雪划分
[J].
Application of Incoherent Target Decomposition Theorems to Classify Snow Cover over the Himalayan Region
[J].
Classification and Snow Line Detection for Glacial Areas Using the Polarimetric SAR Image
[J].
Wet and Dry Snow Detection Using Sentinel-1 SAR Data for Mountainous Areas with a Machine Learning Technique
[J].
Random Forest Classifier for Remote Sensing Classification
[J].
Global Land Cover Mapping at 30 m Resolution: A POK-based Operational Approach
[J].
Hydrological Processes Responding to Climate Warming in the Upper Reaches of Kelan River Basin with Snow-dominated of the Altay Mountains Region,Xinjiang,China
[J].
新疆阿尔泰山区克兰河上游水文过程对气候变暖的响应
[J].
An Analysis on the Relationship between Streamflow and Precipitation in Altay Mountains Region
[J].
我国阿尔泰山的降水及河流径流分析
[J].
Characterization of C band SAR Image for Snow in Mountainous Areas of Manasi River Basin
[J].
玛纳斯河流域山区积雪的C波段SAR图像表征
[J].
Image Processing of Fully Polarimetric SAR
[M].全极化合成孔径雷达图像处理
[M].
An Entropy based Classification Scheme for Land Application of Polarimetric SAR
[J].
A Three-Component Scattering Model for Polarimetric SAR Data
[J].
Four-Component Scattering Model for Polarimetric SAR Image Decomposition
[J].
A Four-Component Decomposition of POLSAR Images based on the Coherency Matrix
[J].
Three-Component Model-based Decomposition for Polarimetric SAR Data
[J].
Four-Component Decomposition of Polarimetric SAR Images with Deorientation
[J].
Multi-feature-based Classification Method Using Random Forest and Superpixels for Polarimetric SAR Images
[J].
综合多特征的极化SAR图像随机森林分类算法
[J].
Random Forest and Rotation Forest for Fully Polarized SAR Image Classification Using Polarimetric and Spatial Features
[J].
Identification of Typical Land Features in the Lijiang River Basin with Fusion Optics and Radar
[J].
基于GF-1 和Sentinel-1A 的漓江流域典型地物信息提取
[J].
Practical Selection of SVM Parameters and Noise Estimation for SVM Regression
[J].
/
〈 |
|
〉 |
