利用提升树模型综合Gabor和LPQ特征进行遥感地物识别
1.
2.
3.
Boosting Tree Model with Gabor and LPQ Feature Fusion of HSI Ground Object Recognition
1.
2.
3.
通讯作者:
收稿日期: 2020-09-23 修回日期: 2021-01-12
基金资助: |
|
Received: 2020-09-23 Revised: 2021-01-12
作者简介 About authors
姜亚楠(1993-),女,河北邢台人,硕士研究生,主要从事统计学、机器学习在遥感图像分类方面的应用研究E⁃mail:
关键词:
Keywords:
本文引用格式
姜亚楠, 张春雷, 张欣, 徐权威, 张舒涛, 周锐.
Jiang Yanan, Zhang Chunlei, Zhang Xin, Xu Quanwei, Zhang Shutao, Zhou Rui.
1 引 言
传统的高光谱遥感图像分类大多是基于图像像元信息的提取,利用光谱信息将像元归为某一类,孤立地考虑单个像元的类别归属问题,忽略了图像本身具有的多尺度关系和空间纹理结构等信息,导致最终分类结果出现“椒盐”现象[4]。此外,随着高光谱遥感技术的发展,图像分辨率大幅提高,使得现如今的高光谱遥感图像中包含复杂的非线性特征[5],而且还具有高精细的光谱信息和高清晰的空间信息,这就使得对图像中的地物特征进行描述时会出现同一地物具有多种不同结构特征的同物异构问题,同时高光谱图像存在的高维特性、近邻波段间较强的相关性以及异物同谱和同谱异物的问题,导致高光谱图像分类存在诸多困难。因此,如何有效地从高光谱数据中提取图像的区域非线性判别特征,有效缓解“椒盐”现象,提高各类地物间的特征区分性,成为了近年来HSI分类中的研究热点。
在图像的空间域中提取特征信息的方法在遥感图像分类中较为常见,大量的文献提出了各种方法从图像区域提取其纹理特征。传统的方法进行纹理分析时,常采用如共生矩阵、二阶统计量Gauss-Markov随机场和局部二值模式[6-8]等方法,提高了模型的特征提取能力,但均局限于在单一尺度上进行分析相对较小邻域的图像空间的相互作用。对此,我们已进行探究并提出了采用多尺度灰度和LBP纹理结构特征融合方法[9]来进一步有效提取图像的多尺度特征信息,提升模型的识别性能。Gabor函数由于其能够很好地兼顾信号在时域和频域中的分辨能力,充分描述图像的纹理信息而越来越多地被应用于遥感影像纹理特征的描述与提取中[10],通过捕获图像的多个方向不同尺度的属性特征对图像纹理结构进行有效表征。刘恂等[11]提出了一种基于局部Gabor二进制模式的空间分类方法,将Gabor滤波器与LBP的思想结合提取高光谱图像的纹理特征,并采用多核支持向量机进行分类,提高了高光谱遥感图像伪装目标的分类精度。局部相位量化(Local Phase Quantization,LPQ)是在频域中提取图像特征的一种描述符[12],具有相位模糊不变性,常用于人脸识别、表情识别等[13-14]。融合Gabor、LBP和LPQ算子提取的图像特征的方法已被应用于人脸识别中[14],却很少应用于HSI分析中。
针对传统遥感地物识别中特征提取结构化方法的不足,将高光谱遥感图像空间域的结构特征和频率域的纹理结构信息充分考虑在内,提出了一种综合多尺度Gabor和LPQ特征(Ms_GLPQ)的空谱融合遥感地物识别模型,对图像进行多通道滤波和多尺度分解,捕捉图像空域、频域上显著的多尺度方向和结构特征变化信息并融合,从而生成了区分性更强的多特征区域结构描述子,能够获得较为充分地描述不同地物之间差异的区别性特征。对于获取的多尺度特征维度较高的问题,利用PCA降维去除过多的冗余信息,最后结合提升树的分类方法进行地物识别,在高光谱遥感图像地物识别领域进行了实验,验证了提出方法的有效性。
2 模型整体结构
研究提出了综合多尺度Gabor和LPQ特征(Ms_GLPQ)的方法模型,通过充分利用图像空域分析和频域分析的方法,较为形象直观地描述了图像空间域中的灰度变化情况和频域中的梯度分布情况,有效结合了高光谱图像空间域和频率域的结构分布和纹理特性,进而得以更简练的描述图像特征,提升高光谱图像的识别精度。具体步骤包括5个部分:①图像预处理;②Gabor滤波器组特征提取;③LPQ算子特征提取;④降维及特征融合;⑤利用提升树的分类器进行识别。
方法模型的整体框架如图1所示,在获取高光谱图像原始数据后,首先对其进行图像预处理操作,达到降维去噪的效果;然后利用多尺度、多方向滤波输出组成的Gabor滤波器组提取遥感图像空间域上的特征信息,得到对应的特征图;同时采用LPQ描述符提取遥感图像频率域上的多尺度纹理结构特征;接着对于获取的空间域和频率域上的多尺度信息再进行PCA降维,消除提取到的特征的冗余,提高计算效率,再进行特征融合操作,获得适当维度且能够充分描述图像结构信息、表征能力强的遥感图像特征;最后利用基于提升树的分类器进行地物识别,得到了较为优异的高光谱遥感图像地物识别结果。
图1
2.1 2D Gabor滤波器
Gabor滤波器能够捕捉遥感图像中特定空间局域性和选择方向对应的局部结构,在遥感地物识别中对光照和灰度变化具有一定的识别性和鲁棒性。由于滤波器不同的中心频率能反映出图像纹理本身所具有的周期性特征,因此对应于特征点的主要频率分量,可以选择一组不同频率的带通窄带滤波器以提取遥感图像中的纹理结构特性。通过利用二维Gabor滤波器的不同参数组合能够对图像进行不同方向和尺度的纹理信息提取,且图像对不同参数下滤波的响应程度也存在明显的差异。
二维Gabor滤波器是由Daugman[15]提出的,可以看作是一个正弦波与高斯核函数调制的结果,具有空间局域性和方向选择性,经Gabor滤波后的每个特征图都描述了图像的不同视觉信号在各种频率和方向的不同特征表现。其函数定义如下:
其中:
2.2 局部相位量化
其中:
在频域中图像的幅值(magnitude)和相位(phase)计算较为简单,分别如下:
当PSF是中心对称时,其Fourier变换
其中:
为了进一步提高方法性能,解决获取的LPQ特征冗余和旋转不变性问题,Ojansivu等[16]还提出了具有旋转不变性的LPQ算子(Ri-LPQ),对图像的每一个像素点计算典型方向,然后将每个局部邻域旋转到典型方向并计算LPQ特征,这就使得Ri-LPQ具有旋转不变性。
2.3 提升树模型
提升方法(Boosting)是一种高效且广泛使用的机器学习方法,也是一种重要的集成方法。其原理是通过对弱分类器反复学习,得到一系列弱分类器组,并赋予每个弱分类器不同的权重,然后将其进行线性组合构成一个强分类器,进而极大提高了分类性能。针对不同问题的提升树方法,主要区别在于损失函数的不同。通过许多弱学习器的线性组合可以很好地拟合训练数据,使其训练误差较小,得到一个强学习器,即使面临输入、输出数据之间的复杂关系时也可以起到较好的拟合效果,使其达到提升分类识别精度的目的。
3 实验与分析
对提出的Ms_GLPQ模型在遥感图像地物识别中应用的有效性进行评价,利用不同的分类器进行识别,对比模型在各种设置下的识别性能。
3.1 数据集介绍
表1 实验数据集信息
Table 1
数据集 | 获取地点 | 成像仪器 | 图像大小 | 波长/ | 波段数 | 空间分辨率/ |
---|---|---|---|---|---|---|
Indian Pines | 美国印第安纳州印度松树林 | AVIRIS | 145×145 | 0.40~2.50 | 200 | 20 |
Salinas | 美国加利福尼亚州 Salinas 山谷 | AVIRIS | 512×217 | 0.40~2.50 | 204 | 3.7 |
茶树 | 江苏省常州市方麓村茶树种植基地 | PHI | 512×348 | 0.417~0.855 | 80 | 2.25 |
3.2 典型地物数据的测试结果
利用Gabor滤波器组构建了包含8个方向(θ=0°,22.5°,45°,67.5°,90°,112.5°,135°,157.5°)、8个尺度(λ=3,5,7,9,11,13,17,21)的2D Gabor滤波器组,从而将遥感图像不同尺度和方向的特征信息提取出来。如图1(b)所示,水平方向上为同一尺度下不同角度的滤波器结构特征,竖直方向则表示Gabor滤波器尺度逐渐增大(即频域窗口逐渐增大,中心频率对应着由小到大)变化,因而通过Gabor滤波器提取出的图像特征逐渐从描述图像的边缘细节等信息,转变为刻画图像的整体灰度轮廓特征等信息。此外对LPQ也采用多尺度分析的方法,选取同样的上述8种尺度的LPQ获取图像多层频域纹理结构信息,从而获取对图像频域信息较为全面的描述。
3.2.1 利用Gabor滤波器的特征提取
图2
3.2.2 利用LPQ描述符的特征提取
同样地,以Salinas图像中的某一波段的两类典型地物块为例进行多尺度LPQ操作,得到不同尺度的参数对应的特征直方图。选取的尺度与上述Gabor滤波器组所采用的尺度相对应(即λ=3, 5, 7, 9, 11, 13, 17, 21)。通过利用不同的尺度得到图像频域上的相位模糊不变特征描述,如图3所示。尺度较小时,多尺度LPQ可以获得图像在频域上的小尺度的直方图统计特征;且随着特征提取尺度的不断加大,其直方图特征中所包含的信息逐渐增加。此外对于不同类地物在一种尺度下特征难以区分时,选取另一种尺度就可能成功将其区分开,进一步表明了不同尺度LPQ可以获取图像不同纹理结构信息。
图3
图3
不同尺度LPQ统计直方图特征
Fig. 3
Statistical histogram features of LPQ at different scales
3.3 实验结果分析
对3类高光谱遥感图像样本的预处理过程进行可靠性分析,将全部原始数据与经过PCA后选取能够解释图像大部分信息(即方差贡献率97%及以上)的前8主成分的数据(以下均称为PCA8)进行的分类识别对比测试。同时在进行分类识别时,选取各组数据集中每类样本的3%进行训练,全部数据进行预测,利用不同的机器学习分类器(SVM、Bayes、XGBoost、CatBoost等)分别对实验数据进行分类识别得到不同的结果。
由表2可知,尽管一般采用原始数据进行分类可以得到较高的精度,但由于其原始数据维度过多,会导致运算效率较低;而经PCA操作后的PCA8数据可以对原始数据可以起到去噪/降维的效果,将数据量大大压缩,减少了运算成本,与此同时也未损失太多精度,表明对原始高光谱遥感图像进行PCA预处理的方法是可行的,并且这样有利于对其进行后续的特征提取和分类。在此基础上,对测试数据集分别通过Gabor滤波器组和多尺度LPQ算法提取遥感图像多尺度多方向的空间和频率域上的纹理结构特征信息,从而使得特征对图像的描述更加地充分,不同类地物之间特征区分明显。但由于采用的Gabor核的尺度和角度较多使得最终获取的特征维度较高,且存在特征冗余问题,因此再次进行特征降维操作是不可避免的。对此仍采用PCA方式选取能够解释图像大部分特征信息的前20主成分(方差贡献率均在99%以上)对提取的多层Gabor特征进行处理,接着再进行后续的融合与分类识别。
表2 I图像预处理效果对比(%) (%)
Table 2
分类器 | Indian Pines | Salinas | 茶树 | |||
---|---|---|---|---|---|---|
原始 数据 | PCA8 | 原始数据 | PCA8 | 原始数据 | PCA8 | |
SVM | 55.66 | 54.36 | 78.73 | 80.53 | 90.93 | 90.27 |
Bayes | 50.40 | 51.85 | 74.82 | 78.07 | 85.55 | 89.2 |
BP | 73.72 | 57.34 | 88.90 | 85.31 | 91.98 | 90.52 |
DT | 55.62 | 56.52 | 81.34 | 80.88 | 87.36 | 86.88 |
RF | 72.38 | 66.46 | 87.14 | 87.04 | 91.1 | 90.98 |
XGBoost | 69.43 | 64.57 | 86.01 | 86.06 | 90.58 | 90.42 |
LightGBM | 69.88 | 64.42 | 86.47 | 85.85 | 89.73 | 89.07 |
CatBoost | 71.26 | 67.36 | 88.04 | 87.24 | 91.54 | 91.39 |
表3 Indian Pines数据集不同算法性能比较(%) (%)
Table 3
分类器 | Indian Pines | |||
---|---|---|---|---|
PCA8 | 多尺度Gabor | 多尺度LPQ | Ms_GLPQ | |
SVM | 54.36 | 73.69 | 62.23 | 63.28 |
Bayes | 51.85 | 61.30 | 69.29 | 69.36 |
BP | 57.34 | 80.52 | 71.43 | 71.30 |
DT | 56.52 | 69.89 | 65.16 | 66.90 |
RF | 66.46 | 82.03 | 82.41 | 83.48 |
XGBoost | 64.57 | 78.55 | 80.31 | 80.66 |
LightGBM | 64.42 | 79.28 | 81.28 | 81.85 |
CatBoost | 67.36 | 83.80 | 85.58 | 85.88 |
表4 Salinas数据集不同算法性能比较(%) (%)
Table 4
分类器 | Salinas | |||
---|---|---|---|---|
PCA8 | 多尺度Gabor | 多尺度LPQ | Ms_GLPQ | |
SVM | 80.53 | 71.38 | 84.84 | 85.05 |
Bayes | 78.07 | 69.62 | 72.42 | 72.77 |
BP | 85.31 | 80.31 | 89.56 | 89.09 |
DT | 80.88 | 81.42 | 82.18 | 81.47 |
RF | 87.04 | 88.48 | 93.75 | 94.13 |
XGBoost | 86.06 | 87.01 | 89.49 | 90.99 |
LightGBM | 85.85 | 87.12 | 90.87 | 91.85 |
CatBoost | 87.24 | 88.92 | 94.29 | 94.42 |
表5 茶树数据集不同算法性能比较(%) (%)
Table 5
分类器 | 茶树 | |||
---|---|---|---|---|
PCA8 | 多尺度Gabor | 多尺度LPQ | Ms_GLPQ | |
SVM | 90.27 | 77.41 | 84.04 | 85.20 |
Bayes | 89.20 | 64.05 | 85.15 | 85.22 |
BP | 90.52 | 83.65 | 88.22 | 88.48 |
DT | 86.88 | 80.77 | 81.58 | 82.65 |
RF | 90.98 | 87.41 | 90.53 | 90.35 |
XGBoost | 90.42 | 86.93 | 90.49 | 90.72 |
LightGBM | 89.07 | 86.22 | 90.29 | 90.45 |
CatBoost | 91.39 | 88.58 | 92.59 | 92.61 |
从表3~表5分类识别的结果可以看出,在每个测试数据集分别经多尺度Gabor和多尺度LPQ提取特征后进行分类的结果与PCA8的结果相比均有提升,但只有当使用Ms_GLPQ方法时得到最高的识别精度。在Indian Pines数据上识别精度最高提升了18.52%,在Salinas数据集上提升了7.18%,而在茶树数据上效果不明显,不过也提升了1.22%。Gabor滤波器组可以获取图像在多个方向和尺度上的纹理信息,同时在一定程度上降低了图像中的光照变化和噪声影响,得以充分利用图像的空间纹理结构信息,从而使得获取的Gabor特征具有较强的类别表征能力,然后经融合多尺度局部相位量化方法(Ms_LPQ)提取的特征,可以表达遥感图像在频域上所具有的模糊不变纹理结构信息,进而提高分类识别效果。
此外当对高光谱遥感图像进行分类识别时,在采用提升树的分类模型上获得的分类效果普遍优于其他的统计模型分类器,这是由于在高光谱遥感数据中各属性间具有一定的线性或非线性关系,即使通过不同的算法进行特征提取后,属性间的特征的关联性仍然存在。而采用提升树模型进行分类识别时,由于模型的自身优势使其对于分布较为复杂稠密的数据表达和泛化能力均较强,能够发掘各属性特征之间的高阶关系,进而使得提升树模型的分类精度普遍较高。其中,CatBoost作为一种新颖而特殊的模型,在每组测试数据集上均获得了最高的识别精度。它不仅能够高效处理类别性特征,还可以充分利用特征之间的联系,能够有效避免常见的梯度偏差问题,从而实现在多尺度空频域特征提取模型下HSI的精确分类,为地物识别提供了有效可行的方法。
图4
4 结 语
实验提出了一种基于提升树的多尺度分析高光谱地物识别模型(Ms_GLPQ),通过Gabor滤波器组能够获取HSI在多个尺度和方向上的具有强类别表征能力的图像空间结构特征,实现在空域中对高光谱遥感图像结构特征的描述;然后通过多尺度LPQ描述符提取了图像频域上的相位模糊不变结构特征信息,增强了HSI地物的类间特征差异,表征了HSI图像在频域上的空间结构信息;最后基于提升树的机器学习分类器实现了遥感地物的分类识别。在标准的HSI公开数据集上的识别结果表明,提出的模型能够获得蕴含更多结构和纹理信息的较为全面的图像特征描述,充分利用了高光谱遥感目标识别的空域和频域的特征信息,有效提升了遥感地物识别的精度。但该模型还存在不足,针对预处理和特征提取过程中出现的信息冗余问题,模型仅简单地采用PCA方式进行处理有一定的局限性,因此在今后的研究工作中可针对数据预处理和特征约简问题继续进行优化改进,为提升高光谱遥感地物的识别精度提供新颖有效的技术手段。
参考文献
The need for accurate geometric and radiometric corrections of drone-borne hyperspectral data for mineral exploration: Mephysto—A toolbox for pre-processing drone-borne hyperspectral data
[J]. ,
Mapping major land cover types and retrieving the age of secondary forests in the Brazilian Amazon by combining single-date optical and radar remote sensing data
[J]. ,
Spectral similarity approach for mapping turbidity of an inland waterbody
[J]. ,
Land cover mapping using time series HJ-1 /CCD data
[J]. ,
基于时间序列 HJ-1 /CCD 数据的土地覆盖分类方法
[J],,
Research on Land use information extraction based on U-Net
[J]. ,
基于 U-Net 的高分辨率遥感图像土地利用信息提取
[J]. ,
Semisupervised hyperspectral image segmentation using multinomial logistic regression with active learning
[J]. ,
Automatic detection of shrub location, crown area, and cover using spatial wavelet analysis and aerial photography
[J]. ,
Remote sensing image classification based on texture features by multivariate local binary pattern
[J]. ,
基于多元局部二值模式的遥感图像纹理提取与分类
[J].,
Classification of remote sensing images based on multi-scale feature fusion using local binary patterns
[J]. ,
基于多尺度LBP特征融合的遥感图像分类
[J].,
Remote sensing image feature and classification based on Gabor function
[J]. ,
基于Gabor函数的遥感影像特征与分类
[J],,
Spatial classification method for hyperspectral camouflage targets image based on local Gabor binary patterns
[J]. ,
基于局部Gabor二进制模式的高光谱伪装目标图像分类(英文)
[J],,
Blur insensitive texture classification using local phase quantization
[C]∥
Face recogniton based on multi-feature optimization fusion of LBP and Gabor with multi-scale blocks
[J]. ,
基于不同分块多特征优化融合的人脸识别研究
[J],,
Facial expression recognition based on Gabor, LBP and LPQ feature
[J]. ,
融合Gabor、LBP与LPQ特征的面部表情识别
[J],,
Two-dimensional spectral analysis of cortical receptive field profiles
[J]. ,
Rotation invariant local phase quantization for blur insensitive texture analysis
[C]∥
Xgboost: A scalable tree boosting system
[C]∥
CatBoost: unbiased boosting with categorical features
[C]∥
The Airborne Visible/Infrared Imaging Spectrometer (AVIRIS)
[J]. ,
Hyperspectral remote sensing cataset for tea farm
[DB/OL]. ,
/
〈 | 〉 |