一种像素与对象相结合的林区建筑物识别方法
Building Recognition Method in Forest Districts Combining the Pixel-level and Object-level
通讯作者:
收稿日期: 2020-07-17 修回日期: 2021-09-05
基金资助: |
|
Received: 2020-07-17 Revised: 2021-09-05
作者简介 About authors
刘倩(1996-),女,湖北武汉人,硕士研究生,主要从事森林灾害遥感监测研究E⁃mail:
关键词:
Keywords:
本文引用格式
刘倩, 胡心雨, 李晓彤, 覃先林.
Liu Qian, Hu Xinyu, Li Xiaotong, Qin Xianlin.
1 引 言
航天遥感技术的发展使获取大面积的高空间、高光谱和高时间分辨率的遥感数据成为可能[1]。如何利用高空间分辨率光学遥感影像实现自动、快速且准确地识别建筑物一直都是一个研究热点[2]。在高空间分辨率光学遥感建筑物目标识别中,国内外学者利用QuickBird、IKONOS、GF-2、ZY-3等数据开展研究,并形成了相应的方法[3-6]。根据目标识别基本单元的不同可将识别方法归纳为:像素级、对象级和二者结合的建筑物识别方法。像素级方法以像元为基本单位,利用其光谱、纹理、形状等特征识别建筑物目标[7-8],但由于该方法会产生明显的椒盐现象而导致识别精度偏低。赵春晖等[8]利用数字表面模型(Digital Surface Model,DSM),融合像元光谱、空间邻域、纹理特征和支持向量机(Supporting Vector Machine,SVM)判决获得的高层语义特征,提升了建筑物提取效果。随着人工智能的快速发展,采用具有识别深层抽象特征的深度学习方法进行建筑物识别受到越来越多的关注[2,9-11],但该方法存在需要大量训练样本、计算机配置要求较高等局限性。近年来面向对象的地理图像分析(Geographic Object Based Image Analysis, GEOBIA)[12]的发展,推动了不同对象级建筑物目标识别方法的出现[13-15]。不同的分割方法将影像分为若干多像素的同质区域(对象),综合考虑影像对象的多种特征,可以得到较高精度 的识别结果,如Attarzadeh等[16]利用对象级光谱、几何和上下文特征,建筑物提取精度80%以上,但寻找最佳分割尺度是一个挑战。为克服像素级和对象级在利用高分数据识别建筑物中存在的不足,一些学者[17-18]尝试将二者结合,首先从像素中进行建筑物初提取,再采用对象级方法进行后识别,如林雨准等[17]利用形态学建筑物指数(Morphological Building Index,MBI)和形状特征进行轮廓初提取,而后基于多尺度分割后对象的纹理特征,在多个尺度下进行对象级识别,通过决策级融合获得最终建筑物识别结果,其精度比MBI法提高10%左右。
国内现有的建筑物识别方法大多是针对城市建筑物的特征研究建立,而林区内的建筑物通常具有比城市建筑物低矮、分散、且聚集规模小等特征,容易受到高大树木的遮蔽,也会受农田、裸地、道路等干扰影响识别精度[10],同时观测角度和太阳角度等产生的阴影也会影响识别精度[14]。准确掌握林区内建筑物分布状况,不仅对于森林扰动监测、土地利用调查等是不可或缺的信息,同时还可为更快速便捷地处理林区内违规建筑事件提供技术服务。因此,研究构建适用于我国林区内建筑物的高分遥感检测技术方法,对于我国林区的保护具有重要的现实意义。研究利用国产高分二号(GF-2)卫星数据,提出一种像元级和对象级相结合的林区内建筑物高分遥感的识别方法,以期为林区人为扰动信息的监测提供技术方法。
2 研究区和数据源
2.1 研究区概况
选取四川蜀南竹海风景名胜区为研究区,其位于四川省宜宾市长宁县和江安县交界处,范围为104°56′04″~105°04′22″E,28°26′58″~28°30′53″N。蜀南竹海总面积120 km2,地势中部最高,东部略高于西部,海拔范围为260~1 000 m。地处亚热带季风气候区,气候温和,四季分明,年平均气温为15.5 ℃,年降水量1 200~2 000 mm,无霜期345 d,植被类型以竹林为主,森林覆盖率大于87%[19]。
与城市高大密集的建筑物不同,该林区内建筑物属于较为矮小的居民建筑物,大多靠近农田,沿道路附近分布。为节省运算时间,在林区内选择一个包含研究区内的所有地物类型、具有代表性的试验区(影像大小为1 176像素×975像素)进行预试验,以确定纹理特征的最佳窗口。研究区和试验区域如图1所示。
图1
2.2 数据获取与预处理
选取了2018年3月9日覆盖该保护区的两景GF-2 PMS 1A级无云影像数据(数据来源于中国资源卫星应用中心)作为该研究的卫星数据源。每景影像包括空间分辨率为1 m的全色和4 m的多光谱两种数据。
首先对GF-2 PMS 1A级数据进行绝对辐射定标和FLAASH大气校正(定标参数、波谱响应函数均来源于中国资源卫星应用中心),然后基于产品数据自带的RPC信息进行正射校正,融合方法采用Gram-Schmidt Pan Sharpening算法,并拼接和裁剪得到研究区的空间分辨率为1 m的多光谱影像。
3 研究方法
3.1 研究路线
图2
3.2 像素级提取
3.2.1 特征集构建
光谱特征是不同地物的最基本特征,在此基础上选择与建筑物和植被等信息相关性高的MBI[6,17,21]和归一化植被指数(Normalized Difference Vegetable Index,NDVI)作为特征指数,其中MBI原理与计算过程见文献[21],NDVI计算公式见文献[22]。采用灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)方法[23]计算影像纹理特征;为加快运算速度,选择利用经过预处理后的GF-2全色影像初识别出8个纹理指标,最终待选的特征见表1。由于整个研究区范围较大,进行纹理特征的最佳尺度研究耗时过长,为高效、准确选出最佳纹理尺度,以试验区为例选择12个不同的移动窗口,即3×3、5×5、7×7、9×9、11×11、13×13、15×15、17×17、19×19、23×23、27×27、31×31,分别与光谱特征结合进行基于RF算法的像元级建筑物识别,结果发现当纹理窗口为7×7时像素级建筑物识别的质量最高,故选择该纹理窗口进行纹理特征的构建。
表1 待选特征数据集
Table 1
特征类型 | 特征指标 |
---|---|
光谱特征 | 融合影像的4个波段光谱值(Band1、Band2、Band3、Band4) |
纹理特征 | 基于GLCM的均值(Mean)、方差(Variance)、均匀性(Homogeneity)、对比度(Contrast)、非相似性(Dissimilarity)、信息熵(Entropy)、二阶矩(Second Moment)、相关性(Correlation) |
特征因子 | NDVI、MBI |
由于利用GLCM计算的纹理特征之间存在冗余,故利用RF-RFE对其进行特征筛选。RF是一种以决策树为基础分类器、非线性的机器学习集成算法,其优势在于设置参数少、速度快、精度高,在特征优选和影像分类方面应用广泛[24]。其算法流程主要包括:
(1)选取足量训练样本,采用自助法(Bootstrap)从原始样本集中多次随机重复采样,抽取与样本容量相等的样本子集n个。
(2)确定将样本分裂到左右两个子集的m个随机特征,分别建立对应的决策树模型。
(3)对样本进行分类,依次分裂直至满足停止的规则为止,构建若干棵决策树组成一个森林,然后采用多数投票法确定最终结果。
在利用RF进行特征重要性计算的基础上,采用后向迭代的RFE法筛选特征子集。算法原理和流程见文献[28]。
3.2.2 建筑物初识别
3.3 影像分割
GEOBIA中的核心问题是影像分割,现有的分割算法比较多,其中多尺度分割算法(Multiresolution Segmentation)[32]结合影像的光谱、纹理、空间和上下文等信息,实现分割对象异质性最小化,其应用十分广泛,该算法需要设置的最重要参数是分割尺度,其次是形状指数和紧密度指数。利用eCognition Developer 9.0软件,采用多尺度分割算法获得影像对象。在探索最佳分割结果过程中,利用GF-2融合影像,将分割尺度范围定为20~120,步长为10;形状指数和紧密度指数范围均定为0.1~1,步长均设置为0.1,经过多次尝试后发现当分割尺度、形状指数和紧密度指数分别为40、0.5和0.9时效果最佳,尽管仍存在部分过分割,但保证了每个对象接近同质。
3.4 建筑物后提取
其中:Predict(o)、Predict(p)分别为对象O和像元p属于建筑物的识别结果;0和1分别表示非建筑物和建筑物。
3.5 精度评价
其中:Si表示最终的建筑物识别结果与目视解译结果交集的像元数;Su表示最终的建筑物识别结果与目视解译结果并集的像元数;St表示目视解译结果的像元数;Sp表示最终的建筑物识别结果的像元数。
4 结果与分析
4.1 特征重要性度量
图3
图4
图4
特征维数与分类精度关系图
Fig.4
Relationship between feature dimension and classification accuracy
4.2 不同分类器的像素级分类结果分析
利用从GF-2影像目视解译生成的建筑物、水体、植被、农田、裸地(包括道路)和阴影等6类训练样本,采用筛选后的分类特征,对利用RF和SVM分类器识别的像素级建筑物结果精度进行比较分析;两种分类器识别的建筑物的精度评价结果见表2。
表2 两种分类器建筑物识别精度评价结果
Table 2
分类器 | 正确率 | 完整率 | 质量 |
---|---|---|---|
RF | 0.64 | 0.72 | 0.51 |
SVM | 0.65 | 0.75 | 0.54 |
从表2中可以看出,从正确率、完整率和质量3个指标来看,SVM算法都比RF算法的精度更高。故选择SVM分类器所得到的像素级建筑物识别结果,与分割对象结合,对该研究区建筑物进行后续识别。
4.3 对象目标下阈值T 对识别精度的影响分析
图5
图5
建筑物识别精度随阈值T的变化分析结果
Fig.5
Building recognition accuracy of the article’s method varies with the threshold T
从图5中可以看出,建筑物识别的完整率随阈值T的增大而逐渐降低,正确率随之逐渐上升,识别质量则随之先上升后降低。当 T 较小时,利用分割的对象对完整率较高的像素级建筑物识别结果进行后处理,使得其结果完整率较高,但由于少部分错检像元也得以保留导致结果正确率较低;当T 增大时,更多错检的孤立像元和小片段对象被剔除,而部分漏检像元占比较高的建筑物对象被划分为非建筑物,故而正确率会上升而完整率降低。
4.4 不同方法比较分析
根据以上分析,最终确定选用SVM分类器识别的建筑物作为像素级识别结果;利用多尺度分割方法对预处理后的融合影像进行对象分割,基于此分割结果,同样选择SVM分类器获得对象级建筑物识别结果;结合像素级识别结果和影像分割结果,将阈值T设定为0.5,得到最终建筑物识别结果;并将本文方法与文献[16]的方法进行对比。由于研究区范围较大,为显示清晰,以试验区为例放大显示,不同方法识别结果见图6。由图6可看出:在像素级建筑物识别结果中,建筑物的边缘较破碎且不连续,存在较多误检;在对象级建筑物识别结果中“椒盐现象”得到有效解决,但一些农田和阴影被错分为建筑物;而对像素级识别结果与对象级结果融合处理后,获得的建筑物轮廓相对规整,并剔除了大量误检结果,识别精度有较大提高。
图6
图6
所选方法试验区建筑物识别结果
Fig.6
Building recognition results in the study area by the selected methods
表3 建筑物识别精度评价结果
Table 3
方法 | 正确率 | 完整率 | 质量 |
---|---|---|---|
像素级方法 | 0.65 | 0.75 | 0.54 |
对象级方法 | 0.77 | 0.75 | 0.61 |
文献[16]方法 | 0.77 | 0.85 | 0.67 |
本文方法 | 0.84 | 0.87 | 0.74 |
5 结 语
针对林区内建筑物遥感识别技术需求,以GF-2遥感影像为数据源,提出了一种像素级和对象级相结合的林区建筑物识别方法,既提高了识别精度,同时与繁琐的对象级识别过程相比,其步骤有所简化。研究发现除GF-2融合影像的光谱特征以外,NDVI和GLCM的纹理特征Mean是林区建筑物识别的重要特征,其次是MBI;支持向量机分类器比随机森林分类器更适合用于该自然保护林区基于GF-2卫星数据的建筑物识别,其识别结果在正确率、完整率和质量上均高于随机森林分类器;结合像素级和对象级的GF-2遥感影像建筑物检测方法与单独采用像素级或对象级方法相比,在识别的正确率、完整率和质量上均有明显提升;在质量评价指标上,本文方法比像素级和对象级方法分别提高了0.20和0.13。
该方法能较好识别出研究区建筑物,普适性较强,有助于林区内的工作人员进行林区更新和违规建筑巡查工作。但实验影像分割方法的参数设置主要依靠人为选择,在下一步研究中将尝试多特征融合的影像分割方法,以实现林区建筑物自动化识别技术流程目标。
参考文献
Current Issues in high-resolution earth observation technology
[J].
高分辨率对地观测的若干前沿科学问题
[J].
Learning building extraction in aerial scenes with convolutional networks
[J].
Object-oriented multi-scale multi-feature high-resolution remote sensing image building extraction
[J].
面向对象的多尺度多特征高分遥感影像建筑物提取
[J].
Unsupervised feature learning for aerial scene classification
[J].
A survey of building extraction methods from optical high resolution remote sensing imagery
[J].
高分辨率光学遥感影像建筑物提取研究进展
[J].
Study on hierarchical building extraction from high resolution remote sensing imagery
[J].
高分辨率遥感影像建筑物分级提取
[J].
Building extraction of hyperspectral image based on feature level fusion method
[J].
基于特征级融合方法的高光谱影像建筑物提取
[J].
Building extraction of high resolution remote sensing image based on multiple features fusion SVM
[J].
基于多特征融合的SVM高分辨率遥感影像建筑物提取方法
[J].
Building detection in very high resolution multispectral data with deep learning features
[C]∥
Township buildings identification using deep learning on high-resolution satellite imagery
[J].
基于深度学习的高分遥感影像乡镇建筑物识别方法
[J].
Multitask learning-based building extraction from high-resolution remote sensing images
[J].
基于多任务学习的高分辨率遥感影像建筑提取
[J].
Geographic object-based imageanalysis towards a new paradigm
[J].
Building extraction from high resolution multispectral image using object-oriented classification method
[J].
面向对象分类提取高分辨率多光谱影像建筑物
[J].
Object-based morphological building index for building extraction from high resolution remote sensing Iiagery
[J].
面向对象的形态学建筑物指数及其高分辨率遥感影像建筑物提取应用
[J].
Automatic building detection of high-resolution remote sensing images based on multi-scale and multi-feature
[J].
基于多尺度多特征的高空间分辨率遥感影像建筑物自动化检测
[J].
Object-based rule sets and its transferability for building extraction from high resolution satellite imagery
[J].
Building extraction from high resolution remote sensing imagery with multi-feature and multi-scale
[J].
多特征多尺度相结合的高分辨率遥感影像建筑物提取
[J].
Regular building extraction from high resolution image based on multilevel-features
[J].
利用多特征进行航空影像建筑物提取
[J].
Spatial heterogeneity of soil physical properties in phyllostachys heterocycla cv pubescens forest, South Sichuan Bamboo Sea
[J].
蜀南竹海毛竹林土壤物理性质空间异质性
[J].
Recursive feature elimination with random forest for PTR-MS analysis of agroindustrial products
[J].
A Multidirectional and Multiscale morphological index for automatic building extraction from multispectral GeoEye-1 imagery
[J].
Combining the pixel-based and object-based methods for building change detection using high-resolution remote sensing images
[J].
结合像元级和目标级的高分辨率遥感影像建筑物变化检测
[J].
Textural features for image classification
[J].
An assessment of the effectiveness of a random forest classifier for land-cover classification
[J].
Comparison of plastic greenhouse extraction method based on GF-2 remote-sensing imagery
[J].
基于GF-2遥感影像的塑料大棚提取方法对比
[J].
The study for the applicability of the random forests classification algorithm in the worldView-2 image based on the construction of optical feature space
[J].
基于最优特征空间构建的随机森林算法在WorldView-2影像分类中的适用性研究
[J].
Using random forests for handwritten digit recognition
[C]∥
A Remote sensing feature selection method of forest biomass estimation based on RF-RFE
[J].
一种后向迭代的森林生物量遥感特征选择方法
[J].
Measuring the VC-Dimension of a learning machine
[J].
Plastic greenhouse recognition based on GF-2 data and multi-texture features
[J].
基于GF-2数据结合多纹理特征的塑料大棚识别
[J].
Research on kernel parameter optimization of support vector machine in speaker recognition
[J].
Multiresolution segmentation: an optimization approach for high quality multi-scale image segmentation
[C]∥
Evaluation of automatic building detection approaches combining high resolution images and LiDAR data
[J].
/
〈 |
|
〉 |
