img

官方微信

遥感技术与应用, 2021, 36(2): 265-274 doi: 10.11873/j.issn.1004-0323.2021.2.0265

CNN 专栏

基于卷积神经网络的面向对象露天采场提取

胡乃勋,1, 陈涛,1,3, 甄娜2, 牛瑞卿1

1.中国地质大学(武汉)地球物理与空间信息学院,湖北 武汉 430074

2.河南省地质环境监测院,河南 郑州 450006

3.青海省地理空间信息技术与应用重点实验室,青海 西宁 810001

Object-oriented Open Pit Extraction based on Convolutional Neural Network

Hu Naixun,1, Chen Tao,1,3, Zhen Na2, Niu Ruiqing1

1.Institute of Geophysics and Geomatics,China University of Geosciences,Wuhan 430074,China

2.Geological Environment Monitoring Institute of Henan Province,Zhengzhou 450006,China

3.Geomatics Technology and Application key Laboratory of Qinghai Province,Xining 810001,China

通讯作者: 陈涛(1981-),男,湖北咸宁人,副教授,主要从事地质环境信息提取研究。Email:taochen@cug.edu.cn

收稿日期: 2019-12-14   修回日期: 2021-01-04   网络出版日期: 2021-05-24

基金资助: 国家自然科学基金项目.  62071439.  61601418.  61871259

Received: 2019-12-14   Revised: 2021-01-04   Online: 2021-05-24

作者简介 About authors

胡乃勋(1993-),男,黑龙江佳木斯人,硕士研究生,主要从事高分辨率遥感地学应用研究Email:hnx0908@cug.edu.cn , E-mail:hnx0908@cug.edu.cn

摘要

矿产资源的过度开发会对自然环境造成严重的负影响,矿山环境监测对生态文明建设具有十分重要意义。在目前的矿山环境监测中,机器学习算法被广泛的使用并取得了较为良好的效果。近年来,随着深度学习领域的快速发展,相关理论知识也逐渐被应用于遥感图像处理中。将深度学习算法与面向对象的思想相结合,以高分二号影像作为研究数据,使用卷积神经网络对河南省禹州市的采矿区进行了以露天采场为主的开发占地类型信息提取,并与支持向量机方法进行对比,最终得到卷积神经网络的总体精度为91.85%,Kappa系数为0.90,均高于支持向量机方法,提取结果也与实际更加相符。表明该方法在露天采场提取中的优势和可行性,可为矿区的环境监测和科学管理提供可靠的技术支撑。

关键词: 露天采场 ; 面向对象 ; 卷积神经网络 ; 深度学习 ; 矿产资源

Abstract

The overexploitation of mineral resources will have a serious negative impact on the natural environment. The monitoring of the mine environment is of great significance to the construction of ecological civilization. Machine learning algorithms have been widely used in traditional mine monitoring and have achieved good results. In recent years, with the rapid development of the field of deep learning, relevant theoretical knowledge has gradually been applied to remote sensing image processing. In this study, the deep learning algorithm is combined with the object-oriented method, and the GF-2 image is used to extract the land occupation type by applying the conventional neural network from the mining area in Yuzhou City, Henan Province. To compare the performance of the proposed methods, the support vector machine method was used. The results show that the overall accuracy of the convolutional neural network is 91.85% and the kappa coefficient is 0.90, which is higher than the support vector machine method. This paper shows the advantages and feasibility of this method in the extraction of open-pit mining areas and provides reliable technical support for the scientific management and environmental monitoring of open-pit mining areas.

Keywords: Open Pit ; Object oriented ; Convolutional Neural network ; Deep learning ; Mineral resources

PDF (25850KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

胡乃勋, 陈涛, 甄娜, 牛瑞卿. 基于卷积神经网络的面向对象露天采场提取. 遥感技术与应用[J], 2021, 36(2): 265-274 doi:10.11873/j.issn.1004-0323.2021.2.0265

Hu Naixun, Chen Tao, Zhen Na, Niu Ruiqing. Object-oriented Open Pit Extraction based on Convolutional Neural Network. Remote Sensing Technology and Application[J], 2021, 36(2): 265-274 doi:10.11873/j.issn.1004-0323.2021.2.0265

1 引 言

露天开采是一种严重破坏自然环境的行为,容易造成水污染、空气污染、固体废物污染和地质灾害等1。以露天采场监测为主的矿山环境监测一直是矿山治理的重中之重。最早的矿山环境遥感监测主要是人工目视解释和野外调查相结合2,工作量大且成本较高,同时由于解译人员的不同,其准确性和可信度差异较大,不能快速准确地提供可靠的数据。此后,计算机领域发展迅速,各种机器学习算法相继提出3,并开始应用于数据挖掘4、医学图像分析5、生物信息学6等领域,也在遥感图像处理领域为矿山信息提取提供了新的方向。2004年,陈华丽等7在对湖北省大冶市矿区的土地类型进行提取时,利用基于知识的决策树方法取得了良好效果。

上世纪末,遥感技术在高分辨率领域取得突破,影像空间分辨率进入亚米级别,除光谱信息外,还携带了纹理和几何信息。为了更好的利用高分影像的所携带的多种信息,面向对象的思想开始进入人们的视野8。2000年,Baatz等9以最小异质性原则为基础将影像分割为若干对象,提出了一种多尺度分割算法,凭借其在分类过程中的良好适用性和高精度,逐渐成为面向对象中图像分割的常用方法。2017年,程璐10基于面向对象思想,配合机器学习算法提取了青海省木里煤田江仓露天矿区的占地信息。研究结果表明,对比于传统的基于像元分类方法,面向对象方法可有效避免椒盐现象的产生,获得精度更高、范围更准确的分类结果。

随着机器学习算法研究的不断深入,深度学习作为实现机器学习的关键技术也逐渐进入大众的视野。2012年,在ImageNet大规模视觉识别挑战赛中,Krizhevsky等11使用AlexNet结构以明显的优势摘得桂冠,开启了深度学习领域的热潮。AlexNet属于卷积神经网络(Convolutional Neural Networks, CNN)的一种,早期的卷积神经网络结构可以追溯到1989年,LeCun等12提出LeNet-5网络结构,并在手写体数字的识别问题中取得了优异的结果。LeNet-5是最经典的卷积神经网络,近年来在各领域广泛使用的AlexNet、VGG13、Google-Net14等网络就是以LeNet-5为基础改进得到的。

随着深度学习理论的不断成熟发展,其在遥感图像处理上的应用也得到了发展。2019年,徐刚等15将深度卷积神经网络用于遥感影像的水泥厂监测,在多种公开数据集上表现良好。蔡博文等16使用卷积神经网络在高分辨率遥感影像中对不透水面进行提取,总体精度对比于支持向量机等经典算法取得了提升。同样地,矿山环境监测也是遥感技术的重要应用场景之一,深度学习的特征学习能力、复杂函数的表达和拟合能力,能有效对采矿区的高分辨率遥感影像携带的多种、大量信息进行特征提取和快速建模17-18,对矿山环境监测具有重要的理论意义和应用价值。

研究选取高分二号(GF-2)遥感影像作为实验数据,利用卷积神经网络算法与面向对象分类思想相结合的方法对采矿区范围内的土地占用类型进行提取,以探索深度学习方法在矿山环境遥感监测领域的应用效果,为矿山环境治理提供及时、准确的数据支持。

2 研究区及数据源

研究区位于河南省禹州市正北方19,北接省会郑州市,面积102.59 km2,位于113.375°~113.561° E,34.256°~34.352° N之间(图1)。属于伏牛山山脉与豫东平原的过渡地带,区内主要矿种为建筑石料用灰岩和水泥用灰岩。选取的影像数据为2018年4月16日GF-2卫星所拍摄的遥感影像。

图1

图1   研究区位置图

Fig.1   Local of the study area


GF-2遥感影像全色、多光谱波段融合后分辨率可达1米,包含红、绿、蓝、近红外4个波段,成像整体清晰可辨,可解译程度较高。另有其他矿山辅助数据包括禹州市矿山地貌景观破坏遥感解译数据、行政区划数据以及土地利用数据。禹州市矿山地貌景观破坏遥感解译数据以室内目视式解译为基础,再通过野外现场核查结果进行修正,可视为矿区开发占地类型的真值。数据以矢量图斑的形式对禹州市境内的矿区各种开发占用情况的类型、位置、大小、状态等信息进行了说明,并建立了露天采场的解译标志。露天采场一般呈浅色调、基岩裸露、无植被、采场外部边缘常伴有阶梯状剥离台阶附近分布有排土场、废石渣堆,且有道路相通为特征,如图2图3所示。由矿山遥感解译数据可知,研究区内部共有大小露天采场105处,总面积935.84 hm2,占研究区面积的9.12%。其中面积最大为64.59 hm2,最小为0.12 hm2

图2

图2   露天采场解译标志

Fig.2   Interpretation symbol of open pit


图3

图3   露天采场现场照片

Fig.3   Field photo of open pit


3 研究方法

研究的主要流程为GF-2影像预处理、面向对象的图像多尺度分割、对象特征值提取、面向对象结合CNN进行露天采场提取(图4)。

图4

图4   技术流程图

Fig.4   Technical flowchart of proposed method


3.1 面向对象的多尺度分割

分形网络演化方法(Fractal Net Evolution Approach,FNEA)是一种应用广泛的多尺度分割算法,在遥感影像的分割应用中,考虑了实际地表多层次、多格局的特征,使用多种尺度来构建分割等级,逐级完成分割与信息提取。克服单一分割尺度不能对所有类型进行提取的局限性20。其基本思想可以描述为一种自下向上的区域合并技术。从像素层开始,遵循局部异质性最小准则,将临近像元组合为一个影像对象,对象内部赋予统一属性。所产生的对象将代替像素作为影像的最基本单元,重复合并操作,过程中保持异质性的最小增长,如果最小增长超过定义的阈值,则该过程停止。

异质性f指合并前后对象之间差异程度,主要由光谱和形状变化决定。

f=wcolorhcolor+wshapehshape
wcolor+wshape=1
wcolor0,1     wshape0,1

其中:权重参数wcolorwshape代表光谱和形状之间的权重比例。hcolor为光谱异质性,表示两个相邻对象合并后得到的光谱异质性值和合并前各自光谱异质性值之和的差异。hshape表示对象的形状异质性,根据两个相邻对象合并前后的形状紧致度变化hcompt和平滑度变化hsmooth计算而来。

hshape=wcompacthcompact+ wsmoothhsmooth
wcompact+wsmooth=1

其中:wcompactwsmooth分别代表紧致度和平滑度因子的权重比例,两者相加之和为1。

在实际应用中,需要设置光谱、形状因子权值和紧致度、平滑度因子的权值。另需设置尺度参数t,即为自下向上的合并过程设定一个阈值为t。在两个相邻物体融合之前,计算所得的异质性f的增加。如果这个结果增加超过由尺度参数确定的阈值t,则不再发生融合并且分割停止。

3.2 对象特征选择

基于影像对象进行面向对象的分类操作,需要对每个对象进行特征计算,旨在找出对象内具代表性、能有助于判别地物类型的特征同时减少数据的冗余。高分影像分割产生的影像对象的特征主要包括光谱特征、纹理特征、几何特征21

光谱特征可以表征实际地物在遥感影像中的电磁辐射规律,常见表达方式是遥感影像的波段或者灰度值,是遥感影像区分不同地类的最基本特征之一。光谱特征主要包括均值、标准差、亮度、比率等。均值(Mean)表示对象在某一波段中包含的所有像素的光谱平均值。标准差(Stdv)表示对象内部所有像素的标准偏差。亮度(Brightness)表示对象在总体波段的光谱均值。比率(Ratio)表示图像对象层的平均值除以所有层平均值的总和。

高空间分辨率影像除了具有光谱信息外,还有丰富的纹理特征,它对于影像中的微结构表达更明晰,这对于纹理复杂的矿山地物,是分类的重要依据。本文使用灰度共生矩阵作为计算对象纹理特征的依据22,主要包括能量、熵、惯性矩、相关系数和均值。能量(Angular Second Moment,ASM)表示图像灰度分布均质性和纹理的粗细程度。如果ASM较大,则表示对象的纹理比较细致、均匀,否则,则表示对象的纹理粗糙、集中。熵(Entropy)是对象内包含的信息量,也是对纹理信息的表达,表示纹理复杂度。惯性矩(Homogeneity)是对象内部纹理的同质性以及变化的程度,值越大表示对象内部纹理越均匀。相关系数(Correlation)表示图像纹理的一致程度。均值(Mean)表示对象的灰度均值。

研究中使用的几何特征是形状指数、圆度、长宽比、紧致度、主方向、非对称性和密度。形状指数(Shape index)是由每个图像对象的边长与4倍的面积平方根的相除计算得到的。圆度(Roundness)是根据包围对象的椭圆和由对象包围的椭圆的差异来计算的。长宽比(Length-width ratio)是物体的长度和宽度的比率。紧致度(Compactness)通过求取对象的周长和面积来表征对象形状的饱满程度。主方向(Main direction)表示纹理的主要走向。非对称性(Asymmetry)描述了图像对象的相对长度。密度(Density)描述对象中的像素分布。最“密集”的形状是正方形;相反的,对象越狭长,密度就越低。

3.3 卷积神经网络(CNN)

CNN是深度学习的典型算法之一现阶段被广泛应用于计算机视觉、目标检测、自然语言处理等领域23。CNN的结构主要由卷积层,池化层和全连接层组成。

卷积层的主要作用是特征提取。卷积层利用卷积核(滤波器)对待提取内容进行卷积运算,提取局部特征。卷积后所得到新层的每一个神经元与前一层的局部感受区相连,以减少连接的数目,新层将这些局部信息综合起来就得到全局的信息,如图5所示。池化层常位于卷积层之后,经过卷积层得到的特征依然存在维数过大和信息冗余等问题,用最大池化或平均池化方法,进行特征压缩(也称下采样),保留主要特征。最后经过全连接层将数据展开成普通的全连接神经网络层并输出。

图5

图5   卷积层原理图

Fig.5   Principle of convolution layer


在使用CNN网络的同时,引入了面向对象和特征提取的方法,将影像对象的特征值作为网络的输入层。考虑到输入层特征的数量多少对网络结构中层数的限制,所以选择了网络结构相对简单的LeNet-5网络为基础并进行改进,改进主要包括3个方面。首先是对输入层的改进。CNN网络常被应用于图像级的分类问题中,输入层通常以矩阵的形式存在。将影像对象的特征值作为输入,输入层为一维数组,采用一维卷积的形式搭建CNN网络,对图像内部每一个对象预测类别,不仅实现了图像内的分类,同时降低了计算机的计算成本,节省了时间。二是本研究中使用的数据集相对较小,在网络训练过程中出现了过拟合现象。所以在模型中增加随机失活(Dropout)层,来降低网络参数的数量,避免出现过拟合现象,保证模型的泛化能力24。Dropout层需设定参数P,在学习过程中按一定的概率P随机屏蔽掉一部分神经元,只训练保留下来的神经元对应的参数,降低节点间的相互依赖性从而实现网络结构的优化。三是CNN网络中各层之间的激活函数选用ReLu函数。ReLu函数的输出为线性且具有分段性质,不需要指数运算,计算复杂度低,更易学习优化。

研究使用的是Python的Keras库。Keras是一个由Python编写的开源人工神经网络库,可以作为TensorFlow、CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化25。利用Keras中的序贯模型(Sequential)构建了包括2个卷积层、2个池化层、2个全连接层和1个Dropout层在内的CNN网络结构,卷积的形式采用一维卷积,网络结构如图6所示。

图6

图6   CNN结构图

Fig.6   The network structure of CNN


(1)卷积层C1和池化层P1。卷积层C1的通道数为32,卷积核大小为6×1,步长为1。池化层P1采用最大池化方法来提取显著特征,池的大小为2×1,步长为1。

(2)卷积层C2和池化层P2。卷积层C2的通道数为64,卷积核大小为3×1,步长为1。池化层P1采用最大池化方法来提取显著特征,池的大小为2×1,步长为1。

(3)全连接层F1、Dropout层。通过F1层将卷积结果展平,再利用Dropout层随机抑制部分神经元。Dropout层参数设置为0.5。

(4)全连接层F2。有7个神经元,与softmax分类器相连,实现分类并作为输出层。

3.4 支持向量机(SVM)

支持向量机(Support Vector Machines, SVM)是建立在统计学习理论、构造风险最小理论和VC维理论基础上的一种机器学习算法。1995年,Cortes等26提出了非线性SVM并将其应用于手写数字识别问题,研究结果表明SVM具有分类器结构简单、训练难度低、收敛速率快、分类精度高等优点。SVM开始得到了越来越多的关注和应用,在许多领域被证明具有良好的泛化能力。对于线性不可分的情况,它的核心思想是通过某种事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,在这个空间构造最优分类超平面,使得两组数据尽可能正确的分开,同时使分类间隔最大。

本研究中SVM的核函数选择为高斯核函数(Radial Basis Function, RBF),决策函数类型使用一对多法(One-Versus-Rest, OVR),惩罚系数C和Gamma经过网格参数寻优后分别为1和0.045。

4 结果与讨论

4.1 影像分割与特征提取

根据研究区实际的露天矿区开发占地信息,所需要提取的地物类型共有7大类,主要包括:露天采场、矿山堆积、建筑物、道路、植被、裸土和水体。使用eCognition软件平台进行影像的分割过程,针对不同地物类型,选用多尺度分割方法进行影像分割。为保证分割结果的质量,分割处理过程中循以下两条原则:同一对象内部像元间应具有良好的同质性;不同对象之间要具有良好的异质性。在经过大量实验并对其效果进行对比后,确定了各级的分割尺度、形状和光谱因子权值以及紧致度、平滑度因子的权值,形成最终的分割规则集(表1)。

表1   分割尺度和权重值

Table 1  Segmentation scale and weight values

分割对象分割尺度形状/光谱权值紧致度/平滑度权值
水体、植被1500.1/0.90.5/0.5
露天采场、矿山堆积、裸土900.4/0.60.5/0.5
道路、建筑500.4/0.60.5/0.5

新窗口打开| 下载CSV


最后经过光谱差异分割处理,合并相邻且光谱差异相近的对象,得到最终的影像对象96 708个(图7)。结合禹州市矿山地貌景观破坏遥感解译数据和土地利用数据制作样本集,按照质心包含的原则从全部影像对象选取了14 636个对象作为总样本并赋标签。将总样本按照1∶1的原则等分为两部分,即7 318个影像对象组成的训练网络结构的训练、测试样本集,另7 318个影像对象组成的精度评价的验证样本集。

图7

图7   局部分割图

Fig.7   Local segmentation diagram


对分割所产生的影像对象,从光谱特征、纹理特征与几何特征3个角度选取其特征值,并进行计算(表2)。

表2   影像对象的特征选择

Table 2  Feature selection of image objects

对象特征域特征
光谱特征标准差、均值、比率、亮度
纹理特征能量、熵、惯性矩、相关系数、均值
几何特征形状指数、圆度、长宽比、紧致度、主方向、非对称性、密度

新窗口打开| 下载CSV


4.2 基于卷积神经网络的面向对象分类

训练、测试样本集共有影像对象7 318个,其中露天采场2 153个,矿山堆积1 203个,建筑物1383个,植被1 026个,道路899个,水体149个,裸土505个。按照7∶3的原则随机划分成5 123个训练样本和2 195个测试样本,使用训练样本训练CNN模型,测试样本计算模型精度。针对多分类问题,选择交叉熵损失函数(Categorical Crossentropy Loss)作为损失函数,并利用Adam优化器对模型进行参数寻优。在训练过程中,首先对未添加Dropout层的网络模型进行训练,迭代次数设为100次,统计每次迭代后的模型精度,得到模型的训练过程曲线(图8)。从图中可知,随着训练次数的增长,模型的测试样本准确率(test_acc)也随之上升,迭代训练达到第20次时,模型的精度趋于平稳,最终稳定在0.89。但是模型的测试样本损失率(test_loss)在训练过程中呈先下降后升高的趋势,这是典型的过拟合现象,该条件下的网络模型无法进行分类工作。为解决过拟合问题,使用添加了Dropout层的网络模型再次训练,得到模型的训练过程曲线(图9)。从图中可知,同样的100次迭代次数,在迭代训练达到第35次时,模型的测试样本准确率开始趋于平稳,最终得到稳定在0.87的精度。同时测试样本损失率也趋于平稳,未出现过拟合问题,总体上达到了很好的训练效果。

图8

图8   原始训练过程曲线

Fig.8   Original training process curve


图9

图9   改进后训练过程曲线

Fig.9   Improved training process curve


将训练得到的CNN网络结构应用于全部96 708个对象,对其进行预测,得到最终的分类结果(图10)。

图10

图10   CNN分类结果

Fig.10   Classification results of CNN


4.3 基于支持向量机的面向对象分类

为了判断CNN的分类效果,同时使用SVM与面向对象相结合进行研究,得到SVM的分类结果并与CNN进行比较。实验流程中所涉及到的影像分割、特征计算和样本选取均与CNN分类过程相同,最后得到0.82的测试样本精度。将分类器应用于全部96 708个对象,对其进行预测,得到SVM的最终分类结果(图11)。

图11

图11   SVM分类结果

Fig.11   Classification results of SVM


4.4 分类结果对比

在研究区内选取典型地物区域,结合现有的矿山地质环境破坏数据,对局部分类效果进行对比,结果如图12所示。

图12

图12   分类结果对比

Fig.12   Compare of classification results


两种方法在总体可视化上均表现出较好的分类效果,均可对露天采场主体及周围地物进行提取。但在细节上,CNN的分类效果要明显优于SVM。图12中,虚线所包围的区域是通过目视解译和野外现场验证的露天采场,可视为“真值”。将图中Ⅰ、Ⅱ、Ⅲ 3处所对应的两种方法下的分类结果进行放大对比。从Ⅰ区域可以看出,对于露天采场错分至其他类别的情况,CNN明显少于SVM。相应地,从Ⅱ区域可以看出,其他类别错分为露天采场的现象,CNN也明显优于SVM。在Ⅲ区域,露天采场面积相对较小且存在停产、废弃的现象,影像上整体表现的特征与周围地物相近,CNN在此种情况下的提取效果同样优于SVM。因此,在对矿区土地分类、提取露天采场的位置和面积甚至确定露天采场的生产状态等任务时,CNN的效果都要优于SVM。

4.5 精度评价

混淆矩阵是监督学习中常用的一种精度评价方法,可以将算法性能进行可视化的展示27。通过混淆矩阵,可以得到包括总体分类精度(Overall Accuracy,OA)、Kappa系数(Kappa)、使用者精度(User’s Accuracy,UA)和生产者精度(Producer’s Accuracy,PA)等在内的多种评价指标。使用上文中已经制作完成的验证样本集进行精度评价。根据7 318个验证样本的预测结果分别得到两种分类方法的混淆矩阵具体数据如表3所示。

表3   CNN/SVM分类结果精度评价混淆矩阵

Table 3  Confusion matrix for accuracy evaluation of CNN/SVM classification result

露天采场道路水体植被建筑物矿山堆积裸土小计
露天采场1 948/1 82221/245/380/047/9685/1031/12 107/2 084
道路25/93911/8551/00/230/908/202/5977/1 065
水体15/40/0117/780/00/11/00/0133
植被3/40/20/2991/9903/190/44/111 001/1 032
建筑42/11516/820/52/11 873/1 7764/292/11 939/2 009
矿山堆积149/15636/210/10/244/16489/43612/27730/659
裸土17/53/31/05/33/29/4393/369431/386
小计2 199/2 199987/987124/124998/9982 000/2 000596/596414/4147 318/7 318

新窗口打开| 下载CSV


经混淆矩阵计算,CNN的总体分类精度为91.86%,Kappa系数为0.90,其中露天采场的分类使用者精度和生产者精度分别为88.59%和92.45%。这4个精度评价指标均高于SVM的结果(表4)。

表4   CNN与SVM露天采场分类结果精度评价

Table 4  Accuracy evaluation of CNN and SVM classification results of open pit

OAKappaUAPA
CNN91.86%0.9088.59%92.45%
SVM86.44%0.8382.86%87.43%

新窗口打开| 下载CSV


露天采场是矿山活动中破坏环境最为严重的行为,对其做到准确的提取也是矿山监测的重中之重。CNN的分类结果对露天采场的生产者精度达到了88.59%,使用者精度为92.45%。SVM的分类结果对露天采场的生产者精度和使用者精度分别为82.86%和87.43%,两项指标差距较大。说明SVM的分类结果中存在更多的错分现象,从SVM的混淆矩阵可以看出,建筑物和矿山堆积两类地物中有大量的对象被错分为露天采场。同样的情况在CNN中就得到了很好的控制。

4.6 扩展实验

在研究区以外,另选区域进行扩展实验。新增扩展研究区位于河南省新密市,位于113.383°~113.426° E之间,34.603°~34.639° N之间。遥感影像为GF-2遥感影像,大小4 000×4 000像素(图13)。基于相同的分割规则集将影像分割为18 476个影像对象,并计算影像对象的特征值,输入CNN网络模型得到分类结果(图14)。通过混淆矩阵计算得到分类结果的总体精度为89.01%,Kappa系数0.86。露天采场的生产者精度和使用者精度分别为92.78%和92.69%。4项评价指标均达到较高水平,证明了本研究方法的可推广性。

图13

图13   扩展研究区影像

Fig.13   Image of extended research area


图14

图14   扩展研究区分类结果

Fig.14   Classification Results of Extended Research Area


5 结 论

以提取矿区露天采场为出发点展开研究,利用GF-2遥感影像,结合面向对象分类的思想,分别构建了基于卷积神经网络和SVM的露天采场提取模型,在此基础上提取了河南省禹州市以露天采场为主的矿区占地信息,利用OA、Kappa、UA和PA对提取结果进行精度评价和比较。得出以下结论:

(1)将深度学习算法应用于矿山环境监测领域。构建了卷积神经网络模型并应用于矿山信息提取。利用混淆矩阵计算得到总体精度为91.86%,Kappa系数为0.90。露天采场的生产者精度达到了88.59%,使用者精度为92.45%,具有较好的分类效果。

(2)CNN的分类效果明显优于SVM。对比两种方法的精度评价指标,CNN算法的总体精度和Kappa系数相比于SVM 算法分别提升5.42%和0.07。露天采场的使用者精度和生产者精度CNN算法也均高于SVM算法。在结合高分辨率影像和野外实测数据分析时,CNN算法的结果也更接近真实矿山环境。表明基于卷积神经网络的面向对象的露天采场提取方法在矿山地质环境检测中优势和准确性,可以为矿山环境治理提供快速、可信度高的技术支持。

(3)CNN网络模型具有一定的泛化能力,在变换研究区的分类过程中仍得到了良好的分类精度。证明了本研究方法的可推广性。

参考文献

Braghina CPeptenatu DConstantinescu Set al.

The Pressure Exerted on the Natural Environment in the Open Pit Exploitation Areas in Oltenia

[J]. Carpathian Journal of Earth and Environmental Sciences, 201051):33-40.

[本文引用: 1]

Chen WeitaoZhang ZhiWang Yanxin.

Advances in Remote Sensing-based Detecting of Mine Exploitation and Mine Environment

[J]. Remote Sensing for Land & Resource,2009212):1-8.

[本文引用: 1]

陈伟涛张志王焰新.

矿山开发及矿山环境遥感探测研究进展

[J]. 国土资源遥感,2009212):1-8.

[本文引用: 1]

Yu KaiJia LeiChen Yuqianget al.

Deep Learning: Yesterday, Today, and Tomorrow

[J]. Journal of Computer Research and Development, 2013509):1799-1804.

[本文引用: 1]

余凯贾磊陈雨强.

深度学习的昨天、今天和明天

[J]. 计算机研究与发展, 2013509):1799-1804.

[本文引用: 1]

He QingLi NingLuo WenJuanet al.

A Survey of Machine Learning Algorithms for Big Data

[J]. Pattern Recognition and Artificial Intelligence, 2014274): 327-336.

[本文引用: 1]

何清李宁罗文娟.

大数据下的机器学习算法综述

[J]. 模式识别与人工智能, 2014274):327-336.

[本文引用: 1]

Zhang Xin.

The Study of SVM-based Medical Image Classification

[D]. HangzhouZhejiang University2006.

[本文引用: 1]

张昕.

基于SVM方法的医学图像分类研究

[D]. 杭州浙江大学2006.

[本文引用: 1]

Wang Shuqin.

Machine Learning Methods and Their Applications in Bioinformatics

[D]. ChangchunJilin University2017.

[本文引用: 1]

王淑琴.

机器学习方法及其在生物信息学领域中的应用

[D].长春吉林大学2009.

[本文引用: 1]

Chen HualiChen ZhihuaDing Guoping.

The Application of The Knowledge-based Decision Tree Classification Method to The Extraction of Land Types in Mining Areas: A Case Study of Daye Area, Hubei Province

[J]. Remote Sensing for Land & Resource, 2004163): 49-53.

[本文引用: 1]

陈华丽陈植华丁国平.

用基于知识的决策树方法分层提取矿区土地类型——以湖北大冶为例

[J].国土资源遥感, 2004163):49-53.

[本文引用: 1]

Li DerenTong QingxiLi Rongxinget al.

Several Cutting-edge Scientific Issues of High-resolution Earth Observation

[J]. ScientiaSinica(Terrae),2012426):805-813.

[本文引用: 1]

李德仁童庆禧李荣兴.

高分辨率对地观测的若干前沿科学问题

[J]. 中国科学:地球科学, 2012426):805-813.

[本文引用: 1]

Baatz MSchape A.

Multiresolution Segmentation: An Optimization Approach for High Quality Multi-scale Image Segmentation

[C]∥ Angewandte Geographische Informationsverarbeitung XII Berlin200012-23.

[本文引用: 1]

Cheng Lu.

Application of Object-oriented Combined SVM in Information Extraction of Open-pit Mine

[D]. XiningQinghai University2017.

[本文引用: 1]

程璐.

面向对象结合支持向量机(SVM)在露天矿区信息提取中的应用研究

[D]. 西宁青海大学2012.

[本文引用: 1]

Krizhevsky ASutskever IHinton G E.

ImageNet Classification with Deep Convolutional Neural Networks

[J]. Communications of the Acm, 2017606):84-90.

[本文引用: 1]

Lecun YJackel L DBoser Bet al.

Handwritten Digit Recognition-Applications of Neural Network Chips and Automatic Learning

[J]. IEEE Communications Magazine, 19892711):41-46.

[本文引用: 1]

Simonyan KZisserman A.

Very Deep Convolutional Networks for Large-scale Image Recognition

[J]. Computer Science, 2014,arXiv preprint arXiv:1409-1556.

[本文引用: 1]

Szegedy CLiu WJia Yet al.

Going Deeper with Convolutions

[C]∥ Proccedings of the IEEE Conference on Computer Vision and Patten Recogntion[C]∥ 20151-9.

[本文引用: 1]

Xu GangYue JiguangDong Yanchaoet al.

Cement Plant Detection on Satellite Images Using Deep Convolution Network

[J]. Journal of Image and Graphics, 2019244):550-561.

[本文引用: 1]

徐刚岳继光董延超娄启佳.

深度卷积网络卫星图像水泥厂目标检测

中国图象图形学报,2019244):550-561.

[本文引用: 1]

Cai BowenWang ShugenWang Leiet al.

Extraction of Urban Impervious Surface from High-resolution Remote Sensing Imagery based on Deep Learning

[J]. Journal of Geo-information Science,2019219):1420-1429.

[本文引用: 1]

蔡博文王树根王磊.

基于深度学习模型的城市高分辨率遥感影像不透水面提取

[J]. 地球信息科学学报,2019219):1420-1429.

[本文引用: 1]

Chen W TLi X JWang L Z.

Fine Land Cover Classification in an Open Pit Mining Area Using Optimized Support Vector Machine and WorldView-3 Imagery

[J]. Remote Sensing, 20201282. .

URL     [本文引用: 1]

Peng YZhang Z MHe G Jet al.

An Improved GrabCut Method based on a Visual Attention Model for Rare-earth Ore Mining Area Recognition with High-resolution Remote Sensing Images

[J]. Remote Sensing, 201911987. doi:10.3390/rs11080987.

[本文引用: 1]

Zhu Guixiang.

Ecological Compensation:the Need for Mineral Resources Exploitation and Environmental Restoration of Henan Province

[J]. Natural Resource Economics of China, 2010235):25-27.

[本文引用: 1]

朱桂香.

生态补偿:河南矿产资源开发与环境修复的需求

[J]. 中国国土资源经济,2010235):25-27.

[本文引用: 1]

Benz U CHofmann PWillhauck Get al.

Multi-resolution, Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004583-4):239-258.

[本文引用: 1]

Huang Xin.

Multiscale Texture and Shape Feature Extraction and Object-oriented Classification for very High Resolution Remotely Sensed Imagery

[D]. WuhanWuhan university2009.

[本文引用: 1]

黄昕.

高分辨率遥感影像多尺度纹理、形状特征提取与面向对象分类研究

[D]. 武汉武汉大学2009.

[本文引用: 1]

Chen TTrinder J CNiu R Q.

Object-oriented Landslide Mapping Using ZY-3 Satellite Imagery, Random Forest and Mathematical Morphology, for the Three-Gorges Reservoir, China

[J]. Remote Sensing, 201794):333. doi:10.3390/rs9040333.

[本文引用: 1]

LeCun YKavukcuoglu KFarabet C

Convolutional Networks and Applications in Vision

[C]∥ IEEE International Symposium on Circuits and Systems2010253-256.

[本文引用: 1]

Srivastava NHinton GKrizhevsky Aet al.

Dropout: A Simple Way to Prevent Neural Networks from Overfitting

[J]. Journal of Machine Learning Research, 2014151929-1958.

[本文引用: 1]

Cuides Developer.

Keras: The Python Deep Learning Library

[EB/OL]. ,2021.

URL     [本文引用: 1]

Cortes CVapnik V.

Support-vector Networks

[J]. Machine learning, 1995203):273-297.

[本文引用: 1]

Wu JianpingYang Xingwei.

Accuracy Analysis of Classification of Remotely Sensed Data

[J].Remote Sensing Technology and Application,1995101):17-24.

[本文引用: 1]

吴健平杨星卫.

遥感数据分类结果的精度分析

[J].遥感技术与应用,1995101):17-24.

[本文引用: 1]

/