利用RefineNet模型提取冬小麦种植信息的方法
Extraction Method for Winter Wheat Planting Area based on RefineNet
通讯作者:
收稿日期: 2018-08-23 修回日期: 2019-06-28 网络出版日期: 2019-09-19
基金资助: |
|
Received: 2018-08-23 Revised: 2019-06-28 Online: 2019-09-19
作者简介 About authors
宋德娟(1994—),女,山东曲阜人,硕士研究生,主要从事遥感信息提取研究E⁃mail:
关键词:
Keywords:
本文引用格式
宋德娟, 魏青迪, 张承明, 李峰, 韩颖娟, 范克琦.
Song Dejuan, Wei Qingdi, Zhang Chengming, Li Feng, Han Yingjuan, Fan Keqi.
1 引 言
冬小麦是我国主要的粮食作物,及时、准确地获取冬小麦种植区域的面积和空间分布信息,能够为农业管理部门指导农业生产、调整农业结构提供技术支撑[1]。
随着机器学习技术的发展,CNN(Convolutional Neural Networks, 卷积神经网络)由于其优越的特征学习能力而被广泛应用于相机图像处理[21]。CNN利用卷积运算提取像素的特征,通过将多层卷积运算嵌套的方式提取高级语义特征,具有非常强大的特征提取能力,在自然图像分类中取得了良好的效果[22]。2015年提出的FCN[23](Fully Convolutional Networks,全卷积网络)是第1个用于图像分割的卷积神经网络,此后,研究者们开发了一系列基于卷FCN的分割模型,包括UNet[24],SegNet[25],DeepLab[26],RefineNet[27]等。其中,UNet、SegNet都使用编码器-解码器结构,虽然模型结构非常清晰,便于理解,但由于解码器无法恢复编码过程中丢失的低阶视觉特征,无法输出精确的高分辨率预测。DeepLab采用了空洞卷积结构增加感受野,改善了分割网络,但它的计算成本较高,扩张的卷积会使特征提取结果更加粗糙,应用于遥感图像时会丢失重要的细节。
RefineNet模型采用了一种被称为Multipath的结构,能够较好地融合粗糙的高级特征与较为精细的低级特征,从而有效地提高了结果的精度。RefineNet在PASCAL VOC、PASCAL-context、NYUDv2、SUNRGBD、Cityscapes、ADE20K、Person-Parts等数据集上进行了测试,均取得了很好的效果[27]。
GF-2(高分2号)影像包括全色和多光谱两种影像,其中全色影像的空间分辨率为1 m,多光谱影像的空间分辨率为4 m,是进行冬小麦种植信息提取的理想数据源。本文根据高分2号遥感影像的特点,对RefineNet进行改进,形成了Ex-RefineNet(Extend-RefineNet)模型,用于提取冬小麦种植信息,取得了较好的效果。
2 研究方法
2.1 模型结构
本文在描述时,使用内部冬小麦像素和边缘冬小麦像素两个名词,其中,内部冬小麦像素是指以该像素为中心像素进行卷积运算时,所使用的像素块均为冬小麦的像素;而边缘冬小麦像素则是指计算该像素的特征时,像素块包含非冬小麦的像素。
图1给出了Ex-RefineNet模型结构,共分为5个部分:(a)输入;(b)Edge-Feature;(c)Inner-Feature;(d)Softmax编码器;(e)贝叶斯模型;(f)输出。
图1
在训练阶段,模型的输入为GF-2遥感影像和相应的标记文件;在测试阶段,模型输入为待分割的GF-2遥感影像;Edge-Feature用于提取边缘冬小麦像素的特征;Inner-Feature用于提取内部冬小麦像素的特征;Softmax编码器的输入是Edge-Feature和Inner-Feature提取的特征向量,输出是归属概率最大的类别号以及对应的概率值;贝叶斯模型利用两个子模型的最大概率值确定最终的像素类别;最终输出为图像文件,每个像素的内容为对应原始影像像素的类别号,本文使用100表示其他,200表示冬小麦。
2.2 制作数据集
制作数据集包括预处理、数据融合和标注三个步骤。使用ENVI5.3对原始GF-2遥感影像进行大气校正、几何校正、辐射校正等预处理;将全色波段数据和多光谱波段数据进行融合,生成空间分辨率为1m的融合图像。
标注过程如图2所示:(1)在ArcGIS10.2中,建立一个矢量文件,利用目视解释标注出冬小麦区域和背景区域;(2)将冬小麦区域分解为边缘区域和内部区域,形成具有三个子类别的标记文件;(3)对图像和标记文件进行裁剪,每个图像块的大小为480×360像素。将得到的图像分为训练集、验证集和测试集,其中,训练集包含2 600张图像、验证集包括508张图像,测试集包含1 554张图像。
图2
2.3 训练模型
Ex-RefineNet模型使用RefineNet的损失函数计算损失值,计算公式如(1)所示。
其中:m代表训练集中像素的个数,p代表某个像素的标记值,q代表该像素的预测值。
使用SGD(Strochastic Gradient Descent,随机梯度下降)算法对模型进行训练。具体训练过程为;
(1)初始化Ex-RefineNet模型的参数;
(2)将随机选出的一组GF-2影像和对应的标对作为训练数据输入到模型;
(3)利用现有参数进行一次前向计算,得到预测结果与标记之间交叉熵,将其作为损失值,利用链规则,进行后向传播;
(4)在后向传播过程中,根据SGD算法对Ex-RefineNet模型的对参数进行调整;
(5)重复上述步骤中(2)~(4),直到损失值小于给定的阈值,结束对模型的训练。
2.4 使用训练成功的模型进行提取
提取冬小麦信息时,首先利用成功的Ex-RefineNet模型对GF-2影像进行分割,得到像素的类别概率向量集合;然后结合贝叶斯模型判断确定每个像素点的类别,判定规则为:对于某个待判定的像素,如果两个子模型提取的最大概率值对应类别相同,将像素确定为这个类别;如果不相同,根据两个子模型输出的类别概率向量,利用利用贝叶斯模型重新进行判断,确定像素类别。逐像素判定完成后,得到最终的提取结果。
3 数据与实验
3.1 实验方案
本文选择山东省作为研究区域,研究区范围在34°22′52″~38°15′02″N,114°19′53″~122°43′E之间,全境总面积为15.3万km2。使用的影像数据为GF-2,包括12幅2016年2月17日的影像,覆盖范围为泰安市肥城县和宁阳县,14幅2018年1月11日的影像,覆盖范围为济南章丘市。图3给出了研究使用的数据示意图。
图3
本文选择TensorFlow框架实现的原始的RefineNet模型作为对比模型。以Ubuntu16.04作为开发环境,利用Python语言完成了模型的改进,形成Ex-RefineNet模型开展实验。
3.2 实验结果和评价
表1 实验结果评价
Table 1
方法 | 正确识别的冬小麦占整体冬小麦的比例/% | 正常识别的背景占整体背景的比例/% | 漏分的冬小麦占整体冬小麦地比例/% | 错分的冬小麦占整体背景地比例/% | 总体分类精度/% | 查全率 /% | Kapp系数 |
---|---|---|---|---|---|---|---|
RefineNet | 85 | 83 | 15 | 17 | 84 | 84 | 0.83 |
Ex-RefineNet | 94 | 92 | 8 | 6 | 93 | 92 | 0.91 |
图4
从图4可以看出,RefineNet模型和Ex-RefineNet模型能提取出所有的内部冬小麦像素,但在RefineNet模型的提取结果中,冬小麦种植边缘区域有较明显的错分和漏分现象。在Ex-RefineNet模型的提取结果中,不仅边缘区域的错分和漏分现象明显减少,而且边缘的形状与实际更加相符,达到了实用的要求,体现了Ex-RefineNet的合理性。
4 结果分析与讨论
4.1 RefineNet边缘粗糙的原因
RefineNet模型采用了Multipath结构,将粗糙的高层语义特征和精细的低层特征进行融合,通过深度卷积提取出更多图像的特征,这种结构在处理细节丰富的相机图像时具有明显的优势。但在遥感图像上,一个像素往往包含多个提取目标,这种情况下,使用深度卷积不仅达不到提取更多细节特征的目的,反而可能会因视野过大引入更多的噪声,使得到的特征值出会现偏差。
根据卷积运算的规则,卷积核与像素块每次运算得到的卷积值,作为像素块的中心像素的特征值。在提取冬小麦时,位于边缘位置的像素,每次卷积运算时,使用的像素块中,有50%的像素为非冬小麦像素;而位于拐角位置的像素,每次运算时,可能会有75%甚至更高的像素为非冬小麦像素,导致这些位置像素的特征值与中心位置的特征值相差很多,从而导致边缘和拐角像素被错分的可能性增加,最终产生了边缘粗糙的后果。
4.2 Ex-RefineNet模型的优势
在高分2号图像上,1个像素覆盖的1平方米区域内,一般包含上百株冬小麦。虽然从一片种植区域来看,占据的像素数量很多,但由于单棵冬小麦覆盖面积较小,处在种植区域边缘上的像素点同时包含冬小麦和其他分类,导致冬小麦种植区域边缘的像素构成与冬小麦种植区域内部像素的构成差别较大。针对这种情况,Ex-RefineNet模型使用两个子模型分别提取冬小麦内部像素和边缘像素,并根据相对位置关系,利用贝叶期模型优化像素判定结果,这种处理方式有效地弥补了原始的RefineNet模型在提取时忽略的边缘区域像素和内部区域像素的特征差异的问题,从而使Ex-RefineNet的提取有较大程度的提高。
4.3 卷积层深度对提取结果的影响
卷积层深度是影响Ex-RefineNet模型分类精度的关键因素。在实验过程中,对使用不同深度的卷积结构得到的结果进行了统计,统计结果如图5所示。使用的统计数据中,共有268 531 200个像素,包含冬小麦像素数为85 500 400个,其中边缘冬小麦像素为895 104,内部冬小麦像素为84 605 296个,其余像素为背景像素。
图5
从图5可以看出,卷积层数为二层及以下时,冬小麦的整体提取精度较低,但边缘冬小麦提取精度较高;随着卷积层数的增加,冬小麦整体提取精度增高,内部冬小麦提取精度增高,但边缘冬小麦提取精度降低;卷积层数为五层及以上时,冬小麦整体提取精度趋于稳定。进一步说明了Ex-RefineNet采用两种结构不同的模型来分别提取边缘冬小麦像素和内部冬小麦像素是合理的、恰当的。
5 结 语
本文提出了一种适用于高分辨率遥感影像的冬小麦种植信息提取方法,所建立的Ex-RefineNet模型充分考虑了GF-2遥感影像上冬小麦种植区域细节信息较少等特点,较好地解决了从GF-2影像上提取的冬小麦种植信息边缘粗糙的问题,实现了从获取高精度的冬小麦种植信息的目标。
本文的主要贡献有:(1)结合遥感影像的特点和提取目标的特点,分析了使用卷积神经网络提取信息时边缘粗糙的原因,在此基础上,建立了一种新的卷积神经网络结构;(2)深入挖掘了卷积神经网络所输出的类别概率向量所包含的信息,合理利用语义特征和统计特征,建立了一种利用贝叶斯模型进行边缘精细化的方法,实现了对边缘的精细化处理。
下一步的工作中,将进一步对编码器进行改进,解决目前Softmax编码器没有考虑特征空间分布信息的问题,进一步提高模型的稳定性。
参考文献
Area Change Monitoring of Winter Wheat based on Relationship Analysis of GF-1 NDVI among Different Years
[J].
基于GF-1影像NDVI年度间相关分析的冬小麦面积变化监测
[J]. ,
Improved Maize Cultivated area Estimation over a Large Scale Combining MODIS-EVI Time Series Data and Crop Phonological Information
[J]. ,
Mapping Paddy Field in Large areas, based on Time Series Multi-sensors Data
[J].,
Crop Information Identification based on MODIS NDVI Time-series Data
[J].
基于MODIS NDVI多年时序数据的农作物种植识别
[J]. ,
Crop Yield Forecasting on the Canadian Prairies Using MODIS NDVI Data
[J]. ,
Identification of Cropping Activity in Central and Southern Queensland,Australia, with the aid of MODIS MOD13Q1 Imagery
[J].,
Spatiotemporal Variation of Vegetation in Northern Shaanxi of Northwest China based on SPOT-VGT NDVI
[J]. ,
Crop Planting Extraction based on Multi-temporal Remote Sensing Data in Northeast China
[J]. ,
Wheat Acreage Estimation Using Remote Sensing in Tarai Region of Uttarakhand
[J]. ,
Mapping Crops Acreages based on Remote Sensing and Sampling Investigation by Multivariate Probability Proportional to Size
[J]. ,
Area Extraction of Winter Wheat at County Scale based on Modified Multivariate Texture and GF-1 Satellite Images
[J].
基于改进多元纹理信息模型和GF-1影像的县域冬小麦面积提取
[J]. ,
Winter Wheat Cultivated Area Estimation and Implementation Evaluation of Grain Direct Subsidy Policy based on GF-1 Imagery
[J]. ,
Early Recognition of Winter Wheat Area based on GF-1 Satellite
[J].
基于GF-1卫星遥感的冬小麦面积早期识别
[J].,
Fine Crop Mapping by Combining High Spectral and High Spatial resolution Remote Sensing Data in Complex Heterogeneous Areas
[J]. ,
Fast Segmenation Method of High-resolution Remote Sensing Image
[J].
高分辨率遥感影像的快速分割方法
[J].,
Robust Autodual Morphological Profiles for the Classification of High-resolution Satellite Images
[J]. ,
Classification Application of QuickBird Imagery to Obtain Crop Planting Area
[J].
应用高分辨率遥感影像提取作物种植面积
[J].,
Fast Remote Sensing Image Segmentation Algorithm based on Nearest Neighbor Direct Graph
[J].
基于最近邻有向图的遥感图像快速分割算法
[J].,
Maximum Entropy Method
[C]
最大熵方法
[C],
Classification of High Spatial Resolution Remotely Sensed Imagery based Upon Fusion of Multiscale Features and SVM
[J].
基于多尺度特征融合和支持向量机的高分辨率遥感影像分类
[J]. ,
Prediction of Rainfall Time Series Using Modular Artificial Neural Networks Coupled with Data-preprocessing Techniques
[J]. ,
Transferring Deep Convolutional Neural Networks for the Scene Classification of High-resolution Remote Sensing Imagery
[J]. ,
Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs
[J]. ,
U-Net: Convolutional Networks for Biomedical Image Segmentation
[J].
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Scene Segmentation
[J]. ,
DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
[J]. ,
RefineNet: Multi-Path Refinement Networks for High-resolution Semantic Segmentation
[J]. ,
Extraction of Residential Areas in GF-1 Remote Sensing Images based on Improved Fully Convolutional Network
[J].
采用改进全卷积网络的“高分一号”影像居民地提取
[J]. ,
Identification Methods for Forest Pest Areas of UAV Aerial Photography based on Fully Convolutional Networks
[J].
基于全卷积网络的林业航拍图像虫害区域识别方法
[J].,
Study of Near Infrared Spectrum Classification for Tobacco Leaf Position based on Deep Belief Network
[J].
基于深度信念网络的烟叶部位近红外光谱分类方法研究
[J].,
The Convolutional Neural Network and Its Applications
[D].
卷积神经网络及其应用
[D].
Classification for High Resolution Remote Sensing Imagery Using a Fully Convolutional Network
[J]. .
Research Summary of Convolutional Neural Network
[J].
卷积神经网络研究综述
[J].,
/
〈 | 〉 |