基于U-Net的高分辨率遥感图像土地利用信息提取
Research on Land Use Information Extraction based on U-Net
收稿日期: 2019-12-17 修回日期: 2020-06-15 网络出版日期: 2021-05-24
Received: 2019-12-17 Revised: 2020-06-15 Online: 2021-05-24
作者简介 About authors
陈妮(1988-),女,浙江诸暨人,博士,工程师,主要从事水土保持与遥感应用研究E⁃mail:
关键词:
Keywords:
本文引用格式
陈妮, 应丰, 王静, 李健.
Chen Ni, Ying Feng, Wang Jing, Li Jian.
1 引 言
随着先进遥感技术带来的土地遥感数据量显著增加,分辨率大幅提高,使得传统基于小样本、低分辨率的图像处理方法无法对当前海量、高分辨率的遥感土地影像进行处理。高分辨率的遥感影像不仅包含复杂的非线性特征,还存在冗余信息。如何利用以深度学习为代表的人工智能技术对海量高分辨率的遥感影像进行处理,进而发挥海量高分辨率的影像优势来辅助土地利用检测是本文重点关注的问题。近年来,计算机视觉[10-12]领域飞速发展,语义分割和图像处理是计算机视觉和遥感领域的重要分支,因此也一直是国内外学者的关注热点。传统基于语义分割和图像处理的方法,如决策树、支持向量机、聚类等方法需要大量人的先验知识,并且这些传统的方法只适用于早期数据量较少、分辨率较低的遥感图像。传统方法面对当前海量高分辨率的土地遥感影像已经不适用。此外得益于大数据和现代计算机性能的不断发展,以深度学习为代表的人工智能技术可以自动处理数据量大、结构复杂、分辨率较高的图像,以卷积神经网络(Convolutional Neural Networks,CNN)为代表的深度神经网络可以利用其复杂的卷积和池化结构自动提取训练样本中的特征信息,大幅度提升了分类算法精度水平。
CNN模型是1998年LeCun等[13]提出的第一个含多隐层的多层结构学习算法,该算法通过学习一种深层非线性网络结构,实现复杂函数的逼近,同时利用空间相对关系减少参数个数从而达到样本训练性能提升的目的,实现了从少数样本集中学习数据集本质特征的过程,在计算机视觉领域的分类应用中表现出强大性能[14],大幅提升了分类算法精度水平。CNN模型用于遥感影像分类时,模型输入采用的是以单像素为中心的图像块,对图像块进行特征建模,进而对每个像素的类别进行分类[15-16]。CNN模型在卷积层之后会连接若干全连接层,全连接层将卷积层产生的特征图映射为固定长度的特征向量[17],因此当CNN模型应用于大批量处理时,计算机内存开销急剧增加。同时每经历一次卷积,特征图的分辨率就会降低一半,若利用全连接层中的特征图进行分类,分类精度较低。
为了改进这个问题,2015年Long等[18]提出了全卷积网络(Fully Convolutional Networks,FCN),该模型通过去除CNN中的全连接层,替换为1×1卷积层,可以输入任意尺寸的图像,利用反卷积层对最后一个卷积层的特征图进行上采样,从而保证与原始输入图像分辨率保持一致。同时,保留输入图像中的空间信息,再对反卷积层的上采样特征图进行逐像素分类,最终实现图像的像素级分类。U-Net模型[19]是一种改进的FCN结构,其沿用FCN进行图像语义分割思想的同时,U-Net融合了编码—解码结构和跳跃网络的特点,在模型结构上更加优雅且巧妙,近两年逐渐应用于遥感影像分类领域。Zhang等[20]将U-Net 与残差学习方法的优点结合,对遥感影像的道路信息进行了提取。Li等[21]对U-Net结构进行改进,得到了较好的海水—陆地遥感影像分割结果。Xu等[22]利用Res U-Net结构,结合导向滤波对影像进行后处理,提取了城市区域的建筑物信息。
SegNet网络是一种用于语义分割的网络,与U-Net有类似的结构,两者的不同之处在于SegNet在上采样过程中并不需要反卷积,直接通过编码器传输到解码器串联。王俊强等[23]对比了SegNet、PSPnet及Deeplabv3+等3种基于深度学习语义分割算法,在迁移学习的支持下3种算法均可顺利提取且精度较高。杨建宇等[24]使用SegNet网络提取高分辨率农业建设用地上取得了较好的结果,总体进度为96.61%,Kappa系数为0.91,说明SegNet在提取农业建设用地上是可取的。邓天民等[25]改进了SegNet模型,与连通域约束相结合实现车道线检测识别,检测识别效果优于传统SegNet网络算法,平均检测精度为94.60%,每帧检测耗时提升53 ms。
本研究基于U-Net网络框架对带土地利用类型标记的高分辨率遥感影像进行深度学习,自动获取不同对象的形状和纹理特征用以指导土地利用分类,探索适用于高分辨率影像土地利用信息提取的新方法,并在技术流程中对比了U-Net与SegNet网络在土地利用分类上的能力。
2 数据与研究区
2.1 研究区概况
选择浙江省绍兴市新昌县为研究区。全县面积1 213 km2,介于120°41′34″~121°13′34″ E、29°13′55″~29°33′52″ N之间,新昌县是浙闽低山丘陵的一部分。东部以低山丘陵为主,主要高峰均在海拔800 m以上,中部多为300 m以下的丘陵台地,自南向北梯级下降,西北部为河谷与低丘地相间分布,海拔在150 m以下,最低处海拔为28 m。新昌县山地面积为382.49 km2,占总面积的31.7%;丘陵台地面积为765.48 km2,占总面积的62.25%;盆地面积73.56 km2,占总面积的6.58%。近年来,新昌县生产和建设活动频繁,生产建设用地增长较快,且存在大量土地开挖扰动现象。
2.2 数据来源
为了确保深度学习模型训练过程中高质量的输入数据集,本研究共选取了3颗搭载不同传感器卫星的、不同时相的遥感影像作为基础数据。分别为新昌县2015年和2019年国产高分一号(GF-1)、高分六号(GF-6)和资源三号(ZY-3)卫星数据。
土地利用现状数据由新昌县自然资源和规划局提供,共2015年和2019年两期作为原始数据。本研究基于两期遥感影像对收集的土地利用现状数据进行校核、修正,在《土地利用现状分类GB/T 21010-2007》一级分类的基础上,根据新昌县土地利用特点以及水土流失监测的需求,增加了扰动用地新的一级类别,扰动用地指在建的生产建设活动用地,该地类是人为水土流失的主要来源,修改后的土地利用数据作为样本构建的土地利用标记数据。
3 研究方法
3.1 U-Net结构及参数设置
U-Net架构网络由左半边捕获上下文信息的压缩通道和右半边支持精确本地化的扩展通道组成[19],简单地将编码器的特征图拼接至每个阶段解码器的上采样特征图,从而形成一个U形结构。
研究采用的U-Net结构图如图1所示,为一个7级的网络,每个层级由不同类型和数量的卷积层、池化层和反卷积层构成,包含14个3×3的卷积层,1个1×1的卷积层,3个2×2的池化层,3个2×2的反卷积层,使用ReLU作为激活函数。模型结构左半边的编码部分用来逐层提取影像的特征,输入图像尺寸为256×256×4,其中,4表示影像的波段数量,右半边的解码部分用于逐渐还原影像的位置信息和细节信息,模型的输出层采用1×1的卷积核将上一层中的特征图映射成3维输出特征图,最终输出图像尺寸为256×256×3。
图1
3.2 技术流程
本研究对影像做的预处理过程如下:首先,对数据进行了几何精校正处理,将各波段数据进行影像的自动配准和镶嵌。然后,对全色影像和多光谱(红、绿、蓝波段)影像采用ENVI Gram-Schmidt Spectral方法进行融合,使多光谱影像具备丰富的纹理特征。土地利用现状数据是经过人工解译得到的分类结果,对其进行校核、修正,进一步处理成遥感影像典型地物的标记数据。土地利用标记数据是含一个波段的TIFF 文件,与数字正射影像在相同格网上定义,空间分辨率均为2 m。根据典型地物训练样本进行深度学习,用验证样本不断地对模型调参,得到训练模型,进一步用训练模型对测试数据进行分类,预测分类结果。最后对分类结果进行精度评价与分析。基于U-Net的土地利用分类流程如图2所示。
图2
图2
基于U-Net的土地利用分类流程图
Fig.2
Flow chart of land use classification based on U-Net
将预处理中修正后土地利用数据生成与遥感影像对应的土地利用标记数据,将标记数据集按照3∶1∶1的比例随机分割为训练、验证以及测试3个数据集。
U-Net要求输入的待分类图像为同样大小的标准矩形,因此在模型训练之前,将待训练遥感影像样本统一转换为模型能够接受的数据输入标准格式,同时尽可能减少拉伸影像过程中的形状信息损失。本次研究的待训练遥感影像样本标准化成像素大小为256×256矩形图像,最终生成63万张影像样本,最少土地利用类型样本量为5 万。为扩充数据,进一步利用数据角度旋转(90°、180°、270°)的增广方法将样本集扩充到252 万张,最少单样本量为20万张,满足训练模型的要求。每张影像样本都具有土地利用的代表性,并且对应的标签明确,数据集的数量及质量均达满足训练所需的条件。获取的样本示例如图3所示。
图 3
图 3
本文获取的土地利用高分辨率遥感样本示例集
Fig.3
Example of large sample set obtained in this paper
3.3 基于U-Net网络的模型训练
在TensorFlow深度学习框架系统中,用训练和验证集数据对U-Net网络进行训练、验证,得到参数调整后的训练模型。
在模型训练过程中,为了控制残差反向传播以及网络的稳定性,设置学习率的初始值为1×10-4,高斯随机初始化参数,采用SGD随机梯度下降法对模型进行训练,利用Adam加速神经网络,并使用ReLU函数激活。
3.4 土地利用分类精度评价
根据训练后模型对测试集数据进行预测,以土地利用现状数据为基础的目视解译结果作为参考标准数据,利用基于对象的评价方法对分类结果进行精度评价。
采用检测评价函数IoU(Intersection over Union)、检测准确率(Precision)、召回率(Recall)以及Kappa系数对高分辨率遥感土地影像的处理进行客观评估。
4 结果与分析
通过对模型的训练发现,迭代次数设为40次左右时,模型整体的loss值处于平稳,这意味着模型的整体状态趋于收敛,故本研究的迭代次数设为40。本文使用的模型在训练集(training set)和验证集(validation set)上迭代的每一次准确率如图4所示,图4详细表示了模型训练过程中训练集loss和验证集loss的变化情况。由图4可以看出,训练准确率最高可以达到96.30%,说明通过使用本文提出的改进U-Net,本研究实现了高准确性和低损失率。整体的实验运行在一台显卡为GPU NVIDIA 2080ti, 中央处理器为Intel Xeon Quad-Core CPU,主存为32GB的处理器上,操作系统是Linux系统。
图4
利用测试集对训练好的U-Net模型进行测试,在对测试集土地利用信息提取结果作详细定量评价之前,首先定性展示新昌县部分人工目视解译和基于训练后的U-Net模型提取的土地利用分类对比结果,如图5所示。从图中可以看出,本研究提出的方法可以很好地切割土地利用边界线,较好地划分了农作物和林地,建筑物和道路等易混淆地区。
图5
为了分析本方法的有效性,使用同一组训练样本和验证样本,与另一种深度卷积神经网络模型SegNet用于高分辨率遥感图像土地利用分类的能力进行了对比。测试方法如下:将训练数据进行十折交叉验证,取其中9份随机剪切到256×256图像大小,在U-Net和SegNet进行迭代训练直至Loss趋于收敛稳定,然后在完全相同的测试数据上进行推理验证,并分别计算AP平均值。实验结果如表1所示,展示了两种模型测试集的最终分类结果与地面真实数据计算得到的精度评价结果,
表1 土地利用分类结果的精度评估
Table 1
序 号 | 地类 | U-Net | SegNet | ||||
---|---|---|---|---|---|---|---|
IoU(%) | Precision(%) | Recall(%) | IoU(%) | Precision(%) | Recall(%) | ||
1 | 耕地 | 91.98 | 93.33 | 98.45 | 90.98 | 93.04 | 97.63 |
2 | 园地 | 88.82 | 92.05 | 96.2 | 87.79 | 91.35 | 95.74 |
3 | 林地 | 94.96 | 96.13 | 98.73 | 94.65 | 95.92 | 98.62 |
4 | 草地 | 87.14 | 89.96 | 96.52 | 86.69 | 89.69 | 96.28 |
5 | 建设用地 | 94.84 | 96.53 | 98.19 | 94.33 | 96.86 | 97.31 |
6 | 交通运输用地 | 87.67 | 89.45 | 97.78 | 87.04 | 89.01 | 97.52 |
7 | 水域 | 89.02 | 92.67 | 95.76 | 89.23 | 93.31 | 95.33 |
8 | 其他土地 | 88.15 | 91.97 | 95.5 | 86.23 | 90.85 | 94.43 |
9 | 扰动用地 | 90.53 | 92.69 | 97.49 | 90.27 | 92.51 | 97.39 |
总体精度 | 90.95 | 93.2 | 97.42 | 90.31 | 92.95 | 96.95 | |
Kappa系数 | 0.86 | 0.84 |
实验对比结果表示:本文采用训练后的U-Net 模型在测试集上取得了96.30%的训练准确率以及90.95%的测试准确率,Kappa系数为0.86,SegNet在测试集上取得了94.60%的训练准确率以及90.31%的测试准确率,Kappa系数为0.81。其中,U-Net 模型各方面精度评价指标均高于SegNet,尤其是对于其他土地类型,U-Net 模型的分类结果准确率高达88.15%,而SegNet模型为86.23%。U-Net 模型的分类结果中建设用地的分类精度最高,达到94.84%,草地的分类精度在9种地物中最低,为 87.14%。实验表明使用U-Net可以高效准确地完成遥感影像土地利用分类任务。
5 结 语
本研究针对土地利用中的耕地、园地、林地、草地、建设用地、交通运输用地、水域、其他土地和扰动用地等典型地物信息提取,对比了两种基于深度学习自动分类的方法。该方法基于遥感影像和影像上人工解译获取的典型地物样本特征为输入信息,然后通过U-Net算法进一步训练样本训练和提取样本特征提取,再将学习后的样本特征应用于影像分割,最终完成基于遥感影像的土地利用信息提取。
研究表明U-Net算法可有效地应用于高分辨遥感影像土地利用分类中,该方法分类速度快,样本识别速度达到每张30 ms,分类准确率达90.95%,与其他方法相比,边界信息损失小,分类精度更高,基本满足高分辨遥感影像土地利用分类自动化处理需求。
在今后的研究中,一方面进一步改造U-Net的结构,使其更好地学习遥感影像的深层次特征,另一方面可发挥影像多波段的优势,以波段组合形式加入多源数据,与遥感影像组成输入的数据整体,输入至U-Net中进行特征学习,为提高高分辨率影像土地利用分类精度提供新的技术手段。
参考文献
Global Land Cover Mapping at 30 m Resolution: A POK-based Operational Approach
[J]. ,
Fractional Vegetation Cover Change and Its Ecological Effect Assessment in a Typical Reddish Soil Region of Southeastern China: Changting County, Fujian Province
[J]. ,
南方红壤典型水土流失区植被覆盖度变化及其生态效应评估——以福建省长汀县为例
[J]. ,
Application of High-resolution Remote Sensing Image to Monitoring Soil Erosion in Shale Gas Development
[J]. ,
高分遥感影像在页岩气开发水土流失监测中的应用
[J]. ,
The Application of High-resolution Remote Sensing and UAV Technology in Soil and Water Conservation Supervision
[J]. ,
水土保持监管中的高分遥感以及无人机技术应用
[J]. ,
Application of Modern Surveying and Mapping Technology in Agricultural Land Management
[J]. ,
现代测绘技术在农业土地管理的应用分析
[J]. ,
Dynamic Analysis of Agricultural Land Use in Nanjing based on Remote Sensing Image
[J]. ,
基于遥感图像的南京市农业用地动态分析
[J]. ,
Large-scale Forest Resources Monitoring by Means of Spatial Sampling of Hi-resolution Remote Sensing Images
[J]. ,
基于卫星遥感数据空中抽样的大尺度森林资源动态监测
[J]. ,
Forest Resource Estimation based on Remote Sensing Technology in Suizhong County of Liaoning Province
[J]. ,
基于遥感技术的辽宁省绥中县森林资源估算
[J]. ,
Myanmar and China in Areas Bordering Deforestation Remote Sensing Monitoring
[J]. ,
缅甸与我国接壤地区森林砍伐遥感监测分析
[J]. ,
Research Progress and Prospect of Machine Vision Technology
[J]. ,
机器视觉技术研究进展及展望
[J]. ,
Survey of Image Semantic Segmentation Methods based on Deep Neural Network
[J]. ,
深度神经网络图像语义分割方法综述
[J]. ,
Survey of Salient Object Detection based on Deep Learning
[J]. ,
基于深度学习的显著性目标检测综述
[J]. ,
Gradient-based Learning Applied to Document Recognition
[J]. ,
ImageNet Large Scale Visual Recognition Challenge
[J]. ,
Building Detection in very High Resolution Multispectral Data with Deep Learning Features
[C]∥
Identification of Village Building via Google Earth Images and Supervised Machine Learning Methods
[J]. ,
Image Segmentation based on Multi-source Fusion FCN
[J]. ,
基于多源融合FCN的图像分割
[J]. ,
Fully Convolutional Networks for Semantic Segmentation
[C]∥
U-Net: Convolutional Networks for Biomedical Image Segmentation
[C]∥
Road Extraction by Deep Eesidual U-Net
[J]. ,
DeepUNet: A Deep Fully Convolutional Network for Pixel-level Sea-land Segmentation
[J]. ,
Building Extraction in very High Resolution Remote Sensing Imagery Using Deep Learning and Guided Filters
[J]. ,
Performance Analysis of Semantic Segmentation Method based on Deep Learning in Remote Sensing Image Segmentation
[J]. ,
深度学习语义分割方法在遥感影像分割中的性能分析
[J]. ,
Rural Construction Land Extraction from High Spatial Resolution Remote Sensing Image based on SegNet Semantic Segmentation Model
[J]. ,
基于SegNet语义模型的高分辨率遥感影像农村建设用地提取
[J]. ,
/
〈 | 〉 |