遥感技术与应用, 2022, 37(4): 800-810 doi: 10.11873/j.issn.1004-0323.2022.4.0800

深度学习专栏

面向云覆盖的遥感影像时空融合深度学习方法及其应用

隋冰清,1, 殷志祥1, 吴鹏海,1,2, 吴艳兰1,2

1.安徽大学 资源与环境工程学院,安徽 合肥 230601

2.安徽大学 物质科学与信息技术研究院,安徽 合肥 230601

Method and Application of Spatial-temporal Fusion for Cloud Coverage of Satellite Images on Deep Learning

Sui Bingqing,1, Yin Zhixiang1, Wu Penghai,1,2, Wu Yan lan1,2

1.School of Resources and Environmental Engineering,Anhui University,Hefei 230601,China

2.Institute of Physical Science and Information Technology,Anhui University,Hefei 230601,China

通讯作者: 吴鹏海(1987-),男,安徽祁门人,博士,副教授,主要从事遥感地表温度智能重建与融合研究。E⁃mail:wuph@ahu.edu.cn

收稿日期: 2021-08-11   修回日期: 2022-06-25  

基金资助: 安徽省科技重大专项.  201903a07020014
安徽大学物质科学与信息技术研究院学科建设开放基金资助

Received: 2021-08-11   Revised: 2022-06-25  

作者简介 About authors

隋冰清(1992-),男,安徽阜阳人,硕士研究生,主要从事遥感时空融合方面的研究E⁃mail:wuph@ahu.edu.cn , E-mail:wuph@ahu.edu.cn

摘要

遥感影像时空融合是一种获取高时空分辨率数据的有效手段,但现有方法在选定基础数据对时要求预测时间低分辨率数据无云覆盖影响,这极大地限制了其应用潜力。为此,提出一种面向云覆盖的遥感影像时空融合方法,即在深度学习框架下,构建重建子网络恢复预测时刻云下缺失信息,将重建后的低分辨率影像与前后相邻时刻高、低分辨率数据对构建时空融合子网络,得到最终的融合影像。以安徽淮南采煤沉陷区Landsat和MODIS反射率数据为例,对预测时刻MODIS数据模拟不同缺失率的云污染;利用所提方法进行时空融合实验,进而比较深度学习与传统方法融合数据对水体信息的提取效果。结果表明:该方法融合结果各波段的RMSE和SSIM均取得较好的定量评价效果,且总体优于传统方法;沉陷区水体提取实验表明本方法水体提取结果更加接近真实观测影像。因此,该方法降低了时空融合对数据的限制要求,且具有更高的融合精度和更有效的应用性。

关键词: 云覆盖 ; 遥感时空融合 ; 深度学习 ; 重建 ; 水体提取

Abstract

Spatio-temporal fusion of remote sensing images is considered as an effective way to obtain high spatio-temporal resolution data. However, the existing methods require that the low-resolution data at the predicted time is not affected by cloud cover when the basic data pairs is selected, which greatly limits the application potential of the spatio-temporal fusion method. Thus, this article proposes a spatio-temporal fusion method based cloud-covered remote sensing image. Under the deep learning framework, there are two types of remote sensing data featured by high spatial resolution but low temporal resolution (HSLT) and the other type by low spatial resolution but high temporal resolution (LSHT). The reconstruction subnetwork is constructed to repair the missing information under the cloud coveraged area of LSHT at the prediction dates, and the reconstructed LSHT image and two prior HSLT images are integrated to obtain the final fusion result on the prediction date by the constructed spatiotemporal fusion subnetwork.We take the Landsat (HSLT) and MODIS (LSHT) reflectance data in the coal mining subsidence area of Huainan City, Anhui Province as an example, simulate cloud pollution with different missing rates on the MODIS data at the prediction time, Spatial-temporal fusion experiments are conducted with the proposed method, and then compare water information extraction effects of deep learning fusion data and traditional method fusion data.The results show that the proposed method achieves a good quantitative evaluation effect on the root mean square error and the structural similarity index of the fusion results in each band, and that the fusion results are generally superior to the traditional classical method. The experiment of water extraction in subsidence area clearly shows that the water body extraction result of the proposed method is generally closer to the real observation image. Therefore, the proposed method reduces the data limitation requirements of spatio-temporal fusion, and has higher fusion accuracy and more effective application than the classic traditional method.

Keywords: Cloud cover ; Remote sensing spatial-temporal fusion ; Deep learning ; Reconstruction ; Water body extraction

PDF (5253KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

隋冰清, 殷志祥, 吴鹏海, 吴艳兰. 面向云覆盖的遥感影像时空融合深度学习方法及其应用. 遥感技术与应用[J], 2022, 37(4): 800-810 doi:10.11873/j.issn.1004-0323.2022.4.0800

Sui Bingqing, Yin Zhixiang, Wu Penghai, Wu Yan lan. Method and Application of Spatial-temporal Fusion for Cloud Coverage of Satellite Images on Deep Learning. Remote Sensing Technology and Application[J], 2022, 37(4): 800-810 doi:10.11873/j.issn.1004-0323.2022.4.0800

1 引 言

随着卫星遥感技术的发展,多传感器遥感影像为地质灾害分析及预防、水体环境变化监测和评估等方面提供重要的数据支撑1。但由于技术条件限制,兼具高空间分辨率、高时间分辨率等特征的遥感数据通常不易获取,这极大地影响了其在地表信息动态监测研究中的应用2。此外,云覆盖等不利天气条件会遮挡传感器接收下垫面电磁波信号,造成信息缺失问题,降低了遥感影像的可用性。针对这些问题,在不改变现有观测条件的情况下,结合多传感器影像优势特征获得兼具高空间分辨率和高时间分辨率特征的时空融合方法应运而生。

目前时空融合方法主要分为4类:基于像元解混的融合、基于滤波的融合结果、组合型的融合方法和基于学习模型的融合方法3。基于像元解混的方法最早由Zhukov等4提出,该方法引入窗口技术,基于目标像元和窗口内同类地物反射率空间相似性假设进行时空融合,但未能彻底解决同类地物光谱空间变化的问题。此后,众多学者针对反射率异常值5、地物类型变化6、窗口内相邻像素空间可变性7等开展了更深入的研究。总体来说,这类方法因建立在线性光谱混合模型的基础上,而遥感影像因分辨率限制常常存在大量非线性混合像元,在像元分解过程中得到的反射率值误差明显因而不适用于异质性较强的区域。

基于滤波的融合方法中,应用最广泛的是Gao等8提出的时空自适应反射模型(Spatial and Temporal Adaptive Reflectance Fusion Model, STARFM)和Zhu等9提出的增强型时空自适应融合模型(Enhanced Spatial and Temporal Adaptive Reflectance Fusion Mode,ESTARFM),这两种方法的基本思想是基于加权函数构建高—低空间分辨率相关关系,STARFM方法主要建立在低空间分辨率影像中一个像素内只有一种土地覆盖类型这一假设上,因此在异质景观上并不适用从而无法实现准确预测;ESTARFM通过加入转换系数改进相似像元权重计算方式,并在基础时间的两组高分辨率影像上同时搜索移动窗口内的相似像元,有效地提高了模型在异质性区域的融合精度。其他学者在景观异质性10-11和权重函数12-13等方面提出了一系列改进算法。此外,Wang等14综合回归模型拟合、空间滤波和残差补偿的三步法生成哨兵2号卫星时间序列影像,该方法在环境动态变化显著的监测上具有很大的应用潜力。这类方法目前具有较多的研究,在时空融合结果上取得较大成果但在不同时相影像的地物类型变化预测效果上仍有一定的局限性。

组合型的融合方法包含不同融合方法的优势,从高/低分辨率数据处理方式和空间信息变化等多方面因素来综合考虑。如Zhu等15提出灵活时空融合模型(Flexible Spatiotemporal Data Fusion,FSDAF),在地表覆盖异质性明显的区域适应性更高,能够较好的预测土地覆盖类型变化。进一步地,Zhao等16提出鲁棒自适应时空融合模型(Robust Adaptive Spatial and Temporal Fusion Model, RASTFM),通过组合像素级和特征级融合提高模型的准确性。

基于学习模型的融合方法,一般是在高分辨率影像和低分辨率影像对之间进行学习。代表性研究有基于纯字典学习17、稀疏表达与字典学习结合18、压缩感知学习19的时空融合方法。总体上,这类方法虽然在土地覆盖类型变化区域具有良好的处理能力,但是存在深层特征挖掘不足、计算复杂、效率较低等问题。

受到卷积神经网络(Convolutional Neural Network, CNN)能够自动提取大量遥感影像结构和纹理特征信息优势的启发,近年来众多学者将其引入时空融合方法中20-24。如Song等20提出基于深度卷积神经网络的遥感时空融合方法(Spatiotemporal Satellite Image Fusion Using Deep Convolutional Neural Networks, STFDCNN)、Tan等21提出的深度卷积时空融合模型(The Deep Convolutional Spatiotemporal, DCSTFN)、Liu等22提出双流卷积神经网络(A Two-stream CNN for Spatiotemporal Image Fusion, StfNet)、姚凯旋等23提出密集连接块改进了CNN网络、Zhang等24提出了基于生成对抗网络的时空融合模型。这类方法对时空融合中尺度转换和时相变化等复杂非线性变换具有较好的建模能力,因此越来越受到欢迎。

相比已有融合方法,尽管基于深度学习的方法显著提高了复杂异质性景观信息预测能力,但均假定输入数据无云覆盖或进行云掩膜处理。根据时空融合基本原理,基础时间高/低分辨率数据对可以择优晴空条件的高质量数据,但预测时间低分辨率数据往往具有不可替代性。由于无法保证预测时间低空间分辨率数据不受云覆盖影响,现有方法往往不能融合得到所需时间的高分辨率数据25-26。因此,对于预测时间存在云覆盖的低分辨率数据来说,研究面向云覆盖的遥感影像时空融合方法具有重要意义。目前已有大量文献对云覆盖像元缺失值重建进行了研究27-28,特别是深度学习框架下遥感信息重建取得了很大进展29-32。因此本文将遥感时空融合与云下信息重建结合起来处理,提出一种面向云覆盖的遥感影像时空融合深度学习模型。首先,基于基础时间MODIS数据,设计重建子网络恢复预测时刻存在缺失像素的MODIS影像;在此基础上,构建时空融合子网络将重建后的MODIS影像和前后相邻时刻的高、低分辨率数据对进行融合,最终得到所需时间的高分辨率融合结果,进而用于水体信息提取等应用研究。

2 研究方法

2.1 面向云覆盖的遥感影像时空融合深度学习模型

图1给出了面向云覆盖的遥感影像时空融合过程的示意图,已知连续时刻的低空间分辨率数据序列(如t1t2t3的MODIS数据称之为低分辨影像,t2时刻MODIS影像存在缺失像素值),与之对应时刻下的高空间分辨率数据序列(如t1t3的Landsat数据,称之为高分辨影像)。利用t1t3时刻无云覆盖的MODIS影像及其对应Landsat影像与t2时刻含云覆盖的MODIS影像可融合出t2时刻具有类似Landsat分辨率的影像,即时刻t2的高空间分辨率影像。此融合过程在时间域和空间域同时进行,达到充分利用高—低分辨率影像序列时空变化信息的目的。

图1

图1   面向云覆盖的遥感影像时空融合示意图

Fig.1   Spatial-temporal fusion for cloud coverage of satellite images


实验采用的深度学习模型包含低分辨率影像缺失信息重建子网络和时空融合子网络。在低分辨率影像缺失信息重建子网络中,利用局部残差连接的特性,连接对应尺度的浅层结构信息和高层网络中的语义信息,提高网络训练中信息提取的丰富性;在时空融合子网络中,基于解码和编码结构,利用多时相高—低空间分辨率影像数据组合以达到充分利用时空特征信息的目的,从而提高融合模型的性能。两部分结构均采用上采样和下采样处理进行特征提取和细节特征恢复。该网络总体结构图如图2所示。

图2

图2   面向云覆盖的遥感影像时空融合深度学习模型总体网络结构

Fig.2   Overall network structure of a deep learning model for cloud coverage based on spatio-temporal fusion of remote sensing images


重建子网络主要是针对低空间分辨率影像的信息处理,共包括16个卷积层,卷积核从64增加到512个。如图2(a)所示,首先将t1t3时刻的高分辨率影像分别与中间时刻t2局部存在缺失像素值的低分辨率影像(Mt)合成并相加,再将合成与相加的结果对应组合,使用卷积核大小为3×3的卷积层进行特征提取,卷积运算的数学公式:

Y=w×x+b

其中:Y输出特征图;wb表示卷积核参数;x是输入图像。

为了使训练过程更快更稳定,使用批量归一化层(Batch Normal, BN)将输入进行归一化,删除冗余参数加速网络训练,BN通常作用于非线性层之前。由于校正线性单元(Rectified Linear Unit, RELU)能够增强模型非线性表达能力并且避免训练过程中出现梯度消失现象,因此选用RELU作为激活函数。此后通过建立大范围内不同像素之间的关系恢复缺失区域的信息,网络中使用平均池化层进一步获取特征信息及背景信息。模型采用局部残差连接充分利用浅层影像的细节特征信息,更好地挖掘低分辨率和高分辨率影像对之间的深层关系,丰富的信息利用提高了模型训练的效果。在上采样中引入转置卷积层,进行端对端地学习恢复高分辨率影像;每个阶段对前一次输出的影像进行上采样,得到更高的分辨率,同时与下采样过程中相同尺寸的特征融合,该过程能有效保留辅助影像的语义信息,最后通过卷积层进行精调得到更为精细化的MODIS影像,以达到预测时刻缺失信息重建的目的。

时空融合子网络的输入影像分别是t1时刻的精细—粗分辨率影像对(L1M1),t3时刻的精细—粗分辨率影像对(L3M3)以及重建后的t2时刻粗分辨率影像(称之t2过渡影像,Ht)。如图2(b)图所示,为了充分利用Landsat影像的高空间分辨率特性,将HtL1-M1L3-M3影像对进行线性组合,多次利用卷积层进行特征提取,该部分上采样处理使得卷积核数目从64依次增加到128、256、512,同时影像尺寸对应缩小2倍,最后使用反卷积层逐步恢复影像尺寸,此时卷积核数目从512递减到256、128、64,影像尺寸对应扩大2倍。为利用浅层特征信息,使用3个局部残差连接将收缩和扩张层对应尺寸的特征影像进行融合,得到最终的t2时刻高空间分辨率影像(Lt)。该子网络包含25个卷积层,每个卷积核大小为3×3。此过程中将连续时刻辅助影像的空间信息、时间信息在网络中始终同步提取,保证了重建与融合过程的信息补充。

2.2 水体提取方法

为了测试提出方法的应用潜力,以融合结果的水体提取为应用对象,根据研究区域地处平原、无山体阴影干扰、沉陷区周围建筑物较少等特点,采用改进的归一化水体指数模型33(Modified Normalized Difference Water Index, MNDWI)进行水体提取。该方法不仅能够较好地抑制植被的影响突出水体特征,而且在区分建筑物特征和消除阴影方面得到更好的效果。MNDWI的计算公式为:

MNDWI=Green-MIRGreen+MIR

其中:GreenMIR分别为绿光、中红外波段的反射率值,即Landsat-7 ETM+影像的B2、B5波段,Landsat-8 OLI影像的B3、B6波段。通过与Landsat影像进行目视对比、直方图分析来确定合适的阈值,完成研究区的水体信息提取。

3 数据来源及预处理

研究区地跨安徽省阜阳东部颍上县及淮南西部凤台县,区域范围界限在116°08′01″—116°44′51″ E,32°41′10″—32°56′05″ N之间。该区域地势平坦,水系分布较多,近些年煤炭资源开采频繁导致该区域分布了较多因矿区地表沉陷而形成的大面积沉陷水体。数据集由2014年12月至2015年10月之间的10对无云Landsat影像和MODIS影像组成,如表1所示。高分辨率影像由陆地卫星影像中的Landsat-7 ETM+/Landsat-8 OLI传感器获得,并使用ENVI补丁进行条带修复和ENVI-FLAASH模块进行大气校正,采用最邻近法重采样到25 m空间分辨率。低分辨率影像由MODIS地表反射率日产品(MOD09GA)产品获得,所有MODIS数据均使用MODIS重投影工具(MODIS Reprojection Tools,MRT)重新投影到WGS84坐标系,并采用最邻近法重采样到25 m空间分辨率,使其与Landsat影像保持一致。实验影像大小为2 400×1 200,选取常用于区分水体边界的4个波段(绿波段、红波段、近红外波段、中红外波段)进行实验。详细的光谱范围如表2所示。

表1   2014—2015年淮南矿区Landsat和MODIS无云数据对

Table 1  Dates for the cloudless-free Landsat-MODIS pairs for Huainan mining area from 2014 to 2015

日期Landsat数据MODIS数据
2014-12-02OLIMOD09GA
2014-12-18OLIMOD09GA
2015-01-11ETM+MOD09GA
2015-01-19OLIMOD09GA
2015-02-12ETM+MOD09GA
2015-04-25rOLIMOD09GA
2015-05-19ETM+MOD09GA
2015-07-30OLIMOD09GA
2015-10-02OLIMOD09GA
2015-10-10ETM+MOD09GA

新窗口打开| 下载CSV


表2   Landsat和MODIS的光谱范围

Table 2  Spectal ranges of Landsat and MODIS

波段

名称

Landsat-7 ETM+Landsat-8 OLIMODIS(MOD09GA)
波段编号带宽/μm分辨率/m波段编号带宽/μm分辨率/m波段编号带宽/μm分辨率/m
绿色20.52—0.603030.53—0.593040.545—0.565500
红色30.63—0.693040.64—0.673010.620—0.670250
近红外40.77—0.903050.85—0.883020.841—0.876250
中红外51.55—1.753061.57—1.653061.628—1.652500

新窗口打开| 下载CSV


为了便于比较,裁剪具有代表性的子区域(影像大小为700×220个像素)开展定性和定量比较;该区域地表信息中水体斑块包括采煤沉陷区块状水体和细碎水体,以及狭长河流自然水体和其他非水体地物信息。图3给出了2015年1月19日由“中红外、近红外、红色”三波段组合的假彩色影像,三对连续时刻的Landsat[图3(a)—图3(c)]及对应的MODIS[图3(d)—图3(f)]实验数据、不同缺失率的掩膜类型数据[图3(g)—图3(i)]。

图3

图3   三对连续时刻“中红外、近红外、红色”三波段组合的Landsat和MODIS影像和不同掩膜类型

Fig.3   Three-band combination Landsat and MODIS image pairs of "MIR-NIR-red" at three consecutive moments and varietal masks


4 模型训练与测试

训练数据选用与待预测时刻相邻的前后各3个时刻的Landsat和MODIS影像组成高—低分辨率数据对。数据分组的基本规则如表3所示,分为两组实验进行,第一组实验数据,以2015年1月19日作为待预测时刻,第二组实验数据,以2015年5月19日作为待预测时刻。其中两组实验的训练数据选择均遵循如下规定:基础时间数据尽可能接近预测时间数据,同时为保证训练阶段预测时间前后时刻的数据分布均衡,基础时间t1的数据偏重于选取预测时间t2之前的影像,基础时间t3的数据偏重于选取预测时间t2之后的影像,预测时间t2数据则选取的是该时刻前后两个时刻的影像。具体影像对分组情况以第一组实验数据选择为例进行说明:选用2014年12月2日、12月18日、2015年1月11日、2月12日Landsat和MODIS影像作为t1时刻的高—低分辨率数据对,2015年1月11日、2月12日、4月25日、5月19日的Landsat和MODIS影像作为t3时刻的高低分辨率数据对。2014年12月18日、2015年1月11日、2月12日、4月25日Landsat和未受云污染的MODIS影像分别作为训练阶段中待预测时刻t2的标签数据及低分辨率数据,为了能够充分训练网络,将大小为2 400×1 200像元的Landsat影像和MODIS影像对应裁剪成160×160像元的影像块,重复裁剪滑动步长为80像元。

表3   训练数据和预测数据分配情况

Table 3  Allocation of training and forecast data

实验数据类型t1t2t3

第一组实验

训练集201412022014121820150111
201412182015011120150212
201501112015021220150425
201402122015042520150519
测试集201501112015011920150212

第二组实验

训练集201501192015021220150425
201502122015042520150730
201504252015073020151002
201507302015100220151010
测试集201504252015051920150730

新窗口打开| 下载CSV


为了模拟不同程度像素缺失情况,制作了具有不同像素缺失率的掩膜,训练过程中,对待预测时刻的MODIS影像的160×160像元影像块进行15%和20%两种缺失率的掩膜处理,得到每一时刻近3 000对高低分辨率影像块用于输入网络进行训练。

在已有的研究中2124,多使用均方误差(Mean Square Error,MSE)作为损失函数,本文考虑到云覆盖区域的异常值影响,损失函数使用具有对异常值敏感度高等特点的回归带参损失(huber loss)27,将重建网络输出的t2低分辨率过渡影像(Ht)与t2真实观测MODIS影像(M2)进行损失计算,记为L¯1。融合得到t2的高分辨率影像(Lt)与实际观测Landsat影像(L2)的损失计算,记为L¯2。将两个损失函数值相加之和作为整个网络的损失函数,记为L¯F(·)表示面向云覆盖的遥感影像深度学习时空融合网络,W1W2分别表示训练过程中重建子网络和时空融合子网络的参数,重建的t2低分辨率过渡影像和最终融合的高分辨率影像表示如式(3)、(4)所示:

Ht=F(M1,M3,Mt;W1)
Lt=F(L1,M1,L3,M3,Ht;W2)

使用以下损失函数公式:

L¯1θ1=12Ht-Mt2,Ht-Mtδ,δHt-Mt-12δ,Ht-Mt>δ.
L¯2θ2=12Lt-L22,Lt-L2δ,δLt-L2-12δ,Lt-L2>δ.
L¯=L¯1+L¯2

其中:δ是超参数,当真实影像与预测结果之间的差值小于δ时,采用均方误差公式,当真实影像与预测结果之间差值大于δ时,采用线性误差公式。式(5)中θ1表示重建子网络权重和偏置项;式(6)中θ2表示时空融合子网络权重和偏置项,根据经验将δ设为1.0。式(7)中L¯1L¯2之和作为整体网络的损失函数L¯。选用自适应矩估计方法(Adaptive Moment, Adam)对两次损失进行优化学习并更新网络权重直到loss值无明显变化,即达到收敛状态。Adam中将一阶矩估计的指数衰减设置为0.9。二阶矩估计的指数衰减设置为0.999。学习率最初设置为0.000 1,每十轮迭代乘以衰减因子0.1,逐步减小学习率。

预测阶段,直接将预测时刻的前后时刻t1t3的高—低分辨率数据对(Landsat和MODIS数据对),预测时刻的模拟存在缺失信息的低分辨率数据(局部区域经过掩膜处理,模拟缺失信息情况)输入到已训练好的网络中,如在第一组实验中,将2015年1月19日作为预测时刻,t1t3分别是2015年1月11日、2月12日的Landsat-7 ETM+和MODIS数据对,第二组实验中将2015年5月19日作为预测时刻,t1t3分别是2015年4月25日、7月30日的Landsat-8 OLI和MODIS数据对,融合得到预测t2时刻的高分辨率影像。一般来说,影像质量评估方法包括基于人类感知的主观方法和客观计算方法,主观评价上主要通过视觉效果上的纹理细节、颜色等方面评价。客观上,将预测日期的融合结果与真实观测的Landsat影像进行比较,选用以下两个评价指标进行方法性能的定量评价。第一个指标是均方根误差(Root Mean Square Error,RMSE),用来衡量融合结果与真实观测影像之间整体差异,RMSE越小,说明影像质量越好。第二个统计指标是结构相似性(Structural Similarity, SSIM),该指标重在比较融合结果和真实观测影像之间的整体结构的相似性来评估融合结果的空间信息恢复效果。SSIM有效范围在[-1,1]之间,SSIM值越大,说明影像质量越好。

5 结果分析与讨论

5.1 融合结果及精度评估

为了有效验证本文方法,对原本无云的预测时间MODIS数据模拟不同面积大小的云覆盖,得到不同缺失率的预测时刻MODIS数据。此外,采用传统经典时空融合方法ESTARFM作为对照,并且在ESTARFM运行前,对不同缺失率的预测时刻MODIS做样条插值(Spline Spatial Interpolation Method,SSIM)处理来重建缺失信息。针对2015年1月19日和5月19日两个预测时间融合结果,表4给出了两种方法在不同缺失率情况下典型区域的定量对比,即两种方法分别在绿波段、红波段、近红外、中红外波段上的综合定量评价结果。表中黑色加粗数字表示最佳结果。由表4可见,本方法融合结果在4个波段上的RMSE值大多数低于ESTARFM预测结果,而SSIM值大多数高于ESTARFM预测结果。相比ESTARFM,不同像素缺失率条件下本方法取得较小的RMSE平均值和较高的SSIM平均值,且变化幅度较小。这表明本方法在纹理细节上重建精度更高,空间信息恢复效果更好,本文所提出的融合方法在地表反射率方面提取结构细节能力明显优于ESTARFM方法,模型稳定性更强。

表4   2015年1月19日和5月19日两种方法融合结果的定量对比(黑体加粗结果更好)

Table 4  The quantitative comparison of the fusion results from the two algorithms on January 19, 2015 and May 19, 2015 (the bolded results are better)

缺失率类型波段2015年1月19日2015年5月19日
ESTARFM本文方法ESTARFM本文方法
RMSESSIMRMSESSIMRMSESSIMRMSESSIM
33%绿色0.048 590.991 870.034 010.992 030.032 010.988 700.020 930.997 01
红色0.046 510.990 170.032 370.987 890.039 280.985 190.038 030.993 13
近红外0.071 190.985 570.057 200.988 500.075 050.978 280.069 600.982 32
中红外0.040 150.991 420.021 540.993 750.041 580.988 120.039 320.988 77
平均值0.051 610.991 470.037 050.989 150.046 980.985 070.041 950.990 31
59%绿色0.047 670.992 020.033 780.992 050.031 250.989 110.020 880.997 01
红色0.045 340.990 350.032 580.987 840.039 110.985 060.038 390.993 07
近红外0.072 910.984 700.057 900.985 140.078 430.978 110.067 100.982 60
中红外0.042 710.990 540.022 350.993 590.043 550.987 770.036 470.988 58
平均值0.052 160.988 530.036 650.990 260.048 090.985 010.040 780.990 32
67%绿色0.050 850.991 470.033 780.992 050.032 510.989 050.020 950.997 01
红色0.052 050.989 230.032 580.987 840.038 090.986 200.038 140.993 11
近红外0.073 600.985 740.062 380.983 990.083 700.978 400.065 400.982 70
中红外0.053 000.990 520.022 780.993 530.038 990.988 870.037 270.988 69
平均值0.062 230.989 240.037 880.991 140.048 320.985 630.040 440.990 38

新窗口打开| 下载CSV


为了比较本文方法和ESTARFM方法的视觉效果,图4展示了2015年1月19日和5月19日真实Landsat局部影像及两种方法的对应结果。第一、三行显示真实Landsat影像、两种方法融合结果,二、四行对应展示了红色、黄色矩形框中影像局部放大的细节图,如图4(d)—图4(f)和图4(j)—图4(l)。由图4(a)—图4(c)和图4(g)—图4(i)可以直观地看出,两种方法的融合结果均能够预测出接近于真实Landsat影像的地物信息,但仍存在一定程度上的光谱失真;具体地,如图4(f)和图4(l),ESTARFM在部分水体区域,影像纹理信息缺失严重,水体边界模糊,存在明显的噪声斑点、地物信息颜色过亮而失真;而本文方法预测影像的纹理信息更接近真实影像,水体边界信息丰富完整、整体较为平滑,狭长细小水体轮廓清晰,例如图4(d)红色矩形放大细节图和图4(j)黄色矩形放大细节图。因此本文融合方法重建及恢复细节信息能力更强。

图4

图4   不同缺失率下两种时空融合结果视觉比较

Fig.4   Visual comparison of results from the two methods with the different missing rate


5.2 两种方法融合影像的水体提取及精度评估

为验证两种方法融合结果在典型区域的水体提取应用效果,以2015年1月19日和5月19日预测结果为例,采用MNDWI分别对缺失率33%、59%的本方法预测结果、ESTARFM预测结果和真实Landsat影像进行水体提取,图5展示了MNDWI使用绿波段和中红外波段进行水体信息提取的分类图,其中白色为水体、黑色为非水体。从图5可以直观看出,两种方法的融合结果在水体提取效果上均能够提取出无干扰信息存在的水体,但是ESTARFM方法因部分存在水体的区域融合效果较差,水体提取难度增大从而导致未能完整的识别水体信息,因此提取结果中存在较多漏提和明显的细碎误提水体信息现象。而本文方法预测结果的水体提取效果更加接近真实影像的水体提取效果,水体斑块清晰、能够较为准确地捕捉到水体边界,漏提和误提现象不明显,如图5中白色矩形框中所示。综合以上水体提取结果,可以认为本文方法的融合结果在该区域水体分类的应用准确度更高、提取的水体信息更加接近真实Landsat影像水体分类结果。表5为两种融合方法融合影像的水体分类精度评价结果。从表5中可以得出,在不同缺失率情况下两种融合方法水体总体精度均达到92%以上,这说明使用MNDWI在两种融合影像上均能够很好地提取水体信息的主要轮廓,但是由于细碎水体的提取存在一定差异,出现了漏分和错分。总体而言本文融合方法水体边界范围提取结果更加完整且接近真实影像水体分类图。另外表5中两种方法的Kappa系数表明,本文融合方法在水体提取监测方面的精度优于ESTRAFM方法。

图5

图5   不同缺失率下的两种时空融合结果的水体提取对比

Fig.5   Comparison of water body extraction effect of the two fusion results with different missing rate


表5   两种时空融合结果水体分类图的精度评价

Table 5  Accuracy assessment of water mapping by ESTARFM and the proposed method

指标

2015年1月19日

(缺失率33%)

2015年5月19日

(缺失率59%)

ESTARFM本文方法ESTARFM本文方法
用户精度/%76767380
制图精度/%74938594
总体精度/%92959295
Kappa系数0.710.830.730.83

新窗口打开| 下载CSV


5.3 讨论

通过对融合结果及水体提取精度分析发现,本文方法能够获得优于ESTARFM方法的融合结果。这是由于在预测时刻MODIS影像存在缺失信息的情况下,本文方法结合了重建子网络和时空融合网络块,在时间域和空间域同时进行优化影像特征信息,达到了充分利用Landsat影像的空间信息和MODIS影像的时间变化信息的效果,这是传统融合方法所不能实现的。此外,本文方法采用与待预测时刻相邻的前后各3个时刻的Landsat和MODIS影像组成的高-低分辨率数据对,训练数据充分,进而能够更好地训练网络。但是作为对照方法的ESTARFM,一方面,尽管使用样条插值处理重建出缺失信息,其重建的准确性仍然较低,影响了后续融合效果。另一方面,该传统融合方法仅仅将相邻时刻的高—低空间分辨率影像对和中间预测时刻的低空间分辨率影像作为输入数据,未能充分获取Landsat影像的空间信息,故而无法有效地实现云覆盖情况下的遥感影像时空融合。在对应融合影像的水体提取方面,本文融合影像纹理细节信息丰富,因而其水体提取效果更加接近真实影像的水体提取效果。但实验仍然存在一定不足:①实验是分波段进行训练及预测,这大大增加了方法的计算成本,且训练数据采用多对高-低分辨率影像组合,在数据量较少的情况下,限制了其应用;而ESTARFM的输入数据量较少,整体效率高于本文方法,因此在今后的研究中,还需要提高本文方法的运行效率。②本文方法融合结果在颜色上稍偏离真实影像,出现一定的光谱失真现象,初步分析是优于训练数据选取的时间跨度过大,可能包含了多个季节不同物候期影像,造成一定的光谱失真。

因此,后续研究还需要进一步改进,尝试使用一对数据结合多个波段的信息进行融合,吸收不同波段的特征信息;同时进一步优化时空融合模型的结构,以此来拓展遥感影像数据信息的可用性。

6 结 论

研究提出了面向云覆盖的遥感影像时空融合深度学习模型,并应用于安徽淮南采煤沉陷区的水体面积提取研究。从预测时刻融合影像的定量对比结果、视觉效果以及水体提取效果中可以得出以下结论:

(1)在预测时刻MODIS影像存在缺失信息时,该方法融合影像更加接近于原始影像,融合结果各波段的RMSE和SSIM均取得较好地定量评价精度,融合影像的细节重建效果明显优于传统经典方法。

(2)由典型区域的水体提取应用效果分析可知,该方法在水体信息提取上取得更好的效果,总体精度为95%,Kappa系数0.83,进一步说明本文方法具有更高的融合精度,降低了时空融合对数据的限制要求,并具有更有效的应用性。

参考文献

Zhang XiaochuanWang Jie.

The analysis of eco-hydrological structure of Shengjin lake wetland based on spatial and temporal fusion technology of remote sensing

[J]. Remote Sensing Technology and Application,2020355): 1109-1117.

[本文引用: 1]

张晓川王杰.

基于遥感时空融合的升金湖湿地生态水文结构分析

[J]. 遥感技术与应用, 2020355): 1109-1117.

[本文引用: 1]

Dong WenquanMeng Jihua.

Review of spatiotemporal fusion model of remote sensing data

[J]. Remote Sensing of Land and Resources, 2018302): 1-11.

[本文引用: 1]

董文全蒙继华.

遥感数据时空融合研究进展及展望

[J]. 国土资源遥感, 2018302): 1-11.

[本文引用: 1]

Zhu X LCai F YTian J Qet al.

Spatiotemporal fusion of multisource remote sensing data:Literature survey,taxonomy, principles,applications,and future directions

[J]. Remote Sensing, 201820431-42. DOI: 10.3390/rs10040527 .

[本文引用: 1]

Zhukov BOertel DLanzl Fet al.

Unmixing-based multisensor multiresolution image fusion

[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999373): 1212-1226. DOI: 10.1109/36.763276 .

[本文引用: 1]

Zurita-Milla RKaiser GClevers Jet al.

Downscaling time series of MERIS full resolution data to monitor vegetation seasonal dynamics

[J]. Remote Sensing of Environment, 20091139): 1874-1885. DOI: 10.1016/j.rse.2009.04.011 .

[本文引用: 1]

Wu MingquanWang JieNiu Zhenget al.

A model for spatial and temporal data fusion

[J]. Journal of Infrared and Millimeter Waves, 2012311): 82-86.

[本文引用: 1]

邬明权王洁牛铮.

融合MODIS与Landsat数据生成高时间分辨率Landsat数据

[J]. 红外与毫米波学报, 2012311): 82-86.

[本文引用: 1]

Zhang WLi A NJin H Aet al.

An enhanced spatial and temporal data fusion model for fusing Landsat and MODIS surface reflectance to generate high temporal Landsat-like data

[J].Remote Sensing,2013510):5346-5368. DOI:10.3390/rs 5105346 .

[本文引用: 1]

Gao FMasek JSchwaller Met al.

On the blending of the landsat and MODIS surface reflectance:Predicting daily Landsat surface reflectance

[J]. IEEE Transactions on Geoscience and Remote Sensing,2006448):2207-2218. DOI: 10.1109/ TGRS.2006.872081 .

[本文引用: 1]

Zhu X LChen JGao Fet al.

An enhanced spatial and temporal adaptive reflectance fusion model for complex heterogeneous regions

[J]. Remote Sensing of Environment, 201011411): 2610-2623. DOI: 10.1016/j.rse.2010.05.032 .

[本文引用: 1]

Fu D JChen B ZWang Jet al.

An improved image fusion approach based on enhanced spatial and temporal the adaptive reflectance fusion model

[J]. Remote Sensing, 2013512): 6346-6360. DOI: 10.3390/rs5126346 .

[本文引用: 1]

Wang Q MZhang Y HOnojeghuo A Oet al.

Enhancing spatio-temporal fusion of MODIS and Landsat data by incorporating 250 m MODIS Data

[J].IEEE Journal of Selected To-pics in Applied Earth Observations & Remote Sensing, 2017109):4116-4123. DOI:10.1109/JSTARS.2017.2701643 .

[本文引用: 1]

Shen HWu P HLiu L Yet al.

A spatial and temporal reflectance fusion model considering sensor observation differences

[J]. International Journal of Remote Sensing, 20133412): 4367-4383. DOI: 10.1080/01431161.2013.777488 .

[本文引用: 1]

Wang JHuang B.

A Rigorously-weighted spatiotemporal fusion model with uncertainty analysis

[J]. Remote Sensing, 2017910): 990. DOI: 10.3390/rs9100900 .

[本文引用: 1]

Wang QAtkinson P M.

Spatio-temporal fusion for daily Sentinel-2 images

[J]. Remote Sensing of Environment, 201820431-42. DOI: 10.1016/j.rse.2017.10.046 .

[本文引用: 1]

Zhu X LHelmer EGao Fet al.

A flexible spatiotemporal method for fusing satellite images with different resolutions

[J]. Remote Sensing of Environment, 201617211): 165-177. DOI: 10.1016/j.rse.2015.11.016 .

[本文引用: 1]

Zhao Y QHuang BSong H H.

A robust adaptive spatial and temporal image fusion model for complex land surface changes

[J]. Remote Sensing of Environment, 20182082): 42-62. DOI: 10.1016/j.rse.2018.02.009 .

[本文引用: 1]

Song H HHuang B.

Spatiotemporal satellite image fusion through one-pair image learning

[J]. IEEE Transactions on Geoscience and Remote Sensing,2013514): 1883-1896. DOI: 10.1109/TGRS.2012.2213095 .

[本文引用: 1]

Wu BHuang BZhang L P.

An drror-bound-regularized sparse coding for spatiotemporal reflectance fusion

[J]. IEEE Transactions on Geoscience and Remote Sensing, 20155312): 6791-6803. DOI: 10.1109/TGRS.2015.2448100 .

[本文引用: 1]

Wei J BWang L ZLiu Pet al.

Spatiotemporal fusion of MODIS and Landsat-7 reflectance images via compressed sensing

[J]. IEEE Transactions on Geoscience and Remote Sensing, 20175512):7126-7139. DOI:10.1109/TGRS. 2017. 2742529 .

[本文引用: 1]

Song H HLiu Q SWang G Jet al.

Spatiotemporal satellite image fusion using deep convolutional neural networks

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018113): 821-829. DOI: 10.1109/JSTARS.2018.2797894 .

[本文引用: 2]

Tan Z YYue PDi L Pet al.

Deriving high spatiotemporal remote sensing images using deep convolutional network

[J]. Remote Sensing,2018107):1066. DOI:10.3390/rs10071066 .

[本文引用: 2]

Liu XDeng C WChanussot Jet al.

StfNet: A two-stream convolutional neural network for spatiotemporal image fusion

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019579):6552-6564. DOI:10.1109/TGRS.2019.2907310 .

[本文引用: 1]

Yao KaixuanCao Feilong.

Spatial-temporal fusion algorithm for remote sensing images based on multi-input dense connected neural network

[J]. Pattern Recognition and Artificial Intelligence, 2019325):429-435.

[本文引用: 1]

姚凯旋曹飞龙.

基于多输入密集连接神经网络的遥感影像时空融合方法

[J]. 模式识别与人工智能, 2019325):429-435.

[本文引用: 1]

Zhang H YSong Y YHan Cet al.

Remote sensing image spatiotemporal fusion using a generative adversarial network

[J].IEEE Transactions on Geoscience and Remote Sensing,2020595):4273-4286. DOI:10.1109/TGRS.2020.3010530 .

[本文引用: 3]

Wu P HYin Z XZeng Cet al.

Spatially continuous and high-resolution land surface temperature product generation: A review of reconstruction and spatiotemporal fusion techniques

[J]. IEEE Geoscience and Remote Sensing Magazine, 202193):112-137. DOI: 10.1109/MGRS.2021.3050782 .

[本文引用: 1]

Liu QMeng Meng X CShao Fet al.

PSTAF-GAN: Progressive spatio-temporal attention fusion method based on generative adversarial network

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022601-13. DOI: 10.1109/TGRS.2022.3161563 .

[本文引用: 1]

Shen H FLi X HCheng Qet al.

Missing information reconstruction of remote sensing data: A technical review

[J]. IEEE Geoscience & Remote Sensing Magazine, 201533): 61-85. DOI: 10.1109/MGRS.2015.2441912 .

[本文引用: 2]

Chen ZihanWang FengXu Ninget al.

Cloud removal by fusing optical and SAR images based on improved PCNN in NSST domain

[J]. Remote Sensing Technology and Application, 2021364): 810-819.

[本文引用: 1]

陈子涵王峰许宁.

基于改进NSST-PCNN的光学与SAR图像融合去云方法

[J]. 遥感技术与应用, 2021364): 810-819.

[本文引用: 1]

Yin Z XWu P HFoody G Met al.

Spatiotemporal fusion of land surface temperature based on a convolutional neural network

[J]. IEEE Transactions on Geoscience and Remote Sensing,2020592):1808-1822. DOI: 10.1109/TGRS. 2020.2999943 .

[本文引用: 1]

Wu P HYin Z XYang Het al.

Reconstructing geostationary satellite land surface temperature imagery based on a multiscale feature connected convolutional neural network

[J]. Remote Sensing,2019113): 300. DOI: 10.3390/rs11030300 .

Zhang QYuan Q QLi Jet al.

Thick cloud and cloud shadow removal in multitemporal imagery using progressively spatio-temporal patch group deep learning

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020162148-160. DOI: 10.1016/j.isprsjprs.2020.02008 .

Xia MJia K.

Reconstructing missing information of remote sensing data contaminated by large and thick clouds based on an improved multitemporal dictionary learning method

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022601-14. DOI: 10.1109/TGRS.2021.3095067 .

[本文引用: 1]

Xu Hanqiu.

A study on information extraction of water body with the Modified Normalized Difference Water Index(MNDWI)

[J]. National Remote Sensing Bulletin,200595):589-595.

[本文引用: 1]

徐涵秋.

利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究

[J]. 遥感学报, 200595): 589-595.

[本文引用: 1]

/