基于内容的遥感图像变化信息检索概念模型设计
1.
2.
3.
Design of Content-based Remote Sensing Image Change Information Retrieval and Relevance Feedback Model
1.
2.
3.
通讯作者:
收稿日期: 2019-01-24 修回日期: 2020-04-24 网络出版日期: 2020-07-03
基金资助: |
|
Received: 2019-01-24 Revised: 2020-04-24 Online: 2020-07-03
作者简介 About authors
马彩虹(1986-),女,山东临沂人,博士,工程师,主要从事遥感图像智能处理与检索、遥感数据发布管理以及热源重工业识别研究E⁃mail:
关键词:
Keywords:
本文引用格式
马彩虹, 关琳琳, 陈甫, 王大成, 刘建波.
Ma Caihong, Guan Linlin, Chen Fu, Wang Dacheng, Liu Jianbo.
1 引 言
随着遥感技术的进步,各种遥感数据不断积累,各行各业对遥感变化信息数据的需求日益旺盛。如资源保护中森林覆盖的动态监测、城市规划中土地利用类型的变化分析、军事侦察中战略目标的动态监视以及自然灾害的定向评估等,都需要大量的遥感变化信息数据作为数据支持。在海量遥感数据的背景下,现有的依据先验经验知识+基于关键字/元数据的遥感数据服务模式,一方面,受先验知识储备完备性的影响,不能保证所获取的遥感变化信息数据的完备性;另一方面,受基于关键字/元数据的遥感数据服务模式对目标变化信息描述的局限性,也无法精确地刻画不同应用领域用户的实际查询检索需求。因此,亟需一种新的能满足不同应用领域用户对多样化遥感变化信息数据快速、有效、全面、准确地获取方式。
基于内容的图像检索,作为一种基于图像内容特征的图像获取服务模式,在海量图像应用背景下,能更加有效、快速地理解不同用户的查询检索需求,已经成为国际视觉信息领域中的研究热点。本文将基于内容的图像检索模式应用到遥感图像变化信息数据的获取中,针对遥感图像变化信息数据服务的特点,建立了一种全新的基于内容的遥感图像变化信息检索模式。通过目标变化遥感图像对的形式来描述变化需求,能更加清晰、准确地描述不同用户的实际查询检索需求,保证了变化信息数据获取的完备性,为不同变化信息发现需求的用户提供了快速、准确、足量完备的数据筛选支持,提高了遥感变化信息数据服务的水平和效率,具有重要的科学和应用实践意义。
2 研究进展
基于内容的遥感图像变化信息检索模型,是一种全新智能的遥感图像变化信息数据获取的服务模式。其本质是针对目标变化遥感图像对的相似性查询检索方法,能够快速、有效、全面、准确地从海量遥感数据中发现变化信息数据,为不同变化信息应用领域的用户提供足够的数据支持。作为一种基于图像本身内容的变化信息数据获取方式,可以辅助发现相似性变化信息,与传统的遥感图像变化检测方法相比,其对变化图像对的预处理(配准、辐射校正)要求较低,在大区域(全国、全球)、长时间序列的海量遥感数据背景下,其普适性和推广性更强。该课题主要涉及遥感数据服务模式、基于内容的遥感图像检索和智能反馈等3个研究领域,现对3个领域的研究现状做出如下综述。
2.1 遥感数据服务模式
自20世纪中期卫星航天事业的崛起后,卫星遥感技术也得到了突飞猛进的发展,各个卫星遥感科学强国也规划了一系列长期对地/空观测项目,如:欧洲宇航局先后发展了ERS、Envisat卫星系列,实现了对地球表面和大气层进行连续的观测;法国自1986年以来先后发射了SPOT1-7号系列地球观测卫星,满足了制图、农业、林业、土地利用、水利、国防、环境以及地质勘探等多个应用领域的需要;日本、印度也推出了相当系列的卫星。同时,在高分辨率卫星发展上,商业公司的IKONOS、QuickBird、GEOEYE、World View、PLEIADES等卫星数据也为用户提供了大量服务。而伴随着遥感卫星技术的发展,遥感数据资源也变得越来越丰富,遥感数据获取的时效性、重访周期与空间分辨率方面得到很大提高。并且,这些遥感数据已经在重要行业应用、重大工程监测、国家宏观决策等方面发挥了不可或缺的作用[1,2]。随之,各个国家也开发了一系列针对基础遥感数据的基于关键字/元数据(传感器类型、轨道号、区域位置、获取时间等)的服务系统[3],例如美国USGS、欧空局ESA、日本RESTEC、法国SPOTIMAGE、资源卫星应用中心、中科院遥感地球所等部门均提供了自己的数据服务系统。同时,伴随着计算机处理能力以及遥感专题产品的发展,一些系统也开始提供某些成熟典型应用专题遥感数据的服务,如NDVI指数产品数据、云覆盖产品数据、水陆边界产品数据等。近几年,为满足用户对遥感图像变化信息的数据服务,NASA推出了针对美国大陆、阿拉斯加州两大区域范围,Landsat卫星2003~2012年的长时间序列遥感数据WELD服务系统;中科院遥感与数字地球研究所提供了针全球6大重点区域,正射产品、星上反射率产品等5种产品的若干年时序产品RTU服务系统;澳大利亚也提出了相应的Datacube时序数据服务系统[4];ESRI推出了面向全球重点区域的1975、1990、2000、2005和2010年等6个时间段,共计10种变化模式的5种专题产品的变化检测ChangeMatters服务系统。上述服务系统在一定程度上满足了某些特定领域针对特定需求的变化信息数据检索需求。
但是受专题产品生产算法、变化检测算法普适性的限制,上述服务模式能提供的专题服务数据,具有地理区域覆盖范围小、专题产品种类少的特点,故在海量、多源遥感数据背景下的普适性和推广性较差。同时,作为传统基于关键字/元数据的数据服务模式,其无法准确地刻画不同用户、不同应用需求的遥感图像变化信息数据的获取需求。因此,在海量遥感数据的背景前提下,一种新的适用性强、能够满足不同用户多样化的应用需求的变化信息发现和获取方式,是变化信息发现和挖掘究领域需要解决的关键问题之一。
2.2 基于内容的遥感图像的检索
基于内容的图像检索(Content- Based Image Retrieval, CBIR)[5]自20世纪90年代初提出的,是对图像按从高到低的层次进行分析和理解的角度来获取图像的各类视觉特征(如颜色、纹理、形状等),然后再根据这些图像的内容特征来进行图像检索的方式。其作为一种新的易于理解的“以图查图”的图像检索方式,在医学图像、电子图书馆、专利商标检索以及建筑设计等领域有着广泛的应用。随后,在20世纪90年代中期基于内容的遥感图像检索[3,6,7]也得到一定的发展,研究的重点主要集中在遥感图像的光谱和纹理特征提取、图像分解及其图像的相似性匹配等技术的研究,并在此基础上开发了满足特定专业应用的实验系统。如:美国Maine大学的Stefanidias等研究与实现了在GIS集成环境下的基于草图的遥感图像检索方法, Maheshwary等[8]应用颜色和纹理属性实现遥感图像检索等。目前国内的研究机构和卫星公司为了很好地管理、分发和使用所存储的海量遥感图像,分别建立了各自的遥感图像数据库及其相应的遥感图像查询发布系统,在基于内容的遥感图像检索的相关技术和方法的研究中取得了一定的进展。目前,代表性的研究主要有:李德仁院士等[9]提出了一种新的基于内容遥感图像检索的图像分块策略;Du等[10]对基于内容的遥感影像检索的若干问题和基于光谱特征的高光谱遥感影像检索进行了研究;张成刚等[11]研究了遥感影像内容的语义查询算法与应用等。遥感图像的特征选择和提取是CBRSIR检索质量最直接因素,针对CBRSIR中特征选择问题,不同的学者提出了各式解决方案。如陆丽珍[12]提出基于多通道Gabor纹理特征的遥感图像检索模型,施智平等[13]提出了基于纹理普描述子的图像检索方法, TSW特征[14]、HSV等特征也在图像检索起到了一定的检索效果。
2.3 基于内容的图像检索的反馈机制
目前,图像检索系统存在的一个主要问题是检索过程以计算机为中心,使得一些查询结果并不能完全的满足用户的要求[16]。图像检索系统的最终用户是人,因此通过交互手段来捕获人对图像内容的认知是相当重要的。为了将用户模型嵌入到图像检索系统,最近几年在基于内容的图像检索领域引入了相关反馈机制[17,18]。相关反馈的目的是从用户与查询系统的实际交互过程中进行学习,发现并捕获用户的实际意图,并以此修正系统的查询策略,从而得到与用户实际需求尽可能相吻合的查询结果[19]。目前,主要的相关反馈方法有:移动查询点、特征权重的调整方法、确定最优查询规则的方法、神经网络法、支持向量机法和基于人工免疫系统的图像检索模型等。不同方法在不同场合有不同的应用,前两种方法相对比较简单,并且效果较好,较为流行;基于人工免疫系统的反馈方法,能增强语义的理解能力,提高检索的准确率。支持向量机(Support Vector Machine,SVM)的模型,由于不需要特定问题的先验知识,在有限的训练样本下,以及非线性或高维模式识别问题中具有较大优势,可以很好地控制学习机器的推广能力[20]。
图像检索的相关反馈过程可以看作模式识别中的二分类问题,因此可将 SVM算法用于相关反馈的学习和检索过程。但是,在SVM的反馈模型中,核函数参数的选取和样本的选取方式,是反馈模型中两大重要问题。良好的参数选择方式以及采样算法,直接影响相关反馈检索的准确度和收敛到目标图像的速度。针对以上问题,科学家提出了一系列的解决方案, 例如Hsu等[21]提出的一种传统的Grid参数选择方式,此种算法比较稳定,其缺点是参数的搜索空间较小,且不能进行高维特征的自主选择。随后,Huang等[22]将GA算法引入到SVM模型的学习当中,实现了参数和特征的同时自主选择,但是也存在收敛速度缓慢等问题。Tong等[23]提出了Active-SVM来解决训练集数目不足和训练集不对称的问题。之后,Abdi等[24]提出了一种基于PSO的参数和特征选择方式,但是PSO算法具有早熟和陷入局部最优的缺陷,致使形成的SVM分类模型的鲁棒性不高。Demir等[25]提出了Active学习来解决训练集数目不足和训练集不对称的问题。
3 基于内容的遥感图像变化信息检索概念模型设计
由于遥感变化信息数据的获取,可以看作是基于一对或多对遥感图像变化对的相似变化性查询检索方式。本文将基于内容的图像检索模式应用到遥感图像变化信息检索当中,依据遥感图像变化信息数据的特点,结合遗传算法、支持向量机和主动学习等机器学习理论,提出了一种基于内容的遥感图像变化信息检索模型,为遥感图像变化信息数据快速获取与服务,提供了一套新的智能化解决方案。
3.1 总体架构
研究基于内容的遥感图像变化信息检索和智能反馈模型框架,必须考虑到遥感图像变化信息发现和人工反馈的特点,研究的框架模型要能够满足遥感图像变化信息检索和智能反馈任务及需求。根据基于内容的遥感图像变化信息检索和智能反馈模型框架需求,建立了合理的分层模型,主要包括:基础数据准备层、神经网络模板集训练层、基于内容的遥感图像变化信息检索层、智能反馈层和数据库管理层。项目的总体技术路线如图1所示。
图1
图1
基于内容的遥感图像变化信息检索的总体技术路线图
Fig.1
The overall technical architecture diagram of the content-based remote sensing change information retrieval
基础数据准备层,是按照遥感图像变化信息检索的需求,实现原始多源、多时相遥感影像数据的数据归档,构建相应的原始影像数据库、元信息数据库、图像块数据库和变化特征数据库。
基于内容的遥感图像变化信息检索层,根据不同用户的应用需求,在输入需要查询的目标变化图像对并提取特征形成目标变化特征矢量后,计算目标矢量与变化特征库中不同数据之间的距离,以距离与归属概率值的比值作为相似性度的度量值,再结合遥感影像库和元数据库信息,最终输出对应的相似变化检测影像对。
智能反馈层,当初次检索不符合用户需求时,引入反馈机制,以使查询结果最终满足用户需求。主要包括训练样本采样方式设定和反馈模型参数优化。训练样本采样方式设定,是指在每轮相关反馈中,选择什么样的图像返回给用户标记,以尽量无重复、高效的标记出信息量大的图像样本,以降低用户工作量,提高检索结果的准确率;反馈模型参数优化,包括反馈模型输入参数的优化,以及输入特征的特征选择等,以提高反馈模型的整体精度。
数据库管理层,实现原始影像数据库、元信息数据库、图像块数据库和变化特征数据库的入库、查询、管理工作。
3.2 多源、多时相遥感影像数据的变化信息数据入库归档
考虑到遥感影像自身的特点,本文设计实现了一种符合MPEG7规范的基于类五叉树的分层分块的数据管理模型。由于本文提出的变化信息数据获取方式是基于变化图像对本身内容的查询检索方式,故其对变化图像对的预处理要求较低,不需要进行刻意的辐射校正,几何配准精度在5个像素以内即可。同时,为适应不同对象的变化信息发现的检索需求,遥感影像切割的最小瓦块大小为128像素×128像素。多源、多时相遥感影像数据变化信息入库归档的流程如下所述(图2)。
图2
图2
多源、多时相遥感影像数据的变化信息数据入库归档
Fig.2
The flowchart of the remote sensing image storagment
①假彩色影像合成,按照R、G、B波段组合融合成假彩色图像;②解析数据的元数据信息,获取历史数据的区域信息,按照区域信息,实现不同时相、不同传感器影像的裁切和和粗配准;③按照选定的数据分层分块策略,对粗配准后的影像进行切割操作;④对切割的小图像块,采用综合颜色和纹理特征的特征提取模型,实现特征提取和归一化处理;⑤根据合理历史数据组织管理策略,比如时间顺序、逆序、相间相生序等原则,形成变化特征矢量。
4 研究前沿和难点
4.1 数据管理模型建立
数据模型是基于内容的遥感图像变化信息检索模型的核心,模型决定了系统的查询和检索能力。相对于一般图像而言,用于变化信息发现的遥感影像具有尺度大、数据量大、时间序列较长、多源、多传感器等特点,这些特点决定了遥感影像变化信息检索往往是面向子图、部分区域或感兴趣对象的,也决定了遥感影像的数据库存储与管理必须是建立在图像分块和分幅的基础上的。因此如何根据遥感图像自身的特点以及变化信息获取的需求,并综合考虑元数据、影像数据和特征数据等多种数据存储需求,建立合理的数据管理模型,实现多源、多时相遥感影像数据的变化信息数据入库归档,是本文的重要问题之一。
4.2 综合多特征遥感图像变化信息检索模型建立
由于颜色、纹理、光谱等单类特征不能完全表达遥感图像内容,基于单类视觉特征的检索往往不能满足遥感图像变化信息检索的需求。因此,如何根据现有颜色、纹理、形状和空间、语义等特征各类视觉特征的优缺点,设计出一种普适性较好的特征组合方式,仍然是决定基于内容的遥感图像变化信息检索模型结果准确性的关键问题之一。在对各个特征进行大量的实验分析的基础上,本文拟对遥感图像采用HSV空间的颜色直方图、三阶颜色矩改进的纹理谱、灰度共生矩阵、矩不变量和快速小波等七类特征(Ma等, 2014),形成了846维变化特征向量。高维特征的图像描述形式,对遥感图像变化信息的描述更加准确。同时,也保证了查询的准确性,为后续的特征学习和特征选择提供了基础和条件。
4.3 遥感图像变化信息检索的智能反馈模型建立
为解决人机理解差异,即初次检索结果往往会不尽人意,也即所谓的 “语义鸿沟”问题。需要将相关反馈机制引入到图像变化信息检索中,鉴于支持向量机模型,在不需要特定问题的先验知识,有限的训练样本下,具有很好的控制学习机器的推广能力,本文将SVM引入到遥感图像变化信息检索的智能反馈模型中,提出了基于改进SVM的遥感图像变化信息检索反馈模型。同时为了解决在SVM的反馈模型中,核函数参数、多特征的选择优化,以及训练样本的采样方式,仍然是两个重要的核心问题。因此,如何针对遥感图像变化信息检索的需求,选择合适的训练样本采样算法,以及参数和特征选择模型,是建立高效智能反馈模型的重要问题。鉴于此,将基于遗传算法(GA)的特征优化模型和基于主动式学习的图像标注方式,引入到基于SVM的智能反馈模型中,形成了改进的SVM的遥感图像变化信息检索的智能反馈模型。该反馈模型能够充分利用遗传算法(GA)的优点,将GA算法的遗传、交叉和变异操作应用到特征选择与参数优化中,以适应不同用户需求的特征选择和参数最优化。同时,在训练样本的采样中,将主动式学习引入到遥感图像变化信息检索的反馈系统中,选择信息量大、重复量小的图像进行标注,降低了用户工作量,提高了检索结果的准确率和收敛速度。
5 简易框架系统搭建
本文在Win7平台下,采用Matlab实现预编程,设计实现简易的基于内容的遥感图像变化信息检索与智能反馈概念模型系统,效果图如图3所示。其主要包括:目标变化图像对输入区域、特征选择区域、反馈的采样方式和参数训练区域、图像显示和反馈等四大区域。分别用于目标变化图像对输入,特征组合方式的确定,反馈模式选择,和参数训练样式选择。
图3
以覆盖北京区域的Landsat卫星的123行03列,时间跨度为1996~2015年,14景质量相对较好时序数据形成长时间序列。采用类五叉树方式切割形成瓦片后,每景影像分割成了2 288块大小为128像素×128像素的图像块。采用顺向正向全排法,共计生成151 008对变化图像对。顺向正向全排法,是指按照时间正方向,采用全排的方式,组织形成变化图像对。图4显示了从水覆盖区域变为建筑物检索结果示意图,左上角为目标变化图像对,中间主体部分检索结果,其按照与目标变化图像对内容的相关性,从上到下、从左到右依次递减。其中,右下角显示了目标变化图像对在原始影像中的位置。由右下方子图可知,在东南五环到六环之间,出现了批量水域变更。经查询验证,1999年7月份北京地区出现年降水超过700 mm,符合实际情况。
图4
图4
水域改造成建筑区的查询结果示意图
Fig.4
Query by example: looking for urban expansion area around water in long time series RS images
6 结论和展望
本文探索了基于内容的遥感图像变化信息检索模型研究意义,将基于内容的图像检索和相关反馈技术应用在遥感图像变化信息检索建模中,提出了一种基于内容的遥感图像变化信息检索模型。在海量遥感数据的背景下,为遥感图像变化信息的发现和挖掘,提供了一种新的、快速、有效能适应不同应用领域用户的数据分发服务模式。作为一种全新的遥感变化信息数据的获取方式,与传统数据服务模式相比,一方面,能有效利用遥感图像的中低层特征,能更加准确地刻画不同用户的遥感图像变化信息检索需求;另一方面,该模型对变化图像对的预处理要求较低,具有较好普适性和自动化性,不受变化检测产品生产种类限制,是一种可以应用于全球范围、全时序变化信息发现服务模式,提高了遥感信息服务的水平和效率。基于内容的遥感图像的变化信息检索,由于其具有更易理解、自动化强等特点,势必会为遥感图像的变化检测和图像检索领域带来新的希望,具有很好的理论和实践应用前景。按照应用目标人群的不同,其主要的应用方向和前景如下所述:①为不同应用领域的专家提供一种快速、有效的遥感图像变化信息获取方式,提供了必要、足量、快速的数据筛选支持,为变化检测领域的进一步发展奠定了基础;②为政府等管理型人员提供了一种丰富、多样、灵活的目标变化检索形式,为特殊事件的快速估计、快速响应提供了快速数据响应服务,可以在一定程度上满足政府工作人员对各类复杂事件的决策辅助需求;③以图像的形式来刻画用户对目标的知识需求,其表达形式更易理解和操作,为遥感走进大众、融入大众提供一种可能和途径。
基于内容的遥感图像变化信息检索模式,在国内研究中属于新的探索。本文在现有的理论技术基础上,进行了综合多特征的遥感图像变化信息检索和反馈研究,并验证了其有效性。随着技术的发展以及遥感数据的扩展,以下两个方面仍然需要进一步研究:
(1)有效的高维索引的建立。综合多特征的遥感图像变化信息检索模型,增强了遥感影像变化信息可分辨性。但伴随着遥感变化信息图像库的数据量迅速增大,以及综合多特征遥感图像变化信息检索方式的特征向量维度加大,为满足遥感图像变化信息检索的实时性需求,必须引入合理的高维索引模型。由于基于特征空间分割的索引方法(如K-D Tree、R-Tree等),会随着特征维数的增加其检索性能急剧恶化;基于聚类的高维索引机制,对于数据库的依赖性较大,索引机制的稳定性较差;基于散列的高维索引机制,其空间复杂度大,可扩展性较差。如何依据遥感图像变化信息检索需求,建立高效、稳定、支持多特征数据库的动态更新和维护的高维索引方案,是该模型步入实践运行的重要问题之一。
(2)基于局部特征的检索。本文应用图像变化信息检索的特征属于全局特征,取得了一定的研究成果。然而在特定目标变化图像对和语义的检索应用场景中,本文提出的方法在需求描述中会存在一定的不足。基于局部特征的图像检索,正是针对上述问题提出的一中可行的解决方案。相对于全局特征描述子,使用基于局部特征的检索方式,能对遥感变化图像对的内容进行更进一步的理解和分析,更容易获得图像的语义特征。
参考文献
Design and Implementation of Active-based Instant Remote Sensing Data Service
[J].
遥感卫星数据实时主动服务系统设计与实现
[J].
Location-based Instant Satellite Image Service: Concept and System Design
[J].
An Improved SVM Model for Relevance Feedback in Remote Sensing Image Retrieval
[J].
Rapid, High-resolution Detection of Environmental Change over Continental Scales from Satellite Data—The Earth Observation Data Cube
[J].
Prototype System for Retrieval of Remote Sensing Images based on Color Moment and Gray Level Co-occurrence Matrix
[J].
Human-Centered Concepts for Exploration and Understanding of Earth Observation Images
[J].
Target-driven Extraction of Built-up Land Changes from High-resolution Imagery
[J].
Prototype System for Retrieval of Remote Sensing Images based on Color Moment and Gray Level Co-occurrence Matrix
[J].
A New Image Decomposition Method for Content-based Remote Sensing Image Retrieval
[J].
一种新的基于内容的遥感图像检索的图像分块策略
[J].
Study on Content-based Remote Sensing Image Retrieval
[C]∥ IEEE International Geoscience and Remote Sensing Symposium,
Research on Application and Semantic Query Algorithm of Remote Sensing Images
[J].
遥感影像内容的语义查询算法与应用
[J].
Remote Sensing Image Retrieval based on Multi-channel Gabor Texture Features
[J].
基于多通道Gabor纹理特征的遥感图像检索
[J].
Texture Spectrum Descriptor based Image Retrieval
[J].
基于纹理谱描述子的图像检索
[J].
A Novel Method for CBIR Using Texture Spectrum in Wavelet Domain
[C]∥
Research on Key Techniques of Content-based Optical Remote Sensing Image Retrieval
[D].
SVM-based Active Feedback in Image Retrieval Using Clustering and Unlabeled Data
[J].
Relevance Feedback in Image Retrieval: A Comprehensive Review
[J].
. Content based Image Retrieval at the End of the Early Years
[J].
Combining Gaussian Mixture Models and Support Vector Machines for Relevance Feedback in Content based Image Retrieval
[C]∥
Statistical Learning for Effective Visual Image Retrieval
[C]∥
A Simple Decomposition Method for Support Vector Machine
[J].
A GA-based Feature Selection and Parameters Optimization for Support Vector Machines
[J].
Support Vector Machine Active Learning for Image Retrieval
[C]∥
Automatic Detection of Erythemato-squamous Diseases Using PSO–SVM based on Association Rules
A Novel Active Learning Method in Relevance Feedback for Content-based Remote Sensing Image Retrieval
[J].
/
〈 |
|
〉 |
