img

官方微信

遥感技术与应用, 2021, 36(3): 618-626 doi: 10.11873/j.issn.1004-0323.2021.3.0618

遥感应用

融合高分辨率遥感影像和POI数据的多特征潜在语义信息用于识别城市功能区

高子为,1, 孙伟伟,2, 程朋根1, 杨刚2, 孟祥超3

1.东华理工大学 测绘工程学院,江西 南昌 330013

2.宁波大学 地理与空间信息技术系,浙江 宁波 315211

3.宁波大学 信息科学与工程学院,浙江 宁波 315211

Identify Urban Functional Zones Using Multi Feature Latent Semantic Fused Information of High-spatial Resolution Remote Sensing Image and POI Data

Gao Ziwei,1, Sun Weiwei,2, Cheng Penggen1, Yang Gang2, Meng Xiangchao3

1.School of Surveying and Mapping Engineering,East China University of Technology,Nanchang,330013,China

2.Department of Geography and Spatial Information Techniques,Ningbo University,Ningbo 315211,China

3.Faculty of Electrical Engineering and Computer Science,Ningbo University,Ningbo 315211,China

收稿日期: 2020-09-15   修回日期: 2021-04-13   网络出版日期: 2021-07-21

基金资助: 国家重点研发计划项目.  2017YFB0503704
国家自然科学基金项目.  41861052.  41861062.  41971296.  41671342.  41801256
浙江省自然科学基金项目.  LR1901D0001.  LQ18D010001

Received: 2020-09-15   Revised: 2021-04-13   Online: 2021-07-21

作者简介 About authors

高子为(1996-),男,浙江宁波人,硕士研究生,主要从事城市遥感环境监测方面的研究E⁃mail:nbgaoziwei@sina.cn , E-mail:nbgaoziwei@sina.cn

孙伟伟(1985-),男,河南巩义人,博士,教授,主要从事地理信息系统和遥感理论、方法及应用研究E⁃mail:sunweiwei@nbu.edu.cn , E-mail:sunweiwei@nbu.edu.cn

摘要

准确识别和划分城市功能区对合理规划城市发展和解决城市问题具有重要作用。遥感影像拥有丰富的光谱纹理特征但难以表征建筑物的社会经济属性,而社交媒体数据等城市数据为城市研究与应用提供了丰富的数据资源,补充了遥感影像所缺失的建筑物内在特征。融合高分辨遥感影像和POI数据的多特征信息,利用嵌入主题模型挖掘其潜在语义信息识别城市功能区。以宁波市2个典型的城市商业区为研究区设计3个实验,验证该方法的效果和性能。研究结果表明:该方法能够取得85.67%和85.78%的分类精度,并准确识别出城市功能区。同时,光谱、纹理、几何和POI特征组合的多特征信息能够明显提升城市功能区的识别精度,并且嵌入主题模型能够更好地挖掘多特征的高层次潜在语义信息,效果明显优于pLSA、LDA和STM 3种主流模型。

关键词: 高分辨率遥感影像 ; POI ; 城市功能区识别 ; 多特征信息 ; 主题模型

Abstract

Accurate identification and division of urban functional zones play an important role in rational planning of urban development and solving urban problems. Remote sensing images have rich spectral texture features, but it is difficult to characterize the social and economic attributes of buildings, while urban data such as social media data provide rich data resources for urban research and application, and supplement the internal characteristics of buildings missing from remote sensing images. In this study, multi-feature information of high-resolution remote sensing image and POI data is integrated and embedded topic model is used to mine its potential semantic information to identify urban functional areas. Three experiments were designed with two typical urban business districts in Ningbo as the study area to verify the effect and performance of the research method. The results show that this method can achieve 85.67% and 85.78% classification accuracy, and can accurately identify urban functional zones. At the same time, the multi-feature information of spectral, texture, geometry and POI feature combination can significantly improve the identification accuracy of urban functional zones, and the embedded topic model can mine the high-level potential semantic information of multi-features better than the three mainstream topic models of pLSA, LDA and STM.

Keywords: High spatial resolution remote sensing image ; POI ; Urban functional zones identification ; Multi-feature information fusion ; Topic model

PDF (5007KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

高子为, 孙伟伟, 程朋根, 杨刚, 孟祥超. 融合高分辨率遥感影像和POI数据的多特征潜在语义信息用于识别城市功能区. 遥感技术与应用[J], 2021, 36(3): 618-626 doi:10.11873/j.issn.1004-0323.2021.3.0618

Gao Ziwei, Sun Weiwei, Cheng Penggen, Yang Gang, Meng Xiangchao. Identify Urban Functional Zones Using Multi Feature Latent Semantic Fused Information of High-spatial Resolution Remote Sensing Image and POI Data. Remote Sensing Technology and Application[J], 2021, 36(3): 618-626 doi:10.11873/j.issn.1004-0323.2021.3.0618

1 引 言

随着城市化的飞速发展,城市空间以“增量扩张”为主的发展模式难以维持,精细化的空间“存量挖潜”成为城市发展的新趋势。城市功能区是存量空间的重要组成部分,厘清城市功能区布局对加强存量利用和优化城市产业结构具有重要作用,包括提升城市产业集聚效能、提高土地利用效率、辅助政府部门管理决策和推进城市化建设的可持续发展等。

遥感技术具有重访周期短、成本低、覆盖范围广等优点1,尤其高分辨率遥感影像如IKONOS和WorldView-II具有亚米级的空间分辨率,获取的地物空间细节信息更加清晰丰富,为准确识别城市土地利用和功能区提供了可能2。因此,有学者开始利用IKONOS高分辨率遥感影像来提取城市土地利用变化信息3,也有学者利用WorldView-II高分辨率遥感影像来划分城市功能区4。然而,高分辨率遥感影像仅使用了地物低层次的灰度或纹理特征,无法准确识别较为相似的不同类别地物。后来,有学者考虑挖掘高分辨率影像的高层次语义特征信息来缩小场景分类的“语义差距”5,通过构建词袋(Bag of words, BoW)模型来融合光谱、纹理和Scale-Invariant Feature Transform(SIFT)等多特征信息,提高土地利用的分类精度6。然而,遥感影像所提取的特征仅代表地物自然物理属性,仍无法完全对接经济社会属性明显的城市土地利用类型。

研究表明,社交媒体数据能够表征人类经济社会活动的内在特征,填补高分辨率遥感影像数据无法精细描述微观个体与用地空间内在联系的空白,有助于识别城市功能区7。社交媒体数据在城市功能区识别中已得到了许多应用,如车辆轨迹辅助识别城市区域功能8、手机和社交媒体的微博签到数据用于城市动态描述9与城市功能区划分10、带有地理标记的社交媒体和街景图像用于城市功能研究11、兴趣点(Point of Interest, POI)数据用于城市土地利用类型分类12。考虑到地物的自然物理特性与社会经济活动信息的互补优势,学者开始研究融合高分辨率遥感图像和社交媒体数据,以提升城市功能区识别的准确度。如Liu等7提出了一种基于Latent Dirichlet Allocation(LDA)主题模型融合了高分辨率遥感数据和POI数据的场景分类框架对城市功能分区。然而,LDA的分析处理性能依赖于构建的多个特征的严格精简词汇表,对于大型词汇表难以保证模型的泛化预测能力13。后来,Zhang等14构建稀疏主题模型,通过度量区域中模式数量及对应的特征比例,整合高分辨率遥感影像和POI数据的多特征语义信息,尝试改善城市功能区的识别精度,但是稀疏主题模型在预测会考虑一些权重较小的特征信息,从而干扰预测结果的正确性,导致识别精度的下降。为此,研究引入词嵌入主题模型(Embedded Topic Model, ETM),融合高分辨率影像和POI数据的多特征信息,挖掘融合数据的内在高层语义知识,提升城市功能区的识别准确性。相比LDA和稀疏主题模型,ETM词嵌入主题模型是一种整合传统主题模型与词嵌入方法的新型文档生成模型。该模型同时包含可解释的潜在语义结构和主题特征,对大型词汇表和复杂城市区域的处理能力较强,在主题质量和预测性能方面优于现有的LDA和稀疏主题模型15。基于宁波市2个典型的新旧城市功能区,利用国产高分二号高分辨率影像和POI数据来设计一系列实验,综合验证本文方法的效果和性能。

2 研究方法和原理

图1为研究方法的技术流程图。首先,对遥感影像按照规则格网进行分割,提取每一块格网中影像特征和POI特征信息作为具有一定表达能力的视觉单词。在此基础上,利用词袋模型建立影像和POI特征信息的高层次语义表达,提升视觉特征的表达能力。其次,利用概率主题模型提取上述多特征信息的潜在语义特征。最后,选择迭代选择最优和最优价值的样本用于训练支持向量机模型,对城市功能区进行识别。

图1

图1   技术流程图

Fig.1   Methodology in this study


2.1 高分辨率影像和POI数据的多特征提取

利用高分辨率影像和POI数据来提取多特征信息,以刻画每个影像格网单元的视觉单词。高分辨率遥感影像的特征提取包括光谱、纹理和空间几何特征信息。POI数据的特征提取包括功能类型和经纬度信息。

(1)光谱特征。光谱特征反映地物表面的物理属性16。本文采用波段均值与标准差来描述格网单元的光谱特征spe=[man, std],公式如(1)~(2)所示。

man=i=1nvin
std=i=1nνi-mean2n

其中:n为每个格网中的像元数量,νi为格网中第i个像元的灰度值。

(2)纹理特征。纹理特征反映地物表面周期性变化的表面结构排列属性17。研究采用局部二值模式(Local Binary Pattern,LBP)来提取各个格网单元中影像的局部纹理特征。LBP是一种描述图像纹理特征的算子,具有灰度不变性和旋转不变性特点18

首先定义一个3×3的窗口,以窗口中心像素的灰度值作为阈值,比较该阈值与相邻的8个像素的灰度值。计算公式如(3)所示:

LBPxc,yc=p=18sIp-Ic×2p

其中:I(p)表示除窗口像元之外的第p个像素点的灰度值;I(c)为中心像素的灰度值。若sIp-Ic0,则为1;否则为0。遍历窗口内所有像元,得到一个8位二进制数作为中心像素点的LBP特征值lbp

(3)几何特征。研究采用Speeded Up Robust Features(SURF)算子和Evaluation of GIST(GIST)算子来分别提取影像的局部和全局几何特征。SURF是一种局部特征描述子,能够克服仿射变换、光照变化和三维视点变化等传统几何特征描述的不足,提取影像局部几何特征19。SURF比SIFT算子具有更低的数据维度和更优的运算效率。

首先为保证尺度不变性,使用不同的模板尺寸对格网进行盒式滤波,构建多尺度斑点响应的金字塔图像,并利用公式(4)的Hessian矩阵判别式来寻找不同尺度下的特征点位置。

det H=2x22fy2-2fxy

其中:x,y分别为像素点的横纵坐标,fx,y为该点的像素值。当Hessian矩阵判别式取得局部最大值时,该点即为特征点。

其次对每个特征点分配一个主方向,以保证旋转不变性。定义一个以特征点作为圆心,0.2弧度作为步长的60°的扇形滑动窗口,对扇形窗口进行Haar小波响应运算,统计窗口中每个点在水平和垂直方向的小波响应,并累加求和mw,θω,特征点的主方向即为小波特征总和最大的方向θ,公式如(5)~(7)所示。

mω=ωdx+ωdy
θω=arctan ωdxωdy
θ=θωmax mω

最后,以特征点为中心,沿着主方向将图像划分为4×4的子块,计算每个子块4个方向上的Haar值作为特征向量,得到一个64维特征向量组成的SURF描述子,并统计格网中的所有特征点描述子作为SURF特征surf

GIST是一种空间包络特征描述符,从自然度、开放度、粗糙度、膨胀度和险峻度5个方面描述影像的全局特征信息,激活对场景类别的记忆表征,具有较好的识别能力20。首先用公式(8)~(10)的Gabor滤波器对格网在4个尺度、8个方向上进行卷积,得到一个32维特征图。

gx,y;λ,ω,ψfσ,γ=
exp -x'2+γ2y'22σ2cos 2πx'λ+ψ
x'=xcos ω+ysin ω
y'=-xsin ω+ycos ω

其中:λ为波长参数,ω为平行条带方向,ψ为相位偏移,γ为空间纵横比,σ为函数标准差。其次,分别将32张特征图平均分割成16个区域。最后,计算每个区域均值并进行拼接,得到一个512维向量作为该格网的GIST特征gist

(4)POI特征。POI数据是包含名称、地址、功能和经纬度等空间属性信息的特征点集,蕴含着丰富的人文经济特征以及自然特征,能够揭示城市土地的利用功能21。根据道路来分割研究区域,计算每个路网区块中的第i种POI类型比例Pi,并将其赋予该区块中的每一个影像格网单元。每个影像格网单元的POI特征向量表示为poi=P1,P2,,Pi

2.2 多特征融合的BoW字典构建

采用词袋模型来构建视觉语义字典,获取多源数据中特征信息的词汇表达向量。BoW模型起源于文档分析,利用文档集中单词和主题的聚类分布来构建语义字典22。应用于遥感领域,该模型将格网单元影像看作文档集,城市功能看作主题,单元格网中的各类特征看作单词。即任一格网单元可用城市功能的分布来表示,任意城市功能可用特征分布来表示。

BoW模型构建语义字典的流程如下。首先,对影像中第i个格网单元提取的多个特征{spei,lbpi,suri,gisti,poii}进行K-means聚类,每个聚类中心构成一个单词,所有聚类中心组成一个单词表。其次,计算该格网单元的特征值与各聚类中心的距离,将特征值分配给单词表中距离最近的单词。最后,统计各个单词的词频,生成一个高维向量并拼接,得到该格网单元中特征词汇的表达向量{wordspe,wordlbp,wordsurf,wordgist,wordpoi}

2.3 潜在语义特征挖掘

采用ETM来挖掘多特征词汇表征中隐藏的高层语义结构信息挖掘高层次潜在语义信息。在传统的主题模型中,每个主题在词汇表上是一个完整的分布,而 ETM 采用深度学习模型构建,将主题和单词共同构建向量空间,融合Hierarchical Softmax实现的词嵌入方法,为每个主题构建其在语义空间的分布表征,并采用Logistic-normal分布简化推断算法来提高运算效率15

ETM推测主题的过程如下。首先,随机给每篇文档中的每个单词分配k个主题中的一个主题。其次,对于每篇文档D,重新分配单词的主题。接下来,假设除了当前文档之外的所有主题分配符合logistic-normal分布,计算两个概率:①当前文档D中的单词被分配到主题t的概率;②所有文档中被分配到主题t的单词中单词w的概率。然后,基于这两个概率的乘积和词向量与主题分布向量的关系分配给单词w一个新的主题。不断重复上述步骤,最终达到稳定状态,得到文档的主题分布。ETM主题模型将BoW字典中的特征合集进行挖掘,提取每个格网中多源特征的潜在语义特征,最终通过训练支持向量机(Support Vector Machine, SVM)分类器实现对各个格单元的功能识别。

3 研究区域和数据源

3.1 研究区域

宁波市位于中国东南沿海,浙江宁绍平原东端,东有舟山群岛为天然屏障,北邻杭州湾,西接绍兴市。宁波既是长江三角洲南翼经济中心和浙江省经济中心之一,经济社会发展水平高,第三产业发达,城市功能类型丰富,因而本文选取宁波作为研究城市。考虑到POI数据的有限性和分布情况,实验选取宁波市2个新旧商业中心作为代表性研究区域,如图2所示。研究区1包含镇海区万科广场及周边区域,面积约为15.3 km2。万科广场于2016年建成,是宁波市新兴发展起来的商业中心,是集购物、休闲和观光为一体的商业综合体。研究区2包含海曙区天一广场及周边区域,面积约13 km2,天一广场于2001年建成,是宁波最大的融休闲、商贸、旅游、餐饮、购物于一体的大型城市中心商业广场,拥有浓厚的商业文化特色。研究区1和2作为宁波市的新旧经济中心,高度集中了城市的商业、工业、居住和公共服务设施用地,区域内建筑分布密度高且外观相似,各类设施分布密集,POI数据丰富,适合作为本文的城市功能分区的实验区域。

图2

图2   研究区范围

审图号:GS(2020)4632

Fig.2   Study area


3.2 数据源

实验采用GF-2卫星的遥感影像作为高分辨率影像数据源。研究区1和2的遥感影像的获取时间分别为2019年6月16日和4月18日,数据来源于地理空间数据云平台(http://www.gscloud.cn/)。行政区划数据来源于全球行政区域网(http://www.gadm.org/),路网数据来源于OpenStreetMap(https://www.openstreetmap.org/)。

POI数据来源于百度地图(https://map.baidu.com/),数据获取时间为2019年6月,包含名称、功能、地址和经纬度等4类属性。研究区1和2分别包含3 009和27 145个POI点。按照2011年中华人民共和国住房和城乡建设部颁布的新版《城市用地分类与规划建设用地标准》,同时考虑到城市功能的普遍性和研究区中所包含的地物类型,将各格网功能划分为公共管理与公共服务用地(A)、商业服务设施用地(B)、绿地与广场用地(G)、工业用地(M)、居住用地(R)、水域(W)和道路(S)共7个类别。

有学者利用格网单元分割遥感影像划分城市功能区并取得了较高的精度1023。考虑到研究区大小以及POI分布密度,本文采用100 m×100 m大小的格网单元,并通过实地考察的方式标注格网单元的真实功能区类别。研究区1和2分别包含1 564和1 147个格网单元,各类功能区的真实样本信息如表1所示。

表1   各功能区的真实样本信息一览表

Table 1  The ground truth information of each functional area

类别ABGMRWS总计
研究区12304212551694398421 564
研究区21325258083167135251 147

新窗口打开| 下载CSV


3.3 预处理

为达到更好的识别效果,在提取影像多特征之前,对GF-2影像进行正射校正、辐射定标、图像融合、大气校正等预处理,得到1 m分辨率的高分辨率多光谱影像数据。在此基础上,根据研究区域范围对预处理后的影像进行裁剪,并采用100 m×100 m格网单元来分割研究区并提取多特征信息。

POI数据虽然蕴含了能反映建筑物内部社会经济属性的语义信息,但并非所有POI数据都能辅助识别城市功能区,甚至可能造成干扰,如公厕、报刊亭、交通站点等,需要从原属数据中剔除。本文从以下几个步骤对POI数据进行预处理,首先对POI数据进行了筛选,排除无详细类别标识的数据和无详细坐标信息的数据。其次对POI类型按照所需类别进行重分类。最后将POI数据从百度坐标系纠偏为与遥感影像一致的WGS84坐标系。

4 实验与分析

设计了3类实验来综合验证提出的方法的性能和效果。实验4.1证明了该方法用于城市功能分区上的可行性。实验4.2剖析不同的特征组合对本文的ETM模型来挖掘高层次语义特征和识别城市功能区的性能影响;实验4.3比较了3种主流语义模型与本文ETM模型的识别效果。

4.1 融合多特征的城市功能识别实验

实验使用光谱特征、纹理特征、几何特征和POI特征,结合BoW模型和ETM模型来识别城市功能区。利用交叉验证原则,两个研究区域以均匀随机抽样的方式分别取80%的格网数据作为训练集,通过人工校核方式保证每种功能类型格网的数据都包含在训练集中。模型参数主题个数设置为250,聚类中心设置为600,SVM分类器采用高斯核函数,通过grid search选取最优参数。城市功能分区识别结果的分类混淆矩阵如表2表3所示。

表2   研究区1的分类混淆矩阵

Table 2  Classification confusion matrix of study area 1

类别ABGMRWS总计
总计1954762731624057461 564
A1442283201189
B11450441902490
G9524322102282
M273144503164
R27620432309389
W00100708
S2600502942

新窗口打开| 下载CSV


表3   研究区2的分类混淆矩阵

Table 3  Classification confusion matrix of study area 2

类别ABGMRWS总计
总计1255686492149134151 147
A891325412116
B17501321901543
G31355011073
M75182401100
R6293211712160
W030011310135
S340130920

新窗口打开| 下载CSV


两片研究区分别有1 340和984格网功能属性定义符合,识别结果精度分别达85.67%和85.78%。公共管理与公共服务用地识别精度较低,主要因为该功能区中包含的服务型POI数量与类型较少,且其外部物理特征存在多样性。商业服务业设施用地识别精度较高,主要原因是商业类型POI在空间中密集分布凸显了POI特征。居住用地识别效果相对较差,部分原因是居住用地中包含一些商业类型POI导致住宅类型POI所占比例较低,影响了识别效果。工业用地具有较高的识别精度,因为其带有鲜明的纹理和几何特征明显如蓝色屋顶和高大的烟囱。水域拥有较高识别精度是因为物理特征上的连续性以及光谱特征的独特性。道路识别精度相对较低,主要因为道路和建筑物顶部相似的物理性质,并且缺乏社交媒体数据辅助。

4.2 不同特征的融合性能分析实验

采用实验来验证高分辨率遥感影像和POI数据中不同特征对高层次语义特征挖掘和功能区识别的影响。实验中融合不同的特征组合,并利用ETM模型来挖掘高层次语义特征信息,并实现城市功能区识别的精度评价。采用的多特征包括POI特征“POI”,光谱特征“Spe”,光谱和纹理特征组合“Spe+Tex”,光谱、纹理和几何特征组合“Spe+Tex+SURF”和“Spe+Tex+SURF+ GIST”,光谱、纹理、几何和POI特征组合“Spe+Tex+SURF+GIST+POI”。

为了验证每种特征对城市功能区识别是否有正向作用,使用不同的特征组合方式分别进行实验,并取10次的平均结果。实验中模型参数主题个数和聚类中心数分别设置为250和600。表4为使用ETM主题模型时不同的特征组合方法得到的功能区识别精度。与单独使用一类特征相比,融合多个特征进行分类能取得更好的结果。实验主要是对城市中建筑物功能类型进行分类,当仅使用光谱、纹理或几何特征时无法有效地挖掘建筑物内部功能属性,其分类精度结果较低。再加入POI特征后,两个研究区域的总体准确率分别提高了8.97%和8.88%。这表明融合多源数据的多特征信息可以大幅提高城市功能区识别的准确度。

表4   ETM模型中不同特征组合得到的分类精度对比 (%)

Table 4  Comparison of classification accuracy of different feature combinations in ETM Model

研究区SpePOISpe+TexSpe+Tex+SURFSpe+Tex+SURF+GIST本文方法
1OA37.0262.8644.7064.7676.7085.67
Kappa24.6653.9432.3955.7969.7581.68
2OA39.2667.1349.7866.9676.9085.78
Kappa26.7258.0438.3157.3870.2480.03

新窗口打开| 下载CSV


图3

图3   研究区1不同特征组合的识别结果图

Fig.3   Recognition results of different feature combinations in study area 1


图4

图4   研究区2不同特征组合的识别结果图

Fig.4   Recognition results of different feature combinations in study area 2


4.3 ETM的语义特征挖掘性能分析实验

实验使用pLSA、LDA、STM 3种模型与ETM模型作对比,验证ETM模型的效果和性能。pLSA模型,利用似然函数来挖掘隐含变量,并利用EM算法(Expectation-Maximization Algorithm)进行求解,得到隐含变量的值,获得潜在语义特征24。LDA模型将文档集中每篇文档的主题以概率分布的形式给出,并通过分析每篇文档中单词的主题分布推断出文档的主题分布25。STM模型是LDA的简化改进,将文档进行稀疏化表达,以克服LDA因词汇表过大导致运行效率过慢问题13

5~6展示了4种主题模型用于研究区1和2的城市功能区的识别精度。实验中采用光谱、纹理、几何和POI特征组合,模型参数的主题数设置为250,K-means聚类中心为600。结果表明利用ETM主题模型提取潜在语义信息后对两个研究区的总体识别结果都优于其他3种主题模型。pLSA模型效果不理想是因为文档数量过大时将导致其识别结果不佳。LDA模型相较于ETM模型的识别能力较差,因为Dirichlet分布随机向量和各分量间仅仅存在弱相关性,而城市功能区的类型存在较强的相关性。STM模型虽然有较快的运行速度,但仅仅在识别公共管理与公共服务用地时识别精度略高于其他几种主题模型。

表5   4种语义模型用于识别研究区1中城市功能区的精度对比 (%)

Table 5  The comparisons of classification accuracy from four semantic models in study area 1

语义模型ABGMRWSOAKappa
pLSA60.0085.9980.0081.0767.4362.5045.2478.3271.46
LDA61.7489.5582.3582.8471.0775.0057.1481.274.68
STM65.2290.7492.9482.2572.2175.0064.2982.7476.73
ETM62.6193.1195.2985.2173.5887.5069.0585.6781.68

新窗口打开| 下载CSV


表6   4种语义模型用于识别研究区2中城市功能区的精度对比 (%)

Table 6  The comparisons of classification accuracy from four semantic models in study area 2

语义模型ABGMRWSOAKappa
pLSA59.8589.1461.2589.1663.4790.372880.4772.19
LDA62.8890.6762.586.7567.0795.562880.9973.53
STM70.4592.1966.2590.3668.2692.593282.9177.86
ETM67.4295.4368.7598.870.0697.043685.7880.03

新窗口打开| 下载CSV


而ETM模型在识别各类功能区时精度都较高,因为其良好的概率分布结构和词嵌入特性,在处理大型词汇表时鲁棒性强。

5 结 语

基于ETM模型,提出了一种融合遥感影像和POI数据中多特征的潜在语义信息来识别城市功能区的方法,并采用宁波市2个典型的研究区来设计实验并进行方法验证。研究结果表明,该方法能够取得良好的城市功能区识别效果。同时,“光谱+纹理+局部几何+全局几何+POI”的多特征组合信息,明显优于传统的POI信息和其他多特征组合,更利于城市功能区识别。此外,ETM模型相较于pLSA、LDA和STM的语义挖掘性能更加优良,能够确保城市功能区的准确识别。然而此方法未考虑影像分割的最优尺度,各类型POI的最优权重,以及城市建筑的复杂或混合功能属性。下一步研究中可采用影像分割或者超像素作为分类单元,结合深度学习算法,探索多源社交媒体数据,并细致考虑混合功能区类型,进一步提升城市功能区的识别准确性。

参考文献

Sun WeiweiYang GangChen Chaoet al.

Development Status and Literature Analysis of China’s Earth Observation Remote Sensing Satellites

[J]. Journal of Remote Sensing,2020245):479-510.

[本文引用: 1]

孙伟伟杨刚陈超.

中国地球观测遥感卫星发展现状及文献分析

[J].遥感学报, 2020245):479-510.]

[本文引用: 1]

Yang ZhaobinZhang ShuwenBu Kunet al.

Application of High Spatial Resolution Remote Sensing Image in Urban LUCC

[J]. Journal of University of Chinese Academy of Sciences, 2016333):289-297

[本文引用: 1]

杨朝斌张树文卜坤

高分辨率遥感影像在城市LUCC中的应用

[J].中国科学院大学学报,2016333):289-297.]

[本文引用: 1]

Sun DanfengYang JihongLiu Shunxi.

Application of High-Spatial IKNOS Remote Sensing Images in Land Use Classification and Change Monitoring

[J]. Journal of Agricultural Engineering, 2002132):160-164.

[本文引用: 1]

孙丹峰杨冀红刘顺喜.

高分辨率遥感卫星影像在土地利用分类及其变化监测的应用研究

[J].农业工程学报,2002132):160-164.]

[本文引用: 1]

Zhang XDu SWang Qet al.

Multiscale Geoscene Segmentation for Extracting Urban Functional Zones from VHR Satellite Images

[J]. Remote Sensing,2018102):281. doi:10.3390/rs10020281.

[本文引用: 1]

Tokarczyk PWegner J DWalk Set al.

Features, Color Spaces, and Boosting: New Insights on Semantic Classification of Remote Sensing Images

[J]. IEEE Transactions on Geoscience and Remote Sensing,2014531):280-295. doi:10.1109/TGRS. 2014.2321423.

[本文引用: 1]

Zhong YZhu QZhang L.

Scene Classification based on the Multifeature Fusion Probabilistic Topic Model for High Spatial Resolution Remote Sensing Imagery

[J]. IEEE Transactions on Geoscience and Remote Sensing, 20155311):62076222. doi:10.1109/TGRS.2015.2435801.

[本文引用: 1]

Liu XHe JYao Yet al.

Classifying Urban Land Use by Integrating Remote Sensing and Social Media Data

[J]. International Journal of Geographical Information Science, 2017318): 1675-1696. doi:10.1080/13658816.2017.13 24976.

[本文引用: 2]

Gao QFu JYu Yet al.

Identification of Urban Regions’ Functions in Chengdu, China, based on Vehicle Trajectory Data

[J]. PLOS One,2019144):e0215656. doi:10.1371/journal.pone.0215656.

[本文引用: 1]

Tu WZhu T TXia J Zet al.

Portraying the Spatial Dynamics of Urban Vibrancy Using Multisource Urban Big Data

[J]. Computer Environment and Urban Systems,202080101428. doi:10.1016/j.compenvurbsys.2019.101428.

[本文引用: 1]

Tu WHu ZLi Let al.

Portraying Urban Functional Zones by Coupling Remote Sensing Imagery and Human Sensing Data

[J].Remote Sensing,2018101):141. doi:10.3390/rs10010141.

[本文引用: 2]

Zhu YDeng XNewsam S.

Fine-grained Land Use Classification at the City Scale Using Ground-level Images

[J]. IEEE Transactions on Multimedia,2019217):1825-1838. doi:10.1109/TMM.2019.2891999.

[本文引用: 1]

Yao YLi XLiu Xet al.

Sensing Spatial Distribution of Urban Land Use by Integrating Points-of-interest and Google Word2vec Model

[J]. International Journal of Geographical Information Science,2017314):825848. doi:10.1080/13658816.2016.1244608.]

[本文引用: 1]

Than KHo T B.

Fully Sparse Topic Models

[C]∥ Joint European Conference on Machine Learning and Knowledge Discovery in Databases. SpringerBerlin, Heidelberg2012490-505. doi:10.1007/978-3-642-33460-3_37.

[本文引用: 2]

Zhang XDu SZheng Z.

Heuristic Sample Learning for Complex Urban Scenes: Application to Urban Functional-zone Mapping with VHR Images and POI Data

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 20201611-12. doi:10.1016/j.isprsjprs.2020.01.005.

[本文引用: 1]

Dieng A BRuiz F J RBlei D M.

Topic Modeling in Embedding Spaces

[J]. ArXiv Preprint ArXiv:1907.049072019. doi:10.1162/tacl_a_00325.

[本文引用: 2]

Hu YongLiu LiangyunPeter Cet al.

Landsat Time-series Land Cover Mapping with Spectral Signature Extension Method

[J]. Journal of Remote Sensing, 2015194):639-656.

[本文引用: 1]

胡勇刘良云Peter C.

光谱特征扩展的时间序列Landsat数据地表覆盖分类

[J].遥感学报, 2015194):639-656.]

[本文引用: 1]

Zhang FafaLi WeizhongLu Liuyeet al.

Technologies of Extracting Land Utilization Information based on SVM Method with Multi-window Texture

[J]. Journal of Remote Sensing, 2012161):67-78.

[本文引用: 1]

张伐伐,李卫忠,卢柳叶,

,康乐SVM多窗口纹理土地利用信息提取技术[J].遥感学报,2012161):67-78.]

[本文引用: 1]

Zhang BGao YZhao Set al.

Local Derivative Pattern Versus Local Binary Pattern: Face Recognition with High-order Local Pattern Descriptor

[J].IEEE transactions on Image Processing,2009192):533-544.doi:10.1109/tip.2009.2035882.

[本文引用: 1]

Bay HEss ATuytelaars Tet al.

Speeded-up Robust Features (SURF)

[J]. Computer Vision and Image Understanding,20081103):346-359. doi:10.1016/j.cviu.2007.09.014.

[本文引用: 1]

Oliva ATorralba A.

Modeling the Shape of the Scene: A Holistic Representation of the Spatial Envelope

[J]. International Journal of Computer Vision,2001423):145-175. doi: 10.1023/A:1011139631724.

[本文引用: 1]

Jiang SAlves ARodrigues Fet al.

Mining Point-of-interest Data from Social Networks for Urban Land Use Classification and Disaggregation

[J]. Computers, Environment and Urban Systems, 20155336-46. doi:10.1016/j.compenvurbsys. 2014.12.001.

[本文引用: 1]

Csurka GDance CFan Let al.

Visual Categorization with Bags of Keypoints

[C]∥ Workshop on Statistical Learning in Computer VisionECCV. 200411-22): 1-2. doi:10.1080/01621459.1949.10483312.

[本文引用: 1]

Jia YGe YLing Fet al.

Urban Land Use Mapping by Combining Remote Sensing Imagery and Mobile Phone Positioning Data

[J]. Remote Sensing, 2018103): 446. doi:10.3390/rs10030446.

[本文引用: 1]

Bosch AZisserman AMuñoz X.

Scene Classification Via pLSA

[C]∥ European Conference on Computer Vision. Sprin-ger, Berlin, Heidelberg2006517-530. doi: 10.1007/11744085 _40.

[本文引用: 1]

Blei D MNg Andrew YJordan M I.

Latent Dirichlet Allocation

[J]. Journal of Machine Learning Research,2003333): 993-1022. doi:10.5555/9449 19.944937.

[本文引用: 1]

/