基于POI数据的城市功能区识别与分布特征研究
A POI Data-based Study of Identification and Distribution Characteristics of Urban Functional Districts
通讯作者:
收稿日期: 2021-07-22 修回日期: 2022-10-20
基金资助: |
|
Received: 2021-07-22 Revised: 2022-10-20
作者简介 About authors
李娜(1980-),女,河南淅川人,副教授,硕士生导师,主要从事城市大数据研究E⁃mail:
关键词:
Keywords:
本文引用格式
李娜, 吴凯萍.
Li Na, Wu Kaiping.
1 引 言
随着城市化进程的不断加快,充分识别城市发展现状在实现健康经济、提高生活品质以及促进城市高质量发展等方面起到积极作用。城市功能区作为城市发展的基本研究单元,是城市格局规划的参考依据和重要组成部分,其分类识别对于城市规划、城市管理、经济分析和环境保护等方面具有重要意义。城市规划者和管理者根据城市发展程度,合理规划城市功能区建设,连接城市功能混合程度和不同地区城市化发展水平之间的协调,以实现城市健康持续发展。
在以往对于城市功能区的研究中,大多基于统计调查、专家评判、调查问卷等定性研究方法,这些方法主观性较强,计算误差较大,对于研究城市功能区分布和密度分布特征存在一定局限性。大数据的广泛应用为城市功能区的相关研究提供了新方向、新思路。国外学者Kling等[1]运用某个时间间隔内特定地点收集的签到数据,推断该区域是如何被城市居民使用的,根据居民活动的众多数据提取该城市区域的结构和功能模式。单一的签到数据获取因地而异,需要经过时间模式分析以推断出使用类别,较难实现对城市用地功能的准确识别。而开源兴趣点(Point Of Interest,POI)大数据可以描述城市的空间属性和地理位置信息,量化空间活力特征,具有信息量大、获取较容易、分析方便等特点,其分布模式和分布密度为城市规划研究提供了新方法。Alves等[2]以波士顿大都市的部分地区为例来识别城市功能区的种类和开发利用情况,Krause等[3]融合用户出行的GPS数据和POI大数据建立相应的模型预测用户短期出行的目的地。这些POI大数据的位置和分类信息有助于研究者了解该城市的居民出行特征,分析其区域经济发展水平。
国内学者对于POI大数据的应用更加广泛。在旅游功能区研究方面,赵莹等[4]通过签到数据和POI大数据识别张家界日常居住区、重点旅游区等功能空间;任江鸿等[5]基于丽江市古城区POI大数据探究此城市的空间格局及行业分布特征。在与城市居民活动相关研究方面,韩昊英等[6]基于北京公交刷卡数据和POI大数据的功能区识别模型快速有效地识别北京市各功能区;陈泽东等[7]结合北京市出租车GPS数据和POI大数据,从空间和时间两个维度上分析各个功能区之间的交互特征。同时,众多学者利用POI大数据在城市绿地空间评价、功能结构对比、混合度识别等领域开展理论和实证研究。戴菲等[8]基于重分类的POI大数据划分上海市城市空间,提升了城市用地识别以及绿地评价的精度;姜佳怡等[9]基于北京市和上海市的POI大数据,以混合功能区的占比来分析其功能区的结构差异、衡量功能结构的合理性;胡晓鸣等[10]通过构建权重模型来量化POI大数据的属性,在精细化网格尺度下识别重庆市的城市混合度。
上述研究表明利用POI大数据不仅能够识别城市功能区,同时可以揭示城市空间结构。为了更加准确地分析城市空间结构布局,需要划分精细化的研究单元。李强等[11]使用格网数据生成研究单元来识别分析武汉市中心城区的功能区,此划分方法简单快捷,但现实城市街区形状大多为不规则的多边形,利用格网数据划分研究单元不能准确反映街区真实情况。而OpenStreetMap(OSM)道路网数据包含经纬度、道路类型、道路名称等基本空间信息,定位精度较高,利用其划分的街区单元更接近实际分布,研究结果更精确合理。
综上,以往学者基于POI大数据结合格网数据进行城市功能区识别具有一定的可操作性,但缺乏对城市街区布局的准确描绘。基于此,本研究以天津市中心城区为例,利用丰富的OSM道路网数据划分城市最小研究单元,融合POI大数据在精细化尺度下进行核密度分析以及功能区识别,并对识别结果进行诠释,以此定量化分析城市中不同功能的密度分布以及功能区分布特征,实现城市功能区的合理划分。
2 研究区域与数据线性
2.1 研究区概况
天津市位于我国华北地区,是我国四大直辖市之一、环渤海地区的经济中心、北方最大且最早开放的港口城市,总面积为11 966.45 km2,2020年年末常住人口为1 386.60万人。天津市2020年地区生产总值(GDP)相比上一年增长1.5%,达到14 083.73亿元。天津市的市辖区(图1(a))可以分为中心城区、环城区、滨海新区和远郊区,其中中心城区(图1(b))可以细分为:和平区、南开区、河东区、河西区、河北区、红桥区。天津市中心城区作为天津的经济中心,具有较发达的政治文化教育经济水平。天津市中心城区城市总体规划对统筹协调全市经济社会发展有十分重要的战略引领作用。因此选择该区域作为研究对象。
图1
2.2 数据来源
2.2.1 POI数据
研究于2021年5月利用Python软件爬取高德地图公开的天津市中心城区POI数据,每条数据都包含名称、经纬度、地址及行政区等基础信息,根据需要将影响力较低的数据剔除,经过筛选最终得到63 904条数据。高德地图中POI数据分类可以分为大类、中类、小类3类。大类比如汽车服务、餐饮服务、购物服务、生活服务等,中类比如加油站、中餐厅、超级市场、邮局等,小类比如中国石化、天津菜、沃尔玛、邮政速递等。首先把城市功能区划分为居住区、公共管理与公共服务区、商业区、交通设施区、工业区、绿地与广场区六大类,然后根据《城市用地分类与规划建设用地标准》以及获取的POI数据种类,对POI数据进行重分类,将重分类的POI数据用于城市功能密度分析以及城市功能区的识别。POI数据采集以及重分类后的结果如表1所示。
表1 天津市中心城区POI数据采集结果
Table 1
功能区分类 | POI数据一级分类 | POI数据二级分类 | POI数据数量/条 |
---|---|---|---|
居住区 | 住宅区、住宅附属设施 | 商用住宅、别墅、小区、社区服务中心等 | 5 435 |
商业区 | 餐饮购物、住宿服务 体育休闲、商务设施 | 餐馆、商场、购物中心、酒店、民宿、青旅、体育馆、游乐场、俱乐部、棋牌室、网吧、银行、保险、证券公司等 | 22 594 |
绿地与广场区 | 公园绿地、风景名胜 | 公园、动物园、植物园、街边绿地、旅游景区、名胜古迹等 | 379 |
工业区 | 工厂企业 | 工业园、产业园区、生产车间、公司等 | 6 902 |
公共管理与公共服务区 | 医疗卫生、文化设施 教育科研、行政办公 | 医院、诊所、卫生防疫站、博物馆、图书馆、少年宫、职业院校、大学、小学、中学、党政机关、社会团体、事业单位等 | 18 482 |
交通设施区 | 交通服务设施、交通附属设施 | 汽车站、火车站、地铁站、公交站、飞机场、停车场等 | 10 112 |
2.2.2 OSM数据
确定城市研究单元是识别城市功能区过程中不可或缺的一部分。针对研究区的实际情况,确定采用OSM道路网数据划分城市研究单元。利用2021年5月在OpenStreetMap官网下载的OSM道路网数据,筛选出天津市高速公路、城市主干道及一级、二级、三级道路,并将其作为分割对象,运用ArcGIS软件相应工具,选择合适的容差处理范围去除重复、悬挂及独立道路,并延长、补齐断开的道路,完成拓扑错误修改,获得研究所需的路网,然后根据实际情况将道路分为3个等级并生成不同规模的缓冲区,建立独立的道路空间并移除,将天津市中心城区分割为多个规模不同的研究区,删除面积较小的研究区域,最终得到功能区识别所需研究单元。
2.2.3 数据预处理
从高德地图爬取的POI数据与天津市中心城区的地理信息存在偏移,需要对数据进行预处理,首先将POI数据和OSM数据导入ARCGIS软件后进行归一化处理,将其统一到WGS-84坐标下,删除超出城区边界的数据,最终得到研究所需数据。
3 研究方法
3.1 城市功能区识别流程
城市功能区识别流程图如图2所示。主要包含:
图2
(1)将利用Python软件爬取的POI数据与OpenStreetMap官网下载的OSM道路网数据进行数据预处理;
(2)利用丰富的OSM道路网数据划分城市最小研究单元,并融合POI大数据在精细化尺度下进行核密度分析;
(3)计算研究单元中各类POI的频率密度,识别OSM路网划分的每个研究单元的主要功能,以此确定该城市研究单元的功能区并分析其分布特征。
3.2 POI权重赋分方法
常用的确定POI权重的方法有熵值法、主成分分析法、德尔菲法等,但这些方法都表现为单一的客观或主观方法。本文根据以往研究,采用多密度空间统计方法,引入影响力权重(公众认知度)、空间面积特征2个指标分析影响各类POI权重的因素,通过计算确定各个POI类别的权重值作为城市功能区识别的重要依据。
(1)每个POI点所代表的地理实体对城市的影响范围都是不同的,例如一家小商店远没有一家大型超市影响力大,因此选择公众认知度作为评价其影响力的指标,通过设计问卷调查得到所需结果,并将其百分数化。
(2)引入面积权重用以描述每个POI点所代表地理实体规模的评价分数,通过查询资料确定每类POI的建筑面积评价分数,最终实现对POI空间面积特征的赋值,并将其百分数化。
将得到的两项权重以多种比例进行实验研究,发现当两项权重各占比50%时,所得结果的精确度最高,以此确定的最终权重如表2所示。
表2 天津市中心城区重分类POI权重
Table 2
重分类POI | 居住 | 商业 | 绿地与广场 | 工业 | 公共管理与公共服务 | 交通设施 |
---|---|---|---|---|---|---|
权重 | 0.21 | 0.05 | 0.32 | 0.18 | 0.11 | 0.13 |
3.3 POI核密度的计算
核密度分析用于计算要素在其周围邻域中的密度。本研究将重分类的POI点数据作为点要素进行核密度估计,以往研究表明,核函数相对于带宽对核密度估计结果的影响较小,带宽的选择是核密度计算的重点。带宽越大,核密度表面越平滑,热点区域可能被覆盖,带宽越小,越能突出细节,但可能会影响对区域的整体性研究。通过设置不同带宽研究其对城市POI核密度的影响,为保证在平滑的条件下,尽可能显示更多城市空间细节,经过多次反复试验,最终选择500 m作为本研究中核密度估计的带宽。
3.4 POI权重分数识别功能分区
在POI权重赋分的基础上,计算各个研究单元中各类POI的密度以及占所有类别的比例,识别OSM路网划分的每个研究单元的主要功能,以此确定研究单元所属的功能区。本文采用的方法是对每一个研究单元构建城市功能区识别计算模型,公式如(1)所示:
其中:
按此方法计算得到每个研究单元中各类功能的频率密度集合
功能区判定的具体流程如图3所示,具体可以描述为:假如某一研究单元中有一类功能的频率密度超过50%,则判定该研究单元为此功能区;如果没有任何一类功能超过50%,则判定该研究单元为混合功能区。例如在某一个研究单元中,商业的频率密度为53%,其余类别的频率密度均小于50%,则该研究单元为商业区。将混合功能区进一步划分,判定是否有一类功能的频率密度介于20%—50%之间,如果有一类功能的占比在此范围内,则判定该研究单元为以此功能为主的混合功能区;如果有两类功能的占比在此范围内,则判定该研究单元为这两类功能为主的混合功能区,否则判定该研究单元为综合功能区。例如在某一个研究单元中,商业的频率密度为46%,其余类别的频率密度均小于20%,则该研究单元为以商业区为主的混合功能区;如果除了商业以外,还有工业的频率密度是41%,则该研究单元为以商业—工业为主的混合功能区。
图3
4 结果分析
4.1 城市功能密度分布
天津市中心城区功能密度分布如图4所示,公共管理与公共服务、交通、居住和商业功能的密集分布区域有营口道、南开区八里台以及和平区的海河沿线,这些区域也是天津市最繁华的地区,表明天津市城市功能分布较为集中。和平区各个功能的核密度值明显高于其他城区,说明和平区功能分布更加密集;而红桥区的核密度值明显低于其他城区,说明各个功能在红桥区的分布并不集中,红桥区还需要加大建设力度,从而与其他城区均衡协调发展。
图4
图4
天津市中心城区功能密度分布图
Fig. 4
Functional density distribution diagram of the central urban area of Tianjin
图4(a)显示天津市中心城区商业功能存在多个密集分布的区域,如滨江道、鞍山道、友谊路附近,说明商业可以作为这一区域的主要功能而存在;绿地与广场所包含的POI数据种类单一、数据量少,其密度分布结果(图4(b))表现为:在城市中分布较为零星,只在和平区海河沿线以及五大道风景区附近有明显分布;由图4(c)可得工业零散分布在华苑产业园区、海河边缘附近,说明中心城区工业数量较少,难以成为城市的主要功能;图4(d)表明公共管理与公共服务功能广泛分布于中心城区各处,相比之下在和平区的分布更为集中,说明和平区相对于其他城区公共服务与基础设施建设更加完善;图4(e)和图4(f)结果显示,交通设施和居住功能分布较为分散,除了在和平区有集中分布以外,其他区域集中分布的居住和交通设施功能并不多,这两种功能通常是与其他功能相混合存在。
4.2 城市功能区分布结果与分析
按照城市空间识别的步骤划分城市功能区,首先利用OSM道路网数据划分城市研究单元,获得街道分区单元共1 960个,将经过重分类的POI数据与预处理过的地块单元数据进行空间联接,依次计算各研究单元中不同功能类别的POI数据点频率密度,并进行可视化表达,得到天津市中心城区功能分布图,如图5所示,较为明显的特征为混合功能区数量较多,且分布广泛。
图5
在单一功能区里,商业区数量最多,共占493个单元,商业区分布也相对广泛,除了和平区滨江道和小白楼商圈、南开区鼓楼商圈、河西区友谊路商圈以及河北区中山路商圈有密集分布,在其他区域也都有分散分布。总体来看天津市中心城区的商业区布局在向着多商圈、多中心的方向发展,呈现出多方位共同发展的趋势。这取决于近几年居民消费升级和区域协调发展,改变了津城商圈的固有格局,从而使市内商圈呈现出分布均匀的态势。
公共管理与公共服务区在单一功能区中的占比略少于商业区,所占比例约为1/4,并且在整个中心城区分布均匀,天津市中心城区为居民提供了数量较多且分布广泛的公共基础设施服务。由于红桥区、南开区、河北区分布着等众多高校和公共场馆,如天津大学、南开大学、天津医科大学和河北工业大学等高校以及天津体育馆、周邓纪念馆和天津规划展览馆等公共场馆,公共管理与公共服务区的分布在这些地区出现了较为集中的现象。
相对于商业区和公共管理与公共服务区,其他4个单一功能区所占比重较低。其中单一功能的绿地与广场区数量最少,主要分布在南开区的零星区域,天津市中心城区内单独分布的绿地、公园以及旅游区较少,应加强城市环境绿化。居住区的数量也较少,在天津市中心城区并不作为一个主要的功能分区,通常是与其他功能区混合存在,在城市中起到一种辅助作用,如小区周围通常都会有配套的社区医院、学校以及商铺等;工业区数量不多,且多分布在天津市中心城区的外围,主要分布在西部与东北部,与一般城市工业区分布相符合,在城市化进程中,工业逐渐外迁;交通设施区的数量也不多,多为汽车站、火车站和地铁站,铁路路网密度较高,但地铁里程有待提高。
通过单一功能区的识别得出混合功能区共有1 107个,将混合功能区进一步划分,具体分布结果如图6所示。以一个功能为主的混合功能区所占比例较少,其中占比最大的是以公共管理与公共服务为主的混合功能区,天津市中心城区公共服务基础设施建设完善,能够有效提升全社会的福利及居民生活幸福指数。在以两个功能为主的混合功能区中,商业-公共管理与公共服务为主的混合功能区占比最大,达到了611个,从中心向外围的分布特征表现为由集中到分散,与单一功能区的分布相符合,天津市商业以及公共服务业较为发达,且分布广泛。其次较多的是公共管理与公共服务—交通设施为主的混合功能区,主要分布在河东区与河北区。
图6
其他类别的混合功能区分布都较少,其中以绿地与广场区为主的混合功能区几乎不存在,天津市中心城区公园绿地较少,且多与其他功能混合存在,由此可见天津市应增加公园广场数量,做好绿化工作,给居民提供安全舒适的生活居住环境。未分类的综合功能区占比达到了1/4,它广泛分布于天津市中心城区的各个区域,并不集中在某一区域,表明天津市中心城区大多区域配套设施齐全,多种城市功能共同混合存在。
4.3 功能区识别结果验证
为验证识别结果的准确性,随机选取A、B、C、D、E、F 6个区域的城市功能区识别结果与高德地图进行对比分析,高德地图对比结果如图7(g)所示。其中A、B、C、D、E、F六个区域在高德地图上的对应地区如图7(a)—图7(f)所示。在本研究中A、B、C、D 4个区域的功能区识别结果为单一功能区,分别为工业区、商业区、公共管理与公共服务区和居住区。识别结果与高德地图对比发现,A区域主要为公司、产业园和创业大厦等;B区域为滨江道步行街,包含乐宾百货、大悦城等购物商城;C区域为南开大学、天津大学和天津医科大学等一些高校;D区域分布着众多住宅小区,如金泰花园、富方园和芳景明居等;这4个区域的单一功能较为明显,由此可见,本研究使用的识别方法所得结果与城市实际规划相符合。
图7
E、F区域功能区的识别结果分别为综合功能区和商业—公共混合功能区,与高德地图对比可知,E区域除了住宅小区和商场,还存在科技大厦和学校,表明此区域为多功能共同存在,基础生活设施完善;F区域有天津爱琴海购物公园和河东区大桥道小学,故识别为商业—公共混合功能区较为合理。
综上,本研究中城市功能区的识别较为准确,精确度较高,取得了良好效果,其识别结果可以作为城市规划者与管理者对城市规划、协调以及管理的参考依据,并且在城市管理者了解天津市中心城区功能区分布、城市空间结构优化以及制定合理的城市发展规划等方面具有一定的理论和实践价值。
5 讨 论
研究提出的城市功能区识别研究方法有效克服了传统功能区识别过程中主观性强、效率低等问题,通过融合OSM道路网数据和POI大数据,能够较为精确的识别出不同地区的不同功能,不仅对客观地识别和理解天津市中心城区的复杂空间结构有重要参考价值,同样适用于其他城市功能区的识别,并且可以为城市总体规划、城市发展管理以及城市功能用地选址等提供参考依据。研究尚存在改进之处,例如POI大数据作为点数据没有矢量信息作为不同建筑物的甄别;本研究提出的城市功能区识别方法可能会影响城市郊区、POI大数据稀少地区的功能区识别的合理性。因此在之后的研究中应考虑加入矢量化地理大数据进一步开展研究,以提升城市功能区识别的精确性,为城市空间的合理规划提供参考。
6 结 论
本文以天津市中心城区为例,利用丰富的OSM道路网数据生成道路空间划分城市研究单元,并融合POI大数据在精细化尺度下识别分析天津市中心城区城市功能密度分布以及功能区分布特征,最后将城市功能区识别结果与高德地图进行对比分析,并对城市功能区识别结果进行阐述,主要得出以下结论:
(1)由天津市中心城区密度分布结果可得:除工业功能在城市外围有集中分布以外,其他功能的分布都呈现出从中心向外围逐渐分散的特征,与一般城市的功能分布特征相类似。
(2)具有单一功能的商业区、公共管理与公共服务区在天津市中心城区的分布最为广泛,这与天津市作为我国四大直辖市之一,商业发达、公共基础设施完善的定位相符合。
(3)单一功能的城市功能区要少于混合功能区,并且混合功能区的分布极为广泛,说明天津市中心城区的很多区域都是多功能混合存在,此分布特征有助于城市的综合协调发展。
(4)将功能区识别结果与高德地图对比分析,发现相对于格网数据划分城市研究单元,利用OSM道路网数据生成道路空间进行研究单元的划分更符合街区实际分布,使得城市功能区的识别更加准确合理。
参考文献
When a city tells a story:Urban topic analysis
[C]∥
Mining Point-of-interest data from social networks for urban land use classification and disaggregation
[J].
Short-term travel behavior prediction with GPS, land use, and point of interest data
[J].
How reliable are cellular positioning data in tourism environments an exploration of functional regions
[J].
基于手机数据可靠性分析的旅游城市功能空间识别研究
[J].
Spatial agglomeration mode of urban function areas in western frontier tourist city: A case study of Lijiang city’ Yunnan province
[J].
西部边疆旅游城市功能区空间集聚模式——以云南省丽江市为例
[J].
Identifying urban functional zones using bus smart card data and points of interest in Beijing
[J].
基于北京公交刷卡数据和兴趣点的功能区识别
[J].
Identification and spatial interaction of urban functional regions in Beijing based on the characteristics of residents’ traveling
[J].
基于居民出行特征的北京城市功能区识别与空间交互研究
[J].
Urban functional zones recognition and green space evaluation of Shanghai based on POI data
[J].
基于POI数据的上海城市功能区识别与绿地空间评价
[J].
Comparative study of urban functional structure based on POI data : A data study of Beijing and Shanghai
[J].
基于POI数据的城市功能结构对比研究——以北京、上海为例
[J].
A POI Data-based of the urban functional areas of Chongqing and their mix degree recognition
[J].
基于POI的城市功能区及其混合度识别研究——以重庆市核心城区为例
[J].
Research on function identification and distribution characteristics of Wuhan supported by big data
[J].
大数据支持的武汉市功能识别与分布特征研究
[J].
Research on scoring evaluation model and functional regions identification constructed by big data
[J].
大数据构建的赋分评价模型与功能区识别研究
[J].
Research on urban functional area recognition integrating OSM road network and POI data
[J].
融合OSM路网与POI数据的城市功能区识别研究
[J].
Spatial distribution and interaction analysis of urban functional areas based on Multi-source data
[J].
基于多源数据的城市功能区识别及相互作用分析
[J].
Identification of urban functional regions based on POI data and Place2vec model
[J].
基于POI数据和Place2vec模型的城市功能区识别研究
[J].
Big-data driven functional interaction patterns and governance strategy for Beijing-Tianjin-Hebei region
[J].
京津冀城市群城市功能互动格局与治理策略
[J].
Quantitative identification urban functional areas based on spatial grid
[J].
基于空间格网的城市功能区定量识别
[J].
Identify multi-level urban functional structures by using semantic data
[J].
使用语义数据识别多层次城市功能结构
[J].
Research on administrative divisions based on functions areas analysis: A case of Shaoxing metropolitan area
[J].
基于功能区的行政区划调整研究——以绍兴城市群为例
[J].
Exploring urban functional areas based on Multi-source data: A case study of Beijing
[J].
基于多源数据的城市功能区精细化研究——以北京为例
[J].
Research on the identification of urban function areas and the hotspots based on crowdsourcing geographic data
[J].
基于众源地理数据的城市功能区及其热点的识别研究
[J].
Identification of the urban functional regions considering the potential context of interest points
[J].
顾及兴趣点潜在上下文关系的城市功能区识别
[J].
Discovering Urban functional regions based on sematic mining from spatiotemporal data
[J].
基于时空语义挖掘的城市功能区识别研究
[J].
Characteristics and promotion strategy of public space vitality in Qingdao Dabaodao historic district
[J].
青岛大鲍岛历史街区公共空间活力特征与提升策略
[J].
Identification and evaluation of urban functional land based on POI data: A case study of five districts in Jinan
[J].
基于POI数据的城市用地功能识别与评价研究——以济南市内五区为例
[J].
Identification of urban functional areas based on GPS trajectory and POI data with association rules
[J].
融合GPS轨迹和POI数据关联规则的城市功能区识别
[J].
Research on the rationality of public toilets spatial layout based on the POI data from the perspective of urban functional area
[J].
城市功能区视角下基于POI数据的公共厕所空间布局合理性研究
[J].
/
〈 |
|
〉 |
