超大城市土地覆盖与热环境的随机森林回归模型研究
1.
2.
Study on the Random Forest Regression Model of Land Cover and Thermal Environment in Megacities
1.
2.
通讯作者:
收稿日期: 2021-10-21 修回日期: 2022-02-21
基金资助: |
|
Received: 2021-10-21 Revised: 2022-02-21
作者简介 About authors
王美雅(1991-),女,福建泉州人,博士,副教授,主要从事环境与资源遥感研究E⁃mail:
关键词:
Keywords:
本文引用格式
王美雅, 徐涵秋.
Wang Meiya, Xu Hanqiu.
1 引 言
遥感技术覆盖面广、分辨率高、处理速度快,利用遥感技术来监测城市下垫面性质,可以克服传统地面观测站点资料数据极其有限的问题,实现海量“面”数据的获取[5]。此外,多时相、多光谱、多平台的遥感卫星影像能保证在全球范围内提供准确、一致的数据,被广泛用于城市热环境研究。从原始的目视解译到海量遥感影像分类、遥感因子回归分析等问题引入了众多模式识别方法,如最大似然法、最小距离法、KNN(K-Nearest Neighbor)算法、ANN(Artificial Neural Network)、支持向量机、随机森林、遗传算法和面向对象等算法等[6],可以看出与日俱增的海量遥感影像推动着遥感图像处理算法的进步。
快速城市化导致的城市热环境变化,产生城市热岛效应[7]。一方面,城市人口的大幅增加,城市规模不断扩大,能耗需求剧增,人为温室气体排放总量持续增加。另一方面,城市化过程中大量的建筑、水泥路等不透水面取代了植被、水体等生态用地,导致地表蒸腾明显减少,显热表面比例升高而潜热表面比例降低,促使城市热岛效应日益严峻[8-9]。众多学者围绕城市热环境变化进行研究分析。Zheng等[10]则在利用Moran'I指数对凤凰城的地表温度和LULC类型的相关性研究中发现,相对于城市建筑物的空间格局,其外立面不同涂料的区别对地表温度的影响更大,且夜间的正相关性更高。Chen等[11]运用Landsat影像反演广州城市地表温度,进一步计算城市热变异区域,并采用多种景观格局指数分析城市热变异区的特征。结果表明,城市地物组成对城市热变异区的影响最大,地表景观空间格局也会影响城市热变异区。Kotharkar等[10]分析印度那格浦尔市局地气候分区(Local Climate Zones, LCZ)的热岛情况,结果表明冬季建筑用地气候区内的UHII介于1.76℃~4.09℃之间,城区中紧凑型低层LCZs区比城市内部的其它主要LCZs区的气候暖和。
然而目前对于超大城市土地覆盖和热环境定量模型研究报道不足,这主要是因为大城市地表温度和地表生物物理组分之间存在复杂的潜在非线性关系,这使得准确评估城市热环境情况遇到了严峻的技术挑战。因此,本研究选取中外6个典型超大城市,研究超大城市土地覆盖与城市热环境的互动作用机理,能为未来生态城市建设提供宝贵建议。
2 研究区概况
图1
3 研究方法
将植被、水体和不透水面等3大主要地表覆盖类型的遥感指数与城市热环境进行回归统计,定量分析中外6个超大城市的城市地表参数与城市热环境的互动关系。
3.1 地表温度反演
其中:Tsensor为传感器处亮温值;K1和K2为热红外波段的定标常数;Lsensor为热红外波段的辐射值;γ和δ是基于Planck函数的2个参数;ε为地表比辐射率,ψ1、ψ2、ψ3是大气水汽含量的函数。
3.2 主要地物遥感指数
不透水面指数[28]:
其中:Green、Red、NIR、MIR1分别代表绿光、红光、近红外和中红外1波段;MNDWI为新型归一化水体指数,TIR为热红外波段。
3.3 土地覆盖与城市热环境的综合定量关系模型构建
城市地表温度和地表生物物理组分之间存在复杂的潜在非线性关系,这使得准确评估城市热环境情况遇到了严峻的技术挑战。研究采用随机森林回归模型来模拟植被、水体和不透水面对地表温度的综合作用关系,建立土地覆盖类型与城市热环境定量关系模型 (Land Cover-LST Regression, LCT),并与传统的多元线性回归模型进行对比。
3.3.1 模型输入样本选择
用于建模与检验的样本需要充分客观地代表各研究区的土地覆盖类型和对应的地表温度特征,为此,本研究采用网格采样的方法进行采样。选用NDVI、MNDWI和NDISI指数来表征植被、水体和不透水面比例,作为模型的3个输入因子。采用地物比例影像进行回归样本采样能有效地解决混合像元效应问题。首先将各研究区植被的NDVI影像、水体的MNDWI影像和不透水面的NDISI影像归一化到0~1之间,并转换成百分率,使其数值分布在0~100之间[28-29],然后根据研究区大小,采用适当尺寸的网格进行采样,北京、上海、广州、伦敦、纽约和东京所用的网格大小分别为15×15、15×15、15×15、14×14、13×13和18×18,总采样点分别为16 894个、11 404个、12 653个、14 684个、12 525个和17 080个,统计出对应的植被比例、水体比例、不透水面比例和地表温度LST,足够多的样品以确保回归分析的客观性。
3.3.2 随机森林回归模型构建
随机森林回归模型(Random Forest Regression, RFR)是一种基于决策树的集成学习算法。由于随机森林回归能够有效处理高维数据,且模型中需要调整的参数较少,只需设置两个参数:生成的决策树数量(Ntree)和决策树生长分裂时被选择用于测试的特征数目(Mtry),因此,比传统的多元回归分析法更具有优势[30-31]。本研究引入随机森林回归模型 (RFR) 来解释土地覆盖与地表温度之间的综合定量关系。本研究将6幅影像的NDVI、MNDWI和NDISI指数作为自变量,LST作为目标值,建立6幅影像的随机森林回归模型 (LCT_RF)。根据前人研究成果,本研究将Ntree值设为500[32],Mtry值设为1(输入特征数的三分之一),模型表达式可简写为:
图2给出随机森林回归模型的构建流程图。
图2
研究对比了随机森林模型与多元线性回归模型对LST的解释能力,以均方根误差(Root Mean Square Error,RMSE)来定量评价模型的预测精度。RMSE反映的是预测值与真实值之间的偏离程度。把卫星影像反演的LST作为真实的LST来评价模型的预测效果。此外,研究也绘制了2种模型真实值与预测值的1∶1的散点图来评价模型的精度,如果模型具有较高的预测精度,其1∶1的散点图会显示45°的直线趋势。
4 研究结果
4.1 地表温度反演结果
依据上述LST反演算法组合以及相关关键参数的获取和计算方法,得到所研究6个超大城市的LST反演结果(图3)。
图3
研究涉及多城市多区域的地表温度数据,通过收集标准气象站点历史温度数据进行验证存在一定困难。因此,研究利用同日的MODIS地表温度产品进行精度验证。通过美国航空航天局(NASA)获取与所反演6个城市各时期LST影像同日的MODIS LST逐日数据(MOD11A1),统计对比各研究区相同区域内的地表温度均值,验证结果见表1。通过取温度均值进行对比的方法可以避免反演的温度和MODIS LST数据空间分辨率上不同而产生的差异。结果表明(表1),所反演的Landsat LST与MODIS LST的均值比较接近,除了伦敦2015年10月2日和东京2015年10月9日的平均温差绝对值略大于1.0℃,其余影像的平均温差均小于1.0℃。这说明,地表温度反演结果总体上符合精度要求。有一定差距的原因可能是由于两种卫星的过空时间不完全相同所致。
表1 地表温度反演精度对比
Table 1
城市 | 日期 | 过空时间 | 卫星 | LST均值/℃ | 平均LST差值/℃ |
---|---|---|---|---|---|
北京 | 2015/8/22 | 11:48a.m. | MODIS | 37.691 | 0.135 |
10:53a.m. | Landsat | 37.556 | |||
上海 | 2015/8/3 | 11:36a.m. | MODIS | 38.557 | -0.855 |
10:24a.m. | Landsat | 37.702 | |||
广州 | 2015/10/18 | 10:48a.m. | MODIS | 32.767 | 0.823 |
10:52a.m. | Landsat | 33.590 | |||
伦敦 | 2015/10/2 | 10:24a.m. | MODIS | 19.177 | -1.312 |
10:58a.m. | Landsat | 17.865 | |||
纽约 | 2015/8/26 | 10:12a.m. | MODIS | 31.600 | 0.869 |
10:39a.m. | Landsat | 32.469 | |||
东京 | 2015/10/9 | 11:42a.m. | MODIS | 26.745 | 1.314 |
10:15a.m. | Landsat | 28.059 |
4.2 3种地表覆盖类型与地表温度的二维关系分析
采用线性和非线性多种拟合分析来定量刻画不同地表覆盖物变化的升温/降温效应。对比线性、二次多项式、对数、指数、幂函数等5种拟合曲线函数,选择最佳拟合回归函数分析3种地物类型与地表温度间的关系。根据拟合结果,选择线性回归方程表示植被和水体与地表温度的定量关系,选择指数回归方程表示不透水面与地表温度的定量关系。
图4
不同城市地表覆盖升温/降温效应有所差别,在北京、上海、纽约和东京等城市区域,植被和水体增加产生的降温效应较明显,植被比例每提升10%,地表温度可降低1℃~1.6℃;水体比例每提升10%,地表温度可降低0.7℃以上。广州和伦敦城市区域,植被比例每提升10%,地表温度降低0.5℃~0.9℃;水体比例每提升10%,地表温度降低0.2℃~0.4℃。北京、上海和纽约等城市区域的不透水面增加产生的升温效应也高于广州、伦敦和东京等区域,当NDISI ≤ 30%时,不透水面比例每增加10%,只导致地表温度增加1.8℃左右,但当NDISI≥80%时,不透水面比例每增加10%,地表温度的增加幅度会达2.4℃以上。在广州和东京等城市区域,当NDISI ≤ 30%时,不透水面比例每增加10%,只导致地表温度增加1.3℃左右,但当NDISI≥80%时,不透水面比例每增加10%,地表温度的增加幅度会达1.8℃以上。升温效应相对低的伦敦,地表温度随不透水面比例增加的上升幅度在0.7℃~0.9℃左右。此外,从北京、广州、纽约和东京植被比例和地表温度的回归散点图看出,在NDVI高值(NDVI>80%) 区域,回归曲线的下降速率比NDVI低值区域有所升高。这说明,在高植被比例(NDVI>80%)情况下,这些城市区域植被的降温效应好于低植被比例的情况。结合这4个城市的遥感影像(图1)可以发现,北京、广州、纽约和东京研究区中的NDVI高值区域对应的为城郊地区覆盖林地的山体区域,而上海和伦敦城市周边则无大片山体林地,这在一定程度说明了大面积林地的降温效应明显好于其他植被类型。
4.3 LCT模型结果分析
基于3种土地覆盖比例指数和随机森林回归模型、多元线性回归模型分别对中外6个超大城市的地表温度进行反演,得到基于RF方法的土地覆盖类型与地表温度的回归模型(LCT_RF)和基于MLR方法的回归模型(LCT_MLR)。LCT_RF模型和LCT_ MLR模型都使用了中心像元的植被比例(NDVI)、水体比例(MNDWI)和不透水面比例(NDISI)作为模型输入自变量,且这3 个自变量都通过了1%的显著性检验,说明3 个变量都是影响地表温度的重要因子。模型获得的预测LST与遥感数据反演的LST进行精度检验,计算了R2和RMSE 2个统计指标来评价模型的精度(表2)。图5~6分别为LCT_RF和LCT_MLR模型的1∶1散点图。
表2 LCT_RF和LCT_MLR方法预测LST精度对比
Table 2
城市 | LCT_RF(3指数) | LCT_MLR(3指数) | ||
---|---|---|---|---|
R2 | RMSE/℃ | R2 | RMSE/℃ | |
北京 | 0.656 | 1.646 | 0.635 | 1.956 |
上海 | 0.775 | 1.347 | 0.754 | 1.592 |
广州 | 0.726 | 1.507 | 0.686 | 1.613 |
伦敦 | 0.623 | 0.882 | 0.559 | 0.954 |
纽约 | 0.826 | 1.814 | 0.752 | 2.164 |
东京 | 0.761 | 1.636 | 0.698 | 1.897 |
图5
图5
6个城市LCT_RF(3 指数)模型结果
Fig.5
Results comparison of LCT_RF(3 indices)of the six megacities
图6
图6
6个城市LCT_MLR(3 指数)模型结果
Fig.6
Results comparison of LCT_MLR(3 indices)of the six megacities
结果表明,LCT_MLR模型的精度低于相应的LCT_RF模型。LCT_RF模型的R2值比LCT_MLR模型高0.02~0.07;LCT_RF模型检验的RMSE则比LCT_MLR模型低0.1℃~0.4℃。这说明,LCT_RF回归方法所建立的非线性模型在不同城市土地覆盖对LST的预测上都表现出比线性模型更高的精度,而其算法的效率也较高。综上可见,LCT_RF模型通过对非线性关系的模拟,比传统的多元线性回归模型对复杂城市环境内LST的变异提供更好的解释。
综上,LST定量模拟结果表明复杂城市景观中的地表覆盖组分与LST存在明显的非线性关系。植被、水体和不透水面等地表覆盖的综合作用会导致城市地表温度的变化。
5 讨 论
本研究采用随机森林回归方法建立了土地覆盖类型与城市热环境的综合定量关系模型(LCT),反映了复杂城市景观中下垫面用地类型和地表温度之间的非线性关系,精度高于基于多元线性回归方法建立的模型,采用的Landsat影像数据易获取,覆盖面广,便于实现大范围应用,但仍有许多不足之处。
(1)以北京、上海、广州、伦敦、纽约和东京等6个超大城市为研究区开展实验,建议的土地覆盖类型与城市热环境的综合定量关系模型 (LCT)有较高的精度,然而该方法在其他大城市或中小城市的适用性还有待进一步研究。此外,实验构建的基于Landsat 8影像的回归模型,所选城市区域夏季多云多雨,数据获取受限,未来将进一步探究使用其他多源遥感影像补充获取更多时相云覆盖区域的数据进行研究。
(2)使用的随机森林回归模型是一种黑盒模型,虽然随机森林可以评估每个参数的重要性,但是每个参数具体如何影响分类结果却未可知;本研究构建500棵分类树的随机森林,分类树棵树的增加,一定程度上提高了分类精度,但是分类花费的时间也相应增加,已有的输入参数可以帮助模型实现最优分类精度,但大大增加了算法运行时间。接下来将继续优化输入参数、分类树数量,在回归精度和时间之间谋求平衡。
(3)植被、不透水面和水体等三大土地覆盖类型是城市复合生态系统的重要组成部分,选择这3种土地覆盖类型作为影响因子,可有效地反映地表覆盖与地表温度的综合作用关系,然而大城市地表温度和地表生物物理组分之间作用机理复杂,将来可进一步细分更多地表覆盖类型增加影响因子类型,持续改进评估模型。
6 结 论
研究利用单通道算法反演中外6个超大城市地表温度,并选取NDVI、MNDWI、NDISI指数作为植被、水体和不透水面等3种主要土地覆盖类型的表征因子。在定量分析了每种土地覆盖类型对地表温度的作用基础上,采用随机森林回归方法建立了土地覆盖类型与城市热环境的综合定量关系模型 (LCT)。结果表明:
(1)地表温度和下垫面用地类型之间表现出密切的关联,高温热场的空间结构在很大程度上被下垫面用地类型的空间格局所左右,不透水面会导致高温热场的聚集,而植被和水体则有降温作用。当NDISI≤30%时,不透水面比例每增加10%,只导致地表温度增加0.7℃~1.8℃左右,但当NDISI≥80%时,不透水面比例每增加10%,地表温度的增加幅度会达0.9℃~2.4℃左右。植被比例每提升10%,地表温度可降低0.5℃~1.6℃; 水体比例每提升10%,地表温度可降低0.4℃~0.9℃。不同城市地表覆盖升温/降温效应有所差别,在北京、上海、纽约和东京等城市区域,植被和水体增加产生的降温效应较明显。北京、上海和纽约等城市区域的不透水面增加产生的升温效应也高于广州、伦敦和东京等区域。
(2)基于随机森林回归方法建立的NDVI、MNDWI和NDISI等3种土地覆盖指数因子与LST的定量关系模型(LCT_RF)得到的精度高于基于多元线性回归方法建立的模型。LCT_RF模型的R2值在0.623~0.826间,比LCT_MLR模型高0.021~0.074;RMSE比LCT_MLR模型低0.07℃~0.35℃。本研究可用于衡量超大城市土地覆盖变化对城市热环境的定量作用,作为生态城市建设重要理论和技术支撑。
参考文献
An Eco-City model for regulating urban land cover structure and thermal environment: Taking Beijing as an example
[J]. ,
城市地表覆盖结构组分与热环境调控模型(EcoCity)研究——以北京城市为例
[J]. ,
The study of urban thermal environment dynamicsand attribution analysis basedon multiple remote sensing dataset: In the case of Shenzhen
[J]. ,
基于多源遥感数据的城市热环境响应与归因分析——以深圳市为例
[J].,
Prediction of ecological effects of potential population and impervious surface increases using a Remote Sensing based Ecological Index(RSEI)
[J]. ,
Spatial and temporal evolution characteristics of thermal environment and its influencing factors in urban area of Yinchuan City based on remote sensing
[J]. ,
基于遥感的银川市城区热环境及其影响因素的时空演变特征
[J]. ,
Frontier hotspotsand development directions of geographical science research:From a perspective of national natural science foundation application keywords in 2021
[J/OL]. :
2021年度自然科学基金申请书关键词透视地理科学研究前沿热点与发展方向
[J/OL].:
Brain cognition and spatial cognition: On integration of geospatial big data and artificial intelligence
[J]. ,
脑认知与空间认知—论空间大数据与人工智能的集成
[J]. ,
Reviewof urban remote sensing researchinthe last two decades
[J]. ,
近20年城市遥感研究现状及其发展趋势
[J]. ,
Locally optimized separability enhancementIndices for urban land cover mapping: Exploring thermal environmental consequences of rapid urbanization in Addis Ababa,Ethiopia
[J].,
Seasonal variations in the relationship between land sur‐face yemperature and impervious surface percentage in Kolkata
[J]. ,
加尔各答市地表温度与不透水面比例季相相关性研究
[J].,
Spatial configuration of anthropogenic land cover impacts on urban warming
[J]. ,
Impacts of urban landscape patterns on urban thermal variations in Guangzhou, China
[J]. ,
Evaluating urban heat island in the criticalLocal climate zones of an Indian city
[J]. ,
Relationship betweentypes of urban forest and PM2.5 capture at three growth stages of leaves
[J]. ,
Determining the impact of urban components on land surface temperature of istanbul by using remote sensing indices
[J]. ,
Detecting changes in surface water area of lake Kyoga sub-basin using remotely sensed imagery in a changing climate
[J]. ,
Urban expansion process in the center of the fuzhou basin, Southeast China in
近30 a来福州盆地中心的城市扩展进程
[J]. ,
Long-term and fine-scale satellite monitoring of the urban heat island effect by the fusion of multi-temporal and multi-sensor remote sensed data: A 26-year case study of the city of wuhan in China
[J]. ,
Decadal assessment of urban sprawl and its effects on local temperature using landsat data in Cantho city,Vietnam
[J].,
Mapping form and function in urban areas: An approach based on urban metrics and continuous impervious surface data
[J]. ,
Summary of current radiometric calibration coefficients for landsat MSS, TM, ETM+, and EO-1 ALI sensors
[J]. ,
Image-based atmospheric corrections-revisited and revised
[J]. ,
Revision of the single-channel algorithm for land surface temperature retrieval from landsat thermal-infrared data
[J]. ,
A generalized single-channel method for retrieving land surface temperature from remote sensing data
[J]. ,
Land surface temperature retrieval methods from Landsat8 thermal infrared sensor data
[J]. ,
Soil class and attribute dynamics and their relationship with natural vegetation based on satellite remote sensing
[J].,
Surface water extent dynamics from three decades of seasonally continuous landsat time series at subcontinental scale in a semiarid region
[J]. ,
Review of impervious surface mapping using remote sensing technology and its application
[J]. ,
遥感技术在不透水层提取中的应用与展望
[J]. ,
Analysis of impervious surface and its impact on urban heat environment using the Normalized Difference Impervious Surface Index (NDISI)
[J]. ,
Getting started with geographic information systems, 3rd edition
[J]. ,
Estimation of maize leaf area index based on GF-1 WFV image and machine learning random algorithm
[J]. ,
基于GF-1 WFV影像和机器学习算法的玉米叶面积指数估算
[J]. ,
Random forest and rotation forest for fully polarized SAR image classification using polarimetric and spatial features
[J]. ,
/
〈 | 〉 |