img

官方微信

遥感技术与应用, 2022, 37(1): 244-252 doi: 10.11873/j.issn.1004-0323.2022.1.0244

草地遥感专栏

基于Cubist的中国植被区域叶绿素荧光数据重建

沈洁,1, 辛晓平,1, 张景2, 苗晨2, 王旭1, 丁蕾1, 沈贝贝1

1.中国农业科学院农业资源与农业区划研究所,北京 100081

2.国家遥感中心,北京 100036

Reconstruction of SIF Remote Sensing Data of Vegetation in China based on Cubist

Shen Jie,1, Xin Xiaoping,1, Zhang Jing2, Miao Chen2, Wang Xü1, Ding Lei1, Shen Beibei1

1.Institute of Agricultural Resources and Agricultural Regional Planning,Chinese Academy of Agricultural Sciences,Beijing 100081,China

2.National Remote Sensing Center of China,Beijing 100036,China

通讯作者: 辛晓平(1970-),女,甘肃天水人,研究员,主要从事草地生态遥感研究。E⁃mail: xinxiaoping@caas.cn

收稿日期: 2021-06-16   修回日期: 2021-09-29  

基金资助: 国家重点研发计划项目“草地碳收支监测评估技术合作研究”.  2017YFE0104500
国家自然科学基金“基于全生命周期分析的多尺度草甸草原经营景观碳收支研究”.  41771205
财政部和农业农村部国家现代农业产业技术体系,中央级公益性科研院所基本科研业务费专项.  Y2020YJ19.  1610132021016

Received: 2021-06-16   Revised: 2021-09-29  

作者简介 About authors

沈洁(1996-),女,宁夏中卫人,硕士研究生,主要从事草地生态遥感研究E⁃mail:JShen_10@163.com , E-mail:JShen_10@163.com

摘要

日光诱导叶绿素荧光(Solar-Induced chlorophyll Fluorescence, SIF)是植物在太阳光照条件下,在光合作用过程中发射出的光谱信号(650~800 nm),SIF相比于植被指数等参数更能直接地反映植被光合作用的相关信息,为大尺度GPP估算带来了新的途径。但目前卫星SIF数据或存在分辨率较低的不足,或存在数据空间不连续的局限,对于应用到大尺度中连续GPP的估算中有一定难度。OCO-2 SIF数据拥有较高的空间分辨率,但却是空间离散数据。针对上述问题,着重研究对离散的OCO-2 SIF数据进行连续预测的方法,生成中国—蒙古草地生态系统的较高精度连续SIF数据集。结果如下:通过Cubist回归树算法,结合MODIS反射率数据,气象数据及土地利用类型,建立了每8 d的0.05°分辨率的连续SIF数据集,预测精度为R²=0.65,RMSE=0.114。其中,对作物类SIF预测的精度最高,为R²=0.71,RMSE=0.117;其次为对森林与草地的预测,两者的R²和RMSE分别为0.64/0.123,0.60/0.112。

关键词: 日光诱导叶绿素荧光 ; Cubist模型 ; 数据重建

Abstract

Solar-Induced Chlorophyll Fluorescence (SIF) is the spectral signal (650~800 nm) emitted by plants in the process of photo-synthesis under sunlight conditions. SIF is more direct than vegetation index and other parameters. Reflecting the relevant infor-mation of vegetation photosynthesis, it brings a new way for large-scale Gross Primary Productivity(GPP)estimation. However, the current satellite SIF data may have insufficient resolution or discontinuity in the data space, which is difficult to apply to the estimation of continuous GPP on a large scale. OCO-2 SIF data has high spatial resolution, but it is spatially discrete data. In response to the above problems, this paper focuses on the method of con-tinuous prediction of discrete OCO-2 SIF data to generate a high-precision continuous SIF data set of the China-Mongolia grassland ecosy-stem. The results are as follows: Through the Cubist regression tree algorithm, combined with MODIS reflectance data, meteorologi-cal data and land use types, a continuous SIF data set with a resolution of 0.05° every 8 days is established, and the prediction accuracy is R²= 0.65 and RMSE = 0.114. Among them, the accuracy of crop SIF prediction is the highest, with R²= 0.71 and RMSE= 0.117; the second is the prediction of forest and grassland, with R² and RMSE of 0.64/0.123 and 0.60/0.112 respectively.

Keywords: Solar-Induced chlorophyll fluorescence ; Cubist model ; Data reconstruction

PDF (5421KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

沈洁, 辛晓平, 张景, 苗晨, 王旭, 丁蕾, 沈贝贝. 基于Cubist的中国植被区域叶绿素荧光数据重建. 遥感技术与应用[J], 2022, 37(1): 244-252 doi:10.11873/j.issn.1004-0323.2022.1.0244

Shen Jie, Xin Xiaoping, Zhang Jing, Miao Chen, Wang Xü, Ding Lei, Shen Beibei. Reconstruction of SIF Remote Sensing Data of Vegetation in China based on Cubist. Remote Sensing Technology and Application[J], 2022, 37(1): 244-252 doi:10.11873/j.issn.1004-0323.2022.1.0244

1 引 言

太阳诱导叶绿素荧光(Solar-Induced chlorophyll Fluorescence, SIF)指植被在光合作用中发射的一种光学信号,植物叶片在日光照射下将所吸收的一部分光能用于光合作用,另一部分激发叶绿素分子使其发生电子跃迁后,以长波形式发射荧光,或以热能形式向外散耗,叶绿素分子吸收光子,被激发的叶绿素重新发射光子而产生的一种光谱范围为650~800 nm的光信号,因此具有直接指示植被光合作用的巨大潜力,是进行监测GPP和植被光合作用的有效工具1-3。叶绿素荧光作为植被光合作用的副产品,相比于植被指数等参数更能直接地反映植被光合作用的相关信息,是植被生理状态的无损探针4。近年来,通过卫星遥感技术得到了大量探测全球尺度SIF的研究和产品。Frankenberg等5-7基于日本GOSAT卫星绘制了首张荧光地图。由此,引发了SIF研究的热潮,多种可用于探测荧光的卫星反演产品也应运而生。如GOME-2传感器(搭载于MetOp-A/B卫星)可提供740 nm附近,分辨率40 km×80 km的荧光峰值分布图8。2009年日本发射的“温室气体观测卫星”(GOSAT)提供直径为10 km分辨率,770 nm附近的叶绿素荧光。美国2014年发射的OCO-2可以提供比GOSAT更高空间分辨率的数据,足迹大小为1.3 km×2.25 km。Sentinel-5P搭载的TROPOMI传感器空间分辨率为7 km×7 km,2019年8月起为3.5 km×7.5 km,也能够获取更高分辨率的荧光产品。2016年中国发射的TanSat卫星能够提供空间分辨率为2 km×2 km的数据,未来计划发射或即将发射的荧光探测卫星用FLEX(FLORIS),美国TEMPO卫星与OCO-3卫星,以及GeoCARB卫星9,将为SIF数据的研究与应用提供更多支持与可能。然而,当前已有的卫星所衍生的叶绿素荧光产品,或存在空间分辨率都较为粗略的问题,或其产品本身只是离散的脚点,不足以直接进行更精细的尺度或生态系统水平的分析10。目前,这个问题能通过从OCO-2卫星中获得更高分辨率的SIF产品得到部分解决11。同时,解决SIF数据集的空间不连续性,也成为近来全球SIF数据研究的重点问题,对于测量光合作用与更好地耦合不同时空尺度的GPP等信息将十分有价值12-14,目前,也有许多学者从神经网络、机器学习等方面探索连续SIF数据集的构建15-19。基于此,研究将尝试解决SIF数据的空间不连续性,通过较高分辨率的OCO-2脚点数据,结合反射率、气象因子、土地利用类型等数据生成连续的SIF产品。

2 研究区域与数据

2.1 研究区域概况

研究区域为中国大陆内的植被覆盖区域,包含了常绿针叶林、常绿阔叶林、落叶针叶林、落叶阔叶林、混交林、郁闭灌丛、开放灌丛、多树草原、稀树草原、草原、永久湿地、作物共12种植被覆盖类型,如图1,其经度范围为73°~136° E,纬度范围为17°~54° N。

图1

图1   研究区域范围

Fig.1   Research area


2.2 数据来源

轨道碳观测2号(Orbiting Carbon Observatory-2,OCO-2)是一颗由美国国家航空航天局(National Aeronautics and Space Administration,NASA)于2014年发射的探测大气中二氧化碳浓度的卫星。同时,该卫星也以的“夫琅禾费暗线填充原理”(Fraunhofer Line Discrimination, FLD),应用了Frankenberg 等5作全球尺度SIF的算法,开发了自己的IMAP-DOAS算法以提取758 nm处和770 nm处的O2-A波段的SIF值,反演得到L2级荧光产品。该产品有3个观测模式,即星下点观测(Nadir模式)、闪烁观测(Glint模式)和目标观测(Target模式)。其中,Nadir模式有较好的分辨率,闪烁观测有较高的信噪比,目标观测的单次观测数据点较多,适用于与地面站点的匹配验证。研究收集了2018年5月至2019年该版本的SIF数据,并从中提取了已校正的日值SIF,通过云掩膜编码剔除了有云的脚点数据。

反射率数据来源于中分辨率成像光谱仪MODIS(Moderate-resolution Imaging Spectroradiometer)的MCD43C4产品,此产品的生成过程中都使用了Terra和Aqua数据,从而为质量保证输入数据提供了最高的可能性。该产品包含在3级数据集中提供的16 d数据,该数据集投影到0.05°(5.6 km)的纬度—经度气候建模网格(Climate Model Grid,CMG),包括MODIS在目标日的当地太阳正午天顶角处前7个光谱带的星下反射率(Nadir_Reflectance),并且以地理投影(纬度-经度)形式提供全球每天的反射率数据。气象数据采用全球范围的MERRA-2数据集,该数据集是美国航天局利用戈达德地球观测系统模型5(GEOS-5)及其大气数据同化系统(ADAS)对卫星时代进行的大气再分析。其空间分辨率为0.5°×0.625°(纬向×经向),时间跨度为1980年至今。该数据集针对坐标点提供年统计,月统计,日变化统计和时间序列数据(如1 h分辨率),针对区域提供年平均数据,本文使用其日变化统计的气象数据集,从中获取1 h分辨率的太阳辐射数据用于计算光合有效辐射(Photosynthetically Active Radiation,PAR),以及每日的最大、最小、平均温度,以及降水率,以此来得到日均温度(Temperature,T),计算饱和水汽压差等参数(Vapor Pressure Deficit, VPD),并对该数据进行重采样以得到固定格网数据。

3 研究方法

3.1 数据预处理

日光诱导叶绿素荧光(SIF)与光合有效辐射以及植被状况有关,因此,研究将采用3类参数,即植被条件、气象条件、土地利用类型,来描述预测的SIF值。其中,由植被增强指数(Enhanced Vegetation Index, EVI)代表植被条件,EVI是被用于监测植被状况最广泛的一种植被指数19,其计算公式如下:

EVI=ρNIR-ρRρNIR+C1*ρR-C2*ρBlue+L*G

其中:ρNIRρRρBlue分别表示近红外波段、红波段、蓝波段的反射率;C1C2 为气溶胶阻抗系数;L为土壤调节参数;G为常数。EVI使用蓝波段的数据去校正红波段的气溶剂影响,加入土壤调节参数,使得EVI对大多数冠层背景不敏感(带有雪背景的除外)20-21。通常取C1=6,C2=7.5,L=1,G=2.5EVI全体取值范围为-2.5~2.522,植被中的EVI取值范围通常在0.2~0.8。从MCD43C4中提取诸天的0.05°反射率数据,由式(2)计算EVI,后计算每8 d的平均EVI值,得到0.05° 8 d分辨率的EVI数据集。

气象条件选取光合有效辐射,气温,饱和水汽压差3个参数来表示可能影响叶绿素荧光发射的环境条件,如太阳辐射,温度、水胁迫等。光合有效辐射为MERRA-2的1 h分辨率的太阳辐射数据集中获取漫射辐射(Diffuse PAR)和直接辐射(Direct PAR)之和,在该数据集中,直接辐射名为光束辐射(Beam PAR),并累积到1 d成为逐天数据,单位:MJ·m-2。气温和饱和水汽压差由逐天的MERRA-2数据集获得,该逐天数据集能够直接获得平均温度,单位:K,此外能够获取每日最高、最低温度和降水率。饱和水汽压差指一定温度下,饱和水汽压与空气中的实际水汽压间的差值,表示实际空气距离水汽饱和状态的程度,由最高、最低温度和水汽压计算方法如下:

VPD=Esat-VP
Esat=E(Tmax)+E(Tmin)2
E(Tmax)=0.6108*e17.27*(Tmax-273.15)Tmax
E(Tmin)=0.6108*e17.27*(Tmin-273.15)Tmin

其中:Esat是饱和水汽压;VP是水汽压;由降水率而得,降水率单位为kg·m-2·s-1,乘以时间,并换算为水汽压差,单位:KPa,TmaxTmin分别是日最高、最低温,单位:K。

由于气象数据集经纬向的分辨率不同,需要重采样到0.05°,再聚合为8 d的累积PAR,平均温度和饱和水汽压数据集。土地利用类型由MCD12C1(分辨率:0.05°)中的国际地理圈-生物圈计划(IGBP)分类方案获得。

日光诱导叶绿素荧光由OCO-2 SIF(1.3 km × 2.25 km)的Nadir模式脚点数据获取,该模式近似垂直观测,由此而受到的测量角度影响可忽略不计。获取每个OCO-2 SIF脚点中心位置的经纬度,并将将所有OCO-2 SIF汇总到每个8 d间隔的0.05°×0.05°网格单元,若每个网格单元内捕获到超过5个的SIF脚点值,即以该网格内所有SIF脚点的均值作为其SIF值,单位:W·m-2·μm-1·sr-1。经汇总后,在每8 d的间隔内,这些网格单元占总陆地面积约0.3%。

对于每个具有SIF数据的网格单元,从网格化EVI、PAR、气温、VPD和土地覆盖类型提取对应单元,组成从2018年5月至2019年12月共20个月的每8 d 0.05°分辨率数据集,共含有约21.5万条记录,将2018年5月至2019年6月约14.0万条数据作为训练集,2019年7月至12月约7.5万条数据作为测试集。集合所有EVI、PAR、气温、VPD和土地覆盖类型数据作为对2018年5月至2019年12月期间连续SIF的预测集。

3.2 Cubist回归树预测算法

OCO-2 SIF数据具有较高的分辨率,但该数据为离散的脚点数据,且呈条带状分布,使得一般的线性插值或重采样方法难以得到较为准确且分辨率高的连续SIF数据,使得OCO-2 SIF数据常被整合为1°分辨率每16 d的数据集,掩盖了该数据的高分辨率优势23。因此,需要从非线性或机器学习等方法出发,结合多种连续的遥感数据估计连续且精度较高的SIF数据集。研究使用机器学习方法中的Cubist回归树,以数据驱动的方法开发预测0.05°分辨率的连续日光诱导叶绿素荧光(SIF)。树型算法的基础决策树因其易理解、易构建、运算快等特性,被广泛应用于统计学及数据挖掘等领域。决策树可以分为两类:分类决策树与回归决策树,处理离散型数据时主要用分类决策树,处理连续型数据就会用到回归决策树,后者常被用于预测连续变化的值。经典回归树是由BREIMAN 等提出的分类与回归树(Classification And Regression Trees,CART)方法24,CART由特征选择、树的生成及剪枝组成,通过不断将数据分为两组,分组时通过穷举每一个特征的每一个阈值来寻找最优切分特征与最优切分点,衡量方法为整体误差平方和最小化。同时,通过类似交叉验证法进行剪枝,避免回归树增长过长。但CART对样本的预测都采用最终叶子节点处所有训练集训练结果的均值,由此导致对新的样本集预测偏差较大,难以达到理想预测效果25

为克服CART等简单的回归树的局限,Quinlan26提出了由M5模型树发展而来的Cubist回归树。Cubist回归树的特点在于模型树的叶子节点上是一个线性回归模型,一系列的分段线性模型组合为Cubist回归树,能够很好地解决非线性问题27。Cubist树训练规则简单、有效,速度快,对输入空间的分割由算法自动进行,能够处理高维属性的问题。模型树将输入的数据集样本空间划分为不同的长方形区域,其边缘互相平行,在每一层模型树中,选择识别力最强的属性成为子树的根节点,将样本根据该根节点划分为若干个子集。为防止树过度增长,对节点增长设置多个停止条件:节点样本的目标属性标准差与总体样本的目标属性标准差的比例或差值小于某一阈值,或节点的样本数低于某一阈值27。建立初步的模型树之后,还需对树进行剪枝,即归并某些冗杂的子树并用叶子节点代替,从而提高模型树的效率与简洁程度,最后需要使用平滑方法对剪枝后叶子节点的不连续行进行补偿,具体需要参考叶子节点的父节点来使用平滑方法,将父节点与叶子节点重新拟合为一个新的线性方程28。目前,该模型已被广泛用于估计生物物理变量与碳通量中,如对叶面积指数29与净生态系统交换量等的估计28

研究采用有Kuhn 等30针对R语言开发的Cubist包进行建模,目前该程序包已经更新到0.2.3版本。Cubist在建模和预测时分别通过设置规则数(Committees)和实例数(Instances)进行优化,规则数指在树模型中需要使用的模型数量,取值范围为0~100,实例数表示在预测时需要参考来修正结果的样本数量,取值范围为0~9。然而,规则数越高不一定就代表模型的精度越高,也可能出现过拟合的情况。为避免这类情况发生,提高模型的稳定性和准确性,在训练模型前需要先进行参数优化,以最能精简模型的同时,有较高的模拟预测精度。模型拟合的精度由计算训练集中预测值和观测值的平均绝对误差(Mean Absolute Error, MAE),相对误差(Relative Error, RE),和相关系数R(Correlation Coefficient)来衡量。其计算方法如下:

MAE=1Ni=1Nyi-ŷi
RE=MAETMAEμ
R=Cov(Y,Ŷ)VAR(Y)VAR(Ŷ)

其中:N为数据总数;yi为观测值;ŷi为模型预测值;MAE T 为模型当前MAE;MAE μ 为预测平均值的MAE。

模型验证精度由计算测试集中预测值与观测值的决定系数R²(Coefficient of Determination),和均方根误差(Root Mean Squared Error,RMSE)来衡量。其计算方法如下:

R2=1-i=1Nyi-ŷi2i=1Nyi-y¯2
RMSE=1Ni=1Nyi-ŷi2

其中:N为数据总数;yi为观测值;ŷi为模型预测值;y¯为观测值的平均值。

4 结果与分析

4.1 基于Cubist回归树的预测模型

4.1.1 模型训练与拟合

Cubist回归树算法的树模型(即规则集)会被自动修剪或合并,因此可以不需要事先进行子集的划分。因此,研究直接通过样本数据对Cubist模型进行参数调优。由于本研究样本数量较大(样本量为万级),故采用常用于参数调优的经典方法十折交叉验证法31,该方法最大的优势在于能重复运用随机产生的子样本进行训练和验证。研究使用训练集数据,以十折交叉验证训练模型中规则数(Committees)和实例数(Neighbor)两个参数,训练结果如图2

图2

图2   规则数与实例数参数优化

Fig.2   Parameter optimization of Committees and Instances


其中,RMSE最小时规则数为100,实例数为9,其次规则数为10,实例数为9。在实际建模过程中,当规则数为100时模型拟合的时间与预测时间迅速增大,考虑到模型拟合与预测速度,选择规则数为10。在实际预测过程中。实例数为9或0的结果差别不大,因此在预测时的实例数选为0。

研究还考虑了样本数量大小对模型精度的影响,以及土地利用类型信息的影响。同时,为得到较大样本量,加入同时段蒙古区域数据,采用随机抽样,以样本量为10 000、50 000、87 000、139 200、174 000,并分考虑土地利用类型信息与不考虑土地利用类型信息两种情况分别建模,每一次建模都使用验证集所有数据进行验证。计算描述拟合精度的平均绝对误差(MAE)、相对误差(RE)、相关系数(R)、描述拟合精度的决定系数(R²)和均方根误差RMSE,结果如表1所示。

表1   模型拟合精度与验证精度统计

Table 1  model fitting accuracy and verification accuracy statistics

Land Use=TURE
FittingValidation
样本量MAERERR²RMSE
10 0000.0770.439 70.7900.632 70.104 7
50 0000.0770.435 60.7920.637 70.103 9
87 0000.0770.429 60.7970.639 40.103 7
139 2000.0760.428 90.7990.651 10.103 5
174 0000.0690.356 00.8170.662 10.097 0
Land Use=FALSE
FittingValidation
样本量MAERERR²RMSE
10 0000.0780.446 10.7810.616 80.106 9
50 0000.0780.439 50.7860.617 40.106 9
87 0000.0770.433 50.7910.621 50.106 3
139 2000.0770.432 10.7940.618 10.106 7
174 0000.0700.359 00.8130.641 60.100 1

新窗口打开| 下载CSV


表1能够明显看出,随着样本量的增大,模型拟合时的误差,即MAE和RE都在逐渐减小,R在逐渐增大,表示模型拟合的精度越来越好。验证精度中,R²与RMSE也均随着样本量的增大而变好,但由于RMSE始终较大,使得R²的提高有限。同时,有土地利用类型的结果均优于不使用土地利用类型的结果。最终选择用全部训练样本训练,使用土地利用类型信息建立的Cubist模型。

4.1.2 模型精度验证

使用测试集数据对训练好的Cubist模型进行验证,验证结果如图3

图3

图3   Cubist模型预测SIF与观测SIF验证

Fig.3   Verification of Cubist model prediction SIF and observation SIF


图3可得,R²为0.67,RMSE= 0.097,说明SIF预测值对SIF观测值有较好的拟合效果。通过与1∶1线的对比可得,整体上SIF预测值对SIF观测值有有一定的低估。均方根误差RMSE较大,为0.097 W·m-2·μm-1·sr-1

为进一步分析误差的分布,以0.05 W·m-2·μm-1·sr-1为步长,统计了每个阶段SIF观测值的数量(图4(a)),并计算每个阶段处的累积误差(图4(b))。可以看出SIF值主要分布在0~0.2 W·m-2·μm-1·sr-1中,累积误差显示了误差来源与SIF值的分布基本一致,由于SIF值的分布,其误差也主要集中在0~0.3 W·m-2·μm-1·sr-1内,这一结果与XIAO 等(2019)的全球SIF连续预测研究结果相同。但当SIF观测值超过0.5 W·m-2·μm-1·sr-1时的累积误差并未饱和,又呈现出增加的趋势。在观测值超过0.5 W·m-2·μm-1·sr-1后,才又逐渐趋于平缓。造成这一现象的原因可能是由于卫星获取SIF数据时,超过0.5 W·m-2·μm-1·sr-1的荧光值反演误差变大,同时,本研究仅针对于中国及蒙古国的区域而进行,样本的范围和数量较为局限,也可能在预测过程中导致累积的误差较大,使得模型的RMSE较大,R²较小。

图4

图4   误差统计(a)SIF观测值分布与(b)SIF观测值的累积误差

Fig.4   error statistics (a) distribution of SIF observations and (b) Accumulative Error of SIF observations


此外,根据土地利用类型对不同生态群落进行验证,将常绿针叶林,常绿阔叶林,落叶针叶林,落叶阔叶林,和混交林归为森林一类,多树草原,稀树草原,和草原归为草地类,作物类,以及永久湿地类,如图5,分别得到Cubist模型在预测不同生态群落中的精度。其中,Cubist回归树模型在对作物类图5(c)中的SIF模拟精度最高,R²为0.71,RMSE= 0.116 W·m-2·μm-1·sr-1。此外,模型在森林类图5(a)和草地类图5(b)的SIF模拟都具有较好的表现,R²分别为0.65和0.61,RMSE分别为:0.098 W·m-2·μm-1·sr-1和0.099 W·m-2·μm-1·sr-1。验证集中永久湿地类图5(d)的点较少,其验证结果也较差,R²为0.43,RMSE=0.162 W·m-2·μm-1·sr-1

图5

图5   不同生态群落中Cubist模型预测SIF与观测SIF验证

(SIF预料值(W · m-2 · μm-1 · sr-1))

Fig.5   Verification of Cubist model prediction SIF and observation SIF in different ecological communities


4.2 高分辨率连续日光诱导叶绿素荧光数据集

研究将每8 d的EVI,光合有效辐射(PAR),平均温度,饱和水汽压差(VPD)和土地利用类型逐像元对应,建立空间连续的预测数据集。采用在3.1.1中经样本训练好的Cubist回归树模型,预测每8 d的0.05°分辨率的连续SIF。图6以2018年7月4日至11日为例,展示了聚合到每8 d的1°分辨率OCO-2 SIF网格数据和本研究做出的由Cubist预测的连续SIF产品。可以看到Cubist模型预测的SIF具有较高的空间分辨率与连续性,能够用于进一步的科学研究,其中,中国-蒙古区域整体呈现出东部、南部较高,向西、向北逐渐降低的规律。

图6

图6   每8天聚合到1°SIF格网数据,Cubist模型预测SIF数据对比(以2018年7月4日~11日为例)

Fig.6   Aggregate to 1° SIF grid data every 8 days, cubist model forecast SIF data comparison (take July 4, 2018-july 11, 2018 as an example)


5 结语

本文主要研究了对OCO-2 SIF数据的连续预测方法,生成了每8 d 0.05°分辨率的SIF产品。预测连续SIF过程中,本研究基于Cubist回归树模型,结合由MODIS反射率数据计算所得,代表植被生长状况的EVI数据,代表气候条件的平均温度、PAR、VPD、以及土地利用类型数据进行回归树建模。通过调优参数选择Cubist回归树中规则数(Committees)为10进行模型拟合。考虑样本大小的变化对拟合结果的影响,结果发现在目前的样本数(17.4万)中,模型精度一直随样本数量的增加而增加,同时考虑土地利用类型信息对模型拟合的影响,结果表明使用土地利用类型的模型精度略高于不使用该因子的模型精度。最终,采用全部训练样本并加入土地利用类型因子进行建模,模型的验证精度较好,为R²=0.67,RMSE=0.097,表明加入的土地利用类型因子提供了更多信息。Cubist能够应用于大尺度及长时序的SIF数据重建中,然而对比于龙龙等23用卷积神经网络(Convolutional Neural Networks, CNN)对其小范围的感兴趣区域内OCO-2 SIF建模的验证精度不算很高,主要是由于在大尺度的重建中,会引入较多的噪声,可以通过像元植被覆盖度的大小对SIF数据进行进一步地筛选,提高算法精度。

该模型对不同生态群落(森林,草地,作物,永久湿地)的预测精度不同,其中,农田的验证精度最高,决定系数R²为0.71,主要是由于农田的景观较为一致,使得该模型能较准确地进行预测。此外,对林地、草地的验证结果也较好,R平方分别为0.65和0.61。研究表明,日光诱导叶绿素荧光(SIF)的值主要集分布在0~0.2 W·m-2·μm-1·sr-1,该模型预测的误差主要集中在SIF低于0.3 W·m-2·μm-1·sr-1时。本研究由Cubist模型预测出的更为精细的每8 d 0.05°分辨率SIF数据集,能够较好地表现植被变化的季节周期,描述植被生长状况。

参考文献

Zhang YGuanter LBerry J Aet al.

Model-based analysis of the relationship between Sun-Induced chlorophyll Fluorescence and gross primary production for remote sensing applications

[J]. Remote Sensing of Environment, 2016187145-155.

[本文引用: 1]

Albert P CEsa TJon Aet al.

Linking chlorophyll a fluorescence to photosynthesis for remote sensing applications: mechanisms and challenges

[J]. Journal of experimental botany, 20146515) : 4065-4095.

Frankenberg CBerry J.

Solar Induced chlorophyll Fluorescence: origins, relation to photosynthesis and retrieval

[J]. Comprehensive Remote Sensing, 20183143-162.

[本文引用: 1]

Meroni MRossini MGuanter Let al.

Remote sensing of Solar-Induced chlorophyll Fluorescence: Review of methods and applications

[J]. Remote Sensing of Environment, 200911310):2037-2051.

[本文引用: 1]

FrankenbergFisherJ Bet al.

New global observations of the terrestrial carbon cycle from GOSAT: Patterns of plant fluorescence with gross primary productivity

[J]. Geophysical Research Letters, 20113817): 351-365.

[本文引用: 2]

Guanter LFrankenberg CDudhia Aet al.

Retrieval and glo-bal assessment of terrestrial chlorophyll fluorescence from GOSAT space measurements

[J]. Remote Sensing of Environment, 2012121none):236-251.

Joiner JYoshida YVasilkov A Pet al.

Filling-in of far-red and near-Infrared solar lines by terrestrial and atmospheric effects: simulations and space-based observations from SCIAMACHY and GOSAT

[J]. Atmospheric Measurement Techniques Discussions, 201251):163-210.

[本文引用: 1]

Köhler PGuanter LJoiner J.

A linear method for the retrieval of Sun-Induced chlorophyll Fluorescence from GOME-2 and SCIAMACHY data

[J]. Atmospheric Measurement Techniques,862015-06-26), 2015, 8:2589-2608.

[本文引用: 1]

Ji MenghaoTang BohuiLi Zhaoliang.

Review of Solar-Induced chlorophyll Fluorescence retrieval methods from satellite data

[J]. Remote sensing Technology And Application,2019343):455-466.

[本文引用: 1]

纪梦豪唐伯惠李召良.

太阳诱导叶绿素荧光的卫星遥感反演方法研究进展

[J].遥感技术与应用,2019343):455-466.

[本文引用: 1]

Li XXiao JHe B.

Chlorophyll fluorescence observed by OCO-2 is strongly related to gross primary productivity estimated from flux towers in temperate forests

[J]. Remote Sensing of Environment, 2018204659-671.

[本文引用: 1]

Frankenberg CO'Dell CBerry Jet al.

Prospects for chlorophyll fluorescence remote sensing from the Orbiting Carbon Observatory-2

[J]. Remote Sensing of Environment, 20141471-12.

[本文引用: 1]

Duveiller GCescatti A.

Spatially downscaling Sun-Induced chlorophyll Fluorescence leads to an improved temporal correlation with gross primary productivity

[J]. Remote Sensing of Environment, 201618272-89.

[本文引用: 1]

Yu LWen JChang C Yet al.

High‐resolution global contiguous SIF of OCO‐2

[J]. Geophysical Research Letters, 2019461449-1458.

Bishop C M. Neural networks for pattern recognition[M]. OxfordOxford University Press1995.

[本文引用: 1]

Zhang YJoiner JAlemohammad S Het al.

A global spatially contiguous Solar-Induced Fluorescence (CSIF) dataset using neural networks

[J]. Biogeosciences, 20181519): 5779-5800.

[本文引用: 1]

Gentine PAlemohammad S H.

Reconstructed Solar-Induced Fluorescence: a machine learning vegetation product based on MODIS surface reflectance to reproduce GOME-2 solar-induced fluorescence

[J]. Geophysical Research Letters, 2018457): 3136-3146.

Duveiller GFilipponi FWalther Set al.

A spatially downscaled Sun-Induced Fluorescence global product for enhanced monitoring of vegetation productivity

[J]. Earth System Science Data, 2020122): 1101-1116.

Ma YLiu LChen Ret al.

Generation of a global spatially continuous TanSat Solar-Induced chlorophyll Fluorescence product by considering the impact of the solar radiation intensity

[J]. Remote Sensing, 20201213): 2167.

Huete ADidan KMiura Tet al.

Overview of the radiometric and biophysical performance of the MODIS vegetation indices

[J]. Remote Sensing of Environment, 2002831-2):195-213.

[本文引用: 2]

Zhengxing WChuang LAlfredo Het al.

From AVHRR-NDVI to MODIS-EVI: advances in vegetation index research

[J]. Acta Ecologica Sinica, 2003235):979-987.

[本文引用: 1]

王正兴刘闯Alfredo H.

植被指数研究进展:从AVHRR-NDVI到MODIS-EVI

[J]. 生态学报, 2003235):143-151.

[本文引用: 1]

Zhang C.

Using MODIS vegetation index to study urban expansion and change

[J]. Meteorological, 20063210):20-26.

[本文引用: 1]

张春桂.

用MODIS植被指数研究福州城区空间扩展变化

[J]. 气象, 20063210):20-26.

[本文引用: 1]

Ma Rui.

Research on enhanced vegetation index algorithm and its application in the ecological environmental remote sensing production subsystem

[D]. KaifengHenan University2015.

[本文引用: 1]

马瑞.

增强植被指数算法的研究及其在生态环境遥感产品生产分系统的应用

[D]. 开封河南大学2015.

[本文引用: 1]

Yu LonglongLuo ZeYan Baoping.

Reconstruction framework of high resolution sif remote sensing dataset in regions of interest

[J]. Computer Systems & Applications, 2019289):133-139.

[本文引用: 2]

于龙龙罗泽阎保平.

兴趣区域高分辨率叶绿素荧光遥感数据集重建框架

[J]. 计算机系统应用, 2019289):133-139.

[本文引用: 2]

Breiman L. Classification and regression trees[M]. New YorkChapman and Hall1984.

[本文引用: 1]

Ma Ziqiang.

Downscaling satellite-based precipitation estimates over the Oinghai-Tibetan Plateau at different temporal scales

[D]. HangzhouZhejiang University2017.

[本文引用: 1]

马自强.

青藏高原地区卫星降水数据时空降尺度研究

[D]. 杭州浙江大学2017.

[本文引用: 1]

Quinlan J R.

Simplifying decision trees

[J]. International Journal of Man-Machine Studies, 1987,273):221-234.

[本文引用: 1]

Dai SYingchun F UZhao Yet al.

The remote sensing model for estimating urban impervious surface percentage based on the cubist model tree

[J]. Journal of Geo-Information Science, 20161810):1399-1409.

[本文引用: 2]

戴舒 付迎春 赵耀龙.

基于Cubist模型树的城市不透水面百分比遥感估算模型

[J]. 地球信息科学学报, 20161810):1399-1409.

[本文引用: 2]

Zhuang X J.

Estimation of net ecosystem carbon exchange for the conterminous United States by combining MODIS and AmeriFlux data

[J]. Agricultural & Forest Meteorology Amsterdam Elsevier, 200814811):1827-1847.

[本文引用: 2]

Gao FAnderson M CKustas W Pet al.

Retrieving Leaf Area Index from Landsat using MODIS LAI products and field measurements

[J]. IEEE Geoscience & Remote Sensing Letters, 2014114):773-777.

[本文引用: 1]

Kuhn MWeston SKeefer C.

Cubist: rule- and instance-based regression modeling

http:∥ftp.ussg.ju.edu/CRAN/web/packages/cubist/,2014.

[本文引用: 1]

Kuhn MJohnson K. Applied Predictive Modeling[M]. New YorkSpringer2013.

[本文引用: 1]

/