中低分冬小麦分布提取模型效率的样本特征分析
1.
2.
3.
Influence Factors Analysis on Accuracies of Winter Wheat Distribution from Low and Medium Resolution Composited Remote Sensing Images
1.
2.
3.
通讯作者:
收稿日期: 2021-03-08 修回日期: 2022-05-25
基金资助: |
|
Received: 2021-03-08 Revised: 2022-05-25
作者简介 About authors
朱爽(1981-),女,甘肃金昌人,博士,副教授,主要从事资源与环境遥感方面的研究E⁃mail:
关键词:
Keywords:
本文引用格式
朱爽, 张锦水.
Zhu Shuang, Zhang JinShui.
1 引 言
低空间分辨率遥感影像(简称低分影像),如MODIS和NOAA,回访周期短,能在1 d内对地球表面进行观测,并可在一定时间窗口上进行数据合成,消除云和噪声的影响,得到无云的遥感影像[6-8]。时间序列影像能够定量地刻画出农作物在整个生长周期的物候特征[9-10],利用每一种作物在时间尺度上的特有时间序列特征来构建识别模型,提取出作物的分布[11-12]。相对于中高分辨率影像而言,具有丰富时间序列特征的低分影像能够一定程度上消除“异物同谱、同物异谱”的困扰,也能够解决作物生长关键期遥感影像缺失的问题[13],但由于空间分辨率低,混合像元现象严重[14],制约了作物分布的识别精度。一般采用混合像元分解来提取出作物的组分,可以在一定程度上消除混合像元的影响[3,11,15]。线性混合像元分解模型是常用的方法[12-13],其中端元选择的优劣是决定模型性能的关键[16],一般可以采用MNF变换从图像上选择出纯净的端元[17],但由于我国农业种植地区地块破碎,很难在低分影像(如MODIS影像为250 m分辨率)上选择出纯净的端元特征,这影响了利用时间序列的低分影像进行作物提取的能力[18]。
中低分辨率影像识别方法能够有效地进行作物识别,但中分影像对识别模型的影响仍需深入探讨。本研究以冬小麦为研究对象,利用从中分影像提取的冬小麦分布作为模型的样本目标量,结合时间序列数据为自变量,构建支撑向量回归模型(Support Vector Regression, SVR)实现混合像元分解,提取出冬小麦的空间分布,分析中分影像作为样本,其数量、质量对模型的影响,进而验证中低分作物识别模型的适用能力。
2 中低分影像复合的冬小麦提取模型
研究的目标是结合中、低分影像各自的优势,利用中分影像构建样本,训练支撑向量回归模型,构建非线性模型,实现低分时间序列影像的混合像元分解,进行冬小麦分布的识别。
对于一个低分像元,如MODIS,该像元内所包含的冬小麦面积(SMODIS)为:
其中:PMODIS表示某个MODIS像元内冬小麦所占比例;SMODIS_O为MODIS像元的面积(即250 m×250 m)。
首先,利用线性混合像元模型来解释像元的光谱特征与组分之间的关系:
其中:f为混合像元的反射率;
但是混合像元光谱特征一般不是简单的线性组合,可以采用非线性模型进行求解。SVR为设定最多有2ϵ偏差的隔离带,能够保证即使在小样本量的情况下也能得到较好的识别结果[21]。研究构建SVR模型进行冬小麦识别,其中因变量为混合像元的丰度,自变量为MODIS的时间序列特征。
为利用SVR混合像元分解进行冬小麦分布的提取,提出两个假设:
假设1:相对于低分影像而言,中分影像(以Landsat5 TM为例)提取出的冬小麦精度高,可以聚合到低分辨率尺度作为SVR回归的目标量。中分冬小麦结果聚合到低分尺度的规则如下:
其中:n为MODIS像元所对应TM的冬小麦像元数;STM、SM分别为TM与MODIS的像元分辨率。
假设2:以MODIS像元中的冬小麦面积丰度为目标量(K),其提取精度与样本量(n)、样本质量(q)密切相关:
3 实验设计
用中低分影像融合的SVR模型来提取冬小麦的流程主要包括:基于TM数据和MODIS时间序列数据分别提取各自冬小麦的分布范围;SVR模型训练样本构建;TM和MODIS共区、非共区区域划分;对冬小麦识别结果进行精度评价。
图1
3.1 研究区与数据
3.1.1 研究区概况
研究区位于北京市东南部,跨越北京、河北和天津,覆盖范围为116°5′13″~117°15′16″ E,39°25′25″~40°28′26″ N,见图2。属于中纬度暖湿带,是典型的温带大陆性季风气候。该地区北部为燕山山脉,大部区域为平原,属于黄淮海平原北部地区,北京市辖区位于西部。作为中国典型的农业区,该区域主要以冬小麦和玉米轮作方式为主。
图2
3.1.2 数据与预处理
实验利用两种空间分辨率的遥感影像:Landsat 5 TM和MODIS。用TM数据提取出的冬小麦分布结果作为目标量,然后结合MODIS数据的时间序列特征进行建模。
Landsat 5 TM数据采集时间为2006年4月7日,为图幅123/32的一个子区范围,图像质量完好,无云,所用波段包括蓝光(0.433~0.515 μm),绿光(0.525~0.600 μm),红光(0.630~0.680 μm)、近红外(0.845~0.885 μm)、短波红外1(1.560~1.660 μm)和短波红外2(2.100~2.300 μm)6个波段。从美国地质调查局USGS网站上下载的TM影像已经进行了几何精校正,本研究仅使用单期TM数据进行冬小麦提取,不再需要进行大气校正。TM的投影类型设定为Albers等积投影,第一条纬线为北纬25°,第二条纬线为北纬47°,中央经线为东经105°,椭球体为WGS84。通过判读图像可以看出,该地区地物类型主要包括冬小麦、裸地、林地、城镇和人工草地等,农业景观呈现规模连片和破碎分布并存的现象。相对于MDOIS数据(分辨率为250 m),TM影像分辨率(30 m)较高,能够有效地反映出冬小麦的分布,且属于冬小麦拔节期,同期作物少,可作为精确识别冬小麦的数据源。
研究采用时间序列MODIS 16 d合成的归一化植被指数(Normalized Difference Vegetation Index, NDVI)产品,时间跨度为2015年10月上旬至2016年6月下旬,覆盖了冬小麦的整个生长周期,利用SG滤波消除云和噪声的影响。投影与坐标系与TM保持一致。图3看出10月下旬、中旬和上旬合成显示,小麦被清晰显示出来,呈粉红色,这主要是10月下旬冬小麦已经出苗,冠层覆盖地面,而其他植被,如林地,正好处于叶绿素减少,叶子脱落,呈裸地状态,造成二者剧烈的时序遥感特征的反差。
图3
3.2 一致样本区的提取
为有效支撑SVR进行冬小麦提取,需要精确的冬小麦分布。在此引用冬小麦“一致性区域”概念,提取本研究中的冬小麦分布作为构建SVR的样本[22]。基本流程为,通过阈值设定从MODIS上提取出冬小麦的分布,利用机器学习的方法从TM影像上提取出冬小麦的分布,二者求取交集,得到冬小麦测量结果一致性区域,这样一定程度上消除不同传感器识别冬小麦的误差。定义模式如下:
其中:SMODIS为利用MODIS影像提取的冬小麦丰度值,FTM为利用TM影像提取出的冬小麦分布范围。当SMODIS=1且FTM≥50%的像元区为典型冬小麦一致区,C取值为1;当SMODIS=0且FTM<50%的区域为典型非冬小麦一致区域,C取值为0为。具体流程参见文献[22]。
3.3 试验区的划分
样本的代表性是SVR构建模型提取冬小麦分布的关键因素之一。从两个角度设计实验,构建SVR模型:一是从区域自身提取样本来训练SVR模型,该方法是常用的机器学习方法[23-25],保证了样本的代表性,定义该区为I区;二是利用已知区域提取样本构建的模型来直接推断另一个区域,即预测区域与样本区域完全独立,定义II区,目的就是验证SVR提取冬小麦的模型泛化能力,在没有任何样本下提取冬小麦的适用性。根据上述确定的规则,将整个研究区划分为两个部分:中空间分辨率影像样本区(简称中分样本区,I区)和非中空间分辨率影像样本区(简称非中分样本区,II区),分别对应于有样本支持和没有样本支持情形下的冬小麦提取,如图3所示。
3.4 SVR训练样本的选择
采用分层等比例抽样的策略,分层指标为250 m×250 m像元尺度内的冬小麦比例,以从“一致样本库”中有效提取出样本为目的。为验证样本数量对回归提取冬小麦精度的影响,在每一层按照抽样比例为0.1%、0.5%、0.8%、5%、10%、20%、30%、40%、50%、60%、70%、80%和90%的数量进行样本的选择,分析当样本量为多大规模时,冬小麦的识别精度就能够达到比较高且稳定的程度。
另外,考虑到用于回归的样本精度(即样本质量)会对回归结果产生一定的影响,因此在一致样本区混入了一定比例的误差,以模拟样本混入误差对SVR冬小麦提取结果的影响。在一致区内的像元样本内混入10%、20%、30%、40%、50%和60%的随机误差(TM的分类误差不能低于40%),也就是在一致区内选择出相应比例的样本量,将冬小麦丰度值f取反(即1-f)。
3.5 精度评价指标
将上述方法提取出的样本,输入到LibSVM中采用epsilon-SVR进行回归分析,构建SVR的冬小麦提取模型。本文选用了像元精度、区域精度来定量分析不同尺度下冬小麦的提取精度。
像元精度(Pixel Accuracy,PA),代表区域内像元级别的冬小麦识别精度。
其中:,
区域精度(Region Accuracy,RA),代表区域内用SVR提取冬小麦的面积精度,反应出区域数量精度。
其中:
4 结果分析
4.1 样本数量对SVR识别精度的影响
按照0.1%、0.5%、0.8%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%,进行5次抽样来训练SVR模型,得到I区内的冬小麦结果(见图4)。从识别结果可以看出,当样本量为0.1%时,非冬小麦区域明显有误差混入的情况;随着训练样本量的增加,误差混入现象逐渐消失,冬小麦被准确地识别出来。
图4
图4
不同样本下MODIS混合像元冬小麦测量结果丰度图
Fig.4
Wheat fractional map generated from MODIS mixed pixel unmixing with various amount of sample data
为全面分析不同情况下SVR冬小麦识别精度,将一致性区域分为两个部分:典型冬小麦区和典型非冬小麦区。
下面分别对全区、典型冬小麦区和典型非冬小麦区进行分析。
4.1.1 全区精度评价
从图5可以看出,随着样本量的增加,MODIS提取出的冬小麦区域精度、像元精度的最大值、最小值和平均值都不断提高。RA和PA的最大值和最小值之间的差值逐渐缩小,呈收缩喇叭口状。在样本量达到10%时,像元精度和区域精度达到最高,趋于平稳状态。可知在一致样本区内提取10%的样本量就可以满足SVR混合像元分解的要求,能够保证区域精度和像元精度的较高一致性(PA达到92%以上,RA达到98%以上)。
图5
图5
全区不同样本量下SVR提取出的冬小麦精度
Fig.5
Wheat accuracy based on SVR with various amount of sample data
4.1.2 典型冬小麦区域精度评价
典型冬小麦区的区域精度、像元精度的结果如图6所示。与全区区域精度、像元精度的规律相似,区域精度、像元精度随着样本量的增加而提高。当样本量达到10%时,两个精度指标已经比较稳定,像元精度达到92%以上,区域精度达到99%以上。可见在典型冬小麦区SVR能够准确提取出冬小麦分布。
图6
图6
典型冬小麦区区域精度和像元精度
Fig.6
Regional and pixel accuracy within representative wheat areas
4.1.3 典型非冬小麦精度评价
典型非冬小麦区域的冬小麦面积为0,因此该区域只需要用像元精度一个指标即可,计算方式是将SVR所提取的非冬小麦丰度代入
图7
上述研究表明,当样本量达到10%以后,PA和OA均比较高且稳定,因此选择某一次10%样本量下的SVR冬小麦提取结果进一步分析。从MODIS和TM冬小麦、非冬小麦的一致区分层随机选择10%的样本,制作散点图、误差直方图和累积误差直方图,分析估计结果和检验样本之间的关系。
图8展示的是5次10%样本量抽样下识别结果和检验样本之间的关系。从这5次结果可以看出,SVR识别冬小麦结果与检验样本的结果非常接近,集中分布在1∶1线两侧,确保了区域面积精度的准确性。
图8
图8
5次10%样本量抽样下TM与MODIS冬小麦测量结果的散点图
Fig.8
The scatter dot diagram calculated between TM and MODIS with 10% sample
图9
图9
10%样本量下5次结果的误差直方图
Fig.9
Error histograms of five experiments with 10% sample
图10
图10
10%样本量下5次结果的误差累积直方图
Fig.10
Accumulated error histograms of five experiments with 10% sample
4.2 样本质量对SVR提取冬小麦的影响
一致区内的样本精度直接影响SVR模型提取冬小麦的能力。下面将一致区内混入一定的误差,分析样本质量对结果的影响。对一致区内的像元混入一定的误差后,分层随机5次抽选出10%样本量构建SVR冬小麦提取模型。
图11是某一次冬小麦的提取结果。当混入10%~40%误差量时,对SVR分解提取的冬小麦分布影响不大,冬小麦的分布比较一致且稳定;当误差量达到50%时,山区的绿色植被、水体等被误分解成冬小麦。可见,输入样本的质量对SVR分解模型有一定影响。
图11
图11
不同误差量下MODIS冬小麦混合结果
Fig.11
MODIS based wheat results with different error fraction
从图12可以看出,RA、PA随着误差量的增加而降低。当误差控制在10%~40%范围内,精度降低较慢,区域精度和像元精度分别在89%、86%以上。当误差量超过50%,区域精度、像元精度发生陡变,精度明显下降,原因是混入误差过多,识别过程将非冬小麦像元分解成冬小麦像元,而冬小麦像元被分解成非冬小麦像元。TM提取冬小麦精度相比MODIS而言能够保证高于50%,且TM提取样本精度越高则SVR提取冬小麦的精度越高。
图 12
4.3 SVR识别冬小麦的泛化能力分析
大区域范围内采用冬小麦信息提取时,经常会出现自身区域缺乏样本来支撑训练SVR模型的情况,因此利用其他区域已形成的SVR模型来推断该区域冬小麦分布是一种常用的策略。分别利用中分样本区0.1%、0.5%、0.8%、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%以及90%抽样样本量下形成的SVR模型对非中分样本区进行冬小麦提取。
图13是非TM样本区的冬小麦提取结果。目视来看,0.1%的样本量下,山区和城区误差混入情况严重;当样本量为0.5%和0.8%时,冬小麦的分布比较明显,但山区的误差混入情况仍比较严重;当样本量高于1%时,冬小麦的分布较为准确且稳定。
图 13
图14表明,非样本区(II区)混合像元分解精度随着输入样本量的增加而上升。在样本量为[0.1%,20%]范围内,RA和PA一直呈上升趋势。在II区,当样本量达到20%后,RA和PA趋于稳定,分别在97%,92%以上,样本量要高于I区SVR提取冬小麦达到比较高精度所需样本量,究其原因是从自身区域选取样本的代表性会更强。
图14
图14
非TM样本区SVR冬小麦识别精度随样本量的变化
Fig.14
The change of SVR based wheat accuracy accompanying with sample increment
5 结 语
本文从样本数量和质量两个角度,分析了对中低分辨率影像复合提取冬小麦识别效率的影响,分别在中分样本区和非中分样本区两个区域进行验证,得到如下结论:
(1)在中分样本区内,冬小麦提取的区域精度和像元精度随着用于SVR模型训练的样本量逐步增多而提高。当样本量超过10%时,全区区域精度和像元精度稳定在98%、93%以上,典型冬小麦区的区域精度和像元精度达到98%、92%以上,非典型冬小麦区的区域精度和像元精度接近且都达到96%以上。说明SVR能够准确地提取出冬小麦的分布,错入、错出现象较少。因此,10%的样本量就可以进行MODIS冬小麦的混合像元分解,准确地提取出冬小麦面积。
(2)SVR冬小麦提取结果的精度与样本质量之间具有相关性。样本质量越高,冬小麦提取结果的精度就会越高。在5次10%抽样样本的情况下,当混入误差在10%~40%时,提取的冬小麦区域精度、像元精度平均值分别在89%、86%以上;当样本混入误差为50%~60%时,区域精度和像元精度陡然降低,都低于50%。可见,SVR分解对于样本的准确性有一定要求,当输入样本精度高于60%时可以获得较好的识别结果。
(3)基于中分样本区训练的SVR模型可以成功迁移到非中分样本区进行冬小麦的提取,具有较强的空间泛化性能力。与中分样本区的实验相同,非中分样本区提取的冬小麦区域精度、像元精度随着输入样本数量的增加而提高,在20%样本量下,区域精度和像元精度达到稳定,且精度分别在97%和92%以上。
在一定样本数量、质量的前提下,利用SVR方法能够有效地提取出冬小麦的分布。这种方法弥补了从低分影像上难以获取有效样本的不足,验证了将模型迁移进行冬小麦提取的有效性。在后续的研究中,需要深入探讨SVR模型参数对提取结果的影响并验证该方法在更大范围和对其他作物提取的适用性。另外,模型迁移学习需要设置迁移网络层、学习效率和方式,还需要注意不同农业景观对迁移学习的影响,这些问题都有待深入研究。
参考文献
Cropland distributions from temporal unmixing of MODIS data
[J].
Mapping cropland distributions using a hard and soft classification model
[J].
Review and prospect of land cover mapping by remote sensing
[J].
土地覆盖遥感制图方法研究现状与展望
[J].
Method of winter wheat planting area estimation based on support vector machine and post-classification changed vector analysis
[J].
支持向量机与分类后验概率空间变化向量分析法相结合的冬小麦种植面积测量方法
[J].
Consistency study between MODIS and TM on winter wheat plant area monitoring a case in small area
[J].
MODIS与TM冬小麦种植面积遥感测量一致性研究——小区域实验研究
[J].
Extraction of planting areas of main crops based on sparse representation of time-series leaf area index
[J].
基于时间序列叶面积指数稀疏表示的作物种植区域提取
[J].
An automatic cloud detection method for high resolution satellite images
[J].
一种高分辨率卫星影像自动云检测方法
[J].
Using a time series of satellite imagery to dete-ct land use and land cover changes in the Atlanta, Georgia me-tropolitan area
[J].
Evaluation of deep learning algorithm for crop identification based on GF-6 time series images
[J].
基于GF-6时序数据的农作物识别深度学习算法评估
[J].
Winter wheat mapping by soft and hard land use/cover change detection
[J].
通过软硬变化检测识别冬小麦
[J].
Prediction of crop yield using phenological information extracted from remote sensing vegetation index
[J].
Impact of spatial and temporal scales of remote sensing data on the spatiotemporal change in geographic elements
[J].
遥感数据时空尺度对地理要素时空变化分析的影响
[J].
Fusion of Spatiotemporal remote sensing data for changing surface characteristics
[J].
面向地表特征变化区域的时空遥感数据融合方法研究
[J].
Improving discrimination of savanna tree species through a multiple-endmember spectral angle mapper approach: Canopy-level analysis
[J].
Citrus recognition methods of hyperspectral remote sensing image based on spectral unmixing model
[J].
基于混合像元分解的高光谱影像柑橘识别方法
[J].
Land cover extraction in the Ejina Oasis by hyperspectral remote sensing
[J].
基于航空高光谱影像的额济纳绿洲土地覆被提取
[J].
Crop identification based on MODIS NDVI time-series data and phenological characteristics
[J].
基于MODIS时间序列及物候特征的农作物分类
[J].
Winter wheat area estimation from MODIS-EVI time series data using the crop proportion phenology index
[J].
The use of remote sensing to derive maize sowing dates for large-scale crop yield simulations
[J].
HJ-1 remotely sensed data and sampling method for wheat area estimation
[J].
HJ-1号卫星数据与统计抽样相结合的冬小麦区域面积估算
[J].
Medium resolution remote sensing-based winter wheat mapping corrected by low-resolution time series remote sensing images
[J].
时间序列低分影像修正中分遥感冬小麦分布
[J].
Comparative Study on remote sensing invertion methods for estimating winter wheat leaf area index
[J].
冬小麦叶面积指数遥感反演方法比较研究
[J].
Remote sen-sing inversion of leaf area index based on support vector machine regression in winter wheat
[J].
基于支持向量机回归的冬小麦叶面积指数遥感反演
[J].
/
〈 |
|
〉 |
