基于SVM的高分时序冬小麦种植区提取研究
1.
2.
Study on Extraction of Winter Wheat Planting Area based on SVM
1.
2.
通讯作者:
收稿日期: 2019-01-16 修回日期: 2021-04-21
基金资助: |
|
Received: 2019-01-16 Revised: 2021-04-21
作者简介 About authors
关士英(1992-),男,河南荥阳人,硕士研究生,主要从事农业遥感研究E⁃mail:
关键词:
Keywords:
本文引用格式
关士英, 谢传节, 袁占良, 刘高焕.
Guan Shiying, Xie Chuanjie, Yuan Zhanliang, Liu Gaohuan.
1 引 言
目前,国内外学者从遥感数据和分类方法等层面进行了大量研究[3]。Landsat数据由于受云雨天气影响,构建时序数据的难度较大,MODIS数据虽然能够满足构建时序数据的要求,但其空间分辨率不高[4-5]。而国产GF1-wfv数据可以同时满足对时间和空间分辨率的要求[6]。王利民等[7]通过研究不同空间尺度下冬小麦作物面积提取精度的变化情况,认为GF-1数据可为农情遥感监测提供可靠的数据源,有助于解决以往高分辨率卫星数据存在的覆盖不全、重访周期长等问题导致的无法进行大尺度运用的问题。杨闫君等[8]利用GF-1卫星 16 m 宽覆盖(wide field of view,WFV)影像,构建16m分辨率NDVI时间序列,比较不同分类方法的分类精度。刘国栋等[9]根据MPPS(Multivariate Probability Proportional to Size)抽样方法进行农作物种植面积的推断,表明GF-1卫星数据完全可应用于县级农作物种植面积提取。宋盼盼等[10]基于时间序列GF-1数据,拟合光谱和植被指数时间序列特征曲线,对中晚稻进行识别,精度分别可达95.57%和95.95%。黄健熙等[11]通过GF-1影像建立多特征数据集,基于CART算法构建决策树分别提取研究区内的水稻和玉米,分类总体精度达到96.15%。综上所述,在作物提取中,通过利用高分一号数据,解决了部分之前中低分辨率数据存在空间分辨率不高导致的混合像元问题的问题。然而这些研究在农作物提取过程中还主要使用NDVI,对EVI关注较少,而EVI改善了土壤及大气影响,提高了其对地物的敏感性[12]。另外由于数据量及物候等因素影响,研究区还是基于较小区域。因此本文研究主要有两个目的:一是分别使用NDVI、EVI数据进行提取,比较两种指数对提取精度的影响。二是通过主成分变换减少时序数据维数,研究其对提取精度影响及可行性,为大范围作物提取提供方法支持[13-14]。
2 研究区域与数据
2.1 研究区概况
研究区位于河南省商丘市,如图1所示。地理坐标为33°44′~34°52′ N、114°49'~116°39' E。全市总面积为10 704 km2,全市根据地貌成因以及形态类型的特征,可分为三大类型区,即黄河冲积平原、淮河冲积平原、剥蚀残丘,黄河冲积平原区为主要类型区。商丘地处暖温带半温润大陆性季风气候区,平均每年日照时数可达1 944 h,年平均气温达到14.2℃,无霜期约211 d,年平均降水量623 mm。全市冬小麦种植面积大,夏季玉米居多,大豆、红薯少量种植。地理位置适中,在河南省冬小麦产量中占比高,具有一定的示范性与代表性。
图1
2.2 影像数据
高分一号(GF-1)卫星在2013年4月26日成功发射,搭载的包括有4台16m分辨率多光谱相机,包括蓝(0.45~0.52 µm)、绿(0.52~0.59 µm)、红(0.63~0.69 µm)、近红外(0.77~0.89 µm)4 个波段,组合后可达800 km的幅宽,重访周期2 d,其空间及时间分辨率都比较高。在综合考虑获取性、云量、时相等因素影响下,以20天左右为间隔,获取自2016年10月至2017年6月质量较好的GF-1/WFV影像共12景,如表1所示。
表1 GF-1影像列表
Table1
时相数 | 影像日期 | 云覆盖度 |
---|---|---|
1 | 20161003 | 2% |
2 | 20161104 | 无云 |
3 | 20161207 | 无云 |
4 | 20161231 | 无云 |
5 | 20170121 | 无云 |
6 | 20170210 | 无云 |
7 | 20170227 | 3% |
8 | 20170410 | 4% |
9 | 20170418 | 1% |
10 | 20170512 | 1% |
11 | 20170528 | 无云 |
12 | 20170609 | 2% |
2.3 调查数据
表2 冬小麦生育期
Table2
日期 | 冬小麦 |
---|---|
10月上旬 | 播种出苗 |
12月下旬 | 分蘖 |
1月中下旬 | 越冬 |
2月下旬 | 返青 |
3月下旬 | 拔节 |
4月中旬 | 抽穗 |
6月中旬 | 成熟 |
3 研究方法
3.1 研究技术路线图
本文利用高分一号数据,在数据预处理的基础上,分别计算NDVI和EVI,构建植被指数时序,同时通过样本分离度选择一景关键期影像,为了试验减少数据量对提取精度的影像,对植被指数时序和关键期影像数据进行了主成分变换,构建特征数据集,采用支持向量机的方法分别对不同的特征组合进行了提取,比较不同特征量的提取精度,以及主成分分析对提取的影像。
图2
3.2 数据预处理及指数计算
3.2.1 数据预处理
数据预处理主要是对影像进行辐射定标、大气校正和几何校正等处理。首先通过利用影像自带的RPC(Rational Polynomial Coefficient)文件进行了几何粗校正,在粗校正基础上通过定标文件进行辐射定标,将影像的DN值转换为辐射亮度值。继而通过采用FLAASH模型进行大气校正,最后借助同时期Landsat影像为基准对数据进行几何精校正,保证精度控制在合理范围内。
3.2.2 指数计算
3.3 时序数据平滑及分析
图3
图3
滤波前后的冬小麦GF-1时序曲线对比
Fig.3
Comparison of winter wheat GF-1 time series curves before and after filtration
根据冬小麦的物候期特征及NDVI时序数据曲线,冬小麦在9月下旬至10月上旬播种,此时主要表现为土壤背景信息,之后一周左右出苗,指数曲线逐渐升高。12月上旬小麦处于分蘖期,叶绿素含量较高,第一个曲线波峰出现。越冬期在次年1月上旬到3月上旬之间,在此期间冬小麦的叶绿素降低,光合作用减弱,基本处于冬眠状态,曲线处于下降趋势。3月天气回暖,冬小麦开始返青,曲线逐渐上升;至4月小麦进入拔节期,生长速度加快,曲线上升速度加快;4月至5月上旬曲线达到最大值,小麦进入抽穗期。之后随着小麦的成熟及收割,曲线迅速下降。EVI时序曲线则很好地反映出在播种至分蘖期植被覆盖与裸土变化,随着小麦的生长土地覆盖度的增加,EVI呈逐渐升高趋势。
3.4 关键期影像选择
影像光谱信息是遥感分类过程中的一个重要特征,因此本文需要从12景影像中选择出一景对分类帮助最大的影像。为了评定不同影像的数据质量及对不同地物的可区分度,这里通过对12景影像分别计算其样本的可分离度来选择关键期影像。结果如图4所示,从图中可以看出冬小麦在越冬期内的分离度普遍较好,较为符合人们的认识规律,在越冬期大部分绿色植被皆处于落叶期,与冬小麦形成较为明显的差异,对光谱的反射与吸收区分度较大,为冬小麦与其他植被的分类提供可能。另图中3月开始冬小麦与其他植被的分离度呈逐渐下降趋势,较为符合植被生长规律,冬小麦返青与其他绿色植被出芽生长较为同步。同时发现返青期及以后数据的分离度普遍低于越冬期数据,分析认为应该是受云的影响。综合以上判断,应该在越冬期内选择一景影像,比较几景影像的数据,并考虑本文的目的,选择其中冬小麦分布与其他植被、人工地物分离度最高的20170210期数据,作物关键期影像参与的分类。
图4
3.5 主成分分析及相关性
首先对关键期影像及其主成分进行相关性分析,结果如表3所示,第一主成分与各个波段的相关性都在0.96以上,说明其与各波段的信息量高度重合,而第二、三主成分与各波段的相关性较低,因此可以使用第一主成分代替原始影像参与分类。
表3 关键生育期影像相关系数
Table 3
PC1 | PC2 | PC3 | Band 1 | Band 2 | Band 3 | Band 4 | |
---|---|---|---|---|---|---|---|
Band 1 | 0.978 217 | 0.201 506 | -0.040 56 | 1 | |||
Band 2 | 0.983 823 | 0.170 595 | 0.054 288 | 0.994 754 | 1 | ||
Band 3 | 0.966 328 | 0.248 691 | -0.024 457 | 0.994 603 | 0.991 398 | 1 | |
Band 4 | 0.975 634 | -0.219 382 | -0.002 544 | 0.910 225 | 0.922 276 | 0.888399 | 1 |
NDVI及EVI时序数据进行主成分分析后,各自进行相关性分析,结果如图5所示,从图5(a)中可看出NDVI的第一主成分与8到12波段的相关性较高,主要反映了第8到第12幅影像的NDVI信息,代表了冬小麦返青后的变化。第二主成分则与前7波段相关性高,反映了冬小麦从播种至返青的信息变化情况。而第三波段的相关性分布与NDVI的变化有一定的相似性,主要与关键物候期的影像有较好的相关性,但是相关系数不高。从图5(b)中可看出EVI第一主成分的相关性分布明显与时序曲线变化趋势相一致,将作物的关键生育期影像信息很好地反映出来。由于EVI引入了1个反馈项来订正土壤和大气对NDVI的影响,从这里也可以反映出来,首先是在越冬期由于其他植被凋零造成土地裸露及冬小麦植被指数的降低,都会影响到对生物量的敏感度,而这里第二主成分很好地反映了冬小麦越冬期的信息,第三主成分则是与播种期有很好的相关性,且与第一景影像的相关性明显高于NDVI,较好地体现出EVI用于提取的优越性。
图5
同时对不同特征量进行相关性分析,结果如表4所示,各特征量间的相关性都处于较低水平,代表着他们所反映的信息之间重合度较小,避免了数据冗余,提高提取的效率。
表4 各特征量相关系数
Table 4
影像主成分 | EVI PC1 | EVI PC2 | EVI PC3 | NDVI PC1 | NDVI PC2 | NDVI PC3 | |
---|---|---|---|---|---|---|---|
影像主成分 | 1 | ||||||
EVI PC1 | -0.710 915 | 1 | |||||
EVI PC2 | 0.110 574 | 0.000 123 | 1 | ||||
EVI PC3 | 0.219 756 | -0.000 131 | -0.000 067 | 1 | |||
NDVI PC1 | 0.007 86 | -0.008 393 | 0.000 681 | -0.000 22 | 1 | ||
NDVI PC2 | -0.002 558 | 0.000 778 | -0.000 445 | -0.001 032 | -0.000 015 | 1 | |
NDVI PC3 | 0.002 628 | -0.001 14 | 0.001 044 | 0.001 34 | 0.000 021 | -0.000 029 | 1 |
因此,选择关键期原始影像第一主成分,NDVI、EVI时序数据以及时序数据进行主成分变换后的第1、2、3主成分变换分量作为特征变量,构建不同组合特征变量集,用于冬小麦提取。
3.6 冬小麦提取方法
研究采用支持向量机的方法进行冬小麦的提取工作,它是一种建立在统计学习理论基础上的机器学习方法。基本思想是在样本空间线性可分时,只需在样本空间中寻找不同类别样本的最优分类面,在样本空间线性不可分时,引入松弛变量,通过非线性映射把低维输入的样本空间映射到高维的属性空间中,使样本在髙维空间中线性可分,既而采用线性算法对样本进行分析,并在髙维特征空间中寻找最优分类超平面;另外,SVM方法是利用结构风险最小化原理构造属性空间的最优分类超平面,得到全局最优的分类器,最后使整个样本空间的预期风险概率满足一定的上界[22]。研究使用台湾大学林智仁教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包LibSVM。LibSVM为用户自主实现髙级的参数优化,这里选择RBF核函数,c、g参数分别为1.2、2.8。在提取过程中为比较不同特征量主成分变换前后精度变化,以及不同特征量的加入对提取精度的影响,首先分别对关键期影像、NDVI时序、EVI时序及它们主成分变换后的数据进行提取,然后又将个特征量互相组合比较不同组合精度,寻找最优组合。
4 结果与讨论
4.1 不同特征量组合的分类精度分析
在利用SVM提取时,首先将结合调查数据和从Google earth目视解译获得的样本数据随机分为训练样本和验证样本,然后将待分类不同组合特征变量数据集与训练样本输入支持向量机分类器中,得到提取结果。不同特征量通过主成分变换前后的差异较大,为评价其对分类精度的影响和贡献度,利用不同特征组合分别进行分类提取,得到各自的提取精度如表5。从表5可看出,在各种特征量组合中,EVI、影像主成分是冬小麦提取的最佳组合,其总体提取精度在所有组合中达到最高,制图精度为99.18%,用户精度为98.60%。在EVI与NDVI两种指数中,EVI比NDVI更适合冬小麦的提取,其在各组合中精度明显高于NDVI。另通过加入关键期影像主成分变换分量,发现其对冬小麦提取精度提升有较大贡献,在NDVI与EVI时序数据加入主成分变换分量后,提取精度分别提升5%和4%左右。
表5 分类精度
Table 5
类别 | 制图精度/% | 用户精度/% | Kappa系数 | 总体精度/% |
---|---|---|---|---|
NDVI | 92.89 | 89.4 | 0.658 4 | 88.172 4 |
EVI | 96.29 | 99.77 | 0.789 1 | 93.980 5 |
影像主成分 | 96.51 | 95.31 | 0.811 5 | 91.653 7 |
NDVI主成分 | 91.24 | 85.44 | 0.763 8 | 87.493 1 |
EVI主成分 | 95.96 | 96.54 | 0.783 7 | 91.486 1 |
NDVI+影像主成分 | 98.91 | 98.44 | 0.786 7 | 93.766 3 |
EVI+影像主成分 | 99.18 | 98.6 | 0.920 2 | 97.678 1 |
NDVI主成分+影像主成分 | 98.82 | 98.45 | 0.782 4 | 93.627 3 |
EVI主成分+影像主成分 | 98.67 | 98.48 | 0.802 7 | 94.205 1 |
NDVI主成分+EVI主成分+影像主成分 | 98.69 | 98.48 | 0.800 6 | 94.143 3 |
在提取过程中,随着不同特征量的加入,特征数据集的数据量不断增加,对提取的效率造成较大影响。为了降低特征数据维数,对时序数据进行主成分变换,分别采用变换后的第1、2、3主成分进行冬小麦提取,发现数据压缩对提取精度影响不大,NDVI变换前后提取精度基本一致,EVI变换前后的提取精度稍有下降,但是在加入关键期影像主成分数据后,各组合的提取精度俱有较大提升,NDVI主成分+影像主成分组合提取精度达到93.62%左右,较单独使用NDVI主成分精度提升将近6%。EVI主成分+影像主成分组合提取精度虽然没有达到EVI+影像主成分组合精度,可是仍达到了94.205 1%,较EVI主成分有了3%的提升,总体提取效果较好,基本达到压缩数据量不损失数据信息的目的。最后同时加入3种特征量,精度并未有明显提高,说明最优特征组合不一定是最多特征量组合,过多特征量反而造成信息的冗余重复,影响提取的效率。
4.2 分类结果分析
其部分提取结果如图6所示。从结果可看出4幅图像的冬小麦总体分布范围大致相同,比较两个不同植被指数分类结果如图7,EVI总体要好于NDVI,EVI分类结果边界较为清晰,尤其是试验区东南部地区,两者的差距较为明显,NDVI结果较多的将居民地分为小麦。另外,EVI对土壤和大气的改进效果较为明显,在EVI分类结果中,能较好地区分人工地物与其他植被,未出现将大片地类划入其他植被现象。从主成分分析角度看,各植被指数主成分分类结果较原数据分类结果也并未表现出较大差异,其中NDVI主成分分析前后结果较为一致,未出现大的变化,EVI主成分分析分类结果与原数据总体还是较为一致的,只是在人工地物分类上存在少量变化,但总体效果较NDVI分类结果还是有所提升。可以判断出主成分分析对冬小麦提取并未造成较大影响。
图6
图7
本研究利用确定的106块共计45 350个像元验证样本对结果进行精度验证。如表6所示,在所有验证样本点中,被正确分类的样本点有44 297个像元,总体样本精度为97.678 1%,Kappa系数为0.920 2。冬小麦验证样本点37 650个像元,被正确分类的像元有37 340个,其样本点是最多的,分类精度也是最高。人工地物验证样本点5 309个像元,被正确分类的有4 728个,被错分的主要原因是在农村地区农田和房舍交错分布且分布零散,容易造成混合像元,另外农舍房前屋后有种植树木的习惯,在树木的遮挡下,对分类也造成一定影响。其他植被共计2 391个验证像元,正确分类了2 229个,由于其样本点较少,没有充足的训练样本,造成分类精度较低。另外,本研究还存在一些不足之处,需要在以后研究中加以改进。首先是此次实验中只提取冬小麦一种作物,在提取过程中由于相近生育期作物以及在冬小麦覆盖度低的区域易错分或漏分,对提取精度造成影响,因此下一步应对多种作物同时提取,提高作物的可分性。其次是对时序数据平滑处理,应当考虑多种平滑方法,以取得较好平滑效果。最后,目前高分数据受云等影响,高质量影像数据时间序列不连续,给提取精度带来一定影响,后续应关注高分与MODIS数据融合方法的研究。
表6 混淆矩阵结果
Table 6
地块分类 | 人工地物 | 其他植被 | 冬小麦 | 合计 | 用户精度 |
---|---|---|---|---|---|
人工地物 | 4 728 | 52 | 242 | 5 022 | 94.15% |
其他植被 | 161 | 2 229 | 68 | 2 458 | 90.68% |
冬小麦 | 420 | 110 | 37 340 | 37 870 | 98.60% |
像元合计 | 5 309 | 2 391 | 37 650 | 45 350 | / |
制图精度 | 89.06% | 93.22% | 99.18% | / | / |
5 结 论
本文以冬小麦生育期内高分一号数据为数据源,以河南省商丘市为研究区域,利用不同特征量组合,通过支持向量机的方法,提取了2017年冬小麦的空间分布信息,得到以下结论:
(1)在两种植被指数中,EVI较NDVI更适合于冬小麦种植面积提取,其在各组合中的提取精度均高于NDVI组合。
(2)通过在植被指数的基础上,加入关键期影像主成分变换分量,发现各组合提取精度均有明显提高,证明关键物候期原始影像信息对冬小麦提取有较大贡献。
(3)比较主成分变换前后不同特征量组合提取精度发现,数据降维后,数据信息并未有明显损失,不同特征量组合的提取精度未见显著下降。满足了压缩数据量,保持提取精度的要求,具有大数据量大区域作物提取潜力。
参考文献
Mapping corn and soybean cropped area with GF-1 WFV data
[J].
基于GF-1 WFV 数据的玉米与大豆种植面积提取方法
[J].
Study on cultivated land change and comprehensive grain production capacity
[D].
耕地变化与粮食综合生产能力研究
[D].
Review of overseas crop monitoring systems with remote sensing
[J].
国外农情遥感监测系统现状与启示
[J].
Fractal of land cover in Kaifeng City based on RS and GIS
[J].
基于RS和GIS的开封市土地覆盖分形
[J].
Land utilization mapping in Guangdong Province based on integration of optical and SAR remote sensing data
[J].
基于多源遥感信息融合的广东省土地利用分类方法:以雷州半岛为例
[J].
Review of Gaofen satellite image monitoring rice planting area
[J].
高分一号卫星影像监测水稻种植面积研究综述
[J].
Relationship between accuracy of winter wheat area remote sensing identification and spatial resolution
[J].
冬小麦面积遥感识别精度与空间分辨率关系
[J].
Crop classification based on GF-1/WFV NDVI time series
[J].
基于GF-1/WFVNDVI时间序列数据的作物分类
[J].
Investigationmethod for crop area using remote sensing samplingbased on GF- 1Satellite data
[J].
基于GF-1卫星数据的农作物种植面积遥感抽样调查方法
[J].
Research on the method of rice remote sensing identification based on spectral time-series fittingin southern China
[J].
基于光谱时间序列拟合的中国南方水稻遥感识别方法研究
[J].
Extration method of crop planted area based on GF-1 WFV image
[J].
基于GF-1 WFV影像的作物面积提取方法研究
[J].
A feedback based modification of the NDVI to minimize canopy background and atmospheric noise
[J].
Application and research of multi-band remote sensing images in land use
[D].
多波段遥感图像在土地利用中的应用研究
[D].
Research on extraction of high-resolution time series winter wheat based on multi-features
[J].
基于多特征的高分时序冬小麦提取研究
[J].
Monitoring of phenology by reconstructing LAI time series data for winter wheat
[J].
基于LAI 时间序列重构数据的冬小麦物候监测
[J].
Monitoring vegetation systems in the Great Plains with ERTS
[J]∥
A methodology for retrieving cropping index from NDVI profile
[J].
复种指数遥感监测方法
[J].
A global 1 by 1 degree NDVI data set for climate studies derived from the GIMMS continental NDVI data
[J].
Monitoring of crop phenology with remote sensing and dynamic change analysis
[D].
基于遥感技术的作物物候监测方法及动态变化分析研究
[D].
Multivariate data analysis
[J].
多元数据分析
[J].
Study on dynamic changes of the oasis soil salini-zation in the lower reaches of Kaidu river basin,Xinjiang ba-sed on RS and GIS
[D].
/
〈 |
|
〉 |
