遥感技术与应用, 2020, 35(5): 1089-1098 doi: 10.11873/j.issn.1004-0323.2020.5.1089

遥感应用

基于客观阈值与随机森林Gini指标的水体遥感指数对比

王一帆,1,2, 徐涵秋,1,2

1.福州大学 环境与资源学院 空间数据挖掘与信息共享教育部重点实验室,福建 福州 350116

2.福州大学 遥感信息工程研究所 福建省水土流失遥感监测评价重点实验室,福建 福州 350116

Comparison of Remote Sensing Water Indices based on Objective Threshold Value and the Random Forest Gini Coefficient

Wang Yifan,1,2, Xu Hanqiu,1,2

1.College of Environment and Resources,Key Laboratory of Spatial Data Mining & Information Sharing of Ministry of Education,Fuzhou 350116,China

2.Institute of Remote Sensing Information Engineering,Fujian Provincial Key Laboratory of Remote Sensing of Soil Erosion,Fuzhou University,Fuzhou 350116,China

通讯作者: 徐涵秋(1955-),男,江苏盐城人,教授,博士生导师,主要从事环境与资源遥感研究。E⁃mail:hxu@fzu.edu.cn

收稿日期: 2019-08-09   修回日期: 2020-07-16   网络出版日期: 2020-11-26

基金资助: 国家重点研发计划专项.  2016YFA0600302

Received: 2019-08-09   Revised: 2020-07-16   Online: 2020-11-26

作者简介 About authors

王一帆(1994-),男,福建福安人,硕士研究生,主要从事环境与资源遥感研究E⁃mail:wyfan63@163.com , E-mail:wyfan63@163.com

摘要

利用福建福州、西藏尼玛和澳大利亚弗伦奇3地代表不同水体类型的Sentinel-2A MSI和Landsat-8 OLI数据,采用客观阈值法(0阈值)和随机森林重要性评估法,比较和分析了改进型归一化差值水体指数(Modified Normalized Difference Water Index, MNDWI)、自动水体提取指数(Automated Water Extraction Index, AWEI)和水体指数2015 (Water Index 2015, WI2015) 这3种世界常用的水体指数之间的差异。从水体增强的效果来看,MNDWI增强的水体不仅具有丰富的信息还具有鲜明的对比度,AWEI和WI2015增强的水体信息的对比度相对偏弱。精度验证表明:3种指数提取的水体精度都较高,但MNDWI在3个地区的平均总精度略高于WI2015和AWEI,3者的平均总精度分别为91.83 %、91.16 %和90.07 %。在提取细小水体方面,MNDWI的能力强于其他2种指数,在阴影较为明显的高原山地区域,MNDWI提取水体的效果优于AWEI和WI2015。进一步采用随机森林的Gini指标进行的重要性评估表明,MNDWI在区分水体和非水体的分类中表现出了很强的重要性,尤其在Sentinel-2A MSI数据中表现得更为突出,而WI2015和AWEI的重要性则相对较弱。

关键词: 水体指数 ; 随机森林 ; Gini指标 ; Sentinel⁃2A ; Landsat⁃8 ; 评估

Abstract

This study used Sentinel-2A and Landsat-8 images of Fuzhou in Fujian, Nima in Tibet, China and French Island in Australia to assess the performance of three commonly-used water indices, i.e., Modified Normalized Difference Water Index (MNDWI), Automated Water Extraction Index (AWEIsh and AWEInsh) and Water Index 2015 (WI2015). The objective threshold value, i.e., 0 threshold, and random forest importance assessment method (Gini coefficient) were adopted to do the comparison with different water types (river, lake, and ocean). Among the water enhanced images of the three indices, MNDWI-enhanced water image has the highest contrast and rich information, whereas AWEI and WI2015 have relatively low contrast and are less informative. Accuracy validation shows that the water features extracted by the three indices all have high accuracy. Nevertheless, the average overall accuracy of MNDWI in the three areas is slightly higher than that of WI2015 and AWEI, which are 91.83 %, 91.16 % and 90.07 %, respectively. In addition, MNDWI can detect small water bodies and remove mountain slope shadows more effectively than the other two indices. The importance assessment revealed by the Gini coefficient of random forest further shows that MNDWI has the strongest importance in the separation of water with non-water features, especially shown in Sentinel-2A images, while WI2015 and AWEI have a relatively lower importance.

Keywords: Water index ; Random forest ; Gini coefficient ; Sentinel-2A ; Landsat-8 ; Assessment

PDF (3542KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王一帆, 徐涵秋. 基于客观阈值与随机森林Gini指标的水体遥感指数对比. 遥感技术与应用[J], 2020, 35(5): 1089-1098 doi:10.11873/j.issn.1004-0323.2020.5.1089

Wang Yifan, Xu Hanqiu. Comparison of Remote Sensing Water Indices based on Objective Threshold Value and the Random Forest Gini Coefficient. Remote Sensing Technology and Application[J], 2020, 35(5): 1089-1098 doi:10.11873/j.issn.1004-0323.2020.5.1089

1 引 言

水体大约占地球表面积的70 %,是人类生存必不可少的重要资源。随着全球气候的变化和人类活动的干扰,地表水体已成为一种快速变化的土地覆盖类型,对生态和环境产生了重大的影响,受到人类的广泛关注1-3。因此,有必要对地表水体的变化进行及时的监测。

遥感技术因其宏观、高效、实时等优点已被广泛地应用于水体分布、水质变化和洪涝灾害等研究中4-6。目前,提取水体的遥感方法有很多,如专题图分类法、线性分解法、指数法等47-9。其中,指数法因具有计算简单、提取精度高等优势而成为了最常用的水体提取方法3671011,该方法的基本思想是通过波段运算来增强水体信息并抑制背景信息来提取水体6。随着遥感技术的发展,水体指数也经历了不同的演变:Crist12通过变换矩阵开发了对地表湿度信息较为敏感的缨帽变换湿度分量(Tasseled Cap Wetness, TCW);McFeeters13基于植被指数NDVI (Normalized Difference Vegetation Index)提出了归一化差值水体指数NDWI (Normalized Difference Water Index),但其提取水体的结果会引入建筑信号的噪声;Xu6提出了改进型归一化差值水体指数MNDWI (Modified Normalized Difference Water Index)以抑制建筑噪音;Danaher等14利用波段的自然对数创建了水体指数WI2006 (Water Index 2006);Fisher等5在WI2006的基础上提出了水体指数WI2015(Water Index 2015);Feyisa等4提出了自动水体提取指数AWEI (Automated Water Extraction Index),并进一步分为可以去除阴影的AWEIsh和不具备阴影去除能力的AWEInsh。从Web of Science核心数据库检索来看,当前全球普遍应用的3种指数为MNDWI (引用1 161次)、AWEI (引用382次)和WI2015 (引用103次),这3种指数也多被认为是精度较高的水体指数315-18

因此,本文对MNDWI、AWEI和WI2015这3种常用水体指数进行对比研究,以不同地区和不同的水体类型来进一步分析这3种水体指数的区别。同时采用Sentinel-2A MultiSpectral Instrument (MSI)和Landsat-8 Operational Land Imager (OLI) 2种影像来考察这些指数。研究结果有望对不同水体指数的选择和应用提供有益的帮助。

2 数据和方法

为了避免基于单一地区和单一水体对比结果的片面性,分别选取了城市水体(河流)、高原山区水体(湖泊)和海湾水体这3种不同的水体类型对MNDWI、AWEI和WI2015指数进行水体信息提取实验和随机森林水体分类重要性实验。

福州实验区的水体主要为横贯城市的闽江和城市内河、水质相对浑浊。尼玛县的水体为孜桂错(盐湖),水质相对清澈。澳大利亚弗伦奇岛实验区的水体主要为海湾水体,水质相对洁净,但局部可见浑浊水体。图1为3个实验区的标准假彩色影像。

图1

图1   实验区Landsat-8 OLI 543标准假彩色影像

Fig. 1   Landsat 8 OLI images of three test areas (RGB: 543)


2.1 数据源及其预处理

研究选择当前最常用的中分辨率遥感影像Sentinel-2A MSI和Landsat-8 OLI为实验数据,以进一步考察不同水体指数在这2种影像中的应用表现。为便于描述,下文将Sentinel-2A MSI和Landsat-8 OLI影像分别记为S2A和L8。3个实验区中,有2个获得了S2A和L8的同日影像(福州、弗伦奇岛),尼玛县仅获得了L8影像,影像的相关信息见表1

表1   Sentinel-2A和Landsat-8影像数据

Table 1  Sentinel-2A and Landsat-8 images of three test areas

地区Sentinel-2A MSILandsat-8 OLI
时间轨道号时间轨道号
中国福州市2017-09-16 GMT 02:35:51205/0892017-09-16 GMT 02:32:53119/042
澳大利亚弗伦奇岛2019-01-28 GMT 00:11:110211/0732019-01-28 GMT 00:03:38092/087
中国尼玛县//2018-11-09 GMT 04:40:54140/038

新窗口打开| 下载CSV


S2A影像下载于欧空局(ESA) (https://scihub.copernicus.eu/dhus/#/home)。下载的1C数据已经过几何校正和辐射校正,只需利用其提供的Sen2 Cor插件进行大气校正,并在Sentinel Application Platform软件中进行格式转换等预处理19,将1C的表观反射率转换为地表反射率20。由于S2A的空间分辨率具有10 m、20 m和60 m,因此将计算水体指数所需的波段统一采样为20 m的空间分辨率。

L8影像下载于美国地质调查局(USGS) (https://earthexplorer.usgs.gov/)。下载的1T格式数据根据官方的用户手册21和Chavez的COST大气校正模型22将影像的DN值转换为地表反射率23

2.2 方 法

2.2.1 改进型归一化差值水体指数

改进型归一化差值水体指数(MNDWI)是Xu6针对McFeeters的NDWI存在的水体和建筑信息混淆的问题,对其进行了改进,采用短波红外第1波段替代了NDWI中的近红外波段,提出了MNDWI指数,即:

MNDWI = Green-SWIR1/Green+SWIR1

其中:Green和SWIR1分别为绿光和短波红外1波段的地表反射率。

2.2.2 自动水体提取指数

Feyisa等4针对水体指数必须采用人为确定的阈值来进行水体提取的问题,提出了无需阈值的自动水体提取指数AWEI,即采用0阈值来提取水体。同时,该指数又分别针对阴影区和无阴影区设置了2个次级指数,分别为AWEIsh (适合于阴影区)和AWEInsh (适合于无阴影区),具体公式如下:

AWEIsh = Blue+2.5Green-1.5(NIR+SWIR1)-            0.25SWIR2
AWEInsh = 4(Green-SWIR1)-(0.25NIR+             2.75SWIR2)

其中:Blue、NIR和SWIR2分别为蓝光、近红外和短波红外2波段的地表反射率。

2.2.3 线性判别分析水体指数2015

Fisher等5基于WI2006指数采用线性判别分析构建了WI2015水体指数,公式为:

WI2015 = 1.7204+171Green+3Red-70NIR-           45SWIR1-71SWIR2

其中:Red为红光波段的地表反射率。

2.2.4 变异系数

变异系数(Coefficient of Variation, CV)又称作标准差系数,其在计算的过程中消除了量纲的影响,更适用于不同量纲之间数据信息量丰富度的比较24,因此本文选用变异系数来评价各个水体指数的信息量,其公式为:

CV = SD/Mean

其中:SD为标准差,Mean为均值。

2.2.5 水体指数提取阈值

当前的遥感水体指数大多都必须人为设定最佳阈值来提取水体,但AWEI可以采用默认的0阈值来自动客观地提取水体,为了考察AWEI是否确实可以采用0作为阈值,以及避免人为选择阈值所造成的结果不确定性,因此本次实验全部采用0阈值来客观评价3种水体指数,而不采用人为选取的主观最佳阈值。

2.2.6 水体提取精度验证

采用随机抽样的方法在每个实验区抽取多于500个样点来进行精度验证25-26。选取时间接近的Google高分影像作为参考影像来判别验证样点的水体提取精度,采用总精度(Overall Accuracy, OA)和Kappa系数来进行水体提取精度评价。

2.2.7 基于随机森林Gini指标的重要性评估

随机森林中的Gini指标可以判别参与影像分类的各波段或指数的重要程度2527。通过计算Gini指标的数值来判断每个波段或指数的重要性,Gini数值越大表示变量的重要性越强。相关公式如下27

GI=k=1Kp̂mk(1-p̂mk)

其中:GI为Gini指标,K为自助法的训练样本类别数,p̂mk为节点m处样本属于第k类的概率估计值,当分类结果为“水体”和“非水体”时,即K为2时,GI=2p(1-p);如果决策树的节点为n,则:

GVIjkn=(GIparent-GIdaughterleft+GIdaughterright)nPkn

其中,GVIjkn为变量j于节点n时对第k类的重要性;GIparent、GIdaughterleft和GIdaughterright分别为节点n的Gini指标和分裂后的2个新节点的Gini指标。将k类中包含变量j的节点求和可以得到变量j对于k类的重要性:

GVIjk=njTreekNGVIjkn

其中:N为节点总数。变量j在所有类别中的重要性即可通过以下公式获得:

GVIj=1ntreek=1ntreeGVIjk

其中:ntree为决策树个数。

在本次实验中,3个水体指数被作为3个特征波段并与S2A和L8的主要多光谱波段组合成为各实验区水体分类的新的影像数据集。根据各实验区的水质具体情况,将它们分为相对净水、相对浑水和非水体3大类别,并分别选择训练区(表2)。

表2   各实验区水体类型和训练样本数

Table 2  Water types and the number of training samples in each test area

地区类别训练样区样本数备注
中国福州市相对浑水、非水体

S2A:水体7 046个,

非水体28 492个;

L8:水体3 256个,

非水体12 805个

同步影像
中国尼玛县相对净水、非水体

L8:水体10 121个,

非水体25 412个

澳大利亚

弗伦奇岛

相对净水、非水体

S2A:水体650个,

非水体2 280个;

L8:水体295个,

非水体1 000个

同步影像

新窗口打开| 下载CSV


3 结 果

3.1 水体增强影像的直观比较

图2为3个实验区S2A和L8影像通过AWEI (AWEInsh或AWEIsh)、MNDWI和WI2015指数增强的水体影像(影像均未经过拉伸处理)。水体增强影像的对比度越大,说明水体(亮)和非水体(暗)越容易分离,从而有利于水体的提取。由于福州和尼玛地区具有山体,因此采用具有消除阴影能力的AWEIsh指数;而弗伦奇岛地区因地势平坦,所以选用不具备去除阴影能力的AWEInsh指数,为方便起见下文仍将这2种指数统称为AWEI指数。

图2

图2   各实验区水体指数增强影像

Fig.2   Water-enhanced images of each test area by the three indices


对比图2各影像可以看出,MNDWI增强的水体影像在所有实验区均具有最大的对比度,非水体信息均受到明显的抑制。因此,横跨江中的大桥可以明显的显示(见福州影像中的圆圈),水体中的微细纹理信息也可以得到较好的表现(见弗伦奇岛影像)。而AWEI和WI2015影像的对比度相对不明显,特别是在福州实验区,横跨江中的大桥几乎没有显示,弗伦奇岛水域的微细信息也不明显。3个指数的这些差别可以从它们的水体影像直方图很好的得以解释(图3),MNDWI的水和非水信息的分离度较大且基本不重合,而AWEI和WI2015的分离度则很小且有一定程度的重合(见图3圆圈处)。

图3

图3   各实验区水体影像直方图

Fig.3   Histograms of water-enhanced images of three test areas


3.2 水体指数影像统计信息对比

进一步对3个实验区各水体指数影像进行统计可以发现(表3),AWEI和WI2015的最小值和最大值为不确定数,在不同地区和不同影像中变化较大,如AWEI的最小值可达-2.223,最大值可达1.121,而WI2015的最小值和最大值则分别可达到-119.572和62.246;而MNDWI的最小值和最大值则严格控制在-1到1之间,这显然有利于不同地区同一指数之间的对比。从变异系数(CV)来看,在福州和尼玛县的MNDWI都具有最高的变异系数,说明水体影像的信息最丰富。而AWEI的变异系数在这2个地区平均低于MNDWI达48 %,WI2015也低于46 %,这说明二者的水体信息量相对较弱,表现在图3的直方图中,水体信息的分布范围很窄且峰值很高,表明水体信息的频数在很窄的数值范围内高度集中。在弗伦奇岛,WI2015的变异系数最高,MNDWI次之,AWEI最低,WI2015比MNDWI高35%,比AWEI高47%。

表3   各实验区不同指数影像的统计信息

Table 3  Statistics of the three index images in each test area

实验区水体指数数据最小值最大值均值标准差变异系数
福州AWEIL8-2.0330.253-0.3640.2000.549
S2A-1.3810.943-0.2890.2290.792
MNDWIL8-0.8011.000-0.3550.2820.794
S2A-0.8240.863-0.2390.2931.230
WI2015L8-119.57216.385-15.9519.2910.582
S2A-89.88660.196-13.33110.6590.800
弗伦奇岛AWEIL8-2.2230.179-0.3600.6901.917
S2A-2.3060.339-0.3860.7701.995
MNDWIL8-0.7130.8430.2470.6562.656
S2A-0.9100.9610.3160.6792.149
WI2015L8-42.3269.818-4.84516.3963.384
S2A-40.31314.522-4.29917.3844.044
尼玛县AWEI-1.2161.121-0.4080.2930.718
MNDWIL8-0.9841.000-0.2310.4501.948
WI2015-68.51762.246-20.57415.890.772

新窗口打开| 下载CSV


3.3 水体提取精度对比

表4为各实验区3个指数采用0阈值客观提取水体的精度表。总体看来3个指数的提取精度都大于90 %,但还是有一定差别。MNDWI在3个地区的平均总精度为91.83 %,WI2015为91.16 %,AWEI为90.07 %。但在Kappa系数方面,AWEI和WI2015与MNDWI的差别相对较大,MNDWI高于AWEI 4.4 %,也比WI2015高1.7 %,这说明MNDWI提取的水体数据和验证数据之间的一致性要好于其它2个指数。就平均漏判率来看,MNDWI高于WI2015不到1个百分点(0.88),而AWEI漏判率相对较高,比MNDWI和WI2015分别高出3.51%和4.39%。就平均误判率而言,AWEI和MNDWI相近,而WI2015的误判率分别高于AWEI和MNDWI 2.63%和2.52%。总的来看,能够自动提取水体信息的AWEI在0阈值的情况下并未显示出自动提取的优势,其总精度和Kappa系数都要低于MNDWI和WI2015。

表4   实验区各水体指数提取精度(0阈值)

Table 4  Accuracy assessment for water feature extraction by the three indices using 0 threshold in test areas

精度AWEIMNDWIWI2015
福州L8漏判率/%20.4315.5916.13
误判率/%3.905.454.88
总精度/%90.5091.7991.79
Kappa0.7970.826 20.825 9
福州S2A漏判率/%6.456.453.76
误判率/%20.5516.3520.09
总精度%87.6990.0688.77
Kappa0.7510.7970.774
弗伦奇岛L8漏判率/%14.069.068.75
误判率/%1.433.003.31
总精度/%91.0193.0393.03
Kappa0.8190.858 10.857 9
弗伦奇岛S2A漏判率/%16.4111.157.74
误判率/%2.533.694.18
总精度/%89.0591.4293.07
Kappa0.7810.8260.858
尼玛县L8漏判率/%18.6316.1817.65
误判率/%2.923.3912.04
总精度/%92.1092.8389.15
Kappa0.8260.8430.766
均值漏判率/%15.2011.6910.81
误判率/%6.276.388.90
总精度/%90.0791.8391.16
Kappa0.7950.8300.816

新窗口打开| 下载CSV


图4是3个指数的水体信息提取对比图,白圈表示各个指数在水体信息提取方面的差异。总体来看,3个指数提取大区域水体的效果相近,但MNDWI对细小水体的提取更为有效,如在福州地区MNDWI可以很好地提取出中部的细小河流,WI2015也能提取出该河流的主体部分,而AWEI则表现出一定程度的漏提。从阴影的去除能力来看,对于尼玛县地区的山体,MNDWI和AWEI都具有较好的去除阴影的能力,但WI2015的去除阴影能力则相对较差(见水体提取影像东部的圆圈处)。

图4

图4   部分实验区各水体指数(0阈值)的局部提取结果比较(以L8为例)

Fig.4   Comparison of water extraction results of the three water indices in some test areas using 0 threshold (Landsat 8 images)


3.4 随机森林Gini指标重要性评估

图5表5表6分别为随机森林Gini指标给出的各个水体指数波段和影像的主要多光谱波段在水体分类的重要性。可以明显地看出,在基于S2A影像的实验中(图5(a)和5(b),表5),无论是相对净水或相对浑水的组合,MNDWI的Gini值都明显大于所有其它变量的值,且远大于AWEI和WI2015,其重要性列所有13个变量的第1位,而AWEI和WI2015的重要性均值仅居第7和第8位,逊于有些光谱波段。在L8影像的实验中(图5(c)~(e),表6),AWEI和WI2015的重要性均不太稳定,AWEI在3 个实验区中列2到6位,WI2015列1到5位,而MNDWI的稳定性则相对较好,列1到3位。从所有影像的重要性均值来看,MNDWI以均值2列所有9个变量的第1位,WI2015以2.33列第2位,AWEI以4列第5位。这说明,作为随机森林分类的水体指数特征波段,MNDWI的水体分类重要性总体强于WI2015和AWEI。

图5

图5   实验区所有特征波段的Gini指标分布排序图

Fig.5   Ranking of all feature bands by Gini coefficient in the test areas


表5   S2A影像的Gini指标重要性排序

Table 5  Variable importance of 13 feature bands ranked by Gini coefficients of random forest based on S2A images

特征波段福州弗伦奇岛重要性均值重要性排序
Gini值重要性Gini值重要性
AWEI469.75680.8197.57
MNDWI3318.191133.23111
WI2015945.87571.431188
Band20.55120.001312.513
Band 34.30110.001211.512
Band 40.371397.35389
Band 516.971075.26101011
Band 6264.317103.5324.54
Band 7220.35894.58466
Band 843.68981.0688.510
Band 8a1547.88490.7175.55
Band 112495.78292.9453.52
Band 121972.52390.8864.53

新窗口打开| 下载CSV


表6   L8影像的Gini指标重要性排序

Table 6  Variable importance of 9 feature bands ranked by Gini coefficients of random forest based on L8 images

特征波段福州弗伦奇岛尼玛县重要性均值重要性排序
Gini值重要性Gini值重要性Gini值重要性
AWEI1 274.94257.9361 794.62445
MNDWI1 211.03372.0324 603.92121
WI20151 559.79175.7411 419.8452.332
Band 24.3180.0080.5698.338
Band 30.8390.0090.7588.679
Band 434.20756.56785.09777
Band 5243.71660.425520.9765.676
Band 6487.96460.9743 619.0823.333
Band 7376.42571.8432 432.7733.674

新窗口打开| 下载CSV


4 讨 论

当前,对各种遥感水体指数和方法都已有较多的对比研究。本文对当前世界上较权威的3个水体指数(MNDWI、AWEI和WI2015)进行了对比,但侧重于以0阈值来对比它们自动提取的精度以及它们在水体分类中的重要性差别。总的来看,3个水体指数的提取精度都较高,但MNDWI相对最高,WI2015次之,AWEI相对较低。这主要得益于MNDWI通过选取最强的水体反射和吸收波段进行比值运算,有助于有效地增强水体信息、抑制非水体信息。因此在影像的直方图上,水体和非水体的峰值可以很好地分离,水体增强影像也有最高的变异度,使得增强的水体影像信息更丰富,更有利于揭示水体中的微细信息。虽然AWEI旨在以0阈值来客观自动提取水体,但从本次3个地区3种水体的实验来看,AWEI的自动提取功能并不突出,甚至还逊于MNDWI和WI2015;而WI2015在阴影的抑制上则逊于其他2个指数。

Ogilvie等18新近对比了包括MNDWI和AWEI在内的6种常用的遥感水体指数。结果显示MNDWI精度最高、最稳定,其均方根误差(RMSE)比发表于Nature的方法小134%。Tulbure等25则采用随机森林Gini指标对包括MNDWI和AWEI在内的多种水体指数和多光谱波段在水体分类中的重要性进行了评价,其结果也认为MNDWI最为重要,而AWEI仅列3到8位。总的来看,MNDWI虽然只用2个波段进行简单的比值运算,但其水体增强和提取效果却很突出,因此,一直深受用户欢迎,并被ENVI 软件的5.3版本增列为水体信息处理的标配指数。应用MNDWI的成果相继发表在NatureScience等国际最顶级刊物上,用于估算全球江河面积、全球滩涂分布变化,以及气候变化和人类迁移等方面的研究16-1728

就指数构成而言,WI2015和AWEI都是先通过波段与调整系数相乘,再通过加减法的组合来增强水体信息,其计算结果的数值范围有较大的不确定性。而MNDWI采用标准的归一化比值法构成,其值稳定在-1~1之间,便于不同年份水体信息之间的对比。另外,这3个指数的构建都用到了短波红外波段,因此,它们的使用在只有可见光和近红外4个波段的影像中受到限制。由于MNDWI只使用到短波红外1波段(1.566 ~ 1.651 μm),而WI2015和AWEI则都还需要使用到短波红外2波段(2.107 ~ 2.294 μm),因此,MNDWI的使用范围会比后二者略广些,如可以用在SPOT 5等不具短波红外2 波段的卫星影像中。

就S2A和L8的2景同步影像的提取效果而言,3种水体指数在福州地区L8影像的水体平均提取精度为91.36 %,Kappa系数为0.816,而S2A的平均水体提取精度为88.84 %,Kappa系数为0.774,逊于L8影像。在弗伦奇岛,L8的3种水体指数的平均提取精度同样要高于S2A(表4)。造成这种差异的原因主要是S2A重采样后的20 m空间分辨率高于L8的30 m分辨率,当采用0阈值自动提取,而不是选用最佳阈值时,S2A提取的水体信息中误分的椒盐噪音信息较多,从而造成精度的下降。从Gini指数的重要性来看,3种水体指数在L8的平均重要性排序为2.67,也好于S2A的5.33。这主要是因为S2A影像的多光谱波段数多于L8影像,且所多的红边波段(6、7、8a波段)的重要性排序又好于AWEI和WI2015 (表5),从而造成WI2015和AWEI水体指数在S2A影像中的重要性下降。

5 结 论

本文基于S2A和L8影像数据以及不同实验区和不同的水体类型,采用客观阈值法和随机森林Gini重要性指标对MNDWI、AWEI和WI2015这3个全球广泛使用的水体指数进行了比较,得到以下结论:

(1)以0阈值客观提取水体时,3个指数都可以获得较高的精度。其中,MNDWI在3个实验区水体的提取平均总精度达91.83 %,高于WI2015 的91.16 %和AWEI的90.07 %。MNDWI提取细小水体的效果优于AWEI和WI2015;MNDWI和AWEI抑制阴影的能力优于WI2015。

(2)MNDWI具有最高的精度主要得益于其增强的水体影像具有很高的对比度,影像直方图上的水体和非水体信息的峰值可以很好地分离,且水体增强影像又具有最高的变异度,使得增强的水体影像信息更丰富,更有利于揭示微细的变化信息。总的来看,由于MNDWI计算简单,使用波段少,数值动态范围稳定,便于对比,因此其适用面更广。

(3)基于Gini指标的随机森林水体分类的重要性评价表明,MNDWI的平均Gini值最大,重要性最强,WI2015次之,而AWEI相对较弱,因此,MNDWI作为特征波段在水体分类中具有显著的重要性。

(4)3个水体指数在L8和S2A影像的水体提取中,L8影像的提取精度要高于S2A,这与S2A的分辨率较高,在客观0阈值提取的情况下误分较明显有关。L8的Gini重要性排名也会好于S2A,这也与S2A的波段数较多,其中有些波段具有较高的重要性有关。

参考文献

Wang MeiyaXu HanqiuFu Weiet al.

Spatio-temporal Variation of Urban Surface Water and Its Influence on Urban Thermal Environment

[J].Scientia Geographica Sinica, 2016367): 1099-1105.

[本文引用: 1]

王美雅徐涵秋付伟.

城市地表水体时空演变及其对热环境的影响

[J]. 地理科学, 2016367): 1099-1105.

[本文引用: 1]

Zhang LeiGong ZhaoningWang Qiweiet al.

Wetland Mapping of Yellow River Delta Wetlands based on Multi-feature Optimization of Sentinel-2 Images

[J]. Journal of Remote Sensing, 2019232): 313-326.

张磊宫兆宁王启为.

Sentinel-2影像多特征优选的黄河三角洲湿地信息提取

[J]. 遥感学报, 2019232): 313-326.

Zhou YDong JXiao Xet al.

Open Surface Water Mapping Algorithms: A Comparison of Water-Related Spectral Indices and Sensors

[J]. Water, 201794): 256. doi: 10.3390/w9040256.

[本文引用: 3]

Feyisa G LMeilby HFensholt Ret al.

Automated Water Extraction Index: A New Technique for Surface Water Mapping Using Landsat Imagery

[J]. Remote Sensing of Environment, 201414023-35. doi: 10.1016/j.rse.2013.08.029.

[本文引用: 4]

Fisher AFlood NDanaher T.

Comparing Landsat Water Index Methods for Automated Water Classification in Eastern Australia

[J]. Remote Sensing of Environment, 2016175167-182. doi: 10.1016/j.rse.2015.12.055.

[本文引用: 2]

Xu H.

Modification of Normalised Difference Water Index (NDWI) to Enhance Open Water Features in Remotely Sensed Imagery

[J]. International Journal of Remote Sensing, 20062714):3025-3033. doi:10.1080/01431160600589179.

[本文引用: 5]

Xu RongZhang ZengxiangZhao Chunzhe.

Diffrernt Models Used in Extraction of Lake Water Body based on MODIS Data

[J]. Remote Sensing information, 20153001): 111-118.

[本文引用: 2]

徐蓉张增祥赵春哲.

湖泊水体遥感提取方法比较研究

[J]. 遥感信息, 20153001): 111-118.

[本文引用: 2]

Bangira TAlfieri S MMenenti Met al.

A Spectral Unmixing Method with Ensemble Estimation of Endmembers: Application to Flood Mapping in the Caprivi Floodplain

[J]. Remote Sensing, 2017910): 1013. doi: 10.3390/rs9101013.

Masocha MDube TMakore Met al.

Surface Water Bodies Mapping in Zimbabwe Using Landsat 8 OLI Multispectral Imagery: A Comparison of Multiple Water Indices

[J]. Phsics and Chemistry of the Earth, 201810663-67. doi: 10.1016/j.pce.2018.05.005.

[本文引用: 1]

Ryu J HWon J SMin K D.

Waterline Extraction from Landsat TM Data in a Tidal Flat - A Case Study in Gomso Bay, Korea

[J]. Remote Sensing of Environment, 2002833): 442-456. doi: 10.1016/S0034-4257(02)00059-7.

[本文引用: 1]

Feng LHu C MChen X Let al.

Assessment of Inundation Changes of Poyang Lake Using MODIS Observations between 2000 and 2010

[J]. Remote Sensing of Environment, 201212180-92. doi: 10.1016/j.rse.2012.01.014.

[本文引用: 1]

Crist E P.

A TM Tasseled Cap Equivalent Transformation for Reflectance Factor Data

[J]. Remote Sensing of Environment, 1985173): 301-306. doi: 10.1016/0034-4257(85)90102-6.

[本文引用: 1]

McFeeters S K.

The Use of the Normalized Difference Water Index (NDWI) in the Delineation of Open Water Features

[J]. International Journal of Remote Sensing, 1996177): 1425-1432. doi: 10.1080/01431169608948714.

[本文引用: 1]

Danaher TCollett L. Development

Optimisation and Multi-temporal Application of A Simple Landsat based Water Index

[C]∥ Proceedings of the 13th Australasian Remote Sensing and Photogrammetry Conference, Canberra, Australia. 200629.

[本文引用: 1]

Wang DazhaoWang SimengHuang Changet al.

A Comparison of Sentinel-2 and Landsat 8 Imagery for Surface Water Extraction Using Four Common Water Indexes

[J]. Remote Sensing for Land and Resources, 2019313): 1-10.

[本文引用: 1]

王大钊王思梦黄昌.

Sentinel-2和Landsat-8的四种常用水体指数地表水体提取对比研究

[J]. 国土资源遥感, 2019313): 1-10.

[本文引用: 1]

Murray N JPhinn S RDeWitt Met al.

The Global Distribution and Trajectory of Tidal Flats

[J]. Nature, 20195657738): 222-236. doi: 10.1038/s41586-018-0805-8.

[本文引用: 1]

Chen JMueller V.

Coastal Climate Change, Soil Salinity and Human Migration in Bangladesh

[J]. Nature Climate Change, 2018811): 981. doi: 10.1038/s41558-018-0313-8.

[本文引用: 1]

Ogilvie ABelaud GMassuel Set al.

Surface Water Monitoring in Small Water Bodies: Potential and Limits of Multi-sensor Landsat Time Series

[J]. Hydrology and Earth System Sciences, 2018228): 4349-4380. doi: 10.5194/hess-22-4349-2018.

[本文引用: 2]

ESA.

Sentinel-2 User Handbook

[EB/OL]. (2015-07-24) [2019-06-24]. , 2015.

URL     [本文引用: 1]

ESA.

Sentinel-2 MSI – Level-2A Prototype Processor Installation and User Manual

[EB/OL]. (2016-04-13) [2019-06-24]. , 2016.

URL     [本文引用: 1]

UGSG.

Landsat 8 (L8) Data Users Handbook

[EB/OL]. (2019-04-01) [2019-06-24]. , 2019.

URL     [本文引用: 1]

Chavez P S.

Image-based Atmospheric Corrections Revisited and Improved

[J]. Photogrammetric Engineering and Remote Sensing, 1996629): 1025-1036.

[本文引用: 1]

Xu Hanqiu. Retrieval of the Reflectance and Land Surface Temperature of the Newly-launched Landsat 8

Satellite

[J]. Chinese Journal of Geophysics, 2015583): 741-747.

[本文引用: 1]

徐涵秋.

新型Landsat8卫星影像的反射率和地表温度反演

[J]. 地球物理学报, 2015583): 741-747.

[本文引用: 1]

Liu Hui.

Regional Inequality Measurement: Methods and Evaluations

[J]. Geographical Research, 20064): 710-718.

刘慧

区域差异测度方法与评价

[J]. 地理研究, 20064): 710-718.

[本文引用: 1]

Tulbure M GBroich MStehman S Vet al.

Surface Water Extent Dynamics from Three Decades of Seasonally Continuous Landsat Time Series at Subcontinental Scale in A Semi-arid Region

[J]. Remote Sensing of Environment, 2016178142-157. doi: 10.1016/j.rse.2016.02.034.

[本文引用: 3]

Jensen J R. Introductory Digital Image Processing: A Remote Sensing Perspective[M].New JerseyPrentice Hall Press2015.

[本文引用: 1]

Goldstein B APolley E CBriggs F B S.

Random Forests for Genetic Association Studies

[J]. Statistical Applications in Genetics and Molecular Biology, 2011101). doi: 10.2202/1544-6115.1691.

[本文引用: 2]

Allen G HPavelsky T M.

Global Extent of Rivers and Streams

[J]. Science, 20183616402): 585-587. doi: 10.1126/science.aat0636.

[本文引用: 1]

/