遥感技术与应用, 2024, 39(1): 120-133 doi: 10.11873/j.issn.1004-0323.2024.1.0120

水质遥感专栏

基于多源遥感及气象数据的河流非光学活性水质参数反演模型研究

兑紫璇,1,2, 王卿3, 王敏3, 张璟4, 顾倩荣,1

1.中国科学院上海高等研究院 低碳转化科学与工程重点实验室碳数据与碳评估中心,上海 201210

2.中国科学院大学,北京 100049

3.上海市环境科学研究院,上海 200233

4.江苏省司法警官高等职业学校,江苏 南京 212008

Research on the Retrieval Model of Non-optically Active Water Quality Parameters of Rivers based on Multi-source Remote Sensing and Meteorological Data

DUI Zixuan,1,2, WANG Qing3, WANG Min3, ZHANG Jing4, GU Qianrong,1

1.Shanghai Carbon Data Research Center,Key Laboratory of Low - Carbon Conversion Science & Engineering,Shanghai Advanced Research Institute,Chinese Academy of Sciences,Shanghai 201210,China

2.University of Chinese Academy of Sciences,Beijing 100049,China

3.Shanghai Academy of Environmental Sciences,Shanghai 200233,China

4.Jiangsu Provincial Judicial Police Officer Higher Vocational College,Nanjing 212008,China

通讯作者: 顾倩荣,博士,高级工程师,主要从事卫星遥感数据应用研究。E⁃mail: guqr@sari.ac.cn

收稿日期: 2022-10-13   修回日期: 2023-12-18  

基金资助: 上海市2020年度科技创新行动计划社会发展科技攻关项目.  20dz1204302
国家自然科学基金面上项目“基于多维数据的城市群碳达峰规划评估模型”.  52178060

Received: 2022-10-13   Revised: 2023-12-18  

作者简介 About authors

兑紫璇,硕士研究生,主要从事卫星遥感数据应用研究E⁃mail:duizx@sari.ac.cn , E-mail:duizx@sari.ac.cn

摘要

针对传统河流水质监测成本高、地面监测站点稀疏等问题,基于哨兵2卫星多光谱遥感数据,结合MODIS地表温度、植被指数、气溶胶光学厚度数据产品,以及ERA5气象数据产品中的地表风速数据,以非光学活性参数溶解氧(DO)、化学需氧量(COD)和氨氮(NH3-N)的地面水质监测站的监测数据为参照,采用支持向量回归(SVR)、随机森林(RF)和多层感知机(MLP)3种机器学习方法,通过对比实验选出每种水质参数最优反演模型及其对应的输入特征组合。模型性能测试实验结果表明,利用多源遥感及气象数据反演出的DO、COD以及NH3-N的决定系数(R2)分别为0.896、0.781、0.529,均方根误差(RMSE)分别为0.263 mg/L、0.383 mg/L、0.061 mg/L。与仅使用哨兵2卫星多光谱遥感数据的反演结果相比,R2分别提高了7.04%、19.05%、18.34%,RMSE分别降低了34.58%、37.42%、14.08%。表明多源遥感及气象数据对提高DO、COD以及NH3-N水质参数反演准确性有重要意义。最后,模型鲁棒性评估实验表明,当模型训练数据的代表性与全局数据较为接近时,训练的模型具有较好的时空鲁棒性。

关键词: 机器学习 ; 多源遥感数据 ; 溶解氧 ; 化学需氧量 ; 氨氮 ; 水质反演模型

Abstract

In view of the high cost of traditional river water quality monitoring and the sparse ground monitoring stations, based on Sentinel-2 satellite multispectral remote sensing data, combined with MODIS surface temperature, vegetation index, aerosol optical thickness data products, and the surface wind speed data in ERA5 meteorological data products, the monitoring data of the surface water quality monitoring stations with non-optical active parameters Dissolved Oxygen (DO), Chemical Oxygen Demand (COD) and ammonia nitrogen (NH3-N) are taken as reference, three machine learning methods, Support Vector Regression (SVR), Random Forest (RF) and Multilayer Perceptron (MLP), were used to select the optimal inversion model of each water quality parameter and its corresponding input feature combination through comparative experiments. The experimental results of the model performance test show that the determination coefficients (R2) of DO, COD and NH3-N are 0.896,0.781 and 0.529, respectively,and the Root Mean Square Error(RMSE) are 0.263 mg/L,0.383 mg/L and 0.061 mg/L, respectively. Compared with the retrieval results using only Sentinel-2 multi-spectral remote sensing data, R2 increased by 7.04%, 19.05% and 18.34% respectively, and RMSE decreased by 34.58%, 37.42% and 14.08% respectively. It shows that multi-source remote sensing and meteorological data are of great significance to improve the retrieval accuracy of DO, COD and NH3-N water quality parameters. Finally, the model robustness evaluation experiment shows that the trained model has better space-time robustness when the representativeness of the model training data is close to the global data.

Keywords: Machine learning ; Multi-source remote sensing data ; Dissolved oxygen ; Chemical oxygen demand ; Ammonia nitrogen ; Water quality retrieval model

PDF (4306KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

兑紫璇, 王卿, 王敏, 张璟, 顾倩荣. 基于多源遥感及气象数据的河流非光学活性水质参数反演模型研究. 遥感技术与应用[J], 2024, 39(1): 120-133 doi:10.11873/j.issn.1004-0323.2024.1.0120

DUI Zixuan, WANG Qing, WANG Min, ZHANG Jing, GU Qianrong. Research on the Retrieval Model of Non-optically Active Water Quality Parameters of Rivers based on Multi-source Remote Sensing and Meteorological Data. Remote Sensing Technology and Application[J], 2024, 39(1): 120-133 doi:10.11873/j.issn.1004-0323.2024.1.0120

1 引 言

水污染对生态环境、可利用淡水资源和人类健康构成严重威胁。因此,定期对河流水质进行监测十分必要。传统的实地采样、实验室分析的监测方法人力和物力耗费巨大,而且效率十分低下。采用地面水质自动监测站的方式,因站点数量有限,且通常稀疏地分散在河流的不同区域,所以这些站点监测到的水质数据难以真实地反映出河流较大区域范围内的水质情况。与此相对,卫星遥感具有覆盖范围广、监测效率高等优点,随着利用遥感数据反演水质研究的进展,卫星遥感反演已广泛应用于水质监测领域。

水质参数根据其是否对某些特定光谱谱段具有明显的光学响应,分为光学活性参数和非光学活性参数两大类1。对于光学活性水质参数,可以根据其固有光学特性与水面反射率之间的关系建立遥感反演模型。目前对于光学活性参数的遥感反演,已有大量研究且取得较好的成果,如叶绿素2-3、总悬浮物4-5和有色溶解有机物6等。对于非光学活性水质参数,由于水体中多种水质成分和沉积物存在的相互影响,以及不同流域水体类型、水深以及周围环境的差异,导致非光学活性参数对水面反射率的影响呈现出复杂多变的特点,这使得直接利用遥感获得的多光谱特征对其进行反演非常困难,而且传统的经验统计法、物理分析法和半经验法的泛化性较差,难以取得较好的反演结果7。相反通过数据驱动,能自动提取出数据之间复杂非线性关系的机器学习方法,非常适合用于提取非光学活性水质参数和多光谱遥感数据之间的相关性,并且能在一定程度上避免大气和其它环境因素带来的干扰,从而实现对这些水质参数的反演7-8

Wang等9发现SPOT5卫星的红光、绿光和近红外谱段的观测值与非光学活性水质参数中的化学需氧量(Chemical Oxygen Demand,COD)和氨氮(Ammonia Nitrogen,NH3-N)数值之间具有较强的相关性。Kuan等10利用经过超分辨率算法处理后的哨兵2多光谱数据,实现了对内陆河流的NH3-N和COD等水质参数的反演。Guo等11用机器学习的方法,从多光谱遥感数据中反演出城市小型水体的溶解氧(Dissolved Oxygen,DO)和COD等水质参数。这些研究表明,DO、COD和NH3-N水质参数与多光谱遥感数据之间存在较强的相关性关系12,揭示了利用数据驱动的机器学习方法,从多光谱遥感数据中反演出这些非光学活性参数的可能性。

目前已有的应用卫星遥感数据反演非活性水质参数的研究,往往只使用卫星的多光谱遥感数据作为反演模型的输入,缺少考虑河流周围环境因素对水质参数的影响。理论上卫星观测到水面反射率应仅受水体水质的影响,但实际上卫星的观测数据还会受到大气中气溶胶光学厚度(Aerosol Optical Depth,AOD)和因风速引起水面浪高差异的影响7。此外,河流周围的地表温度和植被覆盖程度会影响水体中的营养状态,进而影响各种水质参数的数值13。因此,在反演河流水质参数时,河流及附近的风速、气溶胶光学厚度、地表温度、植被指数等环境因素的影响不应被忽略。

实验以谷歌地球引擎(Google Earth Engine,GEE)云遥感处理平台14为分析处理平台,利用哨兵2卫星15多光谱地表反射率数据产品、中分辨率成像光谱仪(Moderate-resolution Imaging Spectroradiometer,MODIS)的地表温度、植被指数,和气溶胶光学厚度数据产品,以及ERA5气象数据,作为多源数据输入,以中国环境监测总站发布的全国主要流域地表水水质监测数据为目标,使用机器学习方法训练反演模型,实现对河流的DO、COD以及NH3-N水质参数的反演。实验结果表明,使用多源数据的DO,COD和NH3-N反演结果的确定系数(The Coefficient of Determination,R2)分别为0.896,0.781,0.529,均方根误差(Root Mean Square Error,RMSE)分别为0.263 mg/L,0.383 mg/L,0.061 mg/L,与只使用哨兵2多光谱遥感数据的反演结果相比,R2提高分别了7.04%,19.05%,18.34%,RMSE分别降低了34.58%,37.42%,14.08%。

2 数据获取与处理

2.1 地面水质监测数据

地面水质监测数据采用中国环境监测总站公开发布的全国主要流域144个地表水水质监测站点,2017年1月至2019年12月间的实时水质监测数据集16中,包含的DO、COD和NH3-N水质参数监测数据。数据集中的144个水质监测站点,从高纬度到低纬度,覆盖我国东部与南部地区的主要河流和湖泊,具有较广泛的空间代表性。

2.2 多源遥感数据与气象数据

2.2.1 哨兵2多光谱遥感数据

哨兵215包括两颗相同的太阳同步轨道卫星,分别于2015年和2017年发射,每颗卫星上搭载一个具有13个光谱谱段的多光谱成像仪(Multispectral imager,MSI),成像的空间分辨率分别为10 m、20 m和60 m。

本研究使用经过辐射定标和大气校正的哨兵2 MSI L2A级数据产品17,该数据产品代表哨兵2观测到的地表反射率。数据产品中的第10谱段数据,因其主要包含高空卷云的信息,所以被丢弃不用。另外,利用哨兵2提供的质量参数筛选出云量小于10%的数据,用于反演研究。

2.2.2 MODIS数据产品

(1)地表温度

地表温度(Land Surface Temperature,LST)来自MODIS的MOD11A118(Terra)和MYD11A119(Aqua)两个数据产品,时间分辨率为每天,空间尺度为1 000 m。

在根据地面水质监测数据的坐标筛选地表温度数据时,由于云的遮挡,有些值可能是null,所以将Terra和Aqua两颗卫星的地表温度数据产品搭配使用,以减少数据的缺失。

(2)植被指数

植被指数(Vegetation Index,VI)来自MODIS MOD13Q120(Terra)和MYD13Q121(Aqua)两个数据产品。它们相互配合,可以得到时间分辨率为8 d,空间分辨率为250 m的两种植被指数,分别为归一化差异植被指数(Normalized Difference Vegetation Index,NDVI)和增强植被指数(Enhanced Vegetation Index,EVI)。

(3)气溶胶光学厚度

气溶胶光学厚度(Aerosol Optical Depth,AOD)来自MODIS的MCD19A222数据产品,时间分辨率为每天,空间分辨率为1 km。该产品提供波长分别为47 nm和55 nm的两种光学厚度数据。

2.2.3 ERA5气象数据

ERA5是欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)生产和发布的最新一代全球气象再分析资料,(https://www.ecmwf.int/en/forecasts/datasets/reanalysis-datasets/era5)。 ERA5提供空间分辨率为0.1°,时间分辨率为1 h的全球大气温度、湿度、气压、风速、降水量等气象参数。研究采用其中10 m高度的u、v风速数据,来计算湖泊河流的水面风速(Wind speed,WS)。

2.3 地面水质监测数据与多源数据的时空匹配
2.3.1 空间上的匹配

地面水质监测数据与多源遥感及气象数据在空间上的匹配,分为以下3个步骤:

步骤(1):在GEE平台14上,从哨兵2、MODIS和ERA5数据产品中,根据地面水质监测数据的坐标,筛选出2017年1月至2019年12月(水质监测数据集所覆盖的时间段)内的多源遥感及气象数据。

步骤(2):在GEE平台14上,将筛选出的MODIS和ERA5数据的投影方式,转换成哨兵2数据产品所使用的EPSG:32649投影方式。

步骤(3):以哨兵2的10 m分辨率的谱段2数据为基准,通过重采样和双三次插值方法23,将哨兵2其它低空间分辨率的谱段数据,MODIS的地表温度、植被指数,和气溶胶光学厚度,以及ERA5的气象数据,插值到哨兵2谱段2数据的坐标处,最终完成多源遥感数据和气象数据在空间上的匹配。

2.3.2 时间上的匹配

经过空间匹配之后的多源遥感及气象数据需要进一步在时间上与地面水质监测数据进行匹配。因为每种数据产品的时间分辨率不同,且对时间变化的敏感程度不同,我们根据每种数据产品的特点,如表1所示,确定其在时间上与地面水质监测数据进行匹配的时间窗口大小。

表1   水质监测数据和多源遥感及气象数据匹配的时间窗口

Table 1  Time window for matching water quality monitoring data and multi-source remote sensing and meteorological data

数据名称哨兵2MODISERA5
地表温度植被指数气溶胶
时间窗口4 h同一天同一天同一天1 h

新窗口打开| 下载CSV


在以往研究中,根据地面水质监测数据的情况,通常将与遥感数据匹配的时间窗口大小选择为4 h11、1 d10,或7 d2。本研究为了得到较好的反演效果,将哨兵2数据与地面水质监测数据匹配的时间窗口大小设置为4 h。

2.3.3 时空匹配后数据的异常值处理

对于经过与多源遥感及气象数据进行时空匹配后筛选出的地面水质监测数据,根据其数值分布的概率,进一步使用异常检测算法EllipticEnvelope24将过高或过低的异常水质监测值剔除,最后得到用于训练反演模型的地面水质监测数据样本集。

筛选出的地面水质监测数据集,异常值剔除前后的统计信息的差异如表2所示。

表2   与多源遥感和气象数据时空匹配后筛选出的地面水质监测数据样本集

Table 2  The ground water quality monitoring sample data set filtered by spatial and temporal matching with the multi-source remote sensing and meteorological data

状态水质参数异常值处理比例样本数平均值/(mgL-1)标准偏差最小值/(mgL-1)最大值/(mgL-1)
异常值剔除前DO-2708.782.433.7618.07
COD-2702.292.340.1015.60
NH3-N-2700.931.420.0010.00
异常值剔除后DO0.082498.291.544.7012.10
COD0.102431.681.330.105.25
NH3-N0.202160.550.650.002.80

新窗口打开| 下载CSV


3 水质参数反演模型

研究使用支持向量回归25(Support Vector Regression,SVR)、随机森林26(Random Forest,RF)和多层感知机27(Multilayer Perceptron,MLP)3种机器学习模型,利用多源遥感和气象数据,反演DO、COD及NH3-N的水质参数。同时,使用传统的多元线性回归(Multiple Linear Regression,MLR)模型28,作为与机器学习模型反演性能对比的参照28,以分析机器学习模型对这3种非光学活性水质参数反演结果准确性的提升情况。

3.1 支持向量回归

基于支持向量29概念的支持向量回归,将低维特征空间中的输入通过非线性变换映射到高维特征空间中,并如图1所示,寻找确保预测值与实际观测值的差异在偏差ε范围内的回归超平面fx25

图1

图1   支持向量回归示意图

Fig.1   Schematic diagram of support vector regression


因为仅有作为支持向量的关键训练样本用于决定回归超平面的位置,所以SVR的性能不会过度依赖训练数据量的多少30,因此在可获得样本数量有限的遥感任务中SVR具有一定优势。

3.2 随机森林

随机森林由多棵不存在强依赖关系的决策树组成,是一种基于装袋法思想31的集成学习方法26。如图2所示,其决策树在每个非叶子节点选择一种特征属性进行测试,并将测试结果通过分支输出,随机森林最终的输出值由多棵决策树共同决定,同时可以对预测变量之间的相互作用进行模拟,因此对输入变量中的异常值具有一定的鲁棒性30。随机森林可以随机选择测试使用的特征子集,可以适用于高维度数据的处理。

图2

图2   随机森林示意图

Fig.2   Schematic Diagram of Random Forest


3.3 多层感知机

多层感知机如图3所示,由输入层、输出层和至少一层的隐含层构成,其中隐藏层与输入层、输出层的神经元完全连接。通过有监督的训练改变网络中神经元之间的连接权重,MLP可以成为能以任意精度32-33逼近集合上任何函数34的通用函数逼近器35。在复杂非线性拟合问题上,MLP可以提供较为精确的近似解。

图3

图3   多层感知机示意图

Fig.3   Schematic diagram of multi-layer perceptron


4 实验设计与数据准备

4.1 实验数据准备

4.1.1 模型训练及测试数据集

先将地面水质监测数据与多源遥感及气象数据进行时空匹配,筛选出时空一致的数据,再根据地面水质监测值的概率分布信息剔除掉其中的异常值,最终形成用以反演模型训练和测试的样本数据集。

从样本数据集中随机抽取80%作为模型的训练集,剩余的20%作为测试集,用以模型的训练和测试。为了防止训练过程中模型过拟合,并评估模型的泛化性能,总共生成10组训练和测试集,将模型在10组测试集上性能指标的平均值作为模型最终的性能指标。

4.1.2 模型鲁棒性评估数据集

地面水质监测数据、多源遥感和气象数据中,除去作为模型训练和测试用的样本数据集之外,剩余的数据,根据地面水质监测数据与多源遥感和气象数据时空匹配的情况,可以分为以下4类,分别为:

(1)对某个地面监测站,虽然有空间上能与之匹配的多源遥感及气象数据,但如果它的某一特定时刻的水质监测数据,没有时间上能匹配的多源遥感数据,那么它在这个时刻的监测数据,称为时间未匹配的水质监测数据。

(2)对某个地面监测站,能与其空间匹配的所有多源遥感及气象数据,可以构成一个集合。如果集合不为空,并且至少有一组多源遥感及气象数据,与这个监测站的水质监测数据在时间上也能匹配,那么对于集合中剩余的,所有与这个监测站数据,在时间上不能匹配的多源遥感及气象数据,被称为时间未匹配的多源遥感及气象数据。

(3)对某个地面监测站,如果没有任何多源遥感及气象数据,能与其在空间上匹配,这个监测站的所有水质监测数据,称为空间未匹配的水质监测数据。

(4)对某个地面监测站,能与其空间匹配的所有多源遥感及气象数据,可以构成一个集合。如果集合不为空,并且没有任何一组多源遥感及气象数据,能与这个监测站的水质监测数据,在时间上匹配上,那么这个集合中的所有多源遥感及气象数据,称为空间未匹配的遥感数据。

用上述4种时空不匹配的数据集,对反演模型的鲁棒性进行评估。

模型训练和测试数据集、模型鲁棒性评估数据集所包含的地面水质监测数据、多源遥感及气象数据的情况,如表3所示。

表3   模型鲁棒性评估实验所用的数据集

Table 3  Data set used in model robustness assessment experiments

实验名称数据集水质参数/(个/组)
DOCODNH3-N
所有地面水质监测数据812 441811 147804 843
时空匹配实验训练数据249243216
测试数据757365
时间未匹配实验水质监测数据234 470235 918235 598
多源遥感及气象数据142142142
空间未匹配实验水质监测数据575 436580 629574 486
多源遥感及气象数据219219219

新窗口打开| 下载CSV


4.2 实验设计
4.2.1 建模参数选取

本研究在建立水质反演模型时,选择哨兵2的多光谱数据(MSI),MODIS的地表温度(LST)、植被指数(VI)、气溶胶光学厚度(AOD),以及ERA5的10 m风速(WS)作为候选的建模参数。其中,哨兵2的多个谱段的反射率可以体现水体中不同成分对光的吸收和反射情况,解析其与DO、COD和NH3-N参数值之间的关系,可以建立反演模型。

除了多光谱反射率之外,反映河流及周围环境因素的LST、VI、AOD和WS也被考虑进去。首先,大气状态和水面平整度与卫星观测到的反射率有关,卫星观测到的水表反射的太阳辐射需要在大气、水面和水体之间传输,在这个过程中,水面的起伏波动,以及大气中的气溶胶都会改变其原本的传输路径,导致观测到的反射率与实际的水表反射率之间产生偏差。另外,水体的富营养化程度和DO、COD和NH3-N之间也存在着密切的关联,河流的富营养化会导致水中藻类大量繁殖,影响水体的光学特性、氧气含量和各种生物过程,进而影响DO、COD和NH3-N参数值。综上,挑选能够影响水面平整度的风速、反映大气状态的气溶胶光学厚度,以及影响和反映水体中营养状态的地表温度和植被指数作为反演模型的辅助参数,以提供更加全面、准确的水质反演结果。

4.2.2 模型训练及性能评估实验

为了从哨兵2的MSI,MODIS的LST、VI、AOD,以及ERA5的WS等多源数据中,选择出每种水质参数反演模型最合适的输入特征组合,以哨兵2的多光谱数据为基础的输入特征,评估增加考虑环境因素和大气因素对反演模型性能的影响,总共可形成四大类共14种输入特征的组合,分别为:

(1)仅以哨兵2的多光谱为模型输入,即为MSI。

(2)增加河流周边地表温度和植被指数环境因素的影响,即可形成MSI+LST、MSI+VI、MSI+LST+VI,共3种输入特征组合。

(3)增加河流上空大气气溶胶光学厚度和10 m风速的影响,即可形成MSI+AOD、MSI+WS、MSI+AOD+WS,共3种输入特征组合。

(4)同时增加环境因素和大气因素的影响,即可形成MSI+LST+AOD、MSI+LST+WS、MSI+VI+AOD、MSI+VI+WS、MSI+LST+AOD+WS、MSI+VI+AOD +WS、MSI+LSI+VI+AOD+WS,共7种输入特征组合。

将以上14种输入特征组合,作为SVR、RF和MLP模型的输入,在训练集上分别训练DO、COD及NH3-N水质参数的反演模型。

3种水质参数的SVR、RF和MLP反演模使用Sklearn库36实现,并使用网格搜索法37自动搜索各个模型的最优超参数值。

当14种输入特征组合对应的各水质反演模型训练完成之后,使用测试集对模型反演结果的准确性进行测试和评估,选出最佳输入特征组合和对应的水质反演模型,作为模型训练实验的最终结果。

4.2.3 模型鲁棒性评估实验

如果模型的时空鲁棒性较好的话,当输入为不包含在模型训练和测试样本集内的多源遥感及气象数据时,模型反演出的水质参数的统计特征,也应与对应地面监测数据的统计特征相近似。

基于以上假设,分别使用4.1.2中说明的时间未匹配和空间未匹配的数据,开展时间未匹配和空间未匹配实验,以评估反演模型的时空鲁棒性。

因时间、空间未匹配实验缺少地表水质监测数据作为反演结果比较的“真值”,所以采用对比用箱形图表示的实验数据分布的统计特征,以评估模型的时空鲁棒性。同时,将模型训练过程作为时空匹配实验,将其结果的统计特征作为评估反演模型时空鲁棒性的参照。

4.3 评价指标

使用确定系数(The Coefficient of Determination,R238、平均绝对误差(Mean Absolute Error,MAE)39和均方根误差(Root Mean Square Error,RMSE)40这3种指标,评估模型反演结果的准确性。指标分别定义如下:

R2=1-i=1nyi-y^i2i=1nyi-y¯2
MAE=1ni=1nyi-y^i
RMSE=1ni=1nyi-y^i2

其中:yiy^i分别为第i个地面水质监测数据和其对应的模型反演结果;y¯为地面水质监测数据的平均值;n为样本总数。

5 结果分析

5.1 模型的训练及性能评估结果

5.1.1 最优超参数筛选

经实验筛选出的3种机器学习水质参数反演模型的超参数配置,如表4所示。

表4   3种机器学习水质参数反演模型的最优超参数表

Table 4  Optimal hyperparameter table of three machine learning water quality parameter retrieval models

机器学习模型参数名称非光学活性水质参数
DOCODNH3-N
SVRC1001010
gamma733
RF决策树个数152615
树的深度461510
MLP隐藏层数655
每个隐藏层神经元数100100100

新窗口打开| 下载CSV


5.1.2 各模型水质参数反演的最优输入特征组合

表5为SVR、RF和MLP模型在14种输入特征组合下的DO、COD和NH3-N水质参数反演结果。从表中可以看到,与仅使用哨兵2的MSI作为输入相比,输入数据中在叠加MODIS、ERA5的数据后,各模型的性能均有所提升。对于不同水质参数,能得到最优反演性能的模型不同,及对应的输入特征组合也不同,具体分析如下:

表5   SVR、RF和MLP模型在14种输入特征组合下的DO、COD和NH3-N反演结果

Table 5  DO, COD and NH3-N retrieval results of SVR, RF and MLP models for 14 combinations of input features

序号输入数据指标DOCODNH3-N
SVRRFMLPSVRRFMLPSVRRFMLP
1MSIR20.8370.8450.8320.6490.6990.6560.2420.4470.485
MAE/(mgL-1)0.3080.3930.4260.4770.5060.4740.1830.1440.139
RMSE/(mgL-1)0.4020.3840.4140.5940.5130.6120.1000.0710.066
2MSI+VIR20.8370.8520.3570.6500.6850.7440.1910.5230.353
MAE/(mgL-1)0.3020.3750.7290.4850.5020.4150.1880.1390.151
RMSE/(mgL-1)0.4070.3661.7110.5960.5370.4440.1060.0630.080
3MSI+LSTR20.8660.8600.7640.6110.6540.6050.2320.2920.386
MAE/(mgL-1)0.3060.3840.4650.5060.5460.5430.1820.1730.154
RMSE/(mgL-1)0.3360.3470.5940.6540.5920.7030.1000.0920.078
4MSI+VI+LSTR20.8900.8790.8410.6710.6730.7170.2510.2320.325
MAE/(mgL-1)0.2820.3590.3770.4720.5270.4300.1840.1680.154
RMSE/(mgL-1)0.2740.3000.3970.5600.5580.4910.0980.0960.084
5MSI+AODR20.8720.8630.8560.6760.6710.7220.3070.5070.432
MAE/(mgL-1)0.3000.3630.3680.4700.5140.4350.1650.1390.143
RMSE/(mgL-1)0.3200.3410.3600.5530.5640.4760.0910.0640.072
6MSI+WSR20.8020.8510.8350.6480.6990.7380.2890.4880.536
MAE/(mgL-1)0.3440.3850.3770.4640.4950.4310.1720.1430.129
RMSE/(mgL-1)0.4970.3640.4170.5990.5140.4490.0910.0660.061
7MSI+AOD+WSR20.8680.8290.7330.7040.6690.7810.3340.5290.502
MAE/(mgL-1)0.2930.4020.4540.4390.5150.3980.1710.1370.137
RMSE/(mgL-1)0.3300.4310.6470.5070.5650.3830.0870.0610.065
8MSI+VI+LST+AOD+WSR20.8890.8680.8530.6700.6600.7420.2210.2780.383
MAE/(mgL-1)0.2890.3780.3370.4870.5280.4140.1840.1680.153
RMSE/(mgL-1)0.2780.3320.3670.5640.5780.4450.0990.0920.079
9MSI+LST+WSR20.8530.8390.6950.6740.6420.7210.2490.3200.436
MAE/(mgL-1)0.3200.4110.5060.4790.5420.4460.1780.1610.149
RMSE/(mgL-1)0.3710.4040.7800.5570.6180.4820.0990.0870.073
10MSI+LST+AODR20.8960.8660.8370.6440.6560.7480.3140.3140.458
MAE/(mgL-1)0.2760.3690.3680.5060.5430.4380.1750.1650.143
RMSE/(mgL-1)0.2630.3330.4090.6110.5890.4280.0880.0890.070
11MSI+LST+AOD+WSR20.8910.8720.8570.7070.6460.7360.2730.2260.381
MAE/(mgL-1)0.2830.3700.3330.4410.5420.4240.1800.1700.152
RMSE/(mgL-1)0.2750.3200.3500.5060.6130.4700.0940.0980.078
12MSI+VI+WSR20.8350.8310.8170.6770.6900.7640.2170.4820.293
MAE/(mgL-1)0.3050.3820.3580.4640.5020.4040.1850.1450.162
RMSE/(mgL-1)0.4120.4160.4660.5530.5310.4120.1030.0660.092
13MSI+VI+AODR20.8690.8560.8670.6920.6670.7140.3130.4590.382
MAE/(mgL-1)0.2910.3710.3370.4390.5110.4190.1750.1460.146
RMSE/(mgL-1)0.3240.3600.3370.5290.5710.4980.0880.0690.077
14MSI+VI+AOD+WSR20.8790.8360.8440.6900.6760.7240.3070.5090.412
MAE/(mgL-1)0.2910.3960.3440.4520.5020.4090.1770.1390.145
RMSE/(mgL-1)0.3030.4100.3910.5260.5610.4830.0890.0640.077

新窗口打开| 下载CSV


溶解氧(DO):性能最优的模型为SVR,对应的输入特征组合为实验10中的MSI+LST+AOD,其R2为0.896,MAE为0.276 mg/L,RMSE为0.263 mg/L。比只使用哨兵2的MSI作为输入的R2提高7.04%,MAE降低10.39%,RMSE降低34.58%。

化学需氧量(COD):性能最优的模型为MLP,对应的输入特征组合为实验7中的MSI+AOD+WS,其R2为0.781,MAE为0.398 mg/L,RMSE为0.383 mg/L。比只使用哨兵2的MSI作为输入的R2提高19.05%,MAE降低16.03%,RMSE降低37.42%。

氨氮(NH3-N):性能最优的模型为RF,对应的输入特征组合为实验7中的MSI+AOD+WS,其R2为0.529,MAE为0.137 mg/L,RMSE为0.061 mg/L。比只使用哨兵2的MSI作为输入的R2提高18.34%,MAE降低4.86%,RMSE降低14.08%。

5.1.3 各模型在3种水质参数上的最优性能

表5中挑选出能达到最优反演性能的SVR、RF和MLP模型的性能指标,作为表6的内容。表6中同时列出多元线性回归(MLR)模型的反演性能指标作为对比参照。

表6   不同方法的模型能到的最佳水质参数反演性能

Table 6  The best retrieval performance of water quality parameters that can be obtained by models of different methods

方法指标非光学活性水质参数
DOCODNH3-N
MLRR20.3830.0660.120
MAE/(mgL-1)1.0271.0460.251
RMSE/(mgL-1)1.6501.5610.132
SVRR20.8960.7070.334
MAE/(mgL-1)0.2760.4410.171
RMSE/(mgL-1)0.2630.5060.087
RFR20.8790.6990.529
MAE/(mgL-1)0.3590.4950.137
RMSE/(mgL-1)0.3000.5140.061
MLPR20.8670.7810.536
MAE/(mgL-1)0.3370.3980.129
RMSE/(mgL-1)0.3370.3830.061

新窗口打开| 下载CSV


从DO、COD和NH3-N3种水质参数反演性能的平均指标来看,整体上MLP模型的R2最高、MAE和RMSE最低。MLP模型反演结果的R2均大于0.536,与作为参照的传统的MLR模型相比,机器学习方法能显著提高水质参数反演的性能。 RF模型反演结果的相关性第二高,R2均大于0.529,RF模型对DO反演结果的性能要比MLP模型稍好。

5.2 模型的鲁棒性评估结果
5.2.1 时空匹配实验(模型训练和测试实验)结果

图4为3种水质参数时间匹配实验结果的箱形图。图中黑色、灰色,和白色箱形,分别表示实验中所有地面水质监测数据、样本中训练模型用的水质监测数据,和模型用样本中作为测试的多源遥感及气象数据反演得到的水质参数值的统计特征。

图4

图4   所有地面水质监测数据,样本中的模型训练数据、模型用样本中测试数据反演的水质参数的年度对比箱形图

(黑色箱形代表所有站点的水质监测数据,灰色箱形代表样本中训练反演模型的水质监测数据;白色箱形代表模型用样本中测试数据反演出的水质参数;箱形图中,箱体内的实线表示中位数,箱体的下边缘和上边缘分别表示下四分位数(Q1)和上四分位数(Q3),箱形外的上下横线表示最大值和最小值,o表示异常值)

Fig.4   Annual boxplots of all surface water quality monitoring data, model training data in the sample set, water quality parameters retrieved by the models with test data in the sample set


如果灰色箱形与黑色箱形相似,表示在时空匹配实验中,反演模型训练所用数据的统计特征,与所有地面水质监测数据的统计特征相似,即训练数据的代表性较好。如果白色箱形与灰色箱形相似,表示模型用样本中测试数据反演出的水质参数的统计特征,与样本中训练数据的统计特征相似,即模型得到了合理的训练。如果白色箱形与黑色箱形相似,则表示模型的泛化性较好。

图4可以看出,通过箱形图分析得到的在3种水质参数反演模型的性能,与表5表6中的结果相同。其中,DO反演模型训练数据的代表性最好,DO模型得到了合理的训练,模型的过拟合程度最低;COD反演模型得到了合理的训练,但模型训练数据中,只有2019年数据的代表性较好,其他两年因训练数据代表性较差的原因,模型有较明显的过拟合现象;NH3-N反演模型训练得最差,特别是对于训练数据代表性最差的2017年,用样本中测试数据反演得到NH3-N参数值的统计特征,与样本中训练数据和所有地面监测数据的统计特征有明显的差异。

5.2.2 时间未匹配实验结果

图5为3种水质参数时间未匹配实验结果的箱形图。图中黑色、灰色,和白色箱形,分别表示实验中所有地面水质监测数据、时间未匹配的水质监测数据,和模型用时间未匹配的多源遥感及气象数据反演得到的水质参数值的统计特征。

图5

图5   所有地面水质监测数据,时间不匹配的水质监测数据、模型用时间不匹配的多源遥感及气象数据反演的水质参数的年度对比箱形图

(黑色箱形代表所有站点的地面水质监测数据,灰色箱形代表时间不匹配的水质监测数据,白色箱形代表模型用时间不匹配的多源遥感及气象数据反演出的水质参数; 箱形图中,箱体内的实线表示中位数,箱体的下边缘和上边缘分别表示下四分位数(Q1)和上四分位数(Q3),箱形外的上下横线表示最大值和最小值,o表示异常值)

Fig.5   Annual boxplots of all ground-based water quality monitoring data, time-mismatched water quality monitoring data, water quality parameters inverted by the models with time-mismatched multi-source remote sensing data


根据表3,时间未匹配的地面水质监测数据量约占到所有地面水质监测数据总量的29%左右,因此与图4相比,灰色箱形与黑色箱形更为接近,表明时间未匹配的水质监测数据的代表性,比训练模型所用数据的代表性更好。

图5可以看出,DO和COD反演模型都有较好的时间鲁棒性,NH3-N反演模型的时间鲁棒性很差,这可能是因为图4中所示的NH3-N反演模型训练数据的代表性较差等原因导致。

5.2.3 空间未匹配实验结果

图6为3种水质参数空间未匹配实验结果的箱形图。图中黑色、灰色,和白色箱形,分别表示实验中所有地面水质监测数据、空间未匹配的水质监测数据,和模型用空间未匹配的多源遥感及气象数据反演得到的水质参数值的统计特征。

图6

图6   所有地面水质监测数据,空间不匹配的水质监测数据、模型用空间不匹配的多源遥感及气象数据反演的水质参数的年度对比箱形图

(黑色箱形代表所有站点的地面水质监测数据,灰色箱形代表空间不匹配的水质监测数据,白色箱形代表模型用空间不匹配的多源遥感及气象数据反演出的水质参数;箱形图中,箱体内的实线表示中位数,箱体的下边缘和上边缘分别表示下四分位数(Q1)和上四分位数(Q3),箱形外的上下横线表示最大值和最小值,o表示异常值)

Fig.6   Annual boxplots of all ground-based water quality monitoring data, space-mismatched water quality monitoring data, water quality parameters inverted by the models with space-mismatched multi-source remote sensing data


根据表3,空间未匹配的地面水质监测数据量约占到所有地面水质监测数据总量的71%左右,因此灰色箱形与黑色箱形大致相同,表明空间未匹配的地面水质监测数据与所有地面水质监测数据具有基本相同的统计特征。

图6可以看出,DO反演模型都有较好的空间鲁棒性,COD反演模型的空间鲁棒性较差,NH3-N反演模型的空间鲁棒性最差,这同样可能是因为图4中所示的NH3-N反演模型训练数据的代表性较差等原因导致。

图6所示的DO和COD反演模型的空间鲁棒性,比图5所示的两个模型的时间鲁棒性要差。图6图5的唯一差异是,白色箱形所代表的水质参数反演所用的多源遥感及气象数据的筛选条件不同。图6所用的空间未匹配多源遥感及气象数据的筛选条件是,对应某个地面水质监测站的所有多源遥感及气象数据中,没有任何一组被选入训练和测试模型用的样本数据集。图5所用的时间未匹配多源遥感及气象数据的筛选条件则为,至少有一组被选入训练和测试模型用的样本数据集。由此可见,是否能有更多的地面站点对应的监测数据,被选入模型训练和测试的样本数据集,对模型的时空鲁棒性有直接的影响。

6 讨 论

6.1 地表温度和植被指数对反演性能的影响

在反演DO、COD和NH3-N时,温度和植被指数是两个重要因素。首先,温度会通过直接或间接的方式影响DO、COD和NH3-N的浓度。对于所研究的3种水质参数,DO主要来源于从大气中转移到水体里的氧气,以及藻类和其他水生植物光合作用产生的氧气41。COD作为衡量有机污染物对水污染程度的指标42,会受到微生物消耗氧气以降解有机物这一过程的影响11。而NH3-N会在氧气的参与下被藻类吸收43。所以水温会通过影响氧气溶解度的方式44,进而影响DO、COD和NH3-N的浓度。同时水温也会影响微生物的呼吸和氧化过程4546,导致DO、COD和NH3-N浓度变化。因此在反演水质参数时考虑温度的影响,能够在一定程度上提高模型的精度。

而NH3-N作为营养物质,会导致藻类和其他水生植物过度繁殖47,大量消耗水中的氧气,DO与COD的浓度也会随之变化。叶绿素a作为浮游植物中最重要的色素之一,可以衡量浮游植物生物量和水体富营养化程度13。而植被指数与水体中的叶绿素a浓度有较高的相关性4548-49,另外河流周围植被的活跃程度(如森林的覆盖程度),也和水中的叶绿素a浓度具有一定关系13。因此,在建立反演模型时,增加反映水体营养状态的植被指数等参数,可以提高模型的反演性能。

6.2 气溶胶和风速对反演性能的影响

大气中的各种由固态和液态颗粒物组成的气溶胶,会通过直接和间接的吸收和散射方式影响光在大气中的传输过程。卫星载荷的传感器接收到的水体表面出水辐射,不仅受水体成分和水底吸光度的影响,也受到大气中气溶胶散射导致的衰减影响750。在遥感数据产品生产过程中,通常用均值或某一大气剖面状态预先定义的气溶胶光学厚度来进行大气辐射校正751。这种方式并不能反映高频的气溶胶光学厚度的实际变化情况。因此在反演模型中,使用MODIS的气溶胶数据产品,可以一定程度上弥补这个问题,从而提高模型反演性能。

河流上的风速会影响水面的平整度,进而对入、出水辐射造成影响。在反演模型的输入数据中加入风速数据,可以使模型在一定程度上考虑水面平整度的影响,从而改善模型的反演性能。

表5中可以看到,将气溶胶光学厚度和风速信息加入到模型输入中时,DO、COD和NH3-N的反演精度会有所提高。

6.3 模型的应用

以南通附近的长江段和东莞附近的珠江段为研究区域,在谷歌地球引擎平台上收集研究区域在特定时间的哨兵2、MODIS地表温度、植被指数和气溶胶光学厚度数据以及ERA5风速数据。基于目视制作的水体掩膜栅格数据,提取出遥感及气象数据中对应于水体部分的数据,作为多源遥感及气象数据。利用表5中能获得最佳反演性能的模型及对应的输入特征组合,反演出两个区域的DO、COD和NH3-N水质参数,并如图7所示分别绘制它们的空间分布图。

图7

图7   用多源遥感及气象数据反演的一部分长江河和珠江江段的DO,COD,NH3-H水质参数空间分布

Fig.7   Spatial distribution of DO, COD and NH3-H water quality parameters in a part of Yangtze and Pearl River retrieved from multi-source remote sensing data


图7(a)显示的南通附近长江段的DO空间分布具有较为明显的变化,水质由北向南逐渐变差。相比之下,COD和NH3-N空间分布较为均匀。在该区域西南部的近岸水域水质较差,推测是因为此处为一个半封闭的湾区,地形的原因使水域的流通性变弱,污染物会在此聚集52

图7(b)显示的南通西侧长江段,DO和COD的浓度总体上从东向西逐渐增加,西部的双山岛附近COD浓度较高,推测可能是因为双山岛对岸分布着工业区和码头,工业活动和船舶活动导致附近水质较差。另外,COD和NH3-N在东北部岛屿附近的长江支流处,均出现了较高值。该长江支流北岸分散着几处农田,而南岸的岛屿又分布着居民区、度假村、工业区等,因此推测该狭长地带两岸较为活跃的人类活动,影响了流经此处的长江支流的水质。

图7(c)显示的东莞附近的珠江段可以看出,该流域东北部穿插在城市或者农田之间的一些支流中,COD和NH3-N浓度偏高。可能是因附近生活排水和农业灌溉和地表径流导致的氮和磷化合物进入水体,过量的营养元素导致水体富营养化11的影响。人类的日常活动、工业废水的排放和农业化肥的使用等,都会对DO、COD和NH3-N的浓度造成影响。

7 结 论

本文基于多源遥感卫星数据,利用全国主要流域地表水水质监测站观测数据,建立了基于机器学习的反演模型。其中选择对DO、COD和NH3-N 3种非光学活性水质参数进行研究,并为每种水质参数选择最佳的输入特征组合。结果显示基于机器学习的模型比传统的多元线性回归模型更能捕捉到反演非光学活性参数所需要的多源遥感以及气象数据的线性和非线性关系。通过实验证明,当样本的代表性与全局水质数据较为接近时,反演模型的时间和空间鲁棒性都比较好。另外对输入特征组合进行分析,发现对于溶解氧的反演,温度和反映植被动态的植被指数较为重要;对于化学需氧量和氨氮,影响反射率的风速和气溶胶更能够提高模型的性能。在未来的工作中,计划将风速数据的降尺度操作进行更精细的模拟,以在本研究的基础上进一步提高水质参数的反演效果,为遥感水质监测和水质分析提供有用的借鉴信息。

参考文献

ZHOU GuanhuaTANG JunwuTIAN Guolianget al.

Uncertainty analysis of inland water quality remote sensing: A renew

[J]. Advances in Earth Science,2009242):150-158.

[本文引用: 1]

周冠华唐军武田国良.

内陆水质遥感不确定性:问题综述

[J]. 地球科学进展, 2009242):150-158.

[本文引用: 1]

LI SSONG KWANG Set al.

Quantification of chlorophyll-a in typical lakes across China using Sentinel-2 MSI imagery with machine learning algorithm

[J].Science of The Total Environment,2021146271.DOI:10.1016/j.scitotenv. 2021. 146271

[本文引用: 2]

WANG ShanshanLI YunmeiWANG Yongboet al.

Suitability of the retrieval models for estimating chlorophyll concentration in Lake Taihu

[J]. Journal of Lake Sciece,2015271):150-162.

[本文引用: 1]

王珊珊李云梅王永波.

太湖水体叶绿素浓度反演模型适宜性分析

[J].湖泊科学,2015271):150-152.

[本文引用: 1]

XIANG WZW AGE L Aet al.

Remote estimates of total suspended matter in China's main estuaries using Landsat images and a weight random forest model

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 202218394-110.

[本文引用: 1]

ZHANG YiboZHANG YunlinZHA Yonget al.

Remote sensing estimation of total suspended matter concentration in Xin'anjiang reservoir using Landsat 8 data

[J]. Environmental Science, 2015361):56-63.

[本文引用: 1]

张毅博张运林査勇.

基于Landsat 8影像估算新安江水库总悬浮物浓度

[J]. 环境科学, 2015361):56-63.

[本文引用: 1]

HONGTDU ARONG Het al.

Optical characterization of black water blooms in eutrophic waters

[J]. Science of the Total Environment,2014. DOI:10.1016/j.scitotenv.2014.02.113

[本文引用: 1]

YANG HKONG JHU Het al.

A review of remote sensing for water quality retrieval: Progress and challenges

[J]. Remote Sensing,2022148):1770. DOI:10.3390/rs14153694

[本文引用: 5]

CHEBUD YNAJA G MRIVERO R Get al.

Water quality monitoring using remote sensing and an artificial neural network

[J]. Water, Air, & Soil Pollution, 20122234875-4887.

[本文引用: 1]

WANG XLI F UCHANSHENG H E.

Applying support vector regression to water quality modelling by remote sensing data

[J]. International Journal of Remote Sensing, 20113223): 8615-8627.

[本文引用: 1]

HUANGFU KLI JZHANG Xet al.

Remote Estimation of Water Quality Parameters of Medium- and Small-Sized Inland Rivers Using Sentinel-2 Imagery

[J]. Water,20201211):3124. DOI:10.3390/w12113124

[本文引用: 2]

GUOHUANGCHENet al.

A machine learning-based strategy for estimating non-optically active water quality parameters using Sentinel-2 imagery

[J]. International Journal of Remote Sensing,2021.DOI:10.1080/01431161. 2020. 1846222 .

[本文引用: 4]

PETERSON K TSAGAN VSLOAN J J.

Deep learning-based water quality estimation and anomaly detection using Landsat-8/Sentinel-2 virtual constellation and cloud computing

[J]. GIScience And Remote Sensing, 2020574): 510-525.

[本文引用: 1]

KIM Y WKIM TSHIN Jet al.

Validity evaluation of a machine-learning model for chlorophyll a retrieval using Sentinel-2 from inland and coastal waters

[J]. Ecological Indicators,2022137108737. DOI:10.1016/j.ecolind.2022.108737

[本文引用: 3]

GORELICK NHANCHER MDIXON Met al.

Google Earth Engine: Planetary-scale geospatial analysis for everyone

[J]. Remote Sensing of Environment,2017202. DOI:10. 1016/j.rse.2017.06.031

[本文引用: 3]

DRUSCH MDEL BELLO UCARLIER Set al.

Sentinel-2: ESA's optical high-resolution mission for GMES operational services

[J]. Remote sensing of Environment, 201212025-36.

[本文引用: 2]

FANG Li.

National surface water quality monitoring data

[DB].2020.07.19,2022.07.04

[本文引用: 1]

方利.

国控地表水水质监测数据

[DB].2020.07.192022.07.04.

[本文引用: 1]

MULLER-WILM ULOUIS JRICHTER Ret al.

Sentinel-2 level 2A prototype processor: Architecture, algorithms and first results

[C]∥ Proceedings of the ESA Living Planet SymposiumEdinburgh, UK. 20139-13.

[本文引用: 1]

WAN ZHOOK SHULLEY.

G. MOD11A1 MODIS/Terra Land Surface Temperature/Emissivity Daily L3 Global 1km SIN Grid V006

[C]∥ NASA EOSDIS Land Processes DAAC2015.

[本文引用: 1]

WAN ZHOOK SHULLEY.

G. MYD11A1 MODIS/Aqua Land Surface Temperature/Emissivity Daily L3 Global 1km SIN Grid V006

[C]∥ NASA EOSDIS Land Processes DAAC2015.

[本文引用: 1]

DIDAN K.

MOD13Q1 MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V006

[DS]. 2015

[本文引用: 1]

DIDAN K.

MYD13Q1 MODIS/Aqua Vegetation Indices 16-Day L3 Global 250m SIN Grid V006

[DS]. 2015

[本文引用: 1]

LYAPUSTIN AWANG Y.

MCD19A2 MODIS/Terra+Aqua Land Aerosol Optical Depth Daily L2G Global 1km SIN Grid V006

[DS]. 2018

[本文引用: 1]

CHENG X.

Fine-resolution mapping of pan-arctic lake ice-off phenology based on dense sentinel-2 time series data

[J]. Remote Sensing, 20211314): 2742. DOI:10.3390/rs 13142742

[本文引用: 1]

ROUSSEEUW P JDRIESSEN K V.

A fast algorithm for the minimum covariance determinant estimator

[J]. Technometrics,1999413): 212.

[本文引用: 1]

VAPNIK V N.

Adaptive and learning systems for signal processing communications, and control

[J]. Statistical Learning Theory,1998.

[本文引用: 2]

BREIMAN.

Random forests

[J]. Mach Learn, 2001451): 5-32.

[本文引用: 2]

HECHTNIELSEN R.

Counterpropagation networks

[J]. Applied Optics, 19872623): 4979-4983.

[本文引用: 1]

WANG FengxiaXIA ZhuoyiGUO Yuhuiet al.

Water quality inversion and eutrophication assessment of The South China Sea based on GEE

[J]. China Environmental Science,2022422):826-833.

[本文引用: 2]

王凤霞夏卓异郭雨辉.

基于GEE的中国南海水质反演与富营养化评价

[J]. 中国环境科学,2022422):826-833.

[本文引用: 2]

VAPNIK V N.

EEstimation of Dependence Based on Empirical Data

[M]. Springer Science & Business Media, 2006.

[本文引用: 1]

KUTER S.

Completing the machine learning saga in fractional snow cover estimation from MODIS Terra reflectance data:Random forests versus support vector regression

[J]. Remote Sensing of Environment,2021255112294. DOI:10.1016/j.rse.2021.112294

[本文引用: 2]

BREIMAN L.

Bagging predictors

[J]. Machine learning, 1996242): 123-140.

[本文引用: 1]

HORNIK K.

Approximation capabilities of multilayer feedforward networks

[J]. Neural Networks, 199142): 251-257.

[本文引用: 1]

HORNIK K.

Some new results on neural network approximation

[J]. Neural Networks, 199368): 1069-1072.

[本文引用: 1]

ELLACOTT S.

W. Aspects of the numerical analysis of neural networks

[J]. Acta Numerica, 19943145-202.

[本文引用: 1]

HORNIK KSTINCHCOMBE M BWHITE H.

Multilayer feedforward networks are universal approximators

[J]. Neural Networks,198925): 359-366. DOI:10.1016/0893-6080(89)90020-8

[本文引用: 1]

KOMER BBERGSTRA JELIASMITH C.

Hyperopt Sk-learn: Automatic Hyperparameter Configuration for Scikit Learn

[J]. Icml Automl Workshop, 2014. DOI:10.25080/MAJORA-14BD3278-006

[本文引用: 1]

WANG X LLI Zhanbin.

Identifying the Parameters of the Kernel Function in Support Vector Machines Based on the Grid[1]Search Method

[J]. Periodical of Ocean University of China,2005355):4. DOI:10.3969/j.issn.1672-5174. 2005.05.032

[本文引用: 1]

王兴玲李占斌.

基于网格搜索的支持向量机核函数参数的确定

[J].中国海洋大学学报:自然科学版, 2005355):4. DOI:10.3969/j.issn.1672-5174.2005.05.032

[本文引用: 1]

NAGELKERKE N.

A note on a general definition of the coefficient of determination

[J]. Biometrika,1991783):691-702. DOI:10.2307/2337038

[本文引用: 1]

COYLE E JLIN J H.

Stack filters and the mean absolute error criterion

[J]. IEEE Trans Acoustics Speech Signal Processing, 1988368): 1244-1254.

[本文引用: 1]

FABER N K M.

Estimating the uncertainty in estimates of root mean square error of prediction: application to determining the size of an adequate test set in multivariate calibration

[J]. Chemometrics and Intelligent Laboratory Systems, 1999491): 79-89.

[本文引用: 1]

MONTGOMERY J M. Water treatment: principles and design[M]. Water treatmentPrinciples and design. John Wiley & Sons. 1985

[本文引用: 1]

GUO QZHANG DCAO Let al.

A Remote Sensing Method to Inverse Chemical Oxygen Demand in Qinghai Lake

[C]∥ Proceedings of the 2021 IEEE International Geoscience and Remote Sensing Symposium IGARSS, F, 2021. IEEE.

[本文引用: 1]

XIE YuruSHEN YangXU Yun.

Discussion on the Treatment of Eutrophic Water by Algae Membrane

[J]. Technology and Enterprise,20146):268.

[本文引用: 1]

谢玉茹沈阳徐云.

关于藻类膜处理富营养化水体的探讨

[J].科技与企业,20146):268.

[本文引用: 1]

KIM Y HSON SKIM H-Cet al.

Application of satellite remote sensing in monitoring dissolved oxygen variabilities: A case study for coastal waters in Korea

[J]. Environment international,2020134105301. DOI:10.1016/j.envint. 2019. 105301

[本文引用: 1]

CâNDIDO A K A AHAUPENTHAL M RSILVA N M DAet al.

Water quality and chlorophyll measurement through vegetation indices generated from orbital and suborbital images

[J]. Water, Air, & Soil Pollution,20162277):1-11. DOI:10.1007/s11270-016-2919-7

[本文引用: 2]

DE ASSIS ESTEVES F.

Fundamentos de Limnologia

[M]. Interciência,1998.

[本文引用: 1]

HUANG JunCHEN Jianzhong.

Recent advances on the treatment technologies of ammonia-nitrogen wastewater

[J]. Journal of Environmental Engineering, 200231): 65-68.

[本文引用: 1]

黄骏陈建中.

氨氮废水处理技术研究进展

[J]. 环境工程学报, 200231): 65-68.

[本文引用: 1]

RODRíGUEZ-LóPEZ LDURAN-LLACER IGONZALEZ-RODRIGUEZ Let al.

Spectral analysis using LANDSAT images to monitor the chlorophyll-a concentration in Lake Laja in Chile

[J]. Ecological Informatics,202060101183. DOI:10.1016/j.ecoinf.2020.101183

[本文引用: 1]

KIM E JNAM S HKOO J Wet al.

Hybrid approach of Unmanned Aerial Vehicle and Unmanned Surface Vehicle for assessment of chlorophyll-a imagery using spectral indices in Stream, South Korea

[J]. Water,20211314):1930. DOI:10.3390/w13141930

[本文引用: 1]

IOCCG.

Atmospheric correction for remotely-sensed ocean-colour products

[R]. Reports of the International Ocean-Colour Coordinating Group2010.

[本文引用: 1]

WARREN M ASIMIS SMARTINEZ-VICENTE Vet al.

Assessment of atmospheric correction algorithms for the Sentinel-2A MultiSpectral Imager over coastal and inland waters

[J]. Remote Sensing of Environment,2019225267-289.

[本文引用: 1]

LI HZHANG GZHU Yet al.

Inversion and driving force analysis of nutrient concentrations in the ecosystem of the Shenzhen-Hong Kong Bay Area

[J]. Remote Sensing,20221415):3694. DOI:10.3390/rs14153694

[本文引用: 1]

/