基于Landsat8遥感影像的青海湖BOD含量反演模型研究
作者: 张怡然 牛海林 冯昶瑞 谢朝阳 宋玉庭
摘要 为了解青海湖BOD含量反演的最适模型,根据Landsat8数据特点及反演技术要求,利用波段比值法对青海湖BOD含量进行反演模型研究。首先利用经过预处理的Landsat8影像中7个波段分别与BOD含量建立反演关系,选择拟合度较高的B5、B6、B7波段,按照B5+B6、B5+B7、B6+B7、B5+B6+B7、B5×B6、B5×B7、B6×B7、B5×B6×B7的波段组合策略进行波段组合,对各个组合波段与BOD含量分别建立指数函数、线性函数、幂函数和对数函数4种类型的反演模型,结果表明,拟合度最高的模型是y=0.743 3e0.000 2x(R2=0.636 7),最后利用该模型对青海湖8个点BOD含量实测值进行验证时发现反演得到的预测值与实测值的决定系数(R2)为0.574 1,且8个验证点中实测值与预测值相对误差小于30%的验证点有6个,故认为利用该模型进行青海湖BOD含量反演是可行的。
关键词 Landsat8遥感影像;BOD含量;反演模型;青海湖流域
中图分类号 X 171.1 文献标识码 A 文章编号 0517-6611(2022)15-0055-04
doi: 10.3969/j.issn.0517-6611.2022.15.015
开放科学(资源服务)标识码(OSID):
Research on the Inversion Model of BOD Content in Qinghai Lake Based on Landsat8 Remote Sensing Images
ZHANG Yi-ran,NIU Hai-lin,FENG Chang-rui et al
(College of Eco-environmental Engineering of Qinghai University,Xining,Qinghai 810016)
Abstract In order to understand the optimal model for the inversion of the BOD content in Qinghai Lake,this paper used the band ratio method to study the inversion model of the BOD content in Qinghai Lake according to the characteristics of Landsat8 data and the technical requirements of inversion.First,the seven bands in the preprocessed Landsat8 image were used to establish an inversion relationship with the respective BOD contents,and select the three bands with higher fitting degree:B5,B6 and B7.The band combination strategy of B5+B6,B5+B7,B6+B7,B5×B6,B5×B7,B6×B7,B5×B6×B7 performed band combination,and established exponential function,linear function,power function and logarithm for each combined band and BOD content.There were four types of inversion models for the function,and the results showed that the model with the highest fitting degree was y=0.743 3e0.000 2x (R2=0.636 7).Finally,the model was used to verify the measured BOD content of 8 points in Qinghai Lake.It was found that the coefficient of determination between the predicted value obtained by inversion and the measured value was R2=0.574 1,and the relative error between the measured value and the predicted value in the 8 verification points was less than 30%.There were 6 verification points,so it was feasible to use this model to invert the BOD content of Qinghai Lake.
Key words Landsat8 remote sensing image;BOD content;Inversion model;Qinghai Lake Basin
湖泊在人类繁衍生息过程中发挥着极其重要的作用。随着人类活动加剧及经济社会发展,全球范围内湖泊水质受到极大威胁。面对日益严峻的生态环境问题,需要进一步去探索更加高效且精准的监测方法。传统水质监测方法局限于实验室分析,尽管该方法精度高,但因其工作量大、耗时长等弊端,难以实现对湖泊水质的连续监测及早期预警。而遥感技术则利用不同传感器进行电磁波信息的收集及处理,通过收集到的遥感影像进行水质监测。较于传统监测手段,遥感监测在应用过程中体现出成本低、信息量大、高效、数据的强实时性、广覆盖面及可同步显示地物特征等优越性,可在一定程度上弥补传统监测方法的缺陷。基于以上特点,遥感技术在生态环境监测中的应用越来越广泛[1-3]。
湖泊中叶绿素在一定程度上是表征湖泊富营养化的重要指标,同时也可以反映湖泊中某些生物的分布情况[4]。利用遥感数据在可见光波段和近红外波段对叶绿素a的高吸收率和高反射率的光学性质,构建反演模型,预测水体叶绿素a浓度的分布情况,可以极大提升水质监测效率[5]。Kuhn等[6]分别利用Landsat8和santinel-2影像对亚马孙河格卢比亚河、密西西比河水体叶绿a浓度进行反演研究,结果表明,利用Landsat8影像对亚马孙河流进行反演时所得到的反演精度最高。综合现有研究来看,考虑到叶绿素在一定程度上受季节变化影响,因此在进行叶绿素反演时需考虑季节变化带来的干扰及影响,必要时可分别建模分析。王丽艳[7]利用MODIS遥感影像数据对呼伦湖流域水质进行了反演研究,且在时间序列上对呼伦湖流域富营养化状态进行了评价。吴欢欢等[8]利用神经网络模型和统计回归模型对天津市海河下游段总磷、总氮、氨氮和电导率进行反演研究,结果表明,通过利用神经网络模型对总磷、总氮和氨氮反演时均可达到较好的反演精度。吴志杰等[9]利用多光谱提出基于特征选择以及机器学习的叶绿素a遥感反演方法,并将该方法运用到阳澄湖水质反演过程中,分别从时间和空间两方面对叶绿素a含量进行分析,初步对引起叶绿素a含量变化的原因进行了研究。除此之外,遥感反演在大气反演中的应用也十分广泛。目前大气中PM2.5已成为我国主要大气污染物之一,利用卫星遥感反演气溶胶厚度已成为主要监测手段之一[10]。近年来为了提高反演精度,相关学者不断对反演模型进行优化,胡占占等[11]提出了时空XGBoost模型(STXGB)对我国区域内PM2.5进行空间浓度反演研究,且将该模型与随机森林(RF)、反距离加权XGBoost(XGBIDW)、BP神经网络(BPNN)、XGBoost模型结果进行对比,结果发现,将该模型用于我国区域内PM2.5反演研究更具有优越性。笔者根据Landsat8数据特点及反演技术要求,利用波段比值法对青海湖BOD含量进行反演模型研究,以期为青海湖BOD含量反演提供参考依据。
1 资料与方法
1.1 研究区概况
青海湖位于青藏高原东北缘,是我国第一大内陆高原咸水湖,属典型的构造断陷湖(图1)。湖区海拔高于青海东部河湟谷地和柴达木荒漠区。青海湖是以河流补给为主、辅以降水和冰川融水补给的封闭湖泊,入湖河流共计50条,多为季节性河流,主要有布哈河、沙柳河、泉吉河、哈尔盖河、甘子河、黑马河和倒淌河7条,流域河网特点表现为不对称的空间分布、西北稠密、流量大、东南稀疏、流量小等。该流域气候类型属于高原大陆性气候,植被以高寒草甸、高寒灌丛为主[12]。青海湖独特而丰富的自然景观、地质遗迹、湖沙风貌、生态奇观,是青海省国家公园自然保护地体系建设的重要载体[13],与此同时整个青海湖流域不仅是重要的生态功能区,更是生态敏感性区域。
1.2 数据获取及处理 该研究采用2018年9月11日青海湖BOD含量,BOD含量数据来源于青海省水文资源测报中心。遥感影像采用的是Landsat8遥感影像,遥感影像数据均从地理空间数据云以及中国科学院遥感与数字地球研究所下载所得。本着遥感影像云量小以及与水质数据时间间隔尽量小等原则,所选取的遥感影像包括2019年2月26日、2018年9月29日、2018年10月7日、2018年9月28日四景遥感影像,四景影像分辨率均为30 m。
由于Landsat8影像已经过几何校正和地形校正,Landsat8遥感影像预处理部分只需进行辐射定标、大气校正、镶嵌和掩膜提取即可。将图像的数字量化值(DN)转化为辐射亮度值或者反射率或者表面温度等物理量的处理过程。ENVI 5.3中的通用辐射定标工具能自动从元数据文件中读取参数从而完成辐射定标。大气校正目的是消除大气中水蒸气、氧气、二氧化碳、甲烷和臭氧等物质对地物反射的影响,消除大气分子和气溶胶散射的影响。大多数情况下,大气校正同时也是反演地物真实反射率的过程。图像镶嵌是将有地理坐标或者没有地理坐标的多景相邻遥感图像拼接合并成一幅大范围、无缝的合成图像的过程。由于青海湖流域面积较大,一景影像无法覆盖整个研究区,故需将多景影像通过镶嵌拼接合并成一幅单一合成影像。另外由于镶嵌拼接好的数据涵盖范围超过研究区,故需要按照研究区矢量范围对经过镶嵌处理的遥感影像进行掩膜提取处理。掩膜处理以后得到一幅完整的青海湖流域Landsat8遥感影像。
1.3 研究方法 该研究首先利用Landsat8遥感影像的7个波段分别与BOD含量进行反演,每次反演都会形成相应的模型以及决定系数(R2),通过对决定系数的比较,对于BOD含量筛选出与之拟合度较高的3个波段进行波段组合,波段组合按照B1+B2、B1+B3、B2+B3、B1×B2、B1×B3、B2×B3的策略进行。
1.3.1 各项水质指标与单波段反演。
在对青海湖流域各点BOD含量分别与Landsat8影像的7个波段各自建立模型的过程中,以各个单波段值作为自变量,以BOD含量作为因变量,分别建立各自变量与因变量之间的相关性关系,通过比较各个相关性结果,选择与BOD含量拟合度较高的3个波段。
1.3.2 各项水质指标与波段组合反演。
将与BOD含量拟合度较高的波段按照反演波段组合策略进行波段组合,对各个组合波段与BOD含量分别进行对数函数、幂函数、线性函数、指数函数4种形式的建模。
2 结果与分析
2.1 青海湖流域BOD反演单波段回归模型建立
在青海湖流域BOD含量反演单波段回归模型建立过程中,以Landsat8影像的7个波段分别作为自变量,以BOD含量实测值作为因变量,分别建立指数函数、线性函数、幂函数和对数函数4种类型的回归模型。根据相关性分析可知(表1),与BOD含量拟合度较高的3个波段分别是B5、B6、B7。