基于GEE云平台和Sentinel数据的滇池湿地制图
作者: 罗蓉蓉 董燕
摘要 基于Google Earth Engine (GEE)和Sentinel数据,结合地形数据,提取影像的光谱指数、红边指数、纹理特征、雷达特征和地形特征,通过RF-RFE方法筛选特征得到最优特征数据集,使用基于像元的方法(随机森林)和面向对象的方法(简单非迭代聚类+随机森林)实现滇池湿地制图,探讨不同分类方法、特征变量对滇池湿地制图的影响。结果表明,面向对象方法优于基于像元方法,总体精度为90.86%,Kappa系数为0.887。面向对象方法可以有效减轻“椒盐现象”,以及湿地和非湿地错分现象,RF-RFE方法可以去除冗余特征,有效提高分类效率。基于GEE平台的面向对象方法适合于高原湖泊滇池湿地制图。
关键词 滇池;湿地;随机森林;简单非迭代聚类;Google Earth Engine;Sentinel
中图分类号 S 127 文献标识码 A
文章编号 0517-6611(2025)04-0205-04
doi:10.3969/j.issn.0517-6611.2025.04.044
开放科学(资源服务)标识码(OSID):
Wetlands Mapping in Dianchi Lake Based on GEE Cloud Platform and Sentinel Data
LUO Rong rong,DONG Yan
(Kunming University of Science and Technology,Kunming,Yunnan 650093)
Abstract Based on Google Earth Engine (GEE) and Sentinel data,combined with terrain data,the spectral index,red edge index,texture features,radar features and terrain features of the images were extracted.The RF RFE method was used to select features to obtain the optimal feature dataset,and Pixel based methods (random forest) and object oriented methods (simple non iterative clustering+random forest) were used to map the Dianchi Lake wetland.We explored the impact of different classification methods and feature variables on the mapping of Dianchi Lake wetlands.The results indicated that the object oriented classification method outperformed the pixel based classification method,with an overall accuracy of 90.86% and a Kappa coefficient of 0.887.The object oriented method was effective in minimizing the ‘salt and pepper’ phenomenon and the misclassification of wetlands and non wetlands,while the RF RFE method could remove redundant features and effectively improve classification efficiency.The object oriented method based on the GEE platform was suitable for mapping the wetlands of highland Dianchi Lake.
Key words Dianchi Lake;Wetland;Random forest;Simple non iterative clustering;Google Earth engine;Sentinel
作者简介 罗蓉蓉(1998—),女,贵州贵定人,硕士研究生,研究方向:遥感图像处理与应用。 *通信作者,副教授,硕士,硕士生导师,从事测绘新技术应用、遥感数据分析应用研究。
收稿日期 2024-02-28
湿地是一种位于水陆交汇处的特殊生态系统,具有涵养与净化水源、防洪抗旱、调节气候、维护区域生态平衡等重要功能[1-2]。滇池盆地是昆明经济发展最快、人口密度最高的地区。随着大规模城镇化、工业发展和人口快速增长,滇池湿地遭到严重破坏[3]。因此,及时获知滇池湿地面积和分布状况对滇池湿地建设与管理和滇池流域水环境保护与治理有重要意义。
与传统实地调查相比,遥感技术具有覆盖范围更广、易于更新、信息量丰富等优点,被广泛用于土地覆盖、湿地制图与监测等研究中[4-5]。Sentinel遥感数据因其具有独特的红边波段、较高的时空分辨率、容易获得等优点被广泛用于湿地制图,如Ruiz等[6]使用Sentinel数据对亚热带湿地植被物种进行分类。Slagter等[7]使用Sentinel时序数据对南非Lucias湿地植被进行分类。宁晓刚等[8]使用Sentinel数据对黑龙江流域沼泽湿地进行提取。
遥感分类方法通常分为基于像元分类和面向对象分类方法,基于像元分类方法的对象是基于单个像元,缺乏对空间结构关系考虑;面向对象分类,其分类对象是由多个相关像素组成,考虑区域信息特征[9]。Cai等[10]使用面向对象的随机森林分类方法对洞庭湖湿地进行分类。毛丽君等[11]分别使用基于像元和面向对象方法对钱江源国家公园进行土地覆盖分类研究。闫明等[9]使用面向对象方法对普洱市森林树种进行分类。
滇池地处南方高原地区,受到云雨天气影响较大,经常获得无效观测数据。Google Earth Engine (GEE)平台是一个全球性的开放数据访问平台,它不仅可以提供海量数据,还可以处理大规模的遥感数据,快速筛选最小云量获取最高质量遥感影像[8]。目前对滇池流域土地覆盖的研究比较普遍,但绝大多数研究并未将湿地作为一个单独的土地类别进行研究,且大多基于Landsat数据进行研究,缺少使用Sentinel数据的研究。鉴于此,笔者基于GEE平台和Sentinel数据,使用基于像元的方法(随机森林)和面向对象的方法(简单非迭代聚类+随机森林)对滇池湿地制图,探讨不同分类方法及特征变量对滇池湿地制图的影响。
1 资料与方法
1.1 研究区概况
滇池流域(102°29′~103°01′E,24°29′~25°28′N)位于长江、珠江、红河三大水系的分界处,地势东高西低,以滇池为中心,四面耸立,形成盆地、丘陵等地形。盆地总面积2 920 km2,约占昆明市总面积的13.8%,包括五华、盘龙、官渡、西山、呈贡等7个县(区)。区域性气候为亚热带湿润季风类型,干湿分明,5—10月为雨季。多年平均降水量为797~1 007 mm,蒸发量为1 409~1 871 mm,雨季降水量占年降水量的87%;年平均气温为14.6~15.9 ℃,日照强烈。滇池流域是云南城市化程度最高、经济最发达、人口最稠密的地区。该区域湿地以湖畔人工湿地为主,目前常见的植物种类有冷杉、柳树、杨树、芦苇、香蒲等。湖滨湿地具有改善滇池水质、减轻水污染、调节气候等的生态功能,是进入滇池的最后一道屏障[3]。
1.2 数据及预处理
1.2.1 遥感数据。
该研究所采用的遥感数据Sentinel-1、Sentinel-2以及地形数据均来源于GEE平台。 Sentinel-1数据分为在极地地区收集的HH、HV、VH和VV全极化数据,在其他地区收集的VH和VV数据。因此该研究雷达数据选取Sentinel-1干涉式宽扫描模式(IW)的双极化数据(VV+VH)。Sentinel-2数据共用13个波段,3个质量评估波段,其中13个波段的3个红边波段对湿地提取有好的效果[12]。滇池流域区域性气候为亚热带湿润季风类型,干湿分明,其中5—10月为雨季,从而造成滇池沼泽湿地在旱季显现、在雨季易被淹没的特点,又由于滇池地理位置的影响,光学遥感影像易受云雾干扰,因此该研究筛选了2020年1—4月云量小于10%的影像,共96景影像。对选取的96景影像利用质量评估(QA)波段进行云掩膜处理。
1.2.2 样本数据。
参考《湿地公约》及研究区相关文献[3],把研究区土地覆被类型分为水体、沼泽湿地、森林、耕地、草地和不透水面6类,其中沼泽湿地和水体是湿地主要类型。湿地样本通过2020年全球30 m湿地数据产品(GWL_FCS30)、JRC Global Surface Water (JRC_GSW)湿地数据结合研究区实地调查在光学影像和谷歌影像目视解译得到。非湿地样本通过ESA World Cover、Dynamic World (DW10)[13]、Global Land Cover with Fine Classification System at 30 m(GLC_FCS30)[14]3个土地覆盖数据结合光学和谷歌影像目视解译得到。以上GWL_FCS30和JRC_GSW湿地数据分别在AI earth平台和欧盟委员会网站上获取,ESA World Cover和DW10在GEE平台上获取,GLC_FCS30在“地球大数据科学工程”数据共享服务系统获取。通过目视解译得到的样本70%作为训练样本,30%作为验证样本,具体见表1。
1.3 研究方法
1.3.1 特征选择。
使用光谱波段特征、光谱指数特征、红边指数、纹理特征、雷达特征和地形特征构建特征数据集。
光谱波段包括B2-B8、B8A、B11、B12波段。光谱指数包括归一化耕作指数(NDTI)、归一化植被指数(NDVI)、归一化建筑指数(NDBI)、改进归一化差异水体指数(MNDWI)、增强植被指数(EVI)、自动水体提取指数(AWEIsh)、裸土指数(BSI);红边指数包括归一化植被指数红边(NDVIre1、NDVIre2、NDVIre3)、归一化红边差值指数(NDre1、NDre2)[8-9]。其中光谱波段计算其中值,光谱指数和红边波段计算其均值、最大值和方差加入特征集。