基于1D-CNN的植被等效水厚度反演研究
作者: 赵强 曹骁
摘要 [目的]为实现高等级公路路域植被等效水厚度(EWT)快速、连续、高效监测需求。[方法]以叶片尺度高光谱为数据源,首先对辐射传输模型PROSPECT-D模拟数据和实测光谱数据分别进行标准正态变量变换、归一化等光谱变换。应用相关性分析提取各变换光谱特征波段,基于PROSPECT-D模拟数据特征波段分别构建一维卷积神经网络(1D-CNN)、支持向量机路域植被叶片EWT反演模型,并用实测光谱数据进行模型验证。[结果]植被EWT最优反演路径为对光谱进行归一化预处理后,构建PROSPECT-D与1D-CNN组合模型,测试决定系数(R2C)为0.645、均方根误差(RMSEC)为2.367,精度较高,满足应用需求。[结论]该研究为利用高光谱数据对南方丘陵地区高等级公路植被EWT定量反演奠定了基础。
关键词 辐射传输模型;PROSPECT-D;叶片等效水厚度;光谱变换;一维卷积神经网络
中图分类号 P 237 文献标识码 A
文章编号 0517-6611(2023)18-0001-05
doi:10.3969/j.issn.0517-6611.2023.18.001
Study on Inversion of Vegetation Equivalent Water Thickness Based on 1D-CNN
ZHAO Qiang1,2,3,CAO Xiao4
(1.The Third Surveying and Mapping Institute of Hunan Province,Changsha,Hunan 410004;2.Hunan Geospatial Information Engineering and Technology Research Center, Changsha, Hunan 410004;3.Hunan Engineering Research Center of Geographic Information Security and Application,Changsha,Hunan 410004;4.The First Surveying and Mapping Institute of Hunan Province,Changsha,Hunan 410114)
Abstract [Objective]In order to realize the rapid, continuous and efficient monitoring requirements of equivalent water thickness (EWT) of vegetation in the road area of high-grade highway.[Method] Taking the leaf-scale hyperspectral data as the data source,first, the simulated data of the radiation transfer model (PROSPECT-D) and the measured spectral data were subject to spectral transformation, such as standard normal variate transformation, normalization and so on. The correlation analysis was applied to extract the characteristic bands of each transform spectrum. Based on the characteristic bands of the PROSPECT-D simulated data, the one-dimensional convolution neural network (1D-CNN) and support vector machine (SVM) models for retrieving the equivalent water thickness of vegetation leaves in the road domain were constructed respectively, and the model was verified with the measured spectral data. [Result]The optimal inversion path of vegetation equivalent water thickness was to construct a combined model of PROSPECT-D and 1D-CNN after the normalized pretreatment of the spectrum. The test determination coefficientwas 0.645, and the root mean square errorwas 2.367. The precision was high enough to meet the application requirements. [Conclusion]This study lays a foundation for quantitative inversion of EWT of high-grade highway vegetation in southern hilly areas using hyperspectral data.
Key words Radiation transfer model;PROSPECT-D;Blade equivalent water thickness;Spectral transformation;One-dimensional convolutional neural network (1D-CNN)
交通运输行业自改革开放以来迅猛发展[1-2],高等级公路周边生态环境和地质条件在公路修建、运营过程中遭到了不可修复的破坏。保护植被、关注有限的路域生态环境对实现可持续发展具有极为重要的意义[3],可以通过路域植被生长状况较为直观的反映[4]。叶片等效水厚度(equivalent water thickness,EWT)可以很好地表示植被生化过程,能够用以衡量植被生理状态和结构形态[5],可较好地应用于高速公路路域植被环境的监测与评价,因此如何准确反演预测路域EWT值得深入研究。
目前应用遥感方法对EWT进行反演已取得一定成果。Moghaddam等[6]利用综合孔径雷达数据建立植被含水量与冠层介电常数的经验统计模型进行反演;郭云开等[7]基于优选水分指数,利用PRO4SAIL构建多种EWT估算模型,经精度分析验证,EWT估算效果最优模型为RF-GA-SVM;Yang等[8]考虑不同波长之间的敏感性和相关性,提高了光谱波段选择的可靠性,在PROSPECT-D模型的基础上,初步检索5个生化特性参数;PROSPECT-D模型的性能优于以前的模型版本,模型预测不确定性降低,光合色素得到更好的检索,还能够在可见光域中以最小的误差模拟真实的叶片光学特性[9]。
随着人工智能的快速发展,基于深度学习的植被生化参数反演取得较大的进展。汤森林[10]在高光谱数据叶面积指数(LAI)反演研究中,发现基于特征选择的深度学习长短期记忆神经网络算法(LSTM)在模拟数据和野外实测数据中精度均优于经典的遗传算法和偏最小二乘相结合的方法(GA-PLSR)机器学习算法;颜庆[11]基于循环神经网络(RNN)和长短期记忆神经网络(LSTM),构造了特征级融合归一化植被指数(NDVI)反演模型,通过试验对比得出,深度学习算法可有效融合不同的数据集,有效提高植被参数的反演精度;凌康杰[12]针对传统特征与深度学习特征进行融合迁移,构建深度迁移网络,结果表明可以快速、高效、准确、无损测定柑橘叶片叶绿素真实值含量。
然而,目前对于PROSPECT-D耦合深度学习反演植被叶片EWT的研究较少,因此该研究首次提出了一种辐射传输模型PROSPECT-D耦合一维卷积神经网络(1D-CNN)反演EWT,以期为南方丘陵地区高等级公路植被EWT定量反演提供基础依据。
1 资料与方法
1.1 研究区概况
长常高速公路中长沙到益阳路段连接省会城市(长沙)和2个地级市(益阳、常德)是促进湘西北地区经济繁荣发展的重要通道。以长益高速公路及其沿线地带为研究区域,该路域处于南方典型的丘陵地带,属于中亚热带季风大陆型湿润气候,热量光照充足、降雨量丰沛、空气环境湿润,亚热带常绿阔叶林是典型植被。该路段在施工修建和营运过程中对沿线路域生态环境造成了不可修复的负面影响。
1.2 野外实测数据 野外试验共有60个样区,样区分布如图1所示(蓝色标记为样区)。样区选中心点1个及角点4个为测量点。在样区对具有代表性的植被类型叶片进行采样,对样本叶片标记编号后,将样本叶片放置于1 mg精密分析天平上称得样本叶片鲜重(FW)。把已获取FW的样本叶片放入烘箱,在80 ℃下烘干至恒重,称得烘干后的样本叶片干重(DW)。利用手持叶面积仪YMJ-B现场测量叶片面积,同一样本叶片面积分别测3次计算平均值作为最终的样本叶面积(A)。计算EWT(g/cm2)的公式如下:
EWT=(FW-DW)/A(1)
对从研究区域每个样区采集的典型植被叶片样品,使用Avafield-3便携式高光谱地物波谱仪在实验室内测量叶片高光谱数据,再经过剔除异常光谱曲线、平滑处理、均值计算、重采样等预处理,得到50组叶片反射率高光谱数据,实测光谱如图2所示。
1.3 研究方法 该研究以辐射传输理论为基础,按照“理论研究-模型构建-精度验证-模型应用”的研究思路,研究技术路线见图3。
1.3.1 PROSPECT-D模型基本原理。
PROSPECT-D模型认为折射率独立于叶片样本,是在PROSPECT-5模型的基础上增加参数化后的花青素得到的,使得该模型具有更强的适用性。PROSPECT-D模型为了防止错误的吸收分配,将各类输入参数对应波长范围进行适当缩小,比如,将花青素对应的波长精确缩小至400~660 nm。改良花青素反射率指数(mARI)在使用留一交叉验证法时得到最佳结果[9]。该公式定义如下:
mARI=(R-1green-R-1red,edge)×RNIR(2)
其中:R-1green是绿波段对应的平均反射率;R-1red,edge是红波段边缘对应的平均反射率;RNIR是760~800 nm的平均反射率。然后从排除mARI>5和Canth>12 μg/cm2的样品的子集导出花青素估算的线性模型:
Canth=2.11×mARI+0.45(3)
将公式(3)应用于ANGERS数据集以确定Canth。花青素含量在0~17.1 μg/cm2,平均值为1.7 μg/cm2。
1.3.2 一维卷积神经网络(1D-CNN)。
卷积神经网络(convolutional neural networks,CNN)中,卷积层的单元在一组滤波器的作用下连接上一层,它存在于特征图中,将连接起来的单元局部加权和非线性函数协同激发[13]。所以卷积层的第k个特征图由公式(4)定义:
hkij(x)=f((Wk·x)ij+bk)(4)
式中:hkij(x)为单元激活值;Wk为局部连接权值;bk为偏置值;f(z)是非线性激活函数。
池化层把相同信息进行融合,卷积和池化交替,然后普遍产生全连接层。池化层由公式(5)定义: