便捷式近红外光谱仪在土壤养分中的预测研究
作者: 卫青 李长昱 许孟操 李明 刘维涓
摘要 采集位于云南省昆明、安宁、弥勒3个地区的350份土壤样品,利用便携式近红外光谱仪进行光谱的扫描并构建全氮、全钾、全磷和有机质4项养分的近红外预测模型。结果表明,在950~1 650 nm,不同地区的土壤样品光谱的轮廓较为接近;全氮、全磷、有机质的最佳预处理方法为一阶导数,全钾的最佳预处理方法为标准正态变量变换(SNV),光谱数据经过预处理后可提高模型的预测能力,并降低模型的复杂度;在土壤养分的PLS预测模型中,全氮、全钾、全磷和有机质的决定系数(R2)分别为0.789 9、0.910 8、0.947 0和0.833 6,RPD值分别为2.108、2.903、3.938和2.238,模型的拟合效果和预测能力均较好,基于便携式近红外光谱分析技术能实现对土壤养分含量的预测。
关键词近红外;全氮;全钾;全磷;有机质;偏最小二乘法
中图分类号S126文献标识码A
文章编号0517-6611(2023)08-0006-04
doi:10.3969/j.issn.0517-6611.2023.08.002开放科学(资源服务)标识码(OSID):
Study on Prediction of Soil Nutrients by Portable Near Infrared Spectrometer
WEI Qing, LI Chang-yu, XU Meng-cao et al(Yunnan Reascend Tobacco Technology(Group)Co.,Ltd.,Kunming,Yunnan 650106)
Abstract350 soil samples were collected from Kunming, Anning and Mile in Yunnan Province, and the spectra were scanned by portable near infrared spectrometer,the near infrared prediction model of total nitrogen, total potassium, total phosphorus and organic matter in soil were established.The results showed that the spectral profiles of soil samples from different regions were close in wavelength bands of 950 -1 650 nm.The best pretreatment method of total nitrogen, total phosphorus and organic matter was the first derivative, and the best pretreatment method of total potassium was SNV.The preprocessed spectra could improve the prediction ability and reduce the complexity of the model.In the PLS prediction model of soil nutrient, the determination coefficients (R2) of total nitrogen, total potassium, total phosphorus and organic matter were 0.789 9,0.910 8, 0.947 0 and 0.833 6 respectively, and the RPD values were 2.108, 2.903, 3.938 and 2.238 respectively.The fitting effect and prediction ability of the model were good.The soil nutrient content could be predicted by portable near infrared spectroscopy.
Key wordsNear infrared;Total nitrogen;Total potassium;Total phosphorus;Organic matter;Partial least squares
土壤的成分十分复杂,有机物和无机物互作,动物、植物和微生物共生,固相、液相和气相共存[1]。氮、磷、钾和有机质作为土壤中的主要营养成分,其含量的多少对促进农作物的生长、营养的运输以及提高作物抗旱、抗寒能力等均有极大的影响作用[2],其中,氮含量指标被广泛用于土壤养分供应能力、植物养分吸收和利用规律等农化分析中[3],并对作物生长过程中有机物的形成起到十分关键的作用[4-5];磷作为仅次于全氮的营养成分,对土壤肥力的高低也有较大的影响,且土壤磷的流失也是导致湖泊富营养化的主要因素[6];钾可以提高作物的抗逆性,增强其抵抗不良环境侵蚀的能力,进而改善其品质[7];有机质含有植物生长发育所需要的各种营养元素,还能改良土壤结构并提高土壤的保水保肥能力[8]。如何快速、准确地测定土壤养分含量是提高农作物产量的基础,同时也是实施精细农业的前提[9-10]。
传统土壤养分含量的测定方法为化学法,该方法测量结果准确度高,但对测量条件的要求严,测量时间长,难以满足对土壤养分的实时监控要求[11-12]。由于近红外光谱技术具有绿色、快速、无损等特点,其应用于土壤营养成分的预测已成为国内外学者的研究重点,采用高光谱分析仪、傅里叶变换近红外光谱分析仪等设备对土壤吸收/反射光谱与养分含量的研究结果显示,土壤光谱与对应的养分含量之间存在显著的相关性,通过构建预测模型可实现对土壤中有机质、全氮、全磷、全钾、速效磷、速效钾、碳酸钙、pH等理化指标的预测[13-16],但由于机载高光谱分析仪受天气的影响较大,而傅里叶变换近红外光谱分析仪体积较大,价格昂贵,只适用于实验室分析,围绕便携式近红外光谱分析仪在土壤养分预测中的应用则研究较少[17]。便携式近红外光谱分析仪以其方便、快速的优点在纺织、食品、药品等领域得到了越来越多的应用,具有广阔的应用前景[18]。因而,笔者采用便携式近红外光谱仪构建土壤中全氮、全钾、全磷和有机质4项主要养分的近红外预测模型, 可为土壤养分的实时监控提供新的思路。
1材料与方法
1.1土壤采样与制备土壤样品采自云南省的昆明、安宁、弥勒3个地区,土壤所种作物为烤烟、蔬菜和果树,采样时先将表层土壤(0~5 cm)去除,采集耕作层(5~25 cm)的土壤进行研究,每个采样点采集1 kg左右土壤,去除石块、树枝等异物后装入样品袋中进行密封[19],共计采集土壤样品350份。为降低水分和粒径的干扰,样品带回实验室后先烘干,再研磨后过60目筛,每个样品分成2份,一份用于测定全氮、全钾、全磷和有机质的含量,另一份用于光谱数据的采集。
1.2土壤养分含量测定根据《土壤全氮测定法》(NY/T 53—1987)、《土壤全钾测定法》(NY/T 87—1988)、《土壤全磷测定法》(NY/T 88—1988)、《土壤有机质的测定》(NY/T 1121.6—2006)4项农业行业标准测定样品中全氮、全钾、全磷和有机质的含量,表1为4项指标的含量统计。
1.3光谱数据采集与预处理采用由台湾中强光电子公司生产的近红外光谱模块(型号NIR-M-R2)自主开发的手持设备进行光谱数据采集,扫描模式为Column,输出数据为Absorbance,扫描时为避免土壤对探头的污染,将样品装入透明塑料自封袋中,并以自封袋中的标准白板作为参比,每个样本采集5条光谱,平均光谱作为该样品的代表光谱,每测3个样品就重新用自封袋中的白板进行一次定标。光谱有效波长为950~1 650 nm,波长间隔为3 nm。对光谱数据采用标准正态变量变换(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)、Savitzky-Golay卷积求导法消除固体颗粒大小、颗粒分布不均匀、基线变化等对近红外漫反射光谱的影响[20],并筛选出与待测化学组分相关性高的变换数据构建土壤养分预测模型。
1.4建模与评价选用偏最小二乘法(partial least squares,PLS)进行建模,采用校正均方根误差(root mean square error of calibration,RMSEC)、交互验证均方根误差(root mean square error of cross validation,RMSECV)、预测均方根误差(root mean square error of prediction,RMSEP)、决定系数(R2)和验证集标准偏差与预测标准偏差的比值(ratio of standard deviation of the validation set to standard error of prediction,RPD)对模型进行评价。其中,R2越大,RMSEC 和RMSECV越小,模型的精度越高;RMSEP越小,RPD越大,模型的预测能力越好。另外,当预测模型 RPD≥2.0 时,表示该模型有较好的估测能力;当 1.4 < RPD < 2.0 时,表示该模型可以对样品进行粗略估测;当 RPD≤1.4 时,表示该模型预测能力很差,无法对样品进行估测[21]。
2结果与分析
2.1土壤的光谱特性分析不同地区的土壤样品在950~1 650 nm 波段,其吸收光谱的轮廓较为接近,并在1 400 nm附近出现一个明显的吸收峰,这主要是由于土壤中的水分子对近红外光的吸收引起的。在土壤的原始光谱(图1a)中,由于样品受粒度、填充密度和基线漂移等因素的影响,不同样品的光谱差异较大,需对原始光谱数据进行适当的预处理,以便提高模型的稳健性;经过SNV(图1b)和MSC(图1c)处理后的光谱可消除颗粒分布不均匀及颗粒大小产生的散射影响,从光谱图上看,2种方法处理后的光谱效果相似,主要是由于SNV与MSC是线性相关的,不同之处在于SNV是针对一条光谱进行处理,MSC是基于一组光谱进行处理;经过一阶求导处理后的光谱可有效消除基线和其他背景干扰的影响,提高分辨率和灵敏度,但它同时也会引入噪声,从经过一阶求导的光谱图(图1d)上看,在950~1 200和1 500~1 650 nm 存在明显的高频噪声。
2.2土壤养分含量的预处理算法选择采用原始光谱和经过SNV、MSC、一阶导数、SNV+一阶导数、MSC+一阶导数预处理后的光谱数据分别对全氮、全钾、全磷和有机质4项指标进行PLS建模,选择交互验证均方根误差(RMSECV)最低的作为最佳预处理方法。不同预处理方法对PLS模型交互验证均方根误差的影响如表2所示,全氮、全磷、有机质的最佳预处理方法均为一阶导数,全钾的最佳预处理方法为SNV,光谱数据经过预处理后一定程度上可提高模型的预测能力,并降低模型的复杂度(PLS主因子下降),但SNV+一阶导数、MSC+一阶导数2种组合的预处理方法均不太理想,可能是由于手持近红外的分辨率较低,选用的预处理方法增加后一定程度上会造成特征信号的丢失,从而降低模型的预测效果。
2.3土壤养分含量与吸收光谱的相关性分析根据每项指标最佳的数据预处理方法,计算预处理后的光谱矩阵中每个波点对应的吸光度向量与待测组分浓度向量的相关系数,得到每个波点变量下的相关系数[22]。在全氮含量与一阶导数处理光谱的相关性中(图2),1 361 nm处的负相关系数最大,为-0.85 6,1 415 nm处的正相关系数最大,为0.842;在全钾含量与SNV处理光谱的相关性中(图3),1 379 nm处的负相关系数最大,为-0.669,1 127 nm处的正相关系数最大,为0.602;在全磷含量与一阶导数处理光谱的相关性中(图4),1 412 nm处的负相关系数最大,为-0.714,1 349 nm处的正相关系数最大,为0.661;在有机质含量与一阶导数处理光谱的相关性中(图5),1 394 nm处的负相关系数最大,为-0.854,1 433 nm 处的正相关系数最大,为0.857。