基于分类回归树模型的奉节脐橙品质影响因素研究

作者: 王佳彬 张云逸 李瑜 鲍丽然

基于分类回归树模型的奉节脐橙品质影响因素研究0

摘要 为明确土壤特性(pH、有机碳、氮、磷、钾、钙、镁、硫、全铁、锰、硼、钼、铜、锌)对奉节脐橙品质(可溶性固形物、横径)的影响,引入分类回归树模型(CART),将土壤特性作为自变量,脐橙品质作为因变量进行建模分析。结果表明,锌是影响脐橙可溶性固形物最关键的因素,而氮是影响脐橙横径最关键的因素。pH、钙与果实横径达显著正相关,相关系数分别为0.346和0.400。CART模型可以很好地用来研究土壤特性对脐橙品质的影响,就可溶性固形物树模型而言, R2 、RMSE、MAE分别为0.85、0.46、0.32;就横径树模型而言, R2  、RMSE 、MAE分别为0.89、1.58、1.07。

关键词 CART;土壤特性;可溶性固形物;横径

中图分类号 S 666.4  文献标识码 A

文章编号 0517-6611(2022)06-0135-05

doi:10.3969/j.issn.0517-6611.2022.06.032

开放科学(资源服务)标识码(OSID):

Research on Factors Influencing the Quality of Fengjie Navel Orange Based on Classification and Regression Tree Model

WANG  Jia-bin ,ZHANG Yun-yi,LI Yu  et al (Southeast Sichuan Geological Team,Chongqing Bureau of Geology and Minerals Exploration, Chongqing  400038)

Abstract In order to clarify the influence of soil characteristics (pH,organic carbon,nitrogen,phosphorus,potassium,calcium,magnesium,sulfur,total iron,manganese,boron,molybdenum,copper,zinc) on the quality (soluble solids,horizontal diameter) of Fengjie navel orange,the classification and regression tree model (CART) was introduced,and the soil characteristics were used as independent variables,and the quality of navel oranges was mostly used as the dependent variable for modeling analysis.The results showed that zinc was the most critical factor affecting the soluble solids of navel oranges,and nitrogen was the most critical factor affecting the horizontal diameter of navel oranges.pH,calcium and fruit transverse diameter reached a significant positive correlation,the correlation coefficients were 0.346 and 0.400,respectively. The CART model could be used to study the influence of soil characteristics on the quality of navel oranges.For the soluble solids tree model, R2 ,RMSE,and MAE were 0.85,0.46,and 0.32,respectively;for the transverse diameter tree model, R2 ,RMSE and MAE were  0.89,1.58 and 1.07,respectively.

Key words CART;Soil characteristics;Soluble solids;Transverse diameter

基金项目 重庆市规划和自然资源局地质调查项目(渝规资〔2019〕128号)。

作者简介 王佳彬(1992—),男,四川简阳人,工程师,从事土地质量地质调查、地球化学勘查研究。*通信作者,高级工程师,从事土地质量调查研究。

收稿日期 2021-07-07;修回日期 2021-07-26

奉节拥有悠久的脐橙种植历史,自1953年从江津果树所引进凤园脐橙,经过不断选育新品种,目前已经拥有凤早、凤园、凤晚、班菲尔、纽荷尔、福本、鲍威尔、切斯勒特等多个品种。2006年2月经国家工商总局商标局批准正式使用“奉节脐橙·FJQCH”地理标识证明商标。2019年,脐橙种植面积已达1.5万hm2,年产量32.47万t[1]。果实品质是外观品质、风味品质、营养品质及加工品质等多种因素的复合体,包括果实形状、大小、果皮色泽、可溶性固形物、有机酸等要素[2]。在脐橙众多的品质指标中,可溶性固形物含量和横径是其中最为关键的指标。可溶性固形物不仅是果实成熟度的重要标识,同时也是决定果实口味及营养的关键因素[3-6]。横径是《GB 12947—2008鲜柑橘》中划分果实级别的唯一外在指标。随着人们生活水平的提高,人们对柑橘品质的要求也越来越明确具体,因此有效控制果实品质显得十分重要。果实品质除受降雨、日照、温度等气候因素的影响外[7-9],主要受到土壤特性的影响[10-16]。由于脐橙属于多年生植物,其土壤中相关元素的含量会长期影响脐橙的生长,因此研究土壤特性对品质的影响对于果园管理及品质把控具有重要意义。

1 材料与方法

1.1 研究区概况

奉节县位于重庆市东北部,地处109°1′17″~109°45′58″E、30°29′19″~31°22′33″N,东邻巫山、南靠恩施、北接巫溪、西连云阳,全域面积4 098.44 km2。奉节属于四川盆地山地地貌,整体呈东南、东北高而中西部稍平缓。境内水系主要有长江(长约41.5 km)、梅溪河、大溪河、石笋河、草堂河、朱衣河等(图1)。气候属于典型的亚热带温润季风气候,具有无霜期长、雨量充沛、日照时间长、四季分明等特点。奉节因其得天独厚的气候条件,具备脐橙生长的“无台风、无冻害、无检疫性病虫害”三大生态优势,成为我国主要的脐橙生产基地,曾被中国果品流通协会特别授予“中国橙都”称号。

1.2 样品采集与分析 在研究区范围内,共采集根系土壤及脐橙样品33件,采样点分布情况见图2。

根系土:在树冠滴水线附近采样,避开施肥、滴灌头湿润区,挖取1个采样穴,在5~40 cm土层中均匀采样,每10株的土壤等量混合均匀为一个样品,用四分法将取土量缩分至1 kg左右,并送实验室进行检测。

脐橙果实:每个采样点选择3~5棵植株,按树冠上中部不同方向随机采摘果实40~50个,组成一件分析样品,样品重量为5 kg,装入样袋及时送中国农业科学院柑橘研究所进行检测。

土壤主要分析测试了pH、有机碳、氮、磷、钾、钙、镁、硫、全铁、锰、硼、钼、铜、锌14个指标。

脐橙主要分析测试了可溶性固形物含量以及果实横径2个指标。

1.3 分类回归树模型

分类与回归树模型(classification and regression tree,CART)是一种典型的监督学习算法,最早由Breiman、Friedman、Olshen和Stone于1984年提出。其基本工作原理是对由测试标量(自变量)和目标变量(因变量)构成的训练集进行循环二分形成二叉树结构。CART树在生长过程中,主要采用GINI系数作为节点的分裂依据。该算法既可用于分类,也可以用于回归,当自变量是离散型数据时成为分类树,当自变量是连续型变量时成为回归树。CART模型因其具有结构清晰、实现简单、运行速度快、可以处理非线性关系、准确性高等特点被广泛应用于土壤及遥感等领域[17-19]。分类回归树模型的构建在软件SPSS v.25.0中完成。其他相关数据统计在Excel 2007中完成。

2 结果与分析

2.1 基本统计 土壤有机碳含量为0.25%~2.90%,平均值为1.26%。土壤pH为4.22~8.37,平均值为7.47。大量元素氮、磷、钾的含量分别为568.00~4 281.00 mg/kg、304.00~5 056.00 mg/kg、1.37%~3.27%,平均值分别为1 567.73 mg/kg、1 428.45 mg/kg、2.31%。中量元素钙、镁、硫的含量分别为0.26%~18.87%、0.51%~3.76%、0.01~0.13%,平均值分别为5.92%、1.15%、0.03%。微量元素铁(全铁)、锰、铜、锌、硼、钼含量分别为2.39%~4.92%、307.00~1 176.00 mg/kg、11.70~55.20 mg/kg、37.70~138.00 mg/kg、31.00~170.00 mg/kg、0.31~1.47 mg/kg,平均值分别为3.77%、587.45 mg/kg、29.24 mg/kg、90.12 mg/kg、88.10 mg/kg、0.70 mg/kg(表1)。

由表2可知,可溶性固形物含量为10.90%~16.10%,平均值为13.57%,参照GB 12947—2008鲜柑橘的相关标准,33个样品的可溶性固形物含量均达到优等果(可溶性固形物含量≥10.5%)级别。果实横径为68.53~85.47 mm,平均值为76.09 mm,参照GB 12947—2008鲜柑橘的相关标准,1个样品达到3 L(85.0  mm≤横径<95.0 mm)级别,6个样品达到2 L(80.0 mm≤横径<85.0 mm)级别,14个样品达到L(75.0 mm≤横径<80.0 mm)级别,7个样品达到M(70.0 mm≤横径<75.0 mm)级别,5个样品达到S(65.0 mm≤横径<70.0 mm)级别。

2.2 相关性分析 相关性分析结果表明,pH、钙与果实横径达显著正相关,相关系数分别为0.346和0.400。上述土壤特性与可溶性固形物含量均未达显著相关性(表3)。

2.3 分类回归树

将可溶性固形物作为因变量,14个土壤特性指标作为自变量,设定父节点和子节点分别为4和2,可溶性固形物生成的CART树模型见图3。将果实横径作为因变量,14个土壤特性指标作为自变量,设定父节点和子节点分别为4和2,果实横径生成的CART树模型见图4。并将模型的预测结果与实际测量值生成散点图(图5、6),来检验预测值与真实值的拟合程度。

分别选取决定系数( R2) 、均方根误差(RMSE)、平均绝对误差(MAE)来检验模型精度。由表4可知,可溶性固形物的 R2 、RMSE、MAE分别为0.85、0.46、0.32;果实横径的 R2 、RMSE、MAE分别为0.89、1.58、1.07。研究表明,当模型的RMSE、MAE越小, R2 越大时,模型精度越好。

上述结果表明,CART树对可溶性固形物和果实横径的解释率分别达85%和89%,说明CART树可以很好地用来研究土壤特性对脐橙果实品质的影响。

2.4 果实品质的主控因素分析

相对重要性图是CART模型一个关键的输出结果,表明自变量对模型的重要程度。可溶性固形物和横径的相对重要性见图7、8。结果表明,锌是影响奉节脐橙可溶性固形物含量最重要的指标,其他指标的相对重要性表现为有机碳>磷>氮>铜>镁>硫>全铁>钼>锰>钾>硼>钙>pH。氮是影响奉节脐橙横径最重要的指标,其他指标的相对重要性表现为锌>锰>pH>磷>铜>全铁>硫>钼>有机碳>镁>钾>硼>钙。

经典小说推荐

杂志订阅

友情链接