基于偏最小二乘路径模型的粮食产量影响因素分析
作者: 舒畅 张鑫 王凯 邹童 易杨 陈晖 李小飞
摘要 根据1990—2018年粮食产量相关统计数据,选取有效灌溉面积、农用化肥施用折纯量、农业机械总动力、农用塑料薄膜使用量、农药使用量、支持农业生产支出、农村居民人均可支配收入、成灾面积、农村用电量、播种面积这10项指标,采用简单相关分析、典型相关分析、偏最小二乘路径模型分析了影响粮食产量的主演因素。结果表明: 通过简单相关分析法,对单位面积粮食产量影响最大的因素是农村用电量,对粮食总产量影响最大的因素是支持农业生产支出;通过典型相关分析法,对产量影响较大的因素是有效灌溉面积、播种面积;通过偏最小二乘路径模型法,对粮食产量影响较大的潜变量是科技因素,其中以塑料薄膜使用量所占载荷最大。
关键词 粮食安全;偏最小二乘路径分析;影响因素;对策
中图分类号 S-9;F 320 文献标识码 A
文章编号 0517-6611(2022)08-0191-04
doi:10.3969/j.issn.0517-6611.2022.08.053
开放科学(资源服务)标识码(OSID):
Study on Factors Influencing Grain Yield Based on Partial Least Squares Path Modeling
SHU Chang,ZHANG Xin,WANG Kai et al (Yiyang Agricultural Sciences Research Institute, Yiyang,Hunan 413046)
Abstract Based on the statistical data of grain output in China from 1990 to 2018, 10 indicators were selected, including effective irrigation area, pure amount of agricultural chemical fertilizer application, total power of agricultural machinery, consumption of agricultural plastic film, consumption of pesticides, expenditure for supporting agricultural production, per capita disposable income of rural residents, disaster area, rural electricity consumption and sown area. Simple correlation analysis, canonical correlation analysis and partial least square path model are used to analyze the main factors affecting grain yield. The results show that the most important factor affecting grain yield per unit area is rural electricity consumption, and the most important factor affecting total grain output is supporting agricultural production expenditure. Through canonical correlation analysis, the factors that have great influence on yield are effective irrigation area and sowing area;according to the partial least squares path model method, the potential variable that has a great influence on grain yield is scientific and technological factors, among which the load of plastic film is the largest.
Key words Grain yield;Partial least squares path modeling;Impact factor;Countermeasure
我国是人口大国,同时也是粮食消费大国,粮食安全是关乎国家稳定的重大问题。从2004年开始,每年中央一号文件均聚焦“三农”问题。2020年受疫情影响,保障粮食产量再次成为人民关心的热点问题。2020年5月23日,习近平总书记在全国政协会议上强调,“对我们这样一个有着14亿人口的大国来说,农业基础地位任何时候都不能忽视和削弱,手中有粮、心中不慌在任何时候都是真理。这次新冠肺炎疫情如此严重,但我国社会始终保持稳定,粮食和重要农副产品稳定供给功不可没”。因此,对粮食产量开展研究,进一步揭示粮食产量与不同因素间的相互影响关系具有积极意义。
目前相关学者已从不同视角对粮食产量影响因素进行了研究:吴红霞等分别采用偏最小二乘回归模型、分位数回归、灰色关联度分析模型、主成分分析、粗糙集等方法对湖北、河南、广东粮食产量影响因素进行客观分析 [1-5]。李青松等 [6-8]从粮食产量波动特征角度出发分别对河南省粮食产量以及我国粮食产量影响因素进行探究。而胡慧芝等 [9]则聚焦长江流域县域粮食产量演变情况。从研究方法来看,尽管不同学者研究方法不一,但由于粮食产量影响因素较多,各因素的影响程度强弱存在差异,此外不同的时间、空间维度也会使粮食产量具有独特的区域性性质,有些模型并没有很好地解决这一问题。
基于此,该研究以我国粮食产量为研究主体,以1990—2018 年为研究时间序列,选取10个影响粮食产量因子指标,根据我国粮食产量的特征,构建偏最小二乘路径(partial least squares path modeling,PLSPM)模型,深入研究自然、科技、经济、生产等因素对粮食产量的影响,进一步揭示我国粮食产量及其主要影响因素的内在联系,明确制约我国粮食生产因素,为今后调控我国粮食增产、稳产提供理论依据。
1 数据来源与影响因子选取
1.1 数据来源 该研究所采集的粮食产量、科技因素、自然因素、经济因素和农业生产条件数据来源于《中国农村统计年鉴》。由于大部分经济因素的统计数据在1990年以前缺失严重,故选取的数据范围为1990—2018年。
1.2 影响因子选取 影响粮食产量的因素复杂,借鉴前人经验 [7,10],粮食产量主要的影响因素大致可以分为4类:自然因素(A1)、科技因素(A2)、经济因素(A3)以及农业生产条件(A4)。因此该研究选取了1990—2018年粮食产量(稻谷、小麦、玉米3种作物产量),包括单位面积粮食产量(X1)、粮食总产量(X2)作为因变量。影响因子主要有:科技因素,包括有效灌溉面积(Y1)、农用化肥施用折纯量(Y2)、农业机械总动力(Y3)、农用塑料薄膜使用量(Y4)、农药使用量(Y5);经济因素,包括支持农业生产支出(Y6)、农村居民人均可支配收入(Y7);自然因素,包括成灾面积(Y8);农业生产条件投入因素,包括农村用电量(Y9)、播种面积(Y10)。
1.3 统计分析方法 采用SPSS 24.0统计软件进行描述性统计分析和相关性分析 [11]。采用R软件处理。并通过plspm程序包对粮食产量以及各指标构建偏最小二乘路径模型(PLSPM)。
2 结果与分析
2.1 粮食产量及其影响因子的基本统计特征
1990—2018年粮食单产、总产以及各影响因素的最小值、最大值、平均值、标准差、偏度和峰度等基本统计结果见表1。粮食年单产在13 318.92~1 8547.49 kg/hm 2,年平均单产产量为15 890.68 kg/hm 2,粮食年总产量在36 297.38万~60 977.34万t,年平均总产量为46 341.19万t。各影响因素数据偏度在-0.47~1.00,峰度在-1.49~-0.19。
2.2 粮食产量与各影响因素简单相关性分析
由表2 可知,单位面积粮食产量、粮食总产量均与受灾面积呈极显著负相关,相关系数分别为-0.789、-0.831,单位面积粮食产量、粮食总产量均与有效灌溉面积、农用化肥施用折纯量、农业机械总动力、农用塑料薄膜使用量、农药使用量、支持农业生产支出、农村居民人均可支配收入、成灾面积、农村用电量、播种面积等因素呈极显著正相关。单位面积粮食产量与农村用电量相关性最大,相关系数为0.977, 粮食总产量与支持农业生产支出相关性最大,相关系数为0.965。
2.3 粮食产量与各影响因素典型相关性分析
对样本进行典型相关系数的显著性检验,结果显示2组典型变量显著相关(表3)。
进一步分析得到这2组典型变量构成的线性表达式:
V1=0.818X1-1.743X2
U1=0.31Y1+0.126Y2+0.052Y3-0.103Y4-0.165Y5-0.224Y6-0.207Y7-0.002Y8+0.215Y9-0.775Y10
以及:
V2=3.088X1-2.674X2
U2=0.269Y1+3.174Y2-0.543Y3-1.044Y4-1.036Y5-1.031Y6-0.062Y7-0.276Y8+1.299Y9-0.994Y10
构成典型变量的原变量系数大小代表原变量对典型相关系数影响的程度,从以上典型变量线性表达式中可以看出,第一典型变量表明粮食总产量与农用塑料薄膜使用量、农药使用量、农业生产支出、农村居民人均可支配收入、播种面积成正相关,其中播种面积对粮食总产量影响最大,成灾面积对粮食总产量影响能力有限;第二典型变量表明单产面积粮食产量与有效灌溉面积、农用化肥施用折纯量、农村用电量呈正相关,农用化肥施用折纯量对单位面积粮食产量影响程度最大,农村居民人均可支配收入对单位面积粮食产量的影响能力有限,而成灾面积对单位面积粮食产量的负面影响较大。
2.4 粮食产量与影响因素偏最小二乘路径分析与模型构建
偏最小二乘路径模型是一种研究显变量与潜变量的完整多元相关关系模型。利用R语言对粮食产量、科技因素、经济因素、环境因素、生产因素的各参数进行了偏最小二乘路径模型构建,如图1所示,科技因素、经济因素、生产因素对粮食产量有正向作用,且经济因素对产量影响效应最大,影响系数达到0.994 1,其次是科技因素,影响系数为0.935 2,而生产因素对粮食产量影响系数最小仅为0.834 1。而环境因素对粮食产量的提高具有反向作用。模型拟合度达到0.920 6。
利用R语言构建显变量与潜变量载荷关系,由图1可知,粮食产量因素中显变量粮食总产量载荷高于粮食单位面积产量;科技影响因素中显变量农用塑料薄膜使用量因素载荷最大为0.997 8,其次是农用化肥施用量载荷系数为0.994 1,农药施用量载荷最低为0.948 4;在经济影响因素中显变量财政支农支出载荷系数高于农村居民人均可支配收入;生产影响因素中显变量农村用电量载荷系数高于播种面积。
3 结论与建议
3.1 结论
相关分析是研究两组随机变量间相关程度及相关方向的一种统计方法。该研究相关分析结果表明:影响粮食产量的各因素均与粮食单位产量、粮食总产量相关性达到极显著水平,除受灾面积因素外其余各因素与粮食单位产量、粮食总产量均成正相关性。其中,与单位面积粮食产量相关性最大的因素是农村用电量,与粮食总产量相关性最大的因素是支持农业生产支出。