基于组合模型的安徽省农产品物流需求量预测
作者: 师小雨 刘祥伟
摘 要:农业生产者和供应链管理者要想合理制订和调整生产计划,就需要更加精准地预测农产品物流需求量。为了提高预测模型的拟合程度及预测结果的精确度,利用GM(1,1)结合BP神经网络的组合模型,对安徽省未来5年的主要农产品物流需求量进行预测。首先,通过对传统的GM(1,1)预测模型进行优化,构成预测的主体部分;其次,根据灰色关联分析法,选取与安徽省农产品物流需求量关联度最大的经济指标,并建立相关的BP神经训练网络进行训练和预测;最后,对GM(1,1)非线性残差部分通过BP神经网络进行优化,构建出无偏GM-BP组合预测模型,并对比几种不同方式的预测结果。根据对比结果,组合模型的预测结果更加准确可靠。
关键词:滑动无偏灰色模型;BP神经网络;组合模型;农产品物流
中图分类号:F224 文献标志码:A 文章编号:1674-7909(2024)8-46-5
DOI:10.19345/j.cnki.1674-7909.2024.08.009
0 引言
随着我国农产品市场的不断壮大和产业的快速发展,农产品物流发展的重要性也日益凸显。一方面,农产品物流能够促进农产品的流通和销售,提高农产品的附加值,推动农村经济的发展,促进农村地区的现代化建设;另一方面,农产品物流也能够促进国际贸易和农产品出口,提高中国农产品在国际市场上的竞争力,推动中国农业的国际化进程。而农产品物流的稳定发展离不开对农产品物流需求量的预测。农产品物流需求量预测是指通过对农产品物流行业的市场环境、产品种类、交通运输等因素进行分析,以预测未来一定时间内农产品物流需求的变化趋势和数量规模。该预测可以为农产品生产、运输和销售等环节提供决策参考,支持物流企业的规划和相关产业的发展。
很多学者研究提出了针对特定指标的预测方法。Wang X等[1]提出了一种基于粒子群优化的支持向量机(SVM)的房地产价格预测模型。Selakov A等[2]介绍了一种结合粒子群优化(PSO)和支持向量机(SVM)的混合方法,其可用于考虑温度变化的短期负荷预测。Kisi O[3]探讨了最小二乘支持向量机(SVM)和多元自适应回归样条(MARS)模型在长期河流水污染预测中的应用。Zou H F等[4]在多阶段优化方法的基础上,提出了一个短期食品价格预测神经网络模型。Qi Fang[5]等通过组合模型对港口物流需求预测进行研究。
也有学者研究提出针对物流和冷链物流的预测模型。缪辉等[6]基于多元线性回归模型对贵州省物流需求进行了预测。戎陆庆等[7]基于灰色理论的定量分析方法研究了区域果蔬冷链物流需求发展,为其发展过程所受到的环境因素影响提供了一种可行的范式。李思聪等[8]通过灰色—回归组合模型对我国农产品冷链物流市场需求进行了预测。李捷等[9]提出了两阶段组合预测模型GSPS-BPNN,通过两个不同阶段、不同的模型对区域物流需求进行预测,证明其预测结果比单阶段单一预测模型预测的结果更稳定。李国祥等[10]基于深度学习对物流需求预测模型进行了研究。岳伟等[11]利用灰色关联法对各个影响因素指标进行分析,实现了对区域冷链物流需求量的预测,并且根据Shapley值法进行边际贡献分析[12],对组合模型进行优化,提高了模型的预测优势。李义华等[13]利用滑动无偏灰色预测模型对湖南省农产品冷链物流需求量进行了分析预测,发现滑动无偏灰色预测模型要优于传统灰色预测模型。王晓平等[14]采用定性分析和定量统计相结合的方法研究农产品冷链物流需求的影响因素,建立了多种农产品冷链物流需求预测模型,并进行对比分析。
这些预测方法大多是单一模型,虽然准确率也比较高,但可能会出现过拟合或欠拟合或者无法适用于多种类型数据的情况,从而导致预测的结果并不准确。此研究在传统灰色预测模型的基础上进行优化改进,并与BP神经网络相结合,不仅能够有效改善过拟合或欠拟合的现象,还能提高预测模型的准确性,减小误差。
1 影响因素的选取与分析
1.1 影响因素的选取
影响农产品物流需求的因素有很多,从宏观角度来看,包括全球和国内的经济增长水平、国际贸易环境、金融政策的变动,其都将影响农产品进出口,进而会直接或间接影响农产品物流。微观因素包括农产品生产、供应、需求及政策等,都会对农产品的需求量产生影响。此次研究主要选取了与经济水平、生产价格、物流量有关的因素。此研究以地区生产总值和第一产业增加值来代表供给水平的影响,以农产品生产价格指数、社会消费品零售总额、农林牧渔业总产值、国内外进出口总额来代表供给水平的影响,以货物运输量、铁路运输里程和公路运输里程代表物流发展水平的影响,如表1所示。
1.2 灰色关联度分析
为了探寻影响农产品物流需求的因素,收集包括地区生产总值、第一产业增加值、农产品生产价格指数、社会消费品零售总额、农林牧渔业总产值、国内外进出口总额、货物运输量、货物运输量、铁路运输里程、公路运输里程的往年数据,运用Matlab计算出这些指标与安徽省农产品物流需求量的灰色关联度值,并按照其关联度值大小进行排序,得到表1。
表1可以看出各指标的关联度值均大于0.5,说明文中选取的指标对安徽农产品物流需求的影响都是显著的。
2 研究方法
此研究先对传统的GM(1,1)预测模型进行优化,在传统的GM(1,1)模型、新信息GM(1,1)模型和新陈代谢GM(1,1)模型中选择最优模型的预测结果,将其作为GM(1,1)预测的主体部分;再选取与安徽省农产品物流需求量关联度最大的经济指标作为影响因素,并建立相关的BP神经训练网络,对数据集进行训练和预测,构建出无偏GM-BP组合预测模型;最后,将几种不同方式的预测结果进行对比,即可得到最优模型。
2.1 GM(1,1)灰色预测模型及优化
2.1.1 GM(1,1)模型
GM(1,1)表示的是模型是一阶的,包含一个变量的灰色模型。GM(1,1)灰色预测的步骤如下:
①进行一阶累加生成数据序列,见式(1)。
[x1k=m=1kx0m,k=1,2,…,n] (1)
一次累加后的数据光滑比小于0.5的数据占比要大于60%。
GM(1,1)模型的微分方程见式(2)。
[dx1dt+aX1(t)=b] (2)
式(2)中:a为发展系数,b为灰作用量,利用一元线性回归,即最小二乘法,求其估计值。
[a b=BTB-1BTYn], (3)
B=[-12x11+x121-12x12+x131……-12x1n-1+x1n1],[Yn=x02x03…x0n] (4)
②建立生成数据序列模型,见式(5)。
[x1k+1=x01-bae-ak+ba,k=1,2,…,n] (5)
③建立原始数据序列模型,见式(6)。
[ x01=x01],
[x=x1k-x1k-1=1-e-ax01-bae-ak-1,]
[k=1,2,3,…,n] (6)
式(6)中:[x0k,k=1,2,…,n]为原始数据序列[x0k,]
[k=1,2,…,n]的拟合值。如果对原始数据进行预测,那么只需要满足k≥n即可。
2.1.2 无偏灰色GM(1,1)模型
设无偏GM(1,1)模型的参数为[m]和[A],则对原始序列见式(7)。
[x0k=Aemk-1,k=1,2,…,n] (7)
通过一次累加可以得到式(8)。
[x1k=x0k=A1-emk1-em,k=1,2,…,n] (8)
参照传统GM(1,1)建模方法可得式(9)。
[abT=BTB-1BTYn=21-em1+em2A1+em] (9)
因此,可以用传统GM(1,1)模型参数a和b表示m和A的估计,见式(10)。
[m=ln2-a2+a,A=2b2+a] (10)
建立原始数据模型,见式(11)。
[x01=x01];
[x0k=Aemk(k=0,1,2,…,n-1)] (11)
式(11)中:[x0k(k=0,1,2,…,n-1)]为原始数据序列的拟合值。
2.2 灰色预测模型精度检验
残差检验一般包括残差检验和后残差检验,通过计算相对误差、均方差比值和平均级比偏差的数值来判断数据的精度等级,具体标准可参照表2。
2.3 BP神经网络模型构建
BP神经网络的基本结构包括输入层、输出层和至少一个隐藏层。BP神经网络的训练过程可以分为前向传播和反向传播两个阶段。在前向传播阶段,输入信号经过一系列的加权和非线性变换后,得到网络的输出。在反向传播阶段,根据网络输出与实际输出之间的误差,通过链式法则计算出每个神经元的误差贡献,并根据误差贡献来更新网络的权重和偏置。BP神经网络具有很强的非线性映射能力和柔性的网络结构,可以适应各种复杂的非线性问题。网络的中间层数、各层的神经元个数可根据具体情况而改变,并且随着结构的改变其性能也有所不同。
3 实证分析
3.1 数据来源
此研究实证选取数据源自《安徽统计年鉴》《安徽省国民经济和社会发展统计公报》,以及相关网站数据直接或间接得出。
为了更加准确直观地对特定地区的农产品物流需求总量进行描述和涵盖,此研究将特定经济区域的粮食、棉花、猪肉、茶叶、水产品、油料等农产品的产出总量均作为影响农产品物流需求总量的因素应用于预测模型,选取了2013—2021年的安徽省主要农产品产量作为原始数据,对安徽省未来5年主要农产品的物流需求量进行预测。通过统计年鉴,得到具体数据,见表3。
3.2 滑动无偏灰色GM(1,1)模型预测分析
此研究以2013—2021年安徽省主要农产品产量为试验数据,利用Matlab对农产品总量采用无偏灰色GM(1,1)模型进行预测,模型以最后3期为试验组,前面的n[-]3期为训练组,分别计算出传统的GM(1,1)模型、新信息GM(1,1)模型和新陈代谢GM(1,1)模型的SSE值。选择SSE值最小的模型作为最优模型对主要农产品未来5年的物流需求量进行预测,分析得到的预测值如表4所示。对预测得到的结果进行检验,小概率误差精度检验结果等级为一级,平均相对残差可靠性等级为二级,数据的均方差比值C=0.249 866 5≤0.35,可靠性等级为一级,说明该模型对原数据的拟合程度具有较高的准确性。因此,可以利用该预测结果作为无偏GM-BP 组合预测模型的线性主体部分。
3.3 BP神经网络模型预测分析
根据关联度分析所得到的数据可以看出,文中所选取的影响因素指标对安徽省主要农产品物流需求的影响是十分显著的。因此,可以确定BP神经网络(见图1)的输入神经元的数量为10个,通过神经网络经验公式kolmogorov定理:[h=m+n+a]可知,其隐层神经元个数应为5~14。经训练集训练检验,可以确定:其隐含层神经元数量为13个时,其回归预测结果最好。