基于GA-BP神经网络的雨生红球藻生长趋势预测

作者: 崔世钢 石兰婷 张永立 何林 李欣颀 张靖宇

基于GA-BP神经网络的雨生红球藻生长趋势预测0

摘要 虾青素具有极强的抗氧化功能,然而在自然界中,能够在相同时间内积累最多虾青素的生物主要为雨生红球藻。但其生长周期较长且对生长环境依赖性强,因此其生长环境参数与其生长、繁殖状况之间存在着非线性关系。BP神经网络模型运用了梯度下降法的基本思想,可以较好逼近复杂的非线性关系。但由于BP神经网络容易陷入局部最小,从而影响预测的结果,所以采用遗传算法对BP神经网络进行优化。根据影响雨生红球藻生长的主要环境(pH),建立基于遗传算法的BP神经网络模型,并对雨生红球藻生长状况进行试验验证,准确率可以达到90%以上。

关键词 雨生红球藻;BP神经网络;遗传算法;预测;pH

中图分类号 TP 183  文献标识码 A

文章编号 0517-6611(2022)20-0235-05

doi:10.3969/j.issn.0517-6611.2022.20.060

Prediction of Growth Trend of Haematococcus pluvialis Based on GA-BP Neural Network

CUI Shi-gang,SHI Lan-ting,ZHANG Yong-li et al (Tianjin University of Technology and Education,Tianjin 300222)

Abstract Astaxanthin has a strong antioxidant function.However, in nature, the organisms that can accumulate the most astaxanthin at the same time are mainly Rhodococcus pluvialis.However, its growth cycle is long and strongly dependent on the growth environment, so there is a nonlinear relationship between its growth environment parameters and its growth and reproduction.BP neural network model used the basic idea of gradient descent method, which could better approach the complex nonlinear relationship.However, because BP neural network was easy to fall into local minimum, which affected the prediction results, genetic algorithm was used to optimize BP neural network.According to the main environment (pH) affecting the growth of Haematococcus pluvialis,a BP neural network model based on genetic algorithm was established, and the growth status of Haematococcus pluvialis was experimentally verified.The accuracy could reach more than 90%.

Key words Haematococcus pluvialis;BP neural network;Genetic algorithm;Forecast;pH

虾青素是一种酮类胡萝卜素[1],比其他天然抗氧化药物具有更强的抗氧化活性。虾青素能够对多种疾病起到辅助治疗的作用,能够抑制肿瘤生长、保护中枢神经系统、预防心脑血管疾病等,因此广泛用于食品、医药和化妆品[2-4]。雨生红球藻在特定的胁迫条件下可以快速积累虾青素,最大积累量可达其干细胞重量的1%。近年来,国内外对于大量生产虾青素的研究已经逐渐向培育雨生红球藻靠拢[5]。

侯奇等[6]建立了预测李斯特菌生长的二级BP神经网络模型。由于雨生红球藻生长周期长,而且与大多数微生物不同,其生长状态分为2个阶段,不同阶段生长条件也不相同,因此很少有可供参考的客观数据。特别是在试验过程中需要消耗大量的时间对雨生红球藻的生长状况进行观测,但其生长趋势依旧很难预测,导致反复试验消耗大量的人力物力依旧不容易得到好的培养效果。因此建立雨生红球藻生长趋势的预测模型,对提高雨生红球藻生产效率的研究提供重要的参考。鉴于此,根据影响雨生红球藻生长的主要环境(pH),建立基于遗传算法的BP神经网络模型,并对雨生红球藻生长状况进行试验验证。

1 雨生红球藻

雨生红球藻(Haematococcus pluvialis)是一种生活在淡水中的单细胞绿藻,其生长状态分为细胞大量增殖阶段和虾青素积累阶段。在环境适宜营养充足的条件下,该细胞主要呈现绿色并处于游动状态,此时繁殖迅速,虾青素含量少。当生存环境恶劣时,为了保证正常生长游动细胞的鞭毛退化,细胞停止游动,为了保证正常生存开始大量积累虾青素,细胞逐渐变为红色[7-8]。

根据雨生红球藻的生长特性,国内外的学者提出了2阶段生产方式的生产模式:第1阶段是对藻细胞进行大量的增殖(也被称为细胞增殖阶段);第2阶段是胁迫雨生红球藻细胞快速积累虾青素(也被称为虾青素积累阶段)。大量研究表明,雨生红球藻的生长需要很多适宜的条件,如温度、光照强度、生存环境的营养成分、pH等,其中pH是关键因素之一。雨生红球藻培养过程中,pH的范围将直接影响藻类细胞的生长和虾青素的积累[9]。相关研究表明,当扩培阶段的藻液处于弱碱性(pH=7.0~9.0)时,光合作用效率大幅提高,藻细胞大量增殖。当诱导阶段的藻液pH为7.0~8.0[10]时,虾青素积累最快[11]。

2 遗传算法以及BP神经网络

BP神经网络(Back Propagation Neural Network)是一种多层前馈神经网络,可以通过误差的反向传播来修正层间的参数。通过输入和期望输出,学习需预测的数据样本。通过输入层将数据传递给隐藏层中的各个神经元,通过计算得到预测的输出值,若预测值与实际值相减的误差不满足预测的精度,则输入层将所得的误差返回,从而修改各层之间的权阈值,使得到的预测输出与实际输出之间的误差逐渐减小,直至满足预测所需的精度。其学习规则采用梯度下降法,以此来得到目标函数的最小值,常用于解决复杂的非线性模型。

雨生红球藻的生长环境参数与生长情况之间存在着非线性关系,因此采用对非线性函数具有最佳逼近性和全局最优性能的神经网络来预测雨生红球藻的生长条件。该研究将雨生红球藻的培养时的pH作为神经网络的输入量,其他环境变量保持不变,将试验测得的生长状态数据作为神经网络的输出量,建立雨生红球藻在不同pH生长状态预测模型。其拓扑结构如图1所示。

遗传算法(Genetic Algorithm,GA)起源于生物进化论,它是模拟自然界生物进化过程中优胜劣汰的一种优化算法。将种群和DNA的概念引入需要优化的参数中,形成参数种群编码,按照适应度函数对遗传信息进行选择、交叉、变异等操作,从而实现对个体的筛选。保留具有优秀基因的个体,淘汰适应度差的个体。种群不断地迭代、循环直至得到满足条件的最优解[12]。

BP神经网络主要由信息前向传播和误差反向传播组成。信息前向传播指的是待预测数据经过输入层传递到隐藏层中,在隐藏层通过对阈值和权值进行计算得到输出结果。将预测结果和实际值做差得到预测的误差值,将误差值传回隐藏层,并通过误差函数对权值和阈值进行更新,不断重复上述2个过程,最终得到理想的参数[13-15]。

3 GA-BP神经网络模型

由于BP神经网络是采用梯度下降法来对相应的参数进行优化,因此在优化的过程中会因为初值的选取出现局部最小值的问题,这样不仅训练时间长,收敛速度也慢。因此,由于遗传算法具有良好的全局寻优能力,故采用其对BP神经网络进行优化,从而找到最优的权值和阈值,提高预测模型的准确率。

3.1 BP神经网络的建立

3.1.1 设定初始参数。

网络的训练方法采用梯度下降法。最大训练次数epochs为2 000,学习率μ=0.005,目标误差0.000 01。

3.1.2 确定隐含层节点数。BP神经网络选取结构为3层,分别是1个输入神经元、5个隐含神经元和1个输出神经元,分别对细胞和数量进行预测。其中,隐含层神经元数量根据式(1)确定为5个,并经过验证可达到最佳的预测效果。

m=n+l+α(1)

式中,n、l、m分别为输入、输出以及隐含层节点数量,α取1~10的整数。

3.1.3 转移函数的选取。隐含层的传递函数采用Tanh函数,值域为(-1, 1)。其定义为:

Tanh(x)=2σ(2x)-1=21+e-2x-1(2)

输出层的传递函数采用Sigmoid函数。其函数定义见式(3):

σ(x)=11+e-x(3)

3.2 遗传算法优化BP神经网络 将遗传算法的3类遗传算子与BP神经网络的权值与阈值结合以来,通过对数据进行训练,找到最优的参数,进而达到对雨生红球藻的生长趋势的精准预测。其模型建立步骤如下:

3.2.1 种群初始化。种群的个体是BP神经网络的所有权值和阈值,对个体采用实数编码。编码采用二进制表示,长度为:

S=n×m+m+m×l+l(4)

种群的规模要根据实际问题进行选取,才能使遗传算法的优化性能达到最好。因此,初始种群为15。

3.2.2 适应度函数。通过编码个体得到BP神经网络的初始权值和阈值,以BP神经网络训练得到的输出与实际输出之间的绝对误差E推出个体适应度值fi。

Ei=abs(yi-oi)

fi=1(ni=1Ei)(5)

式中,BP神经网络的预期输出和实际输出分别为yi、oi。根据适应度函数,期望输出和实际输出的误差越小,适应度函数越大。

3.2.3 选择操作。从种群中选择优秀个体作为繁殖后代的母体。方法采用轮盘赌选择法。主要思想是每个个体被选中的概率与适合度成正比。即:

pi=fiNj=1fi(6)

3.2.4 交叉操作。

交叉操作是遗传基因重组的过程,以便将当前的最优基因传到下一代并获得新的个体。从群体中随机选择2个个体进行配对,根据交叉概率pc=0.2交换2个个体的部分基因。

从而获得2个具有新基因的个体。将随机选取的个体ω1、ω2在第k位基因的交换如下:

gω1k=gω1ka+gω2k(1-a)

gω2k=gω2ka+gω1k(1-a)(7)

式中,b为[0,1]的随机数。

3.2.5 变异操作。变异操作相当于生物学上的基因突变,根据变异概率pm=0.1对第i个个体的第j个基因gij进行变异,随机产生优秀的生物个体,丰富种群的多样性。其变异方法如下:

gij=gij+(gij-gmax)b1(1-d/Dmax) b1>0.5

gij+(gmin-gij)b1(1-d/Dmax) b1≤0.5(8)

式中,b1为随机数,d为当前迭代次数,Dmax为最大进化次数,gmax为基因gij的上界,gmin为基因gij的下界。

GA-BP神经网络算法流程见图2。

4 试验与数据采集

经典小说推荐

杂志订阅

友情链接