基于SSO-PP的水质综合评价方法

作者: 杨旭莹 宋金玲 祝美宁 刘风超

基于SSO-PP的水质综合评价方法0

[摘 要] 水质分级评价是水资源保护的一项基本工作,客观、合理地对水质进行综合分级评价对预防水污染和高效利用水资源具有重要意义。为此,选取溶解氧(DO)、高锰酸盐指数(CODMn)、五日生化需氧量(BOD5)、总磷(TP)和氨氮(NH3-N)5项监测指标,基于投影寻踪(Projection Pursuit,PP)方法构建水质分级评价模型,并引入群居蜘蛛优化算法(Social Spider Optimization,SSO)确定各个指标的最佳投影方向,形成了基于SSO-PP的水质综合分级评价模型。最后,以福建省莆田市的233个水质监测样本为例,对SSO-PP模型的评价效果进行验证。对比分析表明,SSO-PP模型的评价结果具有一定的客观性和合理性,说明SSO-PP模型在水环境的综合评价中具有较好的可行性。

[关键词] 水资源;水质;分级评价;投影寻踪;群居蜘蛛优化算法

[中图分类号] X824 [文献标志码] A [文章编号] 1674-7909(2022)06--4

0 引言

水资源是区域经济发展不可或缺的物质基础,但是随着全球气候变化及人类生产生活的影响,水质恶化、水资源短缺等问题日益突出。及时、准确、客观地根据水体各项指标对水质进行综合评价,对水污染控制及水资源利用都具有重要的现实意义。近年来,学者们使用的水质评价方法主要包括灰色聚类法[1]、神经网络法[2-3]、层次分析法[4]、模糊分析法[5]和支持向量机法[6]等。这些方法都推动了水质综合评价质量的提升,但是评价结果的客观性和准确性还需要进一步提高。因此,需要进一步探索新的水质综合评价方法。

投影寻踪(PP)方法可以将高维数据投影到低维空间,即在水资源配置和评价[5-6]中,将多维水质指标数据投影到一维数据(水质级别),便于相关研究人员及时、准确、客观地根据水体各项指标对水质进行综合评价。因此,笔者将该方法作为水质综合评价的基础模型。在PP方法中,能够反映数据特性的最佳投影方向a是影响投影精度的关键因素,另因群居蜘蛛优化算法(SSO)[7]是一种新型的群体智能进化算法,该算法相对常用的遗传算法、混合蛙跳算法[8]、蝙蝠算法[9]、蚁群算法[10]和粒子群算法[11]等优化算法具有更快的收敛速度和更强的全局搜索能力,所以笔者采用SSO算法选取PP方法的最佳投影方向。最后,笔者以福建省莆田市2018—2020年的水质监测数据为例,对SSO-PP水质综合评价模型进行了验证,结果表明SSO-PP模型可以对水质进行综合有效评价,该模型具有一定的可行性。

1 SSO-PP水质评价模型构建

1.1 投影寻踪(PP)方法

PP方法就是把高维数据投影到低维空间,通过极值化投影指标来反映原数据特征,并在低维空间进行数据结构分析。用PP方法实现水质综合评价的步骤如下。

①数据预处理。设有n个水质样本数,由m个水质评价指标构成的水质样本集为{x(i,j)|i=1,2,…,n;j=1,2,…,m},由于水质各评价指标的量纲不同,采用式(1)将数据进行标准化。数据预处理的计算公式如式(1)所示:

(1)

式(1)中:x(i,j)为水质数据集中第i行第j列数值;xmax(j)和xmin(j)是水质指标中的最大值和最小值。

②构造投影目标函数。维度为m的数据{x(i,j)|i=1,2,…,n;j=1,2,…,m}以a为投影方向进行投影,得到一维投影值z(i),其中是单位向量。投影指标函数如式(2)所示:

(2)

③投影指标函数寻优。投影指标函数值越大,说明其投影方向a越能反映高维数据的某种特征,投影指标函数值最大时a就是最优投影方向。投影值的优劣一般用标准差Sz和局部密度Dz这两个指标评价,因此,将Sz和Dz结合可以构造投影方向的优化函数Q(a)。Q(a)的计算公式如式(3)所示:

(3)

式(3)中:Sz为投影值z(i)的标准差矩阵;Dz为投影值z(i)的局部密度矩阵;R为Dz的局部半径;r(i,j)为样本点之间的距离;o(τ)为单位布阶函数,当τ≥0时,其值为1,τ<0时,则为0。

④建立水质评价等级阈值。根据《地表水环境质量标准》(GB 3838—2002)中对各水质指标限值的规定,参照式(1)对水质指标等级临界值进行标准化,计算得到每个等级标准投影值z'(k)。

⑤水质分级。同步骤4,计算样本数据得到各断面投影值z(i),根据z'(k)对本次水质进行综合评价。

1.2 群居蜘蛛优化算法(SSO)

SSO算法通过模拟群居蜘蛛的行为搜寻最优解,将整个搜索空间作为蜘蛛行动的蜘蛛网,每个蜘蛛的位置是目标优化函数的潜在解,质量最大的蜘蛛个体的位置作为最优解。个体按性别执行不同的搜索方式,雌性会接近质量较大的蜘蛛,而雄性向种群的中间位置聚集,且雄性将与满足交配距离的雌性交配[12],再通过权重判断新个体是否代替群体中的最差个体。个体间通过振动的强弱可以将不同的信息在蜘蛛网络上传递给其他个体,振动的强弱由蜘蛛的质量和个体间距离决定。SSO算法通过不断循环搜索直到找到最优解,SSO算法的实现步骤如下。

①设所有蜘蛛的数量为N,雌性蜘蛛和雄性蜘蛛的数量是qf和qm,雌蜘蛛群体为F={f1,f2,…,fqf},雄蜘蛛群体为M={m1,m2,…,mqm},qf及qm分别定义为式(4)、式(5):

(4)

(5)

式(4)、式(5)中:floor为取整函数;rand为[0,1]中的随机数。

②初始化蜘蛛种群,S={s1=f1,s2=f2,…,sqf=fqf,fqf+1=m1,fqf+2=m2,…,sN=mqm}。每个个体初始位置公式如式(6)所示:

(6)

式(6)中:pmax j和pmin j分别为蜘蛛个体第j维上下限值。

③计算种群S中每只蜘蛛的权重,如式(7)所示:

(7)

式(7)中:wi为蜘蛛个体的权重;J(si)为用所求问题的适应度函数求得的蜘蛛si个体的适应度值;worsts为最劣适应度值;bests为最优的适应度值。

④雌性蜘蛛移动。种群间传递的信息按照振动的方式编码,振动取决于蜘蛛的权重和距离。雌蜘蛛的移动依赖于范围在[0,1]间的随机数rm,如果rm小于阈值PF,雌蜘蛛就靠近最优的雌蜘蛛,反之远离。雌蜘蛛的新位置如式(8)所示:

式(8)中:α、β、δ是[0,1]的随机数;k为迭代次数;个体sc质量大于个体i且两者距离最近;sb为最好的雌蜘蛛;Vibci是个体i和c之间通信的振动因子,Vibbi是个体i和b之间通信的振动因子,两种振动因子分别见式(9)、式(10):

(9)

(10)

式(9)、式(10)中:wc>wi;wb为种群中最大的权重值;di,c=‖si-sc‖;di,b=‖si-sb‖。

⑤雄蜘蛛按照下式(11)协作方式移动,质量为wqf+m的雄蜘蛛是中间值,大于中间值的雄蜘蛛向雌蜘蛛移动,小于中间值的雄蜘蛛会聚集到雄蜘蛛种群的中心。雄蜘蛛的新位置如式(11)所示:

(11)

式(11)中:雌蜘蛛sf与雄蜘蛛i最为相近;mh为雄蜘蛛种群的中心;mi为雄蜘蛛当前位置;wqf+i为雄蜘蛛个体i的质量;wqf+h为中心位置雄蜘蛛的质量;Vibfi代表雄蜘蛛i与最近雌蜘蛛f之间通信的振动因子,如式(12)所示:

(12)

⑥雌雄蜘蛛进行交配,当一只雄蜘蛛m在一个特定半径范围r内搜索到雌蜘蛛,就进行交配产生新个体,形成新的种群Tg。如式(13)所示:

(13)

式(13)中:n为空间维度。

据轮盘法确定概率psi,wi为蜘蛛个体权重,如式(14)所示。得到的新蜘蛛与原来种群进行对比,优势蜘蛛将替代原有的最差个体。

(14)

由于SSO算法是一种新的随机全局优化技术,可以防止个体围聚在较好群体附近,使个体进行全局搜索,解决了易陷入局部最优解和搜索结果不稳定的问题,并且该方法初值和参数的选择对结果影响较小,寻优能力和鲁棒性较强。因此,针对PP模型在水质评价中的最佳投影方向难以确定的问题,笔者采用了SSO算法解决。

1.3 建立SSO-PP模型

综合利用PP方法和SSO算法,即可构建出对水质各指标进行综合评价的SSO-PP模型。SSO-PP模型的具体实现步骤如下。

①数据初始化。用式(1)对样本数据进行归一化。②由于SSO算法搜索的是极小值,为了让Q(a)(=SzDz)最大,因此,将作为SSO算法的适应度函数。③设置初始参数。种群数量为N,最大迭代次数maxtime,阈值PF。④用SSO算法找出最优解,SSO迭代终止后,即可得到最佳投影方向a。⑤利用a求得水质等级标准值z'(k),对此次水质样本数据进行计算得到z(i),根据z'(k)对水质样本进行综合评价。

2 实例分析

2.1 研究区概况

此研究以莆田市小流域水源地为研究区,包括白沙桥、江口桥、蒋隔水库、濑溪、木兰溪三江口、南安陂、狮亭桥、仙游石马桥和园头桥9个断面,共收集了2018—2020年间9个断面的233个水质样本进行综合评价。监测指标选用了溶解氧(DO)、高锰酸盐指数(CODMn)、五日生化需氧量(BOD5)、总磷(TP)和氨氮(NH3-N),根据《地表水环境质量标准》(GB 3838—2002),各水质指标评价等级标准见表1。将表1中各指标评价最大值扩大10倍,最小值缩小至原来的1/10[13],用于数据初始化,使SSO-PP模型准确度更高。

2.2 设置SSO算法参数

最大迭代次数maxtime=20,种群数目N=10;阈值PF=0.55。

2.3 SSO-PP模型评价水质等级

利用SSO-PP模型得到最佳投影方向a。DO、CODMn、BOD5、NH3-N、TP的最佳投影方向a=(0.141 51,0.999 98,0.871 95,0.890 88,0.987 02),结合表1中各指标的分级阈值,将其代入式(2)得到投影值z'。据此得到水质综合评价分级标准为:Ⅰ类≤0.001 1;Ⅱ类(0.001 1,0.006 2];Ⅲ类(0.006 2,0.012 6];Ⅳ类(0.012 6,0.018 9];Ⅴ类(0.018 9,0.025 3];劣Ⅴ类>0.025 3。

2.4 评价结果

将监测的水质样本按式(1)进行归一化,把最佳投影方向a代入到式(2)中,可得到2018—2020年各断面的投影值z(i),根据水质分级标准即可得到各断面的水质等级,选取部分水质样本的评价结果见表2。从表2可以看出,在园头桥、蒋隔水库和木兰溪三江口这些断面上,单因子评价法得出的水质等级比SSO-PP模型综合评价法差,主要原因在于单因子评价法以最差一项指标等级为标准,忽略了其他指标对水质的综合影响,低估了各断面的水域功能。而SSO-PP模型是用各样点投影值反映水体特征,与单因子评价法相比具有一定的优越性。

经统计,在选取的233个水质样本中,有208个水质样本的评价结果与单因子评价法相同,占总比的89.27%,另有25个水质样本的评价结果与单因子评价法不同,占总比的10.73%。在评价结果不同的25个样本中,SSO-PP模型优于单因子评价法1级的个数为17个,优于单因子评价法2级的个数为8个。相差2级是由于样本中的DO质量浓度处于Ⅴ类标准,但高锰酸盐指数、五日化需氧量、总磷和氨氮质量浓度对应的水质达到了Ⅰ类或Ⅱ类标准。由于单因子评价法选取最差指标所在的水质等级作为此断面评价结果,评价较为片面,不能客观反映水环境的综合情况,而SSO-PP模型综合评价法权衡了较好的指标。

经典小说推荐

杂志订阅

友情链接