一种基于改进YOLO v5n的黄桃虫害检测方法

作者: 曾孟佳 徐欢 黄旭

一种基于改进YOLO v5n的黄桃虫害检测方法0

摘要 为了减少虫害,增加桃树产量,提出了一种基于改进YOLO v5n的桃虫害检测方法。首先,针对虫害世代重叠和虫害数据长尾分布,构建了一个多类别的桃虫害数据集;其次在主干网络中引入RFB多分支空洞卷积层,增大模型的感受野,提升模型的特征提取能力,同时将颈部网络结构替换为BiFPN结构,对不同层次的特征图进行特征重结合,改进特征融合的方式;最后,将激活函数更改为ReLU,避免了原激活函数在某些硬件环境中不兼容的问题。结果表明,与原YOLO v5n算法相比,改进算法的准确率、召回率分别提升了1.6%和6.6%,平均精度均值提高了3.6%,达到了88.8%,优于其他YOLO轻量级模型。

关键词 桃;虫害检测;RFB;BiFPN;YOLO v5n

中图分类号 S 126  文献标识码 A  文章编号 0517-6611(2025)03-0236-07

doi:10.3969/j.issn.0517-6611.2025.03.047

开放科学(资源服务)标识码(OSID):

An Improved Peach Pest Detection Method Based on YOLO v5n

ZENG Meng jia1,2,3, XU Huan1, HUANG Xu1,2,3

(1.School of Information Engineering, Huzhou University, Huzhou,Zhejiang 313000;2.School of Electronic Information, Huzhou College, Huzhou,Zhejiang 313000;3.Huzhou Key Laboratory of Urban Multidimensional Perception and Intelligent Computing, Huzhou,Zhejiang 313000)

Abstract To reduce pest damage and increase peach tree yield, we proposed an improved peach pest detection method based on YOLO v5n. Firstly, a multi class peach pest dataset was constructed to address the problem of overlapping pest generations and the long tail distribution of pest data. Secondly, RFB (receptive field block) multi branch dilated convolution layers were introduced into the backbone network to enlarge the model’s receptive field and enhance its feature extraction capability. Simultaneously, the neck network structure was replaced with BiFPN (bi directional feature pyramid network) structure to recombine features from different levels of feature maps and improve the way features were fused. Lastly, the activation function was changed to ReLU to avoid compatibility issues with certain hardware environments. Experimental results showed that compared to the original YOLO v5n algorithm, the improved algorithm achieved a 1.6% improvement in accuracy, a 6.6% improvement in recall rate, and an average precision mean increase of 3.6%(reaching 88.8%). It outperformed other lightweight YOLO models.

Key words Peach;Pest detection;RFB;BiFPN;YOLO v5n

基金项目 教育部人文社会科学一般项目(20YJCZH005);浙江省湖州市工业攻关项目(2018GG29);湖州学院国家级大学生创新创业训练项目(202313287007)。

作者简介 曾孟佳(1980—),女,湖北荆州人,副教授,在读博士,从事人工智能方法及其应用研究。*通信作者,教授,博士,从事智能计算及其应用研究。

收稿日期 2024-02-21

桃是一种具有观赏性的重要经济水果作物,是我国果树产业的组成部分1-2。它含有多种维生素、矿物质、脯氨酸,有很高的营养价值和药用价值,在实现农业增效、农民增收和乡村振兴中发挥了十分重要的作用3-5。而在桃生长过程中,极易受多种虫害影响6。因虫害的隐蔽性,以及虫害有世代重叠的现象,导致虫害的治理较为困难,通常采取广撒、勤撒农药的方式进行灭虫。但大量使用农药,不仅会增加农业生产成本,还会使害虫产生抗药性,破坏农田环境7-9

现阶段,大部分桃园虫害需要通过人工实地调查来检测10。但是人工实地勘察虫害所要求的专业性极高,是建立在专家的目视评估之上的,既耗时费力,又易因主观性出错11。计算机视觉技术可以在保证准确高效的前提下及时发现虫害,较为客观地进行判断12。早期人们使用激光或红外技术进行病虫害的识别,但是价格过于昂贵且过于专业,难以推广民用13-14。随着机器学习的拓展,在农业中使用深度学习技术成为首选15。部分研究人员对Mask-RCNN进行改进16-17,识别和分割桃病害;部分研究人员使用改进VGG模型对桃叶病害进行识别18,有很高的准确率。近年来,随着AI和边缘计算的融合,高效处理海量的边缘数据,为实现边缘智能(DI)提供了可能性19。Li等20用改进的MTC-YOLOv5n模型对黄瓜病害进行检测,准确率提升至84.9%,模型大小仅为4.7 MB,适合部署在移动端;Ma等21在对玉米叶病害检测时,使用改进YOLO v5n算法,平均准确率达到95.2%,模型大小为9.5 MB。

综上,基于深度学习的桃虫害算法虽然优于人工,但由于害虫本身的机动性、虫害发生的隐蔽性和世代重叠的现象,使得数据集获取困难,识别难度增大。鉴于此,在轻量化的前提下,针对样本长尾分布、特征提取困难的情况,笔者通过融合RFB结构和BiFPN结构,接受更多的图像信息,在YOLO v5n的基础上进行改进,拟实现改进YOLO v5n桃虫害识别算法。

1 数据与方法

1.1 数据来源与数据集构建

1.1.1 数据来源。

黄桃虫害数据集主要拍摄于湖州一桃园内。整个桃园呈带状分布,种有桃树千余棵,选择不同地点、不同时间采集虫害图片。

由于桃园内定期除虫,导致害虫发现较少;加上部分虫类过小,且虫害发生初期往往具有隐蔽性,难以观测。因此,该研究对可观测到的虫害种类进行研究,主要有桃红颈天牛、桃潜叶蛾等4种江浙地区主要桃树虫害。采集得到的数据见表1。

1.1.2 数据预处理与数据集构建。

拍摄到的虫害数据分辨率高达8 192×6 144,图像处理效率过于低下。为了提升模型的图像处理效率,先将图片的分辨率统一调整为640×640。

对数据分析发现存在以下问题:

①害虫存在世代重叠现象。害虫生长周期较短且大部分是完全变态发育,幼虫与成虫在形态结构和生活习性上完全不同,在识别时难以归为一类。

②虫害数据存在长尾分布情况。因为在桃园中会定期除虫,导致难以获得充足的虫害数据,且网上对这方面的数据也较少。

因此,在对采集到的数据进行划分时,将不同时期的虫害定义为不同类,最终得到6类虫害;采用数据增广手段扩充数目较少的类别,数据增广手段见图1。

对数据增广和再分类后的图片使用LabelImg对目标虫害进行标注操作,去除模糊不清的图片。依照上述方法得到虫害数据见表2。

最终整个数据集包含图片2 990张,将整个虫害数据集70%的图片划分为训练集,20%为验证集和10%的测试集。

1.2 研究方法

提出了一种改进YOLO v5n的黄桃虫害检测方法。利用RFB的空洞卷积操作,增加模型感受野,提升模型的特征提取能力;将颈部网络结构替换为BiFPN结构,对不同层次的特征图进行特征重结合,改进特征融合的方式;将激活函数更改为ReLU,避免了SiLU在某些硬件环境中不兼容的问题。最后得到1个提取特征能力提升且模型很小的轻量化网络改进YOLO v5n。

2 黄桃虫害检测网络的实现

2.1 YOLO v5s网络模型

YOLO v5(You Only Look Once version 5)属于单阶段目标检测模型,是基于YOLO v4基础上改进而得,对速度与精度都有较大的提升。在不断研究开发过程中,YOLO v5在原有模型基础上,延展出从1.0~7.1的10个版本。在这10个版本中,1.0~6.0版本都在调整层与层之间的顺序,不断提升准确率。YOLO v5-6.1支持多种格式的导出,YOLO v5-6.2新增了分类功能,YOLO v5-7.0可支持实例分割。因此,选择较为完善且无其余功能的YOLO v5-6.0作为主要研究对象。

在YOLO v5中,根据网络宽度和深度的不同,又可以细分为5个大小不同的模型,即YOLO v5n、YOLO v5s、YOLO v5m、YOLO v5l、YOLO v5x,其相对应模型的模型参数量和模型大小依次提高。在上述5个不同规模的模型中,平衡模型宽度系数、深度系数、权重文件大小、参数量、浮点运算量这5个指标,对这5个不同的模型进行分析(表3)。

由于在生产生活中,常使用边缘设备对黄桃虫害进行推理识别,而边缘设备对模型大小、算子的组成有较高的要求,因此选择权重文件较小、参数量较少的YOLO v5n-6.0(简称YOLO v5n)作为该试验的基础模型。

经典小说推荐

杂志订阅

友情链接