基于改进YOLOX_Nano的番茄叶片病害识别研究

作者: 方晓捷 严李强 张福豪 宋沛琳

基于改进YOLOX_Nano的番茄叶片病害识别研究0

摘要 近年来,番茄遭受的病害种类越来越多,这些病害对番茄产量和果实品质产生巨大影响,及时高效识别病害并采取有效措施成为当前番茄生产的迫切需求。针对现有模型番茄病害识别率较低以及模型较大较复杂的问题,提出一种基于改进YOLOX_Nano的病害识别模型。通过引入全局注意力机制以增强特征图的全局信息捕捉能力,改进特征金字塔网络中的上采样模块和路径聚合网络中的下采样模块,以提升特征的表达能力和融合效果。试验结果表明,该方法对番茄叶片病害识别的mAP达到89.16%。优化后的模型不仅在番茄叶片病害识别上表现出高准确率和快速检测性能,而且参数量和计算量较少,便于部署于手机等移动设备。该方法可为番茄叶片病害轻量化快速高效识别提供参考。

关键词 YOLOX_Nano网络;GAM注意力机制;番茄病害识别

中图分类号 TP391.41 文献标识码 A 文章编号 0517-6611(2025)06-0238-05

doi:10.3969/j.issn.0517-6611.2025.06.053

Research on Tomato Leaf Disease Recognition Based on Improved YOLOX-Nano

FANG Xiao-jie,YAN Li-qiang,ZHANG Fu-hao et al

(School of Information Science and Technology,Tibet University,Lhasa,Xizang 850000)

Abstract In recent years, tomatoes have suffered from an increasing number of diseases, which have a huge impact on tomato yield and fruit quality. Timely and efficient identification of diseases and taking effective measures have become an urgent need for tomato production. In response to the low recognition rate of tomato diseases in existing models and the problem of large and complex models, this paper proposes a disease recognition model based on improved YOLOX-Nano. By introducing a global attention mechanism to enhance the global information capture ability of feature maps, improving the upsampling module in the feature pyramid network and the downsampling module in the path aggregation network, the expression ability and fusion effect of features can be improved. The experimental results showed that the mAP of this method for identifying tomato leaf diseases reached 89.16%. The optimized model not only exhibits high accuracy and fast detection performance in tomato leaf disease recognition, but also has fewer parameters and calculations, making it easy to deploy on mobile devices such as smartphones. This method can provide a reference for lightweight, fast, and efficient identification of tomato leaf diseases.

Key words YOLOX-Nano net;Global attention mechanism;Tomato disease identification

当前,农作物病害是全球农业生产中的一大挑战,尤其是在我国农业种植结构日益复杂的背景下,病害问题愈发突出,严重影响了农作物产量和品质。番茄作为我国重要的传统作物,其种植面积和产量均居世界前列。近年来,随着气候变化和农业集约化的发展,番茄病害的种类和发生频率显著增加,常见的病害包括早疫病、黄化曲叶病、褐斑病、叶霉病等。这些病害在叶片中表现出不同的症状,严重时会显著降低番茄产量和果实质量,给农户带来巨大经济损失[1]。识别并防治这些病症对于确保番茄的健康生长至关重要。传统的病害识别方法依赖于农户的经验和常规的农药防治,效率低下且容易导致误判。基于深度学习的病害识别基于人工智能的应用,能够及时识别病害并采取有效防治措施,不仅能防止病害扩散、减少作物损失,还能提高农业生产效率,同时避免过量使用农药,减轻对环境和生态系统的压力,促进农业可持续发展[2]。因此,采用新技术提高番茄病害识别的精度和速度成为当前农业生产的迫切需求。

随着深度学习技术的发展和计算机图像处理能力的提升,计算机视觉技术在农作物病害识别领域的应用取得了显著成果。例如,Widiyanto等[3]采用FasterR-CNN模型训练番茄图像,通过颜色识别番茄成熟度,平均精确度达到98.7%;赵越等[4]研究显示,FasterR-CNN与VGG16结合的方式在马铃薯叶片病害识别中表现优异,检测精度高达99.5%,远超YOLOv3和YOLOv4。刘阗宇[5]在FasterR-CNN的基础上改进区域建议网络,提高建议区域质量,使多姿态葡萄叶片的检测精度得以提升。李玉芳[6]通过简化GoogLeNet的Inception模块,获得了在农作物病害9分类中达到98.4%精度的分类网络。廖露等[7]结合VGG19和迁移学习模型,解决传统水稻病害分类方法的效率和准确度问题,正确率超过99%。Nandi等[8]使用ResNet识别14个品种的植物叶片图像,准确率高达99.53%。Mohandas等[9]提出YOLOv4-tiny模型,用于高效检测番茄、草莓等农作物的病害。Liu等[10]通过改进MobileNetV2和YOLOv3模型,实现了对番茄灰斑病的高效检测。公徐路等[11]基于YOLOv5s模型,通过轻量化网络和注意力模块,提高了苹果叶片小目标病害的检测精度。马超伟等[12]提出使用改进的YOLOv8模型,结合PP-LCNet和深度可分离卷积,优化了小麦病害的检测性能。

上述深度学习技术在提高检测准确性的同时,也在努力减少内存占用和参数数量,以实现高准确度识别、快速检测,并便于在移动设备上部署。尽管检测精度有所提高,但随着模型参数的增加,模型的复杂度也随之增加,导致更多的浮点运算,这可能会增加延迟,从而影响实时检测的性能。在此背景下,人工智能公司旷视科技在2021年提出了YOLOX检模型。YOLOX_Nano作为YOLOX系列中参数量最精简的模型,因其具有较少的参数、快速的浮点运算能力、低延迟、检测精度较高以及便于在移动设备上部署等优势,所以受到了业界的广泛关注。该研究旨在对YOLOX_Nano的基础架构进行深入优化,目标是在不显著增加模型的内存和计算参数的情况下,引入全局注意力机制,提出一种基于改进YOLOX_Nano的番茄叶片病害识别模型。

1 试验数据

1.1 数据获取

试验所需的所有数据来自公开数据集PlantVillage网站,该网站涵盖番茄作物的8种叶片病害,共14 893张:分别是疮痂病2 127张,早疫病1 000张,晚疫病1 909张,叶霉病952张,斑枯病1 771张,褐斑病1 404张,黄化曲叶病5 357张,花叶病373张,其中每张照片的像素均为256×256。

1.2 数据处理

利用Labelimg软件对番茄叶片上的病斑进行标注,并将有关病斑的类别和位置等信息存储于相应的xml文件中。将试验数据根据类别按8∶1∶1的比例划分为训练集、验证集和测试集。由于某些类别数据不均衡,采取数据增强的方法来扩充早疫病、叶霉病、花叶病训练集,具体包括水平翻转、垂直翻转和图像旋转。经过增强处理后,训练集的图片数量从14 893张增加到17 352张。每种番茄叶片病害的图片数量详表1。

2 番茄叶片病害智能检测模型

2.1 YOLOX_Nano网络

YOLOX_Nano是YOLO系列最轻量化的版本,相比传统的目标检测模型,YOLOX_Nano在检测速度和模型体积方面表现更为出色,更适合于移动端和嵌入式设备的部署[13]。YOLOX_Nano的整体结构可以分为4个主要部分,分别为:CSPDarkNet主干提取网络,这是YOLOX_Nano的骨干网络,负责从输入图像中提取高层次的特征表示,使用Cross-Stage Partial Networks(CSP)结构,以提高计算效率和特征学习能力;特征金字塔网络(FPN),通过在不同网络层次上融合和提取特征,以确保模型能够检测多尺度的目标;路径聚合网络(PAN),进一步优化了特征的传播和融合,确保在不同层次上的特征信息能够充分交互和利用,以增强检测的准确性和鲁棒性;YOLOHead输出层,是YOLOX_Nano的检测头部分,使用Anchor-free的检测方法。它负责从特征图中预测目标的位置、类别和置信度,是整个目标检测过程的关键组成部分。图1是YOLOX_Nano的结构图。

2.2 全局注意力机制

鉴于YOLOX_Nano网络结构的简化,未能充分捕捉特征向量之间的关联,导致对相似且难以区分的目标预测效果不佳,同时所使用的数据集中番茄叶片病害特征确实存在相似性问题。为此,该研究在YOLOX_Nano模型中引入全局注意力模块,旨在帮助网络更有效地聚焦于重要的特征信息,从而提升对关键目标的识别能力。

全局注意力机制(global attention mechanism,GAM)通过优化信息流和增强模型对全局特征的交互能力来实现提升深度神经网络的性能,这种机制有助于降低信息的分散性,并提升模型在全局维度上的特征交互。通过融入全局注意力机制,模型能够更加精准地识别图像中的关键信息,进而在背景复杂和光线变化的条件下,提高病害识别的准确性。GAM注意力机制由通道子注意力模块Mc和空间子注意力模块Ms构成。通道子注意力模块使用三维排列在3个不同维度上来保留信息,然后利用1个2层的多层感知机(MLP)来增强跨维度的空间信息交互,从而提高特征表示的能力。空间子注意力模块关注空间信息,通过使用2个卷积层进行空间信息的融合,充分学习空间特征[14]。GAM注意力机制原理如图2所示。

在通道子注意模块中,中间状态的定义为公式(1):

F2=Mc(F1)(×)F1(1)

式中:Mc表示通道注意力图;(×)表示级联。

在空间子注意模块中,中间状态的定义为公式(2):

F3=Ms(F2)(×)F2(2)

式中:Ms表示空间注意力图;(×)表示级联。

2.3 改进的YOLOX_Nano网络

该研究在YOLOX_Nano网络的基础上引入GAM注意力模块,对输入的特征层进行全局处理,通过对全局上下文建模,对不同通道的特征图进行权重的重新分配,增强网络结构深层的特征提取,让网络聚焦于关键特征`,忽视非重点特征。既优化了网络的学习能力,又提高了特征的重要性和区分度[15]。

在FPN和PAN网络中对特征进行上采样和下采样,主要是为了在不同的特征层级中进行信息融合和尺度适配。通过上采样可以将低分辨率的特征图扩展到更高的分辨率,以便与来自其他层级的特征图进行融合;而下采样则有助于从较高分辨率的特征图中提取更丰富的语义信息,并减少整体的计算负担。在上述过程中,可能会丢失一些重要的细节信息。该研究通过在上采样前加入全局注意力机制,可以让网络在恢复高分辨率特征图时更好地利用全局上下文信息,从而保留更多有用的细节信息;通过在下采样前加入全局注意力机制,可以帮助网络更好地整合全局信息,选择性地保留那些对最终任务有重要影响的特征,从而提升下采样过程中的信息保留和特征表达能力。在上采样和下采样前引入全局注意力机制,能够在这些关键特征处理阶段为网络提供全局上下文信息。这有助于网络更好地保留和增强重要特征、减少信息丢失,并优化特征融合过程。通过这种方式,网络的特征表达能力得到提升,进而提升最终的任务性能[16]。图3是改进后的YOLOX_Nano_GAM网络结构图。

经典小说推荐

杂志订阅

友情链接