基于深度学习的玉米种子图像分类识别研究

作者: 张宇航 杨冬风

基于深度学习的玉米种子图像分类识别研究0

摘 要:种子分类识别技术的应用潜力巨大,可以在种子生产、农业科研、种植管理等领域发挥重要作用。通过采集不同品种的玉米种子图像,并利用预处理和数据增强技术对数据集进行处理,构建了一个包含4种深度学习网络模型的试验框架(MobileNetV3、VGG16、GoogLeNet及ShuffleNet),对比4种模型在训练和测试阶段的表现,评估其准确率、损失值、训练时间,然后分析各个模型之间的差异。试验结果显示:MobileNetV3深度学习网络模型在玉米种子分类识别任务中表现出色,对玉米种子的识别精准度达到了93.4%。相比其他3种模型,MobileNetV3深度学习网络模型在准确率和损失值方面展现出最佳性能,并且具有较快的收敛速度和稳定的训练过程。

关键词:玉米;品种识别;深度学习

中图分类号:TP183;TP391.9 文献标志码:A 文章编号:1674-7909-(2023)13-141-3

0 引言

玉米是我国重要的粮食作物之一,其种植面积大、分布范围广,在保证我国粮食供给、促进经济发展、农民增收、维护社会稳定等方面具有重要作用。种子分类对于提高玉米产量和品质具有重要意义,有助于促进种子产业化发展和农业生产优化,助力农业产业可持续发展。近年来,深度学习技术快速发展,其在图像识别和分类领域应用广泛,如深度学习网络模型[1-2]。深度学习网络模型包括深度神经网络、循环神经网络、卷积神经网络等。

马睿等[3]提出的基于卷积神经网络模型的Xception与胚乳数据集建模方法较优,测试集准确率达到了92.78%。司海平等[4]提出一种基于特征融合的玉米品种图像识别方法,通过VGG16和ResNet50两种预训练网络来获取图像的深度特征,试验结果表明对特征进行融合相较于单一使用深度特征或传统特征具有更高的识别准确率。

此次研究旨在探索利用深度学习网络模型对玉米种子进行分类识别的可行性和效果。笔者采集不同品种的玉米种子图像,并利用预处理和数据增强技术对数据集进行处理,构建了一个包含4种深度学习网络模型的试验框架(MobileNetV3、VGG16、GoogLeNet和ShuffleNet),通过对比4种模型在训练和测试阶段的表现,评估其准确率、损失值、训练时间,并分析各个模型之间的差异。

1 试验材料与预处理

1.1 数据采集

此次研究以小金黄、金色超人、甜糯黄玉米、甜妃4个玉米品种为研究对象。在选取玉米种子过程中采用人工选种法,挑选饱满、无破损的玉米种子。其中,小金黄265粒、金色超人256粒、甜糯黄玉米172粒、甜妃166粒。将每种种子平铺在黑色桌面上,使用iPhone 12手机固定在桌面14 cm高处,在实验室自然光情况下垂直对玉米种子进行拍摄。

1.2 数据集的增强与划分

为了提高深度学习网络模型对玉米种子识别的准确率,此次试验利用Python和Opencv将多粒玉米种子图片区域分割成单粒玉米种子图片。分割前,先对图像进行阈值分割和二值化、去除边缘颗粒等处理。

针对样本数据不足导致的深度学习网络模型能力不足问题,为提高深度学习网络模型的准确度,此次研究采用随机旋转45°或-45°、增加噪声、图片池化、随机变色等操作对玉米种子数据集进行增强,数据集图片数量增加到原来的近4倍。从中随机选取每种玉米种子的80%的图像作为训练集,10%的图像作为测试集、10%的图像作为验证集,分别存放在对应的子目录中,如表1所示。

2 试验环境与模型原理

2.1 图像识别模型

此次研究采用了MobileNetV3、VGG16、GoogLeNet、ShuffleNet等4种不同的卷积神经网络模型作为试验的训练模型对玉米种子进行建模,分析各个网络和数据建模之间的差异。

2.1.1 MobileNetV3

相比于MobileNetV2,MobileNetV3更新了倒残差结构,加入了SE模块并且更新了激活函数,使用NAS搜索参数,重新设计耗时层结构。同时,MobileNetV3仍保持轻量级特性,具有较小的模型尺寸和计算开销,适用于计算资源受限的设备和应用。MobileNetV3 Large较于V2版本检测速度提升了25%,MobileNetV3 Small的准确度提高了6.6%,有效提高了应用在移动端的图像分类和检测任务的精度。因此,MobileNetV3是一种高性能、可调节、轻量级的卷积神经网络模型。

2.1.2 VGG16

VGG16的突出特点是卷积层均采用相同的卷积核参数,即每个卷积层的宽和高相同。VGG16卷积串联比单独使用一个较大的卷积核拥有更少的参数,同时比单独一个卷积层拥有更多的非线性变化,适应更复杂的模式[5]。而卷积核串联多次提取特征,比单一的卷积核提取的特征要细腻。Padding的步幅小于核的大小,可以覆盖提取特征,也提高了特征的细腻度。

2.1.3 GoogLeNet

GoogLeNet是由Google团队提出的一种深度卷积神经网络架构,其主要原理是采用了Inception模块来提取图像特征[6]。网络引入Inception结构代替了单纯的“卷积+激活函数”的传统操作,实现了高效的特征提取和计算过程,并具有较好的参数效率和抗衰减性。网络最后采用了average pooling来代替全连接层,使网络参数得到了明显降低,性能得到了提升。

2.1.4 ShuffleNet

ShuffleNet架构中主要采用了两种新操作:分组卷积(Pointwise Group Convolution)和通道重排(Channel Shuffle)。这两种操作在保持模型精度的同时大大降低了计算量,实现了高效的特征提取和交互。分组卷积将输入通道分组并进行卷积操作,可减少计算复杂度;通道重排操作增加特征之间的交互,可提高特征表示的丰富性[7]。

2.2 超参数设置

采用Python编程语言,使用基于Torch的PyTorch深度学习框架,使用PyCharm作为集成开发环境编写深度学习网络模型,并在一台搭载CPU为i7-12700H、GPU为RTX3060的笔记本电脑上进行试验。各个深度学习网络模型的参数均设置成学习率为0.001,一次训练所选取的样本数(BatchSize)设置为16,训练轮数(Epoch)均为100轮,均采用随机梯度下降算法(Stochastic Gradient Descent,SGD)作为优化算法,并且输出每轮训练所得到的损失值和玉米种子识别准确率。

3 试验结果与分析

此试验分别使用4种不同的深度学习网络模型对玉米种子进行分类识别训练,其中MobileNetV3和ShuffleNet为轻量级网络。对于玉米种子图像分类的4种深度学习网络模型,选择平均识别准确率、训练测试过程中损失函数的值及训练过程所需要的时间这3项指标作为评价指标。在经过100轮的迭代训练之后,4种深度学习网络模型对玉米种子分类识别的准确率如表2所示。

试验发现,在对玉米种子分类识别任务中,MobileNetV3深度学习网络模型表现最为出色。与其他3种网络模型相比,MobileNetV3深度学习网络模型在准确率和损失值方面表现出了最佳性能,网络收敛速度最快,对玉米图像的分类识别准确率最高并且在100轮迭代训练中损失值波动幅度最小。这可能归因于MobileNetV3深度学习网络模型在轻量级结构的基础上,引入了SE模块和更新的激活函数,以及通过NAS搜索参数进行的优化,从而提高了模型的性能。

对深度学习网络模型的准确率和损失值进行计算,MobileNetV3深度学习网络模型的准确率曲线图和损失值函数曲线图如图1所示。MobileNetV3深度学习网络模型的损失函数曲线在10轮后趋于平稳,准确率曲线在18轮后趋于稳定。但是,其他3种深度学习网络模型的准确率和损失值在进行35轮迭代训练后才趋于平缓。综上对比,MobileNetV3深度学习网络模型具有较高的识别精度。

在此次试验中,4种模型在训练过程中均出现了局部震荡现象,但MobileNetV3深度学习网络模型的震荡幅度较小,在4种模型中表现最为稳定。而ShuffleNet深度学习网络模型出现局部震荡次数较多且最为明显。这可能与不同网络结构和参数设置之间的差异有关,需要进一步研究和调整。

MobileNetV3深度学习网络模型的训练时间最短,平均每秒钟可对3.6张图片进行训练;ShuffleNet深度学习网络模型的训练时间最长,平均每秒钟只能对1.6张图片进行训练。这与模型的复杂度和计算开销有关,轻量级模型在训练时间上具有一定的优势。

4 结论与讨论

此次研究采用了4种深度学习网络模型(MobileNetV3、ShuffleNet、GoogLeNet、VGG16)对玉米种子进行分类识别,并对其性能进行了评估和比较,其中MobileNetV3深度学习网络模型的测试准确率为93.4%。研究表明,MobileNetV3深度学习网络模型在玉米种子分类识别任务中具有较高的准确率、稳定性和较短的训练时间。该试验结果对于玉米种子的自动化分类和识别具有重要的应用价值,并为进一步优化和改进深度学习网络模型在农业领域的应用提供了参考。然而,此次研究的数据集规模相对较小,对其他玉米品种和泛化能力的研究还需要进一步扩充和探索。

参考文献:

[1]KHAKI S,PHAM H,HAN Y,et al.Convolutional neural networks for image-based corn kernel detection and counting[J].Sensors(Basel),2020(9):2721.

[2]KHAKI S,PHAM H,HAN Y,et al.DeepCorn:a semi-supervised deep learning method for high-throughput image-based corn kernel counting and yield estimation[J].Knowledge-Based Systems,2021(12):106874.

[3]马睿,王佳,赵威,等.基于卷积神经网络与迁移学习的玉米籽粒图像分类识别[J/OL].中国粮油学报:1-10[2023-05-31].http://kns.cnki.net/kcms/detail/11.2864.TS.20220803.1310.010.html.

[4]司海平,万里,王云鹏,等.基于特征融合的玉米品种识别[J/OL].中国粮油学报:1-12[2023-05-31].https://doi.org/10.20048/j.cnki.issn.1003-0174.000167.

[5]王嵘.基于深度学习的图像搜索算法研究[J].计算机产品与流通,2018(11):150.

[6]惠苗.融合压缩与激励的GoogLeNet模型云检测算法[J].榆林学院学报,2023(2):68-72.

[7]毕鹏程,罗健欣,陈卫卫.轻量化卷积神经网络技术研究[J].计算机工程与应用,2019(16):25-35.

作者简介:张宇航(2000—),男,硕士生,研究方向:农业工程与信息技术;杨冬风(1977—),女,博士,副教授,研究方向:模式识别在农业中的应用。

经典小说推荐

杂志订阅

友情链接