基于K-means聚类算法的烘烤烟叶图像分割研究
作者: 周任虎 席家新 丁以纾 段积有 起必建 姚铁 董绍昆 刘羿男 丁从凯 杨国富 马国林
摘要 目前我国烟叶烘烤过程主要依赖人工监测,存在主观性、模糊性和高成本等问题,使用机器视觉方法对烘烤过程烟叶质量变化进行实时监测与判断的研究逐渐增多,实时监测需建立在高效且准确的烘烤烟叶图像分割之上,因此烘烤烟叶图像分割的研究变得尤其重要。提出了基于K-means聚类算法的烘烤烟叶图像分割方法,首先读取图像并将RGB转换为CYMK颜色空间,然后提取CYMK颜色空间下的K通道灰度化图像,再对此单通道图像进行聚类,根据聚类中心确定图像分割阈值,最后利用图像处理方法对图像进行分割。研究比较了K-means、模糊C均值聚类(FCM)和高斯混合聚类(GMM)3种聚类方法,结果表明K-means算法的像素准确率为97.8%、交并比为96.43%、Dice系数为98.2%,均优于其他2种方法。K-means算法能够更好地提取烤烟的烟叶轮廓,去除冗余信息,使得分割结果更清晰。
关键词 烟叶烘烤;图像分割;K-means;阈值
中图分类号 S-058 文献标识码 A 文章编号 0517-6611(2024)19-0232-06
doi:10.3969/j.issn.0517-6611.2024.19.047
开放科学(资源服务)标识码(OSID):
Research on Curing Tobacco Image Segmentation Based on K-means Clustering Algorithm
ZHOU Ren-hu,XI Jia-xin,DING Yi-shu et al
(Chuxiong Company of Yunnan Provincial Tobacco Company,Chuxiong,Yunnan 675000)
Abstract At present,the tobacco baking process in China mainly relies on manual monitoring,which has problems of subjectivity,fuzziness and high cost.Research on using machine vision methods to monitor and judge real-time changes in tobacco quality during the baking process is gradually increasing.Real time monitoring needs to be based on efficient and accurate segmentation of roasted tobacco leaf images,so the research on segmentation of roasted tobacco leaf images has become particularly important.A segmentation method for roasted tobacco leaf images based on K-means clustering algorithm was proposed.Firstly,the image was read and RGB was converted to the CYMK color space.Then,the grayscale image of the K-channel in the CYMK color space was extracted.We clustered the single channel image again,determined the image segmentation threshold based on the cluster center,and finally used image processing methods to segment the image.We compared three clustering methods of K-means,fuzzy C-means clustering (FCM) and Gaussian mixture clustering (GMM).The results showed that the pixel accuracy of the K-means algorithm was 97.8%,the intersection to union ratio was 96.43%,and the Dice coefficient was 98.2%,all of which were better than the other two methods.The K-means algorithm could better extract the contour of tobacco leaves,remove redundant information and make the segmentation results clearer.
Key words Tobacco curing;Image segmentation;K-means;Threshold value
基金项目 中国烟草总公司云南省公司科技项目(2022530000241034)。
作者简介 周任虎(1977—),男,云南楚雄人,农艺师,硕士,从事烟叶烘烤技术研究与应用。
收稿日期 2023-08-03
在我国的烟草产业中,烤烟作为一种重要的经济农作物,对卷烟生产有着重要的影响。烘烤是烟叶生产过程中非常关键的环节工艺,它直接关系到烤烟叶的品质和产量[1]。目前,我国烟叶烘烤过程仍主要依靠专业人员进行人工监测,根据经验和行业标准进行烘烤程度的判断,但这种方法具有主观性和模糊性,并且人工成本较高[2]。为进一步提高烟叶烘烤的智能化水平,近年来研究中涉及采用机器视觉方法在烤房中实时监测和判断烘烤烟叶的质量变化的工作逐渐增多,但关于机器视觉方法在烤烟烘烤过程质量变化方面的文献甚少[3]。机器视觉在烘烤过程中主要用于图像分割,即将待识别的烘烤烟叶目标特征提取出来,去除其他背景部分,从而减少图像信息的冗余度,保证后续对烘烤烟叶的实时监测与判断的质量[4]。在利用机器视觉方法进行烘烤烟叶的烘烤过程监测时,图像分割是图像处理中最基本、最重要的步骤之一[5]。
目前常见的图像分割算法方法包括基于阈值的图像分割算法、基于边缘的图像分割算法、基于区域生长的图像分割算法、基于颜色特征聚类的图像分割算法等[6]。基于阈值的图像分割方法具有实效性较好的特点,但在光照变化和复杂作业环境下的适应能力较弱[7]。基于边缘的图像分割方法相对简单且计算时间短、实效性好,它是基于周围区域的灰度值阶跃变化集合来进行分割的,然而目前大多数边缘检测算法难以提取完整闭合的目标边缘,容易产生伪边缘[8]。基于区域生长的图像分割算法原理简单、直观,但要对整幅图像进行分割时需要耗费较长的时间,它的核心思想是从一个像素作为生长点开始,将具有相似性质的像素集合并形成区域,通过合并与种子像素具有相同性质的邻域像素来递归地完成分割过程[9]。基于颜色特征聚类的图像分割算法能够较好地克服环境变化对分割造成的影响,但是计算时间较长[10]。该方法根据相似性准则,将图像像素在特征空间进行分类聚集并进行分割,然后将分割结果映射回原图像空间[11]。
在诸多技术中,聚类法是最有效的方法之一,主要有K-means聚类、K-means++聚类、模糊C-means聚类、高斯混合聚类等[12]。其中K-means聚类方法语义明确、结构简单、计算速度快,能够处理大数据集,而且有可伸缩、效率高等特点[13],是图像分割技术中最常用的聚类算法。随着研究的深入,同时K均值在遥感图像、人脸图像、医学影像处理都得了很成功的应用,是一种比较成熟的聚类方法[11]。国内外学者在基于K-means聚类法图像分割方面做了大量研究,并取得了丰富的研究成果[5]。Pham等[12]提出了一种基于多通道的图像分割方法,允许用户结合自己的信息通道,利用逻辑框架定义多目标函数来实现图像分割。Sandberg等[14]针对图像分割中灰度不均匀的问题,提出了改进K-means算法中的目标函数来处理图像分割中的不均匀性,提高了图像分割的精度。Walvoort等[15]选择均方最短距离作为目标函数,使用K-means聚类法使其最小化,结果表明在合理的计算范围内这种算法得到的效果最优。王帅等[16]提出基于统计直方图 K-means聚类的水稻冠层图像分割方法,分别与 K-means、K-means++、k-mc2、afk-mc2 共 4 种常用的均值聚类水稻冠层图像特征像素提取方法进行对比,结果表明基于统计直方图K-means聚类算法均优于以上 4 种聚类方法,朱淑鑫等[17]使用K均值算法(K-means)和连续投影算法(SPS),构建了能够测定土壤速钾效钾的预测模型,同时也可以解决光谱预测过程的冗余问题,经过试验证明该方法能够实现对土壤速效钾含量快速精确预测的分析。王爱莲等[18]探讨 K-means 算法在图像分割时在 RGB 和 YUV 颜色空间的分割结果,结果表明使用 YUV 混合模型比单一YUV颜色空间的分割效果更佳。研究人员在医学领域利用 K-means++聚类算法进行区域分类,减少了错误的局部极小值[19]。王帅等[16]提出了关于金鱼图像阴影去除和图像分割改进的K-means类聚算法,在水产鱼类行为量化研究提供了很好的参考价值。乔雪等[20]在马铃薯病虫害图像提取中采用K-means的图像分割方法,能够准确、完整地将目标病虫害色斑从彩色图像中提取出来,在农业病虫害治理方面具有较好的应用价值,高樱萍等[21]将K-means聚类算法应用于服装图像分割,通过分析灰度直方图确定聚类数k,采用马氏距离替代欧式距离计算相似度,效果较好。
采用K-means聚类算法进行烘烤烟叶的图像分割,这种算法在处理大数据集方面具有优势,能够快速、高效地对图像进行分割。同时,利用机器视觉技术对烘烤烟叶进行实时监控,以便获得烘烤过程中的质量变化信息。通过对分割后的图像进行特征提取和分析,能够更准确地理解和量化烟叶的烘烤质量,以期通过实施这些技术,实时监控烟叶烘烤过程,并实时评估烘烤的质量,这将有助于及时发现并解决任何可能影响最终烟叶质量的问题。鉴于此,笔者提出了基于K-means聚类算法的烘烤烟叶图像分割方法,首先读取图像并将RGB转换为CYMK颜色空间,然后提取CYMK颜色空间下的K通道灰度化图像,再对此单通道图像进行聚类,根据聚类中心确定图像分割阈值,最后利用图像处理方法对图像进行分割,提升烟叶烘烤的整体质量,减少对人工监控的依赖,降低生产成本。
1 材料与方法
1.1 材料
试验在云南省楚雄彝族自治州永仁县维的乡维的村(101°637582′E,26°143215′N)进行,平均海拔2 072 m。2022年7—9月采集的成熟期鲜烟叶,包含2个品种,分别为云烟87和K326,均购于中国玉溪中烟种子有限责任公司,烟叶部位包含上、中、下部。