基于聚类分析和曼哈顿距离实现平库烟叶堆码及均匀投料技术研究
作者: 何晓健 刘浩 刘红光 肖旭斌 李觅 张从秋
摘要 [目的]降低复烤加工成品片烟化学质量指标变异系数及提高现场工作效率。[方法]选择云南昆明地区50 t烟叶,以烟叶化学成分烟碱作为主要参数,结合总糖、总氮、还原糖等多项指标进行分组均匀投料研究。首先按烟叶化学成分烟碱高、中、低分组混配挑选出半成品烟叶,通过曼哈顿距离模型指导半成品烟叶出入库堆码;然后运用系统聚类分析方法对半成品烟叶进行聚类分组,化学指标相似的聚为一组;最后投料时,利用贪心算法模型对聚类分组结果进行小批次均匀投料。[结果]采用信息系统结合曼哈顿模型指导烟叶出入库堆码能有效提高现场作业效率;使用系统聚类分组和贪心算法均匀投料,能有效降低烟叶各化学指标变异系数,提高烟叶化学质量稳定性。[结论]该研究结果可应用于平库条件下提高复烤均质化加工水平,同时对未来组建高架库支撑复烤均质化加工提供参考。
关键词 聚类分析;曼哈顿距离模型;贪心算法;质量均匀
中图分类号 TS 44+3 文献标识码 A
文章编号 0517-6611(2023)18-0181-06
doi:10.3969/j.issn.0517-6611.2023.18.042
Technology of Tobacco Stacking and Uniform Feeding in Flat Warehouse Based on Cluster Analysis and Manhattan Distance
HE Xiao jian, LIU Hao,LIU Hong guang et al
(Hongyun Honghe Tobacco (Group) Co., Ltd., Kunming, Yunnan 650032)
Abstract [Objective]In order to reduce the variation coefficient of chemical quality index of redried finished tobacco and improve the on site work efficiency.[Method]This paper selects 50 tons of tobacco leaves in Kunming, Yunnan Province, takes the chemical composition nicotine of tobacco leaves as the main parameter, and studies the grouping and uniform feeding in combination with multiple indexes such as total sugar, total nitrogen and reducing sugar.Firstly, semi finished tobacco leaves were selected according to the chemical composition of tobacco leaves, nicotine high, medium and low groups, and the stacking of semi finished tobacco leaves was guided by Manhattan distance model;then the semi finished tobacco leaves were clustered and grouped by using the method of systematic cluster analysis, and those with similar chemical indexes were clustered into a group;finally, when feeding, the greedy algorithm model is used to feed the clustering grouping results evenly in small batches.[Result]The results show that the information system combined with Manhattan model can effectively improve the on site operation efficiency; Using systematic clustering grouping and greedy algorithm to feed evenly can effectively reduce the variation coefficient of chemical indexes of tobacco leaves and improve the stability of chemical quality of tobacco leaves.[Conclusion]The research results can be applied to improve the level of redrying homogenization processing under the condition of flat warehouse, and provide a reference for the establishment of elevated warehouse to support redrying homogenization processing in the future.
Key words Cluster analysis;Manhattan distance model;Greedy algorithm;Uniform mass
烟叶原料质量的均匀稳定是卷烟产品质量稳定的决定性因素,而打叶复烤均质化加工是稳定烟叶原料质量的重要措施。国内烟叶复烤均质化加工研究已取得成就,宋智勇等[1]根据烟叶烟碱值分类堆放,组批出库,实现均匀投料;沈晗等[2]通过配方比例混配后的半成品烟叶平库单元格堆码,混配组合投料实现烟叶均匀控制;王戈等[3]在烟碱的基础上,引入烟叶颜色和光谱定性值,在高架库条件下实现均匀调控。这些研究重点关注烟碱均匀、水分均匀方面,缺乏按总糖、总氮、还原糖等化学成分均质化进行配比投料方面的研究。复烤企业多以平库为主,缺乏自动化设备,出入库主要依靠人工计算核对,导致工作量大、效率和准确率低,且仓储资源难以得到合理使用。同时,复烤均质化加工及基于烟碱或其他方式堆码均匀投料加工加大了现场工作复杂度和出错率,同时给仓储带来压力。笔者以烟叶烟碱为主要参数,结合烟叶总糖、总氮、还原糖等多项指标,研究烟叶均匀控制技术,旨在提高现场作业效率及准确率的技术。
1 材料与方法
1.1 原料选择
选择云南昆明地区品种为K326的中部上等烟叶经过工业分级后的2个等级(A、B),共50 t烟叶作为研究原料。加工时,等级A(48%)和等级B(52%)按烟碱范围投到烟叶铺把台混配,将挑选出的半成品烟叶分为试验组和对照组进行投料复烤。
1.2 研究方法
1.2.1 烟叶加工流程。
烟叶从工商交接到复烤加工流程如图1所示。烟叶工业分级后,按批次取样,检测样品化学质量信息。复烤加工:首先按烟叶烟碱高、中、低烟叶比例进行混配挑选,然后将混配的半成品烟叶2次分组混配,最后根据分组比例均匀投料[4-7]。
1.2.2 烟叶烟碱混配挑选。
工业分级烟叶堆放在纸箱中,打印二维码标签,记录烟箱信息。每50箱抽样检测化学质量,根据烟叶烟碱值和重量,绘制烟碱数据分布频率直方图(图2)。观察烟碱频率直方图,分析堆码烟碱数据分布状况,平衡烟碱高、中、低烟叶比例接近1∶1∶1,划分高烟碱、低烟碱、中烟碱范围值[8]。混配挑选时,每个铺把台严格按照复烤配方和烟碱分组均匀混配,同时将青、杂、霉烟叶挑出。
混配后将半成品烟叶装入底部设置滚轮的烟框,共180框烟叶。按照装框时间顺序排序(1,2,…,180),取单数顺序号烟框为试验组,偶数顺序号烟框作为对照组。试验组将烟叶总糖、总氮、还原糖、烟碱作为变量进行系统聚类分析分组[9-10],均匀投料,对照组不分组随机投料。
1.2.3 曼哈顿距离模型调度。
半成品烟框入库堆码和出库调度时,利用曼哈顿模型计算出最优调运位置,指导出入库调度堆码。建立半成品烟叶暂存区域二维坐标系,如图3所示,1个烟框摆放1个货位,2个货位之间设置1条通道,运送烟框。坐标系中,通道两边的2个货位视作1个坐标点(xi,yi)。
半成品烟叶入暂存货位堆码时,利用货位坐标系,计算称重房起点坐标(xk,yk)到所有空货位(xi,yi)以及空货位(xi,yi)到投料点(x0,y0)的曼哈顿距离。假设f(xi,yi)为称重房起点坐标(xk,yk)到空货位(xi,yi)再到投料点(x0,y0)的曼哈顿距离之和。坐标系上,两点之间的曼哈顿距离为D=|x1-x2|+|y1-y2|,所以
Min[f(xi,yi)]=|yi-yk|+|xi-xk|+|yi-y0|+|xi-x0|
入库堆码时,在信息系统基于曼哈顿距离模型计算每个空货位点(xi,yi)的距离f(xi,yi),选择距离最短Min(f(xi,yi))的货位堆放,依次类推,直至烟叶堆码完成。投料出库时,通过曼哈顿距离寻找最近距离烟框投料。
1.2.4 聚类分析模型分组。
聚类分析是数据分析中常用的一种方法,根据数据之间的内在联系,将相似的变量或样品聚集在一起成为一个族群。一般使用聚类分析的数据,样本或变量之间都会存在一些相似之处,通过样品各个变量进行计算,找出相似点,根据相似程度将样品分成不同族群,使同一个族群中的相似程度最小,与其他族群之间的相似度最大。聚类分析在烟叶等级和产区分类中应用较广,依据化学指标进行聚类分组研究也初见规模[11-12]。
通过相关性和主成分、因子分析表明,烟叶化学质量中总糖、还原糖、总氮、烟碱与烟叶感官质量相关性最强[13],因此笔者选择总糖、还原糖、总氮和烟碱作为样本变量,通过系统聚类分析进行分组。由于烟叶化学指标不在同一数量级,因此聚类分析前将数据进行标注化处理。
式中,yi为标准化后的样本变量,k为原始样本变量均值, xi为原始变量。聚类分析时,计算样品之间的距离,使用欧式距离(Euclidean distance):
欧式距离是聚类分析中使用广泛的距离测度。
1.2.5 贪心算法模型轮回投料。
贪心算法模型将求解问题分级成若干个子问题,寻找每个子问题最优解,最终达到整个问题的最优解[14]。烟叶半成品投料过程使用贪心算法模型,将每轮投料当作1个子问题,求解每轮投料规划最优解,以达到整体最优投料。
假设每轮投料m框烟叶,复烤加工投料时,以小批次为投料单元,每批次固定投料γ框,根据烟叶化学成分聚类分为n组,配比依次为,其中i=1,2,…,n,假设该次复烤加工投料σ件:
(1)总投料批次(轮次)= σ/γ, 及递归「σ/γ轮回次计算每轮投料分布。
(2)ai =σ×bi,即各组烟叶投料总框数。
(3)根据贪心算法原则及每个投料批次,独立计算最优投料组配,aij为第j轮第i组投料框数。
第1轮,j=1时,各组投料量ai1计算过程如下:xi1=γ×bi1,yi=γ-ni[xi1],xi=xi1-[xi1],将数组xi排序,按从大到小顺序取出yi个数,假设g(xi)={0,1},当xi被取到时,g(xi)=1,未被取到时,则 g(xi)=0,ai1=[xi1]+g(xi)。