魏甲欣,李琪,馬飛,丁美宙,靳亞偉,王藝斌,許文武,王小明
1.河南中煙工業(yè)有限責任公司 許昌卷煙廠,河南 許昌 461000;2.河南中煙工業(yè)有限責任公司 技術(shù)中心,河南 鄭州 450000;3.南京焦耳科技有限責任公司,江蘇 南京 210000
煙絲是卷煙配方的重要組成部分,煙絲結(jié)構(gòu)及煙支中薄片絲、梗絲、葉絲的組分含量是評價卷煙煙絲物理特性的重要指標[1-2]。目前煙草企業(yè)對煙絲結(jié)構(gòu)的檢測仍普遍采用振動分選篩,生產(chǎn)實踐中煙絲組分的鑒別也依然依靠手工分選和人為判讀,這種人工識別法采樣周期長,數(shù)據(jù)實時性差且步驟復雜,不同人員的檢測結(jié)果之間存在較大誤差,隨著工作量的增加,測量效率和精度已經(jīng)難以適應現(xiàn)代化的檢測需求和高品質(zhì)卷煙的生產(chǎn)要求。此外,人工識別法中有機溶劑的使用也增加了實驗過程中的防護難度,不利于檢測人員的身體健康。因此,快速準確地測定煙絲結(jié)構(gòu)和煙絲組分,對鑒別真?zhèn)螣煵葜破?、考查配方設(shè)計特性、穩(wěn)定煙絲混合工藝質(zhì)量及同質(zhì)化生產(chǎn)具有重要意義。
近年來有學者通過圖像識別技術(shù)來檢測煙絲結(jié)構(gòu)和煙絲組分[3-6],楚晗等[4]研究了煙絲結(jié)構(gòu)分布及其對物理品質(zhì)的影響差異,實驗結(jié)果表明,通過控制長絲率和碎絲率,適當增加中長絲和短絲比例,可提升短支卷煙的物理品質(zhì);郭三刺等[5]采用中值濾波對煙絲圖像進行預處理,通過邊緣提取計算煙絲的各個特征值進而實現(xiàn)煙絲結(jié)構(gòu)檢測,證明了圖像處理技術(shù)用于煙絲結(jié)構(gòu)檢測的可行性;鐘宇等[6]提出一種基于殘差神經(jīng)網(wǎng)絡的煙絲組分分類識別的方法,但該方法對于宏觀差異不明顯的煙絲組分識別效果較差。
由于加工方法和原料本身特性的差異,煙絲不同組分間存在顏色、形態(tài)的差異,為圖像識別方法檢測各組分提供了特征參數(shù)。鑒于此,本文擬基于圖像識別技術(shù),建立煙絲面積與質(zhì)量的擬合模型,統(tǒng)計煙絲結(jié)構(gòu)參數(shù),利用煙絲輪廓在飽和度(Saturation, S)通道上的顏色方差及HSV顏色模型的顏色矩,構(gòu)建薄片絲、梗絲、葉絲的煙絲組分分類模型,以提高煙絲結(jié)構(gòu)檢測和煙絲組分分析的準確率,實現(xiàn)對煙絲摻配精度的快速準確判斷。
主要材料:黃金葉品牌某型號卷煙的成品煙絲A,混合煙絲B、C、D,河南中煙工業(yè)有限責任公司提供?;旌蠠熃z組分構(gòu)成如表1所示。
表1 混合煙絲組分構(gòu)成Table 1 The composition of mixed cut tobacco g
主要儀器:JB285型電子天平,瑞士METTLER TOLEDO公司產(chǎn);YQ-2型煙絲振動分選篩,鄭州煙草研究院提供;煙絲結(jié)構(gòu)圖像檢測裝置,南京焦耳科技有限公司產(chǎn)。
煙絲結(jié)構(gòu)圖像檢測裝置主要由光源、高速線陣CCD相機、采集卡和工控機組成。為了滿足大視場高分辨率的要求,采用的線陣CCD相機有8192個感光單元,像元尺寸達到7.04 μm×7.04 μm,當鏡頭的放大倍率為0.7倍時,檢測裝置的最小測量值為0.01 mm,以滿足煙絲長度的測量要求。
《卷煙工藝規(guī)范》[8]規(guī)定,煙絲長度>2.5 mm為整絲,煙絲長度<1.0 mm為碎絲。煙絲的測量精度要求非常高,采用線陣CCD相機拍攝煙絲圖像時,得到的煙絲圖像較大(每幅80 mm×80 mm的圖像大小約為80 M),因此需要對煙絲圖像進行相應的處理,煙絲圖像處理過程如圖1所示,首先對原始圖像(圖1a))進行預處理,將采集到的煙絲圖像灰度化后進行除噪,得到圖1b)。除噪方式選用中值濾波法[9],采用 3 × 3 的濾波窗口,以盡可能地保存圖像的細節(jié)信息。再利用閾值分割[10]對煙絲進行二值化(圖1c)),提取煙絲連通區(qū)域。最后對煙絲連通域圖像進行細化(圖1 d))[11],細化后的煙絲輪廓的中心線即為煙絲骨骼[12]。
圖1 煙絲圖像處理Fig.1 Image process of cut tobacco
通過計算細化后的煙絲輪廓長度可得到煙絲的長度,再統(tǒng)計出煙絲的表觀總面積。從同一批煙絲A中,分別稱取質(zhì)量為5 g、10 g、15 g、20 g、25 g的5個樣品進行圖像采集,每個樣品重復測量5次,建立表觀總面積和煙絲質(zhì)量的擬合模型,如圖2所示。由圖2可知,線性方程的相關(guān)系數(shù)達到0.999 6。將煙絲表面積數(shù)據(jù)代入擬合模型中獲得煙絲質(zhì)量預測值,其與實際值的比較結(jié)果如表2所示。由表2可知,擬合得到的煙絲質(zhì)量數(shù)據(jù)相對誤差<2.34%,變異系數(shù)<3%,模型準確性和重復性均能滿足測量要求。根據(jù)模型預測得到的整絲和碎絲質(zhì)量,計算獲得煙絲的整絲率及碎絲率,獲得煙絲結(jié)構(gòu)。
圖2 樣品煙絲表觀總面積與煙絲質(zhì)量擬合模型Fig.2 Fitting model between the apparent total area of cut tobacco and the quality of cut tobacco
表2 煙絲質(zhì)量預測值與實際值比較結(jié)果Table 2 Comparison between predicted value and actual value of cut tobacco quality
煙絲各組分本質(zhì)上均為煙草在制品的一部分,只是通過不同的加工處理技術(shù)形成不同結(jié)構(gòu)特征的煙草在制品。肉眼觀察3種煙絲(薄片絲、梗絲、葉絲)組分,其結(jié)構(gòu)特征存在一定的差異。薄片絲較為細長,寬度和顏色較為均勻,變化的程度較小[13];梗絲形狀較為多樣,寬度和顏色的變化程度最大[14];而葉絲在寬度和顏色變化方面介于薄片絲和梗絲之間[15]。
圖3 通過最小內(nèi)切圓計算煙絲寬度Fig.3 Calculation of cut tobacco width by minimum inscribed circle
煙絲顏色特征的提取過程是先將煙絲原圖進行圖像增強[18],如圖4所示,再將其轉(zhuǎn)換為HSV圖像[19],分別統(tǒng)計出薄片絲、梗絲、葉絲在H通道、S通道、V通道上的灰度平均值,如表3所示。
圖4 圖像增強后的薄片絲圖像Fig.4 The tobacco flakes image after image enhancement
表3 3種煙絲圖像增強后在HSV三通道灰度平均值Table 3 Average gray values of three kinds of cut tobacco images in HSV three channels after enhancement
除顏色方差之外,本文還加入了顏色矩。低階矩通常已經(jīng)包含了圖像的大部分顏色信息,所以經(jīng)常采用一階矩、二階矩和三階矩來表達圖像的顏色分布,其數(shù)學定義分別如下所示。
其中,Pij為第i個通道的第j個像素的強度值;M為圖像中的像素個數(shù)。
首先提取煙絲形狀特征中的寬度、寬度方差,以及顏色特征中的顏色方差和顏色矩,再通過SVM分類器進行訓練,即可得到薄片絲、梗絲、葉絲的識別分類模型。
為驗證本文圖像識別法檢測煙絲結(jié)構(gòu)的可行性與效果,將其與YQ-2煙絲振動分選篩(振篩法,參照文獻[21])進行對比實驗,實驗樣品為同一批次的煙絲A,取樣量為符合卷煙工藝規(guī)范的標準煙絲(1 000.0±100.0)g/次,樣品含水率為11.0%~14.0%,兩種方法均重復測量5次,取平均值。
不同方法的煙絲結(jié)構(gòu)測量結(jié)果如表4所示。由表4可知,相對于振篩法,本文圖像識別法檢測煙絲結(jié)構(gòu)的標準差和變異系數(shù)均明顯減小,且均小于5%,說明本文方法測量精度較高,穩(wěn)定性較好,比傳統(tǒng)振篩法更快捷、更有效。
表4 不同方法的煙絲結(jié)構(gòu)測量結(jié)果Table 4 Measurement results of cut tobacco structure under different methods %
為了驗證本文圖像識別方法分析煙絲組分的可行性與效果,將其與人工識別法、卷積神經(jīng)網(wǎng)絡法、殘差神經(jīng)網(wǎng)絡法作了對比實驗,實驗樣品為煙絲B、C、D。4種方法的取樣量均為(50.0±0.1)g,含水率為11.0%~14.0%。
傳統(tǒng)煙絲組分的分類為人工識別法,主要靠人工完成,人工進行薄片絲、梗絲、葉絲的分類后,再用天平進行稱重,統(tǒng)計煙絲組分。
采用深度學習的方法,建立基于卷積神經(jīng)網(wǎng)絡[22]的煙絲組分識別模型,使用體現(xiàn)煙絲微觀結(jié)構(gòu)特征的局部特征圖片作為神經(jīng)網(wǎng)絡的輸入,分析識別出每個特征圖片對應的輸出結(jié)果,通過統(tǒng)計方法得出煙絲的組成成分。
利用各類煙絲圖像特征差異,以殘差神經(jīng)網(wǎng)絡[6]為基礎(chǔ)構(gòu)建煙絲類型識別模型,通過設(shè)定樣本對應的神經(jīng)網(wǎng)絡的輸出張量預測煙絲的組成成分的概率值。
不同方法煙絲組分分析結(jié)果如表5所示。由表5可知,人工識別法的平均相對誤差較大,卷積神經(jīng)網(wǎng)絡法和殘差神經(jīng)網(wǎng)絡法的平均相對誤差較小,但仍>5%,本文方法的平均相對誤差≤5%,準確性更高。主要原因是人工識別法本身操作過于復雜,在多次測量時容易產(chǎn)生較大的誤差。而卷積神經(jīng)網(wǎng)絡法在實際操作中,訓練集的正確率與測試集的準確率相差較大,存在一定的過擬合現(xiàn)象,模型泛化能力較低,易導致最終的識別率不理想。殘差神經(jīng)網(wǎng)絡法對比卷積神經(jīng)網(wǎng)絡法在識別的準確率上確實有了明顯的提升,但是對于區(qū)別程度不大的煙絲,比如部分薄片絲和葉絲,其外觀肉眼很難區(qū)分,使用該方法進行識別準確率存在一定的局限性。本文方法中對薄片絲、梗絲、葉絲樣本圖像通過SVM分類器進行訓練,對于錯誤識別的樣本圖像,通過降低它們的分類權(quán)值以提高煙絲識別的準確率。
表5 不同方法煙絲組分分析結(jié)果Table 5 Analysis results of tobacco components by different methods %
本文利用圖像識別技術(shù),對煙絲輪廓進行細化,提取煙絲骨骼,得到煙絲長度,建立煙絲表觀總面積與煙絲質(zhì)量的擬合模型,實現(xiàn)了煙絲結(jié)構(gòu)的圖像識別;提取煙絲的形狀、顏色兩個特征,運用SVM分類器構(gòu)建了薄片絲、梗絲、葉絲的分類模型,實現(xiàn)了薄片絲、梗絲、葉絲的圖像分類識別。與傳統(tǒng)振篩法相比,基于圖像識別的煙絲結(jié)構(gòu)檢測標準差更小,與人工識別法、卷積神經(jīng)網(wǎng)絡法和殘差神經(jīng)網(wǎng)絡法相比,基于圖像識別的煙絲組分分析相對誤差更小,本文方法的準確性及可行性更高,能夠?qū)熃z摻配精度做出快速準確判斷。后續(xù)將針對薄片絲和葉絲誤識別的情況訓練一個二分類器進一步提高識別準確率。