陳飛程,楊懿德,李常軍,楊 洋,冉 茂,鄢 敏,江厚龍,汪代斌*
(1.河南農(nóng)業(yè)大學(xué)煙草學(xué)院,河南 鄭州 450002;2.四川省煙草公司宜賓市公司,四川 宜賓 644000;3.中國(guó)煙草總公司重慶市公司,重慶 400023)
【研究意義】含水率是煙葉烘烤過(guò)程中的重要指導(dǎo)參數(shù),為煙葉烘烤過(guò)程中的變化預(yù)測(cè)和工藝參數(shù)調(diào)控提供了重要依據(jù)[1]。由于烘烤過(guò)程中煙葉含水率具有非線性和時(shí)空多變性,且干燥過(guò)程受多種參數(shù)共同控制,僅靠單一固定模型進(jìn)行擬合,其適應(yīng)性和預(yù)測(cè)精確性的局限性較大[2-6]?!厩叭搜芯窟M(jìn)展】目前,煙葉含水率測(cè)定的方法可分為兩類:一類是基于時(shí)間序列和統(tǒng)計(jì)理論的結(jié)合,主要包括烘箱法[7]、快速水分測(cè)定法[8]、卡爾費(fèi)休法[9]和氣相色譜法[10]等。另一類是通過(guò)物理學(xué)微粒性質(zhì)和運(yùn)動(dòng)原理形成的一些新的檢測(cè)方法,包括微波法[11]、核磁共振技術(shù)法[12]和圖像技術(shù)處理[13]等。近年來(lái),BP神經(jīng)網(wǎng)絡(luò)對(duì)物料含水率無(wú)損預(yù)測(cè)時(shí),具有較強(qiáng)的適應(yīng)性和較高的擬合效果,白竣文等[14]基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建了葡萄氣體射流沖擊干燥過(guò)程中含水率預(yù)測(cè)模型,實(shí)現(xiàn)了葡萄干燥過(guò)程中含水率的預(yù)測(cè),有效提高了葡萄干燥效率。張利娟等[15]利用小麥真空干燥中的工藝參數(shù)作為輸入層,構(gòu)建以小麥含水率為輸出層的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并且該BP神經(jīng)網(wǎng)絡(luò)模型能較好地反映小麥真空干燥工藝參數(shù)與含水率之間的非線性關(guān)系。孫俊等[16]以大米的高光譜數(shù)據(jù)建立MEA_BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)大米的水分含量。宋華魯?shù)萚17]基于雙介電參數(shù)和變量篩選構(gòu)建支持向量回歸機(jī)的預(yù)測(cè)模型實(shí)現(xiàn)對(duì)玉米含水率的快速無(wú)損檢測(cè)?!颈狙芯壳腥朦c(diǎn)】本研究以煙葉為研究對(duì)象,對(duì)從鮮煙葉到烘烤結(jié)束各關(guān)鍵溫度時(shí)段煙葉圖像進(jìn)行采集分析,通過(guò)提取顏色特征和紋理特征,利用BP神經(jīng)網(wǎng)絡(luò)建立煙葉含水率預(yù)測(cè)模型?!緮M解決的關(guān)鍵問(wèn)題】通過(guò)對(duì)煙葉含水率進(jìn)行預(yù)測(cè),精準(zhǔn)把控烘烤過(guò)程中煙葉含水率的變化,為煙葉烘烤過(guò)程中含水率的在線預(yù)測(cè)提供數(shù)據(jù)參考。
本試驗(yàn)于2018—2019年在四川省宜賓市興文縣大壩鄉(xiāng)煙草科技園進(jìn)行。供試煙葉為云煙116品種成熟采收的中部葉。
共采集云煙116煙葉的圖像樣本196份。鮮煙葉采摘后采集1次圖像,然后將其裝入密集烤房,按照三段式烘烤工藝烘烤,分別于變黃前期(36 ℃)穩(wěn)溫結(jié)束、變黃中期(38 ℃)穩(wěn)溫結(jié)束、變黃后期(42℃)穩(wěn)溫結(jié)束、定色前期(46℃)穩(wěn)溫結(jié)束、定色后期(54 ℃)穩(wěn)溫結(jié)束、干筋期(68 ℃)穩(wěn)溫結(jié)束時(shí)取樣(每次取顏色變化均勻一致的煙葉28片)。利用最高分辨率為8256×5504像素水平的Nikon/尼康D850對(duì)煙葉的圖像進(jìn)行采集,圖像采集時(shí)相機(jī)模式采用P(Program)檔,選用白色背景(方便使用最大類間方差法(Ostu)[18]進(jìn)行圖像分割)拍照時(shí)將相機(jī)固定在三腳架上,鏡頭位于樣品1 m正上方,同時(shí)為了保障光線環(huán)境的一致,將采集時(shí)將樣品置于黑暗環(huán)境中以兩根40 W的日光燈為照明光源,運(yùn)用圖像處理軟件Adobe Photoshop CC 2018手動(dòng)去除冗雜的信息(圖1)。
圖1 采集圖像的預(yù)處理Fig.1 Preprocessing of the acquisition of images
1.3.1 煙葉的顏色參數(shù) 采用WSC-3型全自動(dòng)色差計(jì),參考賀帆等[19]的方法測(cè)定煙葉的顏色參數(shù),以橫向距離煙葉主脈5 cm處的對(duì)稱點(diǎn)為測(cè)量點(diǎn),每半片葉等距離測(cè)量3個(gè)點(diǎn),測(cè)量鮮煙葉這6個(gè)點(diǎn)亮度值(L*)、紅度值(a*)、黃度值(b*)、飽和度(C*)和色相角(H*)的平均值作為該葉片的顏色指標(biāo)參數(shù)(圖2)。
1.3.2 煙葉的紋理特征 用Matlab2018b圖像處理工具箱處理所采集的圖像樣本[20-21],獲取圖像樣本的紋理均值(m)、標(biāo)準(zhǔn)差(σ)、平滑度(R)、三階矩(μ3)、一致性(U)以及紋理熵(e)等紋理特征值。
(1)
(2)
圖2 煙葉顏色特征值測(cè)量位點(diǎn)Fig.2 The position of measuring color characteristics
平滑度(R)=1-1/(1+σ2)
(3)
(4)
(5)
(6)
1.3.3 煙葉的含水率 參照行業(yè)標(biāo)準(zhǔn)YC/T 311—1996用烘箱法[7]測(cè)定煙葉的含水率。
采用Excel對(duì)數(shù)據(jù)進(jìn)行處理分析,采用MATLABR2018b中NEWFF神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建和運(yùn)行工作。選取決定系數(shù)R2和均方根誤差RMSE作為擬合評(píng)價(jià)指標(biāo)[14],R2越大、RMSE值越小,則擬合越好。
(7)
(8)
式中,F(xiàn)Wexp,t為烘烤試驗(yàn)實(shí)測(cè)的第t個(gè)含水率;FWpre,t為利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的第t個(gè)含水率;N為試驗(yàn)測(cè)得數(shù)據(jù)的個(gè)數(shù)。
由表1可知,鮮煙葉的紅度值為負(fù)值,表明鮮煙葉的主體顏色是綠色,隨著烘烤的推進(jìn),煙葉的紅度值逐漸由負(fù)值轉(zhuǎn)為正值,這是因?yàn)闊熑~的主體顏色由綠色轉(zhuǎn)為黃色,所以煙葉在變黃期黃度值逐漸增加,并且在變黃后期色相角由負(fù)值突躍為正值,代表人眼對(duì)顏色的感覺(jué)由綠色轉(zhuǎn)成了黃色。煙葉圖像亮度值變化介于40~73,在變黃前期達(dá)到最大值后逐漸減小,在定色前期亮度值先增大后減?。粺熑~圖像紅度值變化介于-14~14,且在變黃階段快速上升;煙葉圖像黃度值和飽和度變化介于35~55,在變黃后期達(dá)到最大值后逐漸減??;煙葉圖像色相角變化介于-85~88,負(fù)值為人眼對(duì)綠色的感覺(jué),從鮮煙葉到干筋結(jié)束的推移過(guò)程中,負(fù)值減小轉(zhuǎn)為正值的過(guò)程即為煙葉顏色由綠轉(zhuǎn)黃,在變黃后期達(dá)到最大值后逐漸減小,這是因?yàn)闊熑~在變黃后期變黃程度達(dá)到最高后紅度值與之增加與黃度值混合形成橙色的過(guò)程。
如表2所示,平滑度是圖像灰度的均勻性,值為0-1代表平滑-不平滑,煙葉在變黃階段和定色前期葉片表面相對(duì)光滑、紋理較細(xì),鮮煙葉紋理較清晰,定色后期至干筋期煙葉皺縮粗糙,所以煙葉烘烤前期平滑度比鮮煙葉和烘烤后期小。紋理熵是圖像所具有的信息量的度量,表示圖像中紋理的非均勻程度或復(fù)雜程度,值越大紋理越混亂、粗糙,烘烤后期煙葉紋理不規(guī)則、混亂度大,所以紋理熵值明顯大于烘烤前期。紋理平均值灰度反映了圖像灰度整體的亮暗,值越高代表越亮,標(biāo)準(zhǔn)差反映了該圖像的亮暗差異。在烘烤定色后期和干筋期,煙葉卷曲與皺縮程度最大,所以這2個(gè)階段的紋理平均值、標(biāo)準(zhǔn)差最大。三階矩反映直方圖偏斜度的度量,對(duì)稱為0,右偏斜為正,左偏斜為負(fù);一致性反映度量一致性,值越大越好。不同時(shí)段間的三階矩和一致性差異顯著。由此可知,以上6個(gè)紋理特征數(shù)據(jù)均可對(duì)不同時(shí)段的煙葉圖像的紋理信息進(jìn)行了描述,能較好地反映煙葉的紋理特征。
表1 不同時(shí)段煙葉的顏色特征
表2 不同時(shí)段煙葉紋理特征的變化
2.3.1 訓(xùn)練樣本集的選擇 為了加速BP神經(jīng)網(wǎng)絡(luò)的運(yùn)算效率,利用因子分析的主成分法從烤煙顏色特征指標(biāo)L*、a*、b*、C*、H*及紋理特征指標(biāo)平均值、標(biāo)準(zhǔn)差、平滑度、三階矩、一致性和熵11個(gè)表觀指標(biāo)中篩選出烤煙表觀特征的6個(gè)代表性影響因子L*、a*、b*、平均值、標(biāo)準(zhǔn)差和紋理熵(表3)。從因子的載荷值可以看出,因子1主要反映了煙葉變黃程度的影響,可以用黃度值b*為代表;因子2主要反映了煙葉表面紋理復(fù)雜程度,可以用紋理熵為代表;因子3主要反映了煙葉表面褐變程度,褐變反映于紅度值的深淺程度,因此選取a*為代表;因子4主要反映了煙葉紋理標(biāo)準(zhǔn)差的變化;因子5主要反映了煙葉紋理均值的變化;因子6主要反映了煙葉亮度值L*的變化。
表3 煙葉的表觀特征值的因子載荷
表4 隱含層神經(jīng)元個(gè)數(shù)及其仿真訓(xùn)練結(jié)果
圖3 煙葉含水率的BP神經(jīng)網(wǎng)絡(luò)模型網(wǎng)格結(jié)構(gòu)Fig.3 Grid structure of BP neural network model of tobacco moisture content
2.3.2 BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析與模型設(shè)計(jì) 根據(jù)因子分析從11個(gè)顏色和紋理特征值中篩選出的L*、a*、b、平均值、標(biāo)準(zhǔn)差和紋理熵6個(gè)優(yōu)度因子作為輸入向量層,輸入層神經(jīng)元個(gè)數(shù)即為6個(gè)。輸出層是不同時(shí)段煙葉的實(shí)時(shí)含水率,因此輸出神經(jīng)元個(gè)數(shù)即為1個(gè)。通過(guò)premnmx函數(shù)對(duì)輸入樣本數(shù)據(jù)和輸出樣本數(shù)據(jù)進(jìn)行歸一化以消除量綱影響。網(wǎng)絡(luò)的輸入層與隱含層之間的傳遞函數(shù)為正切S型函數(shù),為了逼近網(wǎng)絡(luò)的精度隱含層與輸出層的傳遞函數(shù)為線性傳遞函數(shù),因此本研究選擇tansig-purelin組合作為該網(wǎng)絡(luò)的傳遞函數(shù)。為了避免神經(jīng)網(wǎng)絡(luò)訓(xùn)練一定程度出現(xiàn)網(wǎng)絡(luò)麻痹現(xiàn)象,采用LM算法的trainlm作為網(wǎng)絡(luò)訓(xùn)練函數(shù),提高網(wǎng)絡(luò)的收斂速度和泛化能力。
2.3.3 隱含層節(jié)點(diǎn)數(shù)的選擇 隱含層神經(jīng)元個(gè)數(shù)會(huì)影響到網(wǎng)絡(luò)精度和訓(xùn)練時(shí)長(zhǎng)。隱藏層的節(jié)點(diǎn)數(shù)一般采用Kolmogorov定理(隱藏層=2×輸入層個(gè)數(shù)+1)和多次嘗試的方式獲得,本文分別選取了5、7、9、10、11、13、15作為隱含神經(jīng)元個(gè)數(shù),對(duì)所建預(yù)測(cè)模型進(jìn)行訓(xùn)練,通過(guò)對(duì)比訓(xùn)練精度和訓(xùn)練時(shí)間,具體如表2所示。隱藏層節(jié)點(diǎn)數(shù)為13時(shí)有最優(yōu)的訓(xùn)練效果。綜合以上分析,采用6-13-1結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)烤煙含水率進(jìn)行預(yù)測(cè),網(wǎng)絡(luò)模型結(jié)構(gòu)圖如圖3所示。
2.3.4 模型的訓(xùn)練與測(cè)試 按照上述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),學(xué)習(xí)速率設(shè)置為0.001,隨機(jī)選擇的165組數(shù)據(jù)作為訓(xùn)練樣本,經(jīng)過(guò)15次訓(xùn)練停止,均方誤差值達(dá)到0.0031。用得到模型對(duì)余下的31組測(cè)試樣本集進(jìn)行測(cè)試。經(jīng)對(duì)比,預(yù)測(cè)含水率與實(shí)測(cè)含水率最大偏差為0.0459(圖4),決定系數(shù)R2為0.9886,均方根誤差RMSE為0.0191。
2.3.5 模型的驗(yàn)證 為進(jìn)一步驗(yàn)證模型的準(zhǔn)確性,測(cè)量從鮮煙葉到干筋結(jié)束的干燥曲線,并與BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值進(jìn)行對(duì)比,。除干燥初始預(yù)測(cè)值與實(shí)測(cè)值稍有偏差外,其余預(yù)測(cè)值(特別是干筋期)幾乎與實(shí)測(cè)值重合(圖5)。經(jīng)計(jì)算,預(yù)測(cè)值與實(shí)測(cè)值之間的決定系數(shù)R2為0.9987,均方根誤差RMSE為0.0118,其較高的預(yù)測(cè)精度說(shuō)明BP神經(jīng)網(wǎng)絡(luò)模型能夠較好地預(yù)測(cè)煙葉在不同時(shí)段的含水率。
本研究利用機(jī)器視覺(jué)技術(shù)定量煙葉的表觀特征,通過(guò)煙葉的色差參數(shù)和紋理特征指標(biāo)量化煙葉的外觀特征。煙葉的顏色、紋理特征的變化不僅可以判斷煙葉的成熟度和烘烤特性的重要依據(jù)[2,22-23],同時(shí)也是衡量煙葉水分變化的重要指標(biāo)[24]。本研究量化煙葉顏色指標(biāo)采用的是CIE- L*a*b*圖像模式,相較于RGB圖像模式,其色域廣,能更大程度地體現(xiàn)圖像顏色信息,并且做到明度與色度的有效分離,有效避免因環(huán)境的亮暗變化影響樣品圖像色彩信息,能更好反映不同時(shí)段煙葉圖像變化的顏色敏感性。
圖4 烤煙測(cè)試組含水率預(yù)測(cè)Fig.4 Water content prediction of flue-cured tobacco test group
煙葉的L*、a*、b*、C*和H*值均在變黃階段出現(xiàn)不同程度的上升,其原因主要是煙葉的主體顏色在變黃階段顏色由綠色轉(zhuǎn)變?yōu)辄S色,亮度值L*因?yàn)橹黧w顏色的轉(zhuǎn)變,在變黃前期煙葉表面的淺色系對(duì)光的吸收減少且反射增加,故而L*值達(dá)到最大值,并隨著表面黃色系的加深逐漸減小,黃度值b*在變黃階段呈現(xiàn)劇烈的上升,故而飽和度C*的值在變黃階段逐漸上升,紅度值a*和色相角H*由代表綠色的負(fù)值向代表黃色的正值轉(zhuǎn)變;在定色前期煙葉進(jìn)一步變黃后將黃色固定,在此階段烤煙葉片失水較少,煙葉表面較為光滑且黃色也較為鮮亮,因此在定色前期煙葉L*、a*繼續(xù)增大并且H*達(dá)到最大值;定色后期煙葉失水程度增加,煙葉表面出現(xiàn)不同程度的皺縮,煙葉黃色變得較為暗淡,因此煙葉除了a*值繼續(xù)增加,L*、b*、C*和H*值均有所減??;干筋期煙葉主脈失水,葉片全干,煙葉皺縮最為嚴(yán)重,葉片顏色進(jìn)一步變暗轉(zhuǎn)變?yōu)槌壬担愿山钇跓熑~a*值繼續(xù)增加逐漸接近紅色系范圍,L*、b*、C*和H*值均再次減小。
煙葉紋理特征中的平滑度呈現(xiàn)出不平滑、葉片的直方圖偏斜度從總體左偏移逐漸對(duì)稱再向右偏移和煙葉紋理度量值相一致的結(jié)果與張麗[25]的研究結(jié)果一致。本研究中煙葉紋理特征的灰度平均值和標(biāo)準(zhǔn)差這兩個(gè)關(guān)鍵指標(biāo),可以有效減小和校正測(cè)量煙葉色差參數(shù)時(shí)因環(huán)境光線的多變性對(duì)所測(cè)定的指標(biāo)數(shù)據(jù)的誤差,減少BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過(guò)程中的逆?zhèn)鞑バ拚?,加快模型的運(yùn)行的速度,其重要性在因子分析的因子能荷得以體現(xiàn)。
a、b、c、d、e、f、g分別為鮮煙葉、變黃前期、變黃中期、變黃后期、定色前期、定色后期、干筋期a,b,c,d,e,f and g were fresh tobacco leaves,earlier stage of yellowing,middle stage of yellowing,later stage of yellowing,earlier stage of set color,later stage of set color,and stem-dry stage,respectively圖5 烤煙含水率預(yù)測(cè)值與實(shí)測(cè)值比較Fig.5 Comparison of predicted and measured values of flue-cured tobacco moisture content
鮮煙葉顏色為綠黃相間,圖像混亂度較高,溝紋明顯;在變黃階段煙葉逐漸由綠轉(zhuǎn)黃,煙葉失水程度不高,葉面相對(duì)平滑,亮暗差異較小,紋理度量簡(jiǎn)單且均勻,故而平滑度趨于平滑范圍,紋理標(biāo)準(zhǔn)差、一致性和紋理熵值較小且隨著失水程度增加逐漸增大;變黃后期煙葉接近或達(dá)到全黃,此時(shí)煙葉一致性達(dá)到最大值;定色前期,煙葉葉片失水增加,葉片卷曲皺縮,圖像亮暗差異明顯,紋理度量相對(duì)復(fù)雜,因此煙葉紋理均值減小,標(biāo)準(zhǔn)差和紋理熵逐漸增大,平滑度趨于不平滑,三階矩表現(xiàn)為不同程度的偏移;定色后期之后煙葉含水率較少,葉形皺縮卷曲,葉面粗糙圖像紋理復(fù)雜,溝紋逐漸明顯,因此,煙葉圖像標(biāo)準(zhǔn)差、平滑度和紋理熵逐漸增大,紋理平均值逐漸減小。
常規(guī)的線性分析模型很難準(zhǔn)確地建立作物表觀信息與含水率間的關(guān)系[26],本研究通過(guò)提取煙葉的顏色指標(biāo)和紋理特征,并將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入層對(duì)煙葉的含水率進(jìn)行模擬,在樣本訓(xùn)練與驗(yàn)證過(guò)程中模型的均方根誤差分別為0.0191和0.0118,其輸出的模擬值準(zhǔn)確度優(yōu)于甘露萍[24]和段史江等[27]對(duì)煙葉含水量無(wú)損檢測(cè)結(jié)果。含水率預(yù)測(cè)模型的擬合程度和輸出的預(yù)測(cè)值與真實(shí)值的決定系數(shù)說(shuō)明該模型可以實(shí)現(xiàn)對(duì)含水率的精確估測(cè),這與詹攀等人[27-28]研究結(jié)果一致。
為了精準(zhǔn)預(yù)測(cè)不同時(shí)段煙葉中含水率,本研究以煙葉顏色和紋理特征指標(biāo)為輸入層構(gòu)建了結(jié)構(gòu)為“6-13-1”的BP神經(jīng)網(wǎng)絡(luò)模型,以因子分析篩選優(yōu)度因子,以tansig-purelin組合作為該網(wǎng)絡(luò)的傳遞函數(shù),采用L-M算法為訓(xùn)練函數(shù),結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)模型能夠很好預(yù)測(cè)煙葉含水率。BP神經(jīng)網(wǎng)絡(luò)可以將表現(xiàn)煙葉含水率的指標(biāo)包含于1個(gè)模型之中,具有較好的便捷性和精確性。受限于本研究所采集的樣本品種部位單一,網(wǎng)絡(luò)的覆蓋面和適應(yīng)性有所影響,因此本研究還需要進(jìn)一步優(yōu)化品種和部位研究,以進(jìn)一步提高模型通用性。