孫光偉,郭青青,柳 均,馮 吉,孫敬國,張鵬龍,吳哲寬,李建平,陳振國
(1.湖北省煙草科學(xué)研究院,武漢 430030; 2.湖北大學(xué)生命科學(xué)學(xué)院,武漢 430062; 3.湖北省煙草公司煙草質(zhì)量監(jiān)督檢測(cè)站,武漢 430030; 4.湖北省煙草公司恩施州公司,湖北 恩施 445000)
【研究意義】煙葉褐變是煙葉烘烤中常見的現(xiàn)象,是造成烘烤損失的主要因素之一。通過建立烤煙褐變程度識(shí)別模型,可實(shí)現(xiàn)褐變程度的有效區(qū)分,降低烤壞煙損失。【前人研究進(jìn)展】褐變煙主要是由于烤煙烘烤過程“酶促棕色化反應(yīng)”造成的[1],即多酚類物質(zhì)在多酚氧化酶(PPO)的作用下被氧化成醌類物質(zhì),然后進(jìn)一步和其他物質(zhì)聚合成大分子深色物質(zhì)[2-4]。煙葉褐變的產(chǎn)生原理已經(jīng)被提出很多年,前人通過改進(jìn)農(nóng)藝措施[5-7]、烘烤工藝[8-10]、添加褐變抑制劑[11-12]等途徑使煙葉褐變幾率得到了一定緩解,但酶促褐變?nèi)匀皇窃斐蔁熑~烘烤損失的主要原因,尤其是上部葉,其葉片較厚、酚類等內(nèi)含物含量充足[13],導(dǎo)致烤后煙葉褐變現(xiàn)象較重。煙葉褐變程度與外觀質(zhì)量、內(nèi)在化學(xué)成分含量密切相關(guān),直接影響著煙葉的工業(yè)可用性[14]。目前褐變程度輕重主要靠肉眼識(shí)別,主觀性較強(qiáng),誤差較大[15]。近幾年,BP化圖像識(shí)別在煙葉生產(chǎn)上的應(yīng)用越來越廣泛[16-17],如劉劍君等[18]為量化判別烤煙鮮煙葉成熟度,提出一種基于數(shù)字圖像處理的成熟度指數(shù)計(jì)算方法,可實(shí)時(shí)判別和比較煙葉的成熟度。陳飛程等[19]以煙葉的圖像信息建立的煙葉含水率預(yù)測(cè)模型,可精準(zhǔn)把控?zé)熑~過程中含水率的變化。但是BP化圖像識(shí)別在煙葉褐變程度方面的應(yīng)用還沒有報(bào)道?!颈狙芯壳腥朦c(diǎn)】以云煙87上部煙葉為樣本,通過掃描獲取煙葉顏色等特征信息,建立BP神經(jīng)網(wǎng)絡(luò)烤煙褐變程度識(shí)別模型?!緮M解決的關(guān)鍵問題】本研究擬通過建立煙葉褐變程度圖像識(shí)別BP神經(jīng)網(wǎng)絡(luò)模型,探究褐變程度與煙葉質(zhì)量的關(guān)系,明確不同褐變程度對(duì)上部煙葉可用性的影響。
2018年,在恩施州利川市柏楊鎮(zhèn)進(jìn)行試驗(yàn),品種為云煙87,土壤為砂壤土,有機(jī)質(zhì)2.71%,pH 5.71,速效氮89.72 mg/kg,有效磷66.45 mg/kg,速效鉀190.12 mg/kg,施肥比例m(N)∶m(P2O5)∶m(K2O)=1.0∶1.5∶2.5,行距1.2 m,株距0.55 m。其他技術(shù)措施和田間管理按優(yōu)質(zhì)煙生產(chǎn)技術(shù)規(guī)程實(shí)施。選取14~16葉位的上部煙葉為供試材料。
圖片信息數(shù)據(jù)準(zhǔn)備:由烤煙分級(jí)技術(shù)人員對(duì)烤后上部煙葉300份樣本進(jìn)行褐變程度分類(Browning degree, BD),分為正常(葉片干凈鮮亮)、稍褐變(灰褐色斑點(diǎn)零星分布,葉片光澤暗淡)、輕度褐變(褐色斑點(diǎn)零星分布)、中度褐變(灰褐色斑點(diǎn)集塊連片,占葉片面積的30%)、重度褐變(灰褐色斑點(diǎn)集塊連片,占葉片面積的50%以上)5類,分別設(shè)為0、1、2、3和4級(jí)。分類結(jié)果為:0級(jí)65份,1級(jí)52份,2級(jí)61份,3級(jí)54份,4級(jí)68份。利用CANON 60D數(shù)碼相機(jī)對(duì)樣品進(jìn)行圖像采集并保存為JPG格式,圖片大小尺寸統(tǒng)一修改為256×256像素(dots per inch,dpi)。然后對(duì)圖片進(jìn)行灰度化、二值化、梯度銳化等處理,具體參照卜富清[20]的方法,并將提取R、G和B信息存入Excel中。
BP網(wǎng)絡(luò)訓(xùn)練與測(cè)試:首先對(duì)圖片信息數(shù)據(jù)進(jìn)行隨機(jī)排序產(chǎn)生隨機(jī)數(shù)據(jù)集(Random_Data),從隨機(jī)數(shù)據(jù)集抽取圖片信息生成輸入信息集(Input_Data),利用decodeClassLabels函數(shù)將煙葉褐變等級(jí)信息(BD_data)編碼轉(zhuǎn)化成二進(jìn)制矩陣,利用splitForTrainingAndTest將按4∶1拆成訓(xùn)練集和測(cè)試集,包括訓(xùn)練的輸入集(Inputs_Train)、訓(xùn)練的結(jié)果集(Target_Train)、測(cè)試的輸入集(Inputs_Test)和測(cè)試的結(jié)果集(Target_Test),然后對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理到[0,1]。利用R語言RSNNS軟件包構(gòu)建全連接神經(jīng)網(wǎng)絡(luò)(Multi-Layer Perception,BP)。通過設(shè)定不同隱藏層神經(jīng)元以及迭代次數(shù),獲得均方根偏差,最終確定BP參數(shù)。在運(yùn)行中隱藏層神經(jīng)設(shè)置為1~25,迭代次數(shù)分別設(shè)為100~20 000。
BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)識(shí)別結(jié)果驗(yàn)證:取100份樣本,按順序標(biāo)號(hào)(1~100),首先由BP識(shí)別系統(tǒng)對(duì)樣本進(jìn)行褐變程度分類,并記錄分類等級(jí),然后由人工對(duì)樣本進(jìn)行褐變程度分類,并記錄分類等級(jí)。以人工識(shí)別分類為參照,BP識(shí)別系統(tǒng)正確率=1-|NBP-NRG|/NRG×100%(NBP為BP神經(jīng)網(wǎng)絡(luò)自動(dòng)識(shí)別系統(tǒng)數(shù)量,NRG為人工識(shí)別數(shù)量),總體識(shí)別正確率=(1-∑|NBP-NRG|/300)×100%,通過計(jì)算皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient)檢驗(yàn)兩組數(shù)據(jù)相似度,利用配對(duì)T檢驗(yàn)顯著性差異,重復(fù)3次。為進(jìn)一步驗(yàn)證BP神經(jīng)網(wǎng)絡(luò)識(shí)別系統(tǒng)識(shí)別結(jié)果,在BP識(shí)別的樣本集中隨機(jī)分選0、1、2、3、4級(jí)煙葉各3份,共計(jì)15份樣本;在人工識(shí)別的樣本集中隨機(jī)分選0、1、2、3、4級(jí)煙葉3份,共計(jì)15份樣本。分別測(cè)定外觀質(zhì)量、常規(guī)化學(xué)成分、TSNAs含量、多酚含量和感官質(zhì)量,然后進(jìn)行比對(duì)分析,兩組數(shù)據(jù)利用公式皮爾森類似度(Pearson similiarity)進(jìn)行計(jì)算。
隨機(jī)選取5片煙葉,混合為1次重復(fù),70 ℃烘干至恒重,剔除主脈和較粗的支脈,研磨粉碎過250 μm篩保存。常規(guī)化學(xué)成分檢測(cè)采用美國API公司生產(chǎn)的305D型連續(xù)流動(dòng)分析儀參照行業(yè)標(biāo)準(zhǔn)測(cè)定;多酚含量參照行業(yè)標(biāo)準(zhǔn)[21]測(cè)定,TSNAs含量采用液質(zhì)聯(lián)用[22]測(cè)定,外觀質(zhì)量和感官質(zhì)量由BP神經(jīng)網(wǎng)絡(luò)識(shí)別和人工識(shí)別完成。
采用Excel 2016進(jìn)行數(shù)據(jù)處理,利用R語言軟件進(jìn)行多層感知器神經(jīng)網(wǎng)絡(luò)分析,建立褐變程度判定模型,利用軟件R語言Hmisc軟件包進(jìn)行皮爾森類似度分析。
在BP神經(jīng)網(wǎng)絡(luò)構(gòu)建中,隱蔽節(jié)點(diǎn)數(shù)分別設(shè)為1~25,隨著隱蔽層節(jié)點(diǎn)數(shù)增加訓(xùn)練集和測(cè)試集均方根偏差均呈下降趨勢(shì),當(dāng)隱蔽層節(jié)點(diǎn)數(shù)為16時(shí),訓(xùn)練集和測(cè)試集均方根偏差下降趨于平穩(wěn),隱蔽節(jié)點(diǎn)數(shù)設(shè)定為16(圖1-A);迭代次數(shù)從100增加至4000時(shí),訓(xùn)練集和測(cè)試集均方根偏差均呈下降趨勢(shì),達(dá)到0.015,隨著迭代次數(shù)增加出現(xiàn)上升趨勢(shì),5500次以后,訓(xùn)練集和測(cè)試集均方根偏差下降趨于平穩(wěn)(圖1-B),當(dāng)?shù)螖?shù)為4000時(shí)測(cè)試集均方根偏差達(dá)到極小,為此,選擇迭代次數(shù)4000次時(shí)應(yīng)停止迭代次數(shù),與之相對(duì)應(yīng)的權(quán)重選為實(shí)驗(yàn)中的最佳數(shù)學(xué)模型。在此基礎(chǔ)上進(jìn)行訓(xùn)練集和測(cè)試集擬合誤差模擬分析,結(jié)果顯示訓(xùn)練集擬合線(圖1-C,紅色)和測(cè)試集(圖1-D,紅色)接近黑色對(duì)角線,說明在隱蔽節(jié)點(diǎn)數(shù)為16,迭代次數(shù)為4000時(shí)為合理的建模參數(shù),寫入函數(shù)代碼后輸出BP網(wǎng)絡(luò)(圖1-E)。
A、B為蔽節(jié)點(diǎn)數(shù)和迭代次數(shù)模擬分析;C、D為訓(xùn)練集和測(cè)試集擬合誤差模擬分析;E為BP神經(jīng)網(wǎng)絡(luò)模型輸出結(jié)果:輸入層中RBG為輸入色差,隱藏層中H為隱藏節(jié)點(diǎn)及編號(hào),輸出層中1、2、3、4和5為輸出特征代碼,BD0、BD1、BD2、BD3和BD4為對(duì)應(yīng)褐變等級(jí)。紅色連線代表權(quán)重值為正,藍(lán)色代表權(quán)重值為負(fù),線條粗細(xì)代表權(quán)重值絕對(duì)值大小。B1和B2為偏差參數(shù),設(shè)為默認(rèn)值。
300份不同褐變程度煙葉經(jīng)過BP神經(jīng)網(wǎng)絡(luò)識(shí)別系統(tǒng)和人工識(shí)別后,結(jié)果顯示,對(duì)0、1、2、3和4級(jí)識(shí)別正確率分別為100%、100%、96.96%、98.44%和98.33%(表1),BP神經(jīng)網(wǎng)絡(luò)識(shí)別系統(tǒng)總體正確率達(dá)到98.75%。
表1 BP神經(jīng)網(wǎng)絡(luò)模型檢驗(yàn)
通過比較分析BP和RG識(shí)別的不同級(jí)別(0~4)褐變煙葉顏色、成熟度、葉片結(jié)構(gòu)、身份、油分變差和色度以及指數(shù)之和等外觀質(zhì)量參數(shù)。BP識(shí)別(圖2-A)和RG識(shí)別(圖2-B)褐變煙葉隨著0~4級(jí)褐變程度加重。對(duì)于多數(shù)樣本而言,BP識(shí)別和RG識(shí)別差異不明顯(圖2-C);進(jìn)一步分析發(fā)現(xiàn),R3M2樣本人工識(shí)別為3級(jí),BP識(shí)別為2級(jí),R2B3樣本人工識(shí)別為2級(jí),BP識(shí)別為3級(jí),R3B4樣本人工識(shí)別為3級(jí),BP識(shí)別為4級(jí),而R3B2可以歸為2級(jí),R2B3也可以歸為3級(jí),這樣的樣本應(yīng)該介于兩者之間,這對(duì)于BP識(shí)別系統(tǒng)可能有一定的難度,另外R3B4也與煙筋顏色較深有關(guān)(圖2-D)。通過煙葉顏色、成熟度、葉片結(jié)構(gòu)、身份、油分和色度等指標(biāo)對(duì)比分析,發(fā)現(xiàn)BP識(shí)別褐變煙葉外觀質(zhì)量參數(shù)與RG識(shí)別的變化規(guī)律相似(表2,R>0.777,P<0.001)。說明BP和RG識(shí)別的不同級(jí)別(0~4)褐變煙葉外觀質(zhì)量沒有顯著差別(T-test,P>0.05)。
表2 BP和RG識(shí)別不同褐變程度煙葉外觀質(zhì)量
A.人工識(shí)別不同褐化級(jí)別煙葉;B.智能識(shí)別不同褐化級(jí)別煙葉;C.人工識(shí)別和智能識(shí)別不同褐化級(jí)別煙葉單葉比較;D.人工識(shí)別和智能識(shí)別存在差異的不同褐化級(jí)別煙葉。
隨著煙葉褐變程度的增加,人工識(shí)別褐變煙葉中還原糖、總糖含量逐漸降低,重度褐變與未褐變煙相比還原糖含量顯著降低,降幅達(dá)17.77%,褐變程度(x)與烤后煙葉還原糖含量(y1)呈負(fù)相關(guān),y1=-0.1236x2-0.6047x+ 24.559(R2= 0.9991),可見煙葉發(fā)生褐變與糖類過度消耗有關(guān);煙堿、氯離子含量逐漸增加,重度褐變與未褐變煙相比,煙堿含量顯著增加,增幅達(dá)19.79%;糖堿比、氮堿比、鉀氯比降低,內(nèi)在化學(xué)成分的協(xié)調(diào)性變差。智能識(shí)別褐變煙葉中煙堿、還原糖、氯、總糖、總氮和鉀的變化趨勢(shì)與人工識(shí)別褐變煙葉的變化趨勢(shì)基本一致,兩組數(shù)據(jù)間差異不顯著(T-test,P>0.05,表3)。兩組數(shù)據(jù)相似度分析顯示,鉀、氯和總氮含量相似度未達(dá)到顯著水平,煙堿、還原糖和總糖含量顯著相似(圖3)。
A、B、C、D、E和F分別為煙堿、還原糖、鉀、氯、總糖和總氮含量相似系數(shù)及顯著性;*表示顯著值小于0.05,達(dá)顯著水平;*** 表示顯著值小于0.001,達(dá)極顯著水平。
表3 不同褐化程度的煙葉化學(xué)成分
隨著煙葉褐變程度的增加,人工識(shí)別褐變煙葉中適當(dāng)褐變引發(fā)的輕微褐變綠原酸、蕓香苷等多酚含量增加;隨著烤后煙葉褐變程度的加重,綠原酸含量逐漸降低,莨菪亭含量逐漸升高,蕓香苷含量先升高后降低,重度褐變煙葉綠原酸、多酚總量顯著降低。褐變程度(x)與烤后煙葉綠原酸含量(y2)呈一元二次關(guān)系,y2=-0.3457x2+ 0.9029x+ 10.085(R2=0.9896)。智能識(shí)別褐變煙葉中綠原酸、莨菪亭、蕓香苷和多酚總量的變化趨勢(shì)與人工識(shí)別褐變煙葉的變化趨勢(shì)基本一致(表4)。兩組數(shù)據(jù)相似度分析顯示,綠原酸、莨菪亭、蕓香苷和多酚總量相似度均達(dá)到顯著水平(圖4,R≥0.59,P<0.05)。
A、B、C和D的分別為綠原酸、莨菪亭、蕓香苷和多酚總量相關(guān)性分析;R為相似系數(shù),P為顯著值。
表4 不同褐變程度煙葉多酚含量
從表5可以看出,隨著褐變程度的增加煙葉TSNAs含量逐漸增加,褐變程度(x)與烤后煙葉TSNAs含量(y3)呈正相關(guān),y3=-1.3121x2+62.69x+435.76(R2=0.9974),煙葉發(fā)生褐變后吸食安全性降低,重度褐變煙葉與未褐變相比,TSNAs總量增幅達(dá)53.84%。智能識(shí)別褐變煙葉NNN、NNK、NAT和NAB的變化趨勢(shì)與人工識(shí)別褐變煙葉的變化趨勢(shì)基本一致,兩組數(shù)據(jù)間差異不顯著(T-test,P>0.05,表5)。兩組數(shù)據(jù)變化趨勢(shì)分析發(fā)現(xiàn),智能識(shí)別褐變煙葉NNN、NNK、NAT和NAB與人工識(shí)別的變化趨勢(shì)基本一致(圖5,R≥0.85)。
表5 不同褐變程度煙葉TSNAs含量
從表6可以看出,人工識(shí)別和智能識(shí)別的未褐變煙葉、稍褐變煙葉為一檔,香氣質(zhì)感較清晰,煙氣柔順、蓬松感較好,余味較舒適,濃度勁頭中等;與未褐變煙葉相比,稍褐變煙葉香氣量有所增加,煙氣稍柔順,濃度勁頭中等;隨著褐變程度的增加,煙葉感官質(zhì)量逐漸降低,主要表現(xiàn)在香氣質(zhì)、余味變差,雜氣加重;輕度褐變煙為二檔,香氣質(zhì)感較好,雜氣略重,余味稍欠舒適,煙氣尚柔順,濃度中等,勁頭略偏大;褐變達(dá)到中度及以上程度,香氣質(zhì)、香氣量明顯下降,香氣質(zhì)感較差,煙氣粗糙,雜氣稍重,雜味較多,余味舒適性較差(表6)。
褐變煙葉是烤壞煙占例最大的一類煙葉,也是影響交售等級(jí)最大的問題[22]。目前生產(chǎn)上褐變煙的收購主要通過驗(yàn)級(jí)員的主觀判斷,缺乏客觀數(shù)據(jù)支撐,部分具有可用性的褐變煙葉定為雜色煙不予收購,經(jīng)濟(jì)損失較重。馬建元[23]和李勝[24]采用計(jì)算機(jī)圖像處理技術(shù)初步建立了烤煙等級(jí)的BP網(wǎng)絡(luò)識(shí)別模型,為不同褐變程度煙葉的智能化識(shí)別提供了參考。本研究基于BP網(wǎng)絡(luò)構(gòu)建烤煙褐變程度識(shí)別模型,并對(duì)比分析BP網(wǎng)絡(luò)識(shí)別與人工識(shí)別效果及分類煙葉質(zhì)量,為客觀評(píng)價(jià)不同程度褐變煙葉提供了技術(shù)支持,是烤煙分級(jí)圖像識(shí)別的重要補(bǔ)充,建立的褐變程度識(shí)別模型能有效區(qū)分不同褐變程度煙葉的可用性。
BP網(wǎng)絡(luò)構(gòu)建通過反復(fù)計(jì)算和修正,確保網(wǎng)絡(luò)架構(gòu)趨于穩(wěn)定、輸出層的輸出值達(dá)到期望標(biāo)準(zhǔn),其核心在于降低輸出層實(shí)際輸出和期望標(biāo)準(zhǔn)值存在誤差。本文中通過設(shè)置不同的隱藏節(jié)點(diǎn)數(shù)和迭代次數(shù),發(fā)現(xiàn)隱藏節(jié)點(diǎn)為16,迭代次數(shù)4000次為最佳模型參數(shù),訓(xùn)練集和測(cè)試集擬合誤差模擬分析結(jié)果也證實(shí)了該參數(shù)條件下擬合度最佳并輸出BP網(wǎng)絡(luò)模型。通過BP構(gòu)建的神經(jīng)網(wǎng)絡(luò)只是數(shù)字化模擬結(jié)果,是否能適用于實(shí)際生產(chǎn),有必要通過實(shí)際驗(yàn)證。以人工識(shí)別結(jié)果為標(biāo)準(zhǔn),BP神經(jīng)網(wǎng)絡(luò)識(shí)別所識(shí)別的300份樣本中,0級(jí)47份,正確率100%,1、2、3和4級(jí)識(shí)別正確率分別為100%、96.96%、98.44%和98.33%。BP神經(jīng)網(wǎng)絡(luò)對(duì)小麥群體圖像綠色面積識(shí)別精度為85.43%,對(duì)葉面積的平均識(shí)別精度為86.38%[25],烤煙煙葉圖像特征提取和質(zhì)量分級(jí)研究中BP網(wǎng)絡(luò)平均識(shí)別率為80%[24],基于圖像處理的烤煙煙葉質(zhì)量分級(jí)的關(guān)鍵技術(shù)研究識(shí)別率為92%~96%[22],而本文所構(gòu)建的煙葉褐化識(shí)別網(wǎng)絡(luò)精準(zhǔn)度達(dá)98.75%。本研究中僅針對(duì)褐化所涉及到的特征數(shù)據(jù)比較單一,從而獲得較高的精準(zhǔn)度。
煙葉發(fā)生酶促褐變對(duì)內(nèi)在質(zhì)量也有較大影響,與還原糖、總糖含量降低,化學(xué)成分協(xié)調(diào)性變差,感官評(píng)吸質(zhì)量變化有關(guān)[15]。本研究中,智能識(shí)別褐變煙葉隨著程度增加,常規(guī)化學(xué)成分、多酚含量、TSNAs含量和感官質(zhì)量變化與人工識(shí)別的變化基本一致,而且與其他研究結(jié)果也基本一致[15,25-26],說明智能識(shí)別的褐變煙葉表征與內(nèi)在品質(zhì)相符合。識(shí)別分類的煙葉內(nèi)在質(zhì)量差異較大、區(qū)分性較好,通過煙葉質(zhì)量分析表明分類的中度褐變煙葉化學(xué)成分較協(xié)調(diào),多酚含量較高、TSNAs含量較低,感官評(píng)吸香氣質(zhì)感較好,具有一定的可用性,挽救了部分損失。因此,智能識(shí)別系統(tǒng)能夠比較精準(zhǔn)的識(shí)別褐化煙葉,為烤煙收購雜色煙分級(jí)爭(zhēng)議提供客觀評(píng)價(jià)。但本研究中還有一些問題有待研究,比如R3M2樣本人工識(shí)別為3級(jí),BP識(shí)別為2級(jí),R2B3樣本人工識(shí)別為2級(jí),BP識(shí)別為3級(jí),R3B4樣本人工識(shí)別為3級(jí),BP識(shí)別為4級(jí),而R3B2可以歸為2級(jí),R2B3也可以歸為3級(jí),這樣的樣本應(yīng)該介于兩者之間,這對(duì)于BP識(shí)別系統(tǒng)可能有一定的難度,有必要增加圖片的分辨率,或者增加煙葉的其他表征信息(如紋理特征),剔除主支脈顏色偏差從而提高識(shí)別準(zhǔn)確率。
本文基于BP神經(jīng)網(wǎng)絡(luò)建立煙葉褐變程度圖像智能識(shí)別模型,代替?zhèn)鹘y(tǒng)的肉眼鑒別,鑒別結(jié)果更客觀準(zhǔn)確,識(shí)別準(zhǔn)確率為98.75%;智能識(shí)別褐變煙葉表征與內(nèi)在品質(zhì)相符合,為實(shí)現(xiàn)煙葉褐化等級(jí)智能化和規(guī)模化應(yīng)用提供了參考信息。