劉紅蕓 吳雪梅 張富貴 李德侖 葉 磊 蔣柏春
(1.貴州大學(xué)機(jī)械工程學(xué)院 貴陽(yáng) 550025)(2.貴州省煙草農(nóng)業(yè)科學(xué)研究院 貴陽(yáng) 550081)
煙葉成熟度是影響烘烤后煙葉質(zhì)地的中心因素,全面了煙葉成熟特征,正確辨別和判斷煙葉成熟度,把握好適熟采收標(biāo)準(zhǔn),采摘適熟一致的煙葉,對(duì)于烘烤和烤后煙葉質(zhì)地好、級(jí)別高、香味好等具有重要意義[1~5]。目前生產(chǎn)上一般為煙農(nóng)依照煙葉外觀特征來(lái)判斷其成熟度,確定采收成熟煙葉,具有較強(qiáng)的主觀性。因此,研究一種快速、客觀、無(wú)損的方法來(lái)判別煙葉的成熟度,具有重大的意義。
高光譜技術(shù)是發(fā)展迅速的一種遙感技術(shù),高光譜植被光譜指數(shù)及光譜參數(shù)包含的信息大。因此高光譜技術(shù)廣泛應(yīng)用于農(nóng)業(yè)的各個(gè)領(lǐng)域,例如在哈密瓜[6]、草莓[7]和李果實(shí)[8]等。在烤煙上,也有許多學(xué)者利用光譜參數(shù)開展了煙葉化學(xué)成分含量估測(cè)、煙葉的分類和烤煙的生長(zhǎng)監(jiān)測(cè)等方面的研究。孫志偉等[9]利用可見光譜參數(shù)與葉綠素之間的相關(guān)性,構(gòu)建鮮煙葉的葉綠素快速估算模型。X N Wei等[10]采用逐步多元回歸方法建立了煙堿含量的光譜預(yù)測(cè)模型。Peng Jiyu等[11]采集集鮮葉和干葉顆粒煙草樣品光譜信息,并使用PLS-DA建立基于全光譜分類模型。余志紅等[12]利用煙葉的比值植被指數(shù)RVI,構(gòu)建回歸模型能夠很好地監(jiān)測(cè)田間煙葉成熟度,完成了不同成熟度中、上部田間鮮煙葉RVI范圍的初步確定。綜上所述,已有學(xué)者利用光譜技術(shù)對(duì)煙葉的色素含量、水分含量和氮含量等建立了預(yù)測(cè)模型但目前尚未有利用偏最小二乘法判別分析法對(duì)鮮煙葉成熟度進(jìn)行判別分析。
針對(duì)以上問(wèn)題,本文提出了偏最小二乘法判別分析模型,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該模型在煙葉成熟度判別分析研究領(lǐng)域中的可行性。首先,搭建了戶外高光譜圖像信息采集系統(tǒng),采集了煙葉高光譜數(shù)據(jù)信息。然后,建立了PLS-DA的煙葉成熟度判別模型。最后,對(duì)模型訓(xùn)練結(jié)果進(jìn)行了可視化分析。實(shí)驗(yàn)結(jié)果表明,該模型具有良好的判別精度。
2.1.1 實(shí)驗(yàn)圖像采集系統(tǒng)
本實(shí)驗(yàn)采用高光譜成像儀(四川雙利合譜)搭建的戶外高光譜圖像信息采集系統(tǒng)。高光譜圖像采集系統(tǒng)圖,如圖1所示,包括GaiaSky-mini2機(jī)載高光譜成像儀、三腳支架、顯示器、置物板和便捷式大功率移動(dòng)電源等組成。
圖1 高光譜圖像采集系統(tǒng)
2.1.2 實(shí)驗(yàn)樣本
實(shí)驗(yàn)以2019年貴州省息烽縣(黔中地區(qū))、安龍縣(黔西南地區(qū))、道真縣(黔北地區(qū))和威寧縣(黔西北地區(qū))四個(gè)地區(qū)的的云煙87中部煙葉為研究對(duì)象,于7月~8月采集煙葉樣本,采集了未熟、成熟、過(guò)熟煙葉樣本總數(shù)共308個(gè),由貴州省煙草科學(xué)研究院專家對(duì)煙葉樣本及其成熟度進(jìn)行判別。
在煙葉采摘期,選擇天氣晴朗、無(wú)風(fēng)的天氣進(jìn)行拍攝,適宜拍攝時(shí)間為每日10:00-14:00之間。高光譜相機(jī)的攝像頭與置物板距離為5m~6m,拍攝時(shí)將標(biāo)準(zhǔn)白板與煙葉樣本拍入高光譜圖像中,標(biāo)準(zhǔn)白板數(shù)據(jù)作為白幀數(shù)據(jù),每天拍攝結(jié)束時(shí)蓋上鏡頭蓋采集黑幀數(shù)據(jù)。
2.2.1 研究方案
本文旨在使用高光譜成像技術(shù)判別煙葉成熟度。設(shè)計(jì)其判別流程圖,如圖2所示。主要步驟:1)搭建實(shí)驗(yàn)戶外高光譜圖像信息系統(tǒng),拍攝煙葉的高光譜圖像并對(duì)圖像黑白校正;2)選取鮮煙葉樣本的高光譜圖像感興趣區(qū)域(Region of Interesting,ROI)并計(jì)算ROI平均光譜曲線,進(jìn)行Savitzky-Golay卷積平滑預(yù)處理;3)計(jì)算光譜參數(shù),建立PLS-DA模型。
圖2 鮮煙葉成熟度判別流程圖
2.2.2 高光譜圖像校正
高光譜相機(jī)采集的光譜圖像數(shù)據(jù),取決于鏡頭透過(guò)率、光源的強(qiáng)度、光源的光譜、相機(jī)的光譜響應(yīng)效率、光譜儀的衍射效率以及被測(cè)物體的光譜反射率。為了消除光照強(qiáng)度不均勻以及成像儀鏡頭中暗電流所伴隨噪聲的影響,需要對(duì)采集到的高光譜鮮煙葉圖像進(jìn)行黑白校正。黑白校正算法如下式(1)所示:
式中,Sci表示原始樣品數(shù)據(jù),Dci表示暗背景數(shù)據(jù),也稱黑幀數(shù)據(jù),Wci表示白板數(shù)據(jù)也稱白幀數(shù)據(jù)。
2.2.3 提取光譜數(shù)據(jù)及預(yù)處理
將經(jīng)過(guò)校正完成的鮮煙葉葉片高光譜圖像導(dǎo)入ENVI5.3軟件中,利用ENVI5.3軟件,對(duì)鮮煙葉的感興趣區(qū)域(Region of Interesting,ROI)進(jìn)行繪制。提取每個(gè)樣本ROI內(nèi)所有像素點(diǎn)光譜反射率的平均光譜作為該樣本的光譜,統(tǒng)共得到了308個(gè)樣本,其中未成熟90個(gè),成熟117個(gè),過(guò)熟樣本101個(gè)。
為了消除光譜信息中噪聲的影響,在建模前應(yīng)用Matlab2016a對(duì)原始光譜曲線進(jìn)行預(yù)處理來(lái)提高模型的精確度。本次采用SG卷積平滑處理,可減小由于隨機(jī)因素產(chǎn)生的誤差,更好地體現(xiàn)出煙葉光譜特征。從308樣本中隨機(jī)抽取208個(gè)(60個(gè)未成熟、79個(gè)成熟、69個(gè)過(guò)熟)作為模型的訓(xùn)練集,其余的100個(gè)(未成熟30個(gè)、成熟38個(gè)、過(guò)熟32個(gè))作為測(cè)試集。
2.3.1 光譜指數(shù)
從現(xiàn)有的煙葉成熟度研究表明,隨著煙葉的成熟程度的提高,煙葉中的葉綠素含量、胡蘿卜素與總氮含量會(huì)降低,但類胡蘿卜素占色素總量的比例會(huì)提高,煙堿含量、水分含量等隨著成熟度的不同也會(huì)存在差異。由不同成熟度鮮煙葉生化成分的不同[13~15],參考文獻(xiàn)[16]關(guān)于植物光譜指數(shù)的論述,指出不同成熟度鮮煙葉中葉綠素含量、類胡蘿卜素含量和水分含量的差異,應(yīng)用文獻(xiàn)中的6個(gè)光譜指數(shù)(Spectral Indices,SIs)作為成熟度判別的參數(shù),如表1所示。研究6個(gè)光譜指數(shù)與鮮煙葉成熟度間的相關(guān)關(guān)系,經(jīng)對(duì)比分析后,優(yōu)選出最相關(guān)的3個(gè)參數(shù)作為判別模型的輸入?yún)?shù)。
表1 光譜指數(shù)定義和功能描述
2.3.2 可見光光譜參數(shù)
對(duì)三種成熟度鮮煙葉的光譜在可見光波段不同成熟度的煙葉有明顯的區(qū)分效果。選取可見光波段紅光波段中650nm波段、綠光波段中550nm波段及藍(lán)光波段中450nm波段的光譜信息,建立4個(gè)可見光光譜參數(shù)用于煙葉的成熟度的判別分析:
偏最小二乘法判別分析(PLS-DA),是一種用于別分析多變量統(tǒng)計(jì)分析方法,結(jié)合了偏最小二乘回歸的屬性和分類分析技術(shù)的判別能力。在處理時(shí),將樣本判別向量(樣本有m個(gè)類別)轉(zhuǎn)換為n行(n個(gè)樣本)和m列的虛擬矩陣Y(n×m)。本研究中m為3,代表3個(gè)成熟度,每一個(gè)樣本的判別向量Y為一行三列,即Y=[Y1,Y2,Y3],其中Y1,Y2,Y3分別為未成熟、成熟、過(guò)熟煙葉三類煙葉的判別元素。本研究參考文獻(xiàn)[17]的PLS-DA方法,通過(guò)將虛擬的等級(jí)值1、2、3分配給未熟、成熟、過(guò)熟煙葉來(lái)建立PLS-DA判別模型,并將預(yù)測(cè)樣本的數(shù)值代入Y中,其中Y的最大值所對(duì)應(yīng)類別即為該樣本的成熟度類別的歸類規(guī)律,進(jìn)行預(yù)測(cè)分類判別,即Y中Y2的數(shù)值最大,即判斷該樣本為成熟煙葉。
3.1.1 預(yù)處理
圖3為三種不同成熟度鮮煙葉的原始光譜曲線圖(圖3(a))與SG卷積平滑處理后的光譜曲線圖(圖3(b))。如圖3(b),在SG平滑處理后,光譜曲線在可見光波段去除噪聲無(wú)明顯效果,但近紅外波段(780nm~1000nm)去除噪聲的效果較好,原始光譜曲線由噪聲引起的曲線抖動(dòng)跡象有了很好的改善,尤其在900nm~1000nm波段消除了大量的噪聲。
圖3 原始光譜預(yù)處理
三種成熟度的鮮煙葉平均在400nm~735nm有明顯的區(qū)分效果,其中450nm、550nm和650nm光譜反射率統(tǒng)計(jì)如表2。從表中可以看出,在450nm、550nm和650nm處不同成熟度鮮煙葉光譜反射率范圍間反射率略有交叉,平均值隨著成熟度增加而增大。
表2 煙葉可見光譜波段反射率統(tǒng)計(jì)
3.1.2 鮮煙葉平均光譜
由圖4可以看出,三種成熟度鮮煙葉的平均光譜曲線在400nm~680nm可見光波段具有顯著的識(shí)別效果。鮮煙葉光譜反射率隨著煙葉成熟度的增加而增加,特別在550nm~680nm之間的最為顯著。因此,不同成熟等級(jí)的煙葉在葉綠素、類胡蘿卜素、含水量等存在的差異所造成光譜的不同,可利用鮮煙葉成熟度的判別。
圖4 三種不同成熟度鮮煙葉的平均光譜曲線
如圖5所示,將6個(gè)光譜指數(shù)與4個(gè)可見光光譜參數(shù)進(jìn)行歸一化處理,歸一化處理后光譜參數(shù)??梢钥闯鋈N煙葉樣本的10個(gè)參數(shù)均存在差異,說(shuō)明了這些參數(shù)用于煙葉的成熟度的判別具有可行性。選出mNDVI705、SIPI、VOG3、I1、I2、I3、I4用于鮮煙葉不同成熟度的判別,這7個(gè)參數(shù)的數(shù)值隨著鮮煙葉成熟度變化具有一定的線性變化規(guī)律,將它們組合為多光譜參數(shù),作為PLS-DA判別模型輸入變量的自變量X,分別為X1、X2、X3、X4、X5、X6、X7,即X=[X1,X2,X3,X4,X5,X6,X7]。
圖5 歸一化后光譜多參數(shù)均值統(tǒng)計(jì)
以光譜指數(shù)(mNDVI705、SIPI、VOG3)和可見光光譜參數(shù)(I1、I2、I3、I4)組成的多光譜參數(shù)作為煙葉成熟偏最小二乘法判別分析模型(PLS-DA)的特征向量組,將三種不同成熟度作為PLS-DA模型輸入變量因變量Y(判別向量)。圖6為煙葉樣本的判別結(jié)果,可以看出30個(gè)未熟煙葉中,有29個(gè)Y1數(shù)值最大,但第7個(gè)樣本的Y2數(shù)值最大,將該樣本被誤判為成熟煙葉,正確率為96.67%;圖6(b)為測(cè)試集中38個(gè)成熟煙葉中,均為Y2數(shù)值最大,38個(gè)都判為成熟樣本,未出現(xiàn)樣本判斷錯(cuò)誤,正確率為100%;圖6(c)為預(yù)試集中32個(gè)過(guò)熟煙葉中,有31個(gè)Y3數(shù)值最大,但第6個(gè)樣本的Y2最大,將該樣本被預(yù)測(cè)為成熟煙葉,正確率為98%。
圖6 鮮煙葉樣本的判別結(jié)果
本文利用高光譜成像技術(shù)實(shí)現(xiàn)了對(duì)三種不同成熟度(未熟、成熟、過(guò)熟)煙葉分類判別。主要結(jié)論如下:
1)煙葉成熟度不同,反映其光譜特性也不相同,植物光譜指數(shù)(mNDVI705、SIPI、VOG3)和可見光段參數(shù)(I1、I2、I3、I4),用于煙葉的成熟度判別,有良好的判別效果,減少了輸入全光譜波段數(shù)值的計(jì)算量。
2)通過(guò)PLS-DA判別方法結(jié)合多光譜參數(shù)建立了煙葉的成熟度的判別模型和回歸方程,分類識(shí)別的準(zhǔn)確率良好,訓(xùn)練集和測(cè)試集判別效果分別為98.56%與98%,說(shuō)明了PLS-DA算法可實(shí)現(xiàn)三種不同成熟度的煙葉的判別。
3)本研究實(shí)現(xiàn)了快速、無(wú)損地判別煙葉的成熟度,建立了基于高光譜技術(shù)的煙葉成熟度判別模型,結(jié)合高光譜遙感技術(shù)可實(shí)現(xiàn)田間煙葉成熟度判別,適熟采收煙葉,提高烤后煙葉的質(zhì)量。