蔣柏春,李德侖,韋克蘇,張富貴,王杰,劉紅蕓
(1.貴州大學(xué)機(jī)械工程學(xué)院,貴陽市,550025;2.貴州省煙草科學(xué)研究院,貴陽市,550025;3.四川礦產(chǎn)機(jī)電技師學(xué)院,成都市,611230)
葉綠素是綠色植物光合作用的重要色素,影響到作物與外界的物質(zhì)能量交換及作物的物質(zhì)積累,其含量的高低對(duì)植物光合效率、發(fā)育狀況及烘烤工藝等有重要的指示作用[1-2],因而煙葉葉綠素含量的估測(cè)是監(jiān)測(cè)烘烤煙葉烘烤狀態(tài)的有效手段。
同時(shí),作物葉片的葉綠素含量與作物反射光譜之間聯(lián)系緊密。高光譜具有波段多、圖譜合一和分辨率高的特點(diǎn),把二維圖像和光譜技術(shù)融為三維的圖譜信息。
用高光譜成像技術(shù)檢測(cè)的葉綠素具有安全、快速、無損、定量等特點(diǎn),并能對(duì)葉片大區(qū)域葉綠素含量的檢測(cè),有較大的應(yīng)用潛力[3]。
國內(nèi)外學(xué)者在玉米、草叢及葡萄等葉片的葉綠素含量的高光譜估測(cè)方面都有研究。Kaasalinen等[4]利用雷達(dá)高光譜技術(shù)建立了葉綠素快速和無損預(yù)測(cè)模型。
李敏夏等[5]分析了蘋果葉片高光譜特征與葉綠素含量和SPAD值的關(guān)系,研究了葉片的SPAD值和葉綠素含量與微分光譜之間的相關(guān)性,李方舟等[6]做了基于高光譜數(shù)據(jù)的水旱地冬小麥葉綠素含量監(jiān)測(cè),取得了比較理想的結(jié)果,楊杰等[7]通過修正光譜指數(shù)建立了水稻上部葉片葉綠素含量的高光譜估算模型,楊峰等[8]利用高光譜技術(shù)研究了不同生長期下小麥與水稻兩種作物的葉綠素含量和冠層光譜之間的變化,將兩種作物的葉綠素含量與其冠層光譜數(shù)據(jù)的相關(guān)性進(jìn)行比較,進(jìn)而確定了監(jiān)測(cè)兩種作物葉綠素含量的最佳植被指數(shù),但對(duì)于在煙葉烘烤過程中實(shí)時(shí)檢測(cè)煙葉不同烘烤溫度下葉綠素含量的相關(guān)研究較少。
文章以貴陽市平壩區(qū)云煙87為研究對(duì)象,探討合適的光譜參數(shù)和反演方法,為葉綠素含量快速準(zhǔn)確估算提供參考,進(jìn)而為煙葉烘烤工藝提供依據(jù)。
試驗(yàn)于2019年在貴州省貴陽市平壩區(qū)天龍實(shí)驗(yàn)基地進(jìn)行,挑選不同地塊煙葉,取下部煙葉為實(shí)驗(yàn)對(duì)象,供試烤煙品種為云煙87,試驗(yàn)設(shè)置尚熟、成熟、完熟三種成熟度,按照442烘烤工藝進(jìn)行烘烤,分別在烤前、40℃后、45℃后進(jìn)行取樣分析,每次每個(gè)關(guān)鍵點(diǎn)取樣3片為一個(gè)重復(fù),取10個(gè)重復(fù),每個(gè)樣本都進(jìn)行如下處理:從烤房中取樣,編號(hào),進(jìn)行高光譜數(shù)據(jù)采集,采集完高光譜數(shù)據(jù)后帶回實(shí)驗(yàn)室進(jìn)行干燥殺青及粉碎,運(yùn)用分光光度法測(cè)定葉綠素含量。
葉片光譜測(cè)量采用雙利合譜公司生產(chǎn)的GaiaSky—mini2光譜測(cè)定儀,這種探測(cè)器內(nèi)置石英鹵化燈,光源穩(wěn)定,波長測(cè)量范圍400~1 000 nm,光譜分辨率3.5 nm,測(cè)量時(shí)葉片置于密閉的采集光箱中標(biāo)定的固定位置,攤開葉片,在采集光譜數(shù)據(jù)時(shí),使光譜相機(jī)垂直向下,正對(duì)煙葉,且在測(cè)定時(shí)其距離烤煙煙葉的高度為1.6 m。每次測(cè)量前進(jìn)行標(biāo)準(zhǔn)白板校正,每次記錄3組數(shù)據(jù),最后以其平均值作為該樣本的光譜反射值。
采用分光光度法測(cè)定葉綠素含量[9],將進(jìn)行完光譜測(cè)定的煙葉帶回實(shí)驗(yàn)室進(jìn)行干燥殺青及粉碎,每個(gè)樣本做3個(gè)重復(fù),取其平均值作為該煙葉的葉綠素值和類胡蘿卜素值計(jì)算公式
Ca=13.95A665-6.80A649
Cb=24.96A649-7.32A665
式中:Ca——葉綠素a濃度,mg/L;
Cb——葉綠素b濃度,mg/L;
Cc——類胡蘿卜素濃度,mg/L;
A665——葉綠素提取液在波長為665 nm下的吸光度;
A649——葉綠素提取液在波長為649 nm下的吸光度;
A470——葉綠素提取液在波長為470 nm下的吸光度。
采用SpecView,ENVI5.3.1 整理光譜數(shù)據(jù),SPSS22.0,Excel進(jìn)行數(shù)據(jù)分析,Matlab 16b,Python3.6進(jìn)行模型構(gòu)建,最后對(duì)模型精度進(jìn)行評(píng)價(jià),比較各模型的決定系數(shù)、均方根誤差及均方誤差。
運(yùn)用分光光度法測(cè)定云煙87不同成熟度,不同烤煙烘烤溫度點(diǎn)色素含量,每個(gè)關(guān)鍵點(diǎn)色素含量取其平均值結(jié)果如表1揚(yáng)示??梢钥闯觯S著烘烤過程中溫度上升,烤煙葉片葉綠素含量隨之降低,其中,葉綠素含量在烘烤至40℃時(shí)降解速率最快,類胡蘿卜素先降低后升高,其中,類胡蘿卜素含量在烘烤至40℃時(shí)降低,40℃~45℃時(shí)升高。鮮煙葉葉片葉綠素含量揚(yáng)占的比例高于類胡蘿卜素,烘烤過程中葉綠素含量比例迅速降解,烘烤至45℃時(shí),類胡蘿卜素含量揚(yáng)占比例高于葉綠素。葉綠素含量于不同成熟度間與不同程度烘烤處理間差異顯著。對(duì)于不同成熟度烤煙葉片在烘烤過程中不同溫度點(diǎn)時(shí),葉綠素含量表現(xiàn)為:尚熟>成熟>完熟。
表1 云煙87不同成熟度,不同烤煙烘烤溫度點(diǎn)色素含量變化Tab.1 Changes in pigment content of Yunyan 87 with different maturity and different curing temperature points mg/L
圖1分別反映了烤煙在尚熟,成熟,完熟下隨著烘烤溫度的上升煙葉葉片光譜反射率的變化。由圖1可知,隨著烘烤過程中溫度的上升,各成熟度煙葉葉片光譜反射率間的差異表現(xiàn)較為明顯。3種不同成熟度的鮮煙葉光譜在400~480 nm的反射率都小于0.1,主要是煙葉葉綠素和類胡蘿卜素對(duì)紫外光和藍(lán)紫光的吸收,光線的投射和反射量很小,這個(gè)波段的反射率曲線較為平緩且反射率很低,400~700 nm可見光區(qū)域內(nèi),反射曲線呈現(xiàn)“一峰兩谷”的現(xiàn)象,在550 nm處出現(xiàn)波峰,此處為葉綠素的強(qiáng)反射區(qū),稱為“綠峰”。在近紅外波段(700~1 000 nm),各種處理及成熟度煙葉光譜反射率都較高,40℃烘烤煙葉光譜反射率在可見光譜區(qū)域內(nèi)高于鮮煙葉,45℃烘烤煙葉光譜反射率高于40℃烘烤煙葉,表明隨著烘烤溫度的上升,葉綠素含量逐漸降低,光譜反射率上升,不同成熟度烤煙光譜反射率隨溫度變化大致相同,但對(duì)于40℃與45℃的原始光譜反射率曲線區(qū)分不夠明顯。
圖1不同成熟度云煙87在不同烘烤溫度點(diǎn)高光譜反射率Fig.1 Hyperspectral reflectance of Yunyan 87 with different maturity levels at different baking temperatures
針對(duì)原始光譜曲線沒法直接區(qū)分40℃與45℃的烤煙葉片,對(duì)原始光譜曲線進(jìn)行一階導(dǎo)數(shù)求導(dǎo),其結(jié)果如圖2揚(yáng)示。由圖2可知,一階導(dǎo)數(shù)光譜曲線具有多峰現(xiàn)象,在可見光范圍內(nèi)具有明顯的峰值,峰值出現(xiàn)在490~510 nm,560~570 nm,580~720 nm等,而 在400~700 nm以及大波段范圍內(nèi),跳躍性較大,這是由一階導(dǎo)數(shù)的計(jì)算方法揚(yáng)決定的[10]。而處理這些峰的位置、大小,以及軸與峰之間揚(yáng)包圍的面積差異,是構(gòu)建光譜特征參數(shù)的依據(jù),對(duì)于尚熟的3條一階導(dǎo)數(shù)光譜曲線都在490~500 nm,690~700 nm出現(xiàn)波峰但波峰高度不同,可以明顯區(qū)分不同烘烤溫度點(diǎn)烘烤煙葉,從煙葉的一階微分光譜數(shù)值中提取位置變量,面積變量等光譜特征參數(shù)用于烤煙葉片葉綠素含量反演模型的構(gòu)建。
圖2 不同成熟度云煙87在不同烘烤溫度點(diǎn)一階導(dǎo)數(shù)光譜反射率Fig.2 First derivative spectral reflectance of Yunyan 87 with different maturity at different baking temperature points
連續(xù)投影算法[11](SPA)是一種新興的敏感波長選取算法,能夠從光譜信息中充分尋找含有最低限度的冗余信息的變量組,有效消除各種波長變量之間的共線性影響,使得變量之間的共線性達(dá)到最小,降低模型的復(fù)雜度。其簡便快速的特點(diǎn)得到越來越多的應(yīng)用,在多種樣品波長的選取中取得了很好的效果[12]。
本文使用ENVI軟件從不同成熟度,不同烘烤溫度點(diǎn)各選取10片煙葉高光譜圖像,共90張煙葉圖像,用ENVI5.3.1 軟件選取合適的感興趣區(qū)域Region of Interesting(ROI),如圖3揚(yáng)示,首先在每片煙葉圖像中隨機(jī)選擇3個(gè)感興趣區(qū)域(大小為1像素×1像素的正方形),然后提取每個(gè)感興趣區(qū)域內(nèi)光譜信息,最后將3個(gè)區(qū)域的光譜取平均值,得到對(duì)應(yīng)的1條原始光譜數(shù)據(jù),分別處理云煙87不同成熟度不同烘烤溫度點(diǎn)烘烤煙葉,每個(gè)烘烤溫度點(diǎn)處理10片烘烤煙葉,共得到90條煙葉光譜數(shù)據(jù)。
圖3 葉綠素的ROIFig.3 ROI of chlorophyll
將ENVI軟件提取出來的數(shù)據(jù)處理后輸入matlab R2016b,用SPA算法對(duì)ROI區(qū)域的平均光譜進(jìn)行篩選,SPA算法優(yōu)先選10個(gè)波長作為葉綠素含量的優(yōu)選波長組合,這些波段都是葉綠素信息區(qū)域波段,含有葉綠素的吸收峰,且此時(shí)的預(yù)測(cè)平均標(biāo)準(zhǔn)偏差最小,運(yùn)用這些波長建立多元線性回歸模型,運(yùn)算結(jié)果如圖4揚(yáng)示。根據(jù)云煙87不同成熟度不同烘烤溫度點(diǎn)煙葉篩選416 nm,420 nm,465 nm,648 nm,700 nm,775 nm,850 nm,875 nm,916 nm和935 nm作為特征波長。
圖4 SPA運(yùn)行結(jié)果Fig.4 SPA running results
2.5.1 SPA-BP,SPA-Ridge,SPA-LR模型
BP神經(jīng)網(wǎng)絡(luò)實(shí)質(zhì)上實(shí)現(xiàn)了一個(gè)從輸入到輸出的映射功能,數(shù)學(xué)理論證明三層的神經(jīng)網(wǎng)絡(luò)就能夠以任意精度逼近任何非線性連續(xù)函數(shù)。這使得其特別適合于求解內(nèi)部機(jī)制復(fù)雜的問題,即BP神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力。BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí),能夠通過學(xué)習(xí)自動(dòng)提取輸出、輸出數(shù)據(jù)間的“合理規(guī)則”,并自適應(yīng)的將學(xué)習(xí)內(nèi)容記憶于網(wǎng)絡(luò)的權(quán)值中,能很好的對(duì)光譜數(shù)據(jù)和理化值進(jìn)行擬合[13]。將SPA算法篩選出的10個(gè)特征波長數(shù)據(jù)作為輸入,建立SPA-BP模型進(jìn)行不同烘烤溫度點(diǎn)煙葉葉綠素含量的預(yù)測(cè)和驗(yàn)證[14]。訓(xùn)練樣本數(shù)據(jù)共48組,測(cè)試樣本數(shù)據(jù)24組,每組有10個(gè)特征變量,因此SPA-BP模型的輸入層、隱含層、輸出層的神經(jīng)節(jié)點(diǎn)各為48,10,1,用BP神經(jīng)網(wǎng)絡(luò)建模[15-16],其真實(shí)值與預(yù)測(cè)值對(duì)比結(jié)果如圖5(a)。
Ridge回歸模型是一種專用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì)法,Ridge回歸模型通過放棄最小二乘法的無偏性,避免部分光譜信息的損失從而提高精度來獲得回歸系數(shù),表明Ridge回歸是更為符合實(shí)際、更可靠的回歸方法[17-18]。
線性回歸(Linear Regression)[19]是線性回歸方程的最小平方函數(shù)對(duì)一個(gè)或多個(gè)自變量和因變量之間關(guān)系進(jìn)行建模的一種回歸分析方法,這種函數(shù)是一個(gè)或多個(gè)稱為回歸系數(shù)的模型參數(shù)的線性組合,只有一個(gè)自變量的情況稱為簡單回歸,大于一個(gè)自變量情況的叫做多元回歸。將SPA算法篩選出的10個(gè)特征波長數(shù)據(jù)作為輸入,建立SPA-Ridge模型和SPA-LR模型進(jìn)行不同烘烤溫度點(diǎn)煙葉葉綠素含量的回歸預(yù)測(cè),建立SPA-LASSO,SPA-LR模型,其真實(shí)值與預(yù)測(cè)值對(duì)比結(jié)果如圖5(b)。
圖5 模型結(jié)果Fig.5 Model results
通過分析圖5,表2可以看出,3種基于SPA連續(xù)投影算法的預(yù)測(cè)模型都能有效預(yù)測(cè)不同烘烤溫度點(diǎn)煙葉葉片葉綠素濃度,其中SPA-BP預(yù)測(cè)模型效果最好,R2為0.967,RMSE為0.101,SPA-LR預(yù)測(cè)模型次之,R2為0.956,SPA-Ridge預(yù)測(cè)模型最低,R2達(dá)到了0.916,由于LR和Ridge這類線性模型對(duì)原始數(shù)據(jù)中異常數(shù)據(jù)過于敏感,Ridge回歸進(jìn)行建模分析前會(huì)先原始數(shù)據(jù)進(jìn)行正則化處理,這會(huì)導(dǎo)致部分有效數(shù)據(jù)的丟失,因此SPA-Ridge模型的預(yù)測(cè)能力較SPA-BP模型的精度稍差。LR回歸雖未對(duì)原始數(shù)據(jù)進(jìn)行其他處理,但線性回歸魯棒性很差,受到個(gè)別數(shù)據(jù)噪點(diǎn)的影響很大,導(dǎo)致SPA-LR模型預(yù)測(cè)和測(cè)試表現(xiàn)很差。然而BP神經(jīng)網(wǎng)絡(luò)方法因?yàn)榉蔷€性映射能力和自適應(yīng)學(xué)習(xí)能力,從而SPA-BP預(yù)測(cè)效果要優(yōu)于線性方法,有更好的尋優(yōu)能力和預(yù)測(cè)精度。
表2 不同預(yù)測(cè)模型建模結(jié)果Tab.2 Modeling results of different prediction models
2.5.2 檢測(cè)結(jié)果驗(yàn)證
表3為煙葉葉片葉綠素含量反演值和參考值結(jié)果。
最后選取SPA-BP模型對(duì)剩余的24組烘烤葉片樣本進(jìn)行反演值和參考值的仿真驗(yàn)證。將24組煙葉葉片樣本的10個(gè)波段圖像的反射率代入反演模型計(jì)算出煙葉葉片葉綠素含量反演值。
參照趙紅寧等[20]運(yùn)用近紅外光譜法快速測(cè)定砂仁中的水分時(shí)判別模型穩(wěn)健性驗(yàn)證方法,以誤差率<0.1來判別實(shí)測(cè)值與預(yù)測(cè)值相等,其余表示不相等,則SPA-BP預(yù)測(cè)模型的準(zhǔn)確率為83.33%,SPA-Ridge預(yù)測(cè)模型的準(zhǔn)確率為70.83%,SPA-LR預(yù)測(cè)模型的準(zhǔn)確率為75%,基本符合對(duì)葉綠素含量的預(yù)測(cè)。
以貴州省貴陽市平壩區(qū)天龍實(shí)驗(yàn)基地烘烤煙葉為研究對(duì)象,在分析烘烤煙葉葉綠素含量與光譜反射率相關(guān)性的基礎(chǔ)上,選取能夠反映煙葉葉綠素差異的光譜參數(shù),分別采用SPA-BP,SPA-Ridge和SPALR3種方法建立了烘烤煙葉葉片葉綠素含量的預(yù)測(cè)模型,并對(duì)各種模型的預(yù)測(cè)精度進(jìn)行了比較,得到以下結(jié)論。
1)云煙87不同成熟度烘烤煙葉隨著烘烤過程中溫度上升,烤煙葉片葉綠素含量隨之降低,葉綠素含量于不同成熟度間與不同程度烘烤處理間差異顯著。對(duì)于不同成熟度烤煙葉片在烘烤過程中不同溫度點(diǎn)時(shí),葉綠素含量表現(xiàn)為:尚熟>成熟>完熟。
2)由不同烘烤煙葉原始光譜曲線表明:隨著烘烤溫度的上升,葉綠素含量逐漸降低,光譜反射率上升,不同成熟度烤煙光譜反射率隨溫度變化大致相同,對(duì)于40℃與45℃的原始光譜反射率曲線區(qū)分不夠明顯,而一階導(dǎo)數(shù)光譜反射率中,同一成熟度煙葉不同烘烤溫度點(diǎn)光譜曲線特征變化較大,3條曲線都在490~500 nm,690~700 nm等出現(xiàn)波峰但波峰高度不同,可以明顯區(qū)分不同烘烤溫度點(diǎn)烘烤煙葉。
3)通過SPA算法可對(duì)高光譜數(shù)據(jù)進(jìn)行特征波段篩選,實(shí)現(xiàn)數(shù)據(jù)的降維優(yōu)化,SPA算法篩選得出的部分特征波段具有較好的合理性,可為葉綠素高光譜監(jiān)測(cè)傳感器設(shè)計(jì)和反演機(jī)理研究提供參考。
4)分別用基于SPA算法的SPA-BP,SPARidge,SPA-LR3種預(yù)測(cè)模型預(yù)測(cè)不同烘烤溫度點(diǎn)煙葉葉片的葉綠素濃度,3種模型的R2分別為0.967,0.916,0.956,都能很好預(yù)測(cè)葉綠素含量,其中SPABP模型要優(yōu)于其他兩種模型,檢驗(yàn)SPA-BP模型時(shí),以誤差率<0.1來判別實(shí)測(cè)值與預(yù)測(cè)值相等,其余表示不相等,則SPA-BP預(yù)測(cè)模型的準(zhǔn)確率為83.33%,SPA-Ridge預(yù)測(cè)模型的準(zhǔn)確率為70.83%,SPA-LR預(yù)測(cè)模型的準(zhǔn)確率為75%,基本符合對(duì)葉綠素含量的預(yù)測(cè)。
中國農(nóng)機(jī)化學(xué)報(bào)2022年3期