尚靜,黃人帥,張艷,張書琴,孟慶龍
(1. 貴陽學院食品與制藥工程學院,貴陽市,550005; 2. 貴陽學院農產品無損檢測工程研究中心,貴陽市,550005)
“貴長”獼猴桃產自貴州省修文縣,其果肉細嫩且多漿、果汁酸甜爽口,深受廣大消費者的青睞[1]。獼猴桃屬于后熟水果,為了延長果子貯藏時間,果農經常采摘還沒有完全成熟的果子,但是如果采摘太早,果子過于生硬不僅會影響口感而且果子容易受冷害[2]。
通常水果成熟度的傳統(tǒng)判別方法有:專業(yè)人員憑借經驗判別,或者通過測量水果的可溶性固形物含量(soluble solids content,SSC)來判別。然而這些方法的缺陷包括人工判別誤差較大,利用折射儀測量SSC不僅破壞樣本而且很難實現批量檢測。因此,開展水果成熟度的無損檢測對于指導確定采收時期以及采后貯藏具有非常重要的意義。近幾年,基于高光譜成像的快速無損檢測方法具有不破壞檢測對象、檢測速度快、無污染等諸多優(yōu)勢,受到國內外廣大科研學者的關注,已被廣泛地應用于水果品質的無損檢測領域[3-8]。目前,世界各地研究人員已開展了關于蘋果[9-10]、香蕉[11]、獼猴桃[5, 12-13]、桃子[14]、李子[15]、梨[16-17]以及草莓[18]等水果品質的無損檢測,并取得了一定的成果。Li等[7]利用高光譜成像技術結合線性判別分析(Linear discriminant analysis,LDA)構建了櫻桃成熟度識別模型,其正確識別率達到了96.4%。邵園園等[19]采用高光譜成像技術結合人工神經網絡實現了對肥城桃成熟度的預測,結果表明:基于前向選擇算法優(yōu)選的特征波長構建的識別模型對肥城桃成熟度的識別正確率為98.3%。而對于“貴長”獼猴桃成熟度的無損識別卻鮮有報道。
本文利用可見/近紅外高光譜成像系統(tǒng)采集不同成熟階段“貴長”獼猴桃的高光譜圖像;然后分別比較3種光譜預處理方法(二階導數、標準正態(tài)變換以及多元散射校正)對原始光譜的預處理效果;最后采用偏最小二乘判別分析(Partial Least Square Discrimination Analysis,PLS-DA)方法和簡化的K最近鄰法(Simplified K Nearest Neighbor,SKNN)構建判別“貴長”獼猴桃成熟度無損識別模型,以期為開發(fā)“貴長”獼猴桃成熟度的無損識別裝備奠定一定的理論基礎。
“貴長”獼猴桃于2019年9—10月采摘于貴州省修文縣龍關口獼猴桃果園,隨機從不同的果樹上采摘不同成熟階段(Ⅰ:9月17日采摘,Ⅱ:9月28日采摘,Ⅲ:10月7日采摘,Ⅳ:10月19日采摘)的獼猴桃果子,其SSC分布分別為Ⅰ:5.1%~5.5%,Ⅱ:5.6%~7.0%,Ⅲ:7.1%~9.0%,Ⅳ:9.1%~11.6%。每個成熟階段的獼猴桃果子采摘100個,共采摘400個完好無損的樣本。樣本采摘后馬上送到實驗室,用軟紙輕輕地擦掉樣本表面的灰塵,對其依次編號后,在室溫(22±2)℃條件下進行實驗。采用Kennard-Stone算法[20]將400個獼猴桃樣本按照3∶1的比例劃分為300個校正樣本集(每個成熟階段75個樣本)和100個預測樣本集(每個成熟階段25個樣本)。
高光譜成像系統(tǒng),型號為GaiaField-F-V10。系統(tǒng)結構框圖如圖1所示,其中,CCD相機的曝光時間為9.5 ms,樣本距離鏡頭大約40 cm。
圖1 高光譜成像系統(tǒng)框圖Fig. 1 Schematic diagram of hyperspectral imaging system1.計算機 2.溴鎢燈光源 3.暗箱 4.CCD相機 5.成像光譜儀 6.鏡頭 7.電動平移臺
折射儀,型號為ATAGO PAL-α,檢測范圍為0%~85%,檢測精度為±0.2%。
離心機,型號為TD4Z-WS,最高轉速為4 000 r/min,轉速精度為±30 r/min。
榨汁機,型號為JYZ-V911,額定轉速為50 r/min。
1.3.1 高光譜圖像采集與校正
將獼猴桃樣本依次放置于電動平移臺,逐個掃描樣本。獲取完所有樣本的高光譜圖像后,采集全白以及全黑的標定圖像Rwhite和Rblack,對所有獼猴桃樣本的高光譜圖像Roriginal進行反射率校正,得到校正后的高光譜圖像Rref,校正公式
(1)
1.3.2 獼猴桃SSC測定方法
在獲取完所有樣本的高光譜圖像后馬上測定其SSC,先將獼猴桃樣本榨汁后再離心(轉速3 000 r/min,離心時間5 min),再把獼猴桃汁涂抹在折射儀的折光棱鏡上,連續(xù)按測量鍵多次,當折射儀顯示屏最后3次顯示的值相同時記下該值,作為該樣本的SSC參考值。
1.3.3 建模方法
1) 光譜預處理方法。試驗分別運用二階導數(Second Derivative,SD)、標準正態(tài)變換(Standard Normal Variation,SNV)以及多元散射校正(Multi-scatter Calibration,MSC)對原始的光譜反射率數據進行預處理,以消除原始光譜中的噪聲信號。其中,SD方法用于消除線性背景偏移,通過對原始光譜數據求二階導數實現預處理;SNV方法用于校正因散射而引起的光譜誤差,使原始光譜數據標準正態(tài)化,即先將原始光譜減去該光譜數據的平均值,再除以該光譜數據的標準偏差;MSC方法可以有效地消除散射對光譜的影響,即先計算所有樣本光譜的平均光譜,然后將平均光譜作為標準光譜,每個樣本的光譜與標準光譜進行一元線性回歸,求得各光譜相對于標準光譜的斜率與截距,在每個樣本原始光譜中減去截距同時除以斜率,最終實現MSC校正。3種預處理方法的計算公式如式(2)~式(4)。
SD法的計算公式
2[A(v)]+A(v+Δv)+2[A(v+
2Δv)]}
(2)
式中:A(v)——SD法的原始光譜;
v——波數;
Δv——光譜數據的波數間隔。
SNV法的計算公式
(3)
式中:Zij——標準正態(tài)化后的光譜,i=1,2,…,n;
xij——SNV法的原始光譜;
Si——第i個樣本光譜數據的標準偏差;
n——樣本個數;
p——光譜點個數。
MSC法的計算公式
(4)
式中:Ai——第i個樣本的原始光譜;
Ai(MSC)——校正后的光譜;
2) 模式識別方法。分別運用偏最小二乘判別分析(Partial Least Square Discrimination Analysis,PLS-DA)方法以及簡化的K最近鄰法(Simplified K Nearest Neighbor,SKNN)構建獼猴桃成熟度無損識別模型,這兩種方法是模式識別中經常運用的有監(jiān)督統(tǒng)計模式識別方法[21]。其中,PLS-DA方法是將獼猴桃的光譜數據看作自變量X、獼猴桃的類別信息(成熟階段:Ⅰ、Ⅱ、Ⅲ、Ⅳ)作為因變量Y,Y是一個以0,1為元素的矩陣,當獼猴桃屬于某類成熟階段時,則該樣本在Y中對應列的元素值=1,否則為0。建模時分別將X與Y的每一列數據進行偏最小二乘回歸分析,進而獲得類別信息矩陣,最后依據該類別信息矩陣的每一列數據與1接近的程度判別獼猴桃樣本屬于哪類成熟階段。而SKNN方法是基于一種簡化的算法——類重心法構建的,即將校正集中每一類別(成熟階段:Ⅰ、Ⅱ、Ⅲ、Ⅳ)樣本點的重心求出,然后分析預測集樣本點與各類別重心的距離,當預測集樣本點距離哪一類別重心的距離最近,就屬于哪類成熟階段。
利用軟件Spectral SENS(Spectral Imaging Ltd.,Finland)采集所有獼猴桃樣本的高光譜圖像,采集獲得的獼猴桃高光譜圖像數據在ENVI 5.4(Research System Inc., USA),MATLAB R2016b等軟件中進行處理與分析。
圖2給出了不同成熟階段(成熟階段:Ⅰ、Ⅱ、Ⅲ、Ⅳ)‘貴長’獼猴桃的圖像。
圖2 不同成熟階段獼猴桃圖像Fig. 2 Images of different maturity kiwifruit
從圖2中可以看出,獼猴桃表皮顏色較深,且不同成熟階段的獼猴桃表皮顏色差異不明顯,僅通過外部圖像難以判別出獼猴桃的成熟度。因此,需要依據不同成熟階段獼猴桃的可溶性固形物含量以及光譜差異來識別獼猴桃的成熟度。
圖3給出了不同成熟階段(Ⅰ、Ⅱ、Ⅲ、Ⅳ)獼猴桃可溶性固形物含量統(tǒng)計分布圖,從圖3中可以看出,不同成熟階段獼猴桃可溶性固形物含量的平均值分別為Ⅰ:5.3%、Ⅱ:6.4%、Ⅲ:8.0%、Ⅳ:10.2%,即隨著獼猴桃的逐漸成熟,其可溶性固形物含量逐漸增大。圖4分別給出了4個成熟階段獼猴桃樣本的平均光譜曲線,從圖4可見,在波長675 nm附近具有一個吸收峰,該吸收峰是由獼猴桃表面葉綠素的吸收引起的,反映了獼猴桃表面顏色信息,在波長980 nm附近的吸收峰則是由水分的吸收引起的,體現了獼猴桃水分含量信息。進一步從圖4中可以看出,在630~690 nm、740~780 nm以及960~1 010 nm之間,不同成熟階段獼猴桃的光譜值存在差異,導致此光譜差異的主要原因是不同成熟階段的獼猴桃內部成分含量不同(可溶性固形物含量等)。因此,依據此光譜差異構建獼猴桃成熟度無損識別模型。
圖3 不同成熟階段獼猴桃可溶性固形物含量統(tǒng)計結果Fig. 3 Statistics results of soluble solids content of different maturity kiwifruit
圖4 不同成熟階段獼猴桃平均光譜Fig. 4 Average spectra of different maturity kiwifruit
由于原始反射光譜中包含一些噪聲,為了提升識別模型的精確度和穩(wěn)定性,分別運用SNV、MSC以及SD對原始的反射光譜數據進行預處理。圖5分別給出了所有獼猴桃樣本的原始反射光譜以及經過SNV、MSC和SD預處理后的相對反射光譜。對比圖5(a)與圖5(b)、圖5(c)、圖5(d)可以發(fā)現,預處理后的光譜曲線要比原始的光譜曲線平滑些,這說明光譜經過預處理消除了部分噪聲和背景干擾信息。
(a) 原始的光譜
(b) SNV預處理后的光譜
(c) MSC預處理后的光譜
(d) SD預處理后的光譜圖5 獼猴桃反射光譜Fig. 5 Reflectance spectra of kiwifruits
以PLS-DA判別模型為例,分別將經SNV、MSC以及SD預處理后的光譜數據作為自變量,樣本的類別信息(成熟階段:Ⅰ、Ⅱ、Ⅲ、Ⅳ)作為因變量,比較3種光譜預處理方法對原始光譜的預處理效果。表1給出了基于不同光譜預處理方法的識別模型對獼猴桃成熟度的識別結果,從表1可以得出,基于SD預處理后的光譜構建的識別模型對獼猴桃成熟度的正確識別率達到了100%,而基于SNV和MSC預處理后的光譜構建的識別模型的正確識別率最高為96%,說明SD預處理方法對樣本原始光譜的預處理效果相對較優(yōu)。
表1 基于不同光譜預處理方法的識別模型對獼猴桃成熟度的識別結果Tab. 1 Discriminant results of different models based on different spectra preprocessing methods
將經SD預處理后的光譜數據作為自變量,樣本的類別信息(成熟階段:Ⅰ、Ⅱ、Ⅲ、Ⅳ)作為因變量,比較兩種判別模型(PLS-DA、SKNN)對獼猴桃成熟度的識別效果。表2給出了不同識別模型對樣本的識別結果,從表2中可見,相比于SKNN識別模型對判別獼猴桃成熟度的正確識別率(98%),PLS-DA識別模型對判別獼猴桃成熟度的正確識別率高達100%。同時,圖6分別給出了PLS-DA和SKNN兩種識別模型對預測集中獼猴桃成熟度判別結果的混淆矩陣,從圖6中可以看出,PLS-DA識別模型對預測集中不同成熟階段的獼猴桃判別均正確,而SKNN識別模型對預測集中獼猴桃成熟階段Ⅲ中的2個樣本誤判為成熟階段Ⅰ,表明PLS-DA模型的性能要優(yōu)于SKNN模型。
表2 不同識別模型對樣本的識別結果Tab. 2 Discriminant results of different models
(a) PLS-DA
(b) SKNN圖6 識別模型的混淆矩陣Fig. 6 Confusion matrix for the recognition models
1) 以不同成熟階段的“貴長”獼猴桃為研究對象,利用可見/近紅外高光譜成像系統(tǒng)獲得所有樣本的高光譜圖像,并獲取整個獼猴桃樣本區(qū)域的光譜反射率,比較3種光譜預處理方法(SNV、MSC、SD)對原始光譜的預處理效果。最后采用偏最小二乘判別分析(PLS-DA)方法和簡化的K最近鄰法(SKNN)構建判別“貴長”獼猴桃成熟度無損識別模型。
2) 相對于SNV和MSC兩種光譜預處理方法,基于SD預處理后的相對反射光譜構建的PLS-DA識別模型對獼猴桃成熟度的正確識別率達到了100%,表明SD預處理方法具有相對較好的預處理效果。依據獼猴桃成熟度識別率及混淆矩陣,可以得出,構建的PLS-DA識別模型對獼猴桃成熟度的識別性能(正確識別率為100%)要優(yōu)于SKNN識別模型的識別性能(正確識別率為98%)。
3) “貴長”獼猴桃成熟度識別模型的建立為快速、無損檢測其成熟度提供了理論支撐,為開發(fā)“貴長”獼猴桃成熟度無損檢測裝備奠定一定的理論基礎。