劉貴珊,張 翀,樊奈昀,程麗娟,余江泳,袁瑞瑞
寧夏大學(xué)農(nóng)學(xué)院,寧夏 銀川 750021
鹽池灘羊是寧夏優(yōu)勢(shì)特色畜種,肉質(zhì)鮮嫩、 低脂無(wú)膻、 脂肪均勻[1]。嫩度是評(píng)價(jià)灘羊肉品質(zhì)極為重要的指標(biāo)之一[2],決定了肉在烹飪后的口感[3]。肉品嫩度的傳統(tǒng)檢測(cè)方法為WBS剪切儀,檢測(cè)過(guò)程復(fù)雜且破壞樣本,不能滿足肉品嫩度快速無(wú)損檢測(cè)的需求。近年來(lái),高光譜成像技術(shù)作為新型快速無(wú)損檢測(cè)手段,廣泛應(yīng)用于畜產(chǎn)品內(nèi)外部品質(zhì)的檢測(cè)[4-5],為肉品嫩度的快速無(wú)損檢測(cè)提供了理論依據(jù)[6-8]。高光譜成像技術(shù)中所采集的樣品光譜波段較多,這些波段不僅包含樣品信息還包含了大量的無(wú)用信息,如噪音、 背景干擾等,通常會(huì)優(yōu)選特征變量對(duì)原始光譜數(shù)據(jù)降維,提取有效信息,減少模型的運(yùn)算次數(shù),提高模型的預(yù)測(cè)精度。因此,特征變量的選擇對(duì)光譜數(shù)據(jù)分析和模型簡(jiǎn)化有著重要的意義。國(guó)內(nèi)外學(xué)者主要采用SPA[9]、 CARS[10]和VCPA[11]等常規(guī)算法來(lái)進(jìn)行特征變量選取,其弊端在于樣本中校正集出現(xiàn)變換或波動(dòng)時(shí),會(huì)影響集合內(nèi)變量的判斷,導(dǎo)致所構(gòu)建模型預(yù)測(cè)能力顯著降低,而IVISSA[12]算法在彌補(bǔ)這一缺陷的同時(shí)還可以最大限度的提取樣品的有效信息,保證變量特征信息的完整性,降低運(yùn)算次數(shù),提高預(yù)測(cè)模型的魯棒性。
以冷鮮灘羊肉為研究對(duì)象,利用高光譜成像系統(tǒng)采集圖譜信息,采用六種預(yù)處理方法對(duì)可見(jiàn)-近紅外和近紅外區(qū)域的波段進(jìn)行預(yù)處理,并采用SPA,CARS,VCPA和IVISSA算法進(jìn)行降維處理,比較以上算法提取出的特征波長(zhǎng)所構(gòu)建模型的預(yù)測(cè)效果,為鹽池灘羊肉品質(zhì)的在線快速無(wú)損檢測(cè)提供理論依據(jù)。
6月齡的鹽池灘羊背部最長(zhǎng)肌樣本213個(gè),采集于寧夏鹽池縣大夏牧場(chǎng)食品有限公司。
可見(jiàn)-近紅外高光譜(400~1 000 nm),采用美國(guó)Headwall公司生產(chǎn)的HyperSpec VNIR N型設(shè)備,光譜分辨率為2.8 nm,狹縫寬度為25 μm,狹縫長(zhǎng)度18 mm;CCD相機(jī)像素尺寸8.0 μm,光源為鹵素?zé)綦p線光源。
近紅外高光譜(900~1 700 nm),采用芬蘭Specimen公司的Imspector N17E-NIR型成像光譜儀,光譜分辨率5 nm,狹縫寬度30 μm,狹縫長(zhǎng)度9.6 mm,CCD型號(hào)為Models XC-130 100 Hz,混合像元尺寸30×30 pix,全幅幀數(shù)60幀·s-1,光源為Hyper-SIS系統(tǒng)功率,35 W,光通量3 200 lm的4個(gè)鹵素?zé)簟?/p>
TA-XTplus質(zhì)構(gòu)儀(英國(guó)SMS有限公司),刀具為HDP-BSW,厚度3 mm。
1.3.1 光譜采集
高光譜系統(tǒng)預(yù)熱半小時(shí)后進(jìn)行校準(zhǔn)和參數(shù)設(shè)定[13-14]。羊肉樣本暴露于室溫0.5 h,用紙巾擦去表面水分,放置于高光譜電控位移平臺(tái),進(jìn)行光譜掃描。使用ENVI4.8軟件提取樣本感興趣(1.5 cm×1.5 cm)。
1.3.2 嫩度測(cè)量
參照國(guó)標(biāo)NY/T 1180—2006 《肉嫩度的測(cè)定剪切力測(cè)定法》。
1.3.3 IVISSA算法
IVISSA算法[12]是從整體和個(gè)體兩個(gè)方面對(duì)波段進(jìn)行挑選。其中整體和個(gè)體分析采用波段的權(quán)重優(yōu)化,保證各個(gè)波段的間隔位置和寬度。設(shè)光譜數(shù)據(jù)為X,嫩度值為Y,樣品個(gè)數(shù)為n,波長(zhǎng)變量個(gè)數(shù)為p。其原理如下:
(1)采用權(quán)重二進(jìn)制矩陣采樣法(WBMS)將X進(jìn)行隨機(jī)組合,產(chǎn)生子數(shù)據(jù)集x(k×p),其中0 (2)將得到的子數(shù)據(jù)集x作為校正集模型進(jìn)行回歸分析; (4)重復(fù)(2)和(3)過(guò)程來(lái)變換波長(zhǎng)和權(quán)重值,當(dāng)所有子模型的RMSECV值和RMSEP值誤差不改變時(shí),權(quán)重結(jié)果為1的波長(zhǎng)構(gòu)成原始光譜數(shù)據(jù)的特征波長(zhǎng),運(yùn)行程序結(jié)束。 由圖1可知,可見(jiàn)-近紅外高光譜在450~550和700~800 nm之間存在兩個(gè)明顯的吸收峰,在700~800 nm之間樣本存在較強(qiáng)的反射率。近紅外高光譜在1 000~1 010 nm處出現(xiàn)一個(gè)較為明顯的吸收峰。兩個(gè)波段區(qū)域的大部分光譜曲線具有相同的趨勢(shì),但也存在極個(gè)別光譜曲線出現(xiàn)差異的現(xiàn)象,其原因可能是存在異常樣本或光譜掃描過(guò)程中噪音的影響。在900~1 000 nm波段中出現(xiàn)較為明顯的噪音波段,其原因可能是由于儀器噪音或者暗電流的影響。 圖1 灘羊肉樣本原始光譜曲線(a):400~1 000 nm;(b):900~1 700 nmFig.1 Original spectra of mutton samples(a):400~1 000 nm;(b):900~1 700 nm 由于光譜信息采集過(guò)程中,存在外界噪音等影響因素,導(dǎo)致某些光譜信息出現(xiàn)異常,故采用蒙特卡洛法剔除異常值。將剔除異常值的灘羊肉樣本采用SPXY(sample set partitioning based on joint x-y distances)法將按3∶1劃分為校正集樣本和驗(yàn)證集樣本。如表1所示:400~1 000 nm波段,校正集為152個(gè)樣本,驗(yàn)證集為50個(gè)樣本;1 000~1 700 nm波段,校正集為146個(gè)樣本,驗(yàn)證集為50個(gè)樣本。 表1 不同波段校正集與預(yù)測(cè)集灘羊肉的嫩度(單位:g)Table 1 Mutton tenderness of calibration and prediction in different bands(unit:g) 如表2所示,同種預(yù)處理方法所構(gòu)建的1 000~1 700 nm波段的PLSR模型效果均優(yōu)于400~1 000 nm波段(De-trending預(yù)處理方法除外),這是由于1 000~1 700 nm波段所采集光譜反映的是樣本的物理特性,更適用于嫩度模型的構(gòu)建。在1 000~1 700 nm波段所構(gòu)建的PLSR模型中,原始光譜的相關(guān)系數(shù)Rc值為0.83,Rp值為0.79,表明原始光譜所建立的灘羊肉嫩度模型更加穩(wěn)定和精確。預(yù)處理后所建立的灘羊肉嫩度模型效果變差的原因可能是原始光譜經(jīng)過(guò)預(yù)處理后其中某些光譜特征信息被覆蓋或者隱藏。 表2 不同預(yù)處理方法所建立的PLSR模型效果對(duì)比Table 2 Comparison of PLSR models established by different pretreatment methods 如圖2所示,在1 000~1 700 nm波段內(nèi)對(duì)原始光譜數(shù)據(jù)進(jìn)行降維處理。優(yōu)選過(guò)程中,RMSECV值逐漸減小,在第15個(gè)波段RMSECV最小為1 535.40,隨后小幅度增大。因此選用前15個(gè)波段建立PLSR模型,其優(yōu)選波段占228個(gè)總波段的7%。 圖2 SPA算法提取PLSR模型中的特征波長(zhǎng)Fig.2 Characteristic wavelength in PLSR model by SPA algorithm extraction 如圖3所示,采用CARS法提取特征波長(zhǎng),設(shè)定其運(yùn)行次數(shù)為1 000。圖3(a)為篩選特征變量數(shù)的過(guò)程,分為為兩部分,即第一階段快速減少(粗選)而第二階段非常緩慢(精選)。圖3(b)為RMSECV的變化趨勢(shì)圖,當(dāng)RMSECV值最小為1 164.31時(shí),挑選出16個(gè)特征波長(zhǎng),占228個(gè)總波段的6%。圖3(c)中每條線代表回歸系數(shù)的變化趨勢(shì),*號(hào)表示RMSECV最小的位置。 圖3 CARS算法在PLSR模型中波長(zhǎng)選擇過(guò)程Fig.3 Wavelength selection process in PLSR model by CARS algorithm VCPA法在1 000~1 700 nm原始光譜基礎(chǔ)上所提取的特征波長(zhǎng)共13個(gè),占總波段數(shù)的5%。其挑選過(guò)程中RMSECV值最小時(shí)為1 296.24;IVISSA算法在1 000~1 700 nm原始光譜基礎(chǔ)上所挑選的特征波長(zhǎng)個(gè)數(shù)為123個(gè),占總波段數(shù)的54%,其RMSECV最小值為1 211.19。IVISSA算法不僅降低了運(yùn)算次數(shù),而且還提高了模型性能。 圖4顯示在900~1 700 nm波段所構(gòu)建的PLSR灘羊嫩度預(yù)測(cè)模型結(jié)果,其中OS-IVISSA-PLSR模型效果最優(yōu),Rc=0.85,RMSEC=850.86,RMSECV=1 193.42,Rp=0.79,RMSEP=1 497.11。相對(duì)于王婉嬌[15]使用NIR高光譜成像技術(shù)檢測(cè)冷鮮羊肉嫩度的預(yù)測(cè)相關(guān)系數(shù)(Rp)提高了0.017。 圖4 灘羊肉樣本嫩度預(yù)測(cè)模型(a):OS-SPA-PLSR;(b):OS-CARS-PLSR;(c):OS-VCPA-PLSR;(d):OS-IVISSA-PLSRFig.4 Prediction Models of Tenderness in Tan mutton(a):OS-SPA-PLSR;(b):OS-CARS-PLSR;(c):OS-VCPA-PLSR;(d):OS-IVISSA-PLSR 如表3為SPA,CARS,VCPA和IVISSA四種算法選取特征波長(zhǎng)建立的PLSR模型。經(jīng)過(guò)對(duì)比,最優(yōu)模型為 IVISSA-PLSR。分析原因如下:(1)通過(guò)IVISSA提取出的特征波長(zhǎng)信息與嫩度值擬合度高,排除了樣本中無(wú)關(guān)光譜信息,使得預(yù)測(cè)性能更加優(yōu)越;(2)影響羊肉嫩度本身的因素有很多,如蛋白質(zhì)含量、 脂肪含量、 肉質(zhì)紋理和水分等,而通過(guò)前三種特征波長(zhǎng)算法所提取的特征波段可能排除了某一因素下的光譜信息,導(dǎo)致預(yù)測(cè)結(jié)果偏低。 表3 不同特征波長(zhǎng)提取方法所建立的PLSR模型效果對(duì)比Table 3 Performance comparison of PLSR models based on different wavelength extraction methods 利用可見(jiàn)-近紅外高光譜(400~1 000 nm)和近紅外高光譜(900~1 700 nm)系統(tǒng)采集了冷鮮灘羊肉原始光譜,經(jīng)過(guò)優(yōu)選預(yù)處理方法和最佳波段后,建立基于SPA,CARS,VCPA和IVISSA算法下的PLSR嫩度預(yù)測(cè)模型。結(jié)論如下: (1)近紅外高光譜的原始光譜模型的預(yù)測(cè)效果優(yōu)于可見(jiàn)-近紅外高光譜。 (2)在900~1 700 nm波段下,采用不同預(yù)處理方法建模,原始光譜模型效果最優(yōu),其Rc=0.83,Rp=0.79,RMSEC=874.94,RMSEP=1 465.9。 (3)900~1 700 nm波段的原始光譜經(jīng)SPA,CARS,VCPA和IVISSA四種方法所挑選出15,16,13和123個(gè)特征波長(zhǎng),占總波長(zhǎng)的7%,6%,5%和54%。 (4)與其他的變量選擇方法相比,IVISSA-PLSR模型的Rc=0.85,Rp=0.79,RMSEC=850.86,RMSEP=1 497.11,RMSECV=1 193.42,預(yù)測(cè)精準(zhǔn)度更高,模型穩(wěn)定性更好。結(jié)果表明,IVISSA是一種有效簡(jiǎn)化特征波長(zhǎng)的提取方法,可提高肉品嫩度模型的預(yù)測(cè)精度和魯棒性。2 結(jié)果與討論
2.1 原始光譜分析
2.2 樣本集劃分
2.3 預(yù)處理方法優(yōu)選
2.4 特征波長(zhǎng)提取
2.5 PLSR模型構(gòu)建
3 結(jié) 論