周 竹, 鄭 劍, 王允祥, 曾松偉
(1.浙江農(nóng)林大學(xué) 信息工程學(xué)院,浙江臨安 311300;2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 臨安311300;3.浙江農(nóng)林大學(xué) 智慧農(nóng)林業(yè)研究中心,浙江 臨安 311300;4.浙江農(nóng)林大學(xué) 農(nóng)業(yè)與食品科學(xué)學(xué)院,浙江 臨安311300)
雷竹筍硬度的近紅外光譜檢測(cè)模型優(yōu)化
周 竹1,2,3, 鄭 劍4, 王允祥4, 曾松偉1,2,3
(1.浙江農(nóng)林大學(xué) 信息工程學(xué)院,浙江臨安 311300;2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 臨安311300;3.浙江農(nóng)林大學(xué) 智慧農(nóng)林業(yè)研究中心,浙江 臨安 311300;4.浙江農(nóng)林大學(xué) 農(nóng)業(yè)與食品科學(xué)學(xué)院,浙江 臨安311300)
為了提高應(yīng)用近紅外光譜技術(shù)無(wú)損檢測(cè)雷竹Phyllostachys violascens竹筍硬度的精度,研究了雷竹筍硬度光譜檢測(cè)模型的優(yōu)化方法。首先對(duì)雷竹筍原始光譜進(jìn)行正態(tài)變量變換(SNV),然后采用后向間偏最小二乘法(biPLS)去除部分與竹筍硬度無(wú)關(guān)的變量,隨后進(jìn)一步采用競(jìng)爭(zhēng)性自適應(yīng)權(quán)重法(CARS)剔除無(wú)關(guān)變量,最后采用連續(xù)投影算法(SPA)將光譜變量個(gè)數(shù)從1 557個(gè)減少為25個(gè)。最終,biPLS-CARS-SPA模型的交叉驗(yàn)證相關(guān)系數(shù)(rcv),預(yù)測(cè)相關(guān)系數(shù)(rp),交叉驗(yàn)證均方誤差(RMSECV)以及預(yù)測(cè)均方誤差(RMSEP)分別為0.984,0.926,0.300 N·cm-2和0.625 N· cm-2,優(yōu)于其他幾種常見的變量選擇方法及其組合。研究結(jié)果表明,biPLS-CARS-SPA方法所選特征變量避開了水分強(qiáng)吸收峰的影響,具有實(shí)際的物理表征意義,為竹筍硬度在線快速檢測(cè)、篩選和指導(dǎo)切削設(shè)備的研發(fā)提供了重要的理論依據(jù)。圖6表3參20
經(jīng)濟(jì)林學(xué);近紅外光譜;后向間隔偏最小二乘法;競(jìng)爭(zhēng)性自適應(yīng)權(quán)重法;連續(xù)投影算法;硬度;雷竹筍
雷竹Phyllostachys violascens竹筍營(yíng)養(yǎng)豐富,是一種低糖、低脂、高蛋白、高纖維的綠色保健食品。硬度是竹筍品質(zhì)評(píng)價(jià)的重要指標(biāo),常被用于評(píng)判竹筍成熟度及采摘時(shí)間,并對(duì)其采后存儲(chǔ)、保鮮以及分類深加工具有很高的參考價(jià)值。目前,竹筍硬度的檢測(cè)主要采用感官評(píng)定和質(zhì)構(gòu)儀測(cè)定。其中,感官評(píng)定主觀性強(qiáng)、重復(fù)性差。而質(zhì)構(gòu)儀方法雖然能準(zhǔn)確評(píng)定竹筍硬度,但處理程序復(fù)雜,操作繁瑣,檢測(cè)速度慢且具有破壞性,無(wú)法滿足竹筍在儲(chǔ)藏及加工過程中的快速檢測(cè)需要。近紅外光譜技術(shù)(NIRS)因其快速、無(wú)損的優(yōu)點(diǎn),在肉類[1-2]、果蔬[3-6]等農(nóng)產(chǎn)品品質(zhì)檢測(cè)中得到了廣泛的研究。在農(nóng)產(chǎn)品硬度檢測(cè)方面,國(guó)內(nèi)外學(xué)者已對(duì)蘋果Malus pumila[7-9],梨Pyrus spp.[10-11],芒果Mangifera indica[12],獼猴桃Actinidia chinensis[13]等進(jìn)行了相關(guān)研究,這為本研究提供了借鑒。目前,NIRS技術(shù)在竹筍硬度無(wú)損檢測(cè)方面的研究較少。前人[14]的研究表明:硬度是一個(gè)與物質(zhì)密度、細(xì)胞結(jié)構(gòu)和組織結(jié)構(gòu)有關(guān)的復(fù)雜的綜合物理指標(biāo)。與硬度有關(guān)的有機(jī)物主要是果膠、纖維素等物質(zhì),與水分含量相比,這些物質(zhì)在待測(cè)農(nóng)產(chǎn)品中的含量極少,因此,水的強(qiáng)吸收會(huì)掩蓋果膠、纖維素等物質(zhì)的吸收,從而影響待測(cè)農(nóng)產(chǎn)品硬度近紅外光譜模型的性能。通過對(duì)竹筍光譜進(jìn)行變量選擇,從而對(duì)竹筍硬度模型進(jìn)行優(yōu)化是提高硬度光譜檢測(cè)模型性能的重要途徑。本研究提出采用后向間偏最小二乘法(BiPLS)結(jié)合競(jìng)爭(zhēng)性自適應(yīng)權(quán)重法(CARS)以及連續(xù)投影算法(SPA)對(duì)雷竹筍硬度近紅外光譜進(jìn)行變量選擇,并與一些常見的變量選擇方法及其組合進(jìn)行了比較,為快速準(zhǔn)確建立竹筍硬度的近紅外光譜模型提供了一種新的方法。
1.1 竹筍樣本制備
本研究所用的雷竹筍來自浙江省臨安市天目山區(qū),所有竹筍長(zhǎng)度均高于30 cm,基部直徑大于5 cm。為了方便光譜采集,用打孔器在雷竹筍的節(jié)間進(jìn)行打孔取樣,共獲取直徑15 mm,厚度為10 mm的樣品113個(gè)。將竹筍標(biāo)號(hào)放置在4℃冰柜中保存待用。試驗(yàn)前,將待測(cè)竹筍樣本從冰柜中取出置于室溫(22℃)環(huán)境中一段時(shí)間,使待測(cè)竹筍與室溫平衡。
1.2 光譜采集
近紅外漫反射光譜采集儀器為AntarisⅡ傅里葉變換近紅外光譜儀(Thermo Scientific Co.,美國(guó))。通過漫反射式積分球附件進(jìn)行光譜采集。掃描波長(zhǎng)范圍為800~2 632 nm,掃描次數(shù)64次,分辨率8 cm-1。待測(cè)樣品放置于帶有樣品固定仿形膠墊的光譜儀承載臺(tái)上,并使樣品的外表面正對(duì)光譜儀通光孔。采集時(shí)樣品旋轉(zhuǎn)120°·次-1,將3次采集的平均光譜作為該樣品的原始光譜。圖1給出了試驗(yàn)樣本的原始光譜圖。由圖1可知:在光譜采集范圍內(nèi)的首端與末端光譜信噪比較低,結(jié)合前期預(yù)試驗(yàn)的計(jì)算分析,選擇1 000~2 500 nm波段內(nèi)的光譜進(jìn)行后續(xù)分析建模。
圖1 雷竹筍原始光譜Figure 1 Spectra of bamboo shoots(Phyllostachys violascens)
1.3 硬度測(cè)定
竹筍樣品的硬度根據(jù)國(guó)家標(biāo)準(zhǔn)(GB/T 8855-2008新鮮水果和蔬菜取樣方法)測(cè)定。光譜采集后,在對(duì)應(yīng)的光譜采集位置采用TA-XT2i質(zhì)構(gòu)儀(Stable Micro System Ltd,英國(guó))進(jìn)行硬度測(cè)量。測(cè)試探頭采用的是直徑2 mm的鋼制針狀壓頭P2N,探頭測(cè)試深度為5 mm,貫入速度為2 mm·s-1。以3個(gè)測(cè)試點(diǎn)的硬度平均值作為該樣本最終的硬度值。
采用蒙特卡羅采樣算法[15]剔除5個(gè)異常樣本,然后將108個(gè)樣本依濃度梯度法劃分為校正集和測(cè)試集。雷竹筍硬度的統(tǒng)計(jì)描述參數(shù)如表1所示。
表1 雷竹筍硬度的統(tǒng)計(jì)描述參數(shù)Table1 Descriptive statistic data of bamboo shoots
1.4 模型優(yōu)化方法及評(píng)價(jià)
我們提出采用基于區(qū)域的波長(zhǎng)選擇方法和基于單個(gè)變量的波長(zhǎng)選擇方法組合使用來對(duì)雷竹筍硬度檢測(cè)的近紅外光譜模型進(jìn)行優(yōu)化。涉及的算法主要包括后向區(qū)間偏最小二乘法(biPLS),競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(CARS)以及連續(xù)投影算法(SPA)。biPLS是建立在間隔偏最小二乘法(iPLS)基礎(chǔ)上的一種基于區(qū)域的變量選擇方法。該方法將全波段范圍劃分為k個(gè)等寬的子區(qū)間,去掉子區(qū)間1個(gè)·次-1,在剩余的區(qū)間內(nèi)計(jì)算各個(gè)組合區(qū)間的偏最小二乘回歸模型,然后將交叉驗(yàn)證均方誤差(RMSECV)值最小的組合模型時(shí)所去掉的子區(qū)間作為第一去掉子區(qū)間,重復(fù)上述操作直至程序運(yùn)行結(jié)束。最后比較各組合模型的交叉驗(yàn)證均方誤差RMSECV值,以RMSECV值最小對(duì)應(yīng)的區(qū)間組合作為最優(yōu)區(qū)間組合[16]。CARS算法由Liang等提出,該算法模仿達(dá)爾文進(jìn)化論中 “適者生存”思想,將每個(gè)變量看成一個(gè)個(gè)體,通過自適應(yīng)重加權(quán)采樣技術(shù)對(duì)變量實(shí)施逐步淘汰。在此過程中還引入了指數(shù)衰減函數(shù)來控制變量的保留率,計(jì)算效率高,適用于高維數(shù)據(jù)的變量選擇[17]。SPA也是一種基于單個(gè)變量的波長(zhǎng)選擇方法。該方法能夠利用向量的投影分析,尋找含有最低限度冗余信息的變量組合,并使變量之間的共線性程度最低,從而提高建模速度與模型性能[18]。biPLS,CARS和SPA算法的原理分別見文獻(xiàn)[16-18]。
采用偏最小二乘法(PLS)建立最終模型,模型中因子數(shù)由交叉驗(yàn)證法確定。模型的評(píng)價(jià)指標(biāo)包括交叉驗(yàn)證相關(guān)系數(shù)rcv,預(yù)測(cè)相關(guān)系數(shù)rp,交叉驗(yàn)證均方誤差RMSECV以及預(yù)測(cè)均方誤差RMSEP。rcv和rp越接近1,以及RMSECV和RMSEP越低,則模型的預(yù)測(cè)能力和穩(wěn)定性越好。上述各種算法以及最終模型的建立與評(píng)價(jià)均通過MATLAB 2010(The Math Works,美國(guó))軟件完成。
2.1 預(yù)處理方法的確定
表2 基于不同預(yù)處理方法處理的建模和預(yù)測(cè)結(jié)果Table2 Performance of firmness models with different preprocessing methods
受儀器、樣品以及光譜采集環(huán)境等因素的影響,近紅外光譜中常出現(xiàn)噪聲、譜圖基線漂移和平移等現(xiàn)象。為了消除這些不利因素對(duì)模型的影響,應(yīng)對(duì)原始光譜(none)進(jìn)行預(yù)處理。采用標(biāo)準(zhǔn)正態(tài)變量變換(SNV),去趨勢(shì)變換(detrend),一階導(dǎo)數(shù)(FD),二階導(dǎo)數(shù)(SD)等方法對(duì)原始光譜進(jìn)行預(yù)處理并建立PLS模型,結(jié)果如表2所示。由表2可知:標(biāo)準(zhǔn)正態(tài)變量變換預(yù)處理建立的PLS模型最優(yōu),該模型的rcv,rp分別從無(wú)預(yù)處理時(shí)的0.920,0.895提高到0.928,0.901;RMSECV和RMSEP則分別從無(wú)預(yù)處理時(shí)的0.653 N·cm-2,0.739 N·cm-2下降為0.619 N·cm-2,0.718 N·cm-2。此外,建模所用因子數(shù)也從19減少到18。而其他預(yù)處理方法的改善效果不佳。這表明SNV預(yù)處理有利于減弱因竹筍樣本表面不平引起的噪聲干擾。可以增強(qiáng)模型的預(yù)測(cè)能力和穩(wěn)健性。因此,在下文均采用SNV處理后的光譜進(jìn)行分析。
2.2 基于biPLS的模型簡(jiǎn)化
biPLS方法中,由于光譜區(qū)間的劃分無(wú)相應(yīng)的理論依據(jù),且劃分的區(qū)間越多,所需計(jì)算時(shí)間也越長(zhǎng),考慮到雷竹筍硬度定量分析中波長(zhǎng)變量為1 557個(gè),采用試探法依次將全波段劃分為6~50個(gè)區(qū)間,以RMSECV值最小來確定最優(yōu)的區(qū)間劃分。經(jīng)過計(jì)算分析,當(dāng)將整個(gè)光譜波段劃分為48個(gè)區(qū)間時(shí),所建模型的RMSECV值最小。圖2為竹筍硬度biPLS方法的特征波長(zhǎng)選擇結(jié)果,圖中被填充的波段區(qū)間為被選中的波段區(qū)間,對(duì)應(yīng)的波段范圍為 1 129.239~1 145.200 nm,1 162.661~1 179.588 nm,1 198.121~1 216.104 nm,1 235.811~1 254.952 nm,1 297.015~1 318.115 nm,1 437.213~1 462.343 nm,1 490.078~1 517.105 nm,1 710.247~1 745.947 m,1 825.867~1 910.636 nm,2 290.400~2 354.892 nm,共包含357個(gè)波長(zhǎng)變量。采用PLS方法建模,依據(jù)RMSECV最小確定最優(yōu)的因子數(shù)為19,應(yīng)用該模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),模型的rcv,rp,RMSECV和RMSEP分別為0.963,0.913,0.451 N·cm-2和0.675 N·cm-2。與全波段光譜模型相比,biPLS模型采用的波長(zhǎng)點(diǎn)由1 557減少到了357個(gè),在保證精度的前提下簡(jiǎn)化了模型。
2.3 基于biPLS-CARS的模型二次簡(jiǎn)化
盡管通過biPLS算法剔除了大量與雷竹筍硬度檢測(cè)無(wú)關(guān)的信息,且提高了模型性能。然而,biPLS作為一種光譜變量區(qū)域選擇方法,在入選的區(qū)間內(nèi),相鄰的變量之間仍具有高相關(guān)性。采用CARS法對(duì)biPLS處理后的357個(gè)光譜變量進(jìn)行變量選擇,圖3描述了具體的選擇過程。其中:圖3a為所選變量數(shù)隨采樣次數(shù)的變化趨勢(shì),所選變量數(shù)隨采樣次數(shù)的增加由快到慢遞減,體現(xiàn)出粗選與精選2個(gè)階段;圖3b為10折交叉驗(yàn)證所得RMSECV的變化趨勢(shì)圖,在1~132次采樣建模中,RMSECV呈現(xiàn)遞減趨勢(shì),表明剔除了與雷竹筍硬度檢測(cè)無(wú)關(guān)的變量,133次采樣建模以后RMSECV開始遞增,則可能剔除了雷竹筍硬度檢測(cè)的關(guān)鍵變量;圖3c中各線表示隨著采樣次數(shù)增加,各光譜變量的回歸系數(shù)的變化趨勢(shì),“*”標(biāo)示出最小RMSECV所對(duì)應(yīng)的采樣次數(shù)。最終,CARS法選擇了29個(gè)光譜變量。利用這些光譜變量的數(shù)據(jù)建立PLS模型,因子數(shù)為14,模型的rcv,rp,RMSECV和RMSEP分別為0.983,0.926,0.306 N· cm-2和0.628 N·cm-2。biPLS-CARS模型所用變量數(shù)僅為全波段變量數(shù)的1.863%,但模型的性能卻比全波段模型有了提高。
圖2 biPLS算法選擇的最優(yōu)區(qū)間組合Figure 2 Optimal spectral region selected by biPLS
圖3 CARS算法的變量選擇過程Figure 3 Plot of CARS for variable selection
2.4 基于biPLS-CARS-SPA的模型三次簡(jiǎn)化
經(jīng)過biPLS-CARS變量選擇后,變量個(gè)數(shù)從全波段時(shí)的1 557個(gè)減少為29個(gè),然而,光譜變量仍有進(jìn)一步減少的空間。SPA利用向量的投影分析,尋找含有最低限度冗余信息且共線性最小的變量組合,可以減少建模所用變量數(shù),提高建模的速度和性能。
圖4給出了SPA方法下不同個(gè)數(shù)變量建模的RMSCEV值的變化情況。從圖4中可以看出:當(dāng)變量個(gè)數(shù)從1個(gè)增加到23個(gè)時(shí),RMSCEV值下降較快。當(dāng)變量個(gè)數(shù)為25時(shí),RMSCEV值最小。利用所選25個(gè)光譜變量的數(shù)據(jù)建立PLS模型,模型的因子數(shù)為14,校正集的rcv,RMSCEV分別為0.984,0.300 N·cm-2,測(cè)試集的rp,RMSEP分為0.926,0.625 N·cm-2。模型對(duì)樣本預(yù)測(cè)值和真實(shí)測(cè)量值之間的散點(diǎn)圖如圖5所示。與biPLS-CARS方法相比,該模型采用的波長(zhǎng)個(gè)數(shù)又減少了4個(gè),且模型的性能再次得以提升。
圖4 SPA算法中變量個(gè)數(shù)與RMSECV的對(duì)應(yīng)關(guān)系Figure 4 RMSECV versus number of variables in SPA
圖5 biPLS-CARS-SPA-PLS模型的實(shí)測(cè)值和預(yù)測(cè)值的散點(diǎn)圖Figure 5 Reference measurement versus predicted values by biPLS-CARS-SPA-PLS
2.5 結(jié)果比較與分析
為了說明biPLS-CARS-SPA方法在雷竹筍硬度近紅外光譜檢測(cè)模型優(yōu)化方面的優(yōu)越性,將biPLSCARS-SPA方法所建模型分別與組合區(qū)間偏最小二乘法(siPLS)[16],遺傳算法(GA)[19],蒙特卡洛無(wú)信息變量消除法(MCUVE)[20],CARS,SPA等方法單獨(dú)或組合作用下所建模型進(jìn)行比較,比較的結(jié)果如表3所示。從表3可以看出:相比于siPLS,GA,MCUVE,CARS,SPA等方法的單獨(dú)或組合作用,biPLSCARS-SPA方法建模所需變量最少,模型的預(yù)測(cè)精度最高,模型優(yōu)化效果最好。
表3 基于不同變量選擇方法及建模方法的建模和預(yù)測(cè)結(jié)果Table3 Performance of model based on different spectra variable selection
圖6給出了雷竹的原始光譜以及文中各種方法選擇的變量分布情況。據(jù)文獻(xiàn)[20]報(bào)道,竹筍中與硬度有關(guān)的物質(zhì)主要是果膠、纖維素、半纖維素等,這些物質(zhì)的特征官能團(tuán)主要有C—H,O—H以及C——O。從圖6中可以看到:雷竹筍在近紅外光譜區(qū)的主要吸收峰位于1 190 nm,1 450 nm和1 940 nm附近,這些吸收峰主要是由水的吸收所導(dǎo)致的。其中1 190 nm附近為O—H的合頻吸收峰,1 450 nm附近為O—H伸縮振動(dòng)的一級(jí)倍頻吸收峰,1 940 nm附近則是O—H伸縮振動(dòng)的二級(jí)倍頻吸收峰。由于果膠和纖維素成分含量在筍中相對(duì)較低,而水分含量較高(達(dá)90%),水在近紅外區(qū)的強(qiáng)烈吸收掩蓋了果膠、纖維素等物質(zhì)的吸收,這就要求必須進(jìn)行雷竹筍硬度模型的優(yōu)化研究。
圖6 不同優(yōu)化方法的變量選擇分布Figure 6 Selection of variables distribution of different variable selection methods
在基于biPLS算法的模型簡(jiǎn)化算法選擇過程中,分別采用biPLS,siPLS,GA,CARS,MCUVE算法對(duì)SNV預(yù)處理的雷竹筍光譜進(jìn)行變量?jī)?yōu)選時(shí),上述5種算法選擇的波長(zhǎng)區(qū)間具有一定的相似性,其中,biPLS,GA,CARS,MCUVE算法均選擇了1 100~1 200 nm,1 420~1 500 nm,1 720~1 780 nm,1 805~1 940 nm,2 290~2 360 nm范圍內(nèi)的幾個(gè)或多個(gè)波長(zhǎng)點(diǎn)。在這些波長(zhǎng)變量中,1 152 nm附近為果膠中甲基(—CH3)伸縮振動(dòng)的二級(jí)倍頻吸收帶,1 440 nm附近為C—H伸縮振動(dòng)的一級(jí)倍頻吸收帶,1 450 nm附近為O—H伸縮振動(dòng)的一級(jí)倍頻帶,1 490 nm附近為纖維素中O—H伸縮振動(dòng)的一級(jí)倍頻吸收帶,1 780 nm附近為纖維素中C—H伸縮振動(dòng)的一級(jí)倍頻吸收帶,2 280 nm附近為果膠中甲基(—CH3)伸縮振動(dòng)及變形振動(dòng)的合頻吸收帶,1 820 nm附近為纖維素中O—H伸縮振動(dòng)、C——O伸縮振動(dòng)的一級(jí)倍頻吸收帶,2 336 nm為纖維素中C—H的伸縮振動(dòng)及變形振動(dòng)的組合頻吸收帶,2 352 nm則為纖維素中C—H伸縮振動(dòng)的二級(jí)倍頻吸收帶[21]。由于這些方法均選擇了與竹筍硬件檢測(cè)相關(guān)的波段組合并且去掉了一些無(wú)關(guān)變量,因此所建模型的性能均優(yōu)于全光譜模型。然而,SPA方法選擇了過多的無(wú)關(guān)變量(雷竹筍光譜的首端與尾端),其建模效果最差。而siPLS方法未將果膠中與甲基(—CH3)有關(guān)的波段選入,其模型的性能也較差。CARS,UVE和GA等選擇的變量個(gè)數(shù)要少于biPLS,但由于他們或多或少的丟失了一些與雷竹筍硬度檢測(cè)相關(guān)的關(guān)鍵變量,因此所建模型的性能仍然要低于采用357個(gè)變量建模的biPLS模型。
基于biPLS-CARS算法對(duì)模型進(jìn)行二次簡(jiǎn)化。由于biPLS方法作為一種區(qū)域變量選擇方法,在區(qū)域內(nèi)的相鄰波長(zhǎng)之間仍然有一定的相關(guān)性。采用CARS,SPA,MCUVE,GA算法對(duì)biPLS處理的光譜進(jìn)行二次變量選擇,CARS方法選擇的變量數(shù)最少,僅為29個(gè),而SPA,MCUVE和GA方法選擇的變量數(shù)均超過了70個(gè),關(guān)鍵變量的丟失以及相鄰波長(zhǎng)點(diǎn)之間的強(qiáng)相關(guān)性導(dǎo)致MCUVE,SPA方法所建模型的性能比全光譜模型的性能還差。雖然GA所建模型性能較好,僅略低于CARS方法所建模型性能,但是所用變量個(gè)數(shù)(94個(gè))卻遠(yuǎn)多于CARS方法(29個(gè))。CARS方法保留了最多的與雷竹筍硬度檢測(cè)相關(guān)的變量,較大程度去掉了無(wú)關(guān)變量,其模型性能最好。
在基于biPLS-CARS-SPA的模型3次簡(jiǎn)化過程中,采用SPA方法對(duì)biPLS-CARS處理后的變量進(jìn)一步進(jìn)行變量選擇,變量個(gè)數(shù)從29個(gè)減少為25個(gè),所選變量波長(zhǎng)分布如圖6所示。從圖6中可以看到:biPLS-CARS-SPA所選波長(zhǎng)位于或接近雷竹筍硬度相關(guān)物質(zhì)特征官能團(tuán)吸收頻帶,且避開了水的強(qiáng)吸收波段如1 190 nm,1 940 nm,減小了水分對(duì)雷竹筍硬度檢測(cè)模型的影響。biPLS-CARS-SPA模型所用變量?jī)H為全部變量的1.605%,模型的rcv,rp卻比全光譜模型提高5.957%,2.762%,RMSECV以及RMSEP分別降低了51.543%,13.002%。biPLS與CARS以及SPA變量選擇方法的組合使用,表明在采用近紅外光譜對(duì)雷竹筍硬度建模時(shí),有必要在SPA計(jì)算之前對(duì)全波段光譜變量進(jìn)行biPLS與CARS的組合變量選擇,以最大程度減少冗余變量,從而提高模型性能。
該研究利用近紅外光譜技術(shù)快速檢測(cè)雷竹筍的硬度并開展了模型的優(yōu)化研究。在模型優(yōu)化過程中,用后向間偏最小二乘法結(jié)合競(jìng)爭(zhēng)性自適應(yīng)權(quán)重法與連續(xù)投影算法(biPLS-CARS-SPA)對(duì)雷竹筍硬度近紅外光譜進(jìn)行特征光譜區(qū)域和特征波長(zhǎng)的選取。結(jié)果表明:與其他模型優(yōu)化方法相比,biPLS-CARS-SPA方法顯示出明顯的優(yōu)越性,不僅能有效減少建模所用變量個(gè)數(shù),而且保留的特征波長(zhǎng)避開了水分的影響,具有實(shí)際的物理表征意義。biPLS-CARS-SPA模型建立所用變量個(gè)數(shù)為25,因子數(shù)為14,模型的rcv,rp,RMSECV和RMSEP分別為0.984,0.926,0.300和0.625 N·cm-2,模型的復(fù)雜度降低且預(yù)測(cè)精度顯著提高,具有很高的實(shí)用價(jià)值。
[1] 程旎,李小昱,趙思明,等.魚體新鮮度近紅外光譜檢測(cè)方法的比較研究[J].食品安全質(zhì)量檢測(cè)學(xué)報(bào),2013,4(2):427-432.
CHENG Ni,LI Xiaoyu,ZHAO Siming,et al.Comparison of the methods to detect fish freshness based on nearinfrared technology[J].J Food Saf Qual,2013,4(2):427-432.
[2] 湯修映,牛力釗,徐楊,等.基于可見/近紅外光譜技術(shù)的牛肉含水率無(wú)損檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(11):248-254.
TANG Xiuying,NIU Lizhao,XU Yang,et al.Nondestructive determination of water content in beef using visible/nearinfrared spectroscopy[J].Trans Chin Soc Agric Eng,2013,29(11):248-254.
[3] 李小昱,陶海龍,高海龍,等.基于多源信息融合技術(shù)的馬鈴薯痂瘡病無(wú)損檢測(cè)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(19):277-284.
LI Xiaoyu,TAO Hailong,GAO Hailong,et al.Nondestructive detection method of potato scab based on multisensorinformation fusion technology[J].Trans Chin Soc Agric Eng,2013,29(19):277-284.
[4] 劉潔,李小昱,李培武,等.基于近紅外光譜的板栗水分檢測(cè)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(2):338-341.
LIU Jie,LI Xiaoyu,LI Peiwu,et al.Determination of moisture in chestnuts using near infrared spectroscopy[J].Trans Chin Soc Agric Eng,2010,26(2):338-341.
[5] 介鄧飛,謝麗娟,饒秀勤,等.近紅外光譜變量篩選提高西瓜糖度預(yù)測(cè)模型精度[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(12):264-270.
JIE Dengfei,XIE Lijuan,RAO Xiuqin,et al.Improving accuracy of prediction model for soluble solids content of watermelon by variable selection based on near-infrared spectroscopy[J].Trans Chin Soc Agric Eng,2013,29(12): 264-270.
[6] 周萬(wàn)懷,謝麗娟,應(yīng)義斌.全光譜匹配算法在蘋果分類識(shí)別中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(19):285-292.
ZHOU Wanhuai,XIE Lijuan,YING Yibin.Application of full spectral matching algorithm in apple classification[J].Trans Chin Soc Agric Eng,2013,29(19):285-292.
[7] 李桂峰,趙國(guó)建,劉興華,等.蘋果硬度的傅里葉變換近紅外光譜無(wú)損檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(1):120-123.
LI Guifeng,ZHAO Guojian,LIU Xinghua,et al.Using FT-NIR spectra in non-invasive measurement of apple firmness[J].Trans Chin Soc Agric Mach,2009,40(1):120-123.
[8] FAN Guoqiang,ZHA Jianwen,DU Ran,et al.Determination of soluble solids and firmness of apples by Vis/NIR transmittance[J].J Food Eng,2009,93(4):416-420.
[9] BLANKE M M.Non-invasive assessment of firmness and NIR sugar(TSS)measurement in apple,pear and kiwi fruit[J].Erwerbs-Obstbau,2013,55(1):19-24.
[10] LI Jiangbo,HUANG Wenqian,ZHAO Chunqiang,et al.A comparative study for the quantitative determination of soluble solids content,pH and firmness of pears by Vis/NIR spectroscopy[J].J Food Eng,2013,116(2):324-332.
[11] VALENTE M,LEARDI R,SELF G,et al.Multivariate calibration of mango firmness using vis/NIR spectroscopy and acoustic impulse method[J].J Food Eng,2009,94(1):7-13.
[12] 劉卉,郭文川,岳絨.獼猴桃硬度近紅外漫反射光譜無(wú)損檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2011,42(3):145-149.
LIU Hui,GUO Wenchuan,YUE Rong.Nond-estructive detection of kiwifruit firmness based on near-infrared diffused spectroscopy[J].Trans Chin Soc Agric Mach,2011,42(3):145-149.
[13] 王琪.竹筍采后保鮮及軟包裝筍儲(chǔ)藏品質(zhì)變化的研究[D].杭州:浙江工商大學(xué),2011.
WANG Qi.Studies on Preservation of Harvested Bamboo Shoot and Change in Quality of Soft Package Shoot During Storage at Lower Temperature[D].Hangzhou:Zhejiang Gongshang University,2011.
[14] CAO Dongsheng,LIANG Yizeng,XU Qingsong,et al.A new strategy of outlier detection for QSAR/QSPR[J].J Comput Chem,2010,31(3):592-602.
[15] LEARDI R,N?RGAARD L.Sequential application of backward interval partial lest squares and genetic algorithms for the selection of relevant spectral regions[J].J Chemometr,2004,18(11):486-497.
[16] LI Hongdong,LIANG Yizeng,XU Qingsong,et al.Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J].Anal Chim Acta,2009,648(1):77-84.
[17] ARA'UJO M C U,SALDANHA T C B,GALV?O R K H,et al.The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J].Chemometr Intell Lab,2001,57(2):65-73.
[18] LEARDI R.Application of genetic algorithm-PLS for feature selection in spectral data sets[J].J Chemometr,2000, 14(5/6):643-655.
[19] HAN Qingjuan,WU Hailong,CAI Chenbo,et al.An ensemble of Monte Carlo uninformative variable elimination for wavelength selection[J].Anal Chim Acta,2008,612(2):121-125.
[20] 嚴(yán)衍祿.近紅外光譜分析基礎(chǔ)與應(yīng)用[M].北京:中國(guó)輕工業(yè)出版社,2005:31-39.
Phyllostachys violascens model optimization for bamboo shoot firmness using near-infrared spectroscopy
ZHOU Zhu1,2,3,ZHENG Jian4,WANG Yunxiang4,ZENG Songwei1,2,3
(1.School of Information Engineering,Zhejiang A&F University,Lin’an 311300,Zhejiang,China;2.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology Zhejiang A&F University, Lin’an 311300,Zhejiang,China;3.Research Center for Smart Agriculture and Forestry,Zhejiang A&F University, Lin’an 311300,Zhejiang,China;4.School of Agriculture and Food Science,Zhejiang A&F University,Lin’an 311300,Zhejiang,China)
To develop a calibration model for rapid,accurate and nondestructive determination of bamboo shoots firmness with Phyllostachys violascens by using near infrared spectroscopy(NIRS)technology.The diffuse reflectance spectra of bamboo shoot were obtained in the wavelength range from 800 to 2 632 nm.Different informative variable selection methods were first calculated with the full spectra being pretreated using a standard normal variate (SNV)transformation.Analyses with backward interval partial least squares (biPLS),synergy interval partial least squares(siPLS),genetic algorithm(GA),successive projections algorithm(SPA),Monte Carlo uninformative variable elimination (MCUVE),and competitive adaptive reweighed sampling(CARS)were compared.Then CARS and SPA were used on the spectrum to select wavelengths in proper order.The performance of the models were tested using a correlation coefficient for cross-validation of calibration(rcv),root mean square error for cross-validation of calibration (RMSECV),the correlation coefficient of prediction(rp),and the root mean square error of prediction(RMSEP).Results showed that BiPLS combined with CARS and SPA obtained a total of 25 wavelengths or only 1.6%of the full wavelengths.The rcv,RMSECV,rp,RMSEP by biPLS-CARS-SPA were 0.984,0.300 N·cm-2,0.926,0.625 N·cm-2,respectively.The good performance demonstrated that NIR spectroscopy coupled with the biPLS-CARS-SPA algorithm could be used successfully to analyze bamboo shoot firmness and revealed that the biPLS-CARS-SPA algorithm was superior to other wavelength selection methods.[Ch,6 fig.3 tab.20 ref.]
cash forestry;NIR spectroscopy;biPLS;CARS;SPA;firmness;bamboo shoots
S123;O657.33
A
2095-0756(2015)06-0875-08
浙 江 農(nóng) 林 大 學(xué) 學(xué) 報(bào),2015,32(6):875-882
Journal of Zhejiang A&F University
10.11833/j.issn.2095-0756.2015.06.008
2015-01-13;
2015-03-23
浙江省自然科學(xué)基金資助項(xiàng)目(Y3110450,LY13C200014);浙江省科學(xué)技術(shù)公益項(xiàng)目(2011C22069);浙江農(nóng)林大學(xué)智慧農(nóng)林業(yè)研究中心資助項(xiàng)目(2013ZHL03);浙江農(nóng)林大學(xué)人才啟動(dòng)基金資助項(xiàng)目(2012FR085)
周竹,講師,博士,從事木材智能化檢測(cè)技術(shù)等研究。E-mail:zhouzhu@zafu.edu.cn。通信作者:鄭劍,講師,博士研究生,從事農(nóng)產(chǎn)品儲(chǔ)藏加工與品質(zhì)檢測(cè)等研究。E-mail:zhengjian622@126.com