馬世榜,彭彥昆,徐 楊,湯修映,田瀟瑜
(1.中國農(nóng)業(yè)大學(xué)工學(xué)院,北京 100083;2.南陽理工學(xué)院,河南 南陽 473004)
牛肉是營養(yǎng)價值較高的肉品,需求量越來越大,其新鮮度等品質(zhì)安全也越來越受消費者重視.揮發(fā)性鹽基氮(TVB-N)與肉品的新鮮度有很好的對應(yīng)關(guān)系,是國家標準中評價肉品新鮮度的重要指標之一,其值越低,肉品越新鮮.目前,GB/T5009.44—2003中測定肉品揮發(fā)性鹽基氮的方法主要是半微量定氮法或微量擴散法,檢測過程繁瑣,效率低、人為影響因素大,檢測結(jié)果缺乏客觀性和一致性,且需要對樣品進行破壞處理,不能滿足當今肉檢過程的快速、無損、自動化的要求.
可見/近紅外光譜(visible and near infrared spectroscopy,VIS/NIR)分析技術(shù)因具有分析速度快、樣品無需預(yù)處理、非破壞性、操作簡便、測試重現(xiàn)性好、便于實現(xiàn)在線分析等特點,已經(jīng)廣泛應(yīng)用于農(nóng)作物[1-2]和肉品品質(zhì)檢測[3-4]的研究.侯瑞峰等[5]初步研究了用近紅外漫反射光譜定性區(qū)分和定量檢測豬肉的新鮮度的可行性;Cai Jianrong等[6]用近紅外光譜采用聯(lián)合區(qū)間偏最小二乘方法選擇光譜變量建模,預(yù)測豬肉TVB-N值,預(yù)測相關(guān)系數(shù)為0.8084.但近紅外光譜全波長范圍內(nèi)的光譜信息重疊嚴重,信息量龐大,影響建模速度、效率和模型預(yù)測能力.Liu Fei和Xu Huirong等[7-8]采用變量選擇方法提高了光譜預(yù)測葡萄汁、梨農(nóng)產(chǎn)品成分含量的模型精度.用可見近紅外光譜結(jié)合變量選擇方法檢測牛肉整個4℃儲存期內(nèi)TVB-N含量,提高建模速度和精度還少有相關(guān)報道.本研究擬搭建可見/近紅外光譜檢測系統(tǒng)平臺,結(jié)合無信息變量消除(uninformative variable elimination,UVE)算法和連續(xù)投影(successive projections algorithm,SPA)算法2種變量選擇方法,建立生牛肉整個儲存期內(nèi)TVB-N的最小二乘支持向量機(LS-SVM)光譜預(yù)測模型,為進一步開發(fā)實用檢測設(shè)備提供參考.
取不同產(chǎn)地和不同品種的2批次牛肉樣品.第1批樣品取自北京市某大型超市剛上市的內(nèi)蒙古小黃牛統(tǒng)脊部位34塊,尺寸約為8.0 cm×5.0 cm×2.5 cm,用保鮮袋包裝放置于4~6℃低溫保鮮箱,運至中國農(nóng)業(yè)大學(xué)工學(xué)院農(nóng)畜產(chǎn)品無損檢測實驗室,無擠壓地保存在4℃冰箱中,模擬市場上待售生鮮牛肉的放置環(huán)境.試驗周期為17 d,每隔12 h檢測一塊樣品.第2批樣品取自北京市御香苑畜牧有限公司宰后經(jīng)48 h解僵、排酸后的東北改良牛的統(tǒng)脊部位56塊,尺寸也約為8 cm×5 cm×2.5 cm,采取與第1批同樣運輸保存方式和試驗周期,前6 d每隔12 h檢測一塊樣品,后11 d每隔12 h檢測2塊樣品.2次試驗時樣品均是隨機從冰箱中取出,共獲得90個樣本試驗數(shù)據(jù).
試驗用搭建的可見/近紅外光譜檢測系統(tǒng)(見圖1)采集樣品光譜信息.系統(tǒng)主要由封閉艙1、載物臺2、光源3、光譜儀4、計算機5等組成.光譜儀波長測量范圍是200~1750 nm,最小采樣間隔為0.5 nm.封閉艙的作用主要是屏蔽外界光線對檢測結(jié)果的影響.此外還包括KDY-9820凱氏定氮儀、肉攪拌機、電子天平等試驗儀器.
圖1 可見/近紅外光譜檢測系統(tǒng)構(gòu)架
用上述系統(tǒng)采集樣品400~1700 nm波長范圍的光譜反射強度信息.樣品采集光譜前,把樣品從冰箱中取出,去除保鮮袋,在空氣中暴露20 min,使樣品表面水分自然揮發(fā);調(diào)節(jié)載物臺高度使樣品表面距離光纖探頭高度為12 cm,每個樣品采集6個不同點的光譜信息,把6個點的光譜數(shù)據(jù)平均值作為該樣品的最終光譜反射強度值.
揮發(fā)性鹽基氮測量按照GB/T5009.44—2003中的半微量定氮法,用KDY-9820凱氏定氮儀測量.每次測量前,做3個樣品空白試驗,取平均值作為樣品空白試驗值,每個樣品做3個樣液試驗,取平均值作為該樣品樣液測量值.樣品絞碎時去除脂肪、筋腱等組織.
樣本選擇及樣本集劃分.利用主成分分析(principal component analysis,PCA)和統(tǒng)計分析,剔除2個異常光譜曲線樣本和3個異常理化值樣本后剩余有效樣本85個,其原始可見/近紅外反射光譜如圖2所示.按3∶1的原則用SPXY算法[9]把85個樣本劃分為校正集和驗證集,63個樣本作為校正集建立預(yù)測模型,22個樣本作為驗證集驗證模型的精度和穩(wěn)定性,其統(tǒng)計分布結(jié)果如表1所示.
圖2 樣品的可見/近紅外反射原始光譜
表1 牛肉樣本揮發(fā)性鹽基氮實測值
1)數(shù)據(jù)預(yù)處理.為消除高頻噪聲干擾、圖譜偏移或漂移現(xiàn)象和光譜的多重共線性,采用Savitzky-Golay(SG)平滑、多元散射校正(multiplication scatter correction,MSC)和一階導(dǎo)數(shù)(first derivative,F(xiàn)D)方法對光譜數(shù)據(jù)進行預(yù)處理.具體處理是采用Matlab7.6.0軟件編寫相應(yīng)程序進行處理和分析,下文其他算法實現(xiàn)及分析也均是用該軟件編寫的相應(yīng)程序.
2)無信息變量消除算法和連續(xù)投影算法.UVE[10]是基于分析偏最小二乘法(PLS)回歸系數(shù)b的算法,用于消除不提供信息的變量,減少建模變量數(shù),提高建模速度,降低模型的復(fù)雜性.SPA[11]是一種利用向量的投影分析,從光譜信息中尋找含有最低限度冗余信息、共線性最小的變量組,大大減少建模所用變量個數(shù).UVE算法和SPA算法相結(jié)合,能夠進一步減少建模變量個數(shù),提高建模效率和建模精度.
3)建模及評價方法.最小二乘支持向量機(least square-support vector machine,LS-SVM)是在經(jīng)典SVM的基礎(chǔ)上改進的新型建模方法,能夠很好的解決高維數(shù)、非線性、小樣本、局部極小等傳統(tǒng)建模方法的難題,降低計算的復(fù)雜性,是光譜數(shù)據(jù)建模分析的有效工具之一[12].模型的性能用校正相關(guān)系數(shù)Rc、驗證相關(guān)系數(shù)Rv和校正標準差Sc、驗證標準差 Sv評判.Rc,Rv越大,Sc,Sv越小,模型越好.
對原始反射光譜400~1700 nm范圍全波段數(shù)據(jù)共1571個變量進行MSC,F(xiàn)D和SG預(yù)處理,采用LS-SVM方法建模預(yù)測牛肉TVB-N.選用徑向基核函數(shù)(radial basic function,RBF)進行LS-SVM進行建模,用網(wǎng)格搜索結(jié)合留一交叉驗證法進行優(yōu)化確定影響模型精度的徑向基核函數(shù)參數(shù)σ2和懲罰系數(shù)γ.表2顯示了不同預(yù)處理方法建立LS-SVM模型的預(yù)測結(jié)果.結(jié)果顯示SG平滑法(階次1,窗口11)預(yù)處理方法建立的預(yù)測模型預(yù)測結(jié)果最好,校正集和驗證集的預(yù)測相關(guān)系數(shù)分別為0.915,0.924,校正集和驗證集預(yù)測標準差分別為3.956 mg·(100 g)-1和4.638 mg·(100 g)-1,因此下文光譜數(shù)據(jù)均采用SG平滑預(yù)處理方法處理后進行分析.
表2 不同預(yù)處理和不同變量選擇方法得到的光譜變量建立的LS-SVM模型和預(yù)測結(jié)果
對全波段光譜進行SG平滑后建TVB-N的LSSVM預(yù)測模型,得到了較好的預(yù)測結(jié)果,但全波段中可能包含有對建模無用的冗余信息,全部作為建模輸入變量,影響建模速度和精度.用UVE算法進行變量選擇,剔除全波段中的無用信息,提取有效波長信息.首先用PLS結(jié)合全交叉驗證確定最佳主成分為10,在全光譜變量矩陣中加入與其個數(shù)相同的隨機變量1571個,利用確定的最佳主成分數(shù)建立各個變量的PLS回歸模型,求得回歸系數(shù),計算每個變量的穩(wěn)定性C.根據(jù)設(shè)定的穩(wěn)定性C的閾值,進行變量選擇.UVE變量選擇過程如圖3所示,中間豎直線左側(cè)是全波段光譜實際1571個變量穩(wěn)定性C的分布,右側(cè)是相同變量個數(shù)的1571個隨機變量穩(wěn)定性C的分布.兩條水平虛線代表穩(wěn)定性C的閾值的上下限,兩線范圍之外的變量為有用信息用來建模.隨機變量的穩(wěn)定性C的最大值設(shè)定為閾值.用UVE變量選擇后,從1571個變量中選擇出了216個有效變量,變量個數(shù)減少了86%,變量覆蓋可見和近紅外光譜區(qū)域.選擇出來的變量作為輸入變量建立LS-SVM模型,預(yù)測結(jié)果如表2中所示,校正集和驗證集的預(yù)測相關(guān)系數(shù)分別為0.903,0.924,預(yù)測標準差分別為4.239 mg·(100 g)-1和4.808 mg·(100 g)-1,與用全光譜變量建立的模型預(yù)測結(jié)果相比,變量個數(shù)大幅減少,但預(yù)測精度并沒有顯著下降.所以UVE算法能夠有效剔除全波段光譜數(shù)據(jù)中無用信息,提取用于建模的有效變量信息.
圖3 UVE穩(wěn)定性分布曲線
用UVE算法消除了原始全波段光譜中存在的大量的無用信息,提取出來了有效的變量信息,但為進一步減少變量個數(shù),并消除變量之間的共線性,用SPA算法對UVE提取后的光譜信息進行處理,提取共線性最小的有效波長變量.波長變量選擇數(shù)設(shè)定為1~21,由校正集內(nèi)部交叉驗證均方根誤差(RMSECV)值確定最佳有效光譜變量個數(shù).從UVE處理后的216個光譜變量中,提取出8個有效變量,如圖4,5所示.變量個數(shù)在UVE處理后的基礎(chǔ)上減少了96%,與原始全光譜變量個數(shù)相比減少了99.5%.提取的有效變量作為輸入變量建立LS-SVM預(yù)測模型對驗證集進行預(yù)測,預(yù)測結(jié)果如表2中所示,預(yù)測相關(guān)系數(shù)和標準差分別為0.925,4.615 mg·(100 g)-1,具有較好的預(yù)測結(jié)果,預(yù)測精度高于UVE-LSSVM.預(yù)測結(jié)果的散布圖如圖6所示,驗證集樣本的預(yù)測值能夠較好地分布在回歸直線的兩側(cè),說明UVE算法聯(lián)合SPA算法能夠很好地從大量的光譜信息中提取出最有效的波長變量,結(jié)合LS-SVM建立的預(yù)測模型,能夠很好地預(yù)測牛肉揮發(fā)性鹽基氮的值.
圖4 SPA變量選擇
圖5 UVE-SPA選擇的波長
圖6 UVE-SPA-LS-SVM模型預(yù)測TVB-N結(jié)果
搭建了可見/近紅外光譜檢測系統(tǒng),結(jié)合UVE和SPA建立LS-SVM預(yù)測模型,實現(xiàn)了牛肉4℃下整個儲存期TVB-N的無損快速準確檢測.通過優(yōu)化對比,確定SG平滑為最佳光譜數(shù)據(jù)預(yù)處理方法.選取有效光譜變量8個,與全光譜變量建模相比,變量數(shù)減少了99.5%,精度得到提高,建立的LS-SVM預(yù)測模型的預(yù)測相關(guān)系數(shù)和標準差分別為0.925和4.615 mg·(100 g)-1,具有較好的預(yù)測精度.結(jié)果表明:應(yīng)用可見/近紅外光譜技術(shù),結(jié)合UVE、SPA變量選擇算法和LS-SVM建模方法,能有效減少建模所用變量個數(shù),提高建模速度和模型預(yù)測精度,為進一步開發(fā)實用的牛肉TVB-N無損快速檢測設(shè)備,實現(xiàn)牛肉新鮮度無損快速評價、分級提供參考.
References)
[1]朱詠莉,李萍萍,毛罕平,等.基于特征光譜提取的有機基質(zhì)含水量快速測定方法[J],江蘇大學(xué)學(xué)報:自然科學(xué)版,2011,32(2):140-143.Zhu Yongli,Li Pingping,Mao Hanping,et al.Moisture content detection in organic substrates based on characteristic wavelength in near infrared spectroscopy[J].Journal of Jiangsu University:Natural Science Edition,2011,32(2):140-143.(in Chinese)
[2]陳 斌,崔 廣,金尚忠,等.近紅外光譜在快速檢測棉制品中含棉量的應(yīng)用[J].江蘇大學(xué)學(xué)報:自然科學(xué)版,2007,28(3):185-188.Chen Bin,Cui Guang,Jin Shangzhong,et al.Application of near infrared spectra in rapid inspection of cotton contents[J].Journal of Jiangsu University:Natural Science Edition,2007,28(3):185-188.(in Chinese)
[3]徐 霞,成 芳,應(yīng)義斌.近紅外光譜技術(shù)在肉品檢測中的應(yīng)用和研究進展[J].光譜學(xué)與光譜分析,2009,29(7):1876-1880.Xu Xia,Cheng Fang,Ying Yibin.Application and recent development of research on near-infrared spectroscopy for meat quality evaluation[J].Spectroscopy and Spectral Analysis,2009,29(7):1876-1880.(in Chinese)
[4]Savenije B,Geesink G H,van der Palen J G P,et al.Prediction of pork quality using visible/near-infrared reflectance spectroscopy[J].Meat Science,2006,73:181-184.
[5]侯瑞鋒,黃 嵐,王忠義,等.用近紅外漫反射光譜檢測肉品新鮮度的初步研究[J].光譜學(xué)與光譜分析,2006,26(12):2193-2196.Hou Ruifeng,Huang Lan,Wang Zhongyi,et al.The preliminary study for testing freshness of meat by using near-infrared reflectance spectroscopy[J].Spectroscopy and Spectral Analysis,2006,26(12):2193-2196.(in Chinese)
[6]Cai Jianrong,Chen Quansheng,Wan Xinmin,et al.Determination of total volatile basic nitrogen(TVB-N)content and Warner-Bratzler shear force(WBSF)in pork using Fourier transform near infrared(FT-NIR)spectroscopy[J].Food Chemistry,2011,126:1354-1360.
[7]Liu Fei,Jiang Yihong,He Yong.Variable selection in visible/near infrared spectra for linear and nonlinear calibrations:a case study to determine soluble solids content of beer[J].Analytica Chimica Acta,2009,635:45-52.
[8]Xu Huirong,Qi Bing,Sun Tong,et al.Variable selection in visible and near-infrared spectra:application to online determination of sugar content in pears[J].Journal of Food Engineering,2012,109:142-147.
[9]展曉日,朱向榮,史新元,等.SPXY樣本劃分法及蒙特卡羅交叉驗證結(jié)合近紅外光譜用于橘嘻橙皮苷的含量測定[J].光譜學(xué)與光譜分析,2009,29(4):964-968.Zhan Xiaori,Zhu Xiangrong,Shi Xinyuan,et al.Determination of hesperidin in tangerine leaf by near-infrared spectroscopy with SPXY algorithm for sample subset partitioning and monte carlo cross validation[J].Spectroscopy and Spectral Analysis,2009,29(4):964-968.(in Chinese)
[10]Wu Di,He Yong,Nie Pengcheng,et al.Hybrid variable selection in visible and near-infrared spectral analysis for non-invasive quality determination of grape juice[J].Analytica Chimica Acta,2010,659:229-237.
[11]Márcio J C P,Roberto K H G,Mário C U A,et al.The successive projections algorithm for spectral variable selection in classification problems[J].Chemometrics and Intelligent Laboratory Systems,2005,78:11-18.
[12]Liu Fei,He Yong.Application of successive projections algorithm for variable selection to determine organic acids of plum vinegar[J].Food Chemistry,2009,115:1430-1436.