鄒 昊,田寒友,劉 飛,李文采,王 輝,李家鵬,陳文華,狄艷全,喬曉玲,*
(1.中國肉類食品綜合研究中心,肉類加工技術(shù)北京市重點實驗室,北京 100068;2.聚光科技(杭州)股份有限公司,浙江 杭州 310052)
近紅外光譜的預(yù)處理對羊肉TVB-N模型的影響
鄒 昊1,田寒友1,劉 飛1,李文采1,王 輝1,李家鵬1,陳文華1,狄艷全2,喬曉玲1,*
(1.中國肉類食品綜合研究中心,肉類加工技術(shù)北京市重點實驗室,北京 100068;2.聚光科技(杭州)股份有限公司,浙江 杭州 310052)
為研究能否通過對算法參數(shù)的調(diào)整和算法的組合來減弱甚至消除便攜式近紅外儀和樣品組織結(jié)構(gòu)等對樣品光譜信息的影響,提高模型的預(yù)測準確性和穩(wěn)健性,實現(xiàn)現(xiàn)場快速無損檢測生鮮羊肉揮發(fā)性鹽基氮(total volatile basic nitrogen,TVB-N)的目的。本研究應(yīng)用不同參數(shù)組合的單一算法和不同算法組合對樣品的光譜信息進行預(yù)處理并建模,從模型的預(yù)測準確性和穩(wěn)健性2 個方面探討算法參數(shù)和算法組合對模型性能的影響,找出針對檢測生鮮羊肉中TVB-N含量的最佳預(yù)處理方法。結(jié)果表明,不同的算法參數(shù)和算法組合對模型性能的影響差別很大,對樣品的近紅外光譜信息進行差分求導(dǎo)(窗口數(shù)為6,求導(dǎo)階次為1)后,模型性能最佳。模型的校正標準差和驗證標準差分別為1.21和1.31,校正標準差和驗證標準差的比值為1.08小于1.2,主成分數(shù)為10,校正集相關(guān)系數(shù)和驗證及相關(guān)系數(shù)分別為0.94和0.92。說明通過對算法參數(shù)的調(diào)整和對算法的組合可以有效提高模型性能,滿足應(yīng)用便攜式近紅外儀現(xiàn)場快速無損檢測生鮮羊肉TVB-N含量的要求。
近紅外光譜分析技術(shù);預(yù)處理方法;生鮮羊肉;TVB-N;便攜式近紅外儀
在動物性食品的貯藏過程中,內(nèi)源性生物酶和外源性微生物共同作用使蛋白質(zhì)發(fā)生分解,產(chǎn)生的氨和胺類等堿性含氮物質(zhì)進一步與腐敗過程中產(chǎn)生的有機酸結(jié)合,形成具有揮發(fā)性的鹽基態(tài)氮形式的物質(zhì),即為揮發(fā)性鹽基氮(total volatile basic nitrogen,TVB-N)[1-2]。國家標準中將TVB-N作為一項反映生鮮羊肉新鮮度的重要理化指標[3]。目前檢測TVB-N含量的方法主要有分光光度法,微量擴散法和半微量凱氏定氮法[2,4-5]。這些方法雖然可以比較準確的檢測TVB-N含量,但存在著操作過程復(fù)雜、涉及多種化學試劑及實驗室儀器以及對檢測人員操作水平要求較高等問題。
近紅外光譜分析技術(shù)作為一種新型檢測技術(shù),因其具有檢測速度快,操作簡單和綠色環(huán)保等特點,被廣泛的應(yīng)用于農(nóng)業(yè)、食品和醫(yī)藥等行業(yè)[6-11]。近些年國內(nèi)外學者在應(yīng)用近紅外光譜分析技術(shù)檢測肉與肉制品中的TVB-N含量方面進行了大量的研究,并取得了較好的成果[12-17],但仍存在一些空白值得研究。首先,應(yīng)用近紅外光譜分析技術(shù)對生鮮羊肉中的TVB-N含量進行定量檢測方面還鮮見報道。其次,在相關(guān)研究中學者們多采用信噪比、分辨率和波長準確性較好的臺式傅里葉變換型光譜儀對樣品的光譜信息進行采集[12,14,17],但體積較大不便于移動的特點限制了它在現(xiàn)場檢測方面的應(yīng)用。第三,一些學者在采集樣品的光譜信息前將樣品進行均質(zhì)[17-22]來避免因肌肉纖維束傳導(dǎo)近紅外光束導(dǎo)致樣品光譜信息失真的問題[23],但樣品前處理增加了檢測的時間和復(fù)雜程度,破壞了樣品的完整性,無法滿足快速無損檢測的需求。第四,在評價模型性能時,學者們往往只考慮模型的預(yù)測準確性而忽略了模型的穩(wěn)健性。美國谷物化學家協(xié)會、國際商會和美國分析化學家協(xié)會等國際分析組織的近紅外分析標準中均把模型的穩(wěn)健性作為評價模型性能的一個重要指標[24]。最后,相關(guān)研究中多使用單一或組合2 種算法對樣品的光譜信息進行預(yù)處理[25-28],詳細討論組合3 種或3 種以上算法進行預(yù)處理以及算法參數(shù)的變化對模型性能影響的研究國內(nèi)外鮮有報道。
本研究以反映生鮮羊肉新鮮度的TVB-N含量作為檢測對象,在不對樣品進行任何前處理的情況下,使用便攜式近紅外儀采集樣品的光譜信息,應(yīng)用不同參數(shù)組合的單一算法和不同算法組合對樣品的光譜信息進行預(yù)處理并建模,從模型的預(yù)測準確性和穩(wěn)健性2 個方面探討算法參數(shù)和算法組合對模型性能的影響,找出針對檢測生鮮羊肉中的TVB-N含量的最佳預(yù)處理方法,為實現(xiàn)現(xiàn)場快速無損檢測生鮮羊肉中的TVB-N含量提供科學依據(jù),為類似研究中預(yù)處理算法參數(shù)和算法組合的選擇提供經(jīng)驗。
1.1 材料與試劑
羊肉樣品均為宰后排酸12 h的土種羊通脊肉,采購于北京市牛街清真牛羊肉市場。碳酸鉀、硼酸、甲基紅、次甲基藍、阿拉伯膠和甘油均(化學純) 國藥集團化學試劑有限公司;0.010 mol/L鹽酸標準滴定溶液 國家化學試劑質(zhì)檢中心。
1.2 儀器與設(shè)備
6031-02A型擴散皿 日本柴田科學株式會社;BSA822-CW型電子天平(精確度0.01 g) 德國賽多利斯集團;SupNIR-1520型便攜式近紅外儀(光譜波長范圍1 000~1 800 nm,光譜分辨率10 nm,鎢燈光源,平面漫反射探頭,探頭為直徑32 mm的圓)、RIMP Client近紅外光譜數(shù)據(jù)分析軟件 聚光科技(杭州)股份有限公司。
1.3 方法
1.3.1 樣品制備
將采購的新鮮羊通脊肉分別用塑料袋包裹以避免樣品間的干擾和外界環(huán)境對樣品的影響。所有樣品被放置于0~4 ℃冷庫貯藏,使其自然緩慢腐敗,期間隨機選取樣品進行光譜信息的采集和TVB-N含量的測定。
1.3.2 樣品近紅外光譜信息的采集
實驗前將便攜式近紅外儀預(yù)熱30 min,然后用參比標準白板進行校準(樣品間不再進行校準)。所有樣品被隔水置于冰水混合物中以確保樣品溫度在0~4 ℃之間。環(huán)境溫度為(25±1)℃,相對濕度為50%~60%。在采集樣品光譜信息前,用濾紙吸去樣品表面滲出的汁液。采集過程中,將樣品的表面緊貼于便攜式近紅外儀的平面漫反射探頭上,避免因漏光導(dǎo)致采集的樣品光譜信息失真。每個樣品至少進行3 次光譜信息的采集,每2 次采集之間間隔10 s,采集的區(qū)域不完全重合。每次采集,光譜掃描次數(shù)為10 次,采集的近紅外光譜波長范圍為1 000~1 800 nm,分辨率為10 nm。采集后,觀察每個
樣品的光譜圖,選取2 條平行性最好的光譜作為該樣品的光譜信息用于建模。
1.3.3 樣品TVB-N含量的測定
根據(jù)GB/T 5009.44—2003《肉與肉制品衛(wèi)生標準的分析方法》中的微量擴散法對樣品的TVB-N含量進行測定。每個樣品3 個平行,結(jié)果取平均值作為該樣品的TVB-N含量。
1.3.4 樣品光譜信息的預(yù)處理與建模
首先使用不同參數(shù)組合的單一算法對樣品的光譜信息進行預(yù)處理并建模,根據(jù)模型性能評價參數(shù)選出每種算法的最佳參數(shù)組合。再將確定了最佳參數(shù)組合的算法進行組合,從而選出最佳算法組合。建模使用偏最小二乘回歸算法,所用的近紅外光譜信息波長范圍為1 000~1 800 nm。
選擇的預(yù)處理算法包括:數(shù)據(jù)增強類算法:均值中心化(mean centering,MC)和標準化(autoscaling,AS)。導(dǎo)數(shù)類算法:Savitzky-Golay求導(dǎo)(Savitzky-Golay derivative,SGD),窗口參數(shù)為5~31(間隔為2),擬合次數(shù)為2~5,求導(dǎo)階數(shù)為1~4;差分求導(dǎo)(difference derivative,DD),差分點數(shù)為1~100,求導(dǎo)階數(shù)為1~2。平滑類算法:Savitzky-Golay平滑(Savitzky-Golay smoothing,SGS),窗口參數(shù)為5~31(間隔為2),擬合次數(shù)為1~5。信號校正類算法:標準正態(tài)變量變換(standard normal variate transformation,SNV)、多元散射校正(multiplication scatter correction,MSC)、靜分析信號(net analyte signal,NAS)、正交信號校正(orthogonal signal correction,OSC)、去趨勢校正(de-trending,DT)和基線校正(baseline correction,BLC),其中NAS和OSC的主成分范圍為1~20。
1.3.5 最佳算法參數(shù)組合和算法組合的篩選
綜合所得模型的校正標準差(standard error of calibration,SEC)、驗證標準差(standard error of prediction,SEP)、SEP/SEC和SEP-SEC以及主成分數(shù)對模型性能進行評價,從而判斷不同算法參數(shù)組合和不同算法組合對模型性能的影響,從而找出針對檢測生鮮羊肉中的TVB-N含量的最佳預(yù)處理方法。
SEP是模型對未知樣品的近紅外預(yù)測值與其含量之間的殘差標準差,它代表了近紅外分析的總誤差,包括可靠性偏差、穩(wěn)健性偏差和信息處理過程產(chǎn)生的誤差,因此可以直接用于評價模型的預(yù)測準確性。
SEC是模型對校正集中各個樣品的近紅外預(yù)測值與含量之間的殘差標準差,它只代表模型在建模樣品范圍內(nèi)的分析誤差,不包括穩(wěn)健性偏差,因此SEP-SEC應(yīng)大于0[29]。
美國谷物化學師協(xié)會的近紅外分析標準中將SEP/SEC作為評價模型穩(wěn)健性的參數(shù),規(guī)定SEP/SEC應(yīng)小于等于1.2,其值大于1.2時則表示模型的穩(wěn)健性不夠[24]。
每個主成分中都包含了一部分反映待測量的有效信息和一部分背景等無關(guān)信息。當引入的主成分數(shù)過少時,模型未能充分提取樣品光譜信息中的有效信息,模型擬合不足,這時模型雖然穩(wěn)健性較好,但對樣品的預(yù)測準確性較差。當引入的主成分數(shù)過多時,模型提取了過多樣品光譜信息中的噪聲信息,模型過度擬合,這時模型雖然對校正集樣品的預(yù)測準確性較好,但對未知樣品的預(yù)測準確性較差且模型的穩(wěn)健性較差。所以在保證模型的預(yù)測準確性和穩(wěn)健性均較好時,主成分數(shù)越小,模型的性能越好。
因此本實驗在篩選模型時,首先去除SEP/SEC大于1.2以及SEP-SEC小于0的模型,在剩余模型中選取SEP較小的模型,這些模型不僅穩(wěn)健且預(yù)測準確性較好,然后再選取其中主成分數(shù)最小的模型即為性能最佳的模型,這個模型所對應(yīng)的算法參數(shù)組合和算法組合即為最佳預(yù)處理方法。
2.1 樣品TVB-N含量測定結(jié)果
表1 羊肉樣品TVB-N含量的統(tǒng)計結(jié)果Table1 Statistical results of total volatile basic nitrogen content of mutton samples
如表1所示,其范圍涵蓋了國家標準對鮮、胴體羊肉的TVB-N含量所允許的最大值(15 mg/100 g),說明本實驗選用的樣品具有較強的代表性。
從總樣品集中選取TVB-N含量分布均勻的91 個樣品作為校正集,用于模型的建立;剩余的22 個樣品作為驗證集,用于驗證模型的預(yù)測準確性和穩(wěn)健性。
2.2 樣品近紅外光譜信息采集結(jié)果
圖1 羊肉樣品的近紅外漫反射光譜圖Fig.1 Near-infrared diffuse reflectance spectra of mutton samples
如圖1a所示,在1 000~1 800 nm的光譜區(qū)域內(nèi),樣品的近紅外光譜曲線出現(xiàn)多處吸收峰呈遞增或遞減的趨勢,說明本實驗所用的羊肉樣品在此區(qū)域內(nèi)有很好的光譜響應(yīng)。其次不同TVB-N含量的羊肉樣品其近紅外光譜曲線的譜形相似,但又不完全重合,既體現(xiàn)了樣品間的差異性,又體現(xiàn)了總樣品集的連續(xù)性。如圖1b所示,同一羊肉樣品2 次光譜采集所得的近紅外光譜曲線基本重合,說明本實驗所用的便攜式近紅外儀對同一樣品進行多次光譜采集時,所得樣品的光譜信息重復(fù)性較好。
2.3 最佳預(yù)處理方法的篩選
2.3.1 算法參數(shù)對模型性能的影響及算法最佳參數(shù)組合的確定
數(shù)據(jù)增強類算法中的AS算法和MC算法各只有一種參數(shù)組合。導(dǎo)數(shù)類算法中的SGD算法有14個窗口參數(shù),4 個擬合次數(shù),4 個求導(dǎo)階數(shù)(擬合次數(shù)<窗口參數(shù),求導(dǎo)階數(shù)<擬合次數(shù)),共136 種參數(shù)組合;DD算法有100 個差分點數(shù),2 個求導(dǎo)階數(shù),共200 種參數(shù)組合。平滑類算法中的SGS算法有14 個窗口參數(shù),5 個擬合次數(shù)(擬合次數(shù)<窗口參數(shù)),共69 種參數(shù)組合。信號校正類算法中的DT、MSC、SNV算法和BLC算法各只有一種參數(shù)組合,NAS算法和OSC算法各有20 個主成分數(shù),所以各有20 種參數(shù)組合。
表2 每種算法的最佳參數(shù)組合Table2 Optimal parameter combinations for each algorithm
由表2可知,單獨使用導(dǎo)數(shù)類算法可以明顯提高模型性能,單獨使用其他算法,對提高模型性能的作用不大,一些算法甚至會降低模型的預(yù)測準確性或穩(wěn)健性。近些年,國內(nèi)一些學者在相關(guān)研究中也得到了類似的結(jié)論,例如劉源等[17]在研究應(yīng)用近紅外技術(shù)評價冰鮮大黃魚新鮮度的過程中發(fā)現(xiàn)除導(dǎo)數(shù)算法有較好的預(yù)處理效果外,大多數(shù)預(yù)處理算法單獨使用時的效果均不佳,一些算法的預(yù)處理結(jié)果遠劣于無預(yù)處理方法時的結(jié)果。黃濤等[15]在研究基于近紅外光譜的淡水魚新鮮度在線檢測方法的過程中發(fā)現(xiàn)使用單一算法對樣品光譜信息進行預(yù)處理時,導(dǎo)數(shù)算法的預(yù)處理效果最好。
通過MC算法或AS算法來增加不同樣品間光譜信息的差異后[30],模型各參數(shù)變化不大(表2中序號2、3),說明單獨使用MC算法或AS算法,對于模型性能的影響不大。
在篩選SGD算法最佳參數(shù)組合的過程中發(fā)現(xiàn),隨著窗口數(shù)的增大,模型的SEC波動性增大,SEP波動性減小。當窗口參數(shù)過大時,模型的SEC較大,模型的預(yù)測準確性較差,說明預(yù)處理后光譜的分辨率大大減小,建模樣品的光譜信息中丟失了大量的細節(jié)信息,模型擬合不足。當窗口參數(shù)過小時,模型的SEP遠大于SEC,即SEP/SEC大于1.2,穩(wěn)健性較差,說明預(yù)處理后建模樣品光譜信息中的噪聲不能有效地被去除,模型過度擬合,所以窗口參數(shù)不宜過大或過小。當求導(dǎo)階數(shù)增加時,模型趨于擬合不足,所以求導(dǎo)階數(shù)不宜過大。隨著擬合次數(shù)的增加,模型趨于過度擬合,所以擬合次數(shù)也不宜過大。經(jīng)過篩選發(fā)現(xiàn)當窗口參數(shù)為9,擬合次數(shù)為2,求導(dǎo)階數(shù)為1時,所得模型的性能最佳。
在篩選DD算法最佳參數(shù)組合的過程中發(fā)現(xiàn),模型各參數(shù)隨差分點數(shù)的增大上下波動,沒有明顯變化規(guī)律;一階導(dǎo)數(shù)和二階導(dǎo)數(shù)對模型性能的影響沒有明顯區(qū)別。經(jīng)過篩選,當差分點數(shù)為6,求導(dǎo)階數(shù)為1時,DD算法的預(yù)處理效果最佳。
樣品的光譜信息經(jīng)SGD 9-2-1算法或DD 6-1算法預(yù)處理后(表2中序號4、5),所得模型的穩(wěn)健性和預(yù)測準確性均明顯提高。
在篩選SGS算法最佳參數(shù)組合的過程中發(fā)現(xiàn),隨著窗口參數(shù)的增大,模型的SEC逐漸增大,SEP逐漸減小。當窗口參數(shù)過大時,模型的SEC較大,模型的預(yù)測準確性較差,說明此時平滑過度,光譜的分辨率大大減小,建模樣品的光譜信息中丟失了大量的細節(jié)信息,模型擬合不足。經(jīng)過篩選,當SGS算法的窗口參數(shù)為25,擬合次數(shù)為3時,預(yù)處理后的模型性能最佳。
使用SGS 25-3算法對樣品光譜信息中的隨機噪聲進行平滑處理后(表2中序號6),模型的預(yù)測準確性降低,說明單獨使用SGS算法進行預(yù)處理效果不佳。
在篩選OSC算法最佳主成分數(shù)的過程中發(fā)現(xiàn),隨著主成分數(shù)的增加,所得模型的SEC波動性減小,SEP波動性增大,主成分數(shù)無明顯變化規(guī)律。當主成分數(shù)過大時,模型的SEP遠大于SEC,即SEP/SEC大于1.2,且模型的主因子過多,說明預(yù)處理后建模樣品光譜信息中的噪聲沒有被有效地去除,模型過度擬合,穩(wěn)健性較差。所以主成分數(shù)不宜過大。經(jīng)過篩選,當OSC算法的主成分數(shù)為8時,對樣品光譜信息的預(yù)處理效果最好。
單獨使用OSC-8算法雖然不能提高模型的預(yù)測準確性,但大大降低了模型的主成分數(shù)(表2中序號7),使模型的穩(wěn)健性更好[31]。
在篩選NAS算法最佳主成分數(shù)的過程中發(fā)現(xiàn),隨著NAS算法的主成分數(shù)增加,SEC波動性減小,SEP波動性增大,主成分數(shù)上下波動沒有明顯變化規(guī)律,當主成分數(shù)較大時,SEP遠大于SEC,即SEP/SEC大于1.2且模型的主成分過多(表2中序號8),模型過度擬合,穩(wěn)健性較差。當主成分數(shù)為1時,SEP/SEC仍大于1.2,且預(yù)處理后模型的SEP明顯增大,模型的預(yù)測準確性降低,所以單獨使用NAS算法進行預(yù)處理,會降低模型的預(yù)測準確性和穩(wěn)健性。
SNV算法和MSC算法主要是消除樣品表面顆粒分布不均勻及顆粒大小產(chǎn)生的散射影響,本實驗樣品的光譜信息在經(jīng)過SNV和MSC算法預(yù)處理后,模型各參數(shù)變化不大(表2中序號9、10),說明單獨使用SNV算法或MSC算法對模型性能的影響不大。
經(jīng)DT算法或BLC算法預(yù)處理后,所得模型的SEC大幅減小,SEP大幅增大,導(dǎo)致SEP遠大于SEC即SEP/SEC大于1.2,且引入的主成分過多(表2中序號11、12),模型明顯過度擬合,穩(wěn)健性差。說明單獨使用DT算法或BLC算法對樣品的光譜信息進行預(yù)處理,會降低模型的穩(wěn)健性。
2.3.2 組合2 種算法對模型性能的影響
組合2 種算法對樣品的光譜信息進行預(yù)處理后,部分模型的性能評價參數(shù)如表3所示。經(jīng)MC算法與導(dǎo)數(shù)類算法組合以及DD算法與DT算法組合(表3中序號2~4)預(yù)處理后,模型的預(yù)測準確性和穩(wěn)健性均明顯提高。經(jīng)一些算法組合(表3中序號5~14)預(yù)處理后,模型過度擬合,穩(wěn)健性變差。組合AS算法與MSC算法(表3中序號15)進行預(yù)處理后,模型擬合不足,預(yù)測準確性變差。經(jīng)MC算法與OSC算法組合(表3中序號16)預(yù)處理后,模型的SEC和SEP變化不大,但主成分數(shù)明顯減小,說明在不損失預(yù)測準確性的前提下,模型更加穩(wěn)健。MC算法與BLC算法組合以及AS算法與NAS算法組合對模型性能影響不大(表3中序號17、18)。組合MC算法與MSC算法以及組合SGS算法與NAS算法(表3中序號19、20)進行預(yù)處理后,不僅模型的預(yù)測準確性明顯降低,其穩(wěn)健性也變差。經(jīng)DD算法與NAS算法(表3中序號21)組合預(yù)處理后,模型的預(yù)測準確性有所提高,但穩(wěn)健性變差。
表3 組合2 種算法對模型性能的影響Table3 Effects of combining two algorithms on the models performance
2.3.3 組合3 種算法對模型性能的影響
如表4所示,組合MC算法、導(dǎo)數(shù)類算法、NAS算法以及組合MC、DD、BLC算法(表4中序號2~4)進行預(yù)處理后,模型的預(yù)測準確性和穩(wěn)健性均明顯提高。經(jīng)其他一些算法(表4中序號5~9)組合預(yù)處理后,模型過度擬合,穩(wěn)健性變差。組合另一些算法(表4中序號10~16)對樣品的光譜信息進行預(yù)處理后,模型擬合不足,預(yù)測準確性變差。組合MC算法、SGD算法與SNV算法以及導(dǎo)數(shù)類算法、SGS算法與NAS算法(表4中序17~19)進行預(yù)處理后,不僅模型的預(yù)測準確性明顯降低,其穩(wěn)健性也變差。經(jīng)AS算法、導(dǎo)數(shù)類算法與DT算法(表4中序號20、21)組合預(yù)處理后,模型的預(yù)測準確性有所提高,但穩(wěn)健性變差。組合MC、DD算法與SNV算法以及AS算法、導(dǎo)數(shù)類算法與SNV算法(表4中序號22~24)進行預(yù)處理后,模型的SEC和SEP均有所增大且模型的主成分數(shù)較小,可以看出樣品的光譜信息在預(yù)處理過程中丟失了大量的細節(jié)信息,模型出現(xiàn)擬合不足的趨勢。
表4 組合3 種算法對模型性能的影響Table4 Effects of combining three algorithms on the model performance
2.3.4 組合4種算法對模型性能的影響
表5 組合4 種算法對模型性能的影響Table5 Effects of combining four algorithms on the model performance
如表5所示,數(shù)據(jù)增強類算法與導(dǎo)數(shù)類算法、SGS算法和MSC算法組合(表5中序號2~5)進行預(yù)處理后,模型明顯擬合不足。組合AS算法與導(dǎo)數(shù)類算法、SGS算法和SNV算法(表5中序號6、7)進行預(yù)處理,模型的SEC 和SEP均有所增大且模型的主成分數(shù)減小,模型有擬合不足的趨勢。經(jīng)其他算法組合預(yù)處理后(未列出),模型不同程度的都出現(xiàn)了預(yù)測準確性下降和主成分數(shù)減小的情況。由此可見,組合4 種算法進行預(yù)處理,在去除噪聲的同時樣品的光譜信息中也丟失了大量反映細節(jié)的有效信息,導(dǎo)致模型擬合不足,模型對樣品的預(yù)測準確性差。
2.3.5 最佳預(yù)處理算法及模型參數(shù)
通過模型性能評價指標對不同算法參數(shù)組合和算法組合的預(yù)處理效果進行篩選后發(fā)現(xiàn),在建模前對樣品的近紅外光譜信息進行差分求導(dǎo)(窗口數(shù)為6,求導(dǎo)階次為1)后,模型性能最佳。模型的SEC和SEP分別為1.21 和1.31,SEP/SEC=1.08,主成分數(shù)為10(表2中序號5),校正集相關(guān)系數(shù)(ratio of calibration,Rc)和驗證集相關(guān)系數(shù)(ratio of prediction,Rp)分別為0.94和0.92。
圖2 校正集和驗證集樣品的TVB-N含量與模型預(yù)測值相對應(yīng)的散點圖Fig.2 Scatter plot of measured versus predicted TVB-N content for calibration and prediction set samples
分別以校正集和驗證集樣品的TVB-N含量為橫坐標,模型的預(yù)測值為縱坐標作圖,如圖2所示。校正集中,模型的預(yù)測值與校正集樣品的TVB-N含量吻合度較高,模型的SEC為1.21,Rc為0.94,說明建模前對樣品的光譜信息進行差分求導(dǎo)后,模型較好的擬合了光譜信息中反映樣品TVB-N含量的信息。驗證集中,樣品的TVB-N含量和模型的預(yù)測值相關(guān)性較高,SEP為1.31,Rp為0.92,說明模型對驗證集樣品中的TVB-N含量有較好的預(yù)測準確性。
本研究以生鮮羊肉中的TVB-N含量作為檢測對象,使用便攜式近紅外儀對完整樣品進行近紅外光譜信息的采集,從模型的預(yù)測準確性和穩(wěn)健性兩方面探討算法參數(shù)和算法組合對模型性能的影響,篩選出針對檢測生鮮羊肉中的TVB-N含量的最佳預(yù)處理方法。在篩選的過程中發(fā)現(xiàn):不同的算法、算法參數(shù)和算法組合對模型性能的影響差別較大,恰當?shù)念A(yù)處理可以明顯提高模型性能,不當?shù)念A(yù)處理會降低模型性能,所以在對樣品光譜信息進行預(yù)處理的過程中,有必要先對算法的參數(shù)組合進行優(yōu)化;主成分數(shù)組合多種算法進行預(yù)處理時,增加算法的數(shù)量不一定能提高模型性能,相反,當組合的算法過多時,會對樣品的光譜信息預(yù)處理過度,在去除噪聲的同時也丟失了大量的細節(jié)信息,導(dǎo)致模型擬合不足,預(yù)測準確性減小。所以算法的數(shù)量不宜過多。組合不同算法進行預(yù)處理時,預(yù)處理效果不線性疊加。
針對檢測生鮮羊肉中的TVB-N含量,對樣品的近紅外光譜信息進行差分求導(dǎo)(窗口數(shù)為6,求導(dǎo)階次為1)
后建模,模型性能最佳。模型的SEC和SEP分別為1.21和1.31,SEP/SEC=1.08小于1.2,主成分數(shù)為10,Rc和Rp分別為0.94和0.92。說明單獨使用差分導(dǎo)數(shù)可以有效減弱檢測過程中便攜式近紅外儀和樣品組織結(jié)構(gòu)等對樣品光譜信息的影響,提高模型的預(yù)測準確性和穩(wěn)健性,實現(xiàn)現(xiàn)場快速無損檢測生鮮羊肉TVB-N的目的。
本研究沒有考慮算法組合中算法順序?qū)δP托阅苡绊懀聦嵣?,本研究選用的算法部分是非線性的,所以算法順序也會影響模型的性能,日后還需做進一步研究。
[1] 張蕾蕾, 彭彥昆, 陶斐斐, 等. 肉品揮發(fā)性鹽基氮的高光譜無損快速檢測[J]. 食品安全質(zhì)量檢測學報, 2012, 3(6): 575-579.
[2] 上海市食品衛(wèi)生監(jiān)督檢驗所. 肉與肉制品衛(wèi)生標準的分析方法: GB/T 5009.44—2003[S]. 北京: 中國標準出版社, 2003.
[3] 商務(wù)部屠宰技術(shù)鑒定中心, 江蘇雨潤食品產(chǎn)業(yè)集團有限公司. 鮮、凍胴體羊肉: GB/T 9961—2008[S]. 北京: 中國標準出版社, 2008.
[4] 郭亞萍, 張永春, 陳宇. 鮮肉中揮發(fā)性鹽基氮含量測定的不確定度評定[J]. 北京工商大學學報(自然科學版), 2011, 29(2): 37-41. DOI:10.3969/j.issn.2095-6002.2011.02.008.
[5] 劉雪云. 揮發(fā)性鹽基氮檢測方法的現(xiàn)狀及研究[J]. 農(nóng)產(chǎn)品加工(學刊), 2014(1): 51-53.
[6] 趙峰, 林河通, 楊江帆, 等. 基于近紅外光譜的武夷巖茶品質(zhì)成分在線檢測[J]. 農(nóng)業(yè)工程學報, 2014, 30(2): 269-277.
[7] 介鄧飛, 陳猛, 謝麗娟, 等. 適宜西瓜檢測部位提高近紅外光譜糖度預(yù)測模型精度[J]. 農(nóng)業(yè)工程學報, 2014, 30(9): 229-234. DOI:10.3969/j.issn.1002-6819.2014.09.028.
[8] 張瑤, 李民贊, 鄭立華, 等. 基于近紅外光譜分析的土壤分層氮素含量預(yù)測[J]. 農(nóng)業(yè)工程學報, 2015, 31(9): 121-126. DOI:10.11975/ j.issn.1002-6819.2015.09.019.
[9] 呂杰, 郝寧燕, 崔曉臨. 利用可見光近紅外的尾礦區(qū)農(nóng)田土壤Cu含量反演[J]. 農(nóng)業(yè)工程學報, 2015, 31(9): 265-270. DOI:10.11975/ j.issn.1002-6819.2015.09.040.
[10] 李東華, 潘園園, 張卉. 利用近紅外光譜技術(shù)檢測摻假豆?jié){[J]. 農(nóng)業(yè)工程學報, 2014, 30(3): 238-242.
[11] KAMRUZZAMAN M, ELMASRY G, SUN Dawen, et al. Nondestructive prediction and visualization of chemical composition in lamb meat using NIR hyperspectral imaging and multivariate regression[J]. Innovative Food Science and Emerging Technologies, 2012, 16: 218-226. DOI:10.1016/j.ifset.2012.06.003.
[12] 蔡健榮, 萬新民, 陳全勝. 近紅外光譜法快速檢測豬肉中揮發(fā)性鹽基氮的含量[J]. 光學學報, 2009, 29(10): 2808-2811.
[13] 馬世榜, 彭彥昆, 徐楊, 等. 可見/近紅外光譜結(jié)合變量選擇方法檢測牛肉揮發(fā)性鹽基氮[J]. 江蘇大學學報(自然科學版), 2013, 34(1): 44-48. DOI:10.3969/j.issn.1671-7775.2013.01.009.
[14] 陳偉華, 許長華, 樊玉霞, 等. 近紅外光譜技術(shù)快速無損評價羅非魚片新鮮度[J]. 食品科學, 2014, 35(24): 164-168. DOI:10.7506/ spkx1002-6630-201424031.
[15] 黃濤, 李小昱, 彭毅, 等. 基于近紅外光譜的淡水魚新鮮度在線檢測方法研究[J]. 光譜學與光譜分析, 2014, 34(10): 2732-2736. DOI:10.3964/j.issn.1000-0593(2014)10-2732-05.
[16] 楊勇, 王殿友, 楊慶余, 等. 近紅外光譜技術(shù)快速測定鵝肉新鮮度[J].食品科學, 2014, 35(24): 239-242. DOI:10.7506/spkx1002-6630-201424046.
[17] 劉源, 陳偉華, 侯巧娟, 等. 應(yīng)用近紅外光譜技術(shù)評價冰鮮大黃魚新鮮度的研究[J]. 光譜學與光譜分析, 2014, 34(4): 937-941. DOI:10.3964/j.issn.1000-0593(2014)04-0937-05.
[18] 楊建松, 孟慶翔, 任麗萍, 等. 近紅外光譜法快速測定牛肉品質(zhì)[J].光譜學與光譜分析, 2010, 30(3): 685-687.
[19] 劉魁武, 成芳, 林宏建, 等. 可見/近紅外光譜檢測冷鮮豬肉中的脂肪、蛋白質(zhì)和水分含量[J]. 光譜學與光譜分析, 2009, 29(1): 102-105. DOI:10.3964/j.issn.1000-0593(2009)01-0102-04.
[20] ALOMAR D, GALLO C, FUCHSLOCHER R, et al. Chemical and discriminant analysis of bovine meat by near infrared reflectance spectroscopy (NIRS)[J]. Meat Science, 2003, 63(4): 441-450. DOI:10.1016/S0309-1740(02)00101-8.
[21] PRIETO N, ANDRéS S, GIRáLDEZ F J, et al. Potential use of near infrared reflectance spectroscopy (NIRS) for the estimation of chemical composition of oxen meat samples[J]. Meat Science, 2006, 74(3): 487-496. DOI:10.1016/j.meatsci.2006.04.030.
[22] RIPOLL G, ALBERTí P, PANEA B, et al. Near-infrared reflectance spectroscopy for predicting chemical, instrumental and sensory quality of beef[J]. Meat Science, 2008, 80(3): 697-702. DOI:10.1016/ j.meatsci.2008.03.009.
[23] 陶琳麗, 楊秀娟, 鄧君明, 等. 禽畜肉化學成分近紅外光譜檢測技術(shù)研究進展[J]. 光譜學與光譜分析, 2013, 33(11): 3002-3009.
[24] AACC. Near-infrared methods-guidelines for model development and maintenance: method 39-00[S].
[25] 夏俊芳, 李培武, 李小昱, 等. 不同預(yù)處理對近紅外光譜檢測臍橙VC含量的影響[J]. 農(nóng)業(yè)機械學報, 2007, 38(6): 107-111. DOI:10.3969/ j.issn.1000-1298.2007.06.027.
[26] 王遠輝, 黎慶濤, 姜毅, 等. 在線檢測白砂糖近紅外光譜的預(yù)處理方法研究[J]. 食品科技, 2009, 34(8): 283-286.
[27] 江澤慧, 費本華, 楊忠. 光譜預(yù)處理對近紅外光譜預(yù)測木材纖維素結(jié)晶度的影響[J]. 光譜學與光譜分析, 2007, 27(3): 435-438. DOI:10.3321/j.issn:1000-0593.2007.03.006.
[28] 吳靜珠, 李慧, 王克棟, 等. 光譜預(yù)處理在農(nóng)業(yè)產(chǎn)品近紅外模型優(yōu)化中的應(yīng)用研究[J]. 農(nóng)機化研究, 2011(3): 178-181.
[29] 嚴衍祿, 陳斌, 朱大洲, 等. 近紅外光譜分析的原理、技術(shù)與應(yīng)用[M].北京: 中國輕工業(yè)出版社, 2013: 170-171.
[30] 褚小立, 袁洪福, 陸婉珍. 近紅外分析中光譜預(yù)處理及波長選擇方法進展與應(yīng)用[J]. 化學進展, 2004, 16(4): 528-542. DOI:10.3321/ j.issn:1005-281X.2004.04.008.
[31] 尼珍, 胡昌勤, 馮芳. 近紅外分析中光譜預(yù)處理方法的作用及其發(fā)展[J]. 藥物分析雜志, 2008, 28(5): 824-829.
Effects of Spectral Pretreatments on Prediction of Total Volatile Basic Nitrogen (TVB-N) Content in Mutton Using Near Infrared Spectroscopy
ZOU Hao1, TIAN Hanyou1, LIU Fei1, LI Wencai1, WANG Hui1, LI Jiapeng1, CHEN Wenhua1, DI Yanquan2, QIAO Xiaoling1,*
(1. Beijing Key Laboratory of Meat Processing Technology, China Meat Research Center, Beijing 100068, China; 2. Focused Photonics Inc., Hangzhou 310052, China)
This study aimed at in situ, rapid and nondestructive detection of total volatile basic nitrogen (TVB-N) content in fresh raw mutton using near infrared spectroscopy. We checked whether the impact of porTablenear infrared spectrometer and microstructure of samples on the spectral information of the samples could be reduced or even eliminated by adjusting algorithm parameters and combing different algorithms for the purpose of improving the accuracy and robustness of the prediction model developed. Various individual algorithms with different parameter combinations and various algorithm combinations were used to pretreat the spectral information of the samples for modeling. The effects of algorithm parameters and algorithm combinations on the performance of the model in terms of predictive accuracy and stability were evaluated and discussed to find the optimal pretreatment method. The results showed that different algorithm parameter combinations and different algorithm combinations distinctly affected the model performance. When the spectral information of the sample was pretreated with difference derivatives (window parameter is 6, and order of differentiation is 1), the best model performance was achieved. The standard error of calibration (SEC) and standard error of prediction (SEP) of the model were 1.21 and 1.31, respectively, with SEP/SEC = 1.08 < 1.2. The number of principal components was 10. The correlation coefficients of calibration and prediction were 0.94 and 0.92, respectively. Our study verified that spectral information pretreatment with proper algorithm parameter combination and algorithm combination can significantly improve the model performance and allow fast, non-destructive and on-the-spot detection of TVB-N in mutton.
near infrared spectroscopy; pretreatment; fresh raw mutton; TVB-N; porTablenear infrared spectrometer
10.7506/spkx1002-6630-201622027
O657.33
A
1002-6630(2016)22-0180-07
鄒昊, 田寒友, 劉飛, 等. 近紅外光譜的預(yù)處理對羊肉TVB-N模型的影響[J]. 食品科學, 2016, 37(22): 180-186. DOI:10.7506/spkx1002-6630-201622027. http://www.spkx.net.cn
ZOU Hao, TIAN Hanyou, LIU Fei, et al. Effects of spectral pretreatments on prediction of total volatile basic nitrogen (TVB-N) content in mutton using near infrared spectroscopy[J]. Food Science, 2016, 37(22): 180-186. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-201622027. http://www.spkx.net.cn
2016-05-05
“十二五”國家科技支撐計劃項目(2014BAD04B05)
鄒昊(1988—),男,學士,研究方向為肉品品質(zhì)無損檢測技術(shù)。E-mail:1016039906@qq.com
*通信作者:喬曉玲(1964—),女,教授級高級工程師,學士,研究方向為肉制品加工技術(shù)。E-mail:cmrcsen@126.com