郝 勇,吳文輝,商慶園
華東交通大學(xué)機(jī)電與車輛工程學(xué)院,江西 南昌 330013
飼料營(yíng)養(yǎng)的精準(zhǔn)配制不僅可以提高飼料的質(zhì)量,還可以節(jié)約成本。粗脂肪和粗纖維是飼料主要成分,其含量檢測(cè)是飼料精準(zhǔn)配制的重要環(huán)節(jié),傳統(tǒng)的飼料成分方法為濕化學(xué)檢測(cè)方法其靈敏度和精確度高,但操作復(fù)雜、檢測(cè)時(shí)間長(zhǎng)、成本高。近紅外技術(shù)作為一種快速無污染的檢測(cè)方法廣泛應(yīng)用于農(nóng)業(yè)、林業(yè)、化工、制藥等行業(yè)。如Sagrario Modrono等運(yùn)用便攜式光譜儀實(shí)現(xiàn)了飼料中蛋白質(zhì)、粗纖維和淀粉等組分的實(shí)時(shí)測(cè)定[1]; Patrica A.Harris等運(yùn)用近紅外光譜分析方法準(zhǔn)確分析了馬蹄草的營(yíng)養(yǎng)成分[2]; Lusia Mandrile等運(yùn)用近紅外光譜進(jìn)行飼料中蟲類蛋白含量的檢測(cè)等[3]。
本文利用近紅外光譜實(shí)現(xiàn)對(duì)飼料的粗脂肪和粗纖維的含量檢測(cè),在利用近紅外光譜建立含量分析回歸模型前,采用光譜預(yù)處理方法和變量選擇方法來簡(jiǎn)化模型,以提高模型分析精度。
收集了不同廠家不同時(shí)期生產(chǎn)的飼料樣本325個(gè),包括乳豬飼料、中豬飼料和大豬飼料。在采集近紅外光譜前先將樣本利用高速萬能粉碎機(jī)(FW135)粉碎,過40目篩,制成粉末狀樣本。飼料的粗脂肪和粗纖維的實(shí)際含量按照國(guó)家標(biāo)準(zhǔn)GB/T 6433—2006和GB/T 6434—2006確定。
使用瑞士步琦公司NIR-Flex N-500傅里葉近紅外光譜儀,其波數(shù)范圍為10 000~4 000 cm-1。為了保證光譜儀的正常運(yùn)行和所獲光譜的一致性,飼料樣本的厚度統(tǒng)一為4 mm,實(shí)驗(yàn)室溫度為10~30 ℃,濕度為30%RH~70%RH。本文共獲取352條飼料光譜,每條光譜由1 501個(gè)變量組成。
建立飼料粗脂肪和粗纖維定量識(shí)別模型時(shí),352個(gè)樣本光譜根據(jù)x-y聯(lián)合距離劃分樣本集算法(sample set partitioning based on joint x-y distance,SPXY)按照2∶1比例劃分為校正集和預(yù)測(cè)集,校正集有235個(gè)樣本,預(yù)測(cè)集含有117個(gè)樣本[4]。
為消除背景噪聲的影響需要對(duì)原始光譜進(jìn)行預(yù)處理。常用的光譜預(yù)處理方法主要分為兩大類: 光譜導(dǎo)數(shù)法和散射校正法,其中Norris-Williams導(dǎo)數(shù)法(Norris-Williams derivation,NW)和多元散射校正法(multiplicative scatter correction,MSC)有較好的光譜預(yù)處理效果[5-6]。
每條飼料的近紅外光譜有1 501個(gè)變量,其包含了飼料的全部信息。變量選擇方法通過選擇有用變量去除冗余信息來簡(jiǎn)化模型,提高模型精度。變量選擇方法有很多,本文采用蒙特卡羅無信息變量消除法[7-9](Monte carlo based uninformative variable elimination,MCUVE)、變量組合集群分析法[10-12](variables combination population analysis,VCPA)和區(qū)間變量迭代空間收縮法[13-14](interval variable iterative space shrinkage approach,iVISSA)進(jìn)行變量選擇并比較結(jié)果,從而確定最優(yōu)的變量選擇方法。
光譜經(jīng)過預(yù)處理和變量選擇后,利用校正集樣品建立飼料粗脂肪和粗纖維含量模型,再利用預(yù)測(cè)集樣品來對(duì)模型進(jìn)行驗(yàn)證,確定模型能否達(dá)到粗脂肪和粗纖維的含量分析要求。采用校正集相關(guān)系數(shù)Rc、預(yù)測(cè)集相關(guān)系數(shù)Rp、交叉驗(yàn)證均方根誤差RMSECV、預(yù)測(cè)集均方根誤差RMSEP等指標(biāo)來評(píng)價(jià)模型的預(yù)測(cè)精度和穩(wěn)健性[15-17]。
飼料中粗脂肪和粗纖維的實(shí)際含量統(tǒng)計(jì)信息如表1所示。
表1 飼料中粗脂肪和粗纖維含量統(tǒng)計(jì)表(單位: %)
Table1Statisticaltableofcrudefatandcorasefibercontentinfeed(unitofcontent: %)
類別最大值最小值均值標(biāo)準(zhǔn)差粗脂肪4.182.623.460.42粗纖維4.661.913.190.68
采用NW導(dǎo)數(shù)和MSC對(duì)光譜進(jìn)行預(yù)處理。其中NW導(dǎo)數(shù)包括平滑法(NW0th)、一階導(dǎo)數(shù)法(NW1st)和二階導(dǎo)數(shù)法(NW2nd)三種方法,同時(shí)還利用NW1st-MSC方法來進(jìn)行預(yù)處理。如表2所示為不同預(yù)處理方法的飼料粗脂肪和粗纖維含量模型結(jié)果。
表2 不同預(yù)處理方法的飼料粗脂肪和粗纖維含量模型結(jié)果
通過表2可以看出,相比與原始光譜的PLS模型,經(jīng)NW0th,NW1st和NW2nd三種方法處理后的模型都沒起到明顯的效果。而MSC與NW1st-MSC方法對(duì)飼料噪聲去除有明顯效果,對(duì)粗脂肪模型精度有明顯的提升。在粗脂肪模型中,相比于NW1st-MSC方法,單獨(dú)使用MSC預(yù)處理方法能夠更好的實(shí)現(xiàn)光譜的信息提取,校正集的RMSECV由0.74下降到0.64,Rc由0.84提高到0.87。在粗纖維模型中,MSC的RMSEP相比于未經(jīng)處理的有著0.01的提升,而RMSECV與Rc基本相同; NW1st-MSC處理后的效果與原始光譜模型一致。因此,針對(duì)飼料的粗脂肪和粗纖維含量分析的光譜預(yù)處理采用MSC方法。圖1為飼料的原始近紅外光譜和經(jīng)過MSC預(yù)處理后的光譜。MSC修正了光譜間的相對(duì)基線平移和偏移,使光譜更為緊密。
圖1 飼料的近紅外光譜與MSC預(yù)處理后的光譜
飼料光譜經(jīng)過MSC預(yù)處理后,分別利用MCUVE,VCPA和iVISSA三種變量選擇方法結(jié)合PLS建立飼料粗脂肪含量分析模型。圖2為不同變量選擇方法的脂肪含量分析PLS模型校正和測(cè)試相關(guān)圖。
圖2(a)為利用經(jīng)過MSC預(yù)處理的光譜建立的PLS模型,其校正集和測(cè)試集的回歸直線基本重合,相關(guān)系數(shù)Rc和Rp分別為0.87和0.88。模型的RMSECV和RMSEP分別為0.21和0.20。圖2(b)為MSC-MCUVE-PLS模型,圖中可以看出校正集與測(cè)試集相比與MSC-PLS模型分布更為緊密,Rc為0.92,RMSECV為0.17。相比于全譜的模型其校正模型更為穩(wěn)定,精度更高。同時(shí),Rp相較于MSC-PLS模型提高了0.01,且RMSEP降低了0.01,變量數(shù)Vn為400,大幅度降低。圖2(c)為MSC-VCPA-PLS模型,在校正模型中Rc為0.87,RMSECV為0.21與全譜的PLS模型相同,而Rp為0.81,RMSEP為0.25,與MSC-PLS模型相比起預(yù)測(cè)結(jié)果相差較多。Vn為12個(gè),小于全譜變量數(shù)和MCUVE篩選后的變量數(shù)。圖2(d)為MSC-iVISSA-PLS模型,在此模型中Rc為0.86,RMSECV為0.21與全譜的校正集模型相同,同時(shí)預(yù)測(cè)集的Rp為0.87,RMSEP為0.20且與全譜的預(yù)測(cè)值相同,Vn為20與VCPA選擇的變量數(shù)近似。
圖2 不同變量選擇方法的飼料粗脂肪含量分析PLS模型校正和測(cè)試相關(guān)圖
通過圖2可以看出三種變量選擇方法中,經(jīng)MCUVE方法變量選擇后,其模型的各個(gè)參數(shù)都優(yōu)于全譜模型。經(jīng)VCPA和iVISSA方法選擇后都以極少的變量建立檢測(cè)模型且與全譜模型幾乎相同。若精度要求不高時(shí),可以選擇VCPA和iVISSA方法進(jìn)行變量選擇,建立更簡(jiǎn)潔的模型; 若要提升精度,MCUVE則是最好的選擇。
如圖3為經(jīng)不同變量選擇方法的粗纖維定量分析模型相關(guān)圖。圖3(a)為經(jīng)MSC預(yù)處理后由全譜1501個(gè)變量建立的PLS模型,其校正集相關(guān)系數(shù)Rc為0.91,RMSECV為0.28,在測(cè)試集中Rp為0.95,RMSEP為0.25。圖3(b)為經(jīng)過MCUVE變量選擇后的模型,選擇后剩余740個(gè)變量用于模型分析,其Rc和Rp分別為0.95和0.94,較全譜模型的校正集Rc提高了0.04。同時(shí)RMSECV為0.23,較全譜模型降低了0.05,RMSEP降低了0.02,Vn為740,由此可知MCUVE變量選擇法有效地選擇了有用變量,提高了模型的精度。
圖3(c)為經(jīng)過VCPA變量選擇后建立的PLS模型,由圖可知,經(jīng)過VCPA選擇了11個(gè)變量來建立模型,相比與全譜和MCUVE方法,VCPA用極少的變量實(shí)現(xiàn)了幾乎相同的結(jié)果,其校正集Rc為0.91,RMSECV為0.27略好于全譜校正模型,預(yù)測(cè)集Rp和RMSEP都差于全譜。圖3(d)為iVISSA變量選擇后的飼料粗纖維檢測(cè)模型,模型的建立基于20個(gè)變量,其Rc為0.90,RMSECV為0.29,Rp為0.93,RMSEP為0.27相比與全譜和MCUVE模型較差,但較于VCPA模型更好。
對(duì)比三種變量選擇方法,可以看出MCUVE變量選擇方法校正集模型參數(shù)優(yōu)于全譜模型,而預(yù)測(cè)集的參數(shù)與全譜預(yù)測(cè)集參數(shù)幾乎一致,因其變量數(shù)少于全譜,則模型更為簡(jiǎn)潔。利用VCPA和iVISSA進(jìn)行變量選擇后,都剩余極少變量,部分有用信息變量被剔除,因而其模型參數(shù)較全譜都稍差一些,其優(yōu)點(diǎn)是模型簡(jiǎn)單。
圖3 不同變量選擇方法的飼料粗纖維含量分析PLS模型校正和測(cè)試相關(guān)圖
近紅外光譜分析方法用于飼料中粗脂肪和粗纖維的定量分析,采用不同的光譜預(yù)處理方法和光譜變量選擇方法對(duì)光譜模型進(jìn)行優(yōu)化。結(jié)果表明,在飼料粗脂肪定量分析中,MSC預(yù)處理方法結(jié)合MCUVE變量選擇方法可以建立最優(yōu)粗脂肪分析模型,模型變量數(shù)由1 501降低到400,RMSEP和RMSECV分別降低為0.19和0.17,Rp和Rc提高到0.89和0.92; 在飼料粗纖維定量分析中,利用MSC預(yù)處理方法和MCUVE變量選擇方法可以實(shí)現(xiàn)最優(yōu)的粗纖維定量分析模型,模型變量數(shù)為740,模型的RMSEP和RMSECV分別為0.23和0.23,Rp和Rc分別為0.94和0.95。因此,基于近紅外光譜建立的MSC-MCUVE-PLS模型可以有效的進(jìn)行飼料的粗脂肪和粗纖維的定量分析,其精度高,穩(wěn)定性好且更簡(jiǎn)潔。