程文宇 管 驍 劉 靜
(1.上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海 200093;2.上海海事大學(xué)信息工程學(xué)院,上海 200135)
乳制品中非法添加三聚氰胺,長(zhǎng)期或反復(fù)大量攝入會(huì)對(duì)腎與膀胱產(chǎn)生影響,導(dǎo)致腎結(jié)石。三鹿毒奶粉事件的直接原因即是奶粉中含有超量三聚氰胺[1]。為了維護(hù)乳制品安全,不同國(guó)家對(duì)其中的三聚氰胺限量有不同要求。中國(guó)政府2008年明確規(guī)定,乳制品中(包括原料乳)三聚氰胺含量不得超過(guò)2.5mg/kg[2];國(guó)際食品法典委員會(huì)2012年7月規(guī)定每公斤液態(tài)牛奶中三聚氰胺含量不得超過(guò)0.15mg[3]。
三聚氰胺的常用檢測(cè)方法主要有高效液相色譜法和氣質(zhì)聯(lián)用法,但這些方法主要在實(shí)驗(yàn)室進(jìn)行,且需要專(zhuān)業(yè)操作人員,不利于原料乳品質(zhì)的在線監(jiān)控[4]。在計(jì)算機(jī)技術(shù)的飛速發(fā)展、光學(xué)技術(shù)和化學(xué)計(jì)量學(xué)方法的不斷進(jìn)步下,近紅外光譜分析技術(shù)在多個(gè)領(lǐng)域顯示了其獨(dú)特的優(yōu)勢(shì),其中無(wú)損、高效、快速、成本低、無(wú)污染的優(yōu)點(diǎn),使其明顯優(yōu)于傳統(tǒng)的分析檢測(cè)技術(shù),而且樣品無(wú)需預(yù)處理,更加便于實(shí)現(xiàn)在線分析[5]。
有機(jī)物在近紅外光譜區(qū)主要表現(xiàn)為含氫官能團(tuán)X—H(X═C、N、O、S)基頻振動(dòng)的不同倍頻與合頻吸收峰,由于合頻和倍頻躍遷幾率低,譜帶強(qiáng)度弱并重疊嚴(yán)重,因此提取的有用信息為弱信息和多元信息,對(duì)微量物質(zhì)的定量效果往往不佳。劉景旺等[6]利用近紅外光譜對(duì)牛奶中的三聚氰胺進(jìn)行了檢測(cè),但存在準(zhǔn)確性不高等問(wèn)題。近年來(lái)隨著化學(xué)計(jì)量學(xué)的發(fā)展,近紅外技術(shù)結(jié)合適當(dāng)?shù)幕瘜W(xué)計(jì)量學(xué)處理方法,可以對(duì)食品組成成分以及外源添加物進(jìn)行定性判別[6-8],并有效提高檢測(cè)限度。
小波變換被譽(yù)為數(shù)學(xué)上的顯微鏡,是一種理想的信號(hào)處理方法,它能將重疊的混合信號(hào)轉(zhuǎn)變?yōu)椴煌l率的基元信號(hào),具有多分辨率、方向選擇性等特點(diǎn),可對(duì)信號(hào)進(jìn)行局部化分析[9]。在近紅外光譜分析中,小波變換可以有效地消除光譜噪音,提高局部特征信號(hào)[10],是近紅外光譜預(yù)處理常用的方法之一。本研究擬通過(guò)近紅外光譜小波變換結(jié)合主成分分析以及廣義回歸神經(jīng)網(wǎng)絡(luò)(WT—PCA—GRNN)對(duì)添加三聚氰胺的液態(tài)奶進(jìn)行定量分析,并結(jié)合支持向量機(jī)(WT—PCA—SVM)對(duì)其進(jìn)行定性判別,目的是探討近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)液態(tài)奶中三聚氰胺快速檢測(cè)的可行性,為快速檢測(cè)液態(tài)奶中的三聚氰胺提供理論依據(jù)。
傅里葉近紅外光譜儀:MPA型,德國(guó)Bruker公司。光譜采集模式為漫反射(光纖),譜區(qū)范圍4 000~12 501cm-1,分辨率8cm-1,掃描次數(shù)64次;
電子天平:AB104-N型,上海第二天平儀器廠;
均質(zhì)機(jī):APV1000型,上海順儀實(shí)驗(yàn)設(shè)備有限公司。
將取自上海金山奶牛場(chǎng)的新鮮原料乳,通過(guò)蒸餾水稀釋配制成蛋白質(zhì)濃度為1.5%的基底乳,備用。將不等量的三聚氰胺分別摻入基底乳中模擬摻假試樣,三聚氰胺摻入量控制在0.001%~1.000%(質(zhì)量分?jǐn)?shù)),在均勻分布濃度梯度下,共制備54組樣本。在建模時(shí)從54組樣本中隨機(jī)選取15組作為定量模型的測(cè)試集,剩余39組樣為訓(xùn)練集。另外取18組未添加三聚氰胺的原料乳樣本,分別用蒸餾水稀釋至蛋白質(zhì)含量為1.5%~3.2%(質(zhì)量分?jǐn)?shù)),濃度梯度0.1%。表1為訓(xùn)練集和測(cè)試集劃分結(jié)果。
將樣品在恒溫水浴鍋中保持25℃、環(huán)境相對(duì)濕度為45%,使機(jī)器開(kāi)機(jī)預(yù)熱10min。采集光譜前,將不同樣本用轉(zhuǎn)速2 000r/min均質(zhì)機(jī)攪拌60s。樣本的漫反射近紅外光譜利用光纖探頭采集,每組樣本測(cè)量10次,取平均值作為該樣本典型光譜,每組樣本光譜由2 203個(gè)數(shù)據(jù)點(diǎn)構(gòu)成。數(shù)據(jù)采集軟件為OPUS 6.5,數(shù)據(jù)處理分析軟件為 Matlab R2009b。
本試驗(yàn)采用Daubechies(db2)小波對(duì)原始光譜信號(hào)進(jìn)行4層小波分解[6]。處理效果見(jiàn)圖1。
表1 測(cè)試集的選擇結(jié)果Table 1 Results ofdivision of test set
表1 測(cè)試集的選擇結(jié)果Table 1 Results ofdivision of test set
*用于測(cè)試集。
序號(hào) 三聚氰胺質(zhì)量分?jǐn)?shù)/% 序號(hào) 三聚氰胺質(zhì)量分?jǐn)?shù)/% 序號(hào) 三聚氰胺質(zhì)量分?jǐn)?shù)/%1 2 3 4 5 6 7 8 9 1 0 11 12 13 14 15 16 17 18 0.001*0.002 0.003 0.004*0.005 0.006 0.007 0.008 0.009 0.010*0.012 0.014 0.016 0.018 0.020*0.022 0.024*0.028*0.030 0.032 0.034 0.036 0.038*0.040 0.045*0.050 0.055*0.060 0.065 0.070*0.075 0.080 0.085 0.090*0.100 0.150 0.200 0.250 0.300*0.350 0.400 0.450 0.500 0.550 0.600*0.650*0.700 0.750 0.800 0.850*0.900 0.026 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 360.095 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 541.000
圖1 小波變換圖譜Figure 1 Transformed spectrums by WT
據(jù)報(bào)道[11],三聚氰胺中NH2的波動(dòng)處于近紅外區(qū)域,在6 644~6 812cm-1間有明顯的吸收峰,而根據(jù)朗伯—貝耳定律,紅外線通過(guò)水分時(shí)是被選擇性吸收,其吸收量大小遵循近紅外輻射經(jīng)過(guò)物質(zhì)后的光強(qiáng),與物質(zhì)的濃度(水分含量)之間存在一定關(guān)系,即吸收能量隨著被測(cè)物濃度的增加而增加[12]。
為驗(yàn)證三聚氰胺在波數(shù)為6 644~6 812cm-1區(qū)域內(nèi)的吸收峰,將小波變換后的圖譜進(jìn)行一階導(dǎo)數(shù)分析,先將6 644~6 812cm-1內(nèi)43個(gè)光譜數(shù)值擬合成多元函數(shù),處理后發(fā)現(xiàn)最大導(dǎo)數(shù)值處為6 792cm-1,因此選取6 792cm-1處進(jìn)行分析,將所有樣品的光譜在該處導(dǎo)數(shù)進(jìn)行比較分析,結(jié)果見(jiàn)圖2。
圖2 不同三聚氰胺濃度下6 972cm-1導(dǎo)數(shù)值Figure 2 Derivative value at 6 972cm-1 at different concentrations
由圖2可知,三聚氰胺濃度與6 792cm-1處導(dǎo)數(shù)值基本成正比例關(guān)系,這與三聚氰胺在6 644~6 812cm-1內(nèi)存在吸收峰的推斷吻合。但由圖2也不難發(fā)現(xiàn),當(dāng)三聚氰胺在濃度低于0.05%時(shí),濃度與峰值導(dǎo)數(shù)比例關(guān)系并不明顯,并且有幾組樣品在6 792cm-1處導(dǎo)數(shù)為負(fù)值,這是由于樣品背景及其它組分等干擾,以及設(shè)備等系統(tǒng)誤差所共同導(dǎo)致的光譜峰漂移[13,14]。
由于低濃度變化規(guī)律不明顯以及光譜漂移等問(wèn)題,本試驗(yàn)采用主成分分析(PCA)對(duì)光譜進(jìn)一步處理。主成分分析是通過(guò)線性變換重新組合原來(lái)具有一定相關(guān)性的眾多指標(biāo),選出較少個(gè)數(shù)重要且互不相關(guān)的變量,從而使進(jìn)一步研究變得簡(jiǎn)單的一種多元統(tǒng)計(jì)分析方法[15]。本試驗(yàn)?zāi)康氖菍? 644~6 812cm-1內(nèi)已被小波變換放大的特征信號(hào)進(jìn)行進(jìn)一步提取,獲得更具代表性的特征值進(jìn)行后續(xù)分析。表2為主成分分析結(jié)果。
表2 主成分分析結(jié)果Table 2 Result of PCA
由表2可知,通過(guò)主成分分析,可以將6 644~6 812cm-1內(nèi)43個(gè)數(shù)據(jù)點(diǎn)轉(zhuǎn)換成少量的代表性變量,本試驗(yàn)取前4個(gè)主成分因子作為建模自變量,累積貢獻(xiàn)率達(dá)到99.405%。
GRNN是由輸入層、隱含層和一個(gè)線性輸出層組成的,是徑向基函數(shù)(radial basis function,RBF)網(wǎng)絡(luò)的一種。GRNN的拓?fù)浣Y(jié)構(gòu)如圖3所示。GRNN多用于函數(shù)局部逼近,并具有非線性映射能力強(qiáng)、訓(xùn)練速度快的優(yōu)點(diǎn),適用于樣本數(shù)量較少的建模。此外,GRNN只有一個(gè)光滑因子需要調(diào)整,因而合適的預(yù)測(cè)網(wǎng)絡(luò)能夠很快地被找到,具有一定的運(yùn)算優(yōu)勢(shì)。因此,本試驗(yàn)采用GRNN對(duì)液態(tài)奶中三聚氰胺含量進(jìn)行建模[16]。
圖3 GRNN拓?fù)浣Y(jié)構(gòu)Figure 3 Topology of GRNN
利用Matlab軟件建立GRNN模型,取通過(guò)主成分分析得到的4個(gè)因子作為模型自變量,三聚氰胺含量作為模型因變量,將表1中所選取的39組數(shù)據(jù)用于建立模型,15組測(cè)試集用于評(píng)價(jià)模型效果,采用模型相關(guān)系數(shù)R2評(píng)價(jià)模型效果。經(jīng)過(guò)軟件尋優(yōu),平滑因子取值為0.1,此時(shí)三聚氰胺含量訓(xùn)練集模型R2為0.694 3,測(cè)試集模型R2為0.654。結(jié)果顯示如圖4、5所示,雖然模型對(duì)三聚氰胺含量預(yù)測(cè)與實(shí)際值總體趨勢(shì)相同,但預(yù)測(cè)準(zhǔn)確度不高,R2值偏低,作為定量分析仍有待進(jìn)一步完善。
圖4 訓(xùn)練集預(yù)測(cè)結(jié)果Figure 4 Predicted results of train set
圖5 測(cè)試集預(yù)測(cè)結(jié)果Figure 5 Predicted results of test set
由上述分析可以看出,盡管無(wú)法對(duì)液態(tài)奶中的三聚氰胺含量進(jìn)行準(zhǔn)確定量,但對(duì)三聚氰胺含量的預(yù)測(cè)規(guī)律與實(shí)際值相同。因此,本試驗(yàn)進(jìn)一步利用支持向量機(jī)方法對(duì)摻入三聚氰胺的液態(tài)奶樣本進(jìn)行定性判別。
支持向量機(jī)是在結(jié)構(gòu)風(fēng)險(xiǎn)最小原理和統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上建立的,在模型的復(fù)雜性和學(xué)習(xí)能力之間根據(jù)有限的樣本信息尋求最優(yōu),從而能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問(wèn)題中。在近紅外光譜分析中,樣本數(shù)量得到的通常不多,而SVM作為一種專(zhuān)門(mén)研究小樣本情況下預(yù)測(cè)問(wèn)題和統(tǒng)計(jì)估計(jì)的方法,能夠較好地解決小樣本、非線性、高維數(shù)和局部極值等諸多實(shí)際問(wèn)題[17,18]。圖6為支持向量機(jī)拓?fù)浣Y(jié)構(gòu)圖。
圖6 SVM拓?fù)浣Y(jié)構(gòu)Figure 6 Topology of SVM
由于新加入的18組未添加三聚氰胺的液態(tài)乳樣本未進(jìn)行有效主成分提取,所以需要將這些樣本與上述54組加入不同比例三聚氰胺的液態(tài)奶樣本合并,共得到72組樣本,對(duì)其原始光譜重復(fù)上述小波變換預(yù)處理。隨后將72組樣本隨機(jī)劃分,其中54組為訓(xùn)練集,18組為測(cè)試集。對(duì)訓(xùn)練集進(jìn)行主成分分析,通過(guò)計(jì)算提取得5個(gè)主成分因子,累積貢獻(xiàn)率為99.11%。再利用支持向量機(jī)建立模型,其中5項(xiàng)主成分因子為模型自變量,是否摻入三聚氰胺作為因變量,摻入為1,未摻入為0,分別采用不同核函數(shù)建立SVM模型。隨后將18組測(cè)試集帶入主成分分析模型,將得到的主成分因子帶入支持向量機(jī)模型檢驗(yàn),模型效果見(jiàn)表3。
表3 不同核函數(shù)的預(yù)測(cè)結(jié)果Table 3 Predicted results by using different kernel function
由表3可知,采用RBF作為核函數(shù)時(shí),本試驗(yàn)預(yù)測(cè)效果最佳,訓(xùn)練集與預(yù)測(cè)集預(yù)測(cè)準(zhǔn)確率均為94.44%,結(jié)果令人滿意。這表明利用近紅外光譜技術(shù)對(duì)液態(tài)奶中摻入三聚氰胺的定性判別是完全可行的。
通過(guò)近紅外光譜技術(shù),對(duì)液態(tài)奶中三聚氰胺進(jìn)行研究,首先采用小波變換放大三聚氰胺特征信號(hào),再利用主成分分析獲得有效的特征因子,分別對(duì)液態(tài)奶中三聚氰胺進(jìn)行了定量及定性的研究,結(jié)果表明:① 當(dāng)液態(tài)奶中三聚氰胺質(zhì)量比低于0.05%時(shí),模型預(yù)測(cè)能力較差,這是由于近紅外光譜技術(shù)本身的特點(diǎn)所致;② 利用支持向量機(jī)對(duì)液態(tài)奶中三聚氰胺進(jìn)行定性分析可獲得較好的判別結(jié)果,并且近紅外光譜技術(shù)具有前處理簡(jiǎn)單、無(wú)污染、無(wú)破壞性等優(yōu)勢(shì)。進(jìn)一步擴(kuò)充模型光譜數(shù)量,提高模型精度,將有利于推廣近紅外光譜分析技術(shù)在實(shí)際液態(tài)奶質(zhì)量監(jiān)控工作中的應(yīng)用。
1 李高杰.現(xiàn)代近紅外光譜技術(shù)在食品分析中的應(yīng)用[J].經(jīng)營(yíng)管理者,2010(19):403.
2 中華人民共和國(guó)衛(wèi)生部,中華人民共和國(guó)工業(yè)和信息化部,中華人民共和國(guó)農(nóng)業(yè)部,國(guó)家工商行政管理總局.國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局公告2008年第25號(hào)[J].中國(guó)食品衛(wèi)生雜志,2008,20(6):564.
3 新華.牛奶中三聚氰胺含量設(shè)定新標(biāo)準(zhǔn)[J].北京農(nóng)業(yè),2012(22):9.
4 張?chǎng)?,顧欣,陳美蓮,?近紅外光譜技術(shù)在乳品行業(yè)的研究現(xiàn)狀及應(yīng)用前景[J].上海畜牧獸醫(yī)通訊,2010(6):12~13.
5 李慧,曾銘,要磊,等.近紅外光譜技術(shù)在食品檢測(cè)中的應(yīng)用研究進(jìn)展[J].食品工業(yè),2011(12):85~88.
6 劉景旺,張博洋,李樹(shù)峰,等.近紅外吸收光譜技術(shù)快速檢測(cè)奶制品中添加三聚氰胺[J].光散射學(xué)報(bào),2010,22(3):291~297.
7 金長(zhǎng)江,鄭先哲.應(yīng)用近紅外光譜技術(shù)快速檢測(cè)黑加侖漿果的主要營(yíng)養(yǎng)成分[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2011,42(5):41~47,147.
8 Poji'cM,Jasna Mastilovi'c,Dragan Pali'c,et al.The development of near-infrared spectroscopy(NIRS)calibration for prediction of ash content in legumes on the basis of two different reference methods[J].Food Chemistry,2010,123(3):800~805.
9 田高友,袁洪福,劉慧穎,等.小波變換用于近紅外光譜性質(zhì)分析[J].分析化學(xué),2004,32(09):1 125~1 130.
10 郝勇,陳斌,朱銳.近紅外光譜預(yù)處理中幾種小波消噪方法的分析[J].光譜學(xué)與光譜分析,2006,26(10)1 838~1 841.
11 Haughey S A,Graham S F,Cancout E,et al.The application of near-infrared reflectance spectroscopy(NIRS)to detect melamine adulteration of soya bean meal[J].Food Chemistry,2013,136(3~4):1 557~1 561.
12 Decruyenaere V,F(xiàn)roidmont E,Bartiaux-Thill N,et al.Faecal near-infrared reflectance spectroscopy (NIRS)compared with other techniques for estimating the in vivo digestibility and dry matter intake of lactating grazing dairy cows[J].Animal Feed Science and Technology,2012,173(3~4):220~234.
13 Dalle Zotte A,Berzaghi P,Janssonb LM,et al.The use of near-infrared reflectance spectroscopy(NIRS)in the prediction of chemical composition of freeze-dried egg yolk and discrimination between different n-3PUFA feeding sources[J].Animal Feed Science and Technology,2006,128(1~2):108~121.
14 張華秀,李曉寧,范偉,等.近紅外光譜結(jié)合Boosting-PLS快速檢測(cè)奶粉中蛋白質(zhì)含量[J].計(jì)算機(jī)與應(yīng)用化學(xué),2010,27(9):1 197~1 200.
15 Aoyama S,Toshima T,Saito Y,et al.Maternal breast milk odour induces frontal lobe activation in neonates:A NIRS study[J].Early Human Development,2010,86(9):541~545.
16 Brunet D,Woignier T,Lesueur-Jannoyer M,et al.Determination of soil content in chlordecone(organochlorine pesticide)using near infrared reflectance spectroscopy(NIRS)[J].Environmental Pollution,2009,157(11):3 120~3 125.
17 Bruno-Soares AM,Murrayb I,Patersonb RM,et al.Use of near infrared reflectance spectroscopy(NIRS)for the prediction of the chemical composition and nutritional attributes of green crop cereals[J].Animal Feed Science and Technology,1998,75(1):15~25.
18 張仲源,劉靜,管驍,等.近紅外光譜分析技術(shù)在食品檢測(cè)中的應(yīng)用研究進(jìn)展[J].食品與發(fā)酵工業(yè),2011,37(11):159~165.