李尚科,杜國(guó)榮,李跑,*,蔣立文,劉霞
(1.湖南農(nóng)業(yè)大學(xué)食品科技學(xué)院,食品科學(xué)與生物技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南長(zhǎng)沙410128;2.湖南省農(nóng)業(yè)科學(xué)院湖南省農(nóng)產(chǎn)品加工研究所,湖南長(zhǎng)沙410125;3.上海煙草集團(tuán)有限責(zé)任公司技術(shù)中心北京工作站,北京101121)
豆?jié){粉是將大豆制成豆?jié){,殺菌后濃縮,最后經(jīng)干燥制得而成的。其富含植物蛋白、磷脂、多種維生素、煙酸以及礦物質(zhì)等多種營(yíng)養(yǎng)物質(zhì),具有防治高血脂、高血壓、動(dòng)脈硬化、缺鐵性貧血、氣喘等疾病的作用[1-3]。由于大豆產(chǎn)地以及豆?jié){粉加工工藝存在差異,其所含營(yíng)養(yǎng)物質(zhì)以及風(fēng)味均有一定程度上差異。市場(chǎng)上的豆?jié){粉品牌也因廠商的加工不同導(dǎo)致種類紛繁多樣,同時(shí)會(huì)存在摻雜簡(jiǎn)單研磨豆?jié){粉品牌豆?jié){粉中的現(xiàn)象。簡(jiǎn)單研磨豆?jié){粉往往只經(jīng)過簡(jiǎn)單的碾磨過篩,相較于品牌豆?jié){粉在營(yíng)養(yǎng)、口感上存在較大差異。然而,僅通過外觀上很難將其區(qū)分開來。采用化學(xué)方法雖能有效的實(shí)現(xiàn)其檢測(cè),但檢測(cè)時(shí)通常存在耗時(shí)長(zhǎng),步驟繁瑣,檢測(cè)費(fèi)用較高等不足[4]。因此研究開發(fā)一種能快速無損同時(shí)還可以準(zhǔn)確鑒別簡(jiǎn)單研磨豆?jié){粉以及國(guó)內(nèi)外品牌豆?jié){粉的方法具有十分重要的意義。
近紅外光是指波長(zhǎng)介于780 nm~2 526 nm之間的一種不可見電磁波,近紅外光譜技術(shù)(near infrared spectroscopy,NIRS)則是利用介于可見光與中紅外光之間的近紅外電磁波的波粒二象性使物質(zhì)中的部分活性分子發(fā)生狀態(tài)變化或伴隨能級(jí)的躍遷,從而獲得含有被測(cè)物質(zhì)信息的近紅外吸收光譜[5-7]。由于其具有樣品無需預(yù)處理,光譜測(cè)量方便、分析效率高、測(cè)試重現(xiàn)性好等優(yōu)點(diǎn),近紅外光譜技術(shù)被廣泛應(yīng)用于農(nóng)業(yè)、制藥、生物化工、煙草等行業(yè)[8-12]。而在食品分析中,近紅外光譜主要用于分析食品中營(yíng)養(yǎng)物質(zhì)的含量[13-14]以及食品的溯源分析[15]。但在測(cè)量過程中,近紅外光譜信號(hào)中常出現(xiàn)譜峰重疊以及背景干擾等問題,不能直接用于定性定量分析。隨著化學(xué)計(jì)量學(xué)方法的逐步發(fā)展,近紅外光譜中所產(chǎn)生的干擾影響得到了有效消除。其中光譜預(yù)處理方法的目的是針對(duì)特定的樣品體系,通過對(duì)光譜的適當(dāng)處理,減弱以至于消除各種非目標(biāo)因素對(duì)光譜的影響,提取圖譜中的有效信息[16-18]。
已有諸多預(yù)處理方法,如何選取最適宜的近紅外光譜預(yù)處理方法是現(xiàn)代近紅外光譜技術(shù)的熱點(diǎn)話題之一。每一種預(yù)處理方法都有其適應(yīng)范圍,如平滑是消除噪聲常見方法,對(duì)濾除高頻噪聲尤為有效[19];導(dǎo)數(shù)光譜具有有效消除基線和背景干擾,提高分辨率和靈敏度的作用,但它同時(shí)會(huì)放大噪聲,導(dǎo)致信噪比降低[20];標(biāo)準(zhǔn)正態(tài)變量變換、多元散射校正以及去趨勢(shì)校正可以用來減小顆粒大小及分布不均勻產(chǎn)生的散射對(duì)近紅外光譜的影響[21-23]。本文針對(duì)豆?jié){粉近紅外光譜采集過程中所產(chǎn)生的干擾以及不同預(yù)處理對(duì)于干擾因素消除情況,考察不同單一預(yù)處理與組合預(yù)處理方法對(duì)豆?jié){粉原始光譜圖中存在的干擾優(yōu)化結(jié)果,最終結(jié)合主成分分析方法(principal compoent analysis,PCA)實(shí)現(xiàn)簡(jiǎn)單研磨豆?jié){粉以及國(guó)內(nèi)外品牌豆?jié){粉的快速無損分析。
大豆:市售。利用粉碎機(jī)碾磨粉碎,采用100目篩子篩取自磨豆?jié){粉記為A[24]。隨即從不同地區(qū),不同超市分別購(gòu)買一個(gè)國(guó)外品牌豆?jié){粉記為E,3個(gè)國(guó)內(nèi)品牌的豆?jié){粉記為B、C、D,按照3個(gè)批次分別分為B1、B2、B3、C1、C2、C3、D1、D2、D3。本試驗(yàn)中每個(gè)豆?jié){粉樣品數(shù)為12,共計(jì)132個(gè)樣本。
Vertex 70多波段紅外/近紅外光譜儀、近紅外積分球漫反射附件:德國(guó)Bruker公司;MATLAB R2010b:The Math Works,Natick,USA。
1.2.1 光譜的采集
在12 000 cm-1~4 000 cm-1范圍內(nèi),最小間隔為4 cm-1,共采集2 098個(gè)數(shù)據(jù)點(diǎn)。同一樣品測(cè)量3次,取3條平行光譜的平均值作為該樣本的原始光譜。本次試驗(yàn)采集了3個(gè)國(guó)內(nèi)品牌中3個(gè)不同批次樣品、一個(gè)國(guó)外品牌以及自磨豆?jié){粉共132個(gè)樣品的近紅外光譜。
1.2.2 光譜預(yù)處理與聚類分析
將5種豆?jié){粉樣品按照簡(jiǎn)單研磨、進(jìn)口、3個(gè)國(guó)產(chǎn)品牌不同批次分為11類樣品。數(shù)據(jù)按照Kennard-Stone(KS)方法選取99個(gè)樣品用于建立模型,33個(gè)樣品用于驗(yàn)證。結(jié)合15種不同光譜預(yù)處理方法對(duì)豆?jié){粉近紅外原始光譜分別進(jìn)行預(yù)處理。最后運(yùn)用PCA法用于聚類分析,并計(jì)算其鑒別準(zhǔn)確率。
豆?jié){粉單一預(yù)處理光譜圖見圖1。
圖1 豆?jié){粉單一預(yù)處理光譜圖Fig.1 Spectra of soybean milk powder with single pretreatment methods
為了有效地達(dá)到區(qū)分簡(jiǎn)單研磨豆?jié){粉與國(guó)內(nèi)外品牌豆?jié){粉的目的,對(duì)所準(zhǔn)備的11類豆?jié){粉樣品進(jìn)行近紅外光譜采集,樣品分別經(jīng)3次測(cè)量后取其平均值得到原始光譜圖。從原始光譜圖1(a)中可以看出在8 000 cm-1~12 000 cm-1內(nèi)豆?jié){粉樣品的譜線大致趨勢(shì)一致,大部分譜線重合,具有相同或相似的吸收峰。然而從4 000 cm-1~8 000 cm-1可發(fā)現(xiàn)豆?jié){粉譜線趨勢(shì)仍然相似,但簡(jiǎn)單研磨豆?jié){粉的近紅外光譜吸光度值較之其他品牌普遍偏低。由于原始光譜存在明顯的背景干擾和基線漂移,因此無法僅通過原始光譜圖判斷其吸光度值的差異是物質(zhì)含量差異還是基線漂移現(xiàn)象所導(dǎo)致。
為了考察簡(jiǎn)單研磨豆?jié){粉與品牌豆?jié){粉之間吸光度值的差異是由于物質(zhì)含量差異還是基線漂移現(xiàn)象所引起,分別選取了8種不同預(yù)處理對(duì)圖1(a)中的豆?jié){粉原始光譜進(jìn)行優(yōu)化。以期能有效的改善基線漂移現(xiàn)象,扣除背景干擾影響,從而達(dá)到對(duì)豆?jié){粉預(yù)處理之后的光譜圖的有效分析。圖1(b)~圖1(c)為去偏置、去偏移預(yù)處理之后的光譜圖,經(jīng)過這兩種預(yù)處理之后譜圖中背景干擾得到有效消除,在一定波數(shù)范圍內(nèi)仍存在基線漂移現(xiàn)象,但依舊可以清晰看出簡(jiǎn)單研磨豆?jié){粉的近紅外光譜譜線與品牌豆?jié){粉差異較大。圖 1(d)~圖 1(f)為標(biāo)準(zhǔn)正態(tài)變量變換、最大最小歸一化、多元散射校正處理之后的光譜圖,由于豆?jié){粉樣品為粉末狀樣品,在一定程度上所受光譜散射影響較弱,僅僅消除了一定程度上的基線漂移現(xiàn)象,簡(jiǎn)單研磨豆?jié){粉與品牌豆?jié){粉之間譜線在4 000 cm-1~7 000 cm-1呈現(xiàn)一定差異。圖 1(g)~圖 1(i)為一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、連續(xù)小波變換不同單一預(yù)處理之后的光譜圖,背景干擾得到有效消除,基線漂移現(xiàn)象也得到明顯改善,在 11 130、10 500、8 850、7 450、7 000、5 910、5 700、4 900、4 425 cm-1出現(xiàn)明顯波峰,且簡(jiǎn)單研磨豆?jié){粉與品牌豆?jié){粉之間峰值差異較大。二階導(dǎo)數(shù)預(yù)處理雖然消除背景干擾,強(qiáng)化了其譜帶特征,但在10 000 cm-1~12 000 cm-1處出現(xiàn)了明顯的噪聲特性,這是由于二階導(dǎo)數(shù)在一定程度上降低了信噪比。經(jīng)過多種預(yù)處理之后可發(fā)現(xiàn),隨著背景干擾的有效消除,基線漂移現(xiàn)象的改善,簡(jiǎn)單研磨豆?jié){粉的近紅外光譜譜線較之于品牌豆?jié){粉的確存在較大差異,而國(guó)產(chǎn)品牌與進(jìn)口品牌之間在圖譜上并未直觀顯示出存在差別,這可能是由于簡(jiǎn)單研磨豆?jié){粉與品牌豆?jié){粉在原料選取或加工工藝上的差異所導(dǎo)致的。
為了直觀的實(shí)現(xiàn)豆?jié){粉之間的區(qū)分,將經(jīng)過預(yù)處理后的光譜數(shù)據(jù)與PCA相結(jié)合。圖2為對(duì)應(yīng)預(yù)處理之后的PCA圖,分別用不同形狀的實(shí)心與空心圖形表示為樣品的校正集樣本與驗(yàn)證集樣本。
圖2 豆?jié){粉單一預(yù)處理PCA圖Fig.2 PCA results with single pretreatment methods
橢圓形為不同品種綠茶所構(gòu)建的置信橢圓,由于前2個(gè)主成分(PC1和PC2)的方差貢獻(xiàn)率之和在80%以上,因此選取PC1和PC2進(jìn)行PCA分析。圖2(a)為原始光譜的聚類分析,簡(jiǎn)單研磨豆?jié){粉與其他品牌豆?jié){粉樣品之間呈現(xiàn)完美的區(qū)分關(guān)系,這也印證了從原始光譜圖分析所觀察到的簡(jiǎn)單研磨豆?jié){粉近紅外譜圖與品牌豆?jié){粉的差異。然而國(guó)產(chǎn)品牌與進(jìn)口品牌之間并無明顯區(qū)分現(xiàn)象,相互重疊,品牌間僅僅實(shí)現(xiàn)了對(duì)簡(jiǎn)單研磨豆?jié){粉的鑒別,鑒別成功率僅為10.6%,因此,僅僅通過原始光譜圖的聚類分析并未達(dá)到實(shí)現(xiàn)豆?jié){粉品牌鑒別的目的。圖2(b)為經(jīng)過去偏置預(yù)處理之后的聚類分析圖,可以看出簡(jiǎn)單研磨豆?jié){粉被區(qū)分開來,相較于原始光譜的聚類分析,D品牌的豆?jié){粉同樣被有效區(qū)分,然而品牌之間的不同批次由于原料以及加工工藝相同,并未能將其區(qū)分,品牌間的鑒別成功率達(dá)到43.94%。圖2(c)為經(jīng)過去偏移預(yù)處理之后的聚類分析圖,較之圖2(b)分布情況類似,在品牌間的鑒別成功率上略有提升,為47.83%。而圖2(d)與圖2(f)圖譜相似,原因是多元散射校正與標(biāo)準(zhǔn)正態(tài)變量變換二者的主要作用為消除樣品間由于光譜散射影響造成的誤差,而豆?jié){粉為粉末樣品在一定程度上大大減小此類干擾產(chǎn)生的可能性。結(jié)合兩者可知,E品牌豆?jié){粉被有效區(qū)分開,實(shí)現(xiàn)了簡(jiǎn)單研磨、進(jìn)口、國(guó)產(chǎn)3類品牌豆?jié){粉的有效鑒別,但仍然無法實(shí)現(xiàn)國(guó)產(chǎn)品牌之間B類、C類的有效區(qū)分,同一品牌不同批次之間也無法實(shí)現(xiàn)區(qū)分,品牌之間的鑒別成功率為53.03%。圖2(e)為經(jīng)過最大最小歸一化預(yù)處理之后的聚類分析圖,可以看出較之于圖 2(b)、圖 2(c)相似,仍然無法區(qū)分B、C品牌與進(jìn)口E品牌。品牌間的鑒別成功率為48.48%。圖 2(g)與圖 2(i)兩者的 PCA 圖譜相似,僅在主成分含量有所差異,圖中的品牌分布情況較之多元散射校正、標(biāo)準(zhǔn)正態(tài)變量變換預(yù)處理之后的聚類分析結(jié)果相似,品牌間的鑒別成功率達(dá)到53.03%。圖2(h)為經(jīng)過二階導(dǎo)數(shù)預(yù)處理之后的聚類分析圖,從圖中可以看出經(jīng)過二階導(dǎo)數(shù)預(yù)處理之后,簡(jiǎn)單研磨豆?jié){粉、國(guó)產(chǎn)B、C、D品牌、進(jìn)口品牌5類品牌之間均實(shí)現(xiàn)有效區(qū)分,鑒別成功率為100%,國(guó)產(chǎn)、進(jìn)口、簡(jiǎn)單研磨之間也同樣實(shí)現(xiàn)100%鑒別,而國(guó)產(chǎn)品牌不同批次之間仍未得到區(qū)分。相較于原始光譜數(shù)據(jù)聚類分析,使用預(yù)處理之后的聚類分析結(jié)果均得到了較大改善,然而僅使用單一預(yù)處理未能實(shí)現(xiàn)國(guó)產(chǎn)品牌不同批次之間的有效鑒別。
為了進(jìn)一步實(shí)現(xiàn)國(guó)產(chǎn)品牌不同批次的準(zhǔn)確鑒別,選取了優(yōu)化過后的組合預(yù)處理對(duì)原始光譜數(shù)據(jù)進(jìn)行處理,見圖3。
圖3 豆?jié){粉組合預(yù)處理光譜圖Fig.3 Spectra of soybean milk powder with combined pretreatment methods
從圖 3 中可見,圖 3(a)(b)(c)與圖 3(f)、圖 3(d)和圖3(e)之間具有較高的相似度。連續(xù)小波變換與一階導(dǎo)數(shù)、多元散射校正與標(biāo)準(zhǔn)正態(tài)變量變換功能相似。圖中既具有一階導(dǎo)數(shù)消除基線和背景干擾,提高分辨率的功能,同時(shí)還保持了多元散射校正消除光譜散射現(xiàn)象的作用,光譜中的背景干擾得到消除,基線漂移現(xiàn)象基本得到消除,圖譜中的有效信息被提取出來。
圖4為優(yōu)化組合預(yù)處理對(duì)原始光譜數(shù)據(jù)處理之后的聚類分析結(jié)果。
圖4 豆?jié){粉組合預(yù)處理的PCA圖Fig.4 PCA result with combined pretreatment methods
圖4(a)~圖 4(f)中品牌間的鑒別情況相較于單一預(yù)處理未能更進(jìn)一步實(shí)現(xiàn)國(guó)產(chǎn)品牌不同批次之間的有效提升。仍然保持為國(guó)產(chǎn)品牌、進(jìn)口品牌、簡(jiǎn)單研磨豆?jié){粉 3 類實(shí)現(xiàn)區(qū)分,B1 與 C1、C2、C3 相交叉,B、C品牌之間未得到區(qū)分,品牌之間的不同批次也未得到有效區(qū)分,鑒別準(zhǔn)確率為53.03%。因此,在采用不同預(yù)處理對(duì)于豆?jié){粉的快速無損鑒別中,使用優(yōu)化組合預(yù)處理之后的聚類分析結(jié)果與一階導(dǎo)數(shù)、連續(xù)小波變換、多元散射校正、標(biāo)準(zhǔn)正態(tài)變量變換單一預(yù)處理結(jié)果保持一致,均能有效的實(shí)現(xiàn)簡(jiǎn)單研磨、進(jìn)口、國(guó)產(chǎn)品牌豆?jié){粉的區(qū)分,未能有效實(shí)現(xiàn)國(guó)產(chǎn)B、C品牌之間的有效鑒別。采用組合預(yù)處理之后的聚類分析結(jié)果較之二階導(dǎo)數(shù)預(yù)處理之后的聚類分析結(jié)果較差。
本文以簡(jiǎn)單研磨豆?jié){粉產(chǎn)品與國(guó)內(nèi)外品牌豆?jié){粉作為樣品進(jìn)行近紅外光譜采集,探究不同單一預(yù)處理以及優(yōu)化組合預(yù)處理方法是否能有效實(shí)現(xiàn)其快速無損鑒別,從而篩選出最佳的豆?jié){粉無損鑒別預(yù)處理方法,并構(gòu)建可靠的鑒別模型。結(jié)果表明:大多預(yù)處理方法均能在一定程度上消除基線漂移現(xiàn)象,其中,經(jīng)過一階導(dǎo)數(shù)、連續(xù)小波變換、多元散射校正、標(biāo)準(zhǔn)正態(tài)變量變換及其優(yōu)化組合預(yù)處理的使用,實(shí)現(xiàn)了進(jìn)口、簡(jiǎn)單研磨、國(guó)產(chǎn)3類豆?jié){粉樣品的有效鑒別,但無法實(shí)現(xiàn)國(guó)產(chǎn)品牌之間的有效鑒別。二階導(dǎo)數(shù)預(yù)處理相較于其他預(yù)處理的聚類分析結(jié)果更進(jìn)一步實(shí)現(xiàn)了所有品牌之間的完美區(qū)分,品牌間的鑒別成功率可達(dá)到100%,但仍較難實(shí)現(xiàn)各個(gè)品牌間不同批次的鑒別分析,原因可能是由于同一品牌在原料選取,加工工藝流程,輔料、營(yíng)養(yǎng)元素的加入上有著相同的標(biāo)準(zhǔn)所造成的。豆?jié){粉的近紅外快速無損鑒別當(dāng)中最優(yōu)光譜預(yù)處理方法為二階導(dǎo)數(shù)預(yù)處理。