劉燕德,杜秀洋,李 斌,鄭藝蕾,胡 軍,李 雄,徐 佳
華東交通大學機電與車輛工程學院,水果智能光電檢測技術與裝備國家地方聯合工程研究中心,江西 南昌 330013
紫米是珍貴的水稻品種,有補血益氣、 暖脾胃的功效;且糯性紫米粒大飽滿,紫米飯清香、 可口,營養(yǎng)價值和藥用價值都比較高。黑米營養(yǎng)豐富,食、 藥用價值也很高,但消化不良者或者消化能力弱的老人小孩不宜吃黑米,適合吃紫米來調養(yǎng);且黑米含銅量較高不適合肝豆狀核變性患者、 高銅患者食用。大米是全球人民的主要糧食之一,其營養(yǎng)成分遠低于紫米。由于大米和黑米的價格都低于紫米,一些不法商家將大米和黑米進行染色充當紫米進行銷售,從中獲取暴利。這樣的行為不僅降低了人們的生活質量,甚至還會危害人們的身體健康。因此對紫米摻假的鑒別及含量的檢測研究具有重要的現實意義。
近年來儀器分析技術迅速發(fā)展,在鑒別食品摻假的行業(yè)中廣泛應用。頂空分析法是目前最簡單的判別食品摻假的方法,但只能通過氣體來鑒定是否摻假。毛細管電泳法是利用食品內部不同電子在高壓的情況下會發(fā)生不同速度的定向移動原理對食品各成分進行分離檢測,但其存在制備能力差、 靈敏度低的缺點[1]。太赫茲電磁波一般指的是波長在0.03~3 mm范圍之間的電磁輻射,其波段處于微波和紅外輻射之間,屬于遠紅外波段[2]。有機物分子的轉動能級和振動多數分布于此波段范圍,因此太赫茲波透過樣品可獲取大量的物理和化學信息[3]。太赫茲時域光譜技術是近年來發(fā)展起來的新興技術,在食品摻假方面作出巨大貢獻。目前,殷明[4]等采用太赫茲時域光譜技術結合化學計量學方法對食用油的摻假做定性鑒別和定量分析研究;李斌[5]等利用太赫茲時域光譜技術對葛粉中摻雜薯粉進行定性定量的檢測研究,對葛粉中摻薯粉進行快速準確檢測;Liu[6]等利用太赫茲時域光譜技術(Terahertz time domain spectroscopy,THz-TDS)的ATR模式對蜂蜜摻假進行研究,研究表明THz-TDS是可以準確快速的無損鑒別蜂蜜摻假的新型光譜技術。
采用THz-TDS結合化學計量學方法及光譜預處理方法對紫米中摻入染色大米或黑米進行定性及定量分析的檢測研究。通過獲取樣品的吸收系數譜和折射率譜,結合偏最小二乘判別分析(partial least squares decision analysis, PLS-DA)進行建模定性分析。再建立紫米摻假含量的偏最小二乘法(partial least squares, PLS)和最小二乘支持向量機(least squares support vector machine,LS-SVM)數學模型,對模型預測結果分析比較,獲得最優(yōu)模型效果,為紫米摻假含量的快速檢測提供方法。
實驗所用的紫米、 黑米和大米采購于某知名品牌,購買的紫米和黑米不存在染色摻假現象;可食用染色劑購買于某生化公司。先將黑米和大米分別加入可食用染色劑染色,染至與紫米顏色相近。將染色后的黑米和大米放入烘干箱中,溫度調至50 ℃,烘干48 h。之后將烘干后的染色黑米、 大米和正常紫米分別放入高速粉碎機中進行粉碎研磨,再放入陶瓷研缽充分研磨成粉末狀。根據實驗設計,染色黑米和大米按不同質量比分別摻入紫米放置在離心管中,總量均為10 g。對配比好的混合粉末使用渦旋攪拌器進行3 min的振蕩,確保均勻分布。取適量粉末制備樣品,采用壓片法,制片壓力約為8 t,時間約為1 min,壓片厚度為1.00 mm,制備壓片的直徑為13 mm,表面光滑無裂痕。
實驗使用TAS7500SU太赫茲時域光譜儀由日本Advantest公司生產,該光譜儀測量頻譜范圍為0~7 THz,頻譜分辨率為7.6 GHz,采譜掃描速度為8 ms,掃描次數設置為8 192次,透射模式下測量。在采集光譜前將實驗室溫度控制在20 ℃,濕度控制在25%以下,開機后,通過無油靜音空氣壓縮機向設備充入氣體保證環(huán)境干燥,預熱約30 min待設備內部的空氣濕度降低至5%,開始采集光譜。再通過傅里葉變換將時域信號轉換為頻域信號,采用Dorney[7]和Duvillaret[8]等提出的方法進行數據處理得到樣品的吸收系數和折射率。
1.3.1 建模方法
偏最小二乘法是光譜技術檢測分析中一種基于因子分析的多變量校正算法,是一種多因變量對多自變量的回歸建模方法[9]。以光譜矩陣X與濃度矩陣Y相關聯數學模型為
Y=bX+e
(1)
式(1)中,b所表征的即為X和Y間的回歸系數向量,e標示模型殘差。
最小二乘支持向量機采用最小二乘線性系統作為損失函數,通過解一組線性方程組代替?zhèn)鹘ySVM采用的較復雜的二次規(guī)劃方法,降低計算復雜性,加強了求解速度[10]。本文主要選用RBF作為核函數,其表達式為
(2)
式(2)中,Xk是樣本點,Xi是核函數中心點,σ2是內核參數。
1.3.2 模型評價
通過校正集均方根誤差(root mean square error of calibration, RMSEC)、 預測集均方根誤差(root mean square error of prediction, RMSEP)、 校正相關系數(Rc)、 預測相關系數(Rp)等參數來評價模型的優(yōu)劣。若Rc和Rp數值越接近1,說明其校正集和預測集相關程度越高。當RMSEC和RMSEP的值越接近0,表明模型的建模效果好和預測能力越強[11]。
2.1.1 定性光譜分析
本太赫茲時域光譜儀的測量范圍為0~7 THz,由于0~0.5 THz及2.5~7 THz波段的信噪比低,故選取0.5~2.5THz范圍為本實驗的研究波段。實驗準備純紫米、 80%紫米+20%大米和80%紫米+20%黑米3類樣品,每類樣品制備20個,共60個樣品。對每個樣品采集3條太赫茲光譜,取其平均光譜數據進行處理分析。
圖1為紫米、 紫米摻入染色大米和紫米摻入染色黑米的吸收譜和折射譜。由于紫米、 大米和黑米都是由碳水化合物、 蛋白質和脂肪等物質構成的,三種樣品的吸收圖譜和折射率譜的形狀相似且沒有明顯的特征峰。由圖1可知,隨著頻率的提高,吸收系數不斷升高,折射率不斷降低。純紫米光譜的吸收系數和折射率均高于摻假紫米,紫米摻染色大米的吸收系數和折射率均高于紫米摻染色黑米。根據光譜曲線的高低不能準確地鑒定出紫米是否存在摻假現象,需要結合化學計量學方法鑒定出紫米是否存在摻假。
圖1 紫米摻假的吸收譜和折射譜圖(a):吸收系數圖;(b)折射率圖Fig.1 Absorption spectrum and refraction spectrum of purple rice adulteration(a):Absorption coefficient diagram;(b):Refractive index
2.1.2 結合化學計量學的建模定性分析
本文為了對比三種樣品的光譜差異,對光譜進行主成分分析(principal component analysis,PCA),以光譜的前2個主成分(前兩個PC累計方差貢獻率為92%)的得分計算樣本的平面距離,三種樣品的二維得分分布圖如圖2所示。三種樣品的平面分布存在明顯的差別,反映了三種樣品由于碳水化合物、 蛋白質、 脂肪等物質的含量不同在光譜信息中存在差異。
圖2 三種樣品的前2個主成分得分分布Fig.2 The first two PCs score plots of spectra of the three samples
使用偏最小二乘判別分析(PLS-DA)對三種樣品進行定性建模分析。校正集和預測集按照3∶1的比例進行分配。為了減少采集光譜過程中的誤差干擾,對光譜采用SG平滑、 歸一化、 多元散射校正(multiple scattering correction,MSC)、 基線校正等多種預處理方法后建立PLS-DA模型[12]。表1為經過不同預處理之后建立模型的效果,使用基線校正預處理的數據進行PLS-DA建立模型效果最佳,其預測相關系數(Rp)為0.971,預測均方根誤差(RMSEP)為0.142。
表1 不同預處理方法的PLS-DA模型結果Table 1 PLS-DA model results of different pretreatment methods
圖3(a)為在基線校正之后的PLS-DA建模所得的模型散點圖,其中T1為第一類樣品和第二類樣品的分界線,其閾值為1.5;T2為第二類樣品和第三類樣品的分界線,其閾值為2.5。從散點圖可知:所有預測集樣品未出現誤判的情況,預測誤判率為0。即可以利用PLS-DA建模,以誤判率和相關系數為指標,實現紫米中是否摻假大米或黑米的鑒別。
圖3 PLS-DA建模結果圖(a):建模和預測散點圖;(b):均方根誤差隨主成分因子變化圖Fig.3 PLS-DA modeling result graph(a):Modeling and predicting scatter plots;(b): RMSE varies with principal component factor
圖3(b)為主成分因子決定圖,校正集及預測集均方根誤差隨主成分數的增加而下降,當主成分數為3時,預測均方根誤差降到最低。之后隨著主成分數的增加,預測均方根誤差保持穩(wěn)定。故最佳主成分因子數為3。
2.2.1 定量光譜及偏最小二乘法建模分析
在對三種類型的樣品進行定性分析之后,分別對紫米中摻染色大米和紫米中摻染色黑米進行定量建模分析。兩個模型的建立需根據不同的質量分數制備21個質量分數梯度,每個樣品制備4或8個樣品,各樣品質量分數和個數如表2所示。每個樣品采集3條太赫茲光譜,取其平均光譜數據進行處理分析。
表2 21組樣品質量分數(g·g-1, %)Table 2 Mass fraction of 21 samples
圖4(a)為6種不同質量分數的紫米摻染色大米樣品的光譜吸收系數圖,由圖可知,純紫米的吸收系數最高,隨著染色大米摻入的質量分數越大,光譜的吸收系數降低越多。每個不同質量分數的吸收曲線都會有一些不規(guī)則的波動,不能證明這些波動是由于紫米和大米中碳水化合物、 蛋白質或者脂肪含量的不同造成的。要將太赫茲時域光譜與化學計量學結合起來進行紫米摻入染色大米的定量分析。
圖4 紫米摻染色大米光譜分析及建模結果圖(a):不同含量樣品光譜圖;(b):建模和預測含量散點圖Fig.4 Spectral analysis and modeling results of purple rice-stained rice(a):Spectral map of different content samples;(b):Modeling and prediction content scatter plot
使用偏最小二乘法(PLS)對紫米摻入染色大米的實驗進行定量建模分析,將108個樣品數據按照校正集和預測集3∶1的比例進行配比,校正集81個光譜數據,預測集27個光譜數據。對光譜采用SG平滑、 歸一化、 多元散射校正、 基線校正的預處理方法。結果如表3所示,使用基線校正的預處理方法結果最好;預測集相關系數Rp為0.936,預測集均方根誤差RMSEP為0.095。圖4(b)為經過基線校正的校正集與預測集的散點圖及擬合線,表示其真實值與預測值的相關性。由圖可知,模型精度和預測準確度均達到較高水平。
表3 不同預處理方法的PLS模型結果Table 3 PLS model results of different pretreatment methods
采用同樣的預處理方法和建模方法對紫米中摻染色黑米的數據進行處理。結果顯示,校正集相關系數Rc為0.916,校正集均方根誤差RMSEC為0.078;預測集相關系數Rp為0.914,預測集均方根誤差RMSEP為0.096。使用PLS建模能夠準確預測紫米中摻入染色黑米的含量。
2.2.2 最小二乘支持向量機建模分析
由于建立的PLS模型為線性模型,即在LS-SVM中選擇RBF_kernel核函數來建立非線性模型進行對比。其中需確定正則化參數(γ)和內核參數(σ2),這兩個參數會影響模型精確度。采用4種預處理方法處理的數據作為最小二乘支持向量機(LS-SVM)模型的輸入值。表4為LS-SVM預測紫米中摻入染色大米的預測建模結果,經基線校正處理的建模預測精度最高,預測均方根誤差(RMSEP)為0.0917,相關系數(Rp)高達0.979 6,其對應的參數γ=8 658,σ2=1 845。
表4 LS-SVM(RBF_kernel)模型的預測結果Table 4 Prediction results of LS-SVM (RBF_kernel) model
圖5為基線校正后LS-SVM預測紫米摻假染色大米含量的散點圖。
圖5 LS-SVM紫米摻染色大米含量預測模型散點圖Fig.5 LS-SVM purple rice blended dye rice prediction model scatter plot
采用基線校正的預處理和RBF_kernel核函數對紫米摻染色黑米的數據建立LS-SVM模型。結果顯示,預測集均方根誤差(RMSEP)為0.093 6,預測集相關系數(Rp)為0.947 5。
2.2.3 模型對比分析
結果顯示PLS和LS-SVM均可對紫米摻假含量進行準確檢測,但采用基線校正處理建立LS-SVM模型精度最佳。LS-SVM建立紫米摻入染色大米含量模型的RMSEP為0.091、Rp為0.979;LS-SVM建立紫米摻入染色大米含量模型的RMSEP為0.093、Rp為0.947。LS-SVM比PLS預測紫米摻假含量效果更佳、 模型更為穩(wěn)定,原因可能是紫米及摻假品中含有更多的非線性信息。
基于太赫茲時域光譜技術結合化學計量學方法對紫米摻假進行定性和定量分析。首先進行對紫米、 紫米摻染色大米和紫米摻染色黑米進行定性分析研究。使用基線校正預處理之后的數據進行PLS-DA建立模型的誤判率為0,能夠準確地區(qū)分三種樣品。對紫米摻染色大米和紫米摻染色黑米分別進行定量分析研究,使用偏最小二乘法(PLS)與最小二乘支持向量機法(LS-SVM)分別建立定量模型。結果顯示,使用基線校正預處理之后的數據結合最小二乘支持向量機法(LS-SVM)進行定量建模效果最佳,紫米摻染色大米的預測相關系數(Rp)為0.979,預測均方根誤差(RMSEP)為0.091;紫米摻染色黑米的預測相關系數(Rp)為0.948,預測均方根誤差(RMSEP)為0.093。研究表明,太赫茲時域光譜技術可用于紫米摻假定性定量研究。本研究為太赫茲時域光譜技術在食品領域的快速檢測提供方法參考。