朱向榮 李高陽 蘇東林 劉 偉 單 楊(1.中南大學(xué)研究生院隆平分院,湖南 長沙 410125;2.湖南省食品測試分析中心,湖南 長沙 410125)
鎘(cadmium,Cd)是一種毒性大,遷移性強(qiáng)的重金屬元素,Cd在土壤中有較高活性[1],Cd污染是土壤和食品中重金屬污染關(guān)注的首要問題之一。水稻被認(rèn)為是鎘吸收最強(qiáng)的大宗谷類作物[2],很容易吸收土壤中的鎘。水稻鎘污染不僅導(dǎo)致水稻產(chǎn)量下降,更為嚴(yán)重的是鎘元素在水稻植株內(nèi)大量累積,并通過食物鏈進(jìn)入人體,對人類健康帶來嚴(yán)重危害[3]。中國GB 2762—2012《食品中污染物限量》規(guī)定稻米中鎘的最高限量為0.2mg/kg,因此,對稻米中鎘含量進(jìn)行質(zhì)量控制,保障稻米食用安全,采用靈敏、準(zhǔn)確的分析方法檢測稻米鎘含量尤為重要。目前,國內(nèi)外研究者[4]常采用電感耦合等離子體原子發(fā)射光譜與石墨爐原子吸收光譜法等儀器分析方法測定農(nóng)產(chǎn)品中Cd含量。上述方法雖然準(zhǔn)確性好,專屬性強(qiáng)、靈敏度高,但也存在著樣品消化時(shí)間長、強(qiáng)酸試劑消耗量大、環(huán)境危害較大、儀器操作復(fù)雜等缺點(diǎn)。
近紅外光譜法(near-infrared spectroscopy,NIRS)是目前發(fā)展較為迅速的分子光譜快速檢測技術(shù),具有快速、無損、綠色、環(huán)境友好等優(yōu)點(diǎn)。NIRS在稻米中淀粉、蛋白質(zhì)、氨基酸、脂肪、礦質(zhì)元素、水分、脂肪酸值等營養(yǎng)指標(biāo)的含量檢測等領(lǐng)域均有應(yīng)用。從原理上講,無機(jī)元素在近紅外光譜區(qū)并沒有吸收,但是有機(jī)物質(zhì)通過螯合或絡(luò)合的方式與無機(jī)元素形成螯合物或絡(luò)合物,而這些物質(zhì)在近紅外光譜區(qū)有相應(yīng)的響應(yīng)與吸收[5]。稻米的主要有機(jī)成分為淀粉和蛋白質(zhì),其含量分別約為80%和8%。鎘元素與淀粉及蛋白質(zhì)中的C—H、N—H與O—H等基團(tuán)結(jié)合,而使得采用近紅外光譜檢測鎘成為可能。近年來,國外學(xué)者采用NIRS結(jié)合化學(xué)計(jì)量學(xué)方法對動(dòng)物樣 品[6,7]、植物樣品[8-11]以及 水樣[12,13]中重金屬元素定性、定量分析,Kumagai等[14]采用NIRS對鎘污染稻米進(jìn)行定性研究,但尚未見到采用NIRS對稻米鎘進(jìn)行定量研究的報(bào)道。本研究擬通過NIRS與組合間隔偏最小二乘法(synergy interval partial least squares,siPLS)組合,建立稻米鎘含量是否超標(biāo)的NIRS定量模型,并對光譜預(yù)處理方法與光譜變量篩選進(jìn)行系統(tǒng)的考察,以達(dá)到預(yù)期的效果。
石墨爐原子吸收光譜儀:AA-6800型,日本島津公司;
傅里葉變換近紅外光譜儀:Nicolet AntarisⅡ型,美國Thermo公司;
硝酸、高氯酸:優(yōu)級純,國藥集團(tuán)化學(xué)試劑有限公司。
1.2.1 樣品收集 在湖南省長沙市周邊收集了72個(gè)稻米樣品(40個(gè)樣品采自湘陰縣浩河口鎮(zhèn),10個(gè)樣品采自長沙縣大同橋鎮(zhèn),12個(gè)樣品采自長沙縣江背鎮(zhèn),10個(gè)樣品采自長沙縣干杉鎮(zhèn))。樣品經(jīng)烘干(85℃,2h)、去殼、粉碎、過60目篩4個(gè)步驟。
1.2.2 鎘含量的測定 按 GB/T 5009.15—2003《食品中鎘的測定》執(zhí)行。
1.2.3 NIRS方法 利用積分球漫反射檢測系統(tǒng)完成樣品近紅外光譜的采集,NIRS掃描波數(shù)范圍4 000~10 000cm-1。NIRS方法經(jīng)優(yōu)化后,樣品光譜采集的工作流(workflow)確定為:分辨率8cm-1,掃描次數(shù)32次,增益為2,以內(nèi)置背景為參考。每個(gè)樣品重復(fù)3次掃描,取其平均光譜,以消除樣品不均勻性帶來的干擾。
1.2.4 組合間隔偏最小二乘法 偏最小二乘回歸法(partial least squares regression,PLSR)是多元校正中經(jīng)典的定量建模方法之一。在建模的過程中,為了不丟失光譜信息,PLSR常采用全光譜(full spectrum)數(shù)據(jù)進(jìn)行建模,但是全光譜中無信息變量(uninformative variables)過多,將會導(dǎo)致模型過擬合,預(yù)測結(jié)果變差。因此,需采用變量篩選方法提取特征變量,提高NIRS模型的精度。間隔偏最小二乘法[15](interval partial least square,iPLS)是將全光譜分為n個(gè)等寬子區(qū)間,然后對每個(gè)子區(qū)間進(jìn)行局部建模,得到誤差最小,相關(guān)系數(shù)最大的子區(qū)間。組合間隔偏最小二乘法(siPLS)是iPLS的一個(gè)擴(kuò)展,該方法的主要原理是以交叉驗(yàn)證均方根誤差為指標(biāo),對全光譜不同子區(qū)間(比如2、3以及4個(gè)區(qū)間)進(jìn)行任意組合,采用多元回歸方法建立定量模型,最終得到最優(yōu)的光譜變量區(qū)間組合以及相應(yīng)的模型[16]。
1.2.5 模型評價(jià) 采用模型相關(guān)系數(shù)(R)、交叉驗(yàn)證均方根(RMSECV)與預(yù)測集驗(yàn)證均方根(RMSEP)進(jìn)行評價(jià),分別按式(1)~(3)計(jì)算:
式中:
ci——試驗(yàn)值,mg/kg;
n——校正集樣本數(shù);
m——預(yù)測集樣本數(shù)。
1.2.6 統(tǒng)計(jì)分析 利用MATLAB軟件進(jìn)行。
采用NIRS數(shù)據(jù)進(jìn)行建模,選擇有代表性的校正集樣品進(jìn)入到校正模型的數(shù)據(jù)庫,不但可以降低過擬合風(fēng)險(xiǎn)、提高模型的預(yù)測精度,還可以減少建模的工作量。本研究共收集72個(gè)稻米樣本,采用基于馬氏距離的Kennard-Stone(KS)法[17]依次從整個(gè)樣本集(samples set)挑選54個(gè)樣品作為校正集(calibration set),18個(gè)樣品作為預(yù)測集(prediction set)。
圖1為代表性樣品在4 000~10 000cm-1的NIRS圖,主要吸收峰光譜解析為[18]:8 423.5cm-1附近的吸收峰為C—H鍵振動(dòng)的二級倍頻,6 907cm-1附近的吸收峰為O—H鍵伸縮振動(dòng)的一級倍頻,6 480cm-1附近的吸收峰為N—H鍵伸縮振動(dòng)的一級倍頻,5 720cm-1與5 900cm-1兩處吸收峰對應(yīng)的是C—H鍵的一級倍頻,5 200cm-1附近的吸收峰為O—H鍵振動(dòng)組合頻,4 830cm-1附近的吸收峰為N—H鍵伸縮振動(dòng)與彎曲振動(dòng)的組合頻,4 390cm-1附近的吸收峰為C—H振動(dòng)的組合頻。
圖1 稻米樣品代表性的近紅外光譜圖Figure 1 NIR spectrum of rice sample
采集的NIRS中,光譜的背景噪聲、物理因素導(dǎo)致的光散射與量綱不一致等將對建模的準(zhǔn)確性產(chǎn)生重要影響[19]。因此,需要對光譜進(jìn)行預(yù)處理,以減少上述影響。在全光譜范圍內(nèi),以RMSECV值及Rc(訓(xùn)練集相關(guān)系數(shù))進(jìn)行評價(jià)指標(biāo),考察了Savitzky-Golay(SG)平滑、中心化(meaning)、自歸一化(autoscaling)及多元散射校正(multiple scattering correction,MSC)等5種數(shù)據(jù)預(yù)處理方法對稻米樣品的NIR光譜模型的影響。最終確定了平滑、中心化以及多元散射校正作為光譜預(yù)處理最優(yōu)方法。
本研究采集的近紅外原始光譜包含1 557個(gè)變量,在多元變量校正時(shí)包含著不相關(guān)或冗余信息,利用全光譜建立校正模型存在著過擬合風(fēng)險(xiǎn)。因此,采用特征變量選擇方法對全光譜變量進(jìn)行篩選,能減少模型的變量數(shù),降低模型的復(fù)雜性,提高模型的預(yù)測性能。本試驗(yàn)分析了siPLS特征變量提取方法,并與全光譜建模結(jié)果進(jìn)行比較。SiPLS法具體步驟:將全光譜劃分為60個(gè)區(qū)間,每個(gè)區(qū)間26個(gè)變量,然后對不同區(qū)間進(jìn)行組合,得到RMSECV值最小的子區(qū)間組合。本試驗(yàn)考察了siPLS法不同子區(qū)間個(gè)數(shù)的組合對模型的影響,確定3個(gè)區(qū)間組合次數(shù)時(shí),RMSECV值最低,Rc值最大。
圖2為訓(xùn)練集建模時(shí)前10個(gè)主因子數(shù)與所對應(yīng)的RMSECV值的相關(guān)圖。由圖2可知,當(dāng)主因子數(shù)為9時(shí),RMSECV值最小。
圖2 主因子數(shù)與RMSECV的相關(guān)圖Figure 2 The correlation diagram of PLS components and RMSECV
表1列出了前10個(gè)區(qū)間組合所對應(yīng)的波數(shù)位置、主因子數(shù)以及RMSECV值,由表1可知,組合區(qū)間為[21 30 38]時(shí),對應(yīng)的主因子數(shù)為9,此時(shí)RMSECV值最小,為0.247。
采用siPLS法得到的最優(yōu)區(qū)間組合為[21 30 38],21,30與38三區(qū)間在全光譜對應(yīng)的波數(shù)位置見圖3,分別為6 005.2~6 101.6,6 907.8~7 004.2與7 710.0~7 806.4cm-1。具體NIRS解析為[18]:6 005.2~6 101.6cm-1為C—H伸縮振動(dòng)的一級倍頻,6 907.8~7 004.2cm-1為蛋白質(zhì)N—H反對稱伸縮振動(dòng)一級倍頻以及淀粉O—H伸縮振動(dòng)的一級倍頻。7 710.0~7 806.4cm-1為C—H伸縮振動(dòng)的一級倍頻伸縮振動(dòng)的第二組合頻。
表1 RMSECV最低的前10個(gè)組合區(qū)間及其對應(yīng)的主因子數(shù)Table 1 The top 10intervals corresponding to PLS component and RMSECV using siPLS
圖3 采用siPLS算法選擇波段在全譜中的位置Figure 3 Spectral subintervals were selected by siPLS algorithm
采用siPLS法選擇NIRS特征吸收波數(shù),建立稻米鎘PLS定量模型并進(jìn)行預(yù)測,訓(xùn)練集中54個(gè)樣品ICP—MS測定的試驗(yàn)值與NIRS預(yù)測值的相關(guān)圖見圖4。由圖4可知,樣本號為8#、30#與31#的樣品預(yù)測相對較差。此時(shí),模型校正集 RMSECV為0.247,訓(xùn)練集相關(guān)系數(shù)(Rc)為0.919。
圖5為預(yù)測集中18個(gè)樣品ICP—MS測定的試驗(yàn)值與NIRS預(yù)測值的相關(guān)圖。預(yù)測集RMSECV為0.261,預(yù)測集相關(guān)系數(shù)(Rp)為0.895。
圖4 訓(xùn)練集中試驗(yàn)值與預(yù)測值的相關(guān)圖Figure 4 Prediction value vs.ICP—MS measurement for the determination of actual content in the calibration set(n=54)
圖5 預(yù)測集中試驗(yàn)值與預(yù)測值的相關(guān)圖Figure 5 Prediction value vs.ICP—MS measurement for the determination of actual content in the calibration set(n=18)
為了評價(jià)siPLS法在稻米鎘定量建模變量選擇中的重要性,本研究采用2.3節(jié)相同的光譜預(yù)處理手段,建立了全光譜的PLS模型。由表2可知,采用全光譜建立的PLS模型的預(yù)測結(jié)果比siPLS法都要差,這說明采用siPLS法對原始光譜進(jìn)行特征波長選擇,主要成分信息得到最大保留,冗余信息得到部分去除,預(yù)測能力得到提高。
表2 siPLS法與PLS建模結(jié)果比較Table 2 Comparison of the results of siPLS and PLS
本研究采用近紅外光譜與組合間隔偏最小二乘法相結(jié)合,初步實(shí)現(xiàn)了鎘污染稻米中鎘含量的定量檢測。結(jié)果表明,采用siPLS法選擇特征變量再進(jìn)行建模,所得結(jié)果優(yōu)于全譜建模結(jié)果。本研究將進(jìn)一步擴(kuò)大樣品量,提高模型的穩(wěn)健性與準(zhǔn)確性。本研究結(jié)果可為近紅外光譜技術(shù)在稻米鎘快速識別上提供初步依據(jù)。
1 Chaney R L,Reeves P G,Ryan J A,et al.Improved understanding of hyperaccumulation yields commercial phytoextraction and phytomining technologies[J].Biometals,2004,17(5):549~553.
2 Lindén A,Olsson I M,Bensryd I,et al.Monitoring of cadmium in the chain from soil via crops and feed to pig blood and kidney[J].Ecotoxicology and Environmental Safety,2003,55(2):213~222.
3 Chen Gui-ping,Mei Yuan,Tao Wei,et al.Micro near infrared spectroscopy(MicroNIRS)based on on-line enrichment:determination of trace copper in water using glycidyl methacrylatebased monolithic material[J].Analytica Chimica Acta,2011,670(1~2):39~43.
4 Akamatsu S,Yoshioka N,Mitsuhashi T.Sensitive determination of cadmium in brown rice and spinach by flame atomic absorption spectrometry with solid-phase extraction[J].Food Additives &Contaminants:Part A,2012,29(11):1 696~1 700.
5 Kumagai M,Ohisa N,Amano T,et al.Canonical discriminant analysis of cadmium content levels in unpolished rice using aportable near-infrared spectrometer[J].Analytical Science,2003,19(11):1 553~1 555.
6 González-Martín I,González-Pérez C,Hernández-Méndez J,et al.Mineral analysis(Fe,Zn,Ca,Na,K)of fresh Iberian pork loin by near infrared reflectance spectrometry:Determination of Fe,Na and K with a remote fibre-optic reflectance probe[J].Analytica Chimica Acta,2002,468(2):293~301.
7 Font R,Del Río-Celestino M,Vélez D,et al.Visible and nearinfrared spectroscopy as a technique for screening the inorganic arsenic content in the red crayfish(procambarus clarkii Girard)[J].Analytical Chemstry,2004,76(14):3 893~3 898.
8 Font R,Del Río-Celestino M,Vélez D,et al.Use of near-infrared spectroscopy for determining the total arsenic content in prostrate amaranth[J].Science of the Total Environment,2004,327(1~3):93~104.
9 Font R,Vélez D,Del Río-Celestino M,et al.Screening inorganic arsenic in rice by visible and near-infrared spectroscopy[J].Microchimica Acta,2005,151(3~4):231~239.
10 張龍,潘家榮,朱誠.基于近紅外光譜的重金屬汞、鎘和鉛污染水稻葉片鑒別[J].浙江大學(xué)學(xué)報(bào)(農(nóng)業(yè)與生命科學(xué)版),2013,39(1):50~55.
11 劉燕德,施宇.香根草葉片鉛含量近紅外光譜快速檢測[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2014,45(3):232~236.
12 Ning Yu,Li Ji-h(huán)ui,Cai Wen-sheng,et al.Simultaneous determination of heavy metal ions in water using near-infrared spectroscopy with preconcentration by nano-h(huán)ydroxyapatite[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2012(96):289~294.
13 Huang Zi-xia,Tao Wei,F(xiàn)ang Juan-juan,et al.Multivariate calibration of on-line enrichment near-infrared (NIR)spectra and determination of trace lead in water[J].Chemometrics and Intelligent Laboratory Systems,2009,98(2):195~200.
14 Kumagai M,Ohisa N,Amano T,et al.Canonical discriminant analysis of cadmium content levels in unpolished rice using a portable near-infrared spectrometer[J].Analytical Sciences,2003,19(11):1 553~1 555.
15 Norgaard L,Saudland A,Wagner J,et al.Interval partial least squares regression (iPLS):a comparative chemometric study with an example from near-infrared spectroscopy[J].Applied Spectroscopy,2000,54(3):413~419.
16 丁姣,蔡建榮,張海東,等.近紅外結(jié)合Si-ELM檢測食醋品質(zhì)指標(biāo)[J].食品與機(jī)械,2012,28(1):93~96.
17 Kennard R W,Stone L A.Computer aided design of experiments[J].Technometrics,1969(11):137~148.
18 陸婉珍.現(xiàn)代近紅外光譜分析技術(shù)[M].第二版.北京:中國石化出版社,2006.
19 張菊華,朱向榮,蘇東林,等.茶油品質(zhì)鑒別的透射和透反射模式分析比較[J].食品與機(jī)械,2012,28(1):101~104.