王璽 盧紅梅
摘 要:基于普洱茶的近紅外光譜,選擇標(biāo)準(zhǔn)正態(tài)變換(SNV)對(duì)光譜進(jìn)行有效的預(yù)處理,再結(jié)合偏最小二乘回歸(PLSR)建立茶多糖近紅外光譜定量模型,實(shí)現(xiàn)快速檢測普洱茶中茶多糖的含量。該模型的交互驗(yàn)證均方根誤差值、預(yù)測集均方根誤差值和預(yù)測集相關(guān)系數(shù)分別為0.0822、0.1264和0.8217。結(jié)果表明利用近紅外光譜技術(shù)結(jié)合PLSR可以預(yù)測普洱茶中茶多糖的含量,為普洱茶的品質(zhì)分析和活性成分測定提供一些參考。
關(guān)鍵詞:普洱茶;茶多糖;近紅外光譜;偏最小二乘回歸
云南普洱是一種暢銷國內(nèi)外市場的中國特有茶。它[1]是由云南特有的大葉種曬青茶為原料,在微生物的酶促作用和濕熱作用下進(jìn)行加工工藝而制成的。普洱茶與紅茶、綠茶、白茶等其他茶類的主要區(qū)別在于它特殊的后發(fā)酵工藝。在微生物參與的后發(fā)酵過程中,茶葉中的化學(xué)物質(zhì)發(fā)生了一系列的顯著變化,從而形成普洱茶獨(dú)特的品質(zhì)風(fēng)味和保健功能。近年來,普洱茶越來越受到了消費(fèi)者和科研工作者的關(guān)注,成為茶學(xué)領(lǐng)域中的研究熱點(diǎn)。
普洱茶的品質(zhì)、風(fēng)味以及保健藥理功能[2]與茶葉內(nèi)活性成分茶多糖的組成有很大的相關(guān)性。茶多糖是一種復(fù)合型雜多糖[3],具有降血糖、血脂、血壓、防治心血管疾病等作用,同時(shí)在抗凝血、防血栓、保護(hù)血相和增強(qiáng)人體非特異性免疫功能方面均有明顯效果。近些年科學(xué)研究報(bào)道[4]茶多糖還具有治療糖尿病的功效。因此茶多糖的含量也成為鑒定普洱茶品質(zhì)的一個(gè)重要指標(biāo)。傳統(tǒng)測定茶多糖的方法為苯酚-硫酸法、蒽酮-硫酸法和高效凝膠液相色譜[5,6]等等,但是這些方法都比較繁瑣、工作量大、抗干擾能力較差,并不適合茶葉流通過程中的快速檢測。因此為了解決這個(gè)問題,有必要提出一種快速、無損、經(jīng)濟(jì)的方法定量分析普洱茶中的茶多糖含量。
近紅外光譜以其分析速度快、樣品無損害、結(jié)果重現(xiàn)性好并且分析過程中不需要化學(xué)試劑等優(yōu)點(diǎn)得到越來越多科學(xué)家的關(guān)注和青睞,因此廣泛地被應(yīng)用于很多領(lǐng)域,比如農(nóng)業(yè)、食品行業(yè)以及中草藥領(lǐng)域[7,8]等。目前國內(nèi)外學(xué)者先后利用近紅外光譜定量分析茶葉中茶多酚、蛋白質(zhì)、氨基酸、生物堿[9,10]等等,但是專門針對(duì)普洱茶中茶多糖含量的應(yīng)用研究還很少,所以在本文中,基于近紅外光譜,選擇合適的光譜預(yù)處理方法,結(jié)合偏最小二乘回歸建立普洱茶中茶多糖含量快速、無損的預(yù)測模型,為普洱茶中的活性成分研究提供參考價(jià)值。
1 理論部分
1.1 偏最小二乘回歸
偏最小二乘回歸(Partial Least Square Regression,PLSR)[11]是一種能同時(shí)考慮矩陣X和向量y信息的多元回歸方法,是目前在近紅外建模定量分析中應(yīng)用最廣,并且建模效果較好的多元校正方法之一。首先,PLSR對(duì)光譜矩陣X和濃度向量y同時(shí)壓縮分解,得到一系列包含絕大多數(shù)樣本信息的主成分,并通過交叉驗(yàn)證選出最佳主成分?jǐn)?shù);其次將X和y的得分矩陣作多元線性回歸,建立預(yù)測模型。因此,PLSR模型可以在X矩陣中找到最佳的變量,用來預(yù)測y向量中潛在的變量,并充分地考慮兩者之間的相關(guān)性,使之預(yù)測能力很強(qiáng)。
1.2 近紅外光譜的預(yù)處理方法
光譜預(yù)處理方法[12]是近紅外光譜應(yīng)用中非常普遍的一種手段。由于采集近紅外光譜時(shí),伴隨著隨機(jī)噪聲、基線漂移、樣本顆粒大小以及光散射等外界因素,因此近紅外光譜測量存在不穩(wěn)定性,光譜需要進(jìn)行預(yù)處理。常用的光譜預(yù)處理有多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變換(SNV)、微分(Derivative)和平滑(Smoothing)。下面將逐一進(jìn)行簡單介紹。
多元散射校正(Multiplicative scatter correction,簡稱MSC):通過數(shù)學(xué)方法將光譜中的散射光信號(hào)與化學(xué)吸收信息進(jìn)行分類,并假設(shè)散射系數(shù)在所有波長處均相同。經(jīng)過散射校正后得到的光譜數(shù)據(jù)可以有效地消除光散射的影響,增強(qiáng)與成分含量相關(guān)的光譜吸收信息。MSC主要用來消除顆粒分布不均勻以及顆粒大小差異所造成的散射影響。
標(biāo)準(zhǔn)正態(tài)變換(Standard normal variable,簡稱SNV):SNV校正認(rèn)為每一個(gè)光譜中,各波長點(diǎn)的吸收值滿足一定的分布(如正態(tài)分布),通過這一個(gè)假設(shè)對(duì)每一條光譜進(jìn)行校正,利用原光譜減去該光譜的平均值后,再除以該光譜數(shù)據(jù)的標(biāo)準(zhǔn)偏差。它的目的與MSC相似,主要用來消除固體顆粒大小、表面散射以及光程變化對(duì)光譜所造成的影響。
微分算法(Derivative):微分可以消除基線偏移或平緩背景干擾的影響,使原有光譜的分辨率提高。一階微分能夠去除與波長無關(guān)的基線漂移,消除光譜平移誤差,強(qiáng)化譜帶特征,克服譜帶重疊。常用的微分方法有直接差分法、窗口移動(dòng)多項(xiàng)式最小二乘擬合法(Savitzky-Galay),本章采用S-G一階求導(dǎo)預(yù)處理方法。
平滑算法(Smoothing):平滑是分析信號(hào)預(yù)處理中消除噪聲最常用的一種方法。由于受到外界各種因素的干擾,得到的光譜既包含有用信息,同時(shí)也疊加了隨機(jī)誤差(噪聲),造成光譜信號(hào)的毛糙,往往需要經(jīng)過平滑預(yù)處理來降噪聲。最常用的平滑方法為窗口移動(dòng)多項(xiàng)式最小二乘擬合法,這種擬合方法既能去噪提高光譜的信噪比,又能較好地保持分析信號(hào)中的有用信息,將真正的譜峰信號(hào)從噪聲中提取出來。
1.3 模型評(píng)價(jià)參數(shù)
對(duì)建立的模型需要通過測試樣本的預(yù)測來評(píng)價(jià)該校正模型的質(zhì)量,本文將采用如下指標(biāo)來進(jìn)行評(píng)價(jià):RMSECV、RMSEC和RMSEP(均方根誤差),Rcal、Rpre(相關(guān)系數(shù))。PLSR模型通過交叉驗(yàn)證過程中最小的RMSECV數(shù)值決定最佳主成分的個(gè)數(shù)。參數(shù)的詳細(xì)公式如下:
(1)均方根誤差
交叉驗(yàn)證均方根誤差(RMSECV):該指標(biāo)主要用于評(píng)價(jià)建模方法的可行性及所建模型的預(yù)測能力。
這三個(gè)數(shù)值越小,表示建模效果就越好。
(2)相關(guān)系數(shù)
相關(guān)系數(shù)R是指y的總波動(dòng)情況,表示直線關(guān)系中預(yù)測的數(shù)值和實(shí)際測量值之間的相關(guān)程度。通常R值越接近于1,說明預(yù)測值與實(shí)際測量值之間的相關(guān)程度越好。相關(guān)系數(shù)計(jì)算公式如下:
2 材料與方法
2.1 樣品和試劑
40個(gè)普洱茶樣本自普洱市。茶葉經(jīng)過粉碎、過篩、置于自封袋,然后在避光、干燥、室溫的條件下保存。苯酚和濃硫酸購自國藥控股股份有限公司。葡萄糖購自Sigma公司。
2.2 茶多糖的提取和測定
根據(jù)文獻(xiàn)參考[13]進(jìn)行優(yōu)化,本章采用超聲提取的方法。以蒸餾水作為提取溶劑,料液比為1:15,超聲時(shí)間為40min,超聲溫度為50℃。超聲完成后,抽濾取其上清液,將其定容到25mL的容量瓶中。取2ml溶液加入10ml無水乙醇,搖均,過夜醇降靜置,離心(4000rpm/min)30min,棄去上清液,沉淀加蒸餾水水溶解,轉(zhuǎn)移至10ml容量瓶中。
配置1mg/ml的葡萄糖標(biāo)準(zhǔn)溶液,作為對(duì)照品溶液。將其稀釋至不同的濃度,使得葡萄糖的線性范圍在10、20、30、40、60、80、100?滋g/ml范圍內(nèi)。
本章采用苯酚-硫酸法[14]測定茶多糖。首先精密吸取1ml樣品溶液和空白置于10ml具塞試管中,加入5%苯酚溶液1.0ml,渦旋30s搖勻,再加入濃硫酸5.0ml,立即渦旋30s,使其充分混勻,置于90度沸水浴中加熱20min,取出,再放在冷水浴中冷卻5min,在485nm處測定吸光度。以葡萄糖作為標(biāo)準(zhǔn)品,茶多糖的含量表示為%GE(每100克茶葉相當(dāng)于多少克葡萄糖)。
2.3 近紅外光譜的獲取和光譜分析
由于待測樣品為不透明粉末,樣品厚度及透射過程中光路的不規(guī)則影響透射光譜強(qiáng)度,因此很難獲得良好光譜效果。本實(shí)驗(yàn)采用漫反射方式測量其光譜。實(shí)驗(yàn)儀器為AntarisⅡ FT-NIR Analyzer的近紅外儀器(序列號(hào)AHY0800344),采集條件:掃描范圍為10000-4000cm-1(1000-2500nm)、掃描次數(shù)為32次、靈敏度為8cm-1、變量個(gè)數(shù)為1557。具體的實(shí)驗(yàn)過程如下:取0.5000g樣品粉末置于樣品槽,將其進(jìn)行壓縮、關(guān)蓋、掃描,同時(shí)為了提高準(zhǔn)確度,每個(gè)樣本掃描三次,取其平均光譜進(jìn)行后續(xù)分析。所獲得普洱茶的近紅外原始光譜見圖1所示。
3 結(jié)果與討論
3.1 樣本集的劃分以及實(shí)測值的分布
本章共選用了40個(gè)樣本建立茶多糖的定量分析模型。在建立模型之前,需要從這40個(gè)樣本中選擇合適的樣本作為訓(xùn)練集來建立模型,剩下的樣本作為預(yù)測集來驗(yàn)證模型的預(yù)測能力。本文選擇Kennard-Stone樣本劃分方法,其中28份樣本作為訓(xùn)練集,剩下的12份樣本作為預(yù)測集。所有樣品經(jīng)過光譜采集后,按照上述方法測得其茶多糖的含量。其測量值范圍、平均值、標(biāo)準(zhǔn)偏差的結(jié)果如表1所示。實(shí)驗(yàn)結(jié)果顯示,普洱茶樣品中茶多糖含量的變幅較大,說明樣品間差異顯著。同時(shí),訓(xùn)練集中各個(gè)訓(xùn)練集中數(shù)值幾乎覆蓋了預(yù)測集中測量值的變化范圍。因此,所選的樣品具有代表性,在樣品集中的分布是合理的。
3.2 近紅外光譜預(yù)處理方法的選擇
近紅外光譜儀所采集的光譜除了樣品的有用信息外,還包含了很多其他無關(guān)的信息如環(huán)境、樣品的背景干擾和雜散光等,這些會(huì)造成原始光譜基線漂移、譜帶重疊,不能充分地反映樣品的信息。因此,為了獲得穩(wěn)定、可靠的模型,首先需要對(duì)原始光譜進(jìn)行預(yù)處理,消除數(shù)據(jù)中的無關(guān)信息。本文選擇平滑、多元散射校正、標(biāo)準(zhǔn)正態(tài)變換以及它們的組合,這些光譜預(yù)處理方法,同時(shí)以交互驗(yàn)證均方根誤差(RMSECV)作為衡量標(biāo)準(zhǔn)。從表1-2可以看出,對(duì)于茶多糖,最佳的光譜預(yù)處理方法為SNV。
3.3 近紅外定量分析模型的建立
本實(shí)驗(yàn)采用NIRS-PLS建立普洱茶中茶多糖的定量分析模型。根據(jù)3.2選擇合適的預(yù)處理方法,建立校正模型。其評(píng)價(jià)結(jié)果如下圖1-2所示。從圖1-2可以看出,茶多糖總量模型還行,可以滿足定量模型預(yù)測的需求,其中訓(xùn)練集的相關(guān)系數(shù)為0.9051,預(yù)測集的相關(guān)系數(shù)為0.8217。
4 結(jié)束語
本文主要針對(duì)普洱茶中茶多糖這個(gè)指標(biāo)建立近紅外光譜分析模型,為實(shí)現(xiàn)快速、無損檢測普洱茶中茶多糖的含量。實(shí)驗(yàn)結(jié)果表明:針對(duì)普洱茶的近紅外光譜圖,采用SNV光譜預(yù)處理手段,可以有效地消除導(dǎo)致光譜變化的外在影響,然后結(jié)合PLS進(jìn)行回歸,建立茶多糖總量的預(yù)測模型。該模型訓(xùn)練集和預(yù)測集的相關(guān)系數(shù)分別為0.9051和0.8217,RMSEC和RMSEP分別為0.0822和0.1264。這個(gè)數(shù)據(jù)基本可以滿足定量分析,但是在以后的研究中可以選擇一些變量篩選方法比如CARS、MC-UVE、GA等進(jìn)一步對(duì)大數(shù)據(jù)進(jìn)行優(yōu)化分析,提取更多有效的變量,來提高模型的預(yù)測能力??偠灾?,近紅外光譜技術(shù)可以作為一種快速、方便、可靠的方法實(shí)現(xiàn)對(duì)普洱茶中茶多糖含量的分析和快速檢測,為普洱茶的品質(zhì)分析提供一定的參考價(jià)值。
參考文獻(xiàn)
[1]Lv H-p, Zhang Y-j, Lin Z, et al. Processing and chemical constituents of Pu-erh tea: a review[J]. Food Research International, 2013,53(2):608-618.
[2]Jie G, Lin Z, Zhang L, et al. Free radical scavenging effect of Pu-erh tea extracts and their protective effect on oxidative damage in human fibroblast cells[J]. Journal of Agricultural and Food Chemistry, 2006,54(21):8058-8064.
[3]Chen H, Wang Z, Qu Z, et al. Physicochemical characterization and antioxidant activity of a polysaccharide isolated from oolong tea[J].European Food Research and Technology,2009,229(4):629-635.
[4]陳海霞,謝筆鈞.茶多糖對(duì)小鼠實(shí)驗(yàn)性糖尿病的防治作用[J].營養(yǎng)學(xué)報(bào),2002,24(1):85-86.
[5]林劍軍,秦菁莉,周平.黃金茶多糖含量的測定[J].大理學(xué)院學(xué)報(bào),2009,8(6):18-19.
[6]崔宏春,周鐵峰,鄭旭霞,等.茶多糖檢測方法研究進(jìn)展[J].杭州農(nóng)業(yè)與科技,2014(6):29-31.
[7]Dong W, Ni Y, Kokot S. A near-infrared reflectance spectroscopy method for direct analysis of several chemical components and properties of fruit, for example, Chinese Hawthorn[J].Journal of Agricultural and Food Chemistry, 2013,61(3):540-546.
[8]Li W, Wang Y, Qu H. Near infrared spectroscopy as a tool for the rapid analysis of the Honeysuckle extracts[J].Vibrational Spectros
copy, 2012,62:159-164.
[9]Schulz H, Engelhardt U, Wegent A, et al. Application of near-infrared reflectance spectroscopy to the simultaneous prediction of alkaloids and phenolic substances in green tea leaves[J].Journal of Agricultural and Food Chemistry,1999,47(12):5064-5067.
[10]Luypaert J, Zhang M, Massart D. Feasibility study for the use of near infrared spectroscopy in the qualitative and quantitative analysis of green tea, Camellia sinensis (L.)[J].AnalyticaChimicaActa,2003,478(2):303-312.
[11]Barker M, Rayens W. Partial least squares for discrimination[J]. Journal of chemometrics,2003,17(3):166-173.
[12]Blanco M, Coello J, Iturriaga H, et al. Effect of data preprocessing methods in near-infrared diffuse reflectance spectroscopy for the determination of the active compound in a pharmaceutical preparation[J].Applied spectroscopy,1997,51(2):240-246.
[13]楊泱,楊新河,易戀,等.超聲波法提取普洱茶多糖的研究[J].中國茶葉,2009(10):20-22.
[14]武曉英,侯冬巖,回瑞華.黑茶中茶多糖含量的測定[J].鞍山師范學(xué)院學(xué)報(bào),2011,13(2):36-38.