錢麗麗,冷候喜,張愛武,宋雪健,曹冬梅,湯華成,張東杰*
1 (黑龍江八一農(nóng)墾大學食品學院,黑龍江 大慶,163319)2(杜爾伯特伊利乳業(yè)有限責任公司,黑龍江 大慶,166200)3(杜爾伯特金山乳品有限責任公司,黑龍江 大慶,166200 )
基于Fisher判別法對黑龍江大米產(chǎn)地溯源
錢麗麗1,冷候喜2,3,張愛武1,宋雪健1,曹冬梅1,湯華成1,張東杰1*
1 (黑龍江八一農(nóng)墾大學食品學院,黑龍江 大慶,163319)2(杜爾伯特伊利乳業(yè)有限責任公司,黑龍江 大慶,166200)3(杜爾伯特金山乳品有限責任公司,黑龍江 大慶,166200 )
為了探索大米產(chǎn)地鑒別可行性,維護市場秩序和消費者的合法權(quán)益,該研究采用Fisher判別法(Fisher discriminant method,費希爾判別法)進行建模并結(jié)合近紅外光譜技術(shù),對2015年黑龍江5 個水稻主產(chǎn)區(qū)(五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江)的118份大米粉末樣品進行近紅外光譜的掃描,光譜預處理方法為9點二階求導結(jié)合5點平滑,建模波長為全波長。對模型采用留一交叉驗證和預測樣本集進行驗證,5 個地域的驗證結(jié)果分別為94.4%、94.4%、91.7%、91.7%、94.4%和87.5%、87.5%、87.5%、100%、100%。預測結(jié)果達到80%以上,初步認定近紅外光譜指紋分析技術(shù)可用于黑龍江大米產(chǎn)地溯源。
大米;產(chǎn)地溯源;近紅外光譜;Fisher判別法
黑龍江省自然條件優(yōu)越,種植的水稻米粒通透,口感良好,受到廣大消費者和廠商的青睞,尤以黑龍江地理標志大米品質(zhì)更佳,市場需求量大且價格較普通大米高出3倍以上。正因為這一利益的驅(qū)使,不法商販將普通大米冒充地理標志大米,破壞了企業(yè)和消費者的利益,擾亂市場秩序。目前礦物元素指紋分析技術(shù)[1]、有機成分指紋分析技術(shù)[2]、近紅外光譜技術(shù)[3]等已被用于農(nóng)產(chǎn)品產(chǎn)地溯源的研究,但仍處于初級階段,前兩者具有判別結(jié)果準確度高等優(yōu)點,但存在著檢測周期長,成本高等缺點,相比較而言近紅外技術(shù)在產(chǎn)地溯源的研究中有著快速、高效、無損等優(yōu)點,近紅外光譜分析主要用于有機物質(zhì)定性和定量的一種分析技術(shù),易受到加工方式、貯藏時間和條件等影響,故在產(chǎn)地溯源研究中存在一定的局限性。Fisher判別法是先對樣本進行方差分析,將樣本的種類區(qū)分出,然后依據(jù)方差分析的結(jié)果進行線性判別分析,區(qū)分不同個體。Fisher線性識別作為一種分類方法已經(jīng)被成功的廣泛使用在食品、農(nóng)業(yè)等各個領域[4~7],同時將Fisher判別法與近紅外光譜結(jié)合在茶葉、葡萄酒的品種和產(chǎn)地的鑒別中已見報道。周健等[8]將不同品種的茶葉樣本作為試驗樣本,對試驗樣本進行了近紅外光譜的采集,運用主成分分析(PCA)篩選出8個主成分,結(jié)合Fisher判別法建立的品種判別模型對茶葉樣本進行識別,識別準確率為96.8%。劉巍等[9]以我國不同地域產(chǎn)的3 種葡萄酒為試驗樣本,對試驗樣本進行近紅外光譜的掃描,采用Fisher判別法對試驗樣本進行產(chǎn)地溯源的鑒別,結(jié)果達到定性分析的要求。但應用近紅外光譜結(jié)合Fisher判別法在大米產(chǎn)地溯源中的應用還鮮有報道,本研究采用近紅外光譜技術(shù)結(jié)合Fisher判別方法建立黑龍江大米產(chǎn)地溯源模型,為近紅外光譜分析技術(shù)在黑龍江大米產(chǎn)地溯源的研究提供理論依據(jù)。
1.1 試驗材料
為確保試驗樣品真實性與代表性,試驗樣品的采集選擇在水稻田中直接代表性取樣,采樣時間選擇在水稻成熟期后、農(nóng)戶收割水稻前完成,每個采樣點的每個品種采集2 kg,記錄采樣地點、品種等信息。地點選擇2015年黑龍江5 個水稻主產(chǎn)區(qū)包括五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江,分別選擇其主產(chǎn)縣、主產(chǎn)鄉(xiāng)(鎮(zhèn)或農(nóng)場)、主產(chǎn)村(屯)的大面積種植地塊,采樣品種選擇5 個主產(chǎn)區(qū)的主栽品種。所有試驗品種均為粳米,共118 份試驗樣品,如表1所示。將水稻樣品經(jīng)過晾曬、挑選、礱谷和碾米等統(tǒng)一加工過程,超微粉碎成米粉,過100目篩,待測。
表1 樣品信息來源表
1.2 試驗儀器
FC2K礱谷機,日本大竹制作所;VP-32實驗碾米機,日本山本公司;FW100高速萬能粉碎機, 天津泰斯特儀器有限公司;DA7200型固定光柵連續(xù)光譜近紅外分析儀,瑞典波通儀器公司
1.3 材料的選取
試驗材料的選擇參照表1。隨機選擇全部樣本量的2/3作為建模樣本用于建立模型,1/3作為預測樣本集用于驗證模型。各地用于建模和預測的樣本數(shù)見表2。
表2 建模與預測樣品表
1.4 實驗方法
采用Unscrambler 9.7光譜分析軟件對進行光譜掃描,得到近紅外原始光譜見圖1。
圖1 大米樣品近紅外原始光譜圖Fig.1 Near infrared original spectra of rice samples
將原始光譜轉(zhuǎn)化為TCAMP-DX格式,采用Unscrambler 9.7光譜分析軟件選擇原始光譜的預處理方法與建模波長范圍;然后將樣本光譜除去水分峰,采用主成分分析給數(shù)據(jù)降維,篩選Fisher自變量;用SPSS 18.0軟件分析數(shù)據(jù),建立Fisher判別模型;用建模樣本集建立Fisher判別模型,用預測樣本集對模型進行驗證,計算模型的產(chǎn)地判別正確率。
2.1 光譜預處理方法的選擇對建模效果的影響
試驗選擇MSC、SNV、平滑、求導4 種常用的光譜預處理方法,分別對全部樣本的近紅外原始光譜進行預處理后,將樣本近紅外光譜圖中的水分峰扣除,消除水分對建模結(jié)果的影響。對表2中的建模樣本集在全波長范圍采用Fisher判別法建立判別模型,用預測樣本集對模型的正確度進行驗證,選擇高預測正確率對應的預處理方式為本試驗的近紅外原始光譜預處理方式。對于平滑和求導預處理來說,選擇的點數(shù)過少對光譜預處理的效果并不明顯,過多會造成光譜的失真。故試驗選擇范圍為5點、7點、9點、11點,即對5點、7點、9點、11點進行平滑處理、一階求導處理和二階求導處理。
不同預處理建模的效果見表3。將預處理后建模預測的結(jié)果與原始光譜建模預測的結(jié)果對比,發(fā)現(xiàn)原始光譜與經(jīng)過不同預處理后的近紅外光譜建立的Fisher判別模型對預測樣本集的識別率均為100%,但是預測正確率大不相同。經(jīng)過一階和二階求導預處理建模的預測正確率比經(jīng)過原始光譜、MSC、SNV、平滑預處理建模的預測正確率高。說明近紅外原始光譜經(jīng)過預處理后,是可以提高模型對預測集的正確率。經(jīng)過9點二階求導預處理后建立模型的預測正確率最高,5 個地域的預測正確率分別為75%、75%、75%、87.5%、75%。與蘇學素等[10]在對臍橙產(chǎn)地溯源研究中選出的最優(yōu)對光譜預處理的方法基本一致。
試驗選擇在9點二階求導的基礎上,分別結(jié)合MSC、SNV、5點平滑、7點平滑、9點平滑、11點平滑對樣本的近紅外原始光譜進行預處理后,用表2中的建模樣本集在全波長范圍采用Fisher判別法建立判別模型,用預測樣本集對模型的正確度進行驗證,并選擇高預測正確率對應的預處理方式為本試驗的近紅外原始光譜預處理方式,驗證結(jié)果見表4,可以看出2種預處理后的近紅外光譜建立的Fisher判別模型對預測樣本集的識別率均為100%,但是預測正確率大不相同,但總體上比表3中的預測正確率高。說明本試驗中將2 種預處理方法結(jié)合可以提高模型的正確度比一種的效果好。由表4可以看出經(jīng)過9點二階求導和5點平滑預處理后建立模型的預測正確率最高,所以本研究最終選擇9點二階求導和5點平滑對近紅外原始光譜進行預處理,預處理后的近紅外光譜圖如圖2。與王亞鴿[11]在對枸杞產(chǎn)地鑒別及品質(zhì)快速檢測研究中采用對全光譜進行SNV+S-G D(2st,3th,5)預處理的方法基本一致。
表3 預處理對建模效果的影響
以上樣品識別率均為100%。
表4 預處理對建模效果的影響
以上樣品模型識別率均為100%
圖2 預處理后的大米近紅外光譜圖Fig.2 Rice near infrared spectra after pretreatment
2.2 波長范圍的選擇對建模效果的影響
譜區(qū)范圍的選擇是建模過程中一個重要環(huán)節(jié),近些年來,對建模波長范圍的選擇并無統(tǒng)一標準,學者的研究還處在規(guī)律的發(fā)現(xiàn)階段,試驗根據(jù)一些學者[12~17]的研究方式進行波長范圍的選擇對建模效果進行研究。對所有樣本進行9點二階求導結(jié)合5點平滑預處理后,對全光譜范圍進行分段。對建模樣本集采用Fisher判別法在全波長范圍和分段光譜范圍分別建立Fisher判別模型,用預測樣本集對Fisher判別模型的正確度進行驗證,選擇高預測正確率對應的波長范圍為本試驗建立的Fisher判別模型選擇的波長范圍,不同波長范圍建立Fisher判別模型的識別率和預測正確率見表5。比較各個波段的樣本建模的結(jié)果,發(fā)現(xiàn)不同波段建立Fisher判別模型的識別率均為100%,但是預測正確率各不相同,但均為50%以上,其中分段波長建立模型的預測正確率最高的為1 150~1 250 nm波長。全波長建立模型的預測正確率總體比1 150~1 250 nm波段建立模型的預測正確率高,所以本試驗選擇全波長范圍950~1 650 nm進行Fisher判別模型的建立。試驗與NIU等[12]采用近紅外光譜技術(shù)在800~2 500 nm的全波長范圍內(nèi)對來自不同酒廠的紹興黃酒進行判別和周子立等[13]在全波長為325~1 075 nm處利用近紅外光譜技術(shù)進行大米品種鑒別在波長范圍的選取上存在一定的交集;NILSEN等[14]應用近紅外反射儀器對傳送帶上的絞細牛肉成分進行在線檢測所選取的全波長為950~1 700 nm試驗效果較好;與趙海燕等[15]利用近紅外光譜技術(shù)在全波長為950~1 650 nm處對不同地域來源的小麥進行地理標志性識別效果好與分段掃描,且試驗結(jié)果與本試驗相一致。選擇全波長要優(yōu)于分段波長的原因可能是由于全波長涵蓋的指紋信息更充分能較為全面的表征樣品特征,所以全波長范圍的判別率要高于分段波長。
表5 不同波長范圍對建模效果的影響
注:以上樣品模型識別率均為100%。
2.3 模型的驗證
為了全面的檢測模型的預測能力,本研究選擇了留一交叉驗證法對建立的模型進行驗證,即從78 個樣本中隨機抽取1 個進行判別,用剩下的77 個樣本建模型后對其產(chǎn)地進行鑒別,鑒別結(jié)果見表6。結(jié)果表明,5 個地域的留一交叉驗證和預測集校驗對全光譜建立模型的檢測結(jié)果分別為94.4%、94.4%、91.7%、91.7%、94.4%和87.5%、87.5%、87.5%、100%、100%。預測結(jié)果均為80%以上,均達到了定性判別的要求,初步說明Fisher判別可以用于黑龍江不同產(chǎn)地大米溯源。
表6 Fisher判別函數(shù)鑒別5個地域大米樣品的結(jié)果
本試驗選擇五常、佳木斯、齊齊哈爾、雙鴨山、牡丹江的118 份大米粉末樣品進行近紅外光譜的掃描,得到原始近紅外光譜圖。確定近紅外原始光譜圖的預處理方法為9點二階求導結(jié)合5點平滑,最佳波長范圍為全波長。在建立模型前對預處理后的近紅外光譜進行主成分分析證明本試驗可以采用Fisher判別法進行產(chǎn)地溯源判別模型。對模型的Fisher自變量進行選擇,對建模樣本集采用Fisher判別法進行產(chǎn)地溯源判別模型后,采用建模樣本集采用留一交叉驗證和預測樣本集的驗證,模型識別率為100%,5個地域的驗證結(jié)果正確率均在80%以上,達到定性分析的要求,說明近紅外光譜分析技術(shù)可用于黑龍江大米產(chǎn)地判別,為地理標志大米的產(chǎn)地保護具有重要的理論價值。為研究不同產(chǎn)地及品種之間的差異性對建模效果的影響,已在部分地區(qū)建立了試驗田,對影響模型穩(wěn)定性的相關(guān)因素展開系統(tǒng)研究是下一步的研究主要方向。
[1] GONZALVEZ A, LLORENS A, CERVERA M L, et al. Elemental fingerprint of wines from the protected designation of origin valencia[J]. Food Chemistry, 2009, 112(1): 26-34.
[2] HERBERGER K, CSOMOS E, SIMON-SARKADI L. Principal component and linear discriminant analyses of free amino acids and biogenic amines in hungarian wines[J]. Journal of Agricultural and Food Chemistry, 2003, 51(27): 8 055-8 060.
[3] 馬冬紅,王錫昌,劉利平,等. 近紅外光譜技術(shù)在食品產(chǎn)地溯源中的研究進展[J]. 光譜學與光譜分析,2011,131(14):877-881.
[4] QU Y, ADAM B L, THORNQUIST M, et al. Data reduction using a discrete wavelet transform in discriminant analysis of very high dimensionality data[J]. Biometrics, 2003, 59(1):143-51.
[5] BILLINGS S A, LEE K L. Nonlinear fisherdiscriminant analysis using a minimum squared error cost function and the orthogonal least squares algorithm.[J]. Neural Networks the Official Journal of the International Neural Network Society, 2002, 15(2):263-270.
[6] Cawley G C, Talbot N L C. Efficient leave-one-out cross-validation of kernel fisher discriminant classifiers[J]. Pattern Recognition, 2003, 36(11):2 585-2 592.
[7] GESTEL T, SUYKENS J, LANCKRIET G, et al. Bayesian framework for least-squares support vector machine classifiers, gaussian processes, and kernel fisher discriminant analysis[J]. Neural Computation, 2002, 14(5):1 115-1 147.
[8] 周健,成浩,葉陽,等. 基于近紅外的Fisher分類法識別茶葉原料品種的研究[J]. 光學學報,2009,29(1):1 117-1 121.
[9] 劉巍,李德美,劉國杰,等. 利用近紅外光譜技術(shù)對葡萄酒原產(chǎn)地進行Fisher判別[J]. 釀酒科技,2010(7):65-69.
[10] 蘇學素, 張曉焱, 焦必寧,等. 基于近紅外光譜的臍橙產(chǎn)地溯源研究[J]. 農(nóng)業(yè)工程學報, 2012(15):240-245.
[11] 王亞鴿. 基于近紅外光譜技術(shù)的枸杞產(chǎn)地鑒別及品質(zhì)快速檢測研究[D].楊凌:西北農(nóng)林科技大學, 2015.
[12] NIU X Y, YU H Y, YING Y B. YTransactions of the ASABE, 2008, 51(4): 1 371.
[13] 周子立, 張瑜, 何勇,等. 基于近紅外光譜技術(shù)的大米品種快速鑒別方法[J]. 農(nóng)業(yè)工程學報, 2009, 25(8):131-135.
[14] HILDRUM K I, NILSEN B N, WESTAD F, et al. In-line analysis of ground beef using a diode arrag near infrared instrument on a conveyor belt[J].Journal of Near Infrared Spectroscopy, 2004,12:367.
[15] 趙海燕, 郭波莉, 魏益民,等. 近紅外光譜對小麥產(chǎn)地來源的判別分析[J]. 中國農(nóng)業(yè)科學, 2011, 44(7):1 451-1 456.
[16] 段焰青, 陶鷹, 者為,等. 近紅外光譜分析技術(shù)在煙葉產(chǎn)地鑒別中的應用[J]. 云南大學學報:自然科學版, 2011, 33(1):77-82.
[17] 陳全勝, 趙杰文, 張海東,等. SIMCA模式識別方法在近紅外光譜識別茶葉中的應用[J]. 食品科學, 2006, 27(4):186-189.
Study on the origins of Heilongjiang rice based on Fisher discriminate method
QIAN Li-li1,LENG Hou-xi2,3,ZHANG Ai-wu1,SONG Xue-jian1,CAO Dong-mei1,TANG Hua-cheng1,ZHANG Dong-jie1*
1(Heilongjiang Bayi Agricultural University, College of Food Science,Daqing 163319,China)2(Duerbote Yili Dairy Limited Liability Company,Daqing 166200, China)3(Durbate Jinshan Dairy Limited Liability Company,Daqing 166200, China)
In order to explore the feasibility of identification of the origins of Heiloingjiang rice to protect consumer’s rights, food safety issue and legitimate issues, the study used Fisher discrimination method combined with near infrared spectroscopy to build a model. There were 118 rice powder samples from different varieties in five areas (Wuchang、Jiamusi、Qiqihaer、 Shuangyashan) were scanned by near infrared spectroscopy in 2015. Pretreatment method of spectroscopy data is based on “9-point derivative combined with 5-point smoothing”. The wavelength is the whole spectrum. The cross validation and the predicting samples were used to verified the accuracy of the model. The verification results of five areas were 94.4%, 94.4%, 91.7%, 91.7%, 94.4% and 87.5%, 87.5%, 87.5%, 100%, 100%. Predicting accuracy was more than 80%, and Fisher discrimination method was primarily assigned to use in heilongjiang rice origin trace identification.
rice; roots; near infrared spectrum; Fisher discriminant method
10.13995/j.cnki.11-1802/ts.201705033
博士,副教授(張東杰教授為通訊作者,E-mail:byndzdj@126.com)。
黑龍江省教育廳科學技術(shù)研究項目(12541576);黑龍江省墾區(qū)科研項目(HKN125B-13-02);黑龍江省高等學校科技創(chuàng)新團隊建設計劃項目(2014TD006);黑龍江省應用技術(shù)研究與開發(fā)計劃項目(GA14B104)
2016-07-07,改回日期:2016-08-29