韓方凱,張雪柯,宋玉軍,呂日琴,張東京,翟科峰
葡萄酒味美、富含大量的生理活性成分,深受消費(fèi)者喜愛(ài).近年來(lái),隨著生活水平的提高,葡萄酒的消費(fèi)越來(lái)越大眾化,同時(shí)葡萄酒的品質(zhì)問(wèn)題亦受到人們的廣泛關(guān)注.傳統(tǒng)的葡萄酒品質(zhì)評(píng)價(jià)方法主要包括感官評(píng)價(jià)法和理化分析分法.感官評(píng)價(jià)雖簡(jiǎn)單易行,卻具有較強(qiáng)的主觀性;理化分析雖然客觀可靠,然而每一種理化指標(biāo)僅能標(biāo)志葡萄酒一方面的品質(zhì)特性,無(wú)法實(shí)現(xiàn)葡萄酒綜合品質(zhì)的準(zhǔn)確評(píng)判.因此,葡萄酒綜合品質(zhì)檢測(cè)新技術(shù)的開(kāi)發(fā)尤為迫切.
為了克服傳統(tǒng)檢測(cè)方法的缺陷,研究人員采用新型傳感器技術(shù),如電子舌、電子鼻、近紅外等,開(kāi)發(fā)葡萄酒綜合品質(zhì)的快速檢測(cè)方法.其中,近紅外光譜技術(shù)具有檢測(cè)速度更快、無(wú)需樣品預(yù)處理的明顯優(yōu)勢(shì),具有較大潛力.2009年,吳桂芳等人采用近紅外結(jié)合BP-人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了不同品牌葡萄酒樣本的準(zhǔn)確識(shí)別[1];2010年,劉巍等人采用近紅外光譜技術(shù)構(gòu)建了不同產(chǎn)地葡萄酒樣本的Fisher判別識(shí)別模型,獨(dú)立樣本正確識(shí)別率達(dá)到86.7%[2];2017年,Jing Yu等人采用近紅外結(jié)合徑向基人工神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī)構(gòu)建了不同葡萄品種的葡萄酒識(shí)別模型,預(yù)測(cè)準(zhǔn)確率均在90%以上[3].
極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)是一種新型前饋神經(jīng)網(wǎng)絡(luò)算法,由Huang等人于2006年首次提出[4].與傳統(tǒng)采用梯度下降法的神經(jīng)網(wǎng)絡(luò)相比,ELM隨機(jī)產(chǎn)生輸入層與隱含層的連接權(quán)值及隱含神經(jīng)元閾值,具有學(xué)習(xí)速度快,且泛化能力好的優(yōu)勢(shì),現(xiàn)已廣泛用于模式識(shí)別.然而,目前國(guó)內(nèi)外尚未出現(xiàn)采用近紅外光譜技術(shù)結(jié)合ELM算法建立葡萄酒品質(zhì)快速識(shí)別方法的相關(guān)報(bào)道.
本研究嘗試采用近紅外光譜技術(shù)結(jié)合ELM算法構(gòu)建不同產(chǎn)地、葡萄品種、品牌葡萄酒樣本的快速識(shí)別模型,以克服傳統(tǒng)檢測(cè)的缺陷,建立葡萄酒品質(zhì)快速識(shí)別新方法.
研究所用葡萄酒樣本信息如表1所示.采樣結(jié)果保證同一品牌(張?jiān)#?,同一葡萄品種(赤霞珠),不同產(chǎn)地(山東煙臺(tái)、河北廊坊、陜西咸陽(yáng))的葡萄酒樣本各10個(gè);同一葡萄品種(赤霞珠),同一產(chǎn)地(山東煙臺(tái)),不同品牌(張?jiān)?、長(zhǎng)城、朋珠)的葡萄酒樣本各10個(gè);同一品牌(張?jiān)#?,同一產(chǎn)地(山東煙臺(tái)),不同葡萄品種(赤霞珠、蛇龍珠、美樂(lè))的葡萄酒樣本各10個(gè).
表1 葡萄酒樣本
研究采用傅立葉變換近紅外光譜儀(WQF-600N,北京北分瑞利分析儀器(集團(tuán))有限責(zé)任公司)對(duì)葡萄酒樣本進(jìn)行檢測(cè)分析.儀器參數(shù)設(shè)置如下,采樣分辨率為4cm-1,數(shù)據(jù)范圍為3300.00cm-1~10000.00cm-1,每個(gè)樣品掃描次數(shù)為32次.測(cè)樣時(shí),直接將葡萄酒樣本原液置入樣品室內(nèi)進(jìn)行光譜掃描.
研究首先采用主成分分析(Principal Component Analysis,PCA)對(duì)原始光譜信息進(jìn)行降維和去共線化,以可以解釋原始變量信息90%以上的主成分得分作為輸入構(gòu)建ELM模型.經(jīng)過(guò)多次對(duì)比研究,采用閾值傳遞函數(shù)(hardlim)作為隱含層神經(jīng)元激活函數(shù).隨機(jī)選取每組樣本總數(shù)2/5個(gè)樣本作為測(cè)試集,其余樣本作為訓(xùn)練集構(gòu)建ELM模型,并考察了不同隱含層神經(jīng)元個(gè)數(shù)對(duì)模型預(yù)測(cè)效果的影響.
近紅外光譜是由樣品中含氫基團(tuán)(C-H,O-H,S-H,N-H)分子振動(dòng)引起的,反映出這些基團(tuán)基頻振動(dòng)的合頻與倍頻信息,波普范圍內(nèi),二級(jí)倍頻區(qū)與三級(jí)倍頻區(qū),一級(jí)倍頻區(qū)與二級(jí)倍頻區(qū),合頻區(qū)與一級(jí)倍頻區(qū)都有一定的重合帶,再加上葡萄酒本身的復(fù)雜性,導(dǎo)致酒樣近紅外光譜數(shù)據(jù)具有嚴(yán)重的共線性.因此,研究首先采用PCA對(duì)近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,以達(dá)到降維和去共線化的目的.不同產(chǎn)地、葡萄品種及品牌的葡萄酒樣本近紅外光譜信息在不同主成分下的累積貢獻(xiàn)率如圖1所示.可以看出,前7個(gè)主成分的累積貢獻(xiàn)率已達(dá)到90%以上,可認(rèn)為能夠代表原始變量信息.
圖1 不同主成分累積貢獻(xiàn)率
ELM測(cè)試集預(yù)測(cè)結(jié)果如圖2所示.從圖中可以產(chǎn)出,針對(duì)產(chǎn)地識(shí)別,其中本屬于山東煙臺(tái)的2個(gè)樣本判錯(cuò)給陜西咸陽(yáng),正確識(shí)別率為83.33%;針對(duì)品種識(shí)別,其中1個(gè)屬于赤霞珠的樣品錯(cuò)判給蛇龍珠,正確識(shí)別率為91.67%;針對(duì)品牌識(shí)別,共有2個(gè)樣本預(yù)測(cè)錯(cuò)誤,其中有1個(gè)屬于張?jiān)E频臉悠泛?個(gè)屬于長(zhǎng)城牌的樣品均錯(cuò)判給朋珠牌,正確識(shí)別率為83.33%.
圖2 ELM測(cè)試集預(yù)測(cè)結(jié)果(A-產(chǎn)地識(shí)別,B-品種識(shí)別,C-品牌識(shí)別)
從ELM模型預(yù)測(cè)結(jié)果可以產(chǎn)出,近紅外光譜技術(shù)對(duì)品質(zhì)差異性的成品葡萄酒樣本預(yù)測(cè)正確率均在83%以上,效果良好.這主要是由于產(chǎn)地、葡萄品種及生產(chǎn)工藝(品牌)是影響成品葡萄酒綜合品質(zhì)的主要因素.產(chǎn)地、品種及品牌的差異導(dǎo)致終端葡萄酒產(chǎn)品理化成分(如酚類(lèi)、香氣成分、pH、總酸等)的差異[5-7],而近紅外光譜技術(shù)可以識(shí)別出復(fù)雜基質(zhì)中有機(jī)物成分及含量的變化,從而可以實(shí)現(xiàn)品質(zhì)差異性葡萄酒樣本的識(shí)別.
為克服葡萄酒綜合品質(zhì)傳統(tǒng)檢測(cè)方法的局限性,研究采用近紅外結(jié)合ELM建立葡萄酒品質(zhì)快速識(shí)別方法,結(jié)果顯示,ELM模型對(duì)不同產(chǎn)地、葡萄品種、品牌葡萄酒樣本的正確識(shí)別率均在83%以上.可以看出,近紅外結(jié)合ELM可用于葡萄酒綜合品質(zhì)的快速預(yù)測(cè).
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2018年8期