周 兵,譚卓昆,段紅星,劉 亮,張 競(jìng),吳文斗
(1.云南農(nóng)業(yè)大學(xué)理學(xué)院,云南 昆明 650201;2.云南大學(xué) 信息學(xué)院,云南 昆明 650500;3.云南農(nóng)業(yè)大學(xué)茶學(xué)院,云南 昆明 650201;4.云南農(nóng)業(yè)大學(xué)大數(shù)據(jù)學(xué)院,云南 昆明 650201)
中國(guó)有源遠(yuǎn)流長(zhǎng)的茶文化,茶禮茶俗等。隨著中國(guó)經(jīng)濟(jì)的發(fā)展,茶的需求量逐步增加,各類茶企發(fā)展迅速,茶產(chǎn)品層出不窮,為了有利于品牌的宣傳,對(duì)茶葉品質(zhì)進(jìn)行評(píng)價(jià)成為必不可少的一環(huán)。傳統(tǒng)評(píng)價(jià)方式易受評(píng)審人員與評(píng)審環(huán)境等諸多因素影響,如何使評(píng)價(jià)過(guò)程更為簡(jiǎn)便科學(xué),是目前在茶葉評(píng)定領(lǐng)域較為迫切的任務(wù)之一,而色澤作為茶葉品質(zhì)評(píng)審的主要內(nèi)容,對(duì)其進(jìn)行標(biāo)準(zhǔn)且科學(xué)的評(píng)價(jià)便極其重要。
目前對(duì)茶葉色澤的評(píng)價(jià)主要看茶葉外表色澤、茶湯色澤和葉底色澤,以此來(lái)了解茶葉品質(zhì)的高低及制作工藝。但在實(shí)際評(píng)審過(guò)程中,往往因?yàn)椴煌藛T對(duì)色澤的感官?gòu)?qiáng)弱不同,使得評(píng)價(jià)結(jié)果存在一定的主觀誤差。國(guó)外對(duì)茶葉品質(zhì)因子和茶葉質(zhì)量評(píng)定的研究應(yīng)用越來(lái)越多,P Mishra等人在2019年使用近紅外高光譜測(cè)量綠茶數(shù)據(jù),構(gòu)建綠茶分類模型,實(shí)現(xiàn)了16種綠茶產(chǎn)品的分類。國(guó)內(nèi)大部分仍是采用人工感官審評(píng)的方法進(jìn)行,但也不乏創(chuàng)新性的茶葉品質(zhì)評(píng)價(jià)的研究。2016年,潘玉成等利用人工神經(jīng)網(wǎng)絡(luò)對(duì)綠茶色澤進(jìn)行茶葉品質(zhì)的評(píng)定,對(duì)標(biāo)準(zhǔn)樣和預(yù)測(cè)樣本獲得了較令人滿意的評(píng)判結(jié)果。2019年,帥曉華等人采用計(jì)算機(jī)視覺(jué)技術(shù),對(duì)拍攝的茶葉和茶水圖片進(jìn)行識(shí)別分類,識(shí)別的準(zhǔn)確率總體達(dá)到90%。兩者的研究中選取的樣本數(shù)較少,條件控制不足,即便是同一種茶類,由于品控因素,如干茶制作時(shí)溫度、干濕度不同,都會(huì)對(duì)茶類的分級(jí)造成極大的影響。
為解決誤差問(wèn)題,本文設(shè)計(jì)的實(shí)驗(yàn)嚴(yán)格控制紅茶干茶光照時(shí)長(zhǎng),茶湯沖泡的時(shí)間、溫度、水質(zhì),以及葉底測(cè)量方式,最大限度排除環(huán)境因素帶來(lái)的干擾誤差。利用具有精確色彩識(shí)別能力的色差儀測(cè)定不同色澤類型的 L(亮度值)、a(紅綠色值)、b(黃藍(lán)色值)范圍,基于GA-BP算法將測(cè)量的數(shù)值與人工感官評(píng)價(jià)的結(jié)果建立數(shù)學(xué)模型,找到紅茶不同類型的干茶、茶湯、葉底色差值與人工感官評(píng)價(jià)的相關(guān)性,構(gòu)建茶葉色度值參數(shù)與茶葉色澤類型數(shù)據(jù)評(píng)審模型,較好的實(shí)現(xiàn)了茶葉的分類識(shí)別,為茶葉色澤類型的數(shù)字化評(píng)定提供了科學(xué)依據(jù)。
1.1.1 干茶數(shù)據(jù)。紅茶干茶通過(guò)將嫩葉,經(jīng)發(fā)酵等工藝制作而成。本研究選取了市場(chǎng)上常見(jiàn)種類的紅茶,如:古樹(shù)紅茶、名優(yōu)紅茶等茶種。為了使數(shù)據(jù)豐富,具備科學(xué)性、普適性,又從已選取的紅茶種類中挑選了不同價(jià)位、不同品質(zhì)及規(guī)格的紅茶干茶。實(shí)驗(yàn)用的干茶樣本如圖1所示:
圖1 部分干茶樣本及相應(yīng)色澤人工評(píng)審結(jié)論
通過(guò)篩選、評(píng)估,共選取63份紅茶干茶,用色差儀測(cè)得380組數(shù)據(jù),可分為烏黑、烏黑帶毫、烏黑有毫、烏黑多金毫、烏褐顯金毫、金黃共計(jì)六個(gè)干茶評(píng)定色類。
1.1.2 茶湯數(shù)據(jù)。用熱水沖泡前述干茶樣本即得茶湯數(shù)據(jù)。對(duì)湯色進(jìn)行L、a、b值測(cè)量時(shí),發(fā)現(xiàn)同一種茶類在不同溫度、不同水質(zhì)下測(cè)量的色差值不同;不同的溫度、不同水質(zhì)下的不同茶類測(cè)量的數(shù)據(jù)范圍會(huì)相互重疊。所以我們選用同一種類的礦泉水,茶葉稱量5克左右,將水加熱至93℃時(shí)開(kāi)始沖泡。用測(cè)溫槍檢測(cè)茶湯的溫度,當(dāng)茶湯降溫至30℃左右時(shí),對(duì)不同茶類的茶湯,在封閉式的色差儀中進(jìn)行L、a、b值的測(cè)量。研究所用的紅茶茶湯如圖2所示。
圖2 部分茶湯樣本及相應(yīng)色澤人工評(píng)審結(jié)論
本研究選取了60份紅茶干茶進(jìn)行沖泡,用色差儀測(cè)得400組數(shù)據(jù),可分為杏黃、橙黃、橙紅、紅亮、紅濃、紅艷、紅暗共計(jì)七種茶湯評(píng)定色類。
1.1.3 葉底數(shù)據(jù)。葉底也叫茶渣,即干茶經(jīng)開(kāi)水沖泡后所展開(kāi)的葉片。紅茶葉底越有光澤,品質(zhì)越好。判斷方法是首先將泡過(guò)的茶葉倒入潔凈的器皿中,再將茶葉拌勻鋪開(kāi)進(jìn)行觀察后給出結(jié)論。由于發(fā)酵程度不一致,相同種類紅茶的葉底色澤也是不同的,為了盡量減少這個(gè)問(wèn)題帶來(lái)的誤差干擾,評(píng)審人員以大面積的茶葉色澤分布作為葉底顏色分類的依據(jù)。
圖3 部分葉底樣本及相應(yīng)色澤人工評(píng)審結(jié)論
在色差儀測(cè)量葉底前,首先用機(jī)器將葉底打碎,收入相應(yīng)容器中,再對(duì)其進(jìn)行L、a、b值的測(cè)量,使數(shù)據(jù)更加穩(wěn)定、可靠。本研究選取了63份紅茶葉底,用色差儀測(cè)得380組數(shù)據(jù),可分為泛青、泛青稍帶紅、棕紅較勻稍青、棕紅、紅共計(jì)五大葉底評(píng)定色類。
本次研究的測(cè)量?jī)x器采用封閉式的色差儀(深圳市三恩時(shí)科技有限公司的 YS6060 色差儀),實(shí)物圖如圖4所示,該儀器能夠減少在不同環(huán)境條件下,給數(shù)據(jù)測(cè)量帶來(lái)的誤差干擾,同時(shí)本研究的色差值數(shù)據(jù)是由專業(yè)人員進(jìn)行專業(yè)測(cè)量、評(píng)估,測(cè)量的 L、a、b值更加準(zhǔn)確。
圖4 色差儀實(shí)物圖
1.3.1 GA-BP網(wǎng)絡(luò)搭建。GA-BP算法就是使用遺傳算法(GA)將BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值作為初始種群,不斷的迭代進(jìn)化,尋找出全局最佳的權(quán)值和閾值,實(shí)現(xiàn)對(duì)BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化。GA-BP算法流程如圖5所示:
圖5 GA-BP算法流程圖
1.3.2 網(wǎng)絡(luò)參數(shù)設(shè)置及測(cè)試。BP神經(jīng)網(wǎng)絡(luò)模型隱含層包含的神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)能反映出整個(gè)網(wǎng)絡(luò)的非線性水平,進(jìn)行參數(shù)設(shè)置時(shí),找到該網(wǎng)絡(luò)最佳隱含層節(jié)點(diǎn)數(shù)是十分困難的。若隱含層節(jié)點(diǎn)個(gè)數(shù)過(guò)多,不僅會(huì)增加神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)時(shí)間,而且還會(huì)出現(xiàn)“過(guò)擬合”現(xiàn)象;若隱含層節(jié)點(diǎn)個(gè)數(shù)過(guò)少,網(wǎng)絡(luò)甚至無(wú)法訓(xùn)練或使用。我們通過(guò)對(duì)樣本數(shù)據(jù)準(zhǔn)確率結(jié)果分析,判斷各節(jié)點(diǎn)數(shù)對(duì)網(wǎng)絡(luò)模型的影響,確定相關(guān)模型的最優(yōu)隱含層節(jié)點(diǎn)數(shù)。隱含層節(jié)點(diǎn)常用計(jì)算公式如下所示:
式中 H——隱含層節(jié)點(diǎn)數(shù);
M——輸入層節(jié)點(diǎn)數(shù);
N——輸出層節(jié)點(diǎn)數(shù);
A——取1到10的整數(shù)。
紅茶干茶、茶湯、葉底網(wǎng)絡(luò)模型的隱含層節(jié)點(diǎn)范圍如表1所示。
表1 各樣本種類隱含層范圍的確定
依次選取可能的隱含層節(jié)點(diǎn)數(shù),測(cè)試相應(yīng)數(shù)據(jù)集的準(zhǔn)確率,訓(xùn)練集數(shù)據(jù)的各隱含層節(jié)點(diǎn)數(shù)與各樣本準(zhǔn)確率的分布如表2所示。
表2 各樣本訓(xùn)練集隱含層節(jié)點(diǎn)數(shù)的準(zhǔn)確率
通過(guò)對(duì)比不同隱含層節(jié)點(diǎn)數(shù)對(duì)應(yīng)的訓(xùn)練集識(shí)別的準(zhǔn)確率,將均方誤差最小時(shí)的隱含層節(jié)點(diǎn)數(shù)目確立為最佳。求得紅茶干茶、茶湯、葉底的最佳隱含層節(jié)點(diǎn)數(shù)目分別為13、10、8。另外,在其它網(wǎng)絡(luò)參數(shù)的配置上,本研究設(shè)置網(wǎng)絡(luò)的訓(xùn)練次數(shù)為1000次,顯示頻率為25,即每訓(xùn)練25次顯示1次,學(xué)習(xí)速率為0.01,動(dòng)量因子為0.01,最小性能梯度為10-6,并設(shè)置最高失敗次數(shù)為6次。
1.3.3 學(xué)習(xí)方式的選擇。為尋找最適合本次研究的學(xué)習(xí)方式,選擇紅茶干茶色澤數(shù)據(jù)集對(duì)增加動(dòng)量算法、彈性BP算法、自適應(yīng)學(xué)習(xí)算法、共軛梯度算法、LM算法分別進(jìn)行測(cè)試。通過(guò)網(wǎng)絡(luò)訓(xùn)練,再隨機(jī)選取數(shù)據(jù)對(duì)模型進(jìn)行測(cè)試,比較不同學(xué)習(xí)方式對(duì)測(cè)試數(shù)據(jù)集預(yù)測(cè)的準(zhǔn)確率,結(jié)果如表3所示。
表3 不同學(xué)習(xí)方式對(duì)干茶色澤預(yù)測(cè)的準(zhǔn)確率
測(cè)試的結(jié)果顯示LM算法的效果最好,三次平均準(zhǔn)確率可達(dá)到93.75%,因此后面的研究過(guò)程中選擇該算法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
為了檢驗(yàn)GA-BP算法應(yīng)用效果,我們選用了100組干茶數(shù)據(jù)對(duì)模型進(jìn)行測(cè)試。同時(shí),將標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)模型作為對(duì)照組,將兩種模型的測(cè)試結(jié)果進(jìn)行分析。根據(jù)測(cè)試結(jié)果可知標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)對(duì)紅茶干茶色澤數(shù)據(jù)識(shí)別效果一般,準(zhǔn)確率只有85.86%,而且存在少部分識(shí)別結(jié)果和正確結(jié)果誤差較大的數(shù)據(jù)。而GA-BP神經(jīng)網(wǎng)絡(luò)模型分類識(shí)別更為精準(zhǔn),數(shù)據(jù)準(zhǔn)確率為94.95%。
在茶湯數(shù)據(jù)的測(cè)試中,選用了105組紅茶湯色數(shù)據(jù)對(duì)GA-BP模型與標(biāo)準(zhǔn)BP模型進(jìn)行測(cè)試,標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)分類識(shí)別的準(zhǔn)確率為80.95%,使用GA-BP算法的網(wǎng)絡(luò)模型的準(zhǔn)確率可達(dá)到95.23%。
在葉底數(shù)據(jù)的測(cè)試中,選用了95組紅茶葉底數(shù)據(jù)對(duì)模型進(jìn)行測(cè)試。標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)對(duì)大部分?jǐn)?shù)據(jù)識(shí)別比較精準(zhǔn),但是也存在少部分識(shí)別結(jié)果和正確結(jié)果誤差較大的數(shù)據(jù),其分類識(shí)別的準(zhǔn)確率為88.54%,而GA-BP網(wǎng)絡(luò)模型極大提高測(cè)試集數(shù)據(jù)分類識(shí)別的準(zhǔn)確率,其測(cè)試準(zhǔn)確率為90.62%。
經(jīng)過(guò)紅茶的干茶、湯色、葉底數(shù)據(jù)的測(cè)試,使用GA-BP算法對(duì)干茶、湯色、葉底數(shù)據(jù)測(cè)試的準(zhǔn)確率分別為94.95%、95.23%、90.62%,模型的分類識(shí)別效果較好,GA-BP算法使得全局尋優(yōu)能力、數(shù)值范圍交叉的數(shù)據(jù)處理能力更佳,分類結(jié)果與專家評(píng)估較為一致,通過(guò)本次研究獲得的網(wǎng)絡(luò)模型,機(jī)器視覺(jué)識(shí)別的結(jié)果可以與人工評(píng)審結(jié)果做最好的關(guān)聯(lián)。這不僅大大減少了人工評(píng)審帶來(lái)的主觀誤差,也能為茶葉色澤類型的量化審評(píng)提供科學(xué)依據(jù),較好地推動(dòng)茶產(chǎn)業(yè)的數(shù)字化發(fā)展進(jìn)程。