• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于視覺詞袋模型的茶機智能化控制方法

      2014-03-07 02:24:12譚和平徐海衛(wèi)胡常安湯江文徐傳娣
      中國測試 2014年6期
      關(guān)鍵詞:向量茶葉單詞

      譚和平,徐海衛(wèi),胡常安,湯江文,徐傳娣

      (中國測試技術(shù)研究院,四川 成都 610021)

      基于視覺詞袋模型的茶機智能化控制方法

      譚和平,徐海衛(wèi),胡常安,湯江文,徐傳娣

      (中國測試技術(shù)研究院,四川 成都 610021)

      因3類名優(yōu)茶在顏色上并無太大區(qū)分,紋理特征也不明顯,所以在茶機智能化控制方法中主要依靠人為的主觀判斷進(jìn)行名優(yōu)茶分類,準(zhǔn)確度較低。針對這個問題,提出一種基于視覺詞袋模型的分類方法,首先對采集的茶葉圖片通過數(shù)字圖像處理的方法調(diào)整對比度,然后利用視覺詞袋模型提取每一張圖像的SIFT特征并生成視覺單詞,最后將每一張圖像表示成一個包含視覺單詞的向量,輸入到BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練并分類。實驗結(jié)果表明:該方法合理有效,可以被廣泛應(yīng)用到茶葉分類問題中。

      茶機;數(shù)字圖像處理;視覺詞袋模型;SIFT特征;BP神經(jīng)網(wǎng)絡(luò)

      0 引 言

      我國是茶葉的發(fā)源地,也是茶葉生產(chǎn)和出口的大國[1-2]。近年來,隨著茶文化在世界上的廣泛流行,茶葉的出口量呈現(xiàn)逐年增長的趨勢;但是,我國的茶葉分類技術(shù)落后于日本等國。為了保持我國茶葉的出口地位,提出準(zhǔn)確合理的茶葉分類模型十分重要[3]。

      茶葉檢測中比較重要的是名優(yōu)茶的外觀分類,因為它包含難以準(zhǔn)確區(qū)分的3個本質(zhì)類別:芽茶、一芽一葉和一芽兩葉[4]。實際應(yīng)用中只能靠人眼去辨別,非常耗時且不能大規(guī)模的推廣;另外,3種茶葉顏色上并沒有明顯區(qū)別,電子設(shè)備也很難進(jìn)行準(zhǔn)確的分類,所以,我國的茶葉分類技術(shù)還有待提高[5-6]?;谶@個問題,國內(nèi)學(xué)者提出了基于視覺詞袋模型[7]和BP神經(jīng)網(wǎng)絡(luò)模型[8]的名優(yōu)茶外觀分類方法,在茶葉分類領(lǐng)域有較好的應(yīng)用前景。

      1 視覺詞袋模型

      近年來,隨著信息技術(shù)以及計算機網(wǎng)絡(luò)的迅速發(fā)展,數(shù)字圖像的質(zhì)量以及信息量日益增加,從圖像中得到的信息也越來越多。如何準(zhǔn)確合理地挖掘圖像的信息,并對圖像進(jìn)行識別、分類已然成為一個新興的研究領(lǐng)域。從20世紀(jì)70年代起,逐漸興起了圖像檢索的相關(guān)研究[9]。

      基于視覺詞袋模型(bag of visual word,BOVW)的圖像表示近年來受到了強烈關(guān)注,該模型簡單有效地將一個圖像表示成為一個由多種視覺單詞組成的視覺向量;因為往往一張清晰的圖像有近3MB,而一個1000維的向量只占用8000bits,這無論是在存儲圖像還是計算中都是一個重要的模型,對于圖像檢索的效果和效率非常重要,尤其是應(yīng)用在大量的圖像數(shù)據(jù)集中。

      視覺詞袋模型主要可以分為3部分:

      1)提取特征。在數(shù)字圖像中,我們關(guān)心的往往是一些擁有局部特征的像素點,比如圖像的邊緣、顏色。常用的圖像特征有紋理特征、顏色直方圖、灰度直方圖等,將圖像表示成向量,基于這些特征的信息量較少,特征也不穩(wěn)定,所以圖像識別、分類等模型的效果并不理想。在視覺詞袋模型中,最常用的是尺度不變特征轉(zhuǎn)換(scale-invariant feature transform,SIFT),由于其具有尺度不變、旋轉(zhuǎn)不變、光照不變等多種穩(wěn)定的優(yōu)良特性,近幾年成為應(yīng)用最廣泛的局部特征。

      2)生成視覺單詞。由于SIFT特征個數(shù)太多,并且很多特征是相似的,所以需要通過聚類算法將特征量化生成視覺單詞。首先抽取所有茶葉圖片的SIFT特征,然后利用K-means算法對這些特征進(jìn)行聚類,生成視覺單詞。

      3)用詞頻向量表示圖像。在生成視覺單詞之后,每一個圖像便可以用一個向量表示,向量中每一個元素表示視覺單詞在這張圖像里面出現(xiàn)的個數(shù);顯然,這個向量中的元素都是正整數(shù)。經(jīng)過這種表示方法,每一個圖像都從很高的維度降低為一個向量,既保存了圖像間的區(qū)分性又降低了計算量。

      2 人工神經(jīng)網(wǎng)絡(luò)

      人工神經(jīng)網(wǎng)絡(luò)興起于20世紀(jì)60年代,最初通過電阻、放大器等電路原件進(jìn)行仿真,其主要思想是通過將一系列功能與人腦中細(xì)胞類似的神經(jīng)元按照一定的規(guī)則和權(quán)值連接起來,構(gòu)成含有輸入層和輸出層的網(wǎng)絡(luò)。

      根據(jù)不同的網(wǎng)絡(luò)假設(shè),人工神經(jīng)網(wǎng)絡(luò)有很多種類型:Hopfield神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、SOM神經(jīng)網(wǎng)絡(luò)等,其中最為著名的是BP神經(jīng)網(wǎng)絡(luò)[10]。由于BP神經(jīng)網(wǎng)絡(luò)具有非常優(yōu)秀的非線性擬合能力,所以被廣泛應(yīng)用于識別、預(yù)測等領(lǐng)域。常見的BP神經(jīng)網(wǎng)絡(luò)由3層結(jié)構(gòu)組成,輸入層、輸出層還有介于這兩層結(jié)構(gòu)之間的隱含層。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。

      圖1 BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)

      BP神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù)為輸出層的數(shù)據(jù)與訓(xùn)練數(shù)據(jù)的均方差MSE,每次迭代將當(dāng)前的誤差反饋給網(wǎng)絡(luò),通過不斷調(diào)整權(quán)值調(diào)整來達(dá)到網(wǎng)絡(luò)的訓(xùn)練目標(biāo)。

      3 實驗設(shè)計與仿真結(jié)果

      實驗的流程圖如圖2所示。實驗設(shè)計主要分為4個步驟:1)對圖像進(jìn)行采集和初步處理;2)對圖像的SIFT特征進(jìn)行提取并生成視覺單詞;3)將圖像表示為詞頻向量;4)將一部分圖像輸入到BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,并對剩余的圖像進(jìn)行分類。

      圖2 名優(yōu)茶分類模型流程圖

      3.1 圖像采集和預(yù)處理

      為保證圖像的采集環(huán)境盡可能一致,實驗中所用到的圖像均在同一組設(shè)備和儀器參數(shù)下進(jìn)行采集(相機鏡頭為Navitar DO-2595,分辨率500萬像素,采集軟件為Baumer,鏡頭到白色紙板距離372 mm,光源到紙板距離131 mm)。名優(yōu)茶在外型上通常被人為地分成3類:芽茶、一芽一葉和一芽兩葉,如圖3所示。隨機地從原料中選擇等量茶葉,每類茶葉選擇100個樣本分別置于白色紙板上;然后放置在直徑50mm、高度20mm的玻璃皿中;最后,用之前構(gòu)架好的采集設(shè)備進(jìn)行采集。

      圖3 預(yù)處理后的名優(yōu)茶葉圖片

      盡管拍攝環(huán)境一致,但還是會受到光照等一些難以避免的外部因素的影響;所以,先對圖像進(jìn)行灰度處理,然后調(diào)整對比度,再將處理后的圖像做為實驗數(shù)據(jù)。

      3.2 SIFT特征提取和視覺詞袋模型

      尺度不變特征轉(zhuǎn)換(scale-invariant feature transform,SIFT)特征是一種常用于計算機視覺的局部特征,它在空間尺度中尋找極值點,并提取出其位置、尺度、旋轉(zhuǎn)不變量[11]。SIFT特征由David Lowe在1999年所提出,并于2004年完善總結(jié)。SIFT提取算法主要分為4步:

      1)尺度空間極值點檢測。建立高斯尺度金字塔,對圖像中所有位置進(jìn)行檢測,尋找到滿足尺度不變性和旋轉(zhuǎn)不變性的特征點。

      2)特征點定位。因為數(shù)字圖像是離散的,所以需要插值來得到特征點的準(zhǔn)確位置。

      3)計算特征點方向。統(tǒng)計特征點附近的梯度,計算主方向。

      4)對特征點進(jìn)行描述。在特征點周圍的鄰域內(nèi)4×4窗口對8個方向的梯度進(jìn)行統(tǒng)計,生成128維的描述符對SIFT特征進(jìn)行表示。

      經(jīng)過上述4個步驟,茶葉圖片的SIFT特征提取結(jié)果如圖4所示。

      圖中,每一向量代表著一個相應(yīng)的SIFT特征,剪頭代表特征的主方向,長短代表特征的梯度大小??梢钥闯觯煌N類茶葉的特征點的信息和梯度大小都有一定區(qū)別;另外,SIFT特征具有旋轉(zhuǎn)不變性和尺度不變性,所以,無論從什么角度拍攝,茶葉都不會對特征提取的結(jié)果產(chǎn)生影響。

      圖4 茶葉圖片的SIFT特征

      在抽取SIFT特征之后,采用K-means方法對特征進(jìn)行聚類,相應(yīng)的聚類中心便是視覺單詞,可以統(tǒng)計每一張圖像中各個視覺單詞出現(xiàn)的次數(shù),并將每一張圖像表示成一個包含詞頻的向量。

      3.3 BP神經(jīng)網(wǎng)絡(luò)分類預(yù)測

      文中分別對每類茶葉收集了100張圖像,同時選擇生成了300個視覺單詞。這樣,便得到300×300的一個矩陣,并對3類茶葉進(jìn)行人為標(biāo)注:芽茶(0)、一芽一葉(0.5)和一芽兩葉(1)。然后,選擇一半的圖像作為訓(xùn)練樣本,其余的作為檢驗數(shù)據(jù),建立神經(jīng)網(wǎng)絡(luò)模型。部分訓(xùn)練結(jié)果的近似值如表1所示。

      表1 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果

      從表1中可以看出,大部分的訓(xùn)練結(jié)果都是準(zhǔn)確無誤的,尤其以芽茶的精度最高。BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練完成之后,其最后的權(quán)值和閾值作為知識,剩余的數(shù)據(jù)被輸入到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,部分識別結(jié)果的近似值如表2所示。

      由表2可知,分類準(zhǔn)確度非常高,并且在150張圖的分類結(jié)果中,有127張圖被正確分類,準(zhǔn)確度達(dá)84.67%。并且,在得到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)后,對于新的圖片,只需要根據(jù)視覺詞袋模型生成相應(yīng)的向量便可以輸入到網(wǎng)絡(luò)中進(jìn)行識別,大大提高了識別的效率和精度。

      表2 BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果

      在BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,設(shè)置算法的迭代次數(shù)為300次,也同時設(shè)置了訓(xùn)練的期望誤差為10-15。由于訓(xùn)練的數(shù)據(jù)量比較大,一般情況下還沒有達(dá)到期望的誤差就達(dá)到訓(xùn)練的次數(shù),如圖5所示,為BP神經(jīng)網(wǎng)絡(luò)運行一次情況下的系統(tǒng)誤差,系統(tǒng)誤差的初始值為1.51,最后能達(dá)到的訓(xùn)練誤差為1.3×10-5,在訓(xùn)練到200次的時候,系統(tǒng)基本穩(wěn)定在10-5數(shù)量級上。增加算法的迭代次數(shù)可以增加算法的精確度,影響到結(jié)果的判斷,同時也會增加時間[12]。目前來講,還沒有相關(guān)的文獻(xiàn)提到如何來權(quán)衡兩者。

      圖5 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差

      4 結(jié)束語

      茶機智能化控制方法中名優(yōu)茶的分類,往往需要具有專業(yè)經(jīng)驗的工人進(jìn)行人工鑒別,不能廣泛應(yīng)用到大規(guī)模操作中。由于3類茶葉的顏色特征和紋理特征均不明顯,所以利用數(shù)字圖像的方法很難達(dá)到需求的準(zhǔn)確率。本文提出了基于視覺詞袋模型和BP神經(jīng)網(wǎng)絡(luò)模型的名優(yōu)茶分類方法:首先提取每張圖像的SIFT特征,其次利用K-means方法生成視覺單詞,并將圖像表示成詞頻向量,最后利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,實驗結(jié)果證明了該方法的合理性和準(zhǔn)確性。

      雖然SIFT特征具有多種穩(wěn)定的性質(zhì),但是單獨考慮一種特征并不能包含圖像的所有信息,并且視覺詞袋模型的單詞個數(shù)并不能準(zhǔn)確的進(jìn)行界定。所以,未來的工作可以通過增加特征和改善視覺詞袋兩個方面來提高分類的精度。

      [1]管曦.中國出口茶葉產(chǎn)品的比較優(yōu)勢探討:基于不同類別和包裝的分析[J].中國農(nóng)村經(jīng)濟(jì),2010(1):28-34.

      [2]閆振宇,徐家鵬.基于品種細(xì)分的中國茶葉國際競爭力實證分析[J].湖北農(nóng)業(yè)科學(xué),2011,50(8):1713-1716.

      [3]汪新貴.提升越鄉(xiāng)品牌 打造茶葉強市[J].中國茶葉,2012(11):18-19.

      [4]駱耀平,唐萌,蔡維秩,等.名優(yōu)茶機采適期的研究[J].茶葉科學(xué),2008,28(1):9-13.

      [5]田波平,孫秋梅,廖慶喜,等.6CZZ-600型針形名優(yōu)茶做形機及成型工藝優(yōu)化[J].農(nóng)業(yè)工程學(xué)報,2005,21(4):65-68.

      [6]王云,李春華.名優(yōu)茶氨基酸含量變化規(guī)律及其影響因素研究[J].西南農(nóng)業(yè)學(xué)報,2006,19(6):1121-1126.

      [7]許明,韓軍偉,郭雷,等.利用模型選擇確定視覺詞袋模型中詞匯數(shù)目[J].計算機工程與應(yīng)用,2011,47(31):148-150.

      [8]陸江鋒,單春芳,洪小龍,等.基于數(shù)字圖像的茶葉形狀特征提取及不同茶葉鑒別研究[J].茶葉科學(xué),2010,30(6):453-457.

      [9]李志欣,施智平,李志清,等.融合語義主題的圖像自動標(biāo)注[J].軟件學(xué)報,2011,22(4):801-812.

      [10]汪鐳,周國興,吳啟迪.人工神經(jīng)網(wǎng)絡(luò)理論在控制領(lǐng)域中的應(yīng)用綜述[J].同濟(jì)大學(xué)學(xué)報:自然科學(xué)版,2001,29(3):357-361.

      [11]紀(jì)華,吳元昊,孫宏海,等.結(jié)合全局信息的SIFT特征匹配算法[J].光學(xué)精密工程,2009,17(2):439-444.

      [12]李曉峰,徐玖平,王蔭清,等.BP人工神經(jīng)網(wǎng)絡(luò)自適應(yīng)學(xué)習(xí)算法的建立及其應(yīng)用[J].系統(tǒng)工程理論與實踐,2004(5):1-8.

      Tea machine intelligent control method based on BOVW and BP neural network

      TAN He-ping,XU Hai-wei,HU Chang-an,TANG Jiang-wen,XU Chuan-di
      (National Institute of Measurement and Testing Technology,Chengdu 610021,China)

      Classification of famous tea has been a difficult problem precisely,because the three types of famous tea have obviously little distinction in color and ARTS features.So,practical applications mainly rely on subjective human judgment.To address this problem,a novel method based on bag of visual words was proposed.The authors first collected images through digital image processing methods to adjust the contrast,and then used the bag of visual words model,to extract SIFT features from each images and generated to visual words.Finally,each image was expressed as a vector containing a visual representation of the words.Then,the vectors were entered into the BP neural network to train BP and classify tea pictures.Experimental results show that the proposed method is reasonable and effective.This method can be widely applied to tea classification problems.

      tea machine;digital image processing;bag of visual words;SIFT features;BP neural network

      TB99;TH741;TP391.4;TS272.5

      :A

      :1674-5124(2014)06-0084-04

      10.11857/j.issn.1674-5124.2014.06.022

      2014-05-11;

      :2014-07-13

      國家“863”計劃項目(2012AA10A508)

      譚和平(1957-),男,重慶市人,研究員,享受國務(wù)院政府津貼專家,從事生物化學(xué)茶產(chǎn)業(yè)鏈研究。

      猜你喜歡
      向量茶葉單詞
      《茶葉通訊》簡介
      茶葉通訊(2022年2期)2022-11-15 08:53:56
      向量的分解
      聚焦“向量與三角”創(chuàng)新題
      藏族對茶葉情有獨鐘
      創(chuàng)造(2020年5期)2020-09-10 09:19:22
      單詞連一連
      看圖填單詞
      香噴噴的茶葉
      快樂語文(2018年36期)2018-03-12 00:56:02
      看完這些單詞的翻譯,整個人都不好了
      向量垂直在解析幾何中的應(yīng)用
      向量五種“變身” 玩轉(zhuǎn)圓錐曲線
      施秉县| 团风县| 西宁市| 平罗县| 陈巴尔虎旗| 临洮县| 白水县| 麻阳| 兴文县| 阜阳市| 泸州市| 五华县| 澄城县| 鹤岗市| 宽甸| 项城市| 泸州市| 武邑县| 正阳县| 大荔县| 精河县| 九江县| 大理市| 临泉县| 平武县| 宜昌市| 紫阳县| 固安县| 玉门市| 邓州市| 德安县| 婺源县| 确山县| 浦城县| 台山市| 葫芦岛市| 张家港市| 咸丰县| 栾川县| 启东市| 沛县|