• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于BoW模型的圖像分類方法研究

    2017-04-26 09:09:00賀偉姚婭川彭彩平
    科技創(chuàng)新與應(yīng)用 2017年10期
    關(guān)鍵詞:特征提取

    賀偉+姚婭川++彭彩平

    摘 要:圖像分類是圖像檢索的基礎(chǔ),成功的圖像檢索是從海量的數(shù)字圖像中提取有效信息的必要手段。針對當(dāng)前圖像分類領(lǐng)域存在的效率低下的問題,提出了一種基于BoW模型的圖像分類方法。在BoW模型中,采用加權(quán)的K均值聚類方法完成特征與視覺單詞之間的映射;然后對聚類產(chǎn)生的視覺單詞進(jìn)行閾值驗(yàn)證,去除冗余的詞匯,生成最終的視覺詞典。

    關(guān)鍵詞:BoW模型;圖片分類;特征提取;K均值聚類

    引言

    對人類而言,眼睛在捕獲外界傳來的視覺信息之后,會(huì)將這些信息移交給大腦進(jìn)行處理,大腦在對眼睛看到的圖片中進(jìn)行解讀之后,將會(huì)在短期記憶里描述圖片里有些什么內(nèi)容。大腦在記憶圖片里的內(nèi)容時(shí),實(shí)際上也是將視覺信息轉(zhuǎn)存為它所采用的獨(dú)特表示方式。相應(yīng)的,在計(jì)算機(jī)視覺領(lǐng)域,人眼的功能由攝相機(jī)等成像設(shè)備模擬,大腦的分析過程則采用計(jì)算機(jī)去模擬,計(jì)算機(jī)通過對攝像機(jī)獲取的數(shù)據(jù)信息進(jìn)行處理,從而給出圖像的內(nèi)容的解釋。因此要找到一種合適的表達(dá)方式,讓計(jì)算機(jī)能夠像人腦一樣來表述圖像的內(nèi)容。只有合適的表達(dá)方式,才能讓計(jì)算機(jī)實(shí)現(xiàn)基于內(nèi)容的進(jìn)一步的圖像操作。

    BoW模型就是一種比較常用的圖像特征描述子。起初BoW模型是針對文檔信息處理和文本檢索而建立的。它忽略了語法和語序,僅以單詞為基本單位來對文本進(jìn)行描述。推廣到圖像處理中的BoW模型是通過圖像的局部特征向視覺單詞的映射實(shí)現(xiàn)的,下面將從BoW模型出發(fā),分析說明一種基于BoW模型的圖像分類方法。

    1 BoW模型

    BoW( bag of words)模型最先由Csurka等[2]從自然語言處理領(lǐng)域引入到圖像分類領(lǐng)域。BoW模型是一種以單詞為模型的描述向量。將圖像類比為由若干單詞組成的文檔,然后從每幅圖像的視覺單詞頻率直方圖中得到圖像的描述向量,最后得到圖像所映射的類別。使用BoW模型對圖像進(jìn)行分類可以取得較好的分類效果。

    采用BoW模型的關(guān)鍵點(diǎn)是提取圖像的視覺單詞描述。通常的做法是采用SIFT算法提取圖像的局部特征,通過SIFT提取特征后,每幅圖像都由一個(gè)128維特征向量集合描述,此時(shí)對這個(gè)向量集合進(jìn)行K均值聚類,最后將得到K個(gè)聚類中心作為視覺單詞,所有視覺單詞的集合就是視覺詞匯表。由于聚類的不精確性,以及缺乏先驗(yàn)知識(shí)時(shí)K值設(shè)置的隨意性,視覺詞匯表往往具有一定程度上的冗余。圖像的分類是在生成視覺詞典之后完成的。通常是采取與生成詞典時(shí)一樣的算法來提取特征,然后做出圖像的視覺單詞頻率直方圖,得到圖像分類的結(jié)果。如果在特征提取過程中混入了噪聲,最后的結(jié)果可能會(huì)出現(xiàn)偏差?;谝陨戏治?,本文所提出的采用BoW模型實(shí)現(xiàn)圖像分類的方法,首先是對特征進(jìn)行加權(quán),采用加權(quán)后的K均值聚類,生成初始的視覺詞典,然后根據(jù)一定的檢驗(yàn)判定原則,對視覺單詞進(jìn)行驗(yàn)證,刪去冗余詞匯,構(gòu)成最終的視覺詞典。

    2 加權(quán)的K均值聚類

    在視覺詞匯表構(gòu)建時(shí),使用最廣泛是無監(jiān)督聚類算法,例如K均值算法。然而,在實(shí)際圖像中特征描述符中的每個(gè)特征維度的取值范圍不同,并且對于圖像分類來說,每個(gè)維度具有不同的重要性。但傳統(tǒng)的K聚類方法將所有的特征一視同仁不加區(qū)分。因此,為了構(gòu)建更加有效的視覺詞典,本文采用加權(quán)的K均值算法,該算法采用明科斯基距離對特征進(jìn)行加權(quán)。

    4 實(shí)驗(yàn)結(jié)果與總結(jié)

    為了更好地說明本文所提出的基于BoW模型的圖像分類方法的有效性,隨機(jī)從數(shù)據(jù)庫Caltech 101以及Caltech 256中抽取樣本來進(jìn)行驗(yàn)證。對每個(gè)樣本組,分別采用本文所提的對視覺詞典的生成做出優(yōu)化的方法和傳統(tǒng)的沒有任何改進(jìn)的基于BoW模型的圖像分類方法來進(jìn)行圖像分類訓(xùn)練識(shí)別實(shí)驗(yàn)。

    實(shí)驗(yàn)結(jié)果證明,無論視覺詞匯表是大還是小,用加權(quán)的K均值聚類的效果都比使用普通的K均值聚類的效果要好。這說明,本文所提出的采用加權(quán)的K均值方法來生成視覺詞典是能夠取得更優(yōu)的效果的。

    參考文獻(xiàn)

    [1]王瑩,基于BoW模型的圖像分類方法研究[D].哈爾濱工程大學(xué),2012.

    [2]Csurka G,Dance C,F(xiàn)an L,et al.Visual categoriza-tion with bags of keypoints[C].ECCV 04 Workshopon Statistical Learning in Computer Vision.Prague,Czech,2004:59-74.

    [3]李科,游雄,杜琳.基于多特征組合與優(yōu)化BoW模型的影像分類技術(shù)研究[J].系統(tǒng)仿真學(xué)報(bào),2016,28(6):1386-1393.

    [4]李宇,王宏琦,孫顯.利用多尺度語義模型的復(fù)雜圖像目標(biāo)自動(dòng)提取方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2012,37(9):1064-1067.

    猜你喜歡
    特征提取
    特征提取和最小二乘支持向量機(jī)的水下目標(biāo)識(shí)別
    基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
    電子制作(2019年15期)2019-08-27 01:12:00
    基于Daubechies(dbN)的飛行器音頻特征提取
    電子制作(2018年19期)2018-11-14 02:37:08
    基于DNN的低資源語音識(shí)別特征提取技術(shù)
    Bagging RCSP腦電特征提取算法
    一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
    基于DSP的直線特征提取算法
    基于改進(jìn)WLD的紋理特征提取方法
    淺析零件圖像的特征提取和識(shí)別方法
    基于CATIA的橡皮囊成形零件的特征提取
    页游| 湖南省| 九龙城区| 沛县| 庐江县| 香格里拉县| 东阿县| 雷波县| 商洛市| 赞皇县| 汪清县| 通辽市| 五寨县| 浦东新区| 樟树市| 南陵县| 泰和县| 福清市| 桐乡市| 汪清县| 滕州市| 利辛县| 瓦房店市| 涪陵区| 厦门市| 镶黄旗| 西安市| 崇信县| 赤水市| 恩平市| 阿城市| 民权县| 巨鹿县| 灵台县| 土默特右旗| 银川市| 株洲市| 黔南| 济南市| 普格县| 中江县|