劉顏華
摘要:傳統(tǒng)的圖像檢索分類方法以關(guān)鍵字為標準來分類,可以進行主觀分辨,查詢結(jié)果準確率較差?;趫D片顏色特征進行圖像檢索CBIR是利用圖像具有的視覺效果特征進行圖片查詢檢索的一種新技術(shù)。本文以在內(nèi)容基礎(chǔ)上進行圖像檢索作為研究對象,根據(jù)圖片的顏色特征對圖片進行檢索分類,以用戶上傳的圖片為根據(jù),實現(xiàn)基于內(nèi)容的圖像檢索。
關(guān)鍵詞:基于內(nèi)容;圖像檢索;CBIR
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1007-9416(2017)01-0060-02
1 緒論
利用搜索引擎,在互聯(lián)網(wǎng)中對信息進行收集、分類、提取、組織和各種處理,同時用戶可以檢索相關(guān)數(shù)據(jù),將信息進行導(dǎo)航。隨著網(wǎng)絡(luò)技術(shù)和存儲技術(shù)的日新月異,圖像可以更直觀的反饋多媒體的各類信息,更加廣泛的應(yīng)用到生活的方方面面。但是如何在浩瀚的圖片海洋里搜尋到真正對自己有價值的圖片資料,進行有效檢索和分類成為迫切需要解決的問題。
CBIR利用圖像的內(nèi)容進行分析,將顏色、文理、形狀等各類空間因素的信息,將圖像的特征進行分析索引。在視覺效果和語義特征這兩個層次中,視覺上的圖像查詢檢索,可以客觀的將圖像中的特征檢索出來,例如通過顏色來判別圖像之間的同樣性;圖像的檢索的同樣性可以利用識別圖像的技術(shù)來實現(xiàn)視覺特征的檢索查詢。
2 圖像查詢檢索方法
圖像查詢檢索的方法可以使用文本的圖像檢索的方式TBIR和基于內(nèi)容的圖像檢索方法(CBIR)。前者利用文本描述圖像的特征進行檢索,輸出結(jié)果的圖像是由圖像名稱來決定的而不是內(nèi)容,查詢檢索的正確率較低。后者根據(jù)圖像的顏色、紋理、形狀等進行分析和檢索,將圖像底層特征與圖像關(guān)鍵詞結(jié)合進行圖像自動標注以提高準確率等。
2.1 基于文本的圖像信息檢索TBIR
TBIR是基于文本為基礎(chǔ)的信息查詢檢索的技術(shù)。在查詢檢索前,我們通常會對數(shù)據(jù)庫中的圖像進行標示,用簡單的文字去描述圖像的具體內(nèi)容,利用編號的方式將數(shù)據(jù)庫中的圖像關(guān)聯(lián)在一起。在圖像進行查詢檢索時,其實是對圖像描述數(shù)據(jù)庫進行的操作,利用傳統(tǒng)的查詢方式和語言進行檢索,在通過對查詢出來的結(jié)果對應(yīng)圖像數(shù)據(jù)庫中的標示輸出最終的結(jié)果。
利用人工方式見多圖像的標示實現(xiàn)了查詢分類的方式,人工提取標識需要耗費大量的人力、提取過程存在著主觀片面性,對圖像語義依賴于不同的知識結(jié)構(gòu)及理解能力等明顯缺陷。
2.2 基于內(nèi)容的圖像檢索技術(shù)CBIR
基于內(nèi)容的檢索技術(shù)是以內(nèi)容的描述作為基礎(chǔ)。圖像描述的內(nèi)容有顏色、紋理、形狀等視覺特征,還包含了對目標意義的復(fù)雜推理等的高層語義特征。檢索進行查詢的層次可分為基于原始數(shù)據(jù)的查詢、基于特征的查詢和基于語義的查詢?nèi)悺?/p>
CBIR的核心是使用圖像的視覺特征對圖像進行查詢檢索。CBIR可以在圖像的內(nèi)容中找尋出線索,并不是直接在圖像的文本描述朱查找,查詢過程更加有效,適應(yīng)性更強;CBIR其實是一種模糊匹配,查詢條件查詢出的結(jié)果可能挺多的,需要逐漸限制檢索關(guān)鍵,最終確認查詢結(jié)果;通過計算機自動化來實現(xiàn)特征的提取和查詢索引的建立,用戶可以根據(jù)自己的檢索目標來引導(dǎo)查詢過程,可以明顯的提高查詢檢索的效率;可以將多層次的查詢檢索的要求滿足,在大型的數(shù)據(jù)庫中完成快速的查詢檢索功能。本質(zhì)上講,它是一種近似匹配技術(shù)。
3 基于圖片顏色特征的檢索方式
3.1 圖像特征提取技術(shù)
特征提取CBIR是圖像提取技術(shù)的重心。圖像檢索用圖像內(nèi)容作為基礎(chǔ)使用圖像處理和電腦視覺處理技術(shù),在圖像中獲取內(nèi)容。圖像予以存在復(fù)雜性,所以很難直接對圖像語義進行自動的提取。
現(xiàn)在基于內(nèi)容的圖像數(shù)據(jù)庫查詢檢索系統(tǒng)都是以圖像的底層視覺特征作為基礎(chǔ)的,特征由顏色、形狀、紋理和空間的位置信息等。利用CBIR進行特征的抽取,將人觀察出來比較相近的特征抽取出來。
3.2 圖片主色調(diào)區(qū)分
3.2.1 圖片主色調(diào)確認
物體都有顏色的特征,相近事物具有相近的顏色特征,可以通過顏色的特征來區(qū)分物體。顏色特征較容易提取,對于圖像本身的特性依賴性比較弱。所以顏色特征用于圖像檢索已經(jīng)是很重要的方式之一了。
根據(jù)人眼的生理結(jié)構(gòu),所有顏色都可看作是紅(Red)、綠(Green)、藍(Blue)3個基本顏色自行組合。人眼不能分辨多種顏色,對于一張圖片的整體印象總是可以歸結(jié)為幾種顏色,可以選取多種有代表的顏色,作為主色調(diào)的候選項,就可以為一張圖片的重要特征。
篩選后,本文可以將表1中的22種顏色確定為主色調(diào)的候選項。
接著需要確定圖片的主色調(diào)與哪種顏色最相近。可以先獲取到每個像素點的具體顏色,在22種顏色中選出與其最接近的顏色,并將其歸為這種主色調(diào)。查詢出主色調(diào)的像素點占的比例,比例大的確定為圖片的主色調(diào)。
在確定像素顏色的時候,利用歐式的距離公式進行構(gòu)造色彩的距離公式:
,D是距離,代表24種主色調(diào)候選數(shù)值;檢索圖片中的任意的一個像素點數(shù)值。公式可以讓色彩的書籍映射到歐式的空間里,將色彩的差異進行計算,轉(zhuǎn)化到歐式空間里的距離上,距離短,擇色彩接近,利用找尋之間的最小距離來確認顏色歸屬于22種主色調(diào)之中的哪一種,終統(tǒng)計出22種主色調(diào)中頻數(shù)最高的一種,將其作為該圖片整體的主色調(diào)。
3.2.2 確定圖像分塊
通過查閱相關(guān)資料發(fā)現(xiàn),對于圖像的注視來提出對圖像的興趣,對于不引起興趣的區(qū)域,人們很少進行注視。隨意注視的重點分布可以客觀的反應(yīng)人們的視覺感知特征。視覺感知的獲取可以利用視覺跟蹤技術(shù)來獲得用戶的關(guān)注點??梢圆杉脩魧τ趫D像感興趣位置的數(shù)值來代替采集所有的數(shù)值,明顯可以提高圖像查詢檢索的效率。
提高了用戶感興趣的的視覺感知點,根據(jù)視覺感知技術(shù)的研究成果,可以在采集圖片像素點的RGB值之前首先對圖像進行分塊。常用的分塊方法是將圖像平均分成塊。可以在保證所取像素點能夠代表圖片主體特征的情況下,盡量少取像素點。將圖像的像素點密集度進行確認,并為每個不同的區(qū)域賦予不同的關(guān)注權(quán)重。在進行圖像設(shè)計的過程中,多數(shù)采取圖片中央位置作為主體,用戶的關(guān)注度最高,應(yīng)賦予較高的權(quán)重;邊緣多為背景,用戶關(guān)注度較弱,需要賦予較小權(quán)重,因此我們對分割后的圖片區(qū)域按著用戶關(guān)注度從高到低分為A、B、C級,等級越高,所應(yīng)采集的像素點應(yīng)該越多。
4 結(jié)語
論文在圖像的搜索方式和引擎上進行分析研究,設(shè)計了以圖片的顏色作為特征判定的圖像檢索系統(tǒng),利用圖像的顏色特征、圖片主色調(diào)信息實現(xiàn)簡單的“以圖搜圖”?;趦?nèi)容的圖像檢索有著廣闊的應(yīng)用前景,可應(yīng)用于數(shù)字圖書館、醫(yī)療、Web應(yīng)用及電子商務(wù)、知識產(chǎn)權(quán)保護、預(yù)防犯罪、建筑、工程、服裝設(shè)計、地理研究、廣告、新聞、遙感、文化遺產(chǎn)的保護等領(lǐng)域。
參考文獻
[1]趙宏偉,李清亮,劉萍萍,等.特征點顯著性約束的圖像檢索方法[J].吉林大學(xué)學(xué)報(工學(xué)版),2016,02:542-548.
[2]彭晏飛,李佳.基于遺傳算法和SVM的遙感圖像檢索[J].小型微型計算機系統(tǒng),2016,04:875-880.
[3]李燦.基于內(nèi)容的商品圖像檢索技術(shù)與系統(tǒng)研究[J].移動通信,2016,08:63-69.
[4]孫亮.內(nèi)容圖像檢索的特征及策略分析[J].桂林航天工業(yè)學(xué)院學(xué)報,2016,02:159-162.