王逢娟
摘 要: 基于內(nèi)容的圖像檢索是一種利用圖像的視覺特征(顏色、紋理、形狀等)進(jìn)行圖像檢索的技術(shù)。本文研究利用顏色特征進(jìn)行圖像檢索的三個關(guān)鍵問題:顏色的表示、顏色特征的提取和基于顏色的相似性度量。本文利用Visua1 C++6.0實現(xiàn)圖像檢索系統(tǒng),系統(tǒng)功能:用戶以給定示例圖的方式檢索本地圖像庫中的相似圖片,用戶只需根據(jù)提示選擇示例圖和想要檢索的圖像庫,系統(tǒng)會自動對示例圖和圖像庫進(jìn)行特征提取,并計算示例圖與圖像庫中每幅圖片的相似度,最后按相似度大小排序輸出顯示給用戶。
關(guān)鍵詞: 基于內(nèi)容的圖像檢索;顏色特征;CBIR
1.引言
隨著互聯(lián)網(wǎng)的發(fā)展,我們能夠更加便捷、經(jīng)濟(jì)的接觸到數(shù)字媒體(例如視頻、醫(yī)學(xué)圖像、衛(wèi)星圖像、地震數(shù)據(jù)、氣象數(shù)據(jù)、掃描文本、音樂數(shù)據(jù)等)。我們需要解決的問題是如何在浩如煙海的多媒體世界中準(zhǔn)確找到自己所需要的信息。多媒體數(shù)據(jù)庫發(fā)展的一個重要研究領(lǐng)域就是基于內(nèi)容的圖像檢索技術(shù)。
圖像內(nèi)容的主要特征是顏色、紋理和形狀。顏色是表示一幅圖像最簡單、有效的特征,由于顏色具有與生俱來的旋轉(zhuǎn)不變性(rotation-invariance)和尺度不變性(scale-invariance),對大小、方向都不敏感,表現(xiàn)出相當(dāng)強的魯棒性,所以在基于內(nèi)容的圖像檢索中,顏色是使用最廣泛的特征之一。
2. 圖像檢索的一般步驟
(1)特征提取
提取圖像數(shù)據(jù)符合檢索要求的、用戶感興趣的特征,特征提取可以是全局性的,如整幅圖像,也可以是針對某個目標(biāo),如圖像中的子區(qū)域等。
(2)圖像匹配
在特征提取之后,需要適當(dāng)?shù)呐袆e準(zhǔn)則(常用的度量準(zhǔn)則是距離度量法),從而判斷出待識別的圖像的特征與數(shù)據(jù)庫中的哪些圖像的特征最接近。
(3)結(jié)果輸出
將滿足一定相似性條件的一組候選結(jié)果按相似度大小排列后返回給用戶。
(4)特征調(diào)整
對系統(tǒng)返回的結(jié)果可通過瀏覽來篩選,直至找到滿意的結(jié)果,或從候選結(jié)果中選擇一個示例,經(jīng)過特征調(diào)整,生成一個新的查詢。
3.顏色特征表示
顏色特征是圖像視覺最直觀、最重要的感知特征之一。用戶只要輸入想要查詢的顏色特征,在顏色特征庫中進(jìn)行信息的匹配。基于顏色的特征提取方法能較好的表示圖像的顏色信息。目前顏色特征的提取方法主要有:顏色直方圖、顏色集、顏色矩、顏色聚合向量和顏色相關(guān)圖等顏色特征的表示方法。我們采用最常用的顏色直方圖進(jìn)行系統(tǒng)設(shè)計。
Swain和Ballard于1990年提出了顏色直方圖,先將顏色空間劃分為若干個固定的子空間,然后對每幅圖像統(tǒng)計屬于各子空間的像素數(shù)目。它所描述的是不同色彩在整幅圖像中所占的比例。這種方法具有計算簡單、對平移和旋轉(zhuǎn)不敏感等優(yōu)點,但因為不包含色彩的空間位置信息,無法描述圖像中的對象或物體。
4.圖像的相似性度量
為了實現(xiàn)圖像檢索的目的,我們對提取到的特征都要進(jìn)行相似度計算,最后根據(jù)計算的結(jié)果選擇輸出檢索的結(jié)果圖像。相似度是以數(shù)值的形式來表示兩個對象之間的相似程度的度量結(jié)果。
4.1相似度計算公式
4.1.1距離相似測度
我們的理論研究采用的是幾何模型,將圖像的特征看作是坐標(biāo)空間中的點,特征點之間的距離表示兩個點的接近程度。我們用數(shù)學(xué)表達(dá)形式表示以下幾種距離:
假設(shè)有兩幅n維特征矢量的圖像X和圖像Y分別表示為:
X(x1,,x2,…,xi,,…,xn);
Y(yl,y2,…,yi,,…,yn)
1) 歐氏(Euelidean)距離公式
歐氏距離公式是一個常見的衡量兩個對象相似的公式,圖像X和圖像Y之間的距離定義為:
當(dāng)Sim(X,Y)越大時,兩幅圖像在這一特征上的差異就越大,當(dāng)Sim(X,Y) 越小時,兩幅圖像在這一特征上就越相似,這個公式符合人們對于圖像差異的視覺感受。
2) 絕對值距離公式
運用這個公式得到的結(jié)果相對于歐氏距離公式其相似的精確度略差,有可能縮小差異大的圖像的相似度計算結(jié)果,使檢索得到的圖像的數(shù)量擴大。但絕對值距離公式運算簡單,運算結(jié)果誤差小,當(dāng)特征量較少時,其效果還是能達(dá)到要求的。
3) 加權(quán)距離公式
加權(quán)距離公式是對上述絕對值距離公式的改進(jìn),其根據(jù)實際中得到的特征量在整體特征中所占的比重來加上一個相應(yīng)的權(quán)值,表達(dá)式如下:
其中就是相對應(yīng)第i個特征分量的權(quán)值,對于不同類型的圖像及不同的特征分量,其權(quán)值是不同的。加權(quán)距離公式能夠充分體現(xiàn)檢索中兩幅圖像之間在某一特征上的相似性,在不同的檢索要求中可以通過調(diào)整不同的權(quán)值來檢索以達(dá)到更好的效果。
4.1.2 相關(guān)相似測度
相關(guān)相似測度主要體現(xiàn)了兩個對象之間的相關(guān)性,可以根據(jù)相關(guān)計算結(jié)果來判斷兩個對象是否相似。本文采用直方圖交叉計算公式作為相關(guān)相似測度。
直方圖交叉計算公式是一個以求取兩幅圖像相同點程度的公式,其以數(shù)學(xué)中的交集計算為基礎(chǔ),數(shù)學(xué)表達(dá)式如下:
如果兩幅圖像特征分布相同,則其計算的結(jié)果為O;當(dāng)兩幅圖像完全不同時,結(jié)果為1;其它情況結(jié)果落在0到1之間。這個公式可以明顯地區(qū)分出不相似的圖像。
5.系統(tǒng)的設(shè)計與實現(xiàn)
我們開發(fā)了基于顏色特征的圖像檢索系統(tǒng),考慮到可擴展性和使用便捷性,采用Visual C++6.0程序設(shè)計語言,在Windows 7下完成。該系統(tǒng)涉及到顏色模型、特征提取算法,距離度量函數(shù)等方面的設(shè)計,支持用戶以給定示例圖的方式檢索本地圖像庫中的相似圖片,用戶只需根據(jù)提示選擇示例圖和想要檢索的圖像庫,系統(tǒng)會自動對示例圖和圖像庫進(jìn)行特征提取,并計算示例圖與圖像庫中每幅圖片的相似度,最后按相似度大小排序輸出顯示給用戶。
系統(tǒng)主要包括查詢接口,圖像處理,特征提取,特征匹配,結(jié)果顯示五大模塊。
基于顏色特征的圖像檢索系統(tǒng)具有以下特點:
(1)靈活:用戶選擇的事例圖像既可以本地主機上的任何一幅圖片也可是本地任意一個圖像庫檢索與事例圖片相似的圖片。
(2)方便:提供圖形化用戶界面,方便用戶操作。
6.小結(jié)
本文對基于內(nèi)容的圖像檢索技術(shù)作了較全面的介紹和研究,重點研究了基于顏色特征的圖像檢索方法。如何有效地綜合顏色、紋理、形狀、空間位置關(guān)系以及語義特征來對圖像進(jìn)行查詢勢必會成為一個熱門研究方向。因此,從基于圖像內(nèi)容的查詢及其用于Web環(huán)境的深度而言,今后在這些方面還可以進(jìn)行一些更深入的研究。
參考文獻(xiàn)
[1]曹奎.基于顏色的圖像檢索技術(shù)研究.華中科技大學(xué)博士論文.2002.
[2]莊越報. 智能多媒體信息分析與檢索的研究[D]浙江大學(xué)博士論文 .1998.
[3]李鵬杰,楊樹元.一種基于內(nèi)容的圖像檢索系統(tǒng)ImageHunter[J]微機計算機 應(yīng)用 .2001, (5):139-141.
[4]王紹棣.基于內(nèi)容特征的圖像和視頻檢索系統(tǒng)[J]計算機工程與應(yīng)用. 2001, (7):113-117.
[5]徐杰,施鵬飛.基于內(nèi)容的圖像檢索技術(shù)[A].中國圖像圖形學(xué)報.2003.9.978頁.
[6]向世明.Visual C++數(shù)字圖像與圖形處理[M]北京:電子工業(yè)出版社,2002.
[7]Marshall Brain, Lance Lovette. Developing Professional Applications in Windows 95 and NT Using MFC [M]北京:機械工業(yè)出版社,1999.
[8]徐曼,等.基于內(nèi)容的圖像檢索技術(shù)[J]計算機應(yīng)用,2001(9).
[9]胡學(xué)龍主編.C---程序設(shè)計一從面向過程到面向?qū)ο?北京:機械工業(yè)出版社,2001.7.
[10]李蘭友等.visualc++.NET圖形圖像編程.北京:電子工業(yè)出版社.