王潤鴻 劉燕
(閩江學(xué)院,福州 350018)
一種基于主色調(diào)紋理的圖像檢索方法
王潤鴻 劉燕
(閩江學(xué)院,福州 350018)
基于主色調(diào)和共生矩陣的概念,提出并實現(xiàn)一種基于主色調(diào)紋理的圖像檢索方法。該方法根據(jù)用戶所給目標(biāo)圖像的多種主色調(diào),基于三種顏色分量和灰度分量的矩陣信息,提取圖像的主色調(diào)共生矩陣紋理特征,并利用適用該特征的相似性度量函數(shù)實現(xiàn)基于內(nèi)容的圖像檢索。
圖像檢索;主色調(diào);共生矩陣;紋理特征
顏色是彩色圖像最顯著的特征,體現(xiàn)了圖像的概貌,也是最容易給人留下深刻印象的圖像特征?;陬伾臋z索是基于內(nèi)容的圖像檢索中最常用的方法。圖像紋理特征是圖像像素點間灰度或者顏色的漸進變化,是圖像局部結(jié)構(gòu)化特征的反應(yīng),具有統(tǒng)計相關(guān)性。圖像具有多種底層特征,但只選擇其中某一種特征進行圖像檢索,檢索的效果差,應(yīng)用范圍不廣,通用性差。要提高檢索精度,需要綜合考慮圖像的多種底層特征,提取圖像更通用的檢索特征,有效地將圖像的顏色、紋理、形狀、空間等視覺信息結(jié)合起來。在此,針對上述問題提出并實現(xiàn)一種主色調(diào)紋理檢索方法,該方法有效地結(jié)合了圖像主色調(diào)顏色信息和紋理特征。
紋理通常定義為圖像的某種局部性質(zhì),或是對局部區(qū)域中像素之間關(guān)系的一種度量。Haralick等人從純數(shù)學(xué)的角度構(gòu)造一個共生矩陣[1],是一個灰度級的空間相關(guān)矩陣。共生矩陣是紋理特征提取的一種有效方法,充分利用了紋理中灰度分布的性質(zhì)。更適用于描述具有粗糙紋理和沒有明顯方向的的圖像紋理特性[2]。
若將圖像f(x,y)的灰度級定為為L,那么共生矩陣為L×L矩陣。則共生矩陣可定義為:
其中:R為圖像中某一目標(biāo)區(qū)域;S為R中具有特定空間聯(lián)系的像素對的集合;card(S)表示集合S中像素對個數(shù);i∈[0,L-1],j∈[0,L-1],x2=x1+δcosθ,y2=y1+δsinθ,f(x,y)∈[0,L-1]。
圖像主色調(diào)能夠代表一幅圖像的基本概貌,反應(yīng)圖像主體特征和語義特征,如藍天白云、紅花綠葉、綠色森林、藍色的海洋等。對于圖像主色信息可以給出如下定義:
主色:圖像內(nèi)在視覺上起支配作用的顏色稱為主色。主色在圖像中起到主體作用,用主色表示原圖像,視覺效果、主體特征和原圖像基本一致,用最少的顏色來描述圖像的主體視覺效果,可大大減少顏色特征數(shù)。
主色集:一幅圖像內(nèi)所有主色的集合,它基本反映了圖像的顏色特征信息。
用主色調(diào)描述圖像,保持了圖像的主體視覺效果,抽象了圖像的主體顏色特征,但卻僅僅反映了圖像的大致情況。人的肉眼不能精確分辨顏色,只是對顏色的大概判斷。如用戶認知的紅色,通常有很多種,量化到具體的顏色空間不是某個具體的值,而是相關(guān)的若干值的集合。只靠用戶肉眼判斷來作為圖像檢索的主色調(diào)誤差比較大。肉眼對圖像顏色的認知并不精確,無法精確表達其顏色信息。無法用一個量化的RGB值來精確表達肉眼認知的顏色,因為主色調(diào)往往具有個人的主觀因素和判斷,在顏色分布中選擇某個具體的值來表達肉眼對圖像主色調(diào)的認識,往往是不精確的。例如,用戶通過調(diào)色板選擇了一種顏色(R=0,G=255,B=77),那么這個顏色單純指R=0,G=255,B=77的值。而實際上,人類肉眼看似綠色的顏色分布在RGB一個很廣的范圍內(nèi),但由于用戶選擇顏色時的隨機決定性和模糊性,使得用戶真正想要檢索的顏色的值和選中的顏色值具有偏差。將這樣選擇的主色調(diào)應(yīng)用于顏色檢索中,通常會錯過用戶真實需要的顏色,而這種顏色往往近似于用戶所選擇的顏色,因此檢索誤差大,效果并不理想。
基于主色調(diào)的檢索算法很好地應(yīng)用了圖像的主色信息,體現(xiàn)了圖像的概貌,因此應(yīng)用主色調(diào)的圖像檢索能夠在一定程度上提高檢索精度,但基于不經(jīng)過擴展的主色調(diào)檢索有時會加大檢索誤差。
基于顏色特征的圖像檢索中,由于一幅圖像的顏色一般較多,直方圖矢量的維數(shù)也會非常多。因此通常對HSV空間進行適當(dāng)?shù)牧炕笤儆嬎阒狈綀D,以簡化計算量。如公式(2),量化后的色調(diào)、飽和度和亮度值分別為H,S,V。
由上述量化公式可見,如果用戶選擇了一個特殊的顏色值,經(jīng)過空間轉(zhuǎn)換計算得到的H值為40,量化的色調(diào)值H為1,而用戶實際需要的顏色的H值為41,則量化以后其色調(diào)值H為2。兩種幾乎相同的顏色被量化到不同的范圍內(nèi)。而在實際檢索中,由于肉眼對顏色認知的主觀性和隨機性,常常會出現(xiàn)主色調(diào)選擇引起誤差的情況。因此,對主色調(diào)進行適當(dāng)?shù)臄U展后再應(yīng)用于檢索中勢必強化檢索的效果。文獻[3]提出一種主色調(diào)擴展方法,該方法不是單純應(yīng)用用戶提供的某個值,而是將用戶選定的值適當(dāng)擴展到一定范圍,使得經(jīng)過顏色量化后實際顏色和所選擇的顏色盡量能夠落到同一個范圍,提高主色調(diào)選擇的準(zhǔn)確性。通過實驗驗證,選定主色調(diào)的合理擴展能夠提高圖像檢索精度。
以用戶選擇的顏色作為主色調(diào)進行檢索,由于肉眼選擇的模糊性和隨機性使得主色的選擇并不精確,往往和實際需要的顏色相近,量化值不同但同屬于某個范圍的顏色。這種分布是不均勻的,可能性最大的情況是正態(tài)分布。因此利用正態(tài)分布的特點,應(yīng)用正態(tài)分布擬合法來擴展用戶指定的主色調(diào)顏色值。該方法不是單純使用用戶的某個指定值,而是把這個指定值擴展到一個正態(tài)分布的范圍內(nèi)來使用,把這個范圍內(nèi)的顏色值都作為查詢的主色調(diào),而這些值往往都和實際需要的顏色具有相關(guān)性。該擴展方法使用用戶給出的模糊度σ,將主色l擴展到l-3σ至l+3σ范圍內(nèi),這個范圍基本上包含所有分布。取(l-3σ,l+3σ)范圍內(nèi)的離散值 int(l+3σ)+1-int(l-3σ)作為擴展結(jié)果[3]。其中模糊度σ反映的是用戶對指定主色調(diào)的把握性,根據(jù)把握性的大小確定正態(tài)分布的方差值。用戶對所指定的主色把握越大,那么需要擴展的顏色范圍就越小,模糊度σ的值越?。幌喾?,如果用戶相對粗略的選擇主色,就越應(yīng)該擴大其擴展范圍,正態(tài)分布的方差越大,給出的模糊度σ的值越大。因此,我們可以用用戶自己給出的模糊度通過正態(tài)分布函數(shù)擬合成某一范圍內(nèi)的值,作為檢索的主色調(diào)。
一般圖像都包含不止一種主色調(diào),而且主色調(diào)的比例往往不同,不同的主色調(diào)通常反映著不同的語義特征,多種主色調(diào)在圖像中的重要程度經(jīng)常不一樣。因此如何將圖像的多種主色調(diào)有效地組合起來應(yīng)用,對基于主色調(diào)的檢索起到重要的作用。多種主色調(diào)的有效結(jié)合,應(yīng)該能夠體現(xiàn)圖像的基本概貌特征。結(jié)合上述正態(tài)分布擬合法擴展主色調(diào),文獻[3]中提出基于不同模糊度和比例的方法來實現(xiàn)。由用戶給出每種主色調(diào)在圖像中所占的百分比,和每種顏色的模糊度,然后進行多種主色調(diào)的擴展后應(yīng)用于圖像的檢索中,能夠有效地利用圖像的多種主色信息,提高檢索精度。
檢索中可由用戶指定多種主色l1,l2,l3,同時給出每種主色模糊度(體現(xiàn)用戶對該顏色選擇的把握大小)σ1,σ2,σ3,并指出多種主色在圖像中所占的比例分別為應(yīng)用多種主色調(diào)前,要先將主色l1,l2,l3進行正態(tài)擬合擴展,得到基于模糊度擴展的顏色值其中int(l3+3σ3)。接著根據(jù)用戶指定的百分比,提取多種主色調(diào)特征。經(jīng)過實驗證明,上述多主色調(diào)擴展方法適用于基于主色調(diào)的圖像檢索,更好地使用了圖像豐富的色彩信息。
基于以上提出的主色調(diào)及其擴展方法,取 (l-3σ,l+3σ)范圍內(nèi)的離散值,應(yīng)用擴展后的 int(l+3σ)+1-int(l-3σ)種顏色值,結(jié)合共生矩陣紋理特征,形成主色調(diào)共生矩陣特征。提取特征時,計算灰度和顏色分量的共生矩陣,更好地體現(xiàn)圖像的顏色信息。有效地結(jié)合圖像的主色調(diào)顏色和紋理特性,主色調(diào)共生矩陣特征結(jié)合了圖像的多種主色信息,檢索效果更加符合視覺感知。在基于內(nèi)容的圖像檢索中RGB和HSV是最常用的兩種顏色空間,對每個顏色連通區(qū)域,計算紅、綠、色調(diào)、灰度多種顏色分量的主色調(diào)共生矩陣。由于RGB顏色空間模型中R、G、B分量間是線性相關(guān),只考慮其中的紅、綠兩個分量。HSV顏色空間模型中的色調(diào)分量(Hue),用以表示不同的顏色種類,能夠較好地區(qū)分顏色?;叶裙采仃囉脠D像灰度分量I來計算,體現(xiàn)圖像像素的灰度空間變化。
對于圖像的每種主色調(diào),分別提取圖像對應(yīng)的δ=1;H=0°、45°、90°、135°范圍的紅(R)、綠(G)、色調(diào)(H)、灰度(I)顏色共生矩陣特征,共同組成該圖像的主色調(diào)顏色共生矩陣紋理特征。下面描述主色調(diào)顏色共生矩陣紋理特征的提取算法。
步驟一:用戶指定的主色調(diào)為li,每種主色模糊度(體現(xiàn)用戶對該顏色選擇的把握大?。┓謩e為σi,每種主色在圖像中所占的比例分別為由給定的顏色,應(yīng)用正態(tài)分布擬合函數(shù)擴展顏色li,得到基于模糊度擴展的顏色值(i=1,2,…n)。
步驟二:確定圖像T的顏色分量R、G、H和I量化級數(shù)均為 D=int(li+3σi)+1-int(li-3σi)。
步驟三:按公式(1)計算基于每種顏色li的R、G、H和I顏色分量的歸一化共生矩陣,并對每個共生矩陣各自提取如下統(tǒng)計特征量:
由上述特征量組成li的16維紋理特征向量:
步驟四:根據(jù)每種主色在圖像中所占的比例Bi,按公式(4)計算圖像T的歸一化的16維紋理特征向量 F=[FR,F(xiàn)G,F(xiàn)H,F(xiàn)I]={f1,f2,…,f16}:
步驟五:特征提取結(jié)束。
主色調(diào)共生矩陣結(jié)合了圖像的多種主色信息,根據(jù)上述算法提取出的特征,包括了4個顏色分量的特征向量,各分量代表不同的含義,反應(yīng)了圖像不同的方面。因此相似性度量函數(shù)要能夠反應(yīng)其特點,符合不同向量含義。這里選用合適的權(quán)值把四個分量特征結(jié)合起來,組成適用的相似性度量函數(shù)。在實際的檢索算法中也可以由用戶根據(jù)需要設(shè)定權(quán)值。下面給出主色調(diào)共生矩陣的相似性度量函數(shù)。如兩幅圖像A和B,圖像A的主色調(diào)共生矩陣特征為FA=[FRA,F(xiàn)GA,F(xiàn)HA,F(xiàn)IA]={fA1,fA2,…,fA16},圖像 B 的共生矩陣特征為 FB=[FRB,F(xiàn)GB,F(xiàn)HB,F(xiàn)IB]={fB1,fB2,…,fB16},分別代表了R、G、H和I這4種顏色分量的共生矩陣特征分量。則相應(yīng)的相似性度量函數(shù)由其對應(yīng)的4項組成,如公式(5)所示:
其中:DE為用于進行圖像間特征匹配的歐幾里距離函數(shù),用于R、G和H分量的相似性度量;|FIA-FIB|表示向量的絕對值距離函數(shù),用于灰度分量I的相似性匹配;兩個歐幾度量函數(shù)都反映了圖像特征之間的差異程度,但它們的取值范圍不同。絕對值距離的取值范圍是 [0,2],歐幾里距離的取值范圍是需要對其進行歸一化。適用于主色調(diào)共生矩陣特征的歸一化相似性度量函數(shù)如下:
式中:wi為不同顏色分量紋理特征的權(quán)值,滿足0<
這樣得到的相似性度量函數(shù)S(A,B)能夠有效地反映兩幅圖像基于主色調(diào)紋理的相似程度。S(A,B)的值越大,表示兩幅圖像在主色調(diào)紋理的差異越小,其取值范圍為[0,1]。
在Windows平臺上基于Visual C++基本實現(xiàn)了基于主色調(diào)紋理特征的圖像檢索算法。按圖像的分類選取了十幾個語義類(花、鳥、山、汽車、工具、建筑物、風(fēng)景等),共2 000多幅圖像作為實驗的圖像庫。圖像庫中的圖像未進行任何預(yù)處理。根據(jù)目標(biāo)圖,基于本文算法對圖像庫進行相似圖像檢索,并按相似度由大到小的順序顯示前14幅圖像。為了更好地體現(xiàn)圖像的主色作用,充分利用其顏色構(gòu)成與分布信息,相似性度量函數(shù)四個向量的權(quán)值設(shè)置為:w1=0.3,w2=0.3,w3=0.3,w4=0.1。
圖1 部分實驗結(jié)果
實驗結(jié)果表明本文對主色調(diào)明顯、語義明顯的圖像檢索效果較好。由于綜合考慮了圖像的顏色和紋理特征,檢索出的結(jié)果圖像與原圖像在主色調(diào)和紋理上都具有明顯相近的視覺效果,而對于色彩繁雜、語義、紋理不明顯的圖像,還需要綜合形狀、紋理等多種特征。雖然本文方法提取的主色調(diào)紋理特征包含了顏色和紋理信息,但只能在相對精度上體現(xiàn)圖像的概貌,檢索改善不大。根據(jù)具體的檢索需要綜合利用多種底層視覺特征,能夠相對提高檢索效果,優(yōu)于基于單一圖像特征的檢索。
基于內(nèi)容的圖像檢索技術(shù)是信息時代必須認真解決的一個關(guān)鍵性問題。這項技術(shù)直接影響到海量信息的處理速度,影響到各種信息的采集和利用。行之有效的圖像綜合特征提取算法對提高圖像檢索的效率有著重要而積極的作用。文中提出基于主色調(diào)的紋理特征檢索方法,該方法將顏色信息與紋理特征有效地結(jié)合在一起,提高了檢索質(zhì)量。目前還沒有充分體現(xiàn)圖像內(nèi)容的通用方法,要想不斷完善對圖像的特征描述,還需要從以下等多角度加深研究:
(1)提取能夠更好表達圖像空間信息的有效特征,研究具有良好魯棒性的圖像特征。不受或少受旋轉(zhuǎn)、平移、尺度變化和畸變等因素及環(huán)境的干擾。
(2)充分利用用戶的宏觀聯(lián)想和反饋操作,構(gòu)建人機協(xié)同檢索系統(tǒng)。
(3)為了提高檢索智能,需對圖像高層次的語義描述進行研究。
[1]Haralick R M,Shanmugam K,DinsteinI.Texture Features for Image Classification [J].IEEE Transactions on System Management and Cybertics,1973,3(6):768-780.
[2]MariP,BogdanC,MoncefG,et al.Rock Texture Retrieval Using Gray Level Cooccurrence Matrix[EB/OL].http://www.norsig.no/nor-sig2002/Proceedings/papers/cr1071.pdf,2002-10-04.
[3]曹莉華,柳偉,李國輝.基于多種主色調(diào)的圖像檢索算法研究與實現(xiàn)[J].計算機研究與發(fā)展,1999,36(1):96-100.
[4]楊育彬,陳世福,林琿.一種基于顏色連通的圖像紋理檢索新方法[J].電子學(xué)報,2005,33(1):57-62.
Abstract:Using the concept of dominant color and co-occurrence matrix,this paper proposes and implements a content-based image retrieval(CBIR)method.For a target image,according to the dominant colors given by users,the method uses the matrixes of three color components and a gray component to extract the co-occurrence matrix texture features of dominant colors.We use image similarity functions for the features to implement a CBIR system,which indicates that the method combines the texture and dominant color effectively.
Key words:image retrieval;dominant color;co-occurrence matrix;texture feature
A CBIR Method Combined Dominant Colors with Texture Features
WANG RunhongLIU Yan
(Minjiang University,Fuzhou 350018)
TP391
A
1673-1980(2012)02-0159-05
2011-11-02
福建省教育廳科技項目(JB11137).
王潤鴻(1977-),女,講師,碩士,研究方向為智能圖像處理。