侯方,姜秀華
(中國(guó)傳媒大學(xué)信息工程學(xué)院,北京100024)
近年來(lái),隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)和網(wǎng)絡(luò)通信技術(shù)的日益發(fā)展,尤其是Internet網(wǎng)絡(luò)的快速發(fā)展和大范圍普及,數(shù)字圖像正以驚人的速度增長(zhǎng),我們需要一種快速而準(zhǔn)確的查找方法來(lái)從海量圖像數(shù)據(jù)庫(kù)中找到所需要的圖像。從20世紀(jì)70年代至今,圖像檢索技術(shù)由基于文本的圖像檢索發(fā)展到現(xiàn)在的基于內(nèi)容的圖像檢索。
基于內(nèi)容的圖像檢索(CBIR)是圖像特征相似性匹配的過(guò)程,而用于檢索的圖像特征分為底層視覺(jué)特征和高層語(yǔ)義特征,現(xiàn)在一般使用顏色、形狀和紋理等這些底層視覺(jué)特征。一個(gè)典型的CBIR系統(tǒng)一般由兩部分構(gòu)成:圖像特征提取子系統(tǒng)和圖像查詢(xún)子系統(tǒng)。圖像特征提取子系統(tǒng)主要是負(fù)責(zé)圖像的存儲(chǔ)和特征提取,并以特征信息索引庫(kù)形式存儲(chǔ)圖像特征信息的表達(dá)式,圖像查詢(xún)子系統(tǒng)則完成基于內(nèi)容的檢索功能?;趦?nèi)容的圖像檢索技術(shù)經(jīng)過(guò)多年的研究,目前已經(jīng)開(kāi)發(fā)出了一些系統(tǒng),而比較知名的有IBM公司研制的QBIC[1],美國(guó)哥倫比亞大學(xué)開(kāi)發(fā)的WebSEEK和VisualSEEK[2]系統(tǒng)和MIT多媒體實(shí)驗(yàn)室Photobook系統(tǒng)等。在這些圖像檢索系統(tǒng)中,都提供了顏色屬性的檢索功能。
顏色特征是每個(gè)物體都有的非常重要的視覺(jué)特征,而且對(duì)圖像質(zhì)量和尺寸的變化、旋轉(zhuǎn)和噪聲有很強(qiáng)的魯棒性。在大多數(shù)情況下,顏色是描述一幅圖像最簡(jiǎn)單而有效的特征,在基于內(nèi)容的圖像檢索中顏色特征是被最廣泛采用的底層特征。
本文主要介紹圖像檢索系統(tǒng)中關(guān)于顏色特征的相關(guān)理論知識(shí)和幾種常用的的典型的顏色特征提取方法。
常見(jiàn)的用來(lái)表示顏色的顏色空間有RGB顏色空間、HSV顏色空間和CIEL*a*b*顏色空間等,顏色空間的選擇對(duì)顏色特征提取非常重要,一般選用符合人眼視覺(jué)特征的顏色空間。
RGB顏色空間是圖像顯示中的一種最常用的顏色空間,它以紅、綠、藍(lán)作為三基色,依據(jù)三基色原理,紅、綠、藍(lán)按照不同比例相加混合成各種顏色。盡管RGB顏色模型計(jì)算簡(jiǎn)單,也被廣泛的應(yīng)用于CRT顯示彩色圖像,但是RGB顏色空間不具備視覺(jué)一致性,各顏色維之間的相關(guān)性很強(qiáng),我們要改變一種顏色時(shí),就要對(duì)三個(gè)通道上的顏色全部進(jìn)行改變。另外,它不是一個(gè)均勻視覺(jué)的顏色空間,兩種顏色之間的視覺(jué)差異不能采用該顏色空間中兩個(gè)顏色點(diǎn)之間的距離來(lái)表示,不符合人眼對(duì)顏色的感知,因此需要另一種符合人的視覺(jué)心理的顏色模型來(lái)表示顏色。
HSV[3]顏色空間是一種面向視覺(jué)感知的顏色模型,以人類(lèi)對(duì)顏色的感覺(jué)為基礎(chǔ),把顏色用三個(gè)分量來(lái)表示:色調(diào)H(hue)、飽和度S(saturation)、亮度V(value)。HSV顏色空間直接對(duì)應(yīng)于人眼的視覺(jué)三要素,通道之間各自獨(dú)立,所以HSV顏色空間具有視覺(jué)一致性;每個(gè)分量直接對(duì)人眼的視覺(jué)感受起作用,顏色之間感覺(jué)上的距離與HSV顏色空間坐標(biāo)上點(diǎn)的歐幾里德距離成正比,所以HSV顏色空間是一個(gè)均勻的顏色模型,比RGB空間更符合人眼的視覺(jué)特性。但是計(jì)算機(jī)只能識(shí)別RGB顏色空間,因此在圖像處理中需要使用以下公式把圖像從RGB空間模型轉(zhuǎn)換到HSV空間模型:
其中:max=max(R,G,B),min=min(R,G,B),h∈[0,360],(s,v)∈[0,1]。
CIEL*a*b*顏色空間[3]是1976年由國(guó)際照明委員會(huì)(CIE)公布的,是一種均勻的顏色模型。Lab模式由三個(gè)通道組成,一個(gè)通道是亮度L,另外兩個(gè)是色彩通道a和b,人眼對(duì)亮度分量L敏感,對(duì)兩個(gè)顏色分量的變化不敏感。均勻顏色空間模型本質(zhì)上仍是面向視覺(jué)感知的顏色模型,只是在視覺(jué)感知方面更為均勻,對(duì)于CIEL*a*b*空間,顏色之間的差別完全可以用歐氏距離來(lái)測(cè)量。CIEL*a*b*顏色空間也可以由RGB顏色模型轉(zhuǎn)化得到。
顏色直方圖是基于顏色的CBIR系統(tǒng)中最早使用,同時(shí)也是最常用的一種特征表示方法,它反映了圖像中各種顏色的比例分布。顏色直方圖實(shí)質(zhì)就是統(tǒng)計(jì)圖像中每種顏色出現(xiàn)的頻數(shù),所以它計(jì)算簡(jiǎn)單,而且具有平移、旋轉(zhuǎn)和縮放不變性。顏色直方圖可以用一個(gè)一維向量來(lái)表示:
其中hk表示第k種顏色在該圖像中的像素頻數(shù):
上式中k代表圖像的顏色特征值,L代表顏色特征值的個(gè)數(shù),nk是圖像中具有特征值為k的像素個(gè)數(shù),N是圖像像素的總數(shù)。
但是顏色直方圖丟失了顏色的空間分布信息,因此在兩幅完全不相關(guān)的圖像具有相同的顏色直方圖時(shí),就會(huì)降低檢索效率。鑒于顏色直方圖的這種缺點(diǎn),許多改進(jìn)的方法被提了出來(lái),如:累加顏色直方圖,分塊顏色直方圖,局部顏色直方圖等。
當(dāng)圖像中的特征向量不能取遍所有值時(shí),顏色直方圖中就會(huì)出現(xiàn)很多零值,從而影響直方圖的相交運(yùn)算,就會(huì)使匹配結(jié)果不能反映兩圖之間的顏色差別。為了解決這個(gè)問(wèn)題,累計(jì)直方圖被提了出來(lái)。
累計(jì)直方圖的定義如下:
既然每天基本只拍一張照片,不如嘗試拍攝更有力的作品,既能向觀(guān)眾透露整體敘事的一些信息,又能獨(dú)立存在,這會(huì)是一項(xiàng)有趣的挑戰(zhàn)。在365天的項(xiàng)目中給自己設(shè)定敘事以外的挑戰(zhàn),既能給予你更多思考空間,也能給你更多動(dòng)力,促使你完成項(xiàng)目。
hk表示k種顏色的像素累加頻數(shù)。實(shí)驗(yàn)表明,累計(jì)直方圖檢索圖像的效果一般都優(yōu)于直方圖。
顏色矩[4]是 StriCker和 Orengo提出的一種簡(jiǎn)單而有效的顏色特征描述方法,由于顏色的信息主要集中在低階矩,所以圖像的顏色分布僅使用顏色的一、二和三階矩就可以表達(dá)。與顏色直方圖不同的是顏色矩不需要對(duì)特征進(jìn)行向量化,但是圖像低階矩的檢索效率比顏色直方圖的檢索效率要低,所以在實(shí)際應(yīng)用中常將顏色矩同其它圖像特征聯(lián)合使用。
顏色的空間分布特征對(duì)于區(qū)分圖像的內(nèi)容也是十分重要的,因?yàn)閮煞伾臻g分布明顯不同的圖像可能會(huì)存在相同的顏色直方圖,這對(duì)只采用顏色直方圖的檢索算法的檢索精度有很大的影響。所以我們可以將顏色的空間信息和顏色直方圖結(jié)合起來(lái),彌補(bǔ)直方圖特征的缺點(diǎn),使檢索結(jié)果更加精確。
圖像中的顏色一般會(huì)非常多,這樣就會(huì)使直方圖矢量的維數(shù)非常多,矢量維數(shù)的增加又會(huì)占用更多的存儲(chǔ)空間和使計(jì)算量增大,而且人眼對(duì)顏色的分辨能力也有限,不能區(qū)分所有顏色。因此,需要對(duì)顏色空間進(jìn)行量化以減少顏色的維數(shù)。顏色的量化方法一般有等間隔量化、非等間隔量化和聚類(lèi)[14]。
傳統(tǒng)的直方圖方法只是統(tǒng)計(jì)圖像的全局顏色信息,而丟失了圖像的空間分布信息,檢索效率會(huì)受到影響。為了提高檢索精度,需要在直方圖的基礎(chǔ)上引入空間信息。為了加入空間信息,一般是把圖像劃分為若干塊,然后分別計(jì)算每個(gè)子塊的顏色直方圖。
常用的分塊方法是將圖像平均分成m×n塊,這種分塊方法雖然簡(jiǎn)單,但是沒(méi)有突出圖像中間的主體部分和充分限制背景的范圍。于是Stricker M和Dimai A[5]提出了下圖的分割方法,對(duì)每個(gè)區(qū)域求顏色矩的同時(shí)對(duì)中央?yún)^(qū)域1賦予較大的權(quán)值(見(jiàn)圖1)。趙瑩[6]提出了一種圖像重疊分塊的方法,把圖像平均分成3×3的子塊后,又將這9塊合并成4大區(qū)域(見(jiàn)圖2):P1={1,2,4,5},P2={2,3,5,6},P3={4,5,7,8},P4={5,6,8,9}。P1、P2、P3 和 P4這四部分彼此相互重疊,中央部分5重疊了4次,權(quán)重為 4,(2、4、6、8)重疊了 2 次,權(quán)重為 2,(1、3、7、9)只重疊了一次,權(quán)重為1。通過(guò)重疊的方式,不僅可以突出圖像中間的主體部分和限制背景范圍,還一定程度上避免了因分得過(guò)碎而破壞物體完整性的缺點(diǎn),并保留了足夠豐富的顏色信息。
圖1 一種圖像劃分方法
但是當(dāng)圖像發(fā)生變形時(shí),如旋轉(zhuǎn)和物體有位置變化,則以上的劃分方法就無(wú)法正確匹配。
圖2 圖像重疊分塊方法
中心圓和各圓環(huán)的半徑:
式中,R是以M為圓心的最大半徑。等間隔環(huán)形分塊法,分割后的各圓環(huán)的面積并不相等:中心圓的面積最小,所含像素點(diǎn)也最少;而越外面的圓環(huán)面積越大,所含像素點(diǎn)也越多[7]?;谶@種方法不利于突出中央主體部分,余芳[8]提出了一種等面積的圓環(huán)分塊方法,使中心圓和各圓環(huán)的面積相等(見(jiàn)圖4)。這樣不僅保持了環(huán)形分塊的優(yōu)點(diǎn),也更有利于突出圖像中央主體部分。
中心圓和各圓環(huán)的半徑:
圖3 等間隔的圖像環(huán)形塊方法
圖4 等面積的圖像環(huán)形分塊法
顏色量化可以降低顏色直方圖的維數(shù),同時(shí)好的量化方法可以更好的表達(dá)圖像中顏色空間的分布信息,更接近人眼的視覺(jué)感知性。J.R.Smith[9]、張磊[10]和曹莉華[11]等人提出了不同的量化方法,但是這些方法存在兩個(gè)問(wèn)題:忽視了量化邊界處附近的顏色的相似性和連續(xù)性;忽視了人對(duì)顏色主觀(guān)感知的模糊性。汪子強(qiáng)[13]等人提出了基于主觀(guān)視覺(jué)感知的模糊顏色量化方法,統(tǒng)計(jì)模糊量化直方圖,從而更好地近似人的視覺(jué)感知。
以Zadeh[12]提出的模糊集合理論為依據(jù),汪子強(qiáng)提出了基于HSV顏色空間的32色模糊顏色量化方法。設(shè)論域U為整個(gè)HSV顏色空間,對(duì)于不含色彩信息的灰度,把其分為四個(gè)模糊子集G={黑,深灰,淺灰,白};對(duì)于含有色彩信息的空間,根據(jù)人的主觀(guān)感知性研究,人眼對(duì)HSV空間的三分量存在感知獨(dú)立性,因此對(duì)三分量分別進(jìn)行模糊劃分,把色調(diào)大致分為七個(gè)模糊子集:{紅,橙,黃,綠,青,藍(lán),紫};對(duì)于飽和度分為兩個(gè)模糊子集:{深色,淺色};對(duì)于亮度分為:{亮,暗}。于是,由三個(gè)分量的模糊子集笛卡爾積就得到了28個(gè)模糊子集C,加上灰度的4個(gè)模糊子集就得到了32個(gè)模糊子集F(U)=G∪C。然后根據(jù)顏色隸屬度函數(shù) μA(μ)(A?F(U),μ∈U)來(lái)計(jì)算給定顏色對(duì)模糊子集A的隸屬度。于是,由隸屬度函數(shù)可以得到每種顏色對(duì)32個(gè)模糊子集的隸屬度。
由隸屬度函數(shù)可以得到模糊量化直方圖,對(duì)于M×N的圖像I和模糊子集,A?F(U)可以得到模糊量化直方圖如下:
通過(guò)實(shí)驗(yàn)表明基于模糊量化直方圖的方法更接近人的主觀(guān)視覺(jué)感知,具有較高的檢索準(zhǔn)確性。但是為了能夠更好的表達(dá)圖像的顏色特征,還需要我們進(jìn)一步的研究得到更好的量化方法。
主顏色是指圖像中占的比重比較大,而且在表達(dá)圖像語(yǔ)義上起重要作用的顏色,在顏色空間中利用聚類(lèi)方法將顏色聚類(lèi)成主顏色,并利用直方圖表示主顏色信息。聚類(lèi)是顏色量化的一種常用方法,常用的聚類(lèi)方法有K-means方法[8]、模糊C均值聚類(lèi)算法 (FCM)[16]和GLA算法。
李有峰[14]提出了一種基于圖像前景和背景主顏色提取方法,用K-均值聚類(lèi)的方法提取圖像前景和背景的主顏色,該方法不僅能夠降低顏色特征向量的維數(shù),而且對(duì)圖像的旋轉(zhuǎn)以及目標(biāo)物體的大小都不敏感。曾接賢[15]等人提出一種改進(jìn)的K-均值聚類(lèi)方法,在HSV顏色空間中,用K-均值聚類(lèi)算法對(duì)H和V兩個(gè)分量進(jìn)行聚類(lèi),并根據(jù)圖像各個(gè)分量的直方圖特點(diǎn)來(lái)選取分類(lèi)數(shù)目和初始聚類(lèi)中心。
聚類(lèi)時(shí)每個(gè)顏色區(qū)域的顏色很多,如果只用中心顏色來(lái)代替的話(huà),不能反映真實(shí)的顏色分布情況。而且聚類(lèi)是對(duì)顏色的剛性量化,容易在量化邊界上出現(xiàn)顏色劃分的和人眼的感知不一致的情況,即感知上相同的顏色被劃分到不同的量化區(qū)域,而感知上不同的顏色卻被劃分在同一區(qū)域。基于上述原因,方珍紅[16]等人提出了一種基于聚類(lèi)的加權(quán)顏色特征的算法,該算法在模糊C均值聚類(lèi)(FCM)方法上加以改進(jìn)后對(duì)HSV空間上的顏色進(jìn)行聚類(lèi),然后計(jì)算加權(quán)的主顏色直方圖。
傳統(tǒng)的顏色直方圖是給出圖像顏色的整體描述,每種顏色都是同樣的權(quán)重。然而顏色被聚類(lèi)后,顏色被量化后的區(qū)域中所包含的顏色比較多,而且每種顏色對(duì)視覺(jué)感知的重要程度也不一樣,所以方珍紅等人提出加入隸屬度權(quán)重參數(shù),即按照FCM聚類(lèi)后的類(lèi)中心為每個(gè)顏色區(qū)域的主顏色,其他顏色按照隸屬度uik的權(quán)重進(jìn)行頻數(shù)統(tǒng)計(jì),可以得到主顏色直方圖,
定義如下:
式中,uik為顏色i對(duì)k類(lèi)中心的隸屬度函數(shù),ni為第k個(gè)顏色區(qū)域內(nèi)顏色i的像素個(gè)數(shù),m為第k個(gè)顏色區(qū)域內(nèi)的顏色個(gè)數(shù)。實(shí)驗(yàn)表明,利用主顏色的直方圖比傳統(tǒng)的顏色直方圖有更好的檢索效果,同時(shí)不同距離顏色的權(quán)重不同也較為精確地表達(dá)和描述了圖像。
目前對(duì)于圖像顏色特征的提取還沒(méi)有哪種方法可以對(duì)所有類(lèi)型圖像都能達(dá)到最好的效果,所以有時(shí)候要針對(duì)不同類(lèi)型的圖像使用不同的提取方法。
基于顏色的圖像檢索系統(tǒng)一直是研究領(lǐng)域的熱門(mén),經(jīng)過(guò)多年的研究已經(jīng)有了一定的成果,本文簡(jiǎn)單的介紹了目前在圖像檢索系統(tǒng)中常用的顏色空間、顏色特征和幾種顏色特征的提取方法,并對(duì)在直方圖的基礎(chǔ)上做各種改進(jìn)的顏色特征的提取方法,進(jìn)行了分析。但是基于底層特征進(jìn)行檢索并不能得到很好的檢索效果,今后的研究方向應(yīng)該是底層特征和高層語(yǔ)義相結(jié)合并且加入相關(guān)反饋系統(tǒng)。
[1]Flicker M,Sawhney H,Niblack W.et al.Query by image and video content:The QBICsystem[J].IEEE computers,1995,28:23-32.
[2]Smith J R,Chang S.VisualSEEK:A fully automated content-based image query system[C].ACM multimedia,1997:87-98.
[3]韓軒.基于顏色和空間特征的圖像檢索技術(shù)研究[D].廈門(mén):廈門(mén)大學(xué),2008.
[4]Stricker M,Orengo M.Similarity of color images[C].SPIE Storage and Retrieval for Image and Video Databases III,1995:381-392.
[5]Stricker M ,Dimai A.Color indexing with weak spatial constraints[C].SPIE Proceedings 2670,1996:29-40.
[6]趙瑩.基于顏色分布的圖像檢索系統(tǒng)[J].微計(jì)算機(jī)信息,2007,23(6-3):266-268.
[7]周兵,沈鈞毅,彭勤科.一種新的基于對(duì)稱(chēng)色彩空域特征的圖像匹配方法[J].小型微計(jì)算機(jī),2005,26(1):147-150.
[8]余芳.基于顏色特征的圖像檢索技術(shù)研究[D].北京:中國(guó)石油大學(xué),2007.
[9]Smith J R,Chang S F.Tools and Techniques for Color Image Retrieval[C].SPIE ,1996,(2670):426-437.
[10]Zhang Lei,Lin Fuzong,Zhang Bo.A CBIR Method Based on Color-Spatial Feature[C].Proceed ings of the IEEE Region the 10th Conference,1999:166-169.
[11]曹莉華,柳偉,李國(guó)輝.基于多種主色調(diào)的圖像檢索算法研究與實(shí)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,1999,36(1):96-100.
[12]李凡.模糊信息處理系統(tǒng)[M].北京:北京大學(xué)出版社,1998:85-136.
[13]汪子強(qiáng),郭磊.基于模糊顏色量化的圖像檢索[J].計(jì)算機(jī)應(yīng)用研究,2005,22(9):162-164.
[14]李有峰.基于顏色和紋理特征的圖像檢索相關(guān)算法研究[D].成都:電子科技大學(xué),2009.
[15]曾接賢,王軍婷,符祥.K均值聚類(lèi)分割的多特征圖像檢索方法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(2):226-230.
[16]方珍紅,謝明元,楊玲.一種新的基于加權(quán)顏色特征的圖像檢索算法[J].激光與紅外,2013,43(4):471-474.
中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版)2013年5期