孫晉
(遼寧師范大學 計算機與信息技術(shù)學院,遼寧 大連 116029)
隨著多媒體技術(shù)的發(fā)展及互聯(lián)網(wǎng)的不斷普及,數(shù)字圖像作為一種內(nèi)容豐富、表現(xiàn)力強的信息儲存形式被大量應用,而海量的數(shù)字圖像也因此產(chǎn)生。如何快速準確地從數(shù)據(jù)庫中找到用戶所需要的圖像逐漸成為一個難題并被研究者重視。傳統(tǒng)的基于文本的圖像檢索技術(shù)主要依靠人工標記,在大量消耗人力資源的同時,還存在用戶對圖像內(nèi)容的理解不同,標記的信息不全面等問題。因此,基于內(nèi)容的圖像檢索技術(shù)隨之產(chǎn)生。該方法利用圖像的視覺特征(如顏色、紋理等底層特征)進行檢索[1],通過計算這些底層特征之間的相似度作為圖像間的相似性,得到檢索結(jié)果。相對于人工標記,這種方法所提取的特征更具有通用性,從而有效解決了基于文本的圖像檢索技術(shù)的不足。
在基于內(nèi)容的圖像檢索技術(shù)中,顏色作為圖像最直觀的特征之一,多年以來被許多專家學者所重視,并提出了很多基于顏色特征的圖像檢索方法,如:SWAIN M等[2]提出的顏色直方圖檢索算法,依據(jù)整幅圖像的顏色直方圖進行檢索,但存在著丟失顏色分布信息等問題;LIN C H等[3]提出了基于K均值聚類算法的檢索方法;Tang Zhenjun等[4]利用了圖像哈希函數(shù)提取顏色特征;Xia Shixiong等[5]提出描述在每一環(huán)形子集中相似的散布信息的差異,利用這些環(huán)形子集的差異建立差異顏色直方圖;YAP P J[6]等利用Legendre矩提取圖像的彩色信息并進行檢索,但Legendre矩的圖像描述能力不強,實際檢索效果不夠理想。
本文以圓諧-傅里葉矩理論為基礎(chǔ),提出一種基于對立顏色空間和圓諧-傅里葉矩的圖像檢索算法。首先將彩色圖像由RGB顏色空間轉(zhuǎn)換到對立顏色空間,然后在此基礎(chǔ)上計算圖像函數(shù)的圓諧-傅里葉矩,并將其作為圖像顏色特征進行檢索。
RGB顏色空間是圖像處理中最常見的顏色空間,但RGB顏色空間在反映顏色色度的同時,也反映出了亮度。顯然,對于彩色圖像的檢索,應當盡量關(guān)注顏色本身的色度信息,不希望光照強度等因素對顏色產(chǎn)生影響,所以,只需要考慮R、G、B三者之間的比例關(guān)系[6]:
則b=1-r-g。因此,描述圖像的色彩信息僅需(r,g)即可滿足。由“對立顏色理論”[7]可知:顏色空間是一種三維空間,由黑-白、紅-綠和黃-藍 3個雙極坐標軸表示,與RGB顏色空間相比,對立顏色空間的色彩編碼更均勻。對此,本文將RGB顏色空間轉(zhuǎn)換為二維對立顏色空間:
其中,-1≤rg≤1,-1≤yb≤1。
圓諧-傅里葉矩[8]不僅對圖像描述能力強,多項式簡單,計算方便,而且具有良好的旋轉(zhuǎn)、縮放等幾何不變性。圓諧-傅里葉矩算法具體描述如下。在極坐標系(r,θ)中,定義函數(shù)系:
其中,*表示共軛,δnmkl是 Kronecker符號,c為常數(shù)。極坐標系中,圖像 f(r,θ)按函數(shù) Pnm(r,θ)做正交分解:
其中,
定義 Φnm為圖像 f(r,θ)的圓諧-傅里葉矩。
對于一幅M×N的彩色圖像I,在RGB顏色空間中表示為:
其中,i、j為每個像素點的坐標,i=0,1,2,…,M-1;j=0,1,2,…,N-1。將其轉(zhuǎn)換到對立顏色空間,可表示為:
其中,i=0,1,2,…,M-1;j=0,1,2,…,N-1。 以極坐標表示:
代入式(6),即可求得圖像I在對立顏色空間中的圓諧-傅里葉矩。由于低階圓諧-傅里葉矩包含圖像的主要信息[9],同時考慮到圖像檢索方法在實際應用中對時間復雜度的要求,本文算法選取了5個低階矩作為圖像的顏色特征進行檢索。
假設(shè)圖像庫中的圖像為P,被檢索圖像為Q,圖像P顏色特征為CP=(,,,,),圖像 Q的顏色特征為 CQ=(,,,,),則圖像 P、Q間的相似度為:
為驗證本文算法的有效性,進行仿真檢索實驗。實驗過程中采用的軟硬件環(huán)境為:Intel Xeon E5-1603 2.8 GHz處理器,4 GB內(nèi)存,Windows 7 64位操作系統(tǒng)和 MATLAB 2011b。實驗選用了Corel圖像庫,該圖像數(shù)據(jù)庫包括人物、建筑、公交車、鮮花、馬、恐龍等各類圖片 3 000張(包含30個種類,每個種類包含100幅相關(guān)圖片)。圖1給出了全局顏色直方圖算法[2]、參考文獻[6]方法以及本文算法的檢索結(jié)果,其中第1幅圖像為待檢圖像,分別計算待檢圖像與圖像庫中圖像的相似度,并輸出相似程度最高的前20幅圖。
圖1 仿真結(jié)果
表1 3種檢索方法平均查全率對比
表2 3種檢索方法平均查準率對比
為進一步驗證算法的有效性,還計算了全局顏色直方圖算法、參考文獻[6]方法以及本文算法的查全率和查準率。表1和表2分別給出了3種方法的仿真實驗結(jié)果。實驗中,在Corel圖像庫中選取10類圖像,每類隨機抽取10幅作為示例圖像,共構(gòu)成100次查詢,每次查詢選取前20幅最相似的圖像作為檢索結(jié)果。對每類圖像計算其查詢結(jié)果的查準率平均值、查全率平均值。基于內(nèi)容的圖像檢索是正處于發(fā)展過程中的一門全新、跨學科、綜合性高的新技術(shù),其研究與發(fā)展涉及眾多學科分支。本文以圓諧-傅里葉矩理論為基礎(chǔ),在對立顏色空間中提取圖像的顏色特征,通過比較圖像之間的相似度進行檢索。仿真實驗表明,該方法能夠準確和高效地查找出用戶所需內(nèi)容的彩色圖像,在圖像檢索領(lǐng)域有較廣闊的應用前景。下一步的工作將在此基礎(chǔ)上結(jié)合圖像的紋理、形狀等信息,更進一步提高檢索精度,得到更加理想的檢索結(jié)果。
[1]REDDY P V N,SATYA PRASAD K.Color and texture features for content based image retrieval[J].International Journal of Computer Technology and Applications, 2011,2(4):1016-1020.
[2]SWAIN M J, BALLARD D H.Colorindexing[J].International Journal of Computer Vision,1991,7(1):11-32.
[3]LIN C H, HUANG D C, CHAN Y K.Fast color-spatial feature based image retrieval methods[J].Expert System with Applications:An International Journal, 2011,38 (9):11412-11420.
[4]Tang Zhenjun, Zhang Xianquan, Dai Xuan, et al.Robust image hash function using local color features[J].AEUInternationalJournalofElectronicsand Communications,2013,67:717-722.
[5]Xia Shixiong, Zhou Hongbin, Zhou Yong.Divergence color histogram forcontent-based image retrieval[C].Applied Mechanics and Materials, 2011, 50: 639-643.
[6]YAP P T,PARAMESRAN R.Content-based image retrieval using Legendre chromaticity distribution moments[J].IEEE Proceedings-Vision, Image and Signal Processing, 2006,153(1):17-24.
[7]BERENS J, FINLAYSON G D, HUBEL P M.A statistical image of color space[C].Proceedings of International Conference on Image Processing and Its Application,1999,1:348-352.
[8]Ren Haiping, Ping Ziliang, Bo Wurigen, et al.Multidistortion invariant image recognition with the radial harmonic Fourier moments[J].Journal of the Optical Society of America A-optics Image Science and Vision, 2003,20(4):63l-637.
[9]秦娟,李峰,向凌云,等.采用圓諧-傅里葉矩的圖像區(qū)域復制粘貼篡改檢測[J].中國圖象圖形學報,2013,18(8):919-923.