潘紅艷
(浙江工商職業(yè)技術學院,浙江 寧波 315012)
圖像是一種直觀表達信息的媒介。隨著互聯(lián)網(wǎng)技術的發(fā)展和各種購物平臺的興起,網(wǎng)絡數(shù)據(jù)庫中的圖像數(shù)據(jù)量呈指數(shù)級增長。面對繁雜的海量圖像數(shù)據(jù),高效的圖像檢索系統(tǒng)應運而生。利用該系統(tǒng),人們可以快速地在海量圖像數(shù)據(jù)中找到與自己需求相匹配的圖像。
在圖像檢索中,最常用的是基于內(nèi)容的圖像檢索?;趦?nèi)容的圖像檢索是基于圖像底層特征進行的檢索。圖像的底層特征有顏色特征、紋理特征和形狀特征。由于圖像本身的復雜性,很難用一種特征去描述千差萬別的圖像[2]?;趩我粓D像特征的檢索系統(tǒng),檢索準確率普遍不高。越來越多的研究者嘗試將多種圖像特征采用一定的融合策略進行圖像檢索,以提高檢索系統(tǒng)的查全率和查準率。
角點指的是圖像中灰度值在水平和垂直方向變化都顯著的一類點,是圖像的局部特征。將角點進一步處理,可以形成圖像的興趣區(qū)域。常用的角點檢測算法有Harris算法、Susan算法等[1]。本文采用Harris算法獲取圖像的興趣區(qū)域。數(shù)學模型如下:
w(x,y)為窗口函數(shù),(u,v)是窗口偏移量,(x, y)為窗口內(nèi)所對應的圖像像素的位置。
當水平方向和垂直方向變化不明顯時,R(u,v)≈0,此時該點不是角點(興趣點),否則為角點。角點獲取后,根據(jù)所有角點的位置,確定一個能包含所有角點的最小矩形,即興趣區(qū)域。角點檢測結果如圖1所示(白色點為檢測出的角點)。
顏色特征是圖像檢索系統(tǒng)中最常用的一個特征,是一個全局特征,魯棒性較好。常用的顏色特征有顏色直方圖、顏色相關圖、顏色矩等。
圖1 角點檢測
(1)灰度化圖像。利用公式I(i,j)=(R+G+B)/3,求出像素點I(i,j)的灰度值,從而將彩色圖像灰度化。
(2)對像素值進行聚類。圖像的顏色特征比較復雜,如果直接獲取圖像的直方圖,會導致形成的特征向量維度太大,影響計算速度。為了降低特征向量的維度,利用K-means算法對興趣區(qū)域內(nèi)的灰度像素值進行聚類。
(3)提取灰度累積直方圖。顏色直方圖表示的是圖像灰度值的一種統(tǒng)計信息,具有旋轉不變、縮放不變等穩(wěn)定特征。為了避免顏色直方圖的零值問題,本文采用灰度累積直方圖獲取圖像的顏色特征。
L為圖像的灰度級數(shù),ni為圖像中灰度級為i的像素個數(shù)。
紋理特征反映的是圖像內(nèi)容或顏色的某種變化,是一種統(tǒng)計特征,所以抗噪能力比較強。常用的紋理特征提取方法有灰度共生矩陣、傅里葉變換等?;叶裙采仃囉捎趯崿F(xiàn)簡單、特征提取速度快等優(yōu)點,成為紋理特征提取中經(jīng)常被采用的方法。
本文采用灰度共生矩陣的方法提取圖像的紋理特征,計算時灰度級取16級,在4個方向上(0°,45°,90°,135°)分別計算能量、熵、慣性矩、相關度4個紋理特征,然后分別計算4個方向上的均值μ和標準差σ,將其重新組合,得到8維紋理特征向量T=[μ1,μ2,μ3,μ4,σ1,σ2,σ3,σ4]。
為了減少不同特征分量對檢索結果的影響,在進行相似度計算之前對特征分量進行歸一化處理。假設圖像數(shù)據(jù)庫中有M幅圖像,提取的特征向量有N維,形成M×N的特征矩陣VM×N。對特征矩陣中的每一個元素vi,j(表示第i個圖像的第j個特征),利用0均值標準化方法進行歸一化處理,如式3所示。
在提取興趣區(qū)域中的顏色特征和紋理特征,并進行歸一化處理后,形成顏色特征矩陣CM×N和紋理特征矩陣TM×N。
(1)將待檢索圖像的顏色特征向量與CM×N中的向量進行相似度計算(利用Euclidean距離),得到相似度為Ci(i=1……M)[3]。
(2)將待檢索圖像的紋理特征向量與TM×N中的向量進行相似度計算(利用Euclidean距離),得到相似度為Ti(i=1……M)。
(3)將Ci和Ti利用公式Sim(Q,Pi)=WcCi+WTTiα+β=1進行融合。
α和β的取值大小對結果有著至關重要的影響。圖像是千差萬別的,如果把α和β值固定,也就是對所有圖像都應用相同的權值,是不符合實際情況的。本文在確定α和β值時,基于這樣的假設:如果待檢索圖像與圖像數(shù)據(jù)庫中的每一幅圖像之間的距離都相似,說明圖像對這類特征不敏感,應賦予較低的權值。
為了驗證本文提出的基于角點的動態(tài)加權融合檢索技術[4]的有效性,自建小型圖像數(shù)據(jù)庫,數(shù)據(jù)庫中包括自然風光、昆蟲、魚、建筑、鮮花、汽車6類圖像,每類圖像200幅,共有圖像1 200幅。實驗環(huán)境為Matlab2016b,Win7操作系統(tǒng)。
本文提出的圖像檢索方法查準率和查全率如圖2—3所示。
圖2 圖像檢索查準率
圖3 圖像檢索查全率
多特征融合的圖像檢索方法得到越來越多研究者的重視。利用哪些圖像特征進行融合,以及采用什么樣的融合策略是提高檢索系統(tǒng)效率的關鍵。本文提出的基于角點的動態(tài)加權融合方法,一定程度上解決了融合時固定權重帶來的問題。在進行特征提取之前,先利用Harris算法檢測角點,確定圖像的主體興趣區(qū)域,減少了圖像中背景信息對檢索結果的干擾,提高了檢索系統(tǒng)的查全率和查準率。