宋志平,朱亞俐,吾爾尼沙·買買提,庫爾班·吾布力,2*
(1. 新疆大學信息科學與工程學院,新疆 烏魯木齊 830046;2. 新疆多語種信息技術重點實驗室,新疆 烏魯木齊 830046)
伴隨科學技術的普及與發(fā)展,數(shù)字圖像已成為一種應用廣泛的媒介,是一種獨立性較強的數(shù)據(jù)載體。怎樣有效組織、管理及檢索大規(guī)模的圖像信息,同時從海量數(shù)字圖像內準確無誤地檢索出相似圖像,逐漸成為現(xiàn)階段亟待解決的重要問題[1]。語義與文本條件下的圖像檢索為常用的檢索模式,但針對復雜圖像而言,此類檢索模式可靠性較低。由此衍生出圖像二次檢索方式[2],讓相似圖像檢索變得更為輕松且檢索精度也得到大幅提高。
面向圖像檢索問題,彭騰飛等[3]提出一種端到端的深度哈希算法。在卷積神經(jīng)網(wǎng)絡中嵌入空間金字塔池化和冪均值變換明確圖像多種尺度范圍數(shù)據(jù),在全連接層之間引入哈希層,使用漢明距離計算圖像對相似性,建立損失函數(shù)來提升圖像檢索性能。但此方法計算過程中沒有采取圖像預處理,導致圖像相似性結果與實際結果出入較大。陳宏宇等[4]擇取深度卷積網(wǎng)絡全卷積層張量當作深度特征,使用逆文檔頻率加權深度特征獲得顯著圖像,采用主成分分析獲取圖像全局特征,實現(xiàn)圖像距離度量檢索。該方法需要計算的變量較多,運算耗時較長,沒有充分考慮真實場景下算法性能的合理性。
總結以上內容,提出一種基于灰度直方圖的圖像關鍵特征二次檢索算法。首先預處理圖像,利用灰度直方圖計算圖像紋理相似度,完成圖像關鍵特征一次檢索,將相似度值作為二次檢索臨界值,并使用Canny算子得到準確的相似圖像檢索結果。
根據(jù)圖像性質,融合灰度直方圖紋理特征檢索與形態(tài)匹配檢索兩種策略,設計基于灰度直方圖的圖像關鍵特征二次檢索算法。所提方法二次檢索步驟中,將圖像紋理關鍵特征當作第一次檢索,推算圖像灰度直方圖來獲取并統(tǒng)計紋理特征,計算圖像相似度,完成圖像關鍵特征初期篩查,把第一次檢索結果輸入至第二次檢索中,利用投影相似度剔除第一次檢索中的干擾[5],在第一次檢索前提下,最大限度增強圖像關鍵特征二次檢索正確率。將算法具體步驟如圖1。
圖1 圖像關鍵特征二次檢索步驟
為消除圖像背景及系統(tǒng)噪聲干擾,提高后續(xù)圖像關鍵特征檢索準確率,預先對圖像預處理。傳統(tǒng)高通濾波方法可以很好地控制面積較大的低頻背景信息,加強目標邊緣特征清晰度,但不能過濾掉獨立的高頻噪聲點,還會減少目標中心點灰度值。中值濾波與高通濾波存在較大差異,高通濾波方法可以剔除高頻噪聲,保存完整的目標特征,但對低頻背景信息的處理欠佳。在互補原則前提下,設計一種高通中值濾波方法。首先利用低通濾波模式對輸入圖像采取背景預測,然后利用中值濾波,將某像素點灰度值替換成相鄰像素點灰度中值[6],圖像預處理過程如圖2所示,并將輸出圖像表示成式(1)。
Y(i,j)=X(i,j)+Med(i,j)-2Lp(i,j)
(1)
其中,Y(i,j)代表輸出圖像,X(i,j)為輸入圖像,Med(i,j)是中值濾波圖像,Lp(i,j)表示低通濾波預測背景圖像。
圖2 高通中值濾波算法流程
中值濾波與低通濾波圖像的推導過程分別為
Med(i,j)=mmedianS{X(i,j)}
(2)
(3)
其中,S表示濾波窗口,R是濾波半徑。
完成預處理后,為進一步提高圖像關鍵特征二次檢索準確率,就要獲取圖像關鍵特征灰度值分布狀態(tài),明確圖像特征紋理信息?;叶戎狈綀D表示灰度級函數(shù),是圖像位于此灰度級的像素數(shù)目。直方圖曲線內的橫軸表示圖像像素灰度級,縱軸是產(chǎn)生灰度級的幾率。
圖像關鍵紋理特征中包含結構紋理與統(tǒng)計紋理,由于結構紋理對物體幾何框架的需求較為嚴格,約束了其大量應用,當前使用統(tǒng)計紋理方式較多,其中灰度共生矩陣就是使用次數(shù)最多的統(tǒng)計紋理計算方法。
灰度共生矩陣方法是根據(jù)圖像灰度值空間分布來描述其紋理狀態(tài),在評估圖像二階組合條件概率密度函數(shù)前提下得到的統(tǒng)計策略。此方法可描述具有某類關聯(lián)的兩個像素之間的頻率關系。將歸一化灰度共生矩陣記作
(4)
其中,d表示步長,i、j均為灰度值,θ表示方向。
運用灰度共生矩陣能獲得能量、熵、慣性矩與局部穩(wěn)定性四個量化的紋理元素[7],能量、熵、慣性矩與局部穩(wěn)定性依次記作
(5)
(6)
(7)
(8)
灰度變換表示按照某類條件憑借相應變換關聯(lián)逐點變換初始圖像各像素灰度值的方式。例如為凸顯圖像細節(jié)部分,把圖像灰度級全部區(qū)域或其中某段(a,b)拓展為(a*,b*)。若輸入圖像灰度級為z,通過灰度變換后輸出圖像相對的灰度級為z*,需要將z與z*均安置于圖像灰度范圍中,將處在灰度區(qū)間[a,b]中的像素點映射至[z1,zk]區(qū)間,則組建灰度變換函數(shù)表達式
(9)
在式(9)的灰度變換函數(shù)中,其曲線形態(tài)映射關聯(lián)就是把[a,b]區(qū)間拓展至[z1,zk]。假設圖像絕大部分像素灰度值分布于[a,b],較多部分灰度值范圍超過此區(qū)間。
利用圖像灰度變換計算,圖像關鍵特征的灰度形態(tài)更為明顯,為接下來使用灰度直方圖完成深入的特征提取工作,解決了圖像灰度特征不明顯這一重要問題[8]。圖像完成灰度變換之后,統(tǒng)計圖像灰度值,按照統(tǒng)計結果獲得圖像直方圖,然后計算灰度特征矢量,并將輸入圖像采取向量化手段。
將灰度直方圖運算過程記作
(10)
式中,C為灰度級類別個數(shù),n代表圖像擁有灰度級i像素的數(shù)量,D為圖像全部像素數(shù)量。
設置目標圖像灰度直方圖中包含N維向量,按照樣本圖特征向量和數(shù)據(jù)庫圖像特征向量,在規(guī)定的相似度內提取全部圖像關鍵特征。
將圖像灰度區(qū)間拉伸至全局灰度區(qū)間,完成灰度拉伸圖像的灰度增強[9]。將全部灰度空間劃分成30個灰度,灰度圖像像素點為E,E∈(0,255),劃分后的圖像灰度值為V,V∈(0,32)。由此,把灰度值劃分過程定義為
V=[E/8]
(11)
利用式(11)推導過程,整合出每個灰度出現(xiàn)的頻率。將其具體計算過程記作
(12)
其中,count(vk)表示劃分后灰度值vk的像素點個數(shù),N1為圖像全局長度中的像素點個數(shù),N2為圖像全局寬度中的像素點個數(shù)。
在本文算法中,灰度直方圖是圖像關鍵特征提取中最簡便的方法,計算過程簡單,推導速率很快,符合圖像檢索過程中的旋轉、比例及位移不變性,特征提取精度較高。直方圖函數(shù)為
H(k)=Mk
(13)
式中,Mk為第k個灰度級出現(xiàn)的數(shù)量。
把圖像內的像素灰度級作為任意變量,其分布狀況表現(xiàn)出圖像全局統(tǒng)計特征,圖像關鍵紋理特征呈現(xiàn)出圖像灰度局部性特點,圖像窗口不能過大[10]。計算式(5)~式(8)的紋理特征量,得到紋理相似度公式:
(14)
紋理相似度越趨近于1,表明待檢測圖像和輸入圖像相似度越大,這樣就實現(xiàn)了基于灰度直方圖的圖像關鍵紋理特征的第一次檢索。
目標外輪廓是其本身最關鍵的形態(tài)特征,也是推算目標周長與面積等變量的基礎。針對自然界的物體形態(tài)特征而言,人眼可以輕易地捕獲與識別,但使用計算機要完成此項任務則難度很高?,F(xiàn)階段,獲取研究目標形態(tài)特征的手段包括基于區(qū)域與基于邊界兩種方法?;趨^(qū)域方法利用圖像分割、挖空內部點等策略得到物體外部輪廓,但此種方式過多依賴圖像分割結果,圖像分割是圖像處理中最難處理的問題之一,因此該方法實用性較差?;谶吔绶椒幢隳苁褂眠吘壧崛∷阕拥玫轿矬w外部輪廓,但提取結果沒有持續(xù)性[11],且一般會具有物體內部細節(jié)邊緣與背景噪聲干擾,物體輪廓分析中的噪聲數(shù)量較多,增添了圖像關鍵特征二次檢索工作量。
本文按照待檢測圖像內的目標物體處于圖像中間且物體周邊通常為低灰度背景的特征,設計一種基于Canny算子的圖像關鍵特征二次檢索算法。
算法的核心步驟為:
第一,利用Canny算子計算圖像邊緣信息,統(tǒng)計各段邊緣長短,設置臨界值剔除微小邊緣數(shù)據(jù);
第二,針對各行圖像信息,依次實施掃描,把掃描獲得的灰度值邊緣橫坐標描述為x1[i]、x2[i],lHeight-1表示圖像高度。把圖像處于垂直軸內的投影Vproject[i]為
i=0,1,2,…,lHeight-1
(15)
第三,關于各列圖像信息,使用和上個步驟相似手段,按照掃描結果獲得邊緣點縱坐標y1[i]、y2[i],lWidth-1表示圖像寬度,推算圖像處于水平軸內的投影Hproject[i]
i=0,1,2,…,lWidth-1
(16)
對圖像數(shù)據(jù)庫內每一幅圖像均使用式(15)與式(16)計算兩個投影值,同時保存在圖像特征庫內。對輸入圖像使用相同模式推導[12],將圖像關鍵特征形態(tài)相似度表示成
(17)
(18)
SimShape(Q,G)=wv×SimShapeV(Q,G)+wh×SimShapeH(Q,G)
(19)
式中,SimShapeV(Q,G)與SimShapeH(Q,G)依次表示垂直、水平投影的相關指數(shù),VprojectQ、HprojectQ是輸入圖像與待檢測圖像外部輪廓垂直與水平投影,SimShape(Q,G)代表兩個位置上合成的形態(tài)相似度,wv、wh是垂直軸與水平軸的投影權重。
形態(tài)相似度SimShape越趨近1,證明輸入圖像與待檢測圖像的形態(tài)越相近。將基于灰度直方圖的圖像紋理特征檢索結果設置成形態(tài)相似度臨界值,通常臨界值的取值范圍是0.6~0.8。以此實現(xiàn)圖像關鍵特征的二次檢索目標,完成快速、準確的圖像關鍵特征提取與篩選,讓用戶獲得更加精準的相似圖像識別結果。
從Corel圖像數(shù)據(jù)庫內挑選5種不同類型的550幅圖像,每類圖像的個數(shù)是110幅,包含風景、事物、動物等,對本文方法及文獻[3]方法、[4]方法進行仿真。在圖像檢索性能評估中,評估指標包含查準率、查全率、輸出格式等,本文實驗著重前兩個參數(shù)。查準率表示檢索時,檢索系統(tǒng)得到相似圖像和檢索圖像總數(shù)量的比值,記作
(20)
查全率表示檢索時,檢索的相似圖像和數(shù)據(jù)庫內全部相似圖像個數(shù)的比值,記作:
(21)
圖3為三種方法海景類圖像二次檢索結果,比較返回的前5幅圖像檢索結果,每幅圖左上角圖像為示例圖。
圖3 三種方法對海景圖像的檢索結果對比
從圖3可知,文獻[3]中有4幅圖為海景圖像,一幅巖石圖像,查準率為80%;文獻[4]中有三幅海景圖像,另外兩幅圖像分別是街道與花卉,查準率為60%;本文方法5幅圖像均為海景圖像,查準率為100%。實驗結果證實,本文方法查準率顯著優(yōu)于兩種文獻方法,這是因為所提方法使用灰度直方圖得到圖像關鍵特征灰度值分布狀態(tài),掌握圖像特征紋理數(shù)據(jù),在第一次檢索中最大限度提升待檢測圖像和輸入圖像相似度,為圖像二次檢索提供有效幫助。
在數(shù)據(jù)庫內檢索更多不同類型圖像,將圖像類型增加到7種,對三種方法進行大量的圖像二次檢索實驗,統(tǒng)計其檢索平均查全率,結果如圖4所示。
圖4 圖像二次檢索平均查全率對比
可以看到,在不同類型的圖像關鍵特征二次檢索中,本文方法查全率均不同程度地高于文獻[3]與文獻[4],表明檢索查準率和查全率為正比例關聯(lián),即查準率越大,查全率也越大。由此也證明本文方法擁有優(yōu)秀的圖像關鍵特征二次檢索性能,為準確查找相似圖像發(fā)揮應有作用。
針對海量大數(shù)據(jù)中的相似圖像檢索問題,提出基于灰度直方圖的圖像關鍵特征二次檢索算法。所提算法應用過程簡潔,與傳統(tǒng)方法相比,可以最大限度提升相似圖像檢索精準度。伴隨圖像特征二次檢索研究的不斷深入,接下來的研究目標將轉向二次檢索系統(tǒng)的構建,為圖像檢索領域拓寬新的研究方向。