呂英麗 徐小君 葛 宇
(河北建筑工程學(xué)院,河北 張家口075024)
內(nèi)容的多媒體信息檢索研究伴隨著信息時(shí)代的到來而展開.隨著多媒體技術(shù)及網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,各行各業(yè)對(duì)圖像的使用越來越廣泛,使得基于web的圖像檢索系統(tǒng)近年來迅速發(fā)展,但隨著移動(dòng)設(shè)備的應(yīng)用越來越廣泛,在移動(dòng)平臺(tái)上的增值服務(wù)中,人們創(chuàng)建和共享的信息也早已超出了文字和語音的范圍.特別是圖像內(nèi)容的認(rèn)識(shí)以及檢索的應(yīng)用需求非常強(qiáng)烈.正是在這樣的背景下,本文將比較成熟且具有良好分類效果的支持向量機(jī)(Support Vector Machine)SVM算法應(yīng)用于內(nèi)容的移動(dòng)平臺(tái)上的圖像檢索展開研究和設(shè)計(jì).
本文設(shè)計(jì)的移動(dòng)終端上的圖像檢索系統(tǒng)基于C/S(客戶端/服務(wù)器)架構(gòu).由客戶端即移動(dòng)設(shè)備,服務(wù)器以及數(shù)據(jù)庫(kù)組成.考慮到移動(dòng)設(shè)備的性能限制,在計(jì)算分配上,客戶端只負(fù)責(zé)用戶查詢交互,而后續(xù)的圖像處理和其它模塊在功能相對(duì)強(qiáng)大的服務(wù)器上進(jìn)行.系統(tǒng)框圖如圖1所示.
具體實(shí)現(xiàn)流程如下:移動(dòng)設(shè)備用戶發(fā)送一個(gè)請(qǐng)求(手機(jī)拍一幅圖片)到移動(dòng)設(shè)備,移動(dòng)設(shè)備將圖片發(fā)送到服務(wù)器端.服務(wù)器端進(jìn)行預(yù)處理,去除噪聲.提取圖像的顏色特征,紋理特征和形狀特征.將三種特征構(gòu)成的特征向量送入svm分類器,經(jīng)由分類器與數(shù)據(jù)庫(kù)中的圖像庫(kù)及其特征索引進(jìn)行比對(duì)返回分類結(jié)果.將分類結(jié)果以圖像內(nèi)容的形式返回給移動(dòng)設(shè)備,從而將結(jié)果返回給移動(dòng)設(shè)備用戶,用戶收到查詢圖片的相關(guān)信息對(duì)要查詢內(nèi)容有全面的認(rèn)識(shí).
圖1 圖像檢索系統(tǒng)框圖
顏色特征是在圖像檢索中應(yīng)用最為廣泛的視覺特征,主要原因在于顏色往往和圖像中所包含的物體或場(chǎng)景十分相關(guān).與其他的視覺特征相比,顏色特征對(duì)圖像本身的尺寸、方向、視角的依賴性較小,從而具有較高的魯棒性.由于在HSV空間中,人眼視覺的效果比較能夠反映圖像之間主要顏色的差異性.因此,本文主要選取了 HSV 空間來研究.HSV 空間中的各分量的范圍:h∈[0-360]、s∈[0-1]、v∈[0-1].但是考慮各個(gè)分量的取值范圍很大,而人眼不可能有那么高的分辨率,因此有必要對(duì)HSV空間中的各分量進(jìn)行適當(dāng)?shù)牧炕笥?jì)算直方圖,也可減少計(jì)算量,提高效率.
紋理是所有事物表面固有的一種特性,也是圖像檢索中一個(gè)重要而又難以描述的特性.圖像可以看成是不同紋理區(qū)域的組合,紋理通常定義為圖像的某種局部性質(zhì),或是對(duì)局部區(qū)域中像素之間關(guān)系的一種度量.紋理特征可用來對(duì)圖像中的空間信息進(jìn)行一定程度的定量描述.描述方法包括統(tǒng)計(jì)法,頻譜法和結(jié)構(gòu)法,這些方法也常結(jié)合使用.一般認(rèn)為紋理就是紋理元素有規(guī)律地排列組合,而把相互接近、相互編織具有重復(fù)性的區(qū)域看作為紋理元素.統(tǒng)計(jì)法紋理描述符包括灰度直方圖的各階矩、基于共生矩陣的描述符、基于馬爾可夫隨機(jī)場(chǎng)紋理分析等.頻譜法紋理描述的性能較好,有傅里葉變換,DTC變換,Gabor變換,小波變換等.經(jīng)過變換后,圖像中灰度周期變化或近周期變化信息可以通過頻率特性來描述.結(jié)構(gòu)法紋理描述包括圖像的對(duì)比度、粗細(xì)度、方向性、重復(fù)性和復(fù)雜性等.這種描述方法通常將計(jì)算特征與語義聯(lián)系起來,有利于高層語義的獲取.
目前描述形狀特征的方法主要有邊界特征法、傅里葉形狀描述符法、幾何參數(shù)法和形狀不變矩法等.邊界特征法該方法通過對(duì)邊界特征的描述來獲取圖像的形狀參數(shù).其中Hough變換檢測(cè)平行直線方法和邊界方向直方圖方法是經(jīng)典方法.Hough變換是利用圖像全局特性而將邊緣像素連接起來組成區(qū)域封閉邊界的一種方法,其基本思想是點(diǎn)—線的對(duì)偶性;邊界方向直方圖法首先微分圖像求得圖像邊緣,然后做出關(guān)于邊緣大小和方向的直方圖,通常的方法是構(gòu)造圖像灰度梯度方向矩陣.
SVM算法是在統(tǒng)計(jì)學(xué)理論基礎(chǔ)之上發(fā)展起來的一種機(jī)器學(xué)習(xí)算法.SVM基于統(tǒng)計(jì)學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,它將最大化分類間隔的思想和基于核的方法結(jié)合在一起,表現(xiàn)出很好的泛化能力.SVM因其通用性和出色的分類能力被逐漸引入圖像檢索系統(tǒng)中.通過用戶對(duì)提供圖像的相關(guān)性的標(biāo)注,在特征空間尋找最優(yōu)分類面把給定的屬于兩個(gè)類別的訓(xùn)練圖像分開,把最相似類中離超平面最遠(yuǎn)的圖像作為檢索結(jié)果返回,就是SVM方法的基本思想.SVM算法過程是將前N個(gè)圖像作為訓(xùn)練樣本,由用戶標(biāo)記出正例樣本(其他的為反例樣本),作為有類別標(biāo)號(hào)的訓(xùn)練樣本由SVM進(jìn)行學(xué)習(xí),構(gòu)造出適合表示用戶查詢意圖的分類器,然后用該模型對(duì)圖像庫(kù)中的所有圖像進(jìn)行分類,即求出每幅圖像相對(duì)于分類面的距離,然后再次排序返回結(jié)果.
我們采用Windows XP+I(xiàn)IS 6.0+ASP.NET+SQL Server 2008(操作系統(tǒng)+信息服務(wù)器+開發(fā)平臺(tái)+數(shù)據(jù)庫(kù))的組合,這種選擇主要基于以下響應(yīng)速度,面向?qū)ο?,多語言支持等幾個(gè)優(yōu)點(diǎn).SVM分類工具選取svmlib,該工具使用廣泛并且性能較好.
基于內(nèi)容的移動(dòng)終端圖像檢索是目前跨圖像工程領(lǐng)域和移動(dòng)通信領(lǐng)域的研究的主要熱點(diǎn),它集合了圖像處理與分析、圖像理解、人工智能、模式識(shí)別移動(dòng)開發(fā)等內(nèi)容,新思想、新方法層出不窮.而如何根據(jù)市場(chǎng)需求確定針對(duì)性、實(shí)用性較好的方案,并將研究成果快速轉(zhuǎn)化為應(yīng)用成果,是目前需要從理論研究層面逐漸滲透到應(yīng)用層面需要解決的問題.
[1]Rafael C.Gonzalez,Richard E.Woods著,阮秋琦、阮宇智等譯,數(shù)字圖像處理第2版,電子工業(yè)出版社.2003
[2]王小云.SVM算法分析與研究.渝西學(xué)院學(xué)報(bào).2005,9
[3]周曉君,陳棟梁.基于內(nèi)容的圖像檢索技術(shù)研究,計(jì)算機(jī)與數(shù)字工程.2007,5