朱黎輝,李曉寧+,張 瑩,蒲華秀,吳純潔
(1.四川師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,四川 成都610101;2.成都中醫(yī)藥大學(xué) 中藥材標(biāo)準(zhǔn)化教育部重點(diǎn)實(shí)驗(yàn)室,四川 成都611137)
基于內(nèi)容的圖像檢索方式融合了傳統(tǒng)的模式識(shí)別技術(shù)與良好的人機(jī)交互技術(shù)[1],已運(yùn)用到多個(gè)領(lǐng)域,例如植物圖像檢索[2],商標(biāo)圖像檢索[3]等。本文結(jié)合實(shí)際項(xiàng)目,利用基于圖像內(nèi)容的檢索熱點(diǎn)技術(shù)對中藥材圖像進(jìn)行檢索。
實(shí)現(xiàn)中藥材圖像的檢索關(guān)鍵在于提取中藥材圖像的有效特征以及利用這些特征構(gòu)建合適的分類器進(jìn)行分類。中藥材圖像的形狀特征和紋理特征屬較明顯的特征,因此從這2個(gè)角度提取中藥材的圖像特征,將所提取到的2個(gè)特征進(jìn)行加權(quán)線性組合,構(gòu)成綜合特征向量。支持向量機(jī)[4](support vector machine,SVM)是 一 種 新 的 機(jī) 器 學(xué) 習(xí) 技術(shù),可作為分類器使用。吳樂南等人將SVM 用于水果分類[5],張淑雅等人使用支持向量機(jī)用于黑白老照片和彩色照片的分類[6]。SVM 分類器分類效果明顯,因此使用SVM 對中藥材圖像進(jìn)行分類。本文著力探尋圖像內(nèi)容的特征,通過設(shè)計(jì)特征降維方式,減少傳統(tǒng)形狀及紋理特征的維數(shù),反復(fù)試驗(yàn)對比分析獲得適宜的權(quán)重系數(shù),構(gòu)造多分類器解決圖像分類問題,解決中藥材圖像檢索時(shí)間長、精度低等問題。
圖1為中藥材圖像的檢索結(jié)構(gòu)。對于數(shù)據(jù)庫圖像,分別提取形狀,紋理特征,然后進(jìn)行特征的加權(quán)組合,組合特征放入特征數(shù)據(jù)庫,利用SVM 進(jìn)行訓(xùn)練;對于查詢圖像,提取同樣的加權(quán)特征構(gòu)成組合特征,查詢時(shí)對查詢圖像使用SVM 進(jìn)行預(yù)測所屬類別,通過計(jì)算歐氏距離,按距離從小到大依次返回預(yù)測類別的檢索結(jié)果圖像。
圖1 中藥材圖像檢索結(jié)構(gòu)
梯 度 方 向 直 方 圖 (histogram of oriented gradient,HOG)算法[7]廣泛用于圖像形狀特征提取。但是HOG 特征向量維數(shù)較大,不利于提取特征效率及后期分類。例如分辨率為64*128像素的圖像進(jìn)行HOG 特征提取得到特征向量為3780 維[8]。因此,本文對原始HOG 進(jìn)行了改進(jìn),改進(jìn)梯度方向直方圖 (improved histogram of oriented gradient,IHOG)基本操作步驟如圖2所示。
圖2 IHOG 處理的流程
(1)計(jì)算梯度。使用式 (1)計(jì)算水平和垂直方向的梯度
式中:Gh(x,y)——該像素點(diǎn)的水平梯度值,Gv(x,y)——該像素點(diǎn)垂直梯度值。像素點(diǎn)的梯度值 (強(qiáng)度)及梯度方向按式 (2)進(jìn)行計(jì)算
(2)分塊。將分辨率為row*col像素的圖像分為3×3塊。為使圖像特征向量統(tǒng)計(jì)時(shí)包含盡量多的信息,分塊時(shí)考慮使相鄰的區(qū)域有部分重疊。做法是設(shè)定步長,使重疊部分大小為原區(qū)域的一半,行步長設(shè)定為 row/(3+1) ;列步長為col/(3+1) 。
通過步長可嚴(yán)格設(shè)定重疊塊區(qū)域。圖3 為區(qū)域分塊。單元C1,C2,C5,C6 組成塊B1;單元C2,C6,C3,C7組成塊B2;C2、C6為重疊區(qū)域。
圖3 區(qū)域分塊
(3)計(jì)算梯度直方圖。對9個(gè)小塊分別計(jì)算梯度直方圖,做法是在每塊內(nèi)梯度方向范圍取0~180度,平分為9個(gè)方向角度。如0~20度是一個(gè)方向角度,再統(tǒng)計(jì)在這個(gè)方向角度的梯度值總和。9個(gè)方向角度得到一個(gè)9維的梯度直方圖。
(4)歸一化特征向量。為使特征向量空間對光照,陰影和邊緣變化具有魯棒性,因此對每一塊的梯度直方圖進(jìn)行歸一化。歸一化函數(shù)選取文獻(xiàn) [7]中的L1-norm 范式,即式 (3)
式中:v——未歸一化的特征向量,v1——1-norm,ε——一個(gè)很小的常數(shù),取值為0.01。
(5)組合特征向量。將9塊歸一化后的特征向量通過線性組合成一個(gè)81維的IHOG 特征向量。
原始的局部二值模式 (local binary patterns,LBP)算子[9]在每個(gè)像素點(diǎn)都得到一個(gè)LBP 編碼,直接用作紋理特征維數(shù)較大,且空間位置容易混亂從而產(chǎn)生誤差。本文在原始LBP算子上進(jìn)行了一定改進(jìn),主要采用了分塊的思想。分 塊 局 部 二 值 模 式 (block Local binary patterns,BLBP)處理的流程如圖4所示。
圖4 BLBP處理流程
(1)對待處理中藥材圖像進(jìn)行原始LBP 特征提取,得到LBP 紋理圖像。為降低LBP 的編碼模式,使用文獻(xiàn)[10]中特征維數(shù)為10 維LBPriu2(8,1)統(tǒng)一模式,它具有旋轉(zhuǎn)不變性和灰度不變性的特點(diǎn),可減小中藥材圖像由于旋轉(zhuǎn)和光照不勻帶來的影響。
(2)將降低了編碼模式的LBP 紋理圖像平均劃分為4×4的小區(qū)域。分辨率為row*col像素的圖像分塊后,每塊的行列像素變?yōu)閞ow/4 * col/4 。
(3)統(tǒng)計(jì)每塊的灰度直方圖,即計(jì)算小塊內(nèi)每個(gè)數(shù)字出現(xiàn)的頻率。因?yàn)榻档土司幋a模式,所以此步得到的是一個(gè)10維的向量。
(4)每塊執(zhí)行完直方圖統(tǒng)計(jì)后,將每塊得到的向量進(jìn)行線性合并,組合成一個(gè)行向量,此時(shí)得到了整幅圖的BLBP紋理特征向量。
圖像包含顏色、形狀和紋理特征,單一特征只能表達(dá)圖像的部分屬性,對圖像內(nèi)容的描述較片面,缺少足夠的區(qū)分信息。從而有必要考慮組合互補(bǔ)特性構(gòu)成綜合特征,使圖像內(nèi)容特征描述更全面。
本文綜合中藥材圖像IHOG 形狀特征及BLBP 紋理特征,考慮2 個(gè)特征的凸組合,實(shí)驗(yàn)得出最優(yōu)權(quán)重,形如式(4)
式中:F——組合特征,α、β——IHOG、BLBP 特征對應(yīng)權(quán) 重 系 數(shù),fihog、fblbp——IHOG 形 狀 特 征 及BLBP 紋 理特征。
SVM 分類器本質(zhì)是針對兩分類問題,在實(shí)際生活中常對多類問題進(jìn)行分類,即需構(gòu)造SVM 多值分類器。文獻(xiàn)[11]列舉了5種SVM 多類分類方法,分別為一類對余類法、一對一分類法、二叉樹法、糾錯(cuò)輸出編碼法以及決策樹方法。
本文針對多類中藥材的圖像進(jìn)行分類,選取一對一方法進(jìn)行SVM 多值分類器的構(gòu)造,設(shè)圖像類別為N 類,共需訓(xùn)練N×(N-1)/2個(gè)2值SVM 分類器,這種方式是對N 個(gè)分類類別訓(xùn)練集進(jìn)行兩兩區(qū)分,測試的時(shí)候采用投票法決定所屬類別,得票最多的類即為預(yù)測類別
SVM 通過用內(nèi)積函數(shù)定義的非線性變換將輸入空間變換到一個(gè)高維空間,然后在這個(gè)空間中求廣義最優(yōu)分類面來解決非線性問題。根據(jù)不同的內(nèi)積核函數(shù)將形成不同的算法,本文選取式 (5)所列的RBF (徑向基)核函數(shù)[12]。
本文實(shí)驗(yàn)選取自制的中藥材圖像數(shù)據(jù)庫。包括青貝、松貝、珍珠貝、爐貝、蓮子五類圖像,每類藥材圖像數(shù)目為1000幅,一共5000 幅圖像。數(shù)據(jù)庫由不同光照,視點(diǎn)角度條件下拍攝的圖像組成,圖像大小均為128*128*3像素,JPG 格式。部分中藥材圖像如圖5所示。
圖5 部分中藥材圖像
實(shí)驗(yàn)過程中訓(xùn)練集和測試集的組成為:每類圖像隨機(jī)抽取500幅作為訓(xùn)練集,剩下的500 幅圖像作為測試集。一次分類實(shí)驗(yàn)中,每類測試集用于測試,即共需測試2500幅圖像。
為獲得IHOG 和BLBP 最佳特征權(quán)重,實(shí)驗(yàn)對比了不同權(quán)重分配下中藥材圖像10次分類平均準(zhǔn)確率。見表1。
表1 不同權(quán)重分類準(zhǔn)確率比較
從表1 可看出,當(dāng)α 為0,β 為1 時(shí),平均準(zhǔn)確率為86.62%;當(dāng)α為1,β為0時(shí),平均準(zhǔn)確率為84.16%;當(dāng)α、β均不為0 時(shí),平均準(zhǔn)確率提高到92%左右,其中當(dāng)IHOG 和BLBP特征權(quán)重均為0.5時(shí)中藥材圖像平均分類準(zhǔn)確率最高。
IHOG 和BLBP特征單獨(dú)使用時(shí)僅體現(xiàn)了圖像的形狀特征或紋理特征;2 個(gè)互補(bǔ)特征進(jìn)行不同權(quán)重組合能使圖像內(nèi)容特征描述更全面;其中當(dāng)IHOG 和BLBP 特征權(quán)重均為0.5時(shí)顯示出最優(yōu)的權(quán)重分配,可見中藥材圖像數(shù)據(jù)庫中圖像的IHOG 和BLBP 特征對于表達(dá)圖像內(nèi)容信息貢獻(xiàn)率相當(dāng)。
為驗(yàn)證IHOG 和BLBP 特征提取算法的有效性,實(shí)驗(yàn)對比了原始HOG (文獻(xiàn) [8]使用的HOG 方法)、IHOG、原始LBP、BLBP和特征權(quán)重均為0.5的IHOG、BLBP 特征組合 (本文方法)在中藥材數(shù)據(jù)庫中性能,如表2所示,表中時(shí)間表示一幅圖像進(jìn)行特征提取所耗時(shí)間,分類準(zhǔn)確率代表10次平均分類準(zhǔn)確率。
表2 特征提取算法在中藥材數(shù)據(jù)庫性能對比
通過表2可看出,BLBP相比原始LBP,特征維數(shù)降低了102.4倍,特征提取時(shí)間減少了16倍,但分類準(zhǔn)確率提高了66.62%。IHOG 相比原始HOG 特征,特征維數(shù)降低了46.67倍,特征提取時(shí)間減少了14倍,分類準(zhǔn)確率卻提高了29.88%。本文方法結(jié)合IHOG 和BLBP特征,在保證特征維數(shù)、時(shí)間耗費(fèi)較小情況下分類準(zhǔn)確率達(dá)到93.56%。
IHOG 算法繼承了原始HOG 描述子能描述圖像局部形狀信息、一定程度上抑制平移和旋轉(zhuǎn)影響等優(yōu)點(diǎn),一定程度上簡化了分單元的細(xì)節(jié),使表征的范圍大大的減少;BLBP算子在基本保留原始LBP 紋理特征的基礎(chǔ)上,避免了空間位置混亂以及縮小了特征向量的維數(shù)。
從中藥材檢索框架可知,本文的檢索性能與分類結(jié)果密切相關(guān)。查詢圖像首先提取IHOG 和BLBP 組合特征,然后通過SVM 分類器獲得預(yù)測類別,再對中藥材圖像數(shù)據(jù)庫中與預(yù)測類別一樣的圖像進(jìn)行歐式距離度量,最后根據(jù)距離大小依次返回檢索結(jié)果圖像。預(yù)測正確與否直接關(guān)系到最終的檢索效果。
圖像檢索系統(tǒng)性能評價(jià)的重要指標(biāo)是查準(zhǔn)率和查全率。查準(zhǔn)率 (precision)、查全率 (recall)公式如下
式中:m——檢索結(jié)果的圖像數(shù)量,x——在檢索結(jié)果圖像中與查詢圖像屬于同類別的數(shù)量,測試集總圖像數(shù)量為n幅圖像中共有y 幅圖像與要查詢圖像屬于相同的類別。
實(shí)驗(yàn)利用本文方法分別計(jì)算青貝、松貝、珍珠貝、爐貝、蓮子這五類的查準(zhǔn)率和查全率。圖6為對五類圖像在圖像檢索系統(tǒng)的查準(zhǔn)率折線圖,圖7是與圖6相對應(yīng)的圖像檢索系統(tǒng)的查全率的折線圖。
圖6 圖像檢索系統(tǒng)的查準(zhǔn)率
圖7 圖像檢索系統(tǒng)的查全率
圖6中,圖像檢索系統(tǒng)的查準(zhǔn)率基本保持恒定狀態(tài),其中珍珠貝、爐貝、蓮子這三類的查準(zhǔn)率接近1,青貝和松貝的查準(zhǔn)率分別在0.8506和0.9374浮動(dòng)。
圖7中,青貝及松貝的查全率分別在0.8751和0.9218浮動(dòng)。珍珠貝、爐貝、蓮子這三類的圖像查全率約為1。
由圖6、圖7對圖像檢索系統(tǒng)的查準(zhǔn)率和查全率在平均檢索次數(shù)下進(jìn)行統(tǒng)計(jì)可知,青貝和松貝的查準(zhǔn)率及查全率相對較低,而珍珠貝、爐貝、蓮子的較高,這和查詢圖像預(yù)測類別相關(guān),表3 列出了五類別一次分類的混淆矩陣,矩陣的每行代表一個(gè)實(shí)際類的實(shí)例,而每列代表在一個(gè)預(yù)測類的實(shí)例。
表3可看出,每一類取500張進(jìn)行測試,其中500張松貝圖像,只有410張分類正確,67張被預(yù)測為青貝圖像,19張預(yù)測為珍珠貝,4張預(yù)測為爐貝,導(dǎo)致分類的準(zhǔn)確率為82.0%。松貝和青貝的分類準(zhǔn)確率相對較低,這是因?yàn)榍嘭惡退韶愵愰g相似度很大,容易導(dǎo)誤分現(xiàn)象;珍珠貝、爐貝、蓮子分別與其他類別之間的類間相似度較小,容易根據(jù)形狀和紋理特征區(qū)別開來,從而分類準(zhǔn)確率較高。顯然,檢索的查準(zhǔn)率和查準(zhǔn)率對易誤分的青貝和爐貝就相對較低。
表3 分類結(jié)果的混淆矩陣
本文對原始LBP紋理特征及原始HOG 形狀特征進(jìn)行了改進(jìn),在提高分類精度的同時(shí)克服了維數(shù)很大的缺點(diǎn)。實(shí)驗(yàn)表明BLBP 紋理特征和IHOG 形狀特征組合存在優(yōu)勢互補(bǔ),將特征進(jìn)行適當(dāng)?shù)奶卣鳈?quán)重聯(lián)用能改善分類精度。本文提出的基于形狀特征和紋理特征的中藥材檢索方法實(shí)驗(yàn)結(jié)果有效,具有很好的檢索性能。下一步將在此基礎(chǔ)上,研究特征組合權(quán)重的自適應(yīng)設(shè)置。
[1]WU Yongguo,LI Deqiang,LUO Haibo,et al.Image retrieval method combining global description and local description[J].Computer Engineering and Design,2012,33 (2):634-638 (in Chinese).[吳永國,李德強(qiáng),羅海波,等.融合全局和局部描述的圖像檢索方法 [J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33 (2):634-638.]
[2]Kebapci H,Yanikoglu B,Unal G.Plant image retrieval using color,shape and texture features[J].The Computer Journal,2011,54 (9):1475-1490.
[3]Mohd Anuar F,Setchi R,Lai Y.Trademark image retrieval using an integrated shape descriptor[J].Expert Systems with Applications,2013,40 (1):105-121.
[4]Zheng J,Shen F,F(xiàn)an H,et al.An online incremental learning support vector machine for large-scale data [J].Neural Computing and Applications,2013,22 (5):1023-1035.
[5]Zhang Y,Wu L.Classification of fruits using computer vision and a multi-class support vector machine[J].Sensors,2012,12 (9):12489-12505.
[6]ZHANG Shuya,ZHAO Yiming,LI Junli.Algorithm and implementation of image classification based on SVM [J].Computer Engineering and Applications,2007,43 (25):40-42(in Chinese).[張淑雅,趙一鳴,李均利.基于SVM 的圖像分類算法與實(shí)現(xiàn) [J].計(jì)算機(jī)工程與應(yīng)用,2007,43 (25):40-42.]
[7]Déniz O,Bueno G,Salido J,et al.Face recognition using histograms of oriented gradients [J].Pattern Recognition Letters,2011,32 (12):1598-1603.
[8]DING Xuedong,LIU Yuan,XIE Zhenping.Improvement of content-based image retrieval system by incrementally learning semantic attributes of images [J].Application Research of Computers,2014,31 (1):273-276 (in Chinese). [丁學(xué)東,劉淵,謝振平.增量學(xué)習(xí)語義屬性的圖像內(nèi)容檢索系統(tǒng)增強(qiáng)[J].計(jì)算機(jī)應(yīng)用研究,2014,31 (1):273-276.]
[9]Mohamed A,Yampolskiy RV.Face recognition based on wavelet transform and adaptive local binary pattern [G].LNCS 114:Digital Forensics and Cyber Crime.Berlin:Springer Berlin Heidelberg,2013:158-166.
[10]Li L,Li S,Zhu H,et al.An efficient scheme for detecting copy-move forged images by local binary patterns[J].Journal of Information Hiding and Multimedia Signal Processing,2013,4 (1):46-56.
[11]GOU Bo,HUANG Xianwu.SVM multi-class classification methods[J].Journal of Data Acquisition and Processing,2006,21 (3):334-339 (in Chinese).[茍博,黃賢武.支持向量機(jī)多類分類方法 [J].數(shù)據(jù)采集與處理,2006,21 (3):334-339.]
[12]Gumus E,Kilic N,Sertbas A,et al.Evaluation of face recognition techniques using PCA,wavelets and SVM [J].Expert Systems with Applications,2010,37 (9):6404-6408.