宋 輝,劉奉華
(沈陽(yáng)工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110870)
虹膜具有豐富的紋理特征,以及唯一性、穩(wěn)定性、生物活性等特點(diǎn),使其能夠在生物特征識(shí)別技術(shù)中應(yīng)用;而由于虹膜識(shí)別技術(shù)安全性高、方便、防偽性好、非接觸等優(yōu)點(diǎn),使虹膜識(shí)別技術(shù)的應(yīng)用越來(lái)越廣泛,比如銀行、機(jī)場(chǎng)、刑偵等。然而,在虹膜識(shí)別技術(shù)的應(yīng)用過(guò)程中,也出現(xiàn)了許多影響虹膜系統(tǒng)識(shí)別正確率的問(wèn)題,比如光源、采集設(shè)備、圖像處理算法等。針對(duì)這類問(wèn)題所采用的方法有提高圖像采集質(zhì)量[1]、采用更好的圖像處理算法[2]等等,但這些方法未能從源頭上解決問(wèn)題,并且人力、物力和財(cái)力上消耗較大。
文中通過(guò)分析認(rèn)為,導(dǎo)致虹膜識(shí)別率不理想,匹配算法不能很好地發(fā)揮識(shí)別性能的一個(gè)原因是采集的虹膜圖像本身不能滿足匹配識(shí)別的條件,所以,提高識(shí)別率的方法之一就是要把不滿足匹配識(shí)別條件的虹膜圖像篩選出來(lái)。
因此,文中提取虹膜圖像的灰度共生矩陣和LBP特征作為虹膜圖像的特征數(shù)據(jù),將特征數(shù)據(jù)作為訓(xùn)練集對(duì)采用的支持向量機(jī)[3]預(yù)分類器[4]進(jìn)行訓(xùn)練和測(cè)試,最后在匹配識(shí)別中應(yīng)用分類器對(duì)虹膜圖像進(jìn)行預(yù)分類,然后進(jìn)行匹配識(shí)別。
在圖像分類中,要想得到較好的分類效果,必須首先對(duì)圖像進(jìn)行紋理特征的提取。根據(jù)提取的紋理特征包含的特性信息,目前對(duì)特征的描述方法比較多,其中應(yīng)用廣泛的是基于統(tǒng)計(jì)和基于結(jié)構(gòu)的方法。針對(duì)文中提取的是虹膜圖像的紋理特征,采用基于統(tǒng)計(jì)的灰度共生矩陣和LBP兩種方法。
灰度共生矩陣定義為從某一灰度級(jí)為i的點(diǎn)到另一具有固定位置關(guān)系達(dá)到灰度級(jí)為j的概率。其表示方式為Pd(i,j)(i,j=0,1,…,L-1),其中L表示虹膜圖像的灰度等級(jí),i,j表示像素點(diǎn)對(duì)的灰度等級(jí),d表示兩個(gè)像素點(diǎn)的位置關(guān)系,θ表示灰度矩陣生成方向。其關(guān)系圖如圖1所示。
圖1 灰度共生矩陣的像素對(duì)
當(dāng)確定兩個(gè)像素點(diǎn)的距離關(guān)系后,得到在這個(gè)距離關(guān)系d下的灰度共生矩陣。
(1)
其中,每一個(gè)元素代表在某一特定距離關(guān)系下某一灰度點(diǎn)對(duì)組合出現(xiàn)的次數(shù),比如P(0,0),表示在關(guān)系d下,兩個(gè)像素點(diǎn)灰度等級(jí)分別為0和0時(shí)出現(xiàn)的次數(shù)。
灰度共生矩陣所表示的是灰度圖像在不同方向、相鄰間隔像素點(diǎn)間灰度等級(jí)的關(guān)系。通過(guò)它可以分析圖像在灰度上各不同灰度等級(jí)像素點(diǎn)的分布以及排列特征。為了更好地表示紋理特征,對(duì)灰度共生矩陣中的元素進(jìn)行歸一化,也就是對(duì)矩陣內(nèi)元素進(jìn)行統(tǒng)計(jì)。將各個(gè)元素除以所有元素的和,得到以概率表示的歸一化數(shù)據(jù)矩陣,其中新矩陣各個(gè)元素值均小于1,由此得到歸一化共生矩陣。Haralick等分析得出14個(gè)可用于圖像紋理分析的特征參數(shù)。而Ulaby[5]等研究后發(fā)現(xiàn)其中只有4個(gè)特征參數(shù)是互相獨(dú)立的,而采用這4個(gè)特征參數(shù)能得到較好的分類精度,有利于減少?gòu)?fù)雜度。所以一般采用下面4個(gè)[6]最常用的特征來(lái)提取圖像紋理特征。
(1)二階矩(能量)。
二階矩表示灰度共生矩陣中各個(gè)元素值的平方和,反映圖像灰度分布狀況與紋理粗細(xì)程度。若灰度共生矩陣所有值都相等,則f1值小;若差別很大,則f1值大。f1大表示紋理粗能量大;f1小則紋理細(xì),能量小。
(2)
(2)對(duì)比度。
對(duì)比度反映了圖像中不同紋理間的清晰度差別明顯程度和紋路的深淺程度[7]。對(duì)比度越大,其溝紋越深,清晰度越高;反之則越模糊。在灰度共生矩陣中離對(duì)角線遠(yuǎn)的元素越多,對(duì)比度越大,公式如下:
(3)
(3)相關(guān)性。
相關(guān)性表示灰度共生矩陣中各個(gè)元素在各行各列方向上的相似程度[8]。當(dāng)矩陣元素均值相等時(shí),相關(guān)值大,相反則小。若圖像中存在水平方向上的紋理,那么水平方向矩陣的相關(guān)度要更大。
(4)
其中,u1,u2,σ1,σ2分別定義為:
(5)
(6)
(7)
(8)
(4)熵。
熵是圖像信息量的衡量,紋理也是圖像的信息,是圖像隨機(jī)性[9]的度量,當(dāng)灰度共生矩陣中各元素隨機(jī)性最大、所有值幾乎相等,元素分散分布時(shí),熵較大。它表示的是圖像紋理的復(fù)雜程度。
LBP(local binary pattern,局部二值模式)是一種描述圖像局部特性的算子,具有旋轉(zhuǎn)不變性和灰度不變性等優(yōu)點(diǎn)。將其用于紋理特征提取的過(guò)程為:
初始的LBP算子首先建立一個(gè)3*3像素的窗口,把窗口中心像素灰度等級(jí)作為閾值,將與之相鄰的8個(gè)像素的灰度值一一與其進(jìn)行比較,若周圍像素灰度值大于中心像素灰度值,則該像素點(diǎn)對(duì)應(yīng)的位置被標(biāo)記為1,否則為0。這樣,3*3鄰域內(nèi)周圍的8個(gè)點(diǎn)就由原來(lái)的灰度等級(jí)表示轉(zhuǎn)化為以8位二進(jìn)制數(shù)(通常轉(zhuǎn)換為十進(jìn)制數(shù)即LBP碼,共256種)表示,那么該窗口中心點(diǎn)就用次8為二進(jìn)制數(shù)表示,也就是LBP值,并用這個(gè)值來(lái)反映該區(qū)域的紋理信息,LBP原理如圖2所示。
圖2 LBP原理圖
通過(guò)二值圖,按順時(shí)針?lè)较虻玫揭粋€(gè)二進(jìn)制串11111000,這樣中間點(diǎn)的像素灰度值通過(guò)二進(jìn)制數(shù)轉(zhuǎn)化為一個(gè)十進(jìn)制數(shù)來(lái)表示。注意這里的計(jì)算順序并沒(méi)有硬性規(guī)定,只是一個(gè)量化公式在整個(gè)處理過(guò)程中保持相同即可,計(jì)算公式如下:
(9)
其中,P,R分別表示鄰域中的像素點(diǎn)個(gè)數(shù)和鄰域半徑。
針對(duì)其他LBP模式存在的缺陷,采用均勻LBP模式即uniform LBP。均勻模式是在一個(gè)二進(jìn)制序列中0到1交替變化的次數(shù)不超過(guò)2次,比如10100000變化次數(shù)為3,就不是均勻模式。在一個(gè)8位二進(jìn)制串中,其均勻模式共有58種。因?yàn)檠芯空甙l(fā)現(xiàn)計(jì)算得到的數(shù)值中大部分都包括在其中,可以達(dá)到90%,所以將它們分為59類,58個(gè)均勻模式為一類,其他的所有值歸為第59類。通過(guò)該方法,可以把原來(lái)256維的直方圖降到59維。其計(jì)算公式為:
(10)
U(LBPP,R)=|S(gp-1-gc)-S(g0-gc)|+
(11)
SVM是一種泛化能力很強(qiáng)的學(xué)習(xí)機(jī),也就是說(shuō)其適應(yīng)性很強(qiáng),特別是對(duì)于小樣本空間具有獨(dú)特的優(yōu)勢(shì)。SVM學(xué)習(xí)機(jī)中核函數(shù)以及核參數(shù)的選擇至關(guān)重要。實(shí)際應(yīng)用中,核函數(shù)主要有:
(1)線性核函數(shù)。
(12)
(2)多項(xiàng)式核函數(shù)。
(13)
(3)徑向基核函數(shù)。
(14)
(4)Sigmoid核函數(shù)。
(15)
現(xiàn)在對(duì)于分類中核函數(shù)的選擇并沒(méi)有明確的說(shuō)明與參考指導(dǎo),因此文中采用應(yīng)用最廣泛、分類效果不錯(cuò)的徑向基核函數(shù)。SVM是二分類學(xué)習(xí)機(jī),符合文中要求。而通過(guò)在訓(xùn)練中不斷改變核參數(shù)的步長(zhǎng)來(lái)選擇最優(yōu)核參數(shù)。
協(xié)同訓(xùn)練[10]的過(guò)程是,同時(shí)訓(xùn)練兩個(gè)分類器,然后分別將兩個(gè)分類器分類結(jié)果中置信度高[11]的作為另一個(gè)分類器的訓(xùn)練樣本,并不斷迭代,直到達(dá)到迭代次數(shù)或?qū)嶒?yàn)要求[12]。實(shí)驗(yàn)過(guò)程中,受協(xié)同訓(xùn)練思想的啟發(fā),首先對(duì)虹膜圖像進(jìn)行識(shí)別匹配,并把正確匹配與未正確匹配的圖像作為SVM分類器的不同訓(xùn)練樣本,從實(shí)驗(yàn)中學(xué)習(xí)到兩類樣本分別具有的特性,即圖像分類的依據(jù);然后將訓(xùn)練完成的學(xué)習(xí)機(jī)應(yīng)用到匹配識(shí)別過(guò)程中,對(duì)要進(jìn)行匹配識(shí)別的虹膜圖像進(jìn)行預(yù)分類,從而達(dá)到提高虹膜系統(tǒng)正確匹配識(shí)別率的目的。正確匹配識(shí)別率提高的過(guò)程如下所示:
(16)
(17)
其中,m為能正確匹配的虹膜圖像數(shù),其在預(yù)分類前后基本不變;M為虹膜圖像總數(shù);n為被預(yù)分類器篩選出的虹膜圖像數(shù);k為因圖像質(zhì)量不好而無(wú)法識(shí)別的圖像。由此可見(jiàn),在總數(shù)不變,正確匹配圖像數(shù)不變,剔除掉不適合進(jìn)行匹配的虹膜圖像后,正確匹配識(shí)別率η1<η2。
對(duì)虹膜圖像,在0°、45°、90°、135°四個(gè)方向上,像素間距設(shè)置為1,灰度等級(jí)壓縮為16級(jí),提取灰度共生矩陣以及灰度共生矩陣的四個(gè)特征參數(shù)[13],結(jié)果如圖3和圖4所示。
(a) (b)
從圖4可以看出,在兩圖處于不同睜開(kāi)程度下四個(gè)特征值差距明顯,作為圖像分類依據(jù)是可靠的。
利用均勻LBP模式[14]對(duì)虹膜圖像進(jìn)行特征提取,結(jié)果如圖5所示。
圖4 灰度共生矩陣的四個(gè)特征值
圖5 LBP處理圖片前后
將利用灰度共生矩陣與LBP提取的虹膜特征數(shù)據(jù)作為訓(xùn)練樣本,訓(xùn)練SVM預(yù)分類器,并按照實(shí)驗(yàn)步驟對(duì)中科院CASIA虹膜圖像進(jìn)行匹配識(shí)別。
在虹膜圖像的匹配識(shí)別過(guò)程中,利用2D Gabor小波函數(shù)提取圖像的紋理特征[15],然后通過(guò)計(jì)算歐氏距離來(lái)完成匹配。2D Gabor小波函數(shù)如下:
(18)
(19)
在匹配識(shí)別過(guò)程中,所用虹膜圖像為中科院虹膜共享庫(kù)CASIA和本地虹膜圖庫(kù),其中CASIA圖庫(kù)中每個(gè)人同一只眼睛的虹膜圖像有7張,分前后兩次采集,采集數(shù)分別為3張,4張。虹膜圖像的匹配采用歐氏距離判別。首先,對(duì)第一次采集的3張虹膜圖像提取的特征向量?jī)蓛芍g計(jì)算歐氏距離,并取歐氏距離的平均值作為識(shí)別匹配閾值DT,通過(guò)比較閾值DT與歐氏距離D的關(guān)系判斷虹膜圖像是否來(lái)自同一個(gè)人,若D小于DT則來(lái)自同一個(gè)人,反之不是。
第一次匹配識(shí)別選取CASIA圖庫(kù)中200人的2 100張虹膜圖像,其中900張用來(lái)選則分類閾值DT,其余1 100張用來(lái)匹配識(shí)別,正確匹配識(shí)別的有990張,未正確匹配的為110張,其中有7張無(wú)法進(jìn)行匹配識(shí)別。第二次匹配識(shí)別中,首先將第一次匹配識(shí)別后的兩類圖像作為預(yù)分類器訓(xùn)練的兩類不同樣本進(jìn)行訓(xùn)練;然后選取CASIA圖庫(kù)中另外200人的2 100張虹膜圖像,900張作為分類閾值DT選取,1 100張進(jìn)行匹配識(shí)別,正確匹配的為1 050張,未正確匹配的為50張,其中9張無(wú)法進(jìn)行匹配識(shí)別。第三次和第四次匹配識(shí)別中,對(duì)CASIA虹膜圖庫(kù)中隨機(jī)選取的300張虹膜圖像與本地虹膜信息數(shù)據(jù)庫(kù)進(jìn)行匹配識(shí)別,其中第三次不加預(yù)分類器,正確識(shí)別匹配的為277張,未正確識(shí)別匹配的為23張,其中5張無(wú)法進(jìn)行匹配;第四次加入預(yù)分類器后,正確匹配識(shí)別的為285張,未正確匹配識(shí)別的有15張,其中5張無(wú)法進(jìn)行匹配識(shí)別。匹配識(shí)別結(jié)果如表1所示。
表1 匹配識(shí)別率
由表1可以看出,在經(jīng)過(guò)預(yù)分類器對(duì)待匹配虹膜圖像進(jìn)行預(yù)分類后,利用相同的虹膜匹配識(shí)別算法,虹膜系統(tǒng)的正確匹配識(shí)別率得到了明顯提高。
通過(guò)訓(xùn)練預(yù)分類器,對(duì)不滿足識(shí)別匹配的虹膜圖像進(jìn)行預(yù)分類,從而在采用相同圖像處理算法的情況下提高虹膜識(shí)別系統(tǒng)的正確識(shí)別率。同時(shí)在一些情況下也驗(yàn)證了虹膜系統(tǒng)的正確識(shí)別率不高并非匹配識(shí)別算法不好所導(dǎo)致,可能是所識(shí)別的圖像不適合識(shí)別匹配。今后,還可以采用其他類型的分類器以及圖像特征提取方法來(lái)驗(yàn)證文中方法的有效性。