張翌陽(yáng),唐云祁,陳子龍,苗 迪
(1.中國(guó)人民公安大學(xué)偵查學(xué)院,北京 100038;2.公安部鑒定中心,北京 100038;3.北京中科虹霸科技有限公司,北京 100190)
近年來(lái),虹膜識(shí)別在國(guó)內(nèi)外公共安全領(lǐng)域應(yīng)用廣泛。由于虹膜表面紋理特征豐富,且這些紋理特征終生不變,人各不同,同時(shí)虹膜位于人眼內(nèi)部的特殊位置也很難偽造,所以虹膜已經(jīng)成為繼指紋、人臉、DNA后又一廣泛應(yīng)用于公安機(jī)關(guān)核驗(yàn)人員身份的生物識(shí)別技術(shù)[1]。虹膜識(shí)別的精度高,比對(duì)速度快,非接觸式采集并且不易偽造,同時(shí)也特別適合用于大規(guī)模人群的身份識(shí)別[2]。在虹膜識(shí)別技術(shù)成熟應(yīng)用于身份識(shí)別后,隨之而來(lái)的問題是虹膜識(shí)別的結(jié)果無(wú)法直接作為證據(jù)應(yīng)用于司法審判。虹膜從最基礎(chǔ)的用于身份識(shí)別到作為證據(jù)應(yīng)用于司法審判,兩者之間仍然缺少虹膜鑒定這一重要環(huán)節(jié)。
目前,公安機(jī)關(guān)使用各種人體生物特征進(jìn)行身份識(shí)別,而對(duì)于指紋、DNA、人臉等生物特征的檢驗(yàn)鑒定也已取得了一定成果。其中指紋是在已有的人工鑒定方法[3-5]基礎(chǔ)上,研究開發(fā)出了指紋自動(dòng)識(shí)別系統(tǒng),而虹膜則是自動(dòng)識(shí)別技術(shù)發(fā)展在前,鑒定方法的研究相對(duì)滯后。虹膜識(shí)別技術(shù)與虹膜鑒定研究是兩個(gè)不同的問題,虹膜識(shí)別技術(shù)是典型的模式識(shí)別和計(jì)算機(jī)視覺問題,識(shí)別過程中將虹膜特征以編碼形式進(jìn)行匹配,這種特征編碼不需要具備實(shí)際的物理意義,因此盡管虹膜識(shí)別的精度非常高,但得到的結(jié)果無(wú)法直接用作鑒定結(jié)論,難以在法庭審判過程中發(fā)揮作用。虹膜鑒定是通過對(duì)兩幅虹膜圖像進(jìn)行鑒別,尋找其中能夠被人們所認(rèn)識(shí)的特征,最后通過綜合分析,判斷兩幅虹膜圖片是否來(lái)源同一。雖然全國(guó)各地公安機(jī)關(guān)現(xiàn)已開始了虹膜采集工作,虹膜識(shí)別在公安領(lǐng)域的應(yīng)用也越來(lái)越廣泛,但虹膜鑒定的方法研究還相對(duì)滯后。相比于指紋和DNA成熟、系統(tǒng)的鑒定方法,虹膜的鑒定方法還有待進(jìn)一步完善。
虹膜鑒定方法研究的難點(diǎn)有兩個(gè):第一是選擇什么特征作為虹膜鑒定的依據(jù),這個(gè)問題是虹膜鑒定的基礎(chǔ),需要對(duì)虹膜上所有紋理有總體的認(rèn)識(shí),從而將不同特征按照各自的特點(diǎn)進(jìn)行分類;第二是虹膜鑒定特征數(shù)量的確定,當(dāng)前法庭科學(xué)領(lǐng)域的發(fā)展趨勢(shì),對(duì)于檢驗(yàn)鑒定的要求愈發(fā)嚴(yán)格,特征數(shù)量問題不能僅憑經(jīng)驗(yàn)找到一定數(shù)量符合的特征點(diǎn)即可認(rèn)定同一,而是要在此基礎(chǔ)之上從客觀角度出發(fā),給出相應(yīng)的統(tǒng)計(jì)概率作為證據(jù)解釋。目前在虹膜鑒定方法的研究中圍繞這兩個(gè)難點(diǎn),將虹膜上的特征分為了塊狀特征、線狀特征和環(huán)狀特征三類[6]。受限于當(dāng)前標(biāo)準(zhǔn)下虹膜圖像清晰度的限制,線狀特征和塊狀特征會(huì)更加清晰和穩(wěn)定,本文對(duì)類間虹膜塊狀特征相似性進(jìn)行統(tǒng)計(jì),首先利用Tophat算法提取虹膜上的塊狀特征, 然后用Hu矩特征和位置坐標(biāo)信息兩個(gè)參數(shù)描述塊狀特征的相似度,最后使用計(jì)算機(jī)算法對(duì)不同虹膜上提取到的塊狀特征進(jìn)行兩兩比較,統(tǒng)計(jì)異源虹膜上塊狀特征的相似情況。本文希望找到一種方法,能從概率論的角度解釋虹膜鑒定過程中多少個(gè)特征點(diǎn)相吻合即可認(rèn)定同一。
虹膜識(shí)別從上世紀(jì)90年代就已經(jīng)開始興起,1993年,Daugman博士[7]研究出基于Gabor變換的虹膜識(shí)別算法,使虹膜識(shí)別技術(shù)有了突破性的進(jìn)展。在國(guó)內(nèi),1998年底中科院自動(dòng)化所譚鐵牛博士[8]開始進(jìn)行虹膜識(shí)別方面的研究,2000年成功開發(fā)出具有我國(guó)自主知識(shí)產(chǎn)權(quán)的虹膜識(shí)別系統(tǒng),填補(bǔ)了國(guó)內(nèi)空白。目前虹膜識(shí)別技術(shù)的發(fā)展已經(jīng)非常成熟,虹膜識(shí)別技術(shù)在世界上已有很多成功的應(yīng)用案例,如印度的Aadhaar計(jì)劃和阿聯(lián)酋的出入境虹膜識(shí)別系統(tǒng)等[9-10]。
對(duì)于虹膜鑒定方法的研究,公安部鑒定中心以國(guó)家重點(diǎn)研發(fā)項(xiàng)目為依托,以理論研究和計(jì)算機(jī)輔助軟件兩方面研究作為切入點(diǎn),在該領(lǐng)域開展了深入的研究。在理論研究方面,結(jié)合眼解剖學(xué)和虹膜基礎(chǔ)理論,將虹膜特征分為放射狀溝線、向心溝、卷縮輪、隱窩和色素點(diǎn)五大類型[11],并對(duì)虹膜圖像特征的提取和分析方法進(jìn)行了研究,解決了虹膜圖像的人工特征選取和標(biāo)注問題。但對(duì)于特征點(diǎn)數(shù)量問題方面的研究仍有待進(jìn)一步推進(jìn)。若要從概率論的角度來(lái)解釋特征點(diǎn)數(shù)量問題,需要統(tǒng)計(jì)大量的虹膜上各種特征出現(xiàn)情況,通過人工統(tǒng)計(jì)的方式工作量太過龐大,而且由于虹膜紋理特征形狀的隨機(jī)性,肉眼觀察也會(huì)產(chǎn)生很大誤差,這就需要用到計(jì)算機(jī)算法來(lái)自動(dòng)提取虹膜特征并進(jìn)行自動(dòng)統(tǒng)計(jì)。
首先要解決的問題是如何從大量虹膜圖像中有效、準(zhǔn)確提取到紋理特征。Shen等[12-14]通過實(shí)驗(yàn)證實(shí)了虹膜隱窩特征作為虹膜識(shí)別特征的有效性,并設(shè)計(jì)了基于虹膜隱窩特征的虹膜識(shí)別算法,算法中使用Tophat對(duì)隱窩特征進(jìn)行處理后,能夠自動(dòng)勾畫虹膜隱窩輪廓,準(zhǔn)確地將虹膜隱窩特征提取出來(lái)。Tophat算法經(jīng)常被用來(lái)分離比鄰近點(diǎn)亮的一些斑塊,在一幅圖像具有大幅背景,而微小物體比較有規(guī)律的情況下可以使用。彭博等[15]利用Tophat算法來(lái)增強(qiáng)醫(yī)學(xué)超聲圖像的局部對(duì)比度,在保證特征細(xì)節(jié)不丟失的情況下有效抑制了背景噪聲。虹膜圖像和醫(yī)學(xué)超聲圖像都是灰度圖像,在特征細(xì)節(jié)上虹膜塊狀特征和超聲圖像上的特征也有著相似之處。朱成軍等[16]使用Tophat濾波對(duì)車牌進(jìn)行處理,將車牌號(hào)碼突出出來(lái),有效提高車牌的識(shí)別率。段建民等[17]則利用Tophat濾波處理的方式,抑制路面上車道線以外的大多數(shù)背景物體,大大提高車道檢測(cè)的準(zhǔn)確程度。根據(jù)Tophat算法的特點(diǎn),剛好可以用來(lái)對(duì)虹膜上的背景噪聲進(jìn)行抑制,突出虹膜塊狀特征并進(jìn)行分割。
其次要解決的問題是虹膜塊狀特征的形狀用什么方式描述。Hu矩一般用來(lái)識(shí)別圖像中大的物體,能較好地描述物體的形狀,但圖像的紋理特征不能太過復(fù)雜。商立麗等[18]提出了一種基于全局Hu矩和局部TF-KSURF特征的青銅器銘文相似性度量方法,用Hu矩特征準(zhǔn)確地描述了青銅器上銘文的形狀,提高了銘文的檢索性能。曹鵬輝等[19]提出了一種基于光譜降維與Hu矩的壁畫顏料層脫落區(qū)域的提取方法,文中使用了Hu矩特征對(duì)壁畫中顏料脫落區(qū)域的形狀進(jìn)行描述并二次分類,提高了壁畫顏料層脫落區(qū)域的提取精度??梢钥吹?,Hu矩特征經(jīng)常用于描述青銅器銘文和壁畫顏料脫落區(qū)域這種小斑塊的形狀。因此本文選擇使用Hu矩特征值對(duì)經(jīng)過Tophat處理過的虹膜塊狀特征進(jìn)行描述,以實(shí)現(xiàn)對(duì)虹膜圖像中的塊狀特征進(jìn)行自動(dòng)提取和自動(dòng)統(tǒng)計(jì)。
由于虹膜的生理結(jié)構(gòu),可以將其近似看成同心的圓環(huán),隨著瞳孔的放大和縮小,虹膜上的各種特征也隨之變化,因此需要將虹膜圖像進(jìn)行歸一化處理后再進(jìn)行后續(xù)的實(shí)驗(yàn)。得到歸一化圖像后首先對(duì)圖像進(jìn)行Tophat處理,再通過計(jì)算連通域的方式將虹膜圖像上的塊狀特征提取出來(lái),然后記錄每個(gè)特征的位置信息和Hu矩特征,最后把所有虹膜圖像上的塊狀特征進(jìn)行兩兩比較,統(tǒng)計(jì)不同虹膜上出現(xiàn)位置相同且形狀相似的塊狀特征的情況。本文提出的異源虹膜塊狀特征相似性統(tǒng)計(jì)方法示意圖如圖1。
圖1 統(tǒng)計(jì)方法示意圖Fig.1 Schematic for statistical method utilized with this paper
2.1.1 虹膜圖像預(yù)處理
一張虹膜原始圖像中除了有用的虹膜紋理信息外,還包含瞳孔、鞏膜、睫毛以及上下眼皮等無(wú)用信息。另外,由于瞳孔在不同光照條件下的縮放,虹膜的各類紋理特征也會(huì)隨之產(chǎn)生變化。因此在提取塊狀特征前需要對(duì)虹膜原始圖像進(jìn)行預(yù)處理,本文的預(yù)處理過程包括虹膜圖像歸一化處理、直方圖均衡化及反色操作。
虹膜歸一化操作是以瞳孔中心為基準(zhǔn)點(diǎn),沿虹膜內(nèi)外邊界同心圓的徑向方向,將圓環(huán)狀虹膜紋理區(qū)域展開成矩形的歸一化區(qū)域。虹膜內(nèi)外邊界均為圓形,以瞳孔圓心為起點(diǎn),與虹膜內(nèi)外邊界的交點(diǎn)坐 標(biāo) 分別 為(xi(θ),yi(θ))和(xo(θ),yo(θ)),則 利 用下式可將虹膜原圖像中的每一個(gè)點(diǎn)一一映射到極坐標(biāo)(r,θ)中[20-21]。
虹膜歸一化能夠很好地將每幅虹膜圖像調(diào)整為同一尺寸,在最大程度上去除無(wú)用信息的干擾,從而消除平移、縮放、旋轉(zhuǎn)對(duì)虹膜紋理的影響?,F(xiàn)行公安標(biāo)準(zhǔn)虹膜原圖分辨率為640×480像素,在進(jìn)行歸一化操作后,得到虹膜歸一化圖分辨率為540×70像素,如圖2。
圖2 虹膜原圖(a)和歸一化圖(b)Fig.2 Original iris image (a) and its normalized version (b)
對(duì)虹膜歸一化圖進(jìn)行直方圖均衡化操作,以消除光照等因素對(duì)虹膜塊狀特征分割的影響,進(jìn)而保障了虹膜塊狀特征分割結(jié)果的穩(wěn)定。直方圖均衡化是一種易于操作且效果明顯的圖像增強(qiáng)方法,通過改變圖像的直方圖來(lái)調(diào)整圖像中各像素的灰度,能夠有效增強(qiáng)圖像的對(duì)比度。
直方圖均衡化的基本原理就是將圖像中對(duì)畫面起主要作用的灰度值進(jìn)行展寬,對(duì)畫面不起主要作用的灰度值進(jìn)行歸并,增大圖像對(duì)比度,使圖像更加清晰。虹膜歸一化圖像由于其灰度分布集中在較窄的區(qū)間,圖像不夠清晰,直方圖均衡化能把歸一化圖像的直方圖變換為均勻分布的形式,從而增強(qiáng)圖像整體對(duì)比度,更加突出虹膜塊狀特征,如圖3。
圖3 直方圖均衡化效果圖Fig.3 The effect image after histogram equalization
虹膜原圖經(jīng)過歸一化和直方圖均衡化處理后,還需要進(jìn)行反色處理,如圖4。這是由于在歸一化圖像中,塊狀特征的顏色深于虹膜的背景,經(jīng)過反色處理后,虹膜塊狀特征的灰度會(huì)明顯高于其鄰域,以便后續(xù)使用Tophat算法對(duì)塊狀特征進(jìn)行提取。
圖4 反色效果圖Fig.4 Reverse color handling into the effect image from histogram equalization
2.1.2 基于Tophat算法的塊狀特征分割
Tophat算法[17]實(shí)際上是原圖像與開運(yùn)算的結(jié)果圖之差,開運(yùn)算就是先腐蝕后膨脹的過程。設(shè)輸入圖像為f(x,y),內(nèi)核為b(x,y),則Tophat算法表達(dá)式為
式中符號(hào)“?!北硎緝?nèi)核b(x,y)對(duì)圖像f(x,y)的開運(yùn)算,將該運(yùn)算繼續(xù)展開
式中符號(hào)“ ”表示結(jié)構(gòu)元素b(x,y)對(duì)圖像f(x,y)的腐蝕;符號(hào)“”表示b(x,y)對(duì)圖像f(x,y)的膨脹。其中,腐蝕和膨脹運(yùn)算定義如下:
式中符號(hào)“”與“”分別為邏輯與、或運(yùn)算。實(shí)際上,膨脹操作就是將圖像f(x,y)與核b(x,y)進(jìn)行卷積,腐蝕是膨脹的逆運(yùn)算。
對(duì)虹膜歸一化圖進(jìn)行開運(yùn)算可以將歸一化圖中的紋理放大,從原圖中減去開運(yùn)算后的圖像,此過程突出了虹膜歸一化圖上的紋理特征,最后通過簡(jiǎn)單的連通域計(jì)算,將面積與形狀符合條件的塊狀特征分割出來(lái)。
在虹膜鑒定過程中,對(duì)兩個(gè)特征相似的界定有兩個(gè)方面:一是特征的位置相同,二是特征的形狀相似。
2.2.1 虹膜塊狀特征的位置
同一虹膜兩次采集的圖像在進(jìn)行歸一化處理后,塊狀特征的絕對(duì)位置信息可能會(huì)發(fā)生改變。這是由于在采集虹膜圖像的過程中頭部發(fā)生了旋轉(zhuǎn),這種變化會(huì)使采集到的虹膜旋轉(zhuǎn)3°左右,塊狀特征在歸一化圖上的位置也會(huì)發(fā)生相應(yīng)變化,如圖5。在實(shí)驗(yàn)過程中,每個(gè)塊狀特征的位置信息以質(zhì)心坐標(biāo)(x,y)的形式記錄下來(lái),采用歐氏距離來(lái)計(jì)算兩個(gè)特征位置之間的相似程度。
圖5 采集時(shí)頭部旋轉(zhuǎn)對(duì)虹膜歸一化圖上虹膜位置的影響(a:同一虹膜兩次采集的圖像;b:因頭部旋轉(zhuǎn)虹膜上的特征位置發(fā)生偏移)Fig.5 Effect of head turning on iris positioning into its normalization map during acquisition (a: two images collected of the same iris; b:iris feature position offset from head turning)
2.2.2 基于Hu矩的塊狀特征形狀信息
虹膜鑒定過程中,虹膜特征的形狀如何去定義是一個(gè)很重要的問題。經(jīng)過Tophat處理后的虹膜歸一化圖,將虹膜塊狀特征提取出來(lái),僅保留了輪廓形狀,這樣更有利于后續(xù)對(duì)特征形狀的描述。Hu矩算法是由Hu于1962年提出并證明它們具有旋轉(zhuǎn)、縮放和平移不變性,能夠較好描述目標(biāo)的整體輪廓結(jié)構(gòu)特征,被廣泛應(yīng)用于圖像識(shí)別領(lǐng)域[22]。
在空間坐標(biāo)系(x,y)中,設(shè)一幅虹膜塊狀特征圖像f(x,y),其(p+q)階矩定義為:
中心距定義為:
式中,p,q=0, 1, 2, 3…,N和M分別是圖像的高度和寬度;中心距μpq保持位移不變性,矩心(x,y,代表質(zhì)心位置,矩心計(jì)算公式為
由此得到虹膜塊狀特征的Hu矩特征向量為
將所有塊狀特征的Hu矩值計(jì)算出來(lái)后,發(fā)現(xiàn)Hu矩值的范圍很大,有些無(wú)法直接進(jìn)行比較,因此需要先進(jìn)行式(10)中的對(duì)數(shù)變換再進(jìn)行比較。
通過式(11)來(lái)計(jì)算兩個(gè)特征之間形狀的相似程度。
虹膜鑒定過程當(dāng)中,由于虹膜紋理特征完全是隨機(jī)出現(xiàn),形狀也是隨機(jī)形成的,所以兩個(gè)塊狀特征的相似認(rèn)定實(shí)際上是非常復(fù)雜的。在從位置和形狀兩個(gè)角度對(duì)塊狀特征之間相似的定義過程中,對(duì)認(rèn)定相似的參數(shù)需要進(jìn)行調(diào)整,以達(dá)到最接近實(shí)際情況的效果。以下兩個(gè)實(shí)驗(yàn)可以對(duì)參數(shù)的調(diào)整提供參考。對(duì)于塊狀特征的位置特征,由于塊狀特征位置會(huì)因?yàn)閳D像采集過程中頭部的旋轉(zhuǎn)而產(chǎn)生橫向偏差,在歸一化操作時(shí)也會(huì)因?yàn)閮?nèi)外圓自動(dòng)提取的不準(zhǔn)確而產(chǎn)生縱向偏差。頭部旋轉(zhuǎn)導(dǎo)致的虹膜圖像旋轉(zhuǎn)在3°左右,因此結(jié)合虹膜圖像歸一化過程的特點(diǎn),在分辨率為540×70像素的歸一化圖像上,只要兩個(gè)特征之間的歐氏距離小于等于3×540÷360,即小于等于4.5,就認(rèn)為兩個(gè)特征的位置相同。此距離大小的選擇在不同分辨率的歸一化圖像上略有不同。對(duì)于塊狀特征的形狀特征,需要經(jīng)過多次的實(shí)驗(yàn),選取同一只眼睛多次拍攝的虹膜圖像上的同一塊狀特征,計(jì)算并比較它們的Hu矩特征值,找到類內(nèi)塊狀特征Hu矩值之間的差距。本文通過選取4個(gè)來(lái)自于同一虹膜4次采集的4張虹膜圖像上同一個(gè)清晰穩(wěn)定的塊狀特征A、B、C、D(圖6),比較它們的Hu矩值(表1~2),以此作為參考,調(diào)整本文實(shí)驗(yàn)中認(rèn)定類間塊狀特征形狀相似的閾值。
表1 類內(nèi)塊狀特征Hu矩特征值對(duì)比Table 1 Comparison among the intra-class block-shaped characteristic Hu-moment values
圖6 類內(nèi)塊狀特征示例Fig.6 Examples of the intra-class block-shaped features
從表1和表2明顯可以看到,類內(nèi)塊狀特征之間Hu矩特征值相似度d差距均小于7,越小說明特征之間的形狀越接近。根據(jù)經(jīng)驗(yàn),類間虹膜塊狀特征的Hu矩特征值差距明顯大于類內(nèi)的差距。
表2 各塊狀特征之間Hu矩相似度d的值Table 2 The d values of Hu-moment similarity between blockshaped features
實(shí)驗(yàn)的操作系統(tǒng)是Windows 10(64位),CPU為英特爾Corei7-10750H,內(nèi)存16 GB,GPU為GTX1660Ti,軟件平臺(tái)采用MATLAB2018b。依據(jù)現(xiàn)在公安實(shí)戰(zhàn)中對(duì)虹膜圖像的規(guī)格要求,共選取來(lái)自全國(guó)不同地區(qū)的952枚分辨率為640×480像素的清晰虹膜圖像。本實(shí)驗(yàn)所用虹膜數(shù)據(jù)庫(kù)由公安部鑒定中心和北京中科虹霸科技有限公司提供。
本文針對(duì)虹膜塊狀特征進(jìn)行分割,為了更準(zhǔn)確地分割塊狀特征,盡可能多地消除塊狀特征以外的信息,結(jié)合以前對(duì)塊狀特征的研究,對(duì)內(nèi)核的形狀和大小進(jìn)行反復(fù)實(shí)驗(yàn)。圖7為不同形狀和大小的內(nèi)核對(duì)Tophat處理虹膜歸一化圖的效果。發(fā)現(xiàn)當(dāng)使用矩形內(nèi)核時(shí),塊狀特征的邊緣會(huì)損失掉一部分;使用圓盤形內(nèi)核時(shí)如果半徑過小,有一些形狀復(fù)雜的塊狀特征會(huì)被拆成多個(gè)小的斑塊,而半徑過大則不能很好地過濾背景噪聲,相鄰很近的幾個(gè)塊狀特征可能會(huì)被融合為一個(gè)塊狀特征。最終經(jīng)過多次嘗試,當(dāng)使用半徑大小為9的圓盤形核時(shí),對(duì)于虹膜上的塊狀特征的腐蝕最為準(zhǔn)確。這主要是由于塊狀特征的形狀多為類橢圓形,在分辨率為540×70像素的歸一化圖中,塊狀特征的大小為50~500像素不等。這樣經(jīng)過與內(nèi)核卷積,虹膜上的塊狀特征被較為完整地保留下來(lái),而一些線狀特征則被很好地過濾掉,最后再通過面積和形狀的限定,將符合條件的塊狀特征分割出來(lái)。
圖7 不同形狀內(nèi)核提取的效果對(duì)比(a:虹膜歸一化圖;b:邊長(zhǎng)為9的矩形核處理效果圖;c:半徑大小為3的圓盤形核處理效果圖;d:半徑大小為9的圓盤形核處理效果圖;e:半徑大小為15的圓盤形核處理效果圖)Fig.7 Extraction effects of shape-different cores (a: normalized iris image; b: effect from processing with side-length-of-9 rectangular core;c: effect from processing with radius-of-3 disc-form core; d: effect from processing with radius-of-9 disc-form core; e: effect from processing with radius-of-15 disc-form core)
實(shí)驗(yàn)過程中虹膜塊狀特征相似需要調(diào)整兩個(gè)閾值,一個(gè)是位置相同的閾值,另一個(gè)是形狀相似的閾值。本文中使用歐式距離對(duì)塊狀特征的位置相似進(jìn)行度量,但實(shí)際實(shí)驗(yàn)過程中發(fā)現(xiàn)并不是兩個(gè)斑塊位置坐標(biāo)的歐氏距離越小,得到的實(shí)驗(yàn)結(jié)果越接近實(shí)際。認(rèn)定兩個(gè)塊狀特征位置相同時(shí),它們位置坐標(biāo)的歐氏距離需要考慮到歸一化圖的分辨率大小,由此設(shè)定一個(gè)合適的值,本文實(shí)驗(yàn)中設(shè)置的值為4.5。如果這個(gè)值設(shè)置得過小,將會(huì)漏掉一些采集虹膜過程中產(chǎn)生偏差的塊狀特征,使得最后得到的統(tǒng)計(jì)結(jié)果小于實(shí)際值。
塊狀特征形狀相似的閾值本文實(shí)驗(yàn)設(shè)置為7,因?yàn)樵趯?shí)驗(yàn)過程中發(fā)現(xiàn)類內(nèi)塊狀特征之間的相似程度d都在7左右。理論上,d的值越小,塊狀特征之間的相似程度便越接近,但由于采集虹膜時(shí)的光照、角度等外界因素的影響,同一虹膜上的同一塊狀特征,在多次采集的虹膜圖像上也會(huì)呈現(xiàn)出不完全一致的形狀。如果閾值設(shè)置過小,將會(huì)人為過濾掉一部分形狀相似的塊狀特征,也會(huì)使統(tǒng)計(jì)結(jié)果小于實(shí)際值。
本文實(shí)驗(yàn)從952枚虹膜圖像中提取出7 041個(gè)塊狀特征,不同虹膜圖像上的每個(gè)塊狀特征之間兩兩比對(duì),記錄每一對(duì)相似的塊狀特征,再計(jì)算得出不同虹膜上相同位置出現(xiàn)相似虹膜塊狀特征的頻率。在952枚的虹膜庫(kù)中,實(shí)驗(yàn)得出滿足位置和Hu矩特征值均相似的塊狀特征22 443對(duì)。
經(jīng)計(jì)算,952枚異源虹膜之間進(jìn)行兩兩比對(duì),共比對(duì)452 676次,其中兩枚不同虹膜上出現(xiàn)1個(gè)塊狀特征相似的情況19 811次,出現(xiàn)2個(gè)塊狀特征相似的情況2 418次,出現(xiàn)3個(gè)塊狀特征相似的情況198次,出現(xiàn)4個(gè)塊狀特征相似的情況16次。此時(shí)兩枚不同虹膜上出現(xiàn)1個(gè)塊狀特征相似的比率為4.38%,2個(gè)塊狀特征相似的比率為0.534%,3個(gè)塊狀特征相似的比率為0.043 7%,4個(gè)塊狀特征相似的比率為0.003 53%。如表3,出現(xiàn)比率=出現(xiàn)次數(shù)÷452 676。
表3 虹膜塊狀特征相似性實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果Table 3 Statistics about appearing similar block-shaped iris feature on two different irises
根據(jù)大數(shù)定律,在試驗(yàn)不變的條件下,重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它的概率。由于本實(shí)驗(yàn)中數(shù)據(jù)庫(kù)的大小有限,實(shí)驗(yàn)結(jié)果中沒有出現(xiàn)5個(gè)以上塊狀特征相似的情況,并且以上幾種情況的頻率還并不能準(zhǔn)確接近于它的概率。但當(dāng)數(shù)據(jù)庫(kù)達(dá)到一定規(guī)模后,其頻率就將近似等于它的概率。在今后繼續(xù)擴(kuò)充數(shù)據(jù)庫(kù)的過程中,可能還會(huì)有5個(gè)、6個(gè)甚至更多塊狀特征相似的情況,所對(duì)應(yīng)的概率也可以據(jù)此方法計(jì)算出來(lái)。
本文對(duì)異源虹膜塊狀特征相似性進(jìn)行統(tǒng)計(jì),提出利用Tophat算法對(duì)虹膜圖像進(jìn)行處理。根據(jù)塊狀特征的特點(diǎn)優(yōu)化內(nèi)核的形狀,減少背景噪聲,并成功提取到了虹膜塊狀特征;在統(tǒng)計(jì)不同虹膜上相同位置出現(xiàn)的形狀相似的塊狀特征時(shí),采用Hu矩特征來(lái)對(duì)塊狀特征的形狀進(jìn)行描述,通過實(shí)驗(yàn)探究了塊狀特征相似的閾值調(diào)整方法。本文使用計(jì)算機(jī)算法對(duì)異源虹膜塊狀特征相似性進(jìn)行統(tǒng)計(jì),得到了兩枚不同虹膜上出現(xiàn)1~4個(gè)相似的塊狀特征時(shí)各自所對(duì)應(yīng)的頻率,在今后的研究中,還可以針對(duì)虹膜上其他特征進(jìn)行類似的統(tǒng)計(jì)。
解決鑒定過程中認(rèn)定同一的特征數(shù)量問題,不能僅憑經(jīng)驗(yàn),人為地通過設(shè)置閾值制定鑒定標(biāo)準(zhǔn),要以科學(xué)的方法為依據(jù),給出客觀、可信的標(biāo)準(zhǔn)。本文運(yùn)用算法自動(dòng)提取塊狀特征,在提出虹膜塊狀特征相似性度量方法的基礎(chǔ)上,統(tǒng)計(jì)塊狀特征的出現(xiàn)情況,計(jì)算出兩枚虹膜上出現(xiàn)不同數(shù)量相似的塊狀特征時(shí)對(duì)應(yīng)的頻率,運(yùn)用科學(xué)統(tǒng)計(jì)的方法給出設(shè)置不同數(shù)量的塊狀特征作為同一認(rèn)定標(biāo)準(zhǔn)時(shí)所對(duì)應(yīng)的概率。該方法可用于計(jì)算大規(guī)模虹膜數(shù)據(jù)集下異源虹膜間出現(xiàn)不同數(shù)量相似塊狀特征的概率,為解決鑒定過程中需要多少個(gè)特征相同才能認(rèn)定同一的問題奠定基礎(chǔ),對(duì)虹膜鑒定的研究具有重要的意義。