齊 霽,孫光民
QI Ji, SUN Guang-min
(北京工業(yè)大學 電子信息與控制工程學院,北京 100022)
生物特征識別技術是指計算機利用人體所固有的生理或行為特征來進行個人身份鑒定。常用的生物特征包括:指紋、掌紋、虹膜、臉像、聲音、筆跡等(如表1所示)。
表1 各種生物識別方法安全等級比較
虹膜識別技術作為人體生物特征識別技術的尖端代表,具有的普遍性、唯一性、穩(wěn)定性、可靠性、非侵犯性、可采集性等特點,錯誤接受率和錯誤拒絕率較低如表2所示,因而具有無可比擬的優(yōu)勢和很高的研究價值。
表2 虹膜與指紋識別方法性能比較
虹膜識別技術重點應用于領域包括:門禁和考勤;金融和證券;電子護照和第二代身份證;醫(yī)療保險和養(yǎng)老保險的發(fā)放:公安和司法;電子商務;信息安全;特殊行業(yè)等,相對其他生物識別技術具有廣闊的應用前景。因此,國內(nèi)外學者對其高度重視,并進行深入而廣泛的研究。
虹膜識別系統(tǒng)由虹膜圖像預處理、特征提取及編碼和匹配識別等部分構(gòu)成。
虹膜圖像的預處理包括對虹膜內(nèi)外邊界的定位,對提取出的虹膜部分進行直方圖均衡及歸一化操作等。而虹膜圖像紋理的特征提取本文采用了多尺度二維Gabor濾波器對圖像進行濾波,再對輸出的卷積結(jié)果計算平均絕對偏差值作為特征值,最后采用兩種方法對特征值進行分類已達到識別圖像的目的。一種方法是計算標準圖像和待測圖像特征值間的加權(quán)歐式距離(WED);另一種方法是將標準圖像的特征值輸入BP神經(jīng)網(wǎng)絡進行學習和訓練,再用訓練好的網(wǎng)絡對待測圖像的特征值進行分類,并輸出判斷結(jié)果。
虹膜是瞳孔之外鞏膜之內(nèi)的圓環(huán)部分,包含了豐富的紋理信息。為了減少眼瞼、睫毛、圖像拍攝角度以及拍攝距離等因素對虹膜識別效果的影響,須對圖像進行預處理。本文將預處理分為虹膜定位、虹膜圖像歸一化和虹膜圖像增強三個步驟。虹膜與鞏膜、瞳孔的邊界均近似為圓形,可將虹膜的內(nèi)外邊緣近似看作兩個不同心的圓。因此定位的過程就是找出內(nèi)外兩個圓的半徑和圓心的過程。而歸一化的目的是將每幅圖像調(diào)整到相同的尺寸和位置,以消除拍攝角度和距離的不同而帶來的影響。增強是為了消除光照不均的影響,這里對圖像作直方圖均衡使虹膜的紋理信息更加清晰。
虹膜識別系統(tǒng)由光源、攝像頭、圖像分析系統(tǒng)(計算機)三部分構(gòu)成,對光源、攝像頭、計算機均沒有特殊的要求。圖像為8bit256級灰度圖。光源提供照明,使虹膜可以清晰地成像。光源應穩(wěn)定,因為隨入射光線強度的變化,瞳孔會產(chǎn)生收縮或擴張,牽動虹膜變化,增大匹配時的誤差。穩(wěn)定光源,即穩(wěn)定了虹膜,可以提高匹配的精度。
圖像分析系統(tǒng)對拍攝下的虹膜圖像進行預處理,包括對虹膜內(nèi)外邊界的定位,提取出虹膜部分進行直方圖均衡及歸一化操作等。之后從處理后的虹膜圖像中提取需要的紋理特征,包括像冠、水晶體、細絲、斑點、結(jié)構(gòu)、凹點、射線、皺紋和條紋等。識別階段即將待識別的圖像的特征向量與預存的參考圖像的特征向量進行匹配的過程,是典型的模式識別問題。通過比較提取的特征向量之間的相似性,進而確定圖像是否來自同一對象,以達到鑒定身份的目的。
圖1 虹膜圖像處理和識別系統(tǒng)框圖
虹膜圖像識別問題的關鍵在于特征的選取和算法選擇,特征是否有足夠代表性,其包含的信息量是否夠多直接影響到了識別效果,進而對最后的身份鑒別起決定性的影響。目前,國內(nèi)外有許多虹膜圖像的識別算法均能取得不錯的識別效果,如英國劍橋大學的John Daugman教授提出了一種利用多尺度二維Gabor濾波器提取虹膜紋理的識別算法,這是目前應用最廣泛的算法,在很多場合均取得了較高的識別效果。而本論文也采用了Daugman教授的多尺度二維Gabor濾波算法對圖像濾波從而提取出特征信息。
虹膜圖像是基于已提取的特征向量進行識別的,不同的圖像特征提取和編碼方式通常有不同的比較方法,要根據(jù)具體的特征選擇和編碼算法自行設計匹配算法。但也有多種通用的判別方法,如利用漢明距離(Hamming Distance)、加權(quán)歐幾里得距離(Weighted Euclidean Distance)、相關系數(shù)、Hausdorff 距離、不同虹膜間的歸一化碼間距等對待測圖像和參考圖像的相應信息對比,從而達到鑒定身份的目的。本文中就應用加權(quán)歐幾里得距離(WED)對提取的特征向量進行了識別,取得了令人滿意的鑒定效果。此外,神經(jīng)網(wǎng)絡(Neural Network)由于其強大的分類和自適應學習能力而被廣泛用于模式識別領域,本論文也嘗試了應用BP神經(jīng)網(wǎng)絡對虹膜進行了識別。
本文采用的眼部圖像取自中國科學院自動化研究所下屬的虹膜圖像數(shù)據(jù)庫(CASIA),均為8bit320×280大小的BMP位圖如圖2所示。
圖2 CASIA的虹膜圖像樣本
該數(shù)據(jù)庫中有108個不同人的虹膜圖像,每人在不同光照和角度的照片7張,分為兩組,分別用于測試和檢驗。本文采用的兩種虹膜識別方法均用到了兩組圖片,WED識別中作為標準圖片和待測圖片,BP神經(jīng)網(wǎng)絡中用作訓練樣本和測試樣本。這樣提高了系統(tǒng)識別的復雜性,使最終結(jié)果更加具有普遍性,更具有說服力,也使得算法更加嚴謹,客觀。
眼睛的外觀圖由鞏膜、虹膜、瞳孔幾部分構(gòu)成。虹膜在角膜和水樣液的后方,晶狀體的前方,是瞳孔之外鞏膜之內(nèi)的圓環(huán)部分。它包含了最豐富的紋理信息。虹膜與鞏膜、瞳孔的邊界均近似為圓形。因此,可將虹膜的內(nèi)外邊緣近似看作兩個不同心的圓。定位的過程就是找出內(nèi)外兩個圓的半徑和圓心的過程。
本文暨采用粗定位與精定位相結(jié)合的定位方法:先用灰度閾值分割法對圖像進行粗定位,得到內(nèi)邊界參數(shù),然后利用瞳孔的圓心及半徑來縮小搜索的范圍,再檢測圖像邊緣,對其使用Hough變換提取外邊界參數(shù),這種方法定位虹膜的內(nèi)外邊界。
由于虹膜與瞳孔的灰度差值很大,而且虹膜和瞳孔本身內(nèi)部的灰度值比較均勻,因此本文采用灰度閾值法分離瞳孔和虹膜,具體方法是先得到整個眼部圖像的灰度直方圖,再對圖像作二值化處理分離出瞳孔,即選擇一個閾值,將圖像轉(zhuǎn)化為黑白二值。變換函數(shù)形式如式(1),其中T為閾值,如果圖像中某個像素灰度值大于該閾值,則將該像素灰度值設定為255,否則置為0。
圖3 虹膜內(nèi)邊界的定位
之后對瞳孔圖像的二值灰度矩陣各行(列)灰度值依次求相鄰行(列)的灰度差,差值最大的減數(shù)行(列)與差值最小的被減數(shù)行(列)的序號(即坐標)的差值即為瞳孔直徑,再除以2即為內(nèi)邊界的半徑;然后用差值最大的減數(shù)行(列)的序號與半徑作差,得到的序號(即坐標)值為圓心的縱(列)橫坐標,這樣便得到了內(nèi)邊界的圓心坐標。最后依照圓心坐標及半徑在原始圖像上畫出內(nèi)邊界如圖3所示。
虹膜與鞏膜的邊界灰度差值不十分明顯,用灰度閾值法求外邊界的效果十分不理想,必須另想他法。Hough變換是理想的替代方法,其具體方法是:首先在圖像直角坐標系中定義一個圓心和半徑均可變化的圓。將參數(shù)適當離散化后,枚舉出圖像中所有可能的圓,統(tǒng)計每個圓經(jīng)過的外邊界點數(shù)目,數(shù)目最多的就是與外邊界最吻合的圓。但Hough變換需要遍歷整幅圖像,運算量巨大,而且虹膜圖像細節(jié)信息大,邊緣特征復雜,定位外邊界的效果不十分理想,因此需要先驗信息縮小遍歷范圍,降低運算量,提高定位準確率。本文先用Canny算子對圖像進行外邊界邊緣檢測,然后根據(jù)已知的內(nèi)邊界參數(shù)劃定外邊界參數(shù)的范圍,最后再結(jié)合這些先驗信息用Hough變換定位出虹膜外邊界如圖4所示。
圖4 虹膜外邊界的定位
由于光照和拍攝距離及位置等條件的不同,即使同一個人的虹膜圖像也會出現(xiàn)平移,縮放或旋轉(zhuǎn),進而對識別效果造成影響,得到的虹膜圖像不盡相同。而多尺度二維Gabor濾波器對圖像的旋轉(zhuǎn)等因素十分敏感。為了盡可能消除這個因素的影響,需要對虹膜圖像作歸一化和增強處理。歸一化的目的就是將每幅原始圖像調(diào)整到相同的尺寸和位置,以消除平移,放縮和旋轉(zhuǎn)的影響。此外為了便于紋理特征的提取,還需對圖像作增強處理,而增強是為了消除光照不均的影響,使得到的紋理信息更加清晰,突出細節(jié)信息,便于下一階段的特征提取。
虹膜的內(nèi)外邊界都為圓形,為此可以利用幾何方法。虹膜拉伸數(shù)學模型由于比較接近虹膜真實變化因而是個較好的選擇,利用該模型可將虹膜圖像的直角坐標轉(zhuǎn)化為極坐標形式,并展開成矩形。對虹膜圖像進行歸一化處理后,再用直方圖均衡處理,以突出虹膜的特征部分,便于觀察、檢測。
具體方法是利用拉伸模型將虹膜圖像從直角坐標系轉(zhuǎn)化到[0,1]間的極坐標系并展開為矩形,再作直方圖均衡,以增強紋理特征如圖5所示。
圖5 虹膜圖像的歸一化和增強
人眼的虹膜從形狀到紋理結(jié)構(gòu)具有許多可供區(qū)分、鑒定的特征,為了提取這些特征信息,需對虹膜圖像進行分解,對從中提取的信息編碼。現(xiàn)在最常用的特征提取算法為利用Gabor函數(shù)對圖像濾波,提取相位信息編碼。
二維Gabor函數(shù)是一維Gabor函數(shù)的二維拓展形式,引入高斯函數(shù)作為其窗函數(shù)。在窗形區(qū)域內(nèi),該函數(shù)與人眼視覺細胞的二維接受域波形極其相似,適合分析圖像不同頻率的細節(jié)信息,而通過參數(shù)調(diào)整,可以使Gabor函數(shù)具有不同的空間局部化特征,如方向選擇性、頻率選擇性和二次相位關聯(lián)性等。
本文提取虹膜特征的具體方法是先將虹膜環(huán)形圖像等分為12個子圖,由于上眼皮處的兩區(qū)域經(jīng)常被眼瞼、睫毛阻擋,這里除去不用,只選取10個子圖,用多尺度二維Gabor濾波器從4個頻率、4個角度分別對每個子圖以不同頻率、不同角度進行濾波,然后計算濾波后得到的子圖信息的平均絕對偏差,并將這些絕對偏差值作為特征值,排列形成統(tǒng)一大小的特征向量用于識別。設計思路如圖6所示。
圖6 虹膜圖像紋理特征的提取
選取這10個子圖不但能降低眼瞼、睫毛對識別效果的影響,還可以保證有足夠豐富的紋理信息被提取出來;而Gabor濾波器在空域和頻域具有良好的聯(lián)合定位能力,能夠提供空間頻率、位置和方向的最大分辨率,因而非常適合紋理特征分析。本文選擇濾波器的頻率為2、4、8、16周/度,每個頻率分別從0°、45°、90°、135°處對所有子圖濾波,每幅子圖有16個結(jié)果圖,再計算每幅結(jié)果圖的平均絕對偏差值,輸出共160個特征值,這樣能夠在最大程度上保證體現(xiàn)圖像的紋理特征。而圖像的平均絕對偏差定義如式(2),其中N是圖像的像素數(shù),m是圖像的均值,f(x,y)是在(x,y)點的值:
在提取了虹膜圖像的特征信息后,要對其進行分類,以達到識別圖像的目的。本文提出了兩種匹配方法對虹膜圖像進行識別,一種是計算圖像特征值之間的加權(quán)歐式距離(WED)的方法,另一種是利用學習了足夠特征信息的BP神經(jīng)網(wǎng)絡對圖像進行識別的方法。
具體方法是先將參考圖片的特征向量編譯成.mat文件保存,再對測試圖片提取特征向量并分別載入,用算法計算待測圖像特征值與每幅標準圖像特征值間的WED值,將結(jié)果一一對比,通過算法得到最小WED值的序號和數(shù)值。若待測虹膜特征值的WED在k時最小,并且此WED值小于設定的閾值,則認為待測虹膜是第k個虹膜,從而識別出虹膜,達到身份鑒定的目的。加權(quán)歐式距離(WED)的定義如式(3),其中Ai代表第i個子圖的加權(quán)系數(shù),BN和N分別代表子圖的數(shù)目和從每個子圖提取的特征總數(shù)。f(i,j)和fk(i,j)分別代表未知虹膜和第k個虹膜中第i個子圖的第j個特征分量。
人工神經(jīng)網(wǎng)絡是指利用工程技術手段模擬人腦神經(jīng)網(wǎng)絡的結(jié)構(gòu)和功能的一宗技術。它的目的是使機器有人腦那樣的感知、學習和推理能力。人工神經(jīng)網(wǎng)絡模型具有與人腦相似的高度并行性,良好的容錯性和聯(lián)想記憶功能、自適應和自學習能力、強大的分類能力、魯棒性,可以實現(xiàn)輸入到輸出的非線性映射,因此各類神經(jīng)網(wǎng)絡在圖像識別領域得到越來越多的應用。
本文使用的BP神經(jīng)網(wǎng)絡,是一種采用反向傳播算法的多層前饋網(wǎng)絡,能夠逼近任意的非線性映射關系,而且有很好的泛化能力。BP網(wǎng)絡模型處理信息的基本原理是:輸入信號通過中間節(jié)點作用于輸出節(jié)點,經(jīng)過非線性變換產(chǎn)生輸出信號。網(wǎng)絡訓練的每個樣本包括輸入向量和期望輸出量,通過分別調(diào)整輸入層與隱層間、隱層與輸出層間的參數(shù)(權(quán)值和閾值)使誤差沿梯度方向下降,經(jīng)過反復學習訓練,確定與最小誤差相對應的網(wǎng)絡參數(shù),訓練即告停止。此時經(jīng)過訓練的神經(jīng)網(wǎng)絡既能對類似樣本的輸入信息,自行處理輸出誤差最小、經(jīng)過非線性轉(zhuǎn)換的信息。
利用神經(jīng)網(wǎng)絡識別虹膜的具體方法是先輸入標準圖像的特征值讓神經(jīng)網(wǎng)絡訓練網(wǎng)絡各層的權(quán)值和閾值,當輸出與理想輸出的誤差達到某一設定值時,認為網(wǎng)絡收斂已訓練完畢,之后輸入待測圖像的特征值令神經(jīng)網(wǎng)絡根據(jù)訓練結(jié)果自行分類,從而達到識別圖像的目的。
在WED法中采用20人的虹膜圖像,每人有不同拍攝角度和拍攝距離的圖像3幅共60幅圖像進行測試。從中各選取1幅共20幅作為標準圖像,將每人剩余的2幅共40幅圖像作為待測圖像提取特征值,并一一與20幅標準圖像的特征值計算WED距離,取每次對比中最小WED距離為該算法的判斷結(jié)果,如表1所示。
在BP神經(jīng)網(wǎng)絡中采用10人的虹膜圖像,每人有不同拍攝角度和拍攝距離的圖像7幅共70幅圖像參與測試。每人用其中的4幅共40幅圖像提取特征值作為訓練樣本輸入到神經(jīng)網(wǎng)絡中進行訓練,再用其余的3幅共30幅圖像輸入到訓練好的神經(jīng)網(wǎng)絡中進行分類識別,結(jié)果如表3所示。
表3 兩種方法對虹膜圖像的識別結(jié)果
結(jié)合試驗結(jié)果得出結(jié)論:
試驗結(jié)果表明,用兩種方法對虹膜圖像進行識別的效果都比較理想,WED法的計算結(jié)果清楚明了,便于比較,準確率高,但判斷耗費的時間較BP神經(jīng)網(wǎng)絡長;神經(jīng)網(wǎng)絡需要訓練特征,對樣本數(shù)量的需求比WED法大,但判斷時間短,輸出結(jié)果簡單直觀,便于分析。若改進神經(jīng)網(wǎng)絡的輸入樣本特征類型,有望提高神經(jīng)網(wǎng)絡識別虹膜圖像的準確率;而WED法受圖像的拍攝角度和拍攝距離的影響較大,若要減弱這種影響,提高識別的準確率,需要對提取特征的算法作進一步的改善。
本文介紹了虹膜圖像處理和識別系統(tǒng),對各階段從圖像預處理到最終的虹膜識別用到的方法進行了研究與探討。在圖像預處理方面,選用灰度閾值和Hough變換的方法分別對虹膜內(nèi)外邊界定位,并實現(xiàn)預期功能;通過算法實現(xiàn)了對虹膜圖像歸一化以及直方圖均衡的處理以突出其紋理特征。在特征提取方面,選取了業(yè)內(nèi)著名的Daugman教授的多尺度二維Gabor濾波器方法對虹膜圖像濾波,編程實現(xiàn)了提取濾波后圖像的信息;選擇濾波后圖像的平均絕對偏差作為特征值,利用算法將其編譯成特征向量保存,為識別階段做準備;在特征識別方面選用了兩種方法:用加權(quán)歐幾里得距離(WED)對虹膜圖像的特征向量識別,鑒別效果十分理想;使用BP神經(jīng)網(wǎng)絡學習、訓練樣本特征值,進而對虹膜圖像識別,鑒別效果達到預期。
[1]龐尚珍,雷躍榮,馮雪,杜玲艷.虹膜識別技術研究[J].四川理工學院學報,2008,21(5):95-97.
[2]黃惠芳,胡廣書.虹膜識別算法的研究及實現(xiàn)[J].紅外與激光工程,2002,31(5):404-409.
[3]孟浩,徐翠平.虹膜識別算法的研究[J].哈爾濱工程大學學報,2006,27(3): 400-403/452.
[4]史鵬舉.孫光民.虹膜識別系統(tǒng)的研究[J].計算機應用研究,2004,23(增):509-511.