路 春 輝
(廣東工程職業(yè)技術學院信息工程學院 廣東 廣州 510520)
?
基于特征融合和優(yōu)化極限學習機算法的虹膜識別系統(tǒng)
路 春 輝
(廣東工程職業(yè)技術學院信息工程學院廣東 廣州 510520)
摘要針對虹膜圖像采集過程中存在光照、干擾等因素,為進一步提高虹膜圖像識別的準確率,提出一種基于組合特征提取的優(yōu)化極限學習機(ELM)模型來提高虹膜圖像識別的精度。模型考慮了特征提取和分類器優(yōu)化兩者均起著重要作用,利用灰度共生矩陣(GLCM)和多通道2D Gabor濾波器特征提取后進行特征融合,得到更豐富的特征信息,并設計改進了蜂群算法(IABC)優(yōu)化ELM模型作為分類器。同時設計的線性加權多目標函數(shù)綜合考慮分類精度和網(wǎng)絡結構,從而有效提高了虹膜識別的準確率。實驗表明提出的模型通過結合兩種特征提取方法,能提取出更豐富的可區(qū)分特征,并且結合優(yōu)化分類器得到了很高的分類準確率,是一種有效的虹膜識別模型。
關鍵詞特征提取虹膜識別灰度共生矩陣多通道2D Gabor濾波器極限學習機
0引言
生物特征識別技術是指通過計算機,利用人體所固有的生理特征或行為特征來進行個人身份鑒定。近年來,基于人臉、指紋、虹膜、聲音等生物特征的識別技術引起人們關注,其中人眼的虹膜具有豐富的紋理信息和特征,與其他生物特征相比,具有唯一性、穩(wěn)定性和非侵犯性等優(yōu)點。因此基于虹膜的身份識別系統(tǒng)研究正成為生物特征識別領域的一個研究熱點[1,2]。
虹膜識別系統(tǒng)主要包括三部分:(1) 虹膜圖像預處理;(2) 虹膜特征提??;(3) 虹膜分類。虹膜特征提取是虹膜識別系統(tǒng)中最重要的步驟之一。Daugman根據(jù)Gabor變換提出了2D Gabor濾波器理論[3]。之后Daugman[4]利用多尺度正交小波法提取虹膜紋理信息并生成2048位虹膜代碼。Monro等[5]采用一維離散余弦變換(DCT)作為特征提取方法進行虹膜匹配。Ma等[6]采用紋理分析方法并利用多通道Gabor濾波器捕捉虹膜圖像全局和局部細節(jié)。He等[7]基于灰度共生矩陣(GLCM)提取特征和圖像像素統(tǒng)計強度值屬性作為虹膜的特征。
通過分析可以發(fā)現(xiàn),盡管一些研究人員分別利用2D Gabor濾波器和GLCM進行特征提取,然而還未有相關的工作提出結合這兩種方法來進行虹膜特征提取。多通道2D Gabor濾波器能夠提供信號空間和頻率的局部信息,達到局部最優(yōu)化。而GLCM是一種統(tǒng)計分析方法,能夠反映紋理圖像中各灰度值在空間上的分布特性,是目前應用最廣泛的一種紋理統(tǒng)計分析法。同時,由于眼瞼、眼毛等對虹膜的遮擋和干擾,會使得提取的特征在準確性和穩(wěn)定性方面有所下降,影響識別準確度。為了進一步提高識別精度,本研究嘗試結合上述兩種方法,通過特征提取進行特征組合以得到新的特征集合,從而更有效地反映虹膜圖像的特征和紋理信息。
除了特征提取之外,分類器的選擇在虹膜識別系統(tǒng)中也起著重要的影響。在大多數(shù)虹膜識別研究中,使用較多的方法包括人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVM)以及基于距離的分類模型(DBC)[8]。其中SVM分類方法取得的效果較好。2007年,He等[7]利用傳統(tǒng)SVM進行虹膜識別。2008年,Roy等[9]利用遺傳算法進行特征選擇并結合非對稱SVM進行虹膜識別。2009年苑瑋琦等[10]提出基于紋理特征點匹配的自適應虹膜識別方法。同年,他又提出利用2D Gabor濾波器提取紋理方向特征的虹膜識別方法[11]。2011年,Roy等[12]利用Daubechies小波變換提取紋理特征,并結合遺傳算法和自適應非對稱SVM(AASVMs)以提高虹膜識別準確率。
從這些研究中可以發(fā)現(xiàn),基于人工智能技術的虹膜識別方法已得到了廣泛的關注和研究,其中基于SVM的分類模型取得了很好的效果,但仍存在以下兩個問題:(1) SVM中的核寬γ和懲罰因子C對分類效果起著重要影響,傳統(tǒng)的網(wǎng)格搜索和基于梯度下降[13]的搜索方法都各有不足,難以找到最優(yōu)的參數(shù),使得模型的表現(xiàn)不穩(wěn)定;(2) 在設計適應度函數(shù)時,通常都是采用分類準確率作為評估標準,很少考慮其他重要因素,容易產(chǎn)生過擬合問題,也會消耗大量訓練時間,降低模型的分類效率。
基于上述分析,為了克服上述缺點,得到識別率更高的虹膜識別模型,提出了結合GLCM和多通道2D Gabor濾波器的特征提取方法,并結合優(yōu)化極限學習機(ELM)分類模型—IABC-ELM模型,用于虹膜識別。該模型提出利用GLCM和多通道2D Gabor濾波器進行特征提取,然后將兩種方法得到的特征子集進行特征組合作為分類模型的輸入。在分類模型上,提出改進的蜂群算法IABC(Improved Artificial Bee Colony)用于優(yōu)化ELM分類模型的網(wǎng)絡權重,從而得到最優(yōu)的分類模型。此外,設計了線性加權多目標函數(shù),在最大化分類精度的同時也考慮了網(wǎng)絡結構的簡化,目標函數(shù)由分類準確率和網(wǎng)絡隱層節(jié)點個數(shù)兩個子函數(shù)通過線性加權計算所得。
1改進的蜂群算法(IABC)
ABC算法由Erciyes大學Karaboga教授于2005年提出,它是最重要的元啟發(fā)智能算法之一,源于蜜蜂覓食行為的研究,其核心思想是利用蜂群的協(xié)作機制結合個體蜜蜂的局部搜索,實現(xiàn)有針對性尋找最優(yōu)解的過程[14]。由于ABC算法簡單易實現(xiàn)、調(diào)節(jié)參數(shù)少、全局尋優(yōu)能力強,并且在解決實際問題中展示了優(yōu)越性,近年來被廣泛用于解決各種現(xiàn)實復雜優(yōu)化問題[15]。
ABC算法的具體機制如下:蜂群由三種蜜蜂組成,分別是雇傭蜂、跟隨蜂和偵查蜂。蜂群的食物源可看作為問題P的可行解集合,每一個食物源的位置與問題中每一個可行解相對應,目標函數(shù)f的計算值決定食物源的優(yōu)劣,雇傭蜂的數(shù)量與食物源的數(shù)量相等,那么食物源的位置可用實數(shù)向量xi=(xi1,xi2,…,xid)表示。初始種群根據(jù)下面公式隨機生成SN個解實數(shù)向量,每個解xi,i =1,2,…,SN,其中SN是一個d維向量。
(1)
算法將這些食物源隨機分配給雇傭蜂,并利用目標函數(shù)計算其適應度值,然后開始對食物源進行循環(huán)搜索,循環(huán)次數(shù)為gen,當指定精度達到預定值或者達到最大迭代次數(shù)設定值Genmax時,算法停止運行。首先,雇傭蜂對相應的食物源進行搜索,隨機選擇一個不同于自己的鄰域蜂,按照下面的公式在解空間內(nèi)進行鄰域探索,從而產(chǎn)生新的食物源vij:
vij=xij+uij(xij-xkj)
(2)
其中uij是[-1,1]之間均勻分布的隨機實數(shù),j和k是隨機產(chǎn)生的維度數(shù)值,且j必與k相異。
研究發(fā)現(xiàn),ABC算法具有較強的全局搜索能力,但是局部搜索能力較弱[16],在偵查蜂搜索階段,算法摒棄了當前解,隨機生成一個新的可行解。該解可能是個比之前更差的解,降低了算法效率,因此為了進一步提高ABC算法的性能,考慮了當前解的情況,基于當前解所提供的信息產(chǎn)生新的可行解,使得新的解不是完全隨機生成,而是得到之前解的指導信息,朝更好的方向搜索。解的更新式為:
(3)
(4)
其中fitnessi是第i個解對應的適應度值,NP為種群數(shù)量。
當一個食物源xi在某一位置連續(xù)limit代都未得到改善,說明解xi很有可能陷入局部極小值而未找到全局最優(yōu)解,則相對應的跟隨蜂棄掉該食物源,并根據(jù)式(3)的搜索方式生成一個新的食物源。算法的具體流程如圖1所示。
圖1 ABC算法的整體流程圖
2極限學習機(ELM)
ELM算法由Huang等提出,它是一種新型單隱層前饋神經(jīng)網(wǎng)絡,研究已經(jīng)證明了ELM具有與神經(jīng)網(wǎng)絡相同的全局逼近能力[17]。其網(wǎng)絡結構分為三層:輸入層、單個隱藏層和輸出層,其中的網(wǎng)絡輸入權重和隱偏倚隨機生成,且一旦生成不需要調(diào)節(jié),輸出權重值直接由最小二乘估計方法計算得出。ELM不僅具有良好的泛化能力,而且由于不需要迭代調(diào)節(jié)網(wǎng)絡權重值,避免了梯度下降算法產(chǎn)生的局部極值、學習時間長以及學習率的影響等問題,極大地提高了訓練和測試速度,因此ELM的研究和應用受到了廣泛的關注。
極限學習機的網(wǎng)絡結構如圖2所示。
圖2 ELM的網(wǎng)絡結構
對于N個不同的訓練樣本集(xi,ti), i =1,2,…,N,其中xi= [xi1,xi2, …,xid]T∈ Rn, ti= [ti1,ti2,…,tim]T∈Rm,具有L個隱層節(jié)點和激活函數(shù)g(x)的單隱層前饋神經(jīng)網(wǎng)絡,表達式如下:
(5)
其中wj= [wj1,wj2,…,wjn]T( j = 1, 2, …, L)表示連接第j個隱層節(jié)點和輸入層節(jié)點之間的輸入權重向量值,bj表示第j個隱層節(jié)點的偏倚,wj·xi表示wj和xi的內(nèi)積,βj= [βj1,βj2,…,βjL]T表示連接第j個隱層節(jié)點和輸出層節(jié)點之間的輸出權重向量值。Oi為網(wǎng)絡中相應的xi的實際結果。
Huang等在文獻[18]中已經(jīng)證明如果激活函數(shù)g(x)無限可微,那么單隱層網(wǎng)絡中的輸入權重值和隱層偏倚值可以隨機生成,且一旦固定不需要迭代調(diào)節(jié),使得:
(6)
上述公式實際上就是找到線性系統(tǒng)Hβ = T的最小二乘解β′。其中T = [t1, t2, …, tm]T是目標矩陣(期望得到的輸出值)。
H=H (w1,w2,…,wL,b1,b2,…,bL,x1,x2,…,xN)
(7)
其中H = {hij} (i =1,2,…,N;j =1,2,…,L)稱為隱層輸出矩陣,H的第j個隱層節(jié)點的第j列對應輸入x1, x2, …, xN,H的第i行對應輸入xi的輸出向量。
若隱層節(jié)點數(shù)L等于訓練樣本個數(shù)N時,那么H是個可逆方陣,單隱層前饋神經(jīng)網(wǎng)絡能以零誤差逼近訓練樣本。但在大多數(shù)情況下,隱層節(jié)點個數(shù)會遠小于訓練樣本個數(shù),即L?N,那么H是一個N×L的矩陣,通常采用最小二乘方法來確定線性系統(tǒng)的輸出權重值:
β′=H+T
(8)
其中H+為隱層輸出矩陣H的Moore-Penrose廣義逆矩陣。
ELM算法的學習過程主要分為三步:
(1) 隨機產(chǎn)生輸入權重值和隱層偏倚值(wi, bi), i = 1, 2,…,L;
(2) 根據(jù)式(4)計算隱層輸出矩陣H;
(3) 計算輸出權重值β:β′=H+T,完成ELM的學習。
3提出的模型
在這一部分,將詳細介紹基于結合GLCM和多通道2D Gabor濾波器特征提取的IABC-ELM虹膜識別系統(tǒng)。如之前所述,本系統(tǒng)的目的是要進一步提高虹膜識別的準確率。為了讓系統(tǒng)獲得更好的性能,本模型整個運行的過程包括三個階段:第一階段,利用GLCM結合多通道2D Gabor濾波器進行特征提取,將這兩種方法提取出的特征組成新的虹膜特征集合;第二階段,利用第一階段提供的最優(yōu)特征集合作為分類模型的輸入,在不同訓練數(shù)據(jù)集上進行訓練,同時利用改進的ABC算法優(yōu)化ELM模型,得到最優(yōu)IABC-ELM分類器;第三階段,利用訓練好的分類器在測試數(shù)據(jù)集上測試其模型的性能,從而達到虹膜識別的目的。
3.1圖像預處理
為了準確獲取虹膜信息,消除光照不均勻等因素影響,提高虹膜識別準確率,在特征提取前要對虹膜圖像進行預處理。我們通過六個步驟實現(xiàn)圖像預處理,具體處理過程如圖3所示。
圖3 圖像預處理流程
第一步:評估圖像質量,篩掉質量較差的圖像;第二步:基于光斑中心,根據(jù)經(jīng)驗值確認兩個感興趣區(qū)(ROI),包括較小ROI中的瞳孔區(qū)和較大ROI中的瞳孔和虹膜區(qū);第三步:利用坎尼算子和霍夫變換對較小ROI區(qū)域中的瞳孔進行定位;第四步:通過較大ROI區(qū)域中虹膜和白膜間的灰度梯度差異進行邊緣定位;第五步:對圖像標準化操作,消除虹膜在徑向延伸的影響(產(chǎn)生虹膜圖像為512×64像素);第六步:用全局直方圖強化圖像以消除不均勻光照等外界因素的影響。圖像預處理過程效果如圖4所示。
圖4 圖像預處理各階段示意圖
3.2多通道2D Gabor濾波特征提取
基于Gabor濾波器被廣泛用于計算機視覺中,2D Gabor濾波器具有可調(diào)方向和徑向頻率選擇、可調(diào)中心頻率等一系列優(yōu)點,具體可參考文獻[19]。在本文研究中,采用這種方法進行特征提取。直角坐標系下2D Gabor的表達式如下:
(9)
其中f是沿x軸θ方向的正弦平面波頻率,σx′和σy′分別是沿x′軸和y′軸的標準差。
為了得到多方向和多尺度的紋理信息,本文采用的多通道2D Gabor濾波器,通過不同方向的濾波器對紋理圖像進行濾波,選輸出響應最大的濾波器方向作為紋理方向。利用g(x)作為生成函數(shù),可得到一組自相似濾波器,即Gabor濾波,表達式如下:
(10)
其中θ=nπ/k,{k|k>1,k∈Z},k為總方向個數(shù),m和n分別表示尺度和方向的個數(shù),n∈[0,k],a-m是比例系數(shù)。通過改變m和n的值可以得到一組方向和尺度各不相同的過濾器。
同時Gabor非正交性意味著在過濾后的圖像中存在冗余信息,接下來需要降低這個冗余性。我們設置粗尺度濾波器和最優(yōu)尺度濾波器的中心頻率以確保Gabor濾波器的響應可以相互聯(lián)系但不會在峰值頻率相交。分別設濾波器的最高和最低頻率值,差異度的計算式如下:
(11)
對給定圖像,Gabor變換函數(shù)的表達式如下:
(12)
其中*表示復共軛操作符,(u,v)∈Ω表示濾波窗口的大小。變換系數(shù)的均值μmn和方差σmn分別定義為:
(13)
(14)
最后,通過結合μmn和方差σmn,可得到虹膜的特征向量:
FS={μ00,σ00,μ01,σ01,…,μM-1K-1,σM-1K-1}
其中M和K分別為多通道2D Gabor濾波器的尺度大小和方向。
3.3IABC-ELM模型
IABC-ELM模型是針對ELM模型自身網(wǎng)絡權重參數(shù)優(yōu)化問題,利用IABC算法良好的全局尋優(yōu)能力,對ELM的權重進行自適應迭代優(yōu)化,以得到更優(yōu)的分類器。模型的整體流程如圖5所示。該模型主要通過下面的步驟進行構建:
第一步選擇L×(n+1)維粒子對解進行編碼,其中前L×n維表示輸入權重值,其余的L維表示隱層偏倚值,它們都是連續(xù)實數(shù);
第二步對種群進行初始化,設定種群的大小、最大迭代次數(shù)、臨界次數(shù)等參數(shù);
第三步利用第二步所得到的解在ELM模型上訓練;
第四步由于我們在最大化分類精度的同時,也要盡可能地簡化ELM網(wǎng)絡結構,所以設計的線性加權多目標函數(shù)綜合考慮了平均分類準確率ACC(Averaged accuracy rate)和網(wǎng)絡隱層節(jié)點個數(shù),適應度值根據(jù)如下等式計算:
(15)
(16)
F=a·f1+(1-a)·f2
(17)
其中f1表示K折交叉驗證K-fold CV(K-fold cross validation)得到的ACC均值,f2中的L表示ELM網(wǎng)絡隱層節(jié)點個數(shù),N為總節(jié)點個數(shù)。a為常量值,表示ELM分類精度所占的權重值,1-a為隱層節(jié)點個數(shù)所占的權重值,權重可以調(diào)整到一個恰當?shù)闹?,這主要取決于各個子目標函數(shù)對評估結果的貢獻大小,在本文中通過多次試驗,a取值為0.8,在計算適應度值后,保存全局最優(yōu)適應度值、全局最優(yōu)個體;
第五步增加迭代次數(shù);
第六步根據(jù)式(3)更新粒子相對應的位置,新粒子的位置不能超出界限,若新的粒子的位置超出了界限[Xmin,Xmax],那么新的位置設為其邊界值Xmin或Xmax;
第七步利用第六步得到新的粒子進行解碼所得到參數(shù)在ELM上訓練,并根據(jù)式(17)計算該粒子的適應度值;
第八步記錄當前種群的最優(yōu)粒子,若當前的適應度值大于存儲的最優(yōu)適應度值,更新存儲適應度值為當前值,否則,保持存儲的適應度值不變;
第九步如果達到最大種群數(shù)量,算法轉到第十步運行,否則,轉到第六步運行;
第十步比較當前適應度值和全局最優(yōu)適應度值,若當前值大于存儲的全局最優(yōu)適應度值,更新為當前值,否則,保持存儲的適應度值不變;
第十一步如果達到最大迭代次數(shù),算法轉到第十二步運行,否則,轉到第五步繼續(xù)進行迭代優(yōu)化;
第十二步輸出全局最優(yōu)的粒子,進行解碼得到最優(yōu)參數(shù);
第十三步利用得到的最優(yōu)參數(shù)結合訓練集在ELM上訓練,構造出最優(yōu)的分類器;
第十四步利用得到的分類器在測試集上進行測試并輸出最終的分類結果。
圖5 模型的總體流程圖
4實驗設計
4.1數(shù)據(jù)描述
本實驗所采用的虹膜數(shù)據(jù)集是利用虹膜圖像捕獲設備對一些測試人員進行數(shù)據(jù)采集,自組建的虹膜數(shù)據(jù)庫BR-IRIS。圖6給出了BR-IRIS圖像數(shù)據(jù)庫中的一些樣本,BR-IRIS數(shù)據(jù)庫的基本信息如表1所示。在該數(shù)據(jù)庫中共有180個樣本,我們分別捕捉了在不同光照條件下每個人左右虹膜的持續(xù)5秒的視頻圖像。每個視頻包含25幀/秒,共采集11 500張圖片。圖像大小為480×576的8位灰度圖像。此外,在實驗過程中為了避免過擬合和欠擬合現(xiàn)象的發(fā)生,使得結果更具說服力,采用雙層交叉驗證方法[20]。內(nèi)層5折交叉驗證用來確定最優(yōu)特征子集和最優(yōu)參數(shù)組合,外層5折交叉驗證用于評估ELM的分類性能。由于運行一次交叉驗證不能保證結果的公正性,同時數(shù)據(jù)是隨機抽樣分割的,每次生產(chǎn)的訓練集和測試集不會完全一樣,在本實驗中將模型運行10次,然后求平均值作為最終結果。
圖6 BR-IRIS數(shù)據(jù)庫圖像的樣本
年齡性別采樣時間段采樣環(huán)境19~45歲,大部分年齡在30歲左右男:女=8:210點,14點和19點三個時段室內(nèi)正常光線(上午、下午和晚上)
4.2實驗設置
本文提出的虹膜識別模型是Matlab 2012a開發(fā)環(huán)境下設計實現(xiàn)的,ELM 采用的是ELM工具包,采用的機器配置為Intel四核處理器,主頻2.0GHZ,4GB內(nèi)存。
在接下來模型的訓練和相關算法比較過程中,模型的詳細參數(shù)設置如下:對于GLCM,窗口大小為8,灰度值為16,像素對間距為4;對于Gabor濾波器,使用兩組方向的濾波器對圖像進行濾波,選取輸出響應最大的濾波器方向作為該塊的方向,其方向分別設置為θ=0°,45°,90°,135°和θ=0°,30°,60°,90°,120°,150°。濾波器的最高和最低頻率分別為0.45和0.05;對于ABC算法,粒子初始位置均設為[-1,1]之間的隨機數(shù),種群數(shù)量為40,最大迭代次數(shù)為80,limit值為SN×D[21],其中SN為種群個數(shù),D為解的維度。ELM中隱層激活函數(shù)采用Sigmoid函數(shù)?;诰W(wǎng)格計算的SVM(Grid-SVM)模型中C和γ的搜索范圍分別為C∈{2-10,2-9,…,215}和γ∈{2-15,2-14,…,25}。
5實驗結果分析
為了驗證提出的模型的有效性,首先分別采用基于GLCM和基于多通道2D Gabor過濾器特征提取,其中利用GLCM提取出一個特征子集,利用多通道2D Gabor提取出四個特征子集,然后將這兩組特征子集組合得到新的四組特征子集。也就是說,共得到九個虹膜特征子集。為了便于說明,將這九個特征集合標記為fs1到fs9。表2給出了特征集合所相應的特征提取方法和參數(shù)。
表2 特征子集所對應的特征提取方法和參數(shù)設置情況
實驗首先對虹膜特征組合的有效性進行評估。為了驗證特征組合的有效性,表3給出了ELM模型通過5折CV在不同特征子集上得到的分類結果(Avg為均值,Dev為均方差)。
表3 九組特征子集在5折CV下分別結合ELM所得到的識別精度
為了使實驗結果更明晰,圖7給出了所得分類結果的比較。
圖7 基于GLCM和多通道2DGabor濾波器特征提取在ELM上的識別精度比較
從圖7中可以看出,基于多通道2D Gabor濾波器提取出四組特征子集的識別精度均高于基于GLCM的特征提取方法。這說明在虹膜特征提取方面,多通道2D Gabor濾波器比GLCM更穩(wěn)定。
圖8給出了通過GLCM提取的特征、多通道2D Gabor濾波器提取出的特征以及特征組合這三類特征集合在ELM分類模型上所取得的識別精度比較。從圖8中可以看出,組合的特征集合得到了最好的結果,這說明,基于GLCM和多通道2D Gabor濾波器在特征提取上具有互補性,通過特征組合能夠進一步提高虹膜識別精度。
圖8 基于GLMC特征子集、2DGabor濾波器特征子集和組合特征子集在ELM分類器上得到的識別精度比較
從圖9可以看出,基于IABC-ELM分類模型在5折CV上的識別精度均高于ELM模型,其識別精度平均高了2%。圖10給出了ELM和IABC-ELM模型均方差的結果比較,從結果可以看出,基于IABC-ELM的模型的均方差值較小,說明了本方法具有良好的穩(wěn)定性。
圖9 基于IABC-ELM和Grid-ELM模型的識別精度比較結果
圖10 不同特征集合在兩種方法上得到的均方差值比較
另外為了驗證提出的IABC算法的全局搜索能力和收斂速度,實驗進一步對IABC算法的演化機制進行了研究,給出了IABC算法在虹膜數(shù)據(jù)集5折CV過程中某1折數(shù)據(jù)集上(選出的是第1折)最優(yōu)適應度值的變化過程,如圖11所示。注意到圖中顯示的是全局最優(yōu)值的演化過程,將每一次迭代中所有解的最優(yōu)適應度值記錄下來。通過觀察可以發(fā)現(xiàn),IABC適應度曲線從第一次迭代一直到第80次迭代逐步演化,曲線在演化的初始階段增長比較迅速,在第18次迭代時收斂到最高值,之后適應度值趨于平穩(wěn)。該現(xiàn)象說明了提出的IABC算法具有很好的全局搜索能力和收斂速度,能迅速收斂到全局最優(yōu)解,因此能夠有效地實現(xiàn)了ELM模型參數(shù)的優(yōu)化過程。
圖11 IABC算法在第1折上訓練數(shù)據(jù)的適應度值
由于采用ELM作為分類器,實驗進一步分析ELM的隱層節(jié)點以及權重參數(shù)變化對分類性能的影響。圖12給出的是隨ELM隱層節(jié)點變化對虹膜識別精度的影響。由圖可見,初始階段隨著隱層節(jié)點個數(shù)的增加,識別精度曲線呈顯著上升趨勢,當節(jié)點個數(shù)為7時,得到最大精度,然而隨著節(jié)點數(shù)的繼續(xù)增加,識別精度呈下降趨勢。這是由于ELM隱層節(jié)點個數(shù)對分類精度有較大影響,當節(jié)點數(shù)過多時易造成ELM過擬合,降低了模型分類精度。因此本實驗中取模型隱層節(jié)點數(shù)為7時分類性能最優(yōu)。另外,從表4結果可見,在相同特征子集和相同隱層節(jié)點值條件下,每一折過程中基于ELM分類器所得的識別精度均低于IABC-ELM分類器,這說明ELM的權重參數(shù)對虹膜識別精度也具有重要影響。分析其原因是由于ELM會隨機產(chǎn)生非最優(yōu)或不必要的權重值和偏倚值,降低了算法的性能,造成取得的結果不穩(wěn)定。而通過IABC優(yōu)化ELM權重參數(shù),能夠找出最優(yōu)的參數(shù)從而進一步提高模型的分類精度。
圖12 模型分類精度隨ELM隱層節(jié)點個數(shù)變化情況
foldfs6fs7fs8fs9fs6fs7fs8fs9ACC(%)(ELM)ACC(%)(IABC-ELM)#197.41797.78697.04897.78699.26299.26299.26299.631#296.67998.15597.78696.67998.89398.89398.89398.893#397.77896.29697.03796.29698.88999.25999.63099.630#497.40797.40798.14897.77899.63099.63099.63099.630#596.31095.94195.94197.78698.89398.89398.89399.262Avg97.11897.11797.19297.26599.11399.18799.26199.423Dev0.6030.9570.8480.7220.3300.3080.3680.330
此外,實驗對基于ELM、IABC-ELM和SVM模型的訓練時間、測試時間和準確率進行了比較,如表5所示。從表中可知,SVM模型計算效率最低,這是由于采用基于網(wǎng)格的方法需要大量訓練時間,極大降低了計算效率。ELM模型所用時間最少,這是由于原始ELM算法隨機產(chǎn)生權重參數(shù)且無需迭代調(diào)節(jié),從而具有極快的訓練速度和測試速度。而IABC-ELM的訓練時間和測試時間稍多于ELM模型,分析其原因是由于采用IABC算法自適應迭代調(diào)節(jié)ELM模型權重參數(shù),與ELM模型相比,雖然訓練時間和測試時間分別增加了1.132 s和1.016 s,但使得虹膜識別的準確率提高了2.158%,因此在計算效率上是可接受的。
表5 三種模型的訓練時間、測試時間及精度比較
6結語
虹膜識別作為身份認證的一種新技術,得到了人們廣泛的關注和研究,一個更加精確、穩(wěn)定的虹膜識別系統(tǒng)可極大地降低錯誤識別的風險。為此提出了基于特征融合的優(yōu)化ELM虹膜識別模型。在該模型中,利用GLCM和多通道2D Gabor濾波器分別進行特征提取,之后將兩組特征集合進行特征組合,得到了更豐富的虹膜信息,同時提出改進的ABC算法優(yōu)化ELM分類模型,進一步提高了虹膜識別精度,設計了綜合考慮分類精度和ELM網(wǎng)絡隱層節(jié)點個數(shù)的線性加權多目標函數(shù),在最大化精度的同時也精簡了網(wǎng)絡結構。通過實驗,從特征提取和分類模型優(yōu)化兩方面,比較了該模型與ELM的分類準確率和均方差等性能指標。結果表明,與傳統(tǒng)特征提取算法相比,本文提出的模型不僅能夠得到更優(yōu)的虹膜特征集合,而且其識別精度也得到極大的提高,獲得了99.423%的識別精度,是一個有效的虹膜識別模型。
當然,該模型還存在許多值得進一步研究的地方。首先,采用的是基于ABC算法的優(yōu)化模型,其他的優(yōu)化算法在該數(shù)據(jù)集上是否具有更好的表現(xiàn);其次,將本文模型用于其他虹膜識別數(shù)據(jù)庫看其識別效果,是下一步的研究工作。
參考文獻
[1] Zhenan Sun,Xianchao Qiu,Tieniu Tan.Toward Accurate and Fast Iris Segmentation for Iris Biometrics[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(9):1670-1684.
[2] Tieniu Tan,Zhaofeng He,Zhenan Sun.Efficient and robust segmentation of noisy iris images for non-cooperative iris recognition[J].Image and Vision Computing,2010,28(2):223-230.
[3] John G Daugman.Two-dimensional spectral analysis of cortical receptive field profiles[J].Vision Research,1980,20(10):847-856.
[4] John G Daugman.Statistical richness of visual phase information:Update on recognizing persons by iris patterns[J].International Journal of Computer Vision,2001,45(1):25-38.
[5] Monro D M,Rakshit S,Zhang D.DCT-based iris recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(4):586-595.
[6] Ma L,Tan T N,Wang Y H.Personal identification based on iris texture analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(12):1519-1533.
[7] He X F,An S J,Shi P F.Statistical texture analysis-based approach for fake iris detection using support vector machines[J].Advances in biometrics,Lecture Notes in Computer Science,2007,46(2):540-546.
[8] John G Daugman.New methods in iris recognition[J].IEEE Transactions on System,Man,and Cybernetic,Part B:Cybernetics,2007,37(5):1167-1175.
[9] Roy K,Bhattacharya P.An iris recognition method based on zigzag collarette area and asymmetrical support vector machines[C]//IEEE International Conference on System,Man and Cybernetics,2006(1):861-865.
[10] 苑瑋琦,林忠華,徐露.一種基于紋理特征點匹配的自適應虹膜識別方法[J].儀器儀表學報,2009,30(2):232-236.
[11] 苑瑋琦,馮琪,柯麗.利用2D-Gabor濾波器提取紋理方向特征的虹膜識別方法[J].計算機應用研究,2009,26(8):3166-3168.
[12] Roy K,Bhattcharya P,Suen C Y.Towards nonideal iris recognition based on level set method,genetic algorithms and adaptive asymmetrical SVMs[J].Engineering Applications of Artificial Intelligence,2011,24(3):458-475.[13] Chapelle O,Vapnik V,Bousquet O.Choosing multiple parameters for support vector machines[J].Machine Learning,2002,46(1-3):131-159.
[14] Karaboga D,Basturk B.A powerful and efficient algorithm for numerical function optimization:artificial bee colony (ABC) algorithm[J].Journal of Global Optimization,2007,39(3):459-471.
[15] TsungJung H,WeiChang Y.Knowledge discovery employing grid scheme least squares support vector machines based on orthogonal design bee colony algorithm[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2011,41(5):1198-1212.
[16] Gao W F,Liu S Y.A modified artificial bee colony algorithm[J].Computers & Operations Research,2012,39(3):687-697.
[17] Huang G B.Extreme Learning Machine for Regression and Multiclass Classification[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B,2012,42(2):513-529.
[18] Huang G B,Ding X,Zhou H.Optimization method based extreme learning machine for classification[J].Neurocomputing,2010,74(3):155-163.
[19] Bovik A C,Clark M,Geisler W S.Multichannel texture analysis using localized spatial filters[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,12(1):55-73.
[20] Chen H L.A novel bankruptcy prediction model based on an adaptive fuzzy k-nearest neighbor method[J].Knowledge Based Systems,2011,24(8):1348-1359.
[21] Karaboga D,G?rkemli B,Ozturk C.A comprehensive survey: artificial bee colony (ABC) algorithm and applications[J].Artificial Intelligence Review,2014,42(1):21-57.
收稿日期:2015-04-13。廣東省科技廳項目(粵科規(guī)財字[2015]72號)。路春輝,講師,主研領域:數(shù)據(jù)挖掘,計算機圖像處理,模式識別。
中圖分類號TP3
文獻標識碼A
DOI:10.3969/j.issn.1000-386x.2016.07.073
AN IRIS RECOGNITION SYSTEM BASED ON FEATURE FUSION AND OPTIMIZED EXTREME LEARNING MACHINE ALGORITHM
Lu Chunhui
(CollegeofInformationEngineering,GuangdongEngineeringPolytechnic,Guangzhou510520,Guangdong,China)
AbstractThe acquisition of iris image is easily affected by the uneven light and noise interference, thus, an optimized extreme learning machine (ELM) based on feature extraction is proposed to improve the accuracy of iris recognition. In the proposed model, considering both feature extraction and classifier selection play an important role, the gray level co-occurrence matrix (GLCM) and multi-channel 2D Gabor filters are used for separate feature extraction, and then two groups of feature sets are combined for achieving more information characteristics. Moreover, an improved artificial bee colony (IABC) is designed to conduct parameter optimization for ELM. Besides, a linear-weighted multi-objective function is designed to take into account the average accuracy rate and the number of ELM network hidden-layer nodes, which helps to improve the accuracy of model. Experimental results show that the proposed algorithm not only extracts more distinguished information by the combination of two feature extraction methods, but also obtains the highest accuracy, which proves the validity of the proposed model.
KeywordsFeature extractionIris recognitionGray level co-occurrence matrixMulti-channel 2D Gabor filtersExtreme learning machine