唐婉冰,關 瑜,王子豪,李 琛
(北方工業(yè)大學計算機學院,北京 100041)
隨著當今科學技術的發(fā)展,信息安全和公共安全等社會問題日益突出,訪問人的身份識別成為保障信息安全和公共安全的重要手段。使用人體所固有的特征來進行身份鑒定的生物特征識別,由于其自身獨特的優(yōu)勢吸引了大量研究者的興趣??捎米錾矸葑R別的生物特征主要包括:視網(wǎng)膜、指紋、人臉、人耳、掌紋、步態(tài)、虹膜、手形、簽名、語音和擊鍵等。目前已有的生物特征識別系統(tǒng)對環(huán)境的要求較高,然而在實際應用中,常常需要實現(xiàn)對被監(jiān)控個體的遠距離非打擾識別。研究發(fā)現(xiàn)人耳具有特征穩(wěn)定,不受化妝、表情、年齡變化等因素影響的特征,并且人耳數(shù)據(jù)可以方便地從視頻或照片信息中獲取,易實現(xiàn)遠距離、非打擾式的識別使其吸引了越來越多專家及學者的關注。
目前常用的特征提取方法有主成分分析(PCA)、局部二值模式(LBP)和局部線性嵌入(LLE)等,這些方法均取得了一定的識別效果??紤]到PCA 在提取全局特征方面的優(yōu)勢及LBP 在提取局部紋理細節(jié)方面的優(yōu)勢,本文研究一種結合LBP 和PCA 的人耳特征提取方法,經(jīng)過實驗證明,該方法能夠從人耳圖像中提取出較好的用于識別的特征。
基于PCA 的特征提取是一種常用的基于協(xié)方差矩陣對信息進行處理、壓縮及提取的有效方法[1]。其將人耳作為一個整體處理,通過求解訓練樣本散布矩陣的特征值問題,利用線性變換提取主元,以一組數(shù)量小于樣本空間維數(shù)的正交基為特征空間,識別時將測試的人耳圖像投影到此空間,得到一組投影系數(shù),用于表達人耳。PCA 方法通過降低特征維數(shù),使得特征表達更為緊湊,并且可使用人耳圖像的原始灰度數(shù)據(jù)直接用來識別,降低計算強度。
對圖像使用PCA 降維獲取特征的步驟如下[2]:
1)假設訓練集有n 幅人耳圖像,每個圖像樣本大小為M×N,則訓練樣本矩陣X 為:
其中,向量Xi為由第i 個圖像的每一列向量堆疊成一列的MN 維向量,即把矩陣向量化。
計算訓練圖片的平均耳Ψ:
并計算每幅人耳圖像的差值耳di:
2)計算圖像數(shù)據(jù)的協(xié)方差矩陣C:
其中差值耳矩陣A 為:
3)對協(xié)方差矩陣進行奇異值(SVD)分解得到圖像的特征值λi和特征向量Vi,并找出前n 個最大特征值對應的特征向量ui:
則特征臉空間W 為:
4)將每一幅人耳圖像的差值耳矢量投影到“特征耳”空間Ωi,即:
LBP 是一種用來描述圖像局部紋理特征的算子,其基本思路是通過比較圓形鄰域內的像素點與其鄰域內像素灰度值的大小,并用二進制模式表示的比較結果來表述局部紋理特征。LBP 理論在描述紋理特征方面有顯著的效果。圖像的局部紋理T 的分布可假設認為是灰度級為P(P >0)的圖像中所有像素的灰度聯(lián)合分布密度。局部紋理T[3]可表示為:
其中,hc表示圖像局部鄰域中心像素點的灰度值,hp(p=0,...,p-1)是在半徑為R(R >0)的圓形對稱區(qū)域內p 個相等空間像素灰度值。
圖1 為3 種不同的LBP 算子。
基本的LBP 算法是定義3 ×3 窗口的中心像素為閾值,將剩余的8 個像素的灰度值依次與閾值比較,大于中心點像素的,則標記為1,否則標記為0。最后將中心像素點周圍的8 位二進制數(shù)轉化為十進制數(shù),即為此窗口的LBP 值。若中心像素值為ip周圍的8 個像素,像素值依次為i1~i8,則LBP 值[4]為:
其中,(xc,yc)代表3 ×3 鄰域的中心元素,它的像素值為ic,ip則代表鄰域內其他像素的值。s(x)是符號函數(shù),當x≥0 時,s(x)=1,否則為0。
算法過程如圖2 所示。
圖1 不同P,R 值對應的LBP 算子
圖2 基本LBP 算子示意圖
根據(jù)LBP 算子可實現(xiàn)不同人耳圖像的LBP 編碼圖像[5],如圖3 所示。
圖3 人耳圖像及其LBP 編碼圖像
基于LBP 和PCA 的人耳識別過程如圖4[6]所示。
圖4 基于LBP 和PCA 的人耳識別流程圖
1)對人耳圖像提取LBP 特征,得到LBP 特征矩陣,即圖3 所示的LBP 編碼圖像。
2)將所有經(jīng)過LBP 處理過的人耳圖像按列提取,將這些特征從大到小排列,提取出前120 個特征值和對應的特征向量作為最終PCA 提取的特征矩陣。
3)將LBP 處理過的按列提取的圖像矩陣分別與最終PCA 提取的特征矩陣相乘,得到最終用于識別的特征。
在識別階段,將測試集圖像做LBP 特征提取處理,并使用訓練集中PCA 提取的特征矩陣降維,最后采用歐氏距離來計算測試集與訓練集的相似度。
最小距離分類器是監(jiān)督分類的方法之一,其基本思想是利用試驗訓練集生成一個可表示該類別的中心向量Uk(k=1,2,...,n;n 是類別數(shù))。對于每個待分類的元素組X,計算其與Uk的距離,根據(jù)計算的距離,把X 歸入與之距離最近的類。這里X=[x1,x2,...,xm,f],Uk=[uk1,uk2,...,ukm,f],其中f 表示類別,f 屬于[f1,f2,,,fn]。
本文中最小距離分類器使用的是較為常見的歐氏距離(Euclidian Distance)。歐氏距離,也稱為泛數(shù),是一個通常采用的距離定義,可表示為在k 維空間中2 個點之間的真實距離。也常被用于度量向量間的距離:
采用歐氏距離的最小分類器由于不用計算屬性的方差和協(xié)方差,所以分類速度較快,分類時間較短。
本文采用北京科技大學USTB 人耳圖像庫(3)作為實驗對象,包含有79 個人的395 張人耳側面圖像,圖像采集顯示分辨率為768 ×576,正側面光照恒定。并分別通過LBP、PCA、LBP+PCA 3 種方法對其進行比較驗證。本實驗的目的在于測試不同算法條件下對人耳識別率的影響并改進出最優(yōu)的識別方法以便提高識別率。
圖5 3 種算法在79 人訓練集上的CMC 曲線(一對一)
圖5 為一對一識別曲線,本次實驗的人耳庫為USTB79 人耳庫,在識別過程中使用每個人的第5 張人耳圖像作為訓練集,第2 張作為測試集。
圖6 3 種算法在79 人訓練集上的CMC 曲線(一對多)
圖6 為一對多的識別曲線,本次實驗的人耳庫為USTB79 人耳庫,在識別過程中使用每個人的第5 張人耳圖像作為訓練集,第1 張及第2 張作為測試集。
由圖5、圖6 可得出各種算法識別結果的差別。無論是一對多還是一對一的識別過程中,基于局部二值模式的LBP 算法識別率最低,最高只能達到89%。而本文研究的PCA 與LBP 相結合的方法,得到的識別率最高可達到97%左右。在實際運用中基本以第一次識別為準,即rank1 的結果。通過對rank1 的比較可以看出,在一對多的識別中,運用單獨LBP 或者單獨PCA 的算法所得到的識別率均受到影響,比如LBP 的首次識別率下降至69%。而本文研究的新算法首次識別率相對穩(wěn)定,在實際運用中會得到更好的效果。
本文研究了一種結合LBP 和PCA 的人耳識別方法,實驗結果表明,相對于原始的LBP 和原始的PCA識別方法,結合LBP 和PCA 的人耳識別方法能有效降低計算復雜度,同時可以提高識別率,尤其是對于訓練集個數(shù)較少的圖像庫,本文研究的方法與PCA和LBP 方法相比表現(xiàn)出明顯的優(yōu)勢。
[1]穆志純,袁立,曾慧.生物特征識別技術-人耳自動識別[M].北京:科學出版社,2012.
[2]李昆侖,王命延.基于PCA 和LBP 的人臉性別分類方法[J].電腦知識與技術(學術交流),2009,5(10):8023-8025.
[3]韋妍.基于改進LBP 的人臉表情識別方法[J].現(xiàn)代計算機,2011(14):24-27.
[4]齊永鋒,張家樹,火元蓮.一種基于膚色與改進的LBP 的人臉檢測方法[J].光電子·激光,2009(6):816-821.
[5]王志秦,董翠英,周浩淼.一種基于LBP 的人耳特征提取方法[J].唐山學院學報,2009,22(3):60-62.
[6]熊承義,李丹婷,笪邦友.基于LBP 和PCA 特征提取的人臉識別[J].中南民族大學學報(自然科學版),2011,30(2):75-79.
[7]張海軍,穆志純,???人耳識別技術研究進展綜述[J].計算機工程與應用,2004,40(33):5-7.
[8]張海軍,穆志純,張克君,等.基于主元分析的人耳圖像識別方法[J].北京工商大學學報(自然科學版),2005,23(6):28-30.
[9]袁立,穆志純,曾慧.基于人臉和人耳的多模態(tài)特生物特征識別[J].北京科技大學學報,2007,29(S2):190-193.
[10]袁立,穆志純,徐正光,等.基于人耳生物特征的身份識別[J].模式識別與人工智能,2005,18(3):310-315.
[11]王瑋,黃非非,李見為,等.使用多尺度LBP 特征描述與識別人臉[J].光學精密工程,2008,16(4):696-705.
[12]王憲,張彥,慕鑫,等.基于改進的LBP 人臉識別算法[J].光電工程,2012,39(7):109-114.
[13]李一波,曹景亮,張海軍.一種基于張量PCA 的人耳識別的改進方法[J].計算機工程與應用,2011,47(25):171-174.
[14]趙懷勛,徐鋒,陳家勇.基于多尺度LBP 的人臉識別[J].計算機應用與軟件,2012,29(1):257-259.
[15]封筠,穆志純,毛晚堆.基于局部二值模式與濾波器融合的人耳識別[J].計算機工程與應用,2010,46(35):192-195.
[16]劉嘉敏,劉強,朱晟君.基于改進二維主成分分析及神經(jīng)網(wǎng)絡的人耳識別方法[J].計算機應用,2009,29(12):3357-3360.
[17]劉嘉敏,朱晟君.復雜背景下的人耳檢測方法[J].光電工程,2009,36(3):140-145.
[18]黃金鈺,張會林,閆日亮.LBP 直方圖與PCA 的歐式距離的人臉識別[J].計算機系統(tǒng)應用,2012,21(6):202-204.