陳勝
(江蘇省常熟職業(yè)教育中心校 江蘇 常熟215500)
人們在日常生活中最常用的身份認證手段就是人臉識別,其也是當前模式識別中一個最熱門的研究課題[1]。人臉識別就是將動態(tài)捕捉到的人的面部與預(yù)先錄用的人臉庫中的人臉進行比較識別?,F(xiàn)已經(jīng)廣泛地應(yīng)用于國家安全、刑事偵破等領(lǐng)域。人臉與指紋、虹膜等其他生物特征一樣與生俱來,具有唯一性和不易被復(fù)制的良好特性;且人臉識別具有可以遠距離采集人臉圖像,是一種非接觸性的技術(shù),具有非侵犯性的特點,但是人臉圖像的特征空間分布非常復(fù)雜;另外,還不能找到完全可分的特征映射和相應(yīng)曲面進行分類識別[2]。
特征提取是人臉識別過程中的關(guān)鍵問題。在各種特征提取方法中,Belhumeur等人提出的Fisher臉(Fisherfaces)方法[2]和Turk等人提出的特征臉方法(Eigenfaces)方法[3]是兩種應(yīng)用最為廣泛的算法。Fisher臉方法是通過線性判別分析(Linear Discriminant Analysis,LDA)尋找使類內(nèi)距和類間距最小比值的投影方向來獲取判別信息,是一種有監(jiān)督的方法[2]。使用LDA方法進行人臉識別時,可能遇到兩大問題:1)小樣本問題(Small Simple Size,SSS);2)邊緣類的存在造成投影空間中近鄰樣本的重疊[4]。且由于LDA方法中的類間散布矩陣Sb的秩最多有c-1個,因此,特征向量最多有c-1個。 對于高維數(shù)據(jù),要很好地區(qū)分各個類,只有c-1個特征是不充分的。此外,類內(nèi)散布矩陣只考慮了類的中心,沒有考慮類的邊界結(jié)構(gòu),而這些邊界結(jié)構(gòu)已經(jīng)證明了在分類時有很大作用的,這些問題導(dǎo)致了LDA方法性能的不穩(wěn)定[3]。為解決這些問題,Li等人于2009年提出了非參數(shù)子空間分析方法(Non-parametric Subspace Analysis,NSA)[5]。 主成分分析(Principal Component Analysis,PCA)在做特征提取時提取的是全局特征,識別效果往往不是很理想[6],而實際上當人臉表情和光照條件變化時,僅部分人臉區(qū)域變化明顯,而其他部分變化不大,甚至無變化[7]。M2DPCA方法則是對PCA算法的改進,它是對劃分后的子圖像進行鑒別分析,可以捕捉人臉的局部信息特征,有利于識別[8]。
由于NSA方法中的類內(nèi)散布矩陣Sw仍然和LDA的一樣,這樣可能會影響識別效果;且NSA方法計算類間散步矩陣沒有考慮到不同的KNN點有助于構(gòu)建不同的類間散布矩陣。Li等人提出了非參數(shù)特征分析(nonparametric feature analysis,NFA)方法,本文在降維方面作了改進即先對圖像矩陣分塊并采用2DPCA進行特征預(yù)提取,得到替代原始圖像的低維新模式后對其施行NFA方法[5]。在ORL人臉庫及XM2VTS人臉庫上驗證了該方法,其識別性能優(yōu)于LDA方法、NFA方法。
設(shè)模式類別有C個:C1,C2,…,CC,第i類有ni個樣本。 訓練樣本圖像為訓練樣本Ai的p×q塊圖像矩陣表示為
其中每個子圖像矩陣(Ai(j))k,l(i=1,2,Λ,c;j=1,2,Λ,ni;k=1,2,Λ,p;l=1,2,Λ,q)是m1×n1(m1×p=m,n1×q=n)矩陣。
訓練樣本的總體散布矩陣為:其中M=Npq表示訓練樣本子圖像矩陣總數(shù),是所有訓練樣本子矩陣的總體平均值,我們很容易就能得出G t為m1×m1的非負定矩陣。定義準則函數(shù):
G t的前t個最大特征值所對應(yīng)的標準正交的特征向量Z1,Z2,…,Zt為最優(yōu)投影向量組,最優(yōu)投影矩陣Q=[Z1,Z2,…,Zt]。由此可得訓練樣本在Q上投影的特征矩陣:
值得注意的是:在對原圖像施行模塊化2DPCA過程中,當確定圖像分塊后,投影軸個數(shù)t的取值就決定了特征矩陣Bi(j)的維數(shù)。若t值取小了,特征矩陣中會遺失許多不利于稍后分類的鑒別信息,然而t值取大了,則特征矩陣中又將存在大量不利于降維的冗余信息。t可按如下方法取值,先求總體離散矩陣Gt的特征向量,按降序排列為:λ1,λ2,…,λme,令l=1,2,Λme,則t取使得min{ηl/ηme≥1-ε(0<ε≤0.01)}成立的l值。
令 (xi(j))k,l=Vec(Bi(j))k,l, 則 (xi(j))k,l∈Rm1n1,k=1,2,…,p,l=1,2,…,q;第i類第j個圖像樣本的子圖像矩陣的均值為:
定義新的類間散布矩陣:
新的類內(nèi)散布矩陣:
其中,NNk(xi(j),l)為類l到xi(j)的K個最近鄰的集合,式(6)中權(quán)值w(i,j,l)為:
式(7)中α是一個正參數(shù),可以控制關(guān)于距離比的權(quán)值變化速度,d(xi(j),NNk(xi(j),l))是xi(j)到集合NNk(xi(j),l)距離。
于是,相應(yīng)的準則函數(shù)為:
取特征方程SbNFAω=λSwNFAω的前d個最大特征值對應(yīng)的特征向量作為最優(yōu)鑒別向量。
ORL人臉庫中共有40人在不同時期不同狀態(tài)下拍攝的10張照片,每張照片的分辨率均為112×92,照片有側(cè)面、正面;表情嚴肅、表情放松;睜眼、閉眼;微笑、不笑;戴眼鏡、不戴眼鏡等諸多差別。以下是取自人臉庫的一組照片:
圖1 ORL人臉庫Fig.1 ORL face database
表1給出了對原始圖像矩陣進行8×4、16×4即圖像子矩陣大小分別是14×23、7×23兩種分塊后與LDA、NFA方法對比的結(jié)果。分類器為最小距離分類器[8]。
表1 各方法在ORL人臉庫上的實驗結(jié)果Tab.1 Experimental results of everym ethod for ORL face database
本文中取 ε≤0.01。由表1數(shù)據(jù)可以看出,8×4分塊和16×4分塊在識別率方面均要優(yōu)于LDA和NFA方法。
XM2VTS人臉庫中共有295人在不同環(huán)境不同表情下拍攝的8張照片,每張照片的分辨率均為55×51,照片包括低頭、抬頭,戴眼鏡、不戴眼鏡,表情憤怒、表情平和,側(cè)臉、正臉,有妝、無妝等各種差異。以下是取自人臉庫的一組照片:
圖2 XM2VTS人臉庫Fig.2 XM2VTS face database
本實驗中以每組前4張作為訓練樣本,后4張作為測試樣本[4]??偟挠柧殬颖竞涂偟臏y試樣本均為1 180張[8]。實驗的結(jié)果,正確識別率的對應(yīng)關(guān)系見表2,表2給出了對原始圖像矩陣進行11×3和5×17即圖像子矩陣大小分別是5×17和11×3兩種分塊后與LDA、NFA方法對比的結(jié)果。分類器為最小距離分類器[8]。
表2各方法在XM 2VTS人臉庫上的實驗結(jié)果Tab.2 Experim ental results of everym ethod for XM 2VTS face database
由表1和表2的數(shù)據(jù)可以看出,在識別率方面本文方法均要優(yōu)于LDA和NFA方法。具體言之,在ORL數(shù)據(jù)庫中,LDA方法結(jié)果是93.50%,而NFA方法的結(jié)果是98.00%,新方法的最高識別率達99.00%。在XM2VTS數(shù)據(jù)庫中,LDA方法的結(jié)果是84.42%,NFA方法的結(jié)果是94.90%,新方法的最高識別率為94.83%。本方法在ORL人臉庫上效果較為明顯。
LDA方法和NSA方法在處理數(shù)據(jù)時只對一維數(shù)據(jù)進行處理,大大增加了計算量,容易出現(xiàn)“小樣本問題”。而本文的方法首先使用模塊化2DPCA對二維數(shù)據(jù)進行特征提取,考慮到了圖像的局部特征,而且圖像維數(shù)的降低,減少了計算量。在此基礎(chǔ)上轉(zhuǎn)化為一維數(shù)據(jù)使用NSA方法,考慮到了類內(nèi)及類間的差異性,可以取得更好的識別率。
本文在NFA的基礎(chǔ)上提出了M2DPCA和NFA相結(jié)合的一種新的人臉識別方法。首先利用模塊化2DPCA對原始數(shù)據(jù)進行預(yù)處理,再對得到的新的圖像樣本實行NSA判別分析,這樣做的優(yōu)點是能夠抽取到圖像的局部特征,反映圖像之間的差異的同時,亦能降低維數(shù),使計算簡單,得到更高的識別率。但研究發(fā)現(xiàn),對同一個庫中的原始圖像分塊方法的不同,識別率一般都不同,因此,如何分塊才能得到更高的識別率有待于進一步研究。
[1]Yuen P C,Lai JH.Face Representation Using Independent ComponentAnalysis[J].Pattern Recognition,2002,35(6):1247-1257.
[2]Turk M,Pentland A.Eigenfaces for recognition[J].Cognitive Neuroscience,1991,3(1):71-86.
[3]Belhumer PN,Hespannha J,Kriegman D.Eigenfaces vs fisherfaces:recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,Special Issue on Face Recognition,1997,17(7):711-720.
[4]莊哲民,張阿妞,李芬蘭.基于優(yōu)化的LDA算法人臉識別研究[J].電子與信息學報,2007,29(9):2047-2049.
ZHUANG Zhe-min,ZHANG A-niu,LI Fen-lan.Based on an optimized LDA algorithm for face recognition[J].Journal of Electronics&Information Technology,2007,29(9):2047-2049.
[5]LIZhi-feng,TANG Xiao-ou,et al.Nonparametric discriminant analysis for face recognition[J].Pattern AnalysisMachine Intelligence,2009,31(4):755-761.
[6]陳伏兵,陳秀宏,張生亮,等.基于模塊2DPCA的人臉識別方法[J].中國圖像圖形學報,2006,11(4):580-585.
CHEN Fu-bing,CHEN Xiu-hong,ZHANG Sheng-liang,et al.A human face recognition method based on modular 2DPCA[J].Journal of Image and Graphics,2006,11(4):580-585.
[7]王偉,張明.基于對稱線性判別分析算法的人臉識別[J].計算機應(yīng)用,2009,29(12):3353-3356.
WANG Wei,ZHANG Ming.Face recognition based on symmetrical linear discriminate analysis[J].Journal of Computer Applications,2009,29(12):3353-3356.
[8]He X F,Yan SC,Hu Y X,et al.Face recognition using Laplacianfaces[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(3):328-340.
[9]Gottumukkal R,Asari V K.An improved face recognition technique based onmodular PCA approach[J].Pattern Recognition Letters,2004,25(4):2429-2436.