楊玉平,向 華
(1.重慶電子工程職業(yè)學(xué)院,重慶 401331;2.重慶師范大學(xué),重慶401331)
對人臉識別特征數(shù)據(jù)降維算法的優(yōu)化
楊玉平1,向 華2
(1.重慶電子工程職業(yè)學(xué)院,重慶 401331;2.重慶師范大學(xué),重慶401331)
在模式識別領(lǐng)域,人臉特征數(shù)據(jù)相對龐大,為了提取人臉主要的特征數(shù)據(jù),提高識別系統(tǒng)的運(yùn)行效率,對特征數(shù)據(jù)的降維是必須的操作。針對現(xiàn)有降維算法對識別率有較大影響的問題,本文總結(jié)了各類降維算法,提出了一種優(yōu)化的降維算法。
人臉識別;降維;人臉特征;人臉識別
隨著模式識別技術(shù)的發(fā)展,各種識別系統(tǒng)都有了很大的發(fā)展,例如:指紋識別、虹膜識別、人臉識別等。人臉識別以其不易察覺性、自然性等特點(diǎn)得到廣泛的應(yīng)用。相對于其他的識別方式,人臉識別的特征數(shù)據(jù)量較大,在提取特征數(shù)據(jù)之后要進(jìn)行降維,這樣可以在一定程度上減少數(shù)據(jù)量,提高識別系統(tǒng)的運(yùn)行效率。但如果降的維度過大,會造成一些主要特征數(shù)據(jù)丟失,使識別系統(tǒng)的識別率降低而達(dá)不到要求?,F(xiàn)在在降低維度的實(shí)驗(yàn)過程中,一般運(yùn)用多種維度降維,比如提取的特征數(shù)據(jù)的維度從幾十維到上百個(gè)維度不等?;蛘呔鸵詫?shí)驗(yàn)的方式來提取經(jīng)驗(yàn)數(shù)據(jù),往往在維度降到一定程度之后,如果繼續(xù)降維就會造成整個(gè)識別系統(tǒng)的識別率降低。
Karhunen-Loeve變換,簡稱K-L變換,是一種傳統(tǒng)的數(shù)學(xué)領(lǐng)域常用的正交變換。簡單來講就是將K維空間的數(shù)據(jù),通過降低數(shù)據(jù)維度,把數(shù)據(jù)變成L維空間的數(shù)據(jù)??梢杂孟旅娴臄?shù)學(xué)公式來表示:
假設(shè)有矩陣Xm×k,m個(gè)行向量表示樣本的個(gè)數(shù),k表示每個(gè)樣本數(shù)據(jù)的維數(shù)。有另一矩陣Rk×l,稱這個(gè)Rk×l為變換矩陣,將這兩個(gè)矩陣作如下運(yùn)算:
可見最終可將m個(gè)樣本的k維數(shù)據(jù),降低到l維數(shù)據(jù)了。Karhunen-Loeve變換的實(shí)質(zhì)就是將數(shù)據(jù)從一個(gè)坐標(biāo)系轉(zhuǎn)換到另一個(gè)坐標(biāo)系中,而前一個(gè)坐標(biāo)系的維度很大,且里面的數(shù)據(jù)帶有許多的冗余信息;而后一個(gè)坐標(biāo)系的維度相對來說很小,只帶有數(shù)據(jù)的主要信息。
在眾多的特征臉方法中,PCA、LDA、SIFT等特征提取過程中,都有降低特征數(shù)據(jù)維度的過程,其一般過程是:預(yù)處理人臉圖像;加載人臉庫,提取特征數(shù)據(jù)形成特征空間;形成特征子空間;把樣本人臉圖像和待識別的人臉圖像投影到特征子空間上;選擇一定的距離參數(shù)進(jìn)行識別。如下圖1:
圖1 圖像處理過程
一張M×N的人臉圖像,在作預(yù)處理時(shí),可以看成是一個(gè)M×N的行向量或者列向量。例如一張64×64的人臉圖片可認(rèn)為是4 096維列向量,因此它就是一個(gè)4 096維空間中的一點(diǎn)。但一般人臉的都是比較相似的,所以這些人臉中就存在許多的冗余信息,當(dāng)提取了人臉圖像的特征數(shù)據(jù)后,就可以把這些特征數(shù)據(jù)降到一個(gè)低維的空間當(dāng)中,用一個(gè)相應(yīng)的低維子空間來表示除去冗余信息的主要的特征數(shù)據(jù)。設(shè)m是人臉圖像樣本的數(shù)目;xi表示第i幅人臉圖像構(gòu)成的人臉向量,則樣本的協(xié)方差矩陣為:
根據(jù)SVD定理,設(shè)li(i=1,2,……,k)為矩陣W的k個(gè)非零特征值,vi為W對應(yīng)于li的特征向量,則W的正交歸一特征向量ui為:
則特征臉子空間為:w=(u1,u2…… ur,)。其中A=
優(yōu)化的特征數(shù)據(jù)降維算法是建立在原有的特征數(shù)據(jù)降維算法的基礎(chǔ)上,通過在形成特征子空間時(shí)預(yù)設(shè)參數(shù),使降低的維度不至于過低,從而使主要的特征向量丟失,造成識別率下降;降低的維度過少,使過多的冗余信息存留,造成系統(tǒng)運(yùn)行效率降低。此優(yōu)化算法的流程圖如下圖2:
圖2 優(yōu)化算法流程
具體實(shí)現(xiàn)步驟:
(1)運(yùn)用imread()函數(shù)讀入訓(xùn)練樣本圖像,把每張樣本圖像的像素以行的方式連接起來,構(gòu)成一個(gè)一維行向量。把每個(gè)行向量從上到下連接起來,就構(gòu)成了一個(gè)訓(xùn)練人臉樣本矩陣。
(2)每一行就是一張圖像,把每一張圖像相對應(yīng)的像素點(diǎn)求得它們的平均值,最后得到一個(gè)平均圖像的行向量。
(3)把每一個(gè)行向量與平均圖像行向量作差運(yùn)算,得到一個(gè)差值矩陣A,運(yùn)用協(xié)方差公式:W=AAT進(jìn)行計(jì)算。并計(jì)算出W的特征值和特征向量。
(4)將特征向量按特征值大小以降序排列,設(shè)定優(yōu)化參數(shù)值R,此參數(shù)表示取所有特征值中的多少特征值來作為主要特征值,實(shí)驗(yàn)中,取R=0.9110(0 (6)在識別階段,將待識別的人臉圖像先作預(yù)處理,提取特征向量,再把其特征向量投影到新坐標(biāo)系所表示的空間中,最后與特征模板數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行比較,進(jìn)行識別。 本算法在實(shí)驗(yàn)中所用的人臉數(shù)據(jù)庫有ORL和AR。ORL人臉庫中有40個(gè)人的人臉圖像,每個(gè)人有10幅圖像。選取5人的人臉圖像作為訓(xùn)練樣本人臉圖像,剩余圖像作為識別時(shí)用,圖像大小為64×64,如圖3所示。 圖3 ORL人臉庫 表1 ORL庫識別率及運(yùn)行時(shí)間 本實(shí)驗(yàn)運(yùn)用Matlab 7.5,并且基于SIFT人臉特征數(shù)據(jù)提取算法。從表1中的數(shù)據(jù)可以看出,人臉特征數(shù)據(jù)從4 096維降到不同的維度特征空間,系統(tǒng)運(yùn)行的時(shí)間不一樣。一般來說,維數(shù)降得越低,處理的特征數(shù)據(jù)越少,系統(tǒng)運(yùn)行就越快,但因此所得到的識別率也有所降低。本實(shí)驗(yàn)中所用的優(yōu)化參數(shù)值R=0.9110,相應(yīng)所得到的降維維數(shù)是93維,識別率是0.9972,運(yùn)行時(shí)間是0.4580秒。與表1所得到的分析數(shù)據(jù)對比來看,充分說明了參數(shù)優(yōu)化效果。 在人臉識別的眾多算法中,數(shù)據(jù)的降維是必不可少的操作。本文介紹了早期的K-L變換,總結(jié)了PCA、LDA、SIFT等算法中的降維方法,給出了一種優(yōu)化的特征數(shù)據(jù)降維算法。并運(yùn)用Matlab工具驗(yàn)證了此算法的可行性。此優(yōu)化降維算法將給以后降維操作帶來方便、快捷,并具有一定的指導(dǎo)意義。 [1]周玲麗,賴劍煌.生物特征數(shù)據(jù)安全保護(hù)技術(shù)的發(fā)展[J].計(jì)算機(jī)科學(xué),2008,35(10):33-38 [2]苑瑋琦,柯麗,白云.生物特征識別技術(shù)[M].北京:科學(xué)出版社,2009:164-165 [3]田印中,董志學(xué),黃建偉.基于PCA的人臉識別算法研究及實(shí)現(xiàn)[J].內(nèi)蒙古經(jīng)濟(jì)與科技,2010,(3). [4]羅昊,孟傳良.基于特征臉和LDA的人臉識別[J].貴州工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,(1). [5]H.K.Ekenel and R.Stiefelhagen.Why is facial occlusion a challengingproblem[C].IntemationalConferenceonAdvances in Biometrics,2009:299-308. [6]Roberts C.Biometric technologies-palm and hand[EB/OL].http://www.ccip.govt.nz/newsroom/information-notes/2006/biometrics-technologies-palmhand.pdf,2008-03-22. [7] H.Jia and A.M.Maninez,Support vector machines in face recognitionwithocclusions[C].IEEEConferenceonCompmer Vision and Pattem Recognition,2009:136-141. [8]Nagar A,Nandakumar K,Jain A K.Biometric Template Transformation:ASecureityAnalysis[C].Proc.of SPIE,Electronic Imaging,Media Forensics and Security XII.2010. [9]Feng Y C,Yuen P C,Jain A K.A Hybrid.Approach for Generating Secure and Discriminating Face Template[J].IEEE Transactions on Information Forensics and Security,2010,5(1):103-117. [10]Nagar A,Jain A K.On the Security of Non-invertible FingerprintTemplateTransforms[C].IEEEWorkshopon Information Forensics and Security(WIFS),2009. Optimization of Dimension Reduction Algorithm for Face Recognition Character Data YANG Yuping1,XIANG Hua2 In the field of pattern recognition,facial character data is relatively large,and therefore it is necessary to reduce the dimension of the character data in order to extract the primary facial main data and improve the efficiency of the recognition system.For the existing dimension reduction algorithm has some negative effect on the recognition rate,this article sums up various kinds of dimension reduction algorithms and brings forward a better algorithm. face recognition;dimension reduction;facial character TP39 A 1674-5787(2012)01-0162-03 2011-12-28 楊玉平(1984—),男,重慶市人,重慶電子工程職業(yè)學(xué)院,助教、重慶師范大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院計(jì)算機(jī)軟件與理論專業(yè)2010級碩士研究生,研究方向:數(shù)字圖像處理與模式識別;向華(1984—),女,重慶市人,重慶師范大學(xué)外國語學(xué)院學(xué)科教學(xué)(英語)2010級專業(yè)碩士研究生。 責(zé)任編輯 王榮輝4 實(shí)驗(yàn)效果與分析
5 結(jié)語
(1.Chongqing College of Electronic Engineering Chongqing 401331,China;2.Chongqing Normal University,Chongqing 401331,China)