楊 浩, 張二喜, 蔣卓蕓
(成都理工大學(xué) 管理科學(xué)學(xué)院, 四川 成都 610059)
?
基于距離測(cè)度的PCA人臉識(shí)別研究
楊浩,張二喜,蔣卓蕓
(成都理工大學(xué) 管理科學(xué)學(xué)院, 四川 成都 610059)
應(yīng)用主成分分析法對(duì)ORL人臉庫及YALE人臉庫進(jìn)行特征提取,采用最近鄰分類器及5種不同的距離測(cè)度進(jìn)行人臉識(shí)別。結(jié)果表明:不同的距離測(cè)度及累計(jì)方差貢獻(xiàn)率對(duì)PCA(Principal Component Analysis,主成分分析)人臉識(shí)別結(jié)果影響較大,在累計(jì)方差貢獻(xiàn)率分別取0.75,0.8,0.9,0.95的條件下,對(duì)于ORL人臉庫,曼哈頓距離和閔可夫斯基距離下PCA人臉識(shí)別正確識(shí)別率隨累計(jì)方差貢獻(xiàn)率增大而呈減小趨勢(shì);歐幾里德距離和夾角余弦距離下PCA人臉識(shí)別正確率隨累計(jì)方差貢獻(xiàn)率增大而先增大后減小;切比雪夫距離下的PCA人臉識(shí)別正確率保持不變。累計(jì)方差貢獻(xiàn)率取0.8,以歐幾里德距離作為距離測(cè)度的PCA人臉識(shí)別算法對(duì)ORL人臉庫取得最高的正確識(shí)別率為96.67%,對(duì)YALE人臉庫,取得的正確識(shí)別率為95.56%,驗(yàn)證了算法的有效性。歐幾里德距離是PCA人臉識(shí)別正確率最高的距離測(cè)度。
主成分分析;人臉識(shí)別;特征提取; 距離測(cè)度
人臉識(shí)別是人們?nèi)粘I钪凶畛S玫纳矸荽_認(rèn)手段,人臉識(shí)別技術(shù)作為生物特征識(shí)別領(lǐng)域中一種基于生理特征的識(shí)別技術(shù),是通過計(jì)算機(jī)提取人臉特征,并根據(jù)這些人臉特征進(jìn)行身份驗(yàn)證的一種技術(shù)[1]。同其他生物識(shí)別技術(shù)相比,人臉識(shí)別技術(shù)具有操作簡(jiǎn)單、結(jié)果直觀等特點(diǎn)。人臉識(shí)別在信息安全、刑事案件偵破、出入口控制、網(wǎng)上購物支付、用戶賬戶登錄等領(lǐng)域具有廣闊的應(yīng)用前景。
人臉識(shí)別的主要方法有基于面部幾何特征方法[2-3]、基于模板匹配方法[4-6]、基于子空間的分析方法[7-8]、人工神經(jīng)網(wǎng)絡(luò)[9-10]、支持向量機(jī)[11-15]等方法。在眾多人臉識(shí)別算法中,基于子空間分析的PCA(Principal Component Analysis,主成分分析)方法被認(rèn)為是最經(jīng)典的人臉識(shí)別方法之一[16-18]。
主成分分析又稱為K-L變換(Karhunen-Loeve Transform),是模式識(shí)別領(lǐng)域中的核心方法。本文應(yīng)用PCA進(jìn)行人臉識(shí)別,比較不同的距離測(cè)度及不同累計(jì)方差貢獻(xiàn)率對(duì)PCA人臉識(shí)別結(jié)果的影響。
1.1算法思想
PCA人臉識(shí)別算法的基本思想:通過主成分分析可以從人臉訓(xùn)練集中得到由特征向量組成的降維子空間,將待識(shí)別人臉圖像向其投影,即得到一組坐標(biāo)系數(shù),這組坐標(biāo)系數(shù)表明了該人臉圖像在子空間中的位置,從而可以作為人臉識(shí)別的依據(jù)。
主成分分析的基本思想:對(duì)原變量加以改造,在不致?lián)p失原變量太多信息的條件下使其方差(或觀測(cè)值的樣本方差)達(dá)到最大,盡可能地降低原變量的維數(shù)。
設(shè)X=(x1,x2,…,xp)T是p維隨機(jī)向量,EX=u,DX=V≥0,亦即來自某個(gè)總體X的樣品有p個(gè)特征向量,其均值向量為u,協(xié)方差陣為V。我們的任務(wù)就要將這p個(gè)特征向量x1,x2,…,xp綜合成盡可能少的幾個(gè)綜合性變量y1,y2,…,yq(q
1.2算法步驟
PCA人臉識(shí)別算法步驟如下:
(1)一張人臉圖片在計(jì)算機(jī)中表示為一個(gè)像素矩陣,也就是一個(gè)二維數(shù)組?,F(xiàn)在把這個(gè)二維數(shù)組變成一維數(shù)組,即把第一列后面的數(shù)全部添加到第一列。假設(shè)每張人臉圖像的大小均為r×n像素,則每張人臉都可以用一個(gè)大小為1×L的行向量來表示,L=r×n。將訓(xùn)練集中的M幅人臉圖像按照以上方式構(gòu)成訓(xùn)練樣本矩陣X,大小為M×L。
(2)對(duì)訓(xùn)練樣本矩陣X進(jìn)行主成分分析,X的協(xié)方差矩陣為
對(duì)協(xié)方差矩陣C進(jìn)行特征值分解,求得C的特征值為λ1,λ2,…,λL,λ1≥λ2≥…≥λL。選取累計(jì)方差貢獻(xiàn)率Fm超過0.8(取值理由見下文)的前m個(gè)特征值對(duì)應(yīng)的單位特征向量構(gòu)成降維子空間U。Fm定義如下式:
由于C的大小為L(zhǎng)×L,直接對(duì)C進(jìn)行特征向量計(jì)算比較困難,我們先計(jì)算BBT的特征值λi及相應(yīng)的單位特征向量vi,大小為L(zhǎng)×1,則BTB的單位特征向量為[19]
降維子空間為U=[u1,u2,…,um],大小為L(zhǎng)×m。
(3)將訓(xùn)練集中的人臉圖像Xi向子空間投影:
Yi即為高維人臉樣本Xi在特征子空間的降維表示。將待識(shí)別人臉圖像按步驟(1)中的方法做成一個(gè)1×L的行向量XT,將待識(shí)別人臉樣本XT向子空間U進(jìn)行投影:
YT=XTU。
(4)選擇合適的距離測(cè)度,采用最近鄰分類器,計(jì)算Yi與YT之間的距離di=d(YT,Yi)。取與YT距離最小的第i張訓(xùn)練集人臉?biāo)陬愖鳛榇R(shí)別人臉?biāo)陬悺?/p>
對(duì)于PCA人臉識(shí)別算法的最后一步中,降維后待識(shí)別人臉樣本與訓(xùn)練集人臉樣本的距離計(jì)算,設(shè)x和y是兩個(gè)m維樣本,常用的有以下幾種距離:
(1)歐幾里德距離
(2)曼哈頓距離
(3)夾角余弦距離
(4)閔可夫斯基距離
(5)切比雪夫距離
本次研究選取ORL人臉庫作為主要研究對(duì)象,選取YALE人臉庫作為算法驗(yàn)證對(duì)象。
3.1ORL人臉庫識(shí)別
ORL人臉庫是由英國劍橋大學(xué)Olivetti實(shí)驗(yàn)室創(chuàng)建的人臉數(shù)據(jù)庫,共有40個(gè)不同年齡、不同性別、不同種族的人,每個(gè)人10幅,共計(jì)400幅灰度圖像,每幅圖像大小為92×112像素。ORL人臉庫部分人臉如圖1所示。
取每個(gè)人的前7幅人臉圖像,40個(gè)人共計(jì)280幅人臉圖像作為訓(xùn)練集,每個(gè)人的后3幅人臉圖像,40個(gè)人共計(jì)120幅人臉圖像作為測(cè)試集,進(jìn)行PCA人臉識(shí)別,PCA降維后樣本距離依次取歐幾里德距離、曼哈頓距離、夾角余弦距離、閔可夫斯基距離、切比雪夫距離,閔可夫斯基距離中參數(shù)取值為p=0.5,訓(xùn)練集的主成分分析累計(jì)方差貢獻(xiàn)率如圖2所示。
圖1 ORL人臉庫部分人臉圖像 圖2 訓(xùn)練集累計(jì)方差貢獻(xiàn)率曲線
為研究不同累計(jì)方差貢獻(xiàn)率對(duì)識(shí)別結(jié)果的影響,采用聯(lián)想筆記本電腦Z485(內(nèi)存4 G),Windows 7旗艦版系統(tǒng)下,用MATLAB R2012a進(jìn)行編程實(shí)現(xiàn)PCA人臉識(shí)別,取累計(jì)方差貢獻(xiàn)率Fm分別為0.75,0.8,0.9,0.95進(jìn)行實(shí)驗(yàn)。采用最近鄰分類器進(jìn)行判別,計(jì)算出不同距離測(cè)度下PCA人臉識(shí)別具體結(jié)果如表1—表4所示。
表1 累計(jì)方差貢獻(xiàn)率為0.75時(shí)不同距離測(cè)度下PCA人臉識(shí)別結(jié)果
表2 累計(jì)方差貢獻(xiàn)率為0.8時(shí)不同距離測(cè)度下PCA人臉識(shí)別結(jié)果
表3 累計(jì)方差貢獻(xiàn)率為0.9時(shí)不同距離測(cè)度下PCA人臉識(shí)別結(jié)果
表4 累計(jì)方差貢獻(xiàn)率為0.95時(shí)不同距離測(cè)度下PCA人臉識(shí)別結(jié)果
由表1—表4可以看出累計(jì)方差貢獻(xiàn)率為0.8時(shí),以歐幾里德距離作為距離測(cè)度的PCA人臉識(shí)別正確率最高,為96.67%,算法執(zhí)行時(shí)間均比較快,都在4 s以內(nèi),隨著累計(jì)方差貢獻(xiàn)率增大,主成分個(gè)數(shù)增加。
由圖3可以看出在累計(jì)方差貢獻(xiàn)率分別取0.75,0.8,0.9,0.95條件下,曼哈頓距離和閔可夫斯基距離下PCA人臉識(shí)別正確識(shí)別率隨累計(jì)方差貢獻(xiàn)率增大而呈減小趨勢(shì);歐幾里德距離和夾角余弦距離下PCA人臉識(shí)別正確率隨累計(jì)方差貢獻(xiàn)率先增大后減?。磺斜妊┓蚓嚯x下的PCA人臉識(shí)別正確率保持不變,為93.33%。
圖3 不同累計(jì)方差貢獻(xiàn)率不同距離測(cè)度PCA人臉識(shí)別正確率
3.2YALE人臉庫識(shí)別
圖4 YALE人臉庫部分人臉圖像
YALE人臉數(shù)據(jù)庫由耶魯大學(xué)計(jì)算視覺與控制中心創(chuàng)建,共有15位志愿者的165張人臉圖片,包含光照、表情和姿態(tài)的變化。YALE人臉數(shù)據(jù)庫部分圖像如圖4所示。
取累計(jì)方差貢獻(xiàn)率為0.8,采用歐幾里德距離作為距離測(cè)度,采用最近鄰分類器進(jìn)行YALE人臉庫PCA人臉識(shí)別,取每個(gè)人的前8張人臉,15個(gè)人共計(jì)120張人臉樣本作為訓(xùn)練集,取每個(gè)人的后3張人臉,15個(gè)人共計(jì)45張人臉樣本作為測(cè)試集,人臉識(shí)別正確率為95.56%,程序執(zhí)行時(shí)間為1.41 s。YALE人臉數(shù)據(jù)庫含有復(fù)雜光照、表情和姿態(tài)的變化,本文算法對(duì)YALE人臉數(shù)據(jù)庫取得了較高正確識(shí)別率,進(jìn)一步驗(yàn)證了算法的有效性。
基于主成分分析的人臉識(shí)別方法是當(dāng)今人臉識(shí)別領(lǐng)域中最經(jīng)典也是使用最廣泛的方法。本文利用PCA方法對(duì)人臉進(jìn)行特征提取,對(duì)比分析了5種不同距離測(cè)度在累計(jì)方差貢獻(xiàn)率為0.75,0.8,0.9,0.95條件下的人臉識(shí)別正確率。得出結(jié)論:綜合人臉識(shí)別正確率及算法程序運(yùn)行時(shí)間,以O(shè)RL人臉庫為研究對(duì)象,累計(jì)方差貢獻(xiàn)率取0.8時(shí),歐幾里德距離PCA人臉識(shí)別爭(zhēng)取率最高,為96.67%;在累計(jì)方差貢獻(xiàn)率超過0.8后,繼續(xù)提高累計(jì)方差貢獻(xiàn)率并增加主成分個(gè)數(shù),PCA人臉識(shí)別正確率會(huì)呈現(xiàn)降低趨勢(shì)。
[1]王映輝.人臉識(shí)別:原理、方法與技術(shù)[M].北京:科學(xué)出版社,2010:16.
[2]陳立生,王斌斌.基于幾何特征與深度數(shù)據(jù)的三維人臉識(shí)別[J].電腦知識(shí)與技術(shù),2013(8):1864-1868.
[3]張淑軍,王高峰,石峰.基于AAM提取幾何特征的人臉識(shí)別算法[J].系統(tǒng)仿真學(xué)報(bào),2013,25(10):2374-2380.
[4]陸興華,梁建銘,袁文聰,等.一種融合角點(diǎn)特征匹配的人臉優(yōu)化識(shí)別方法[J].計(jì)算機(jī)時(shí)代,2016(3):8-11.
[5]錢玉潔,王玉德,馮瑋,等.基于DPM模型的靜態(tài)人臉檢測(cè)[J].電子技術(shù),2016,45(3):12-14.
[6]黎紅,張昊龍.基于聯(lián)合貝葉斯算法的人臉匹配算法的MATLAB實(shí)現(xiàn)[J].廊坊師范學(xué)院學(xué)報(bào):自然科學(xué)版,2016,16(1):31-34.
[7]程強(qiáng),陳秀宏.局部非參數(shù)子空間分析在人臉識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(3):141-144.
[8]殷飛,焦李成,楊淑媛.基于子空間類標(biāo)傳播和正則判別分析的單標(biāo)記圖像人臉識(shí)別[J].電子與信息學(xué)報(bào),2014(3): 610-616.
[9]李文琴,曾廣樸,文俊浩.基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別系統(tǒng)[J].激光雜志,2015,36(3):54-57.
[10]蘇光大.人臉識(shí)別在社會(huì)公共安全領(lǐng)域的應(yīng)用[J].中國安防,2015(14):12-14.
[11]王志楊,劉金龍,毛世偉.基于特征臉和支持向量機(jī)的人臉識(shí)別技術(shù)研究[J].淮海工學(xué)院學(xué)報(bào):自然科學(xué)版,2015,24(1):23-29.
[12]婁洹熙,王力.基于支持向量機(jī)和遺傳算法的人臉識(shí)別研究[J].微型機(jī)與應(yīng)用,2015,34(7):49-51.
[13]高晴,閆德勤,楚永賀,等.基于模糊聚類的LLE和SVM的人臉識(shí)別[J].微型機(jī)與應(yīng)用,2015,34(6):56-58.
[14]邵新華,趙勛杰,程凱.基于改進(jìn)的WLD特征的人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用與軟件,2015(4):141-144.
[15]DEVI H S,LAISHRAM R,THOUNAOJAM D M.Face Recognition using R-KDA with Non-Linear SVM for Multi-View Database[J].Procedia Computer Science,2015,54(8):532-541.
[16]施志剛.一種基于類間類內(nèi)雙權(quán)重圖像分塊PCA的人臉識(shí)別技術(shù)[J].杭州師范大學(xué)學(xué)報(bào):自然科學(xué)版,2014,13(1):89-93.
[17]全星慧,牟海維,呂秀麗,等.基于PCA與貝葉斯決策的人臉識(shí)別算法[J].光學(xué)儀器,2014,36(2):122-125.
[18]穆新亮,武亞靜.基于雙向主成分分析和壓縮感知的人臉識(shí)別算法[J].電子科技,2014,27(1):45-48.
[19]孫濤,谷士文,費(fèi)耀平.基于PCA算法的人臉識(shí)別方法研究比較[J].現(xiàn)代電子技術(shù),2007,30(1):112-114.
[責(zé)任編輯:魏 強(qiáng)]
PCA face recognition study based on different distance measures
YANG Hao,ZHANG Er-xi,JIANG Zhuo-yun
(Academy of Management Science, Chengdu University of Technology, Chengdu 610059, China)
This paper extracted eigenface from the ORL face images and the YALE face images with Principal Component Analysis(PCA) method. The nearest neighbor classifier and five different distance measures are used for face recognition. The results show that, different distance measures and different cumulative variance contribution rates greatly influenced the result of the PCA face recognition. On the cumulative variance contribution rate of 0.75,0.8,0.9,0.95 conditions, in ORL face database, the correct recognition rate of Manhattan distance and Minkowski distance PCA face recognition decreases with the cumulative variance contribution rate increase. The PCA face correct recognition rate under Euclidean distance and angle cosine distance decreases with the cumulative variance contribution rate decreases after the first increases. The PCA face recognition accuracy remains the same based on Chebyshev distance. The PCA face recognition on ORL face database has the highest recognition correct rate of 96.67% based on The Euclidean distance as the distance measure and the cumulative variance contribution rate of 0.8. To YALE face images, the correct recognition rate of the algorithm is 95.56%, it has proved the effectiveness of the algorithm. The PCA face correct recognition rate based on Euclidean distance is higher than the PCA face correct recognition rate based other distances.
principal component analysis(PCA);face recognition;feature extraction;distance measures
1673-2944(2016)04-0045-06
2016-04-06
2016-05-03
楊浩(1990—),男,彝族,四川省喜德縣人,成都理工大學(xué)碩士研究生,主要研究方向?yàn)槟J阶R(shí)別;張二喜(1990—),男,甘肅省禮縣人,成都理工大學(xué)碩士研究生,主要研究方向?yàn)槟J阶R(shí)別;蔣卓蕓(1992—),女,四川省合江縣人,成都理工大學(xué)碩士研究生,主要研究方向?yàn)槟J阶R(shí)別。
TP391.41
A