王健 王新中 楊文霞 彭保
【摘 要】綜述了主成分分析(Principal Component Analysis, PCA)算法的基本原理,并詳細(xì)闡述了PCA算法在人臉識別中的應(yīng)用,包括:分塊PCA、基于類內(nèi)平均臉的PCA算法改進(jìn)、PCA和ICA的組合算法。最后,本文提出:未來的研究應(yīng)著眼于擴(kuò)大算法的比較范圍和尋找最優(yōu)分塊方式。
【關(guān)鍵詞】主成分分析;人臉識別;分塊PCA;算法組合
0 引言
PCA是經(jīng)典的模式識別算法。它的思想是在特征空間尋找一些方向,使得數(shù)據(jù)在這些方向上的誤差平方和最小。本文將簡要介紹PCA在人臉識別中的基本原理和應(yīng)用。
1 PCA人臉識別的基本原理
圖1 PCA人臉識別的基本原理
PCA能夠最大限度地保留原有數(shù)據(jù)的結(jié)構(gòu)分布,變換的核心是在最小均方意義下尋找最能代表原始數(shù)據(jù)的投影,從而達(dá)到對特征空間降維的目的。
人臉圖像作為二維矩陣,每個元素代表圖像中相應(yīng)點的灰度等級。設(shè)一幅人臉圖像為一個m行n列的矩陣Im×n。Im×n=(I1,I2,…,Ii,…,In,),其中為第i列向量(i∈[1,n])。對人臉圖像進(jìn)行PCA變換主要包含6個步驟,如圖1所示。
1.1 圖像向量化
1.6 采用最近鄰分類器對特征進(jìn)行分類
2 PCA人臉識別的應(yīng)用
PCA人臉識別能夠在降維的同時最大限度地保留原始圖像的主要識別信息。它能夠反映樣本集合的主要分布方向,抓住圖像之間的所有差異。但是,PCA仍然有缺點:
(1)PCA反映的圖像之間的差異可能是類內(nèi)差異,也可能是類間差異,因此PCA變換進(jìn)行分類的效果未必好。
(2)PCA抽取的是人臉的全局特征。在人臉表情和光照條件變化較大時(即局部變化大時),人臉識別的效果不顯著。因此,需要改進(jìn)PCA算法來捕捉人臉的局部信息特征。
(3)圖像向量化過程將產(chǎn)生很高的向量維數(shù)。一方面會增加計算復(fù)雜度;另一方面會使樣本數(shù)目小于特征維數(shù),導(dǎo)致小樣本問題,造成特征提取困難。
針對上述問題,解決辦法有三類:(1)對人臉圖像采取分塊PCA。(2)改進(jìn)PCA的算法結(jié)構(gòu)。(3)吸取其它算法的優(yōu)點,將PCA和ICA、LDA等算法進(jìn)行組合來識別人臉。
2.1 分塊PCA
分塊PCA的主要思想是對人臉圖像手動分塊(p*q塊),然后再對每一子塊分別進(jìn)行PCA變換[1],或者將這些子塊進(jìn)行能量歸一化和傅里葉變換,在頻域范圍進(jìn)行子塊PCA變換[2]。兩種方法差別不大。分塊PCA變換后,采用最近鄰分類器對提取的主分量特征進(jìn)行分類。
研究表明:分塊PCA不但可以降低圖像向量的維數(shù),而且可以以2的冪次方增加樣本的數(shù)量,避免小樣本問題。此外,分塊PCA可以更清晰地捕捉人臉的局部信息特征,在表情和光照條件變化較大時具有更好的識別能力和魯棒性。因此,分塊PCA優(yōu)于經(jīng)典PCA。
2.2 PCA算法的改進(jìn):基于類內(nèi)平均臉的PCA
實驗表明:基于類內(nèi)平均臉的PCA方法有效地增加了不同類別之間樣本的距離,同時縮小了類內(nèi)樣本之間的距離,有利于提高人臉識別率。(下轉(zhuǎn)第44頁)
(上接第34頁)在基于類內(nèi)平均臉的PCA基礎(chǔ)上,還可對圖像進(jìn)行分塊處理。研究表明:基于類內(nèi)平均臉的分塊PCA的人臉識別效果明顯優(yōu)于經(jīng)典PCA方法和普通分塊PCA方法[4]。
2.3 PCA+ICA
PCA提取的特征是最小均方誤差意義上的二階統(tǒng)計信息,各分量之間互不相關(guān);而ICA提取的是高階統(tǒng)計信息,各分量之間相互獨立。因此PCA的主分量特征與ICA的獨立分量特征是對原數(shù)據(jù)的兩類不同描述。如果將二者結(jié)合起來,那么必定使抽取到的信息更加全面,人臉識別的性能也將得到改善。
1)先對人臉圖像進(jìn)行PCA變換,在變換后的特征空間進(jìn)行ICA變換[5-7]。具體為:
(1)人臉圖像訓(xùn)練樣本先進(jìn)行PCA降維,得到。
(2)在PCA變換得到的特征空間上求取ICA最佳投影矩陣W,由此得到聯(lián)合最優(yōu)投影矩陣。
(3)人臉圖像訓(xùn)練樣本和測試樣本經(jīng)過Y=(W?鄢)TX進(jìn)行變換。
(4)用最近鄰分類器分類。
2)分別對人臉圖像進(jìn)行PCA和ICA變換,得到的特征分別求距離或余弦相似度,最后將相似度結(jié)果求和并進(jìn)行分類[8]。具體為:
(1)人臉圖像進(jìn)行PCA變換;
(2)人臉圖像進(jìn)行ICA變換;
(3) PCA和ICA的兩類特征使用余弦分類器和最近鄰分類器進(jìn)行聯(lián)合人臉識別。
實驗表明:基于分類器組合的方法優(yōu)于單獨使用PCA或ICA的單分類器方法。
3)分別對人臉進(jìn)行PCA和ICA變換,對得到的特征加權(quán)求和,并分類[9]。具體為:
(1)對人臉圖像進(jìn)行PCA變換,得到PCA特征。
(2)對人臉圖像進(jìn)行ICA變換,得到ICA特征。
(3)將PCA特征和ICA特征加權(quán)求和,構(gòu)造加權(quán)特征值。
(4)對加權(quán)特征值進(jìn)行分類(最近鄰法和余弦法)。
實驗表明:單獨的ICA識別率高于單獨的PCA;PCA和ICA特征加權(quán)識別率高于單獨的PCA或單獨的ICA。
3 總結(jié)及展望
本文總結(jié)了PCA的基本原理,并詳細(xì)闡述了PCA算法在人臉識別中的應(yīng)用,包括:分塊PCA,基于類內(nèi)平均臉的PCA算法改進(jìn),PCA和ICA的組合算法。未來的研究中可以著眼于以下幾點:
(1)算法組合后,人臉識別效果的比較范圍應(yīng)該擴(kuò)大。在現(xiàn)有文獻(xiàn)中,組合算法進(jìn)行人臉識別后,通常只和某種單一的算法進(jìn)行比較,而不和其它的組合算法比較,這樣無法發(fā)現(xiàn)哪種組合算法更優(yōu)。
(2)解決分塊PCA如何最優(yōu)分塊的問題。研究表明:不同的分塊方式、不同的分塊個數(shù)將導(dǎo)致不同的人臉識別率,那么尋找最佳的分塊方式和分塊數(shù)目將成為下一步研究的重點。
【參考文獻(xiàn)】
[1]陳伏兵,楊靜宇.分塊PCA及其在人臉識別中的應(yīng)用[J].計算機(jī)工程與設(shè)計,2007,28(8):1889-1892.1913.
[2]孫鑫,劉兵,劉本永.基于分塊PCA的人臉識別.基于分塊PCA的人臉識別[J].2005,27:80-82.
[3]何國輝,甘俊英.PCA類內(nèi)平均臉法在人臉識別中的應(yīng)用研究[J].計算機(jī)應(yīng)用研究,2006,3:165-166,169.
[4]李曉東,費數(shù)岷,張濤.一種改進(jìn)的模塊PCA方法及其在人臉識別中的應(yīng)用[J].測控技術(shù),2008,11:19-21,24.
[5]安高云,阮秋琦.基于獨立分量分析的普適人臉識別系統(tǒng)[J].北京交通大學(xué)學(xué)報,2006,30(5):6-9,14.
[6]王宏漫,歐宗瑛.采用PCA/ICA特征和SVM分類的人臉識別[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2003,15(4):416:420
[7]劉直芳,游志勝,王運瓊.基于PCA和ICA的人臉識別[J].激光技術(shù),2004,28(1):78-81.
[8]徐勇,張重陽,楊靜宇.基于主分量特征與獨立分量特征的人臉識別實驗[J].計算機(jī)工程與設(shè)計,2005,26(5):1155-1157,1184.
[9]王展青,劉小雙,張桂林,王仲君.基于PCA與ICA的人臉識別算法研究[J].華中師范大學(xué)學(xué)報:自然科學(xué)版,2007,41(3):373-376.
[責(zé)任編輯:鄧麗麗]