陳瀟
摘要:人臉識別技術(shù)是快速身份是識別技術(shù)中極其重要的一種識別方法,本文研究了結(jié)合Fisher準(zhǔn)則和主成分分析PCA算法的人臉識別方法,采用基于奇異值分解的特征提取算法,通過計算協(xié)方差矩陣的特征值以及特征向量,使用歐式距離判斷輸入圖像與訓(xùn)練圖像之間的類似度的方法進(jìn)行人臉判別分類,識別出匹配圖像。
關(guān)鍵詞:人臉識別;PCA算法;Fisher準(zhǔn)則
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)10-0156-02
0 引言
隨著科學(xué)技術(shù)的進(jìn)步,有效可高的身份識別技術(shù)越來越受到人們的重視。生物特征相對于其他識別技術(shù)具有穩(wěn)定、唯一的特點,因此在身份識別領(lǐng)域受到青睞。人臉識別技術(shù)相對指紋識別等其他識別技術(shù)穩(wěn)定性強(qiáng),識別速度快,適用場合廣泛,在不同場合中實現(xiàn)了各種各樣的智能化應(yīng)用。
結(jié)合Fisher準(zhǔn)則和主成分分析PCA算法的人臉識別方法,降低了處理圖像的維度,能夠在保留原始圖像大部分信息的前提下提取圖像中的主要元素,減少了數(shù)據(jù)處理難度。
1 理論基礎(chǔ)
1.1 人臉識別系統(tǒng)
常見的人臉識別流程如圖1所示,主要分為以下步驟。
1.1.1 獲取人臉圖像
首先通過各種采集設(shè)備獲得人臉圖像信息,轉(zhuǎn)化成計算機(jī)可以處理的數(shù)據(jù)。
1.1.2 預(yù)處理
由于受各種因素的影響,輸入的圖像質(zhì)量不統(tǒng)一,不能夠直接將圖像用于后續(xù)的人臉識別過程,很大程度上影響了識別的性能。預(yù)處理工作能夠盡可能消除在尺寸大小、姿態(tài)、明暗程度、 面部遮擋物等方面對識別性能的影響。
1.1.3 特征提取
每副人臉圖像中都有區(qū)別于其他圖像的特征。人臉的特征主要分為:物理、結(jié)構(gòu)和數(shù)學(xué)特征三種。人們常通過物理和結(jié)構(gòu)特征去識別和記憶對象,因為這兩種特征易于被察覺和感知。計算機(jī)在對數(shù)學(xué)特征的處理上具有優(yōu)勢,所以我們利用計算機(jī)的特點在人臉識別過程中完成如計算協(xié)方差矩陣、統(tǒng)計樣本平均值等工作。
1.1.4 特征匹配
特征匹配是將經(jīng)過特征提取后的樣本與人臉庫中存儲特征樣本按照相應(yīng)的規(guī)則進(jìn)行匹配。目前常用的手段是使用最近鄰分類器結(jié)合歐式距離進(jìn)行比對。
1.2 Fisher準(zhǔn)則原理
假設(shè)訓(xùn)練集樣本、測試集樣本有n個特征,為了找出最好的投影方向,可以通過計算樣本的平均值、樣本類內(nèi)的離散度矩陣、樣本類間的離散度矩陣以及總類間離散度矩陣。根據(jù)最佳投影方向投影所有訓(xùn)練集樣本到一維空間為Y,然后找到Y(jié)空間的邊界點,即可將待測樣本投影到一維Y空間,通過比對投影點與分界點之間的關(guān)系將樣本進(jìn)行分類。
Fisher分類器設(shè)計步驟如下:
(1)計算各類樣本均值向量,是各個類的均值,是類的樣本個數(shù)。
(2)計算樣本類內(nèi)離散度矩陣和總類間離散度矩陣:
(3)計算樣本類間離散度矩陣:
(4)求出向量:
為了保證樣本投影后在一維空間的距離較大,即樣本訓(xùn)練集和待測樣本的均值之差()的值要大,即類間距離最大化。同時要實現(xiàn)類內(nèi)的距離最小化,即各樣本在類內(nèi)緊密。
1.3 基于PCA的人臉識別算法
PCA是人臉識別領(lǐng)域一種常用算法,能夠在保留原始圖像大部分信息數(shù)據(jù)的前提下,降低空間維度,提取主要元素,從而減少數(shù)據(jù)處理難度。下面將詳細(xì)介使用PCA算法計算特征臉并進(jìn)行識別的過程。
第一步:降維并生成一維向量矩陣。假設(shè)二維人臉圖像的長度和寬度為別為M和N,在某種程度上可將其看成是一個長度為MN的列向量。為了將二維的圖像轉(zhuǎn)換成一維的列向量,先計算二維圖像的大小即M*N的值,隨后將圖像按行進(jìn)行轉(zhuǎn)置運(yùn)算,接著按列依次取出人臉圖像的灰度值,拼接形成一維向量矩陣T。
第二步:對圖像進(jìn)行規(guī)范化處理。對圖像矩陣T進(jìn)行規(guī)范化,對一維列向量求出平均值,然后用矩陣每列減平均值,經(jīng)過規(guī)范化的操作后形成了矩陣A。
第三步:計算特征臉。訓(xùn)練樣本表示為,維度為,將訓(xùn)練樣本A與A的轉(zhuǎn)置相乘得到訓(xùn)練圖像的協(xié)方差矩陣C,則C的維度為(MN)2。那么協(xié)方差C的維度較高,從而導(dǎo)致計算特征向量以及特征值比較繁瑣。為了避免上述現(xiàn)象,我們采用奇異值分解定理。
由此可計算出,且和存在共同非零的特征值,和分別為和對應(yīng)特征值的正交特征向量。
由此可推導(dǎo)出:
則可以根據(jù)協(xié)方差矩陣,構(gòu)造出矩陣L,L表示為:,從而較容易地計算出L的特征值及特征向量,然后即可根據(jù)上式求出協(xié)方差矩陣C的特征值以及特征向量。
本文就是采取直接構(gòu)造出的方法,由此計算出L的特征值,然后從L的特征值中選取值大于100的值作為協(xié)方差矩陣C的特征值,最后再根據(jù)協(xié)方差矩陣C的特征值來計算出C的特征向量,從而形成特征臉圖像。
第四步:進(jìn)行識別。識別過程主要有兩個部分:樣本訓(xùn)練和樣本測試。
樣本訓(xùn)練主要是將人臉數(shù)據(jù)庫中的圖像提取出來,生成特征數(shù)據(jù)庫。樣本測試過程中,需要識別的人臉的特征,然后將經(jīng)過計算提取后的特征和特征數(shù)據(jù)庫中樣本距離進(jìn)行比較,匹配距離最小的訓(xùn)練圖像即為匹配結(jié)果。
為了生成人臉特征庫,需要將圖像矩陣A的列向量進(jìn)行投影,形成特征子空間。使用公式對人臉圖像Y進(jìn)行標(biāo)準(zhǔn)化處理,形成的標(biāo)準(zhǔn)化圖像對特征子空間進(jìn)行投影,得到向量。隨后使用歐式距離法進(jìn)行圖像的判別,測試圖像與每個人臉圖像間的距離為,從中選擇滿足最小距離的圖像作為匹配結(jié)果。
2 系統(tǒng)實現(xiàn)
本文中人臉識別程序使用matlab2012b平臺編程實現(xiàn),人臉數(shù)據(jù)來源于face94 Essex face database標(biāo)準(zhǔn)人臉庫。
本系統(tǒng)主要分為:生成訓(xùn)練樣本、計算特征臉和識別匹配三部分,程序框圖如圖2所示。
選擇訓(xùn)練樣本和測試樣本庫,然后在樣本訓(xùn)練庫和測試庫中選擇樣本圖片,如圖3所示。
系統(tǒng)進(jìn)行樣本訓(xùn)練后即可完成人臉識別匹配,匹配結(jié)果如圖4所示。
本次實驗總共分3組進(jìn)行測試,每次測試匹配20張圖片,平均準(zhǔn)確率達(dá)到90%以上。通過樣本庫中人臉進(jìn)行測試后發(fā)現(xiàn),在光照均勻,測試姿態(tài)為正面,臉部遮擋較少的情況下,人臉識別系統(tǒng)可以達(dá)到較高的識別率。
3 結(jié)語
本文按照完整的人臉識別流程,設(shè)計了基于Fisher線性分類準(zhǔn)則的PCA人臉識別算法并編程實現(xiàn),通過實驗發(fā)現(xiàn)人臉識別率很高。在未來改進(jìn)過程中,增加對圖像的光照變化以及其他姿態(tài)因素的考慮,以進(jìn)一步提高圖像識別的準(zhǔn)確性。
參考文獻(xiàn)
[1] 宋文娟,于威威.一種應(yīng)用PCA的人臉圖像集識別方法[J].現(xiàn)代計算機(jī)(專業(yè)版),2014(12):23-26.
[2] 張成龍.基于PCA算法的人臉識別技術(shù)研究[J].電腦知識與技術(shù),2016,12(22):182-184.
[3] 邵嵐,姚艷松,尚福.基于PCA人臉識別原理[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(01):26-27+39.
[4]張誠,楊陽.基于PCA算法的人臉識別登錄系統(tǒng)設(shè)計[J].信息與電腦(理論版),2017(11):125-127+130.
[5] 徐飛.Matlab應(yīng)用圖像處理[M].西安:西安電子科技大學(xué)出版社,2005.