鄒麗英 孫小權(quán)
摘要:小波變換能夠充分突出某些特征的主要特點(diǎn),通過(guò)小波變換可以將一張高維數(shù)的圖片變換成低維數(shù)的圖片,且人臉識(shí)別所需要的主要特征保持不變,通過(guò)主成份分析可以進(jìn)一步降維。改進(jìn)了基于小波變換和主成份分析提取特征向量的人臉識(shí)別方法,開(kāi)發(fā)了基于小波變換及支持向量機(jī)的人臉識(shí)別系統(tǒng),實(shí)現(xiàn)了對(duì)普通圖片和視頻的人臉識(shí)別。
關(guān)鍵詞:人臉識(shí)別;人臉檢測(cè);小波變換;支持向量機(jī)
DOIDOI:10.11907/rjdk.161084
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2016)005-0109-04
1 系統(tǒng)需求分析
小波提供了一種非平穩(wěn)信號(hào)的時(shí)間—尺度分析手段,小波變換在時(shí)域和頻域都能提供良好的局部信息,尤其小波變換降維可降低圖像分辨率,進(jìn)而降低計(jì)算復(fù)雜度,因而人臉識(shí)別技術(shù)中將高維圖片降為低維圖片采用小波變換[1-2]?;谛〔ㄗ儞Q和支持向量機(jī)的人臉識(shí)別系統(tǒng)核心功能是根據(jù)給定圖片(可以來(lái)自視頻) 通過(guò)一系列變換,檢測(cè)出圖片中的人臉,從人臉圖片中提取特征向量作為支持向量機(jī)的輸入,支持向量機(jī)輸出識(shí)別出的人員代碼,并調(diào)用相應(yīng)人員的信息。系統(tǒng)主要功能模塊為人臉檢測(cè)、分類識(shí)別、參數(shù)優(yōu)化、分類訓(xùn)練,如圖1所示。
系統(tǒng)主要功能模塊包括圖像預(yù)處理、人臉檢測(cè)模塊、小波變換模塊、PCA特征提取模塊、支持向量機(jī)參數(shù)尋優(yōu)
模塊、支持向量機(jī)訓(xùn)練模塊、支持向量機(jī)人臉識(shí)別模塊等[3],系統(tǒng)流程如圖2所示。
2 主要功能模塊設(shè)計(jì)
2.1 人臉檢測(cè)
人臉檢測(cè)的主要目的是在輸入的整幅圖像上尋找人臉區(qū)域,計(jì)算機(jī)把圖像分割成人臉區(qū)域和非人臉區(qū)域兩個(gè)部分。首先確定場(chǎng)景中是否存在人臉,再確定圖像中人臉的位置,將人臉區(qū)域按一定尺寸比例截取。
檢測(cè)人臉通過(guò)膚色來(lái)進(jìn)行。經(jīng)過(guò)濾波、光線補(bǔ)償?shù)膱D片,按照膚色模型提取近似膚色區(qū)域,去除小塊區(qū)域;利用形態(tài)學(xué)的原理對(duì)類膚色區(qū)域進(jìn)行腐蝕和膨脹,去除毛刺和孔洞;根據(jù)區(qū)域形狀、大小等參數(shù)初步判斷是否為人臉區(qū)域,截取初步判斷為人臉的區(qū)域,調(diào)用人臉/非人臉識(shí)別程序判斷是否為人臉[4]。人臉/非人臉識(shí)別程序采用支持向量機(jī)進(jìn)行識(shí)別判斷,檢測(cè)流程如圖3所示。
2.2 小波變換
由于采集到的圖片像素點(diǎn)較多,進(jìn)行特征提取時(shí),運(yùn)算量非常大,而圖片中實(shí)際上包含了大量的冗余信息,人臉識(shí)別中所用到的特征主要是低頻特征,通過(guò)小波變換可以提取圖片的低頻信息。小波算法由于計(jì)算量較大,常采用濾波器的Mallat算法,也就是用兩個(gè)互補(bǔ)的濾波器產(chǎn)生高頻和低頻信號(hào),再進(jìn)行抽樣分別得到一級(jí)小波變換后的分解系數(shù)[4]。
當(dāng)對(duì)圖片進(jìn)行小波分解時(shí),可以先按行進(jìn)行一層小波變換,再按列進(jìn)行一層小波變換。當(dāng)需要進(jìn)行多層變換時(shí),可以將上一層變換后得到的低頻系數(shù)作為輸入,再作一層或多層小波分解。圖片二維小波變換實(shí)際是在行和列兩個(gè)方向上分別進(jìn)行一維小波分解,多層小波分解實(shí)質(zhì)是對(duì)上層小波分解的低頻分量再進(jìn)行小波分解。
2.3 主成份分析法提取特征向量
主成份分析實(shí)際上是對(duì)圖片矩陣進(jìn)行奇異值分解,得到一個(gè)對(duì)角線為奇異值的對(duì)角矩陣(奇異值非負(fù)且按降序排列)和圖片矩陣的奇異向量,再對(duì)這些矩陣進(jìn)行運(yùn)算,得到系數(shù)矩陣、訓(xùn)練樣本投影后的矩陣、協(xié)方差矩陣特征值[5]。計(jì)算協(xié)方差矩陣特征值的累計(jì)值,當(dāng)累計(jì)值達(dá)到預(yù)先設(shè)定的能量占比,特征值下標(biāo)即是應(yīng)取的維數(shù),根據(jù)這一維數(shù),從主成份系數(shù)矩陣和訓(xùn)練樣本投影矩陣中取出相應(yīng)的列數(shù),構(gòu)成新的主成份系數(shù)矩陣和樣本投影矩陣。識(shí)別時(shí),只需將識(shí)別樣本向主成份系數(shù)矩陣上投影就得到要提取的特征向量。主成份分析法算法實(shí)現(xiàn)在多種編程工具中都進(jìn)行了封裝,可以直接調(diào)用,不再贅述。
2.4 數(shù)據(jù)規(guī)格化
通過(guò)PCA變換得到特征數(shù)據(jù),不同特征最大值和最小值不一樣,有的相差很大。為了使數(shù)據(jù)具有可比性,將不同的特征數(shù)值變化范圍統(tǒng)一在同一值域內(nèi),而在同一特征內(nèi)部,數(shù)值之間的比例關(guān)系不變,因此需要對(duì)特征數(shù)據(jù)進(jìn)行統(tǒng)一的規(guī)格化操作。先確定各特征變化范圍,再求取各特征數(shù)據(jù)的最大值和最小值,將各特征值的實(shí)際變化范圍與目標(biāo)變化范圍的比值作為各特征值的變換系數(shù),用這一變換系數(shù)對(duì)各特征進(jìn)行數(shù)據(jù)變換,從而得到規(guī)格化的數(shù)據(jù)。對(duì)于圖像預(yù)處理模塊、PCA特征提取模塊、支持向量機(jī)的參數(shù)尋優(yōu)模塊,支持向量機(jī)訓(xùn)練模塊、支持向量機(jī)人臉識(shí)別模塊不再一一詳述。
3 人臉識(shí)別系統(tǒng)實(shí)現(xiàn)
MATLAB交互式程序設(shè)計(jì)語(yǔ)言,具有強(qiáng)大的矩陣運(yùn)算和操作功能,能夠完成大部分圖像處理工作,本系統(tǒng)采用MATLAB語(yǔ)言程序代碼,實(shí)現(xiàn)圖像預(yù)處理、人臉檢測(cè)模塊、小波變換模塊、PCA特征提取模塊、支持向量機(jī)的參數(shù)尋優(yōu)模塊,支持向量機(jī)訓(xùn)練模塊、支持向量機(jī)人臉識(shí)別模塊等[6-7]。
3.1 人臉檢測(cè)算法實(shí)現(xiàn)
根據(jù)輸入的圖片,從中檢測(cè)出是否有人臉,如果存在人臉,則將人臉區(qū)域進(jìn)行標(biāo)記,并裁剪出來(lái)。
4 原型系統(tǒng)運(yùn)行與驗(yàn)證
第一次使用識(shí)別之前,必須對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,而為了得到較好的訓(xùn)練效果,必須設(shè)置合適的參數(shù),通過(guò)參數(shù)尋優(yōu)可以得到優(yōu)化的訓(xùn)練參數(shù)。本系統(tǒng)通過(guò)網(wǎng)格化尋優(yōu)方法進(jìn)行尋優(yōu)。點(diǎn)擊上排菜單上的訓(xùn)練,再點(diǎn)擊參數(shù)尋優(yōu),在輸入框中輸入PCA降維時(shí)用的能量占比。因?yàn)樵撛拖到y(tǒng)存在兩個(gè)樣本庫(kù),一個(gè)是人臉/非人臉樣本庫(kù),一個(gè)是識(shí)別用樣本庫(kù)。所以要分別選擇訓(xùn)練目錄,選擇訓(xùn)練的文件夾,任點(diǎn)一個(gè)訓(xùn)練文件,程序開(kāi)始自動(dòng)計(jì)算優(yōu)化參數(shù)。結(jié)果參數(shù)寫入相應(yīng)樣本庫(kù)的參數(shù)文件中并在左下方輸出。參數(shù)尋優(yōu)如圖11所示。
圖片人臉識(shí)別是從現(xiàn)有的未經(jīng)處理的相片中檢測(cè)出人臉并進(jìn)行識(shí)別。一張圖片中可以有多個(gè)人臉,該功能模塊需要調(diào)用人臉檢測(cè)、標(biāo)準(zhǔn)人臉識(shí)別等函數(shù)。點(diǎn)擊打開(kāi)圖片文件按鈕,選擇要識(shí)別的圖片,打開(kāi)圖片文件,進(jìn)入自動(dòng)檢測(cè)人臉和自動(dòng)識(shí)別。左側(cè)窗口顯示原圖片,右側(cè)上排顯示檢測(cè)出的人臉,下排顯示識(shí)別出的人臉。圖片人臉識(shí)別如圖12所示。
視頻源人臉識(shí)別通過(guò)攝像頭等實(shí)時(shí)拍攝設(shè)備或視頻文件,直接從視頻中發(fā)現(xiàn)人臉并進(jìn)行識(shí)別。點(diǎn)擊打開(kāi)視頻設(shè)備或打開(kāi)視頻文件,程序打開(kāi)視頻,當(dāng)發(fā)現(xiàn)需要識(shí)別的人臉時(shí),點(diǎn)擊捕獲按鈕,即進(jìn)入自動(dòng)檢測(cè)人臉和自動(dòng)識(shí)別。左側(cè)窗口顯示視頻圖像,右側(cè)上排顯示檢測(cè)出的人臉,下排顯示識(shí)別出的人臉。視頻源人臉識(shí)別如圖13所示。
5 結(jié)語(yǔ)
本文系統(tǒng)采用MATLAB交互式程序設(shè)計(jì)語(yǔ)言,具有強(qiáng)大的矩陣運(yùn)算和操作功能,能夠完成大部分圖像處理,同時(shí)節(jié)省編寫低層算法代碼的時(shí)間。改進(jìn)了基于小波變換和主成份分析(PCA)提取特征向量與支持向量機(jī)相結(jié)合的人臉識(shí)別方法。通過(guò)小波變換和PCA對(duì)圖片降維,人臉識(shí)別的主要特征保持不變。應(yīng)用膚色模型理論進(jìn)行人臉檢測(cè),通過(guò)小波變換和主成份分析法進(jìn)行人臉特征提取,最后通過(guò)支持向量機(jī)進(jìn)行人臉識(shí)別,實(shí)現(xiàn)了對(duì)普通圖片和視頻的人臉識(shí)別。從運(yùn)行結(jié)果看,還需進(jìn)一步調(diào)整參數(shù),使人臉識(shí)別效果達(dá)到最佳。程序運(yùn)行實(shí)時(shí)性欠佳,有待進(jìn)一步提高其算法功能。
理論和實(shí)踐都表明,利用不同原理而得到的多種特征提取方法,具有較強(qiáng)的互補(bǔ)性。多種特征經(jīng)過(guò)融合后,可以更全面地反映被測(cè)人臉的特征信息,并能提高識(shí)別精度。因此,小波特征與其它特征的融合有待于進(jìn)一步研究。人臉圖像本身是三維的非剛性集合體,三維數(shù)據(jù)能為人臉識(shí)別提供更豐富的信息,用二維圖像來(lái)識(shí)別三維人臉信息,必然會(huì)引入一定的誤差,因此基于三維模型的人臉識(shí)別必將成為是未來(lái)人臉識(shí)別發(fā)展的主流。
參考文獻(xiàn):
[1]XIAOFEI HE,DENG CAI.Learning a maximum margin subspacefor image retrieval[J].IEEE Transactions on knowledge and data engineering.,2008,20(2):189-201.
[2]JIAN YANG,DELIN CHU,LEI ZHANG.Sparse representation classifier steered discriminative projection with applications to face recognition[J].IEEE Transactions on Neural Networks and Learning Systems,2013,24(7):1023-1035.
[3]王金云,周暉杰,紀(jì)政.復(fù)雜背景中的人臉識(shí)別技術(shù)研究[J].計(jì)算機(jī)工程,2013,39(8):196-199.
[4]余嘉,方杰,許可.基于加權(quán)小波的DCT人臉識(shí)別算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(17):199-202.
[5]郝靜靜,李莉.一種基于KPCA與LDA的人臉識(shí)別改進(jìn)算法[J].電子技術(shù)應(yīng)用,2013,39(12):132-134.
[6]樊春玲,陳秀建.基于PCA和LDA的人臉識(shí)別系統(tǒng)設(shè)計(jì)控制工程[J],2012,19(4):712-715.
[7]肖瀟,王憲保,王守覺(jué).多自由度神經(jīng)元模型的人臉識(shí)別算法研究[J].小型微型計(jì)算機(jī)系統(tǒng),2012,33(12):2693-2695.
[8]周杰,盧春雨,張長(zhǎng)水,等.人臉自動(dòng)識(shí)別方法綜述[J].電子學(xué)報(bào),2000,28(4):102-107.
[9]褚勤.基于小波分析和支持向量機(jī)的人臉識(shí)別方法研究[D].廣州:華南理工大學(xué),2012.5.
[10]王躍明,潘綱,吳朝暉.三維人臉識(shí)別研究綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2008,20(07):819-829.
[11]張東.圖書借閱管理系統(tǒng)的人臉識(shí)別技術(shù)[J].科技與管理,2014,16(04):65-67.
(責(zé)任編輯:陳福時(shí))