王超,王洋
(長(zhǎng)春理工大學(xué),長(zhǎng)春 130022)
面部識(shí)別技術(shù)是使用計(jì)算機(jī)對(duì)人的面部圖像進(jìn)行分析,通過圖像處理顯示出有效的面部特征信息,進(jìn)而對(duì)人的身份進(jìn)行辨認(rèn)的一種技術(shù)。人的面部識(shí)別技術(shù)是近年來圖像和模式識(shí)別處理領(lǐng)域的一個(gè)研究熱點(diǎn),很多研究機(jī)構(gòu)及學(xué)者已經(jīng)在此項(xiàng)技術(shù)上取得了顯著的成果,并應(yīng)用在許多領(lǐng)域[1]。由于學(xué)生管理工作是高校事務(wù)中的重中之重,由于群體特點(diǎn)及課堂時(shí)間的限制,采用傳統(tǒng)的點(diǎn)名方式或者簽到方式都會(huì)存在各種弊端,若采用面部識(shí)別技術(shù),則可提高管理能力和效率。但由于人面部特征復(fù)雜,計(jì)算機(jī)對(duì)面部特征提取受環(huán)境影響大等因素,識(shí)別率仍有待提高[2,6]。本文設(shè)計(jì)一種結(jié)合PCA與局部二值模式的面部識(shí)別學(xué)生考勤方法,融合了主部與局部的特征,可以有效提高面部識(shí)別算法的識(shí)別率。
在面部識(shí)別技術(shù)領(lǐng)域中,最主要的提取主部特征信息的方法就是主成分分析法(Principal Component Analysis,PCA)。其廣泛應(yīng)用于面部的輪廓信息提取。PCA是最早的一種多變量分析技術(shù),起源于通信理論中的K-L變換。早在1901年,Pearson就提出了此方法,此后,Karhunan Loève等學(xué)者對(duì)該方法進(jìn)行了多次修改。PCA的主要技術(shù)路線就是代表原始數(shù)據(jù)的基礎(chǔ)上,通過線性變換將高維面部樣本取樣數(shù)據(jù)投影到低維數(shù)據(jù)中,使它們?cè)诘途S數(shù)據(jù)中的分散程度最大化,從而更容易對(duì)面部圖像進(jìn)行分類顯示[2]。
對(duì)于n維空間中的N個(gè)樣本X1,X2,…,XN,其中Xi=(x1,x2,…,xn)可以看成N個(gè)隨機(jī)變量中的第i個(gè)n維隨機(jī)變量,用矩陣的形式可表示為:
對(duì)矩陣X中所有的列取平均向量,由于樣本的總數(shù)為N,則可以得到所有樣本的平均向量M:
進(jìn)一步得出樣本集X對(duì)應(yīng)的總體散布矩陣,即協(xié)方差矩陣為:
根據(jù)奇異值分解定理可以求出其特征值λi及對(duì)應(yīng)的特征向量由奇異值定理可知,St的正交歸一化特征向量為:
其中,i=1,2,…,n。λ1,λ2,…,λn是其特征值,且滿足λ1≥λ2≥…≥λn,則其對(duì)應(yīng)的特征向量為,在主成分分析中,αi可被稱為這組樣本的主成分,W即為這組樣本的主成分矩陣。
對(duì)一個(gè)n維向量X,通過先行變換公式Y(jié)=WTX可以得到一個(gè)新的n維變量Y,即一簇投影特征向量Y1,Y2,…,Yn。這個(gè)PCA變換過程就是將變量X向W所對(duì)應(yīng)的一組基進(jìn)行投影,得到一組投影系數(shù)Y。在這個(gè)過程中,PCA起到了明顯的降維作用。Y就稱為X在這組數(shù)據(jù)下經(jīng)過PCA變換后的結(jié)果[3]。
已知投影系數(shù)Y,可以通過W重構(gòu)原始數(shù)據(jù):
圖1 通過PCA提取后的重構(gòu)圖像
圖1列出了部分通過PCA提取后的重構(gòu)圖像,從圖像分析可以看出,重構(gòu)出的面部圖像細(xì)節(jié)部分比較模糊,但是面部圖像的全局輪廓信息非常清楚。因此PCA主要提取的是人臉的全局信息。
局部二值模式(Local Binary Pattern,LBP)是一種具有旋轉(zhuǎn)不變性和灰度不變性等優(yōu)點(diǎn)的高效局部紋理圖像描述算子[4]。在近幾年的研究?jī)?nèi),LBP算子得到不斷的變化和發(fā)展,并廣泛地應(yīng)用于紋理圖像分類、紋理處理分割、面部圖像分析、目標(biāo)識(shí)別等領(lǐng)域。
紋理分析是圖像處理分析中常用的技術(shù),它是由物體表面物理特性不同所引起的能夠表示某個(gè)特定表面特征的灰度或者顏色信息??梢哉J(rèn)為紋理圖像是由很多相似的像素構(gòu)成,所以直觀來說紋理圖像描述可提供特定圖像區(qū)域的平滑、稀疏、規(guī)律性等特性。反映在圖像上,紋理圖像表現(xiàn)為顏色、亮度的周期性變化[3]。幾乎所有的圖像都包含了紋理信息。與其它圖像特征相比,圖像紋理信息反映了圖像灰度模式的空間分布,也區(qū)分了圖像的低頻信息與高頻信息,并包含了圖像的表面信息及其與周圍環(huán)境的聯(lián)系,更好地兼顧了圖像的微觀結(jié)構(gòu)信息與宏觀信息,因此在圖像分析中的紋理分析受到格外關(guān)注。
局部二值模式是一種灰度范圍內(nèi)的紋理描述方式[5]。通過圖像點(diǎn)C與在其鄰域內(nèi)采樣的n個(gè)點(diǎn)的差值來描述:
基本的LBP算子由于覆蓋了一個(gè)特定半徑范圍內(nèi)的較小區(qū)域,在應(yīng)用到不同大小和頻率紋理圖像時(shí)受到限制,這成了LBP的最大缺點(diǎn)。為了適應(yīng)不同大小的紋理圖像特征,并保持灰度和旋轉(zhuǎn)不變性的要求,Ojala[5]等對(duì)LBP算子進(jìn)行了修改和改進(jìn),將最初的3×3鄰域擴(kuò)展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進(jìn)后的LBP算子允許在半徑為R的圓形鄰域內(nèi)有任意多個(gè)像素點(diǎn)。
圖2 Ojala提出的改進(jìn)LBP算子
但是隨著鄰域的擴(kuò)展及像素點(diǎn)的增加,描述子的維數(shù)也隨之增加,算法的復(fù)雜度也明顯加大。
LBP的工作原理是通過將每一維以零為閾值進(jìn)行二值化來實(shí)現(xiàn)二進(jìn)制編碼的。它把描述子向量空間劃分為不同象限,同一象限內(nèi)的描述子具有相同的編碼。描述子空間的坐標(biāo)可表示為:
其中,C為圖像塊中心像素點(diǎn),Ci為C的鄰域像素點(diǎn),是由鄰域點(diǎn)和圖像點(diǎn)的值組成的原始描述子向量,E是描述矩陣,是圖像點(diǎn)的最終描述子向量。但是LBP的描述矩陣的列向量不正交,這會(huì)導(dǎo)致LBP的編碼出現(xiàn)分布不均勻的情況,因此可對(duì)描述子進(jìn)行變換:
其中,W是變換矩陣。對(duì)描述子進(jìn)行變換其實(shí)就是對(duì)描述矩陣進(jìn)行變換:
對(duì)變換后的描述子進(jìn)行閾值化得到的二進(jìn)制向量為:
結(jié)合PCA變換可以保證描述子的各維間不相關(guān),且描述子每一維的方差足夠大,以確保LBP編碼分布均勻。
設(shè)LBP差值描述子的協(xié)方差矩陣為:
選取k個(gè)最大特征值對(duì)應(yīng)的特征向量,作為變換矩陣其中k為變換后描述子所需維數(shù)。采用此變換矩陣對(duì)差值描述子進(jìn)行變換,并對(duì)變換后的描述子進(jìn)行LBP編碼就完成了LBP的特征提取。
在LBP編碼過程中增加了PCA變換,通過PCA變換,將描述子的各維間變換為不相關(guān),也即由描述子得到的二進(jìn)制碼在每個(gè)比特間不相關(guān)。PCA變換在整個(gè)去相關(guān)過程中,使描述子每一維的方差最大化,即每一維在均值零附近盡量均勻分布。PCA變換能使編碼值在圖像總體上呈現(xiàn)均勻分布。另外,PCA變換還具有降維的作用。因?yàn)樵贚BP編碼中,描述子的維數(shù)決定了編碼值的數(shù)目,以及直方圖特征的維數(shù)。描述子的維數(shù)越大,采樣點(diǎn)數(shù)就越多,能利用的信息就更多,但帶來的影響就是系統(tǒng)的復(fù)雜度也越高。PCA變換的降維作用剛好可以解決這個(gè)問題,能夠簡(jiǎn)化計(jì)算,有利于更好地描述圖像點(diǎn)。最后,PCA變換后的描述子是原差值描述子的線性組合,會(huì)大大増強(qiáng)編碼的魯棒性。
實(shí)驗(yàn)過程中,分別將提出的算法在ORL人臉庫(kù)、YALE和FERET圖像庫(kù)進(jìn)行驗(yàn)證。在ORL人臉庫(kù)的訓(xùn)練集上隨機(jī)選出250張訓(xùn)練圖像,其中50張圖像用于進(jìn)行PCA變換學(xué)習(xí),其余的200張圖像分別進(jìn)行常規(guī)LBP及結(jié)合PCA變換的LBP編碼實(shí)驗(yàn)。使用400張YALE和FERET圖像庫(kù)的圖像進(jìn)行圖像識(shí)別。
實(shí)驗(yàn)過程中,在編碼的分布均勻性方面,結(jié)合PCA變換的LBP編碼要明顯優(yōu)于常規(guī)LBP,這說明對(duì)描述子進(jìn)行PCA變換具有明顯效果。表1給出了對(duì)不同算法在三種權(quán)威的人臉圖像庫(kù)中圖像識(shí)別率的統(tǒng)計(jì)情況,結(jié)果顯示,本文提出的算法識(shí)別率均超出了PCA、LBP和CS-LBP+WPCA算法。這說明PCA變換的主部特征提取結(jié)合LBP局部二值模式起到了明顯作用,主要?dú)w功于LBP和PCA的降低特征向量的維度處理,即去除了特征向量冗余部分,進(jìn)而使算法的計(jì)算效率得到提高。
表1 各種算法識(shí)別率比較
本文針對(duì)高效課堂考勤方式存在的弊端,提出了一種基于LBP與PCA變換結(jié)合的面部識(shí)別技術(shù),在LBP二值模式提取人臉局部特征的基礎(chǔ)上,再用PCA變換對(duì)其進(jìn)行降維,通過增加LBP維數(shù)增加有效信息的獲取,再通過PCA降維處理來減小算法復(fù)雜度。結(jié)合后的特征能夠降低特征數(shù)據(jù)間的冗余,保證有效決策信息的保留。LBP和PCA算法的結(jié)合實(shí)現(xiàn)面部識(shí)別技術(shù)的有效互補(bǔ)。本算法在三種權(quán)威人臉圖像庫(kù)中進(jìn)行測(cè)試,均體現(xiàn)了較好的識(shí)別性能,也表明本算法在面部識(shí)別上具有較好的魯棒性。
在大數(shù)據(jù)時(shí)代的背景下,PCA與LBP的學(xué)生面部識(shí)別考勤算法體現(xiàn)了大數(shù)據(jù)的思維,結(jié)合智能識(shí)別技術(shù)、計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù),逐漸改變傳統(tǒng)點(diǎn)名方式,科學(xué)、高效的解決課堂點(diǎn)名的各類問題,極大的提高了課堂效率及教學(xué)質(zhì)量,促進(jìn)高校學(xué)生管理系統(tǒng)良性發(fā)展。本課題的研究可為高校管理的智能化提供一定的借鑒和參考。
[1]王竹君.基于人臉檢測(cè)的移動(dòng)點(diǎn)名系統(tǒng)研究與實(shí)現(xiàn)[D].云南:云南大學(xué),2014.
[2]黃金鈺,張會(huì)林.LBP直方圖與PCA的歐式距離的人臉識(shí)別[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,21(6):202-204.
[3]李德福,黃新.基于二維PCA和SVM算法的人臉識(shí)別系統(tǒng)[J].桂林電子科技大學(xué)學(xué)報(bào),2017,37(5):391-395.
[4]趙玉丹.基于LBP的圖像文理特征的提取及應(yīng)用[D].西安:西安郵電大學(xué),2015.
[5]Ojala T,Pietik?inen M,M?enp?? T.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[C].European Conference on Computer Vision,2000,24(7):404-420.
[6]利嘉頔,陳振學(xué),劉成云.分塊CS-LBP和加權(quán)PCA的低分辨率人臉識(shí)別[J].光電子激光,2016,27(2):210-216.