許 娜
(河南工業(yè)職業(yè)技術(shù)學(xué)院 河南南陽473000)
隨著現(xiàn)代科學(xué)技術(shù)的不斷發(fā)展與深入,人臉識別系統(tǒng)得到了空前廣泛的關(guān)注并已應(yīng)用在實(shí)際生活生產(chǎn)中。人臉識別系統(tǒng)是通過攝像頭采集人臉信息,與后臺龐大的人臉模板對比,確認(rèn)匹配用戶就可以自由通行,并且支持口罩識別,如此一來,即使是出門忘帶磁卡、指紋變形、忘記密碼、也不用擔(dān)心不能進(jìn)門,并且 “刷臉”出入更方便、安全、衛(wèi)生,適用于學(xué)校、社區(qū)、商務(wù)中心、寫字樓、酒店、交通及旅游等各類場所。人臉生物識別技術(shù)的日益成熟和完善,在當(dāng)今社會公共安全防范、刑偵、技偵、網(wǎng)絡(luò)安全、金融安全等諸多領(lǐng)域?qū)l(fā)揮著獨(dú)有的不可替代的作用,而我國人口規(guī)模巨大,經(jīng)濟(jì)增長迅速,對可靠的人臉識別技術(shù)的各方面需求越來越迫切,人臉識別技術(shù)的不斷提高,將大大推動我國人工智能產(chǎn)業(yè)的發(fā)展。
人臉識別系統(tǒng)中最重要的技術(shù)就是人臉的特征提取與識別,相關(guān)的研究開始于二十世紀(jì)六十年代中后期,發(fā)展到現(xiàn)在已成為模式識別領(lǐng)域內(nèi)的一個重要課題。人們對于人臉圖像識別中線性判別方法的研究產(chǎn)生了很濃厚的興趣, 其中,如何提取有效的判別特征和降低判別向量的維數(shù)是焦點(diǎn)所在。目前許多人臉特征抽取算法被提出,主成分分析(PCA)[1],F(xiàn)isher線性鑒別分析(LDA)[2]和相關(guān)的改進(jìn)方法是最典型的經(jīng)典線性算法。近年來研究發(fā)現(xiàn),人臉很可能位于一個非線性流形上,因此一些基于流形學(xué)習(xí)的算法相繼被提出,包括局部線性嵌入方法[3],保持近鄰嵌入[4],拉普拉斯特征映射[5],局部保持投影方法[6]和無監(jiān)督鑒別投影方法[7]等。
保持近鄰嵌入(Neighborhood Preserving Embedding,NPE)算法就是對于給定的數(shù)據(jù)集,采用與局部線性嵌入(LLE)算法相似方法來構(gòu)建數(shù)據(jù)集上的近鄰圖。假設(shè)給定的數(shù)據(jù)集,其中。NPE算法目的就是能夠找到一個投影變換矩陣 P = [p1, p2,..., pd],該矩陣可以把人臉圖像的數(shù)據(jù)映射到一個相對低維的特征子空間中。其中,數(shù)據(jù)集在中表示為Y=y1,y1,…,yd,且Y=PTX。接下來,通過矩陣找到平面的局部幾何特征。每個數(shù)據(jù)點(diǎn)可以通過它的個最近鄰進(jìn)行線性重構(gòu),重構(gòu)損失函數(shù)為:
線性變換P可以通過求解下面最小化問題獲得:
經(jīng)過運(yùn)算,公式(1)即可變?yōu)榍蠼鈴V義特征值,即
局部保持投影算法(Locality Preserving Projection,LPP)旨在降低維度的同時,還能使樣本的局部流形結(jié)構(gòu)保持不變。LPP算法的目的是通過一定的性能目標(biāo)來找到一個線性變換,從而降低高維數(shù)據(jù)的維度:yi=PTxi,i=1,2,…,N 。
設(shè)訓(xùn)練樣本數(shù)據(jù)X= (x1,x2,…,xN),其中xi∈iD,i=1,2,…,N,變換矩陣可以通過最小化下面的目標(biāo)函數(shù)來獲得:
無監(jiān)督分類投影算法(Unsupervised Discriminant Projection,UDP)的目的是利用非局部散度矩陣和局部散度矩陣的比值最大從而獲取最優(yōu)投影向量。
假設(shè)給定的樣本數(shù)據(jù)集為:X=(x1,x2,…,xN),其中xi∈ iD,i=1,2,…,N。
通常,人臉識別算法分析中,都會采用人臉數(shù)據(jù)庫為樣本來測試驗(yàn)證算法的有效性,本文即是如此。在實(shí)驗(yàn)中,通常隨機(jī)地將人臉圖像分成兩組,其中一組作為訓(xùn)練樣本,剩下的一組作為測試樣本。本次實(shí)驗(yàn)采用最近鄰算法進(jìn)行分類。
ORL人臉數(shù)據(jù)集是由英國劍橋大學(xué)的 Olivetti研究實(shí)驗(yàn)室在1992年4月至1994年4月期間創(chuàng)建,共包含 40個不同人的 400張圖像。可以從http://www.cam-orl.co.uk下載此人臉數(shù)據(jù)集。數(shù)據(jù)庫中的部分人臉圖像如圖1所示。
圖1 ORL人臉數(shù)據(jù)庫部分人臉圖像
表1 ORL數(shù)據(jù)庫上各種算法的最高識別率
在實(shí)驗(yàn)中,將隨機(jī)選取到的ORL人臉數(shù)據(jù)庫中每人的5幅人臉圖像作為訓(xùn)練樣本,測試樣本則為每人其余的5幅圖像。每次實(shí)驗(yàn)都會獨(dú)立重復(fù)進(jìn)行20次,這是為了消除選擇樣本的隨機(jī)性,最終取平均識別率。
觀察圖2和表1中各個算法的識別率,可以看出UDP算法的識別率最高,LDA算法次之。這是因?yàn)?LDA算法是有監(jiān)督特征提取算法, 而 UDP算法是將不同類的人臉流形分開,所以能夠得到很好的識別效果。而LPP算法,NPE算法則通過不同的方法保留了圖像的流形結(jié)構(gòu),所以最終識別率都大于PCA。
圖2 ORL人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果
Yale人臉數(shù)據(jù)庫[8]由耶魯大學(xué)計(jì)算視覺與控制中心創(chuàng)建,包含15位志愿者的165張圖片,每人11幅,每幅圖像灰度級為256,圖像大小寬度為320,高度為243,部分圖像如下圖3所示。
觀察圖4和表2中各個算法的識別率,可以看出,各種算法在背景成分變化較大的場合且樣本較少時,最高識別率均較低,而隨著訓(xùn)練樣本數(shù)的增多,這些算法的識別率有增長趨勢。其中,UDP算法識別率低于LPP,但是其魯棒性較好。而NPE算法在Yale數(shù)據(jù)庫上人臉識別率很低,相較于該算法在ORL數(shù)據(jù)庫上的高識別率,說明NPE算法在光照條件變化較大時,其魯棒性很差。
圖3 Yale人臉數(shù)據(jù)庫部分圖像
表2 Yale數(shù)據(jù)庫上各種算法的最高識別率(%)
圖4 Yale數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果
通過以上分析,可以知道LDA, LPP和UDP算法的識別率較高,因此人臉識別中基于流形學(xué)習(xí)的算法以及將這些算法應(yīng)用于人臉識別系統(tǒng)中還是有很大的研究空間的??偟膩碚f,人臉識別技術(shù)的算法技術(shù)創(chuàng)新還有很多難題亟待解決。