魏衍君, 楊明莉
(商丘職業(yè)技術(shù)學院 計算機系,河南 商丘 476000)
目前,由于信息采集困難、受到環(huán)境條件的約束、實現(xiàn)方式和手段的不足等原因,三維人臉識別技術(shù)還很不成熟[1,2].論文提出將聚類技術(shù)應用到三維人臉建模過程中,設計了一個基于三維人臉聚類建模的人臉識別系統(tǒng)的解決方案.針對三維人臉聚類,提出了圓錐曲線相似性三維人臉定義方法.基于三維人臉聚類建模設計了人臉識別系統(tǒng)的新框架,設計了與新系統(tǒng)對應的識別策略,解決了人臉與不同模型匹配結(jié)果無法比較的問題.本文的方法較好地提高了三維人臉建模的效果和效率.
三維形變模型方法基于合成分析框架.三維形變模型的基本原理是在包含M張人臉樣本的人臉空間上,將所有對應每張人臉的形狀向量S和紋理向量T進行線性組合,最后生成一個形變模型:
(1)
(2)
它們的協(xié)方差矩陣CS和CT可以這樣計算:
(3)
然后分別求得CS的特征值δi和特征向量Si,CT的特征值λi和特征向量ti,并按特征值由大到小的順序取前m個最大的特征值及相應的特征向量作為變換后組合模型的基底.那么人臉空間中的一個人臉形變模型可以近似表示為:
(4)
針對三維形變模型存在的問題及其解決辦法,受聚類思想的啟發(fā),考慮將聚類技術(shù)應用于三維形變模型的建立.在建立形變模型之前,先對整個三維人臉庫中的所有原型人臉進行聚類,然后對每一類人臉進行三維建模.這樣的好處是首先使得三維人臉庫的容量理論上可以無限制增長,增加模型的適用性;其次確定了模型建立時模型參數(shù)的初始值,去除了模型建立時的不確定因素;最后也是最重要的就是大大簡化了模型匹配的過程,減少了迭代次數(shù),提高了計算效率.參考三維形變模型框架,建立了三維聚類建模的主要框架,如圖1所示.從圖1可以看出,框架的總體結(jié)構(gòu)與三維形變模型有些類似,主要的區(qū)別就是在建立形變模型之前,先對整個三維人臉庫中的所有原型人臉進行聚類,然后對每一類人臉進行三維建模,最后得到一組三維形變模型.這里有兩個很重要的問題需要解決.首先,要對三維人臉進行聚類,決定選用哪種特征作為三維人臉之間的相似性,并且根據(jù)這種相似性進行的聚類效果最好;其次選擇最優(yōu)的聚類技術(shù),高效地進行聚類[3].
圖1 三維人臉聚類建??蚣?圖2 人臉識別系統(tǒng)架構(gòu)圖
簡單地對每個形變模型都進行模型匹配是不合適的,這樣不僅增加了系統(tǒng)的計算量,也沒有充分利用聚類建模的優(yōu)勢.在參照傳統(tǒng)形變模型框架的基礎上,提出了新的基于聚類建模的人臉識別系統(tǒng)框架,如圖2所示.
在進行模型匹配之前添加了一個相似性計算模塊,其主要功能是根據(jù)輸入的二維圖像,在n個形變模型中選擇一個形變模型來進行模型匹配,當然這里不能任意選擇,要按照一定的原則,這里采用的是相似性最大原則.
因為在建立這個形變模型時,是利用聚類思想先對三維人臉庫進行聚類,然后在每個分類的基礎上建立相應的形變模型,這里屬于每個分類的三維人臉之間具有很強的相似性,所以,我們自然想到,同樣按照相似性原則選擇一個形變模型進行模型匹配.在現(xiàn)實中面臨較多的是二維人臉圖像識別,現(xiàn)在要解決的主要問題是,如何計算一張二維人臉圖像與形變模型之間的相似性.
使用相似性傳遞聚類技術(shù)進行三維人臉的聚類,首先要解決的問題是三維人臉相似性的定義,該定義應該滿足以下要求:首先計算效率高,不能為整個系統(tǒng)增加計算量;其次,在計算量最低的情況下提高聚類的效果,以滿足實際應用的需要.
根據(jù)光照錐理論,一個三維對象在不同光照環(huán)境下形成的所有圖像可以形成一個凸多面錐,這個多面錐可以作為一個圖像生成器,賦予其不同的非負系數(shù)就可以生成不同光照條件下的圖像.圓錐曲線相似性定義的首要任務就是要定義一個好的度量,來描述來自同一個多面錐的圖像間的相似性.
對于某一個三維人臉圖像xi,可以找到一個非負的線性合成系數(shù){bi1,bi2,…,bi(i-1),bi(i+1),…,bin}使得:
(5)
這里用到了最小二乘逼近法,對于所有的i,bii=0.
(6)
公式(5)中的系數(shù)可以用來判斷xi的歸屬,即xi是否屬于{y1,y2,…,yk}子集生成的光照錐.如果xi屬于,那么對于j∈{1,2,…,k},對應的bij應該具有相對較大的數(shù)值,其他的bij很小、或者趨于0.這樣公式(5)中的線性系數(shù)就是一個很好的三維人臉圓錐曲線結(jié)構(gòu)的指示器.
用矩陣B表示公式(5)中的線性系數(shù)bij,即B=(bij),并對矩陣的每一列進行正?;幚恚沟妹恳涣械暮偷扔?.因為一般情況下bij≠bji,也就是矩陣B不是對稱的,所以可以得到需要的相似矩陣A=(B+BT)/2.
Im(x,y)=(Ir,m(x,y),Ig,m(x,y),Ib,m(x,y))T
(7)
輸入的二維人臉圖像為:
Ii(x,y)=(Ir(x,y),Ig(x,y),Ib(x,y))T
(8)
兩張人臉圖像的所有像素和色階的歐幾里得距離為:
E=∑x,y(Ii(x,y))-Im(x,y))2
(9)
E的大小就反映了這兩張人臉相似性的大小,E越大相似性越小,反之越大.這里的n個形變模型生成n張對應的平均人臉,E最小的平均臉對應的形變模型就是與二維輸入圖像最相似的形變模型.
三維人臉相似性的定義實際就是提取一種三維人臉特征來表示人臉,圓錐曲線相似性屬于基于動態(tài)模板的特征提取,這種方法的實質(zhì)是參數(shù)化的圖元模型和能量函數(shù)的結(jié)合,其中能量函數(shù)的設計依據(jù)人臉的先驗知識來確定,模板由三維人臉特征點的參數(shù)組成,參數(shù)可以根據(jù)環(huán)境的變化而調(diào)整,在進行特征提取時由模板的參數(shù)確定提取的面部三維特征.
三維人臉識別利用上一步所提取的面部關(guān)鍵特征,與數(shù)據(jù)庫中已有的圖像進行比較,從而得出人臉的身份.比較圖像通常使用最大相似性判別法.最大相似性判別法首先匹配人臉整體的輪廓和三維空間方向;然后,在保持姿態(tài)固定的情況下,匹配臉部不同特征點.匹配時根據(jù)人臉特征向量的統(tǒng)計相似度來判斷,相似度在一定范圍之內(nèi)即為識別結(jié)果.相似度的計算公式為:
(10)
其中ti是待檢驗樣本的特征向量的第i個特征分量;pi是樣本庫中樣本的特征向量的第i個特征分量;ki是第i個特征分量的權(quán)值;m是特征向量的維數(shù).相似度計算不能反映臉形圖像中的哪些變化量是關(guān)鍵的,哪些又是偶然的.因此可采用貝葉斯統(tǒng)計識別方法來解決這個問題.
在將上述框架應用到人臉識別時要選擇一個形變模型進行模型匹配,這里提出的識別策略如下:假設這里要確定兩張人臉圖像A和B是否是同一個體,首先分別對這兩張人臉圖像與n個形變模型進行相似性計算,如果與這兩張圖像相似的形變模型不是同一個,那么可直接確定這兩張圖像不屬于同一個體;如果這兩張人臉圖像都與同一個形變模型相似,那么再進行模型的匹配,這是得到的模型參數(shù),具有可比性,最后根據(jù)模型參數(shù)的比較確定這兩張圖像是否屬于同一個體.
模型匹配的過程是一個多參數(shù)的迭代優(yōu)化問題,過程復雜,是形變模型中計算花銷最大的處理步驟.而在實際的人臉識別系統(tǒng)中,大多數(shù)的情況是人臉圖像不屬于同一個體,如果采用如上策略,那么不需要再進行模型匹配就可以完成人臉的比較.這就大大減少了基于形變模型的人臉識別系統(tǒng)的總體計算量.這也正是本文提出基于聚類建模的人臉識別思想的最主要動機.
如果待處理的兩張人臉圖像都與同一個形變模型相似,這時就需要進行模型的匹配,這里采用了文獻[5]中介紹的ICIA(Inverse Compositional Image Alignment)算法實現(xiàn)模型的匹配.
由兩個向量之間夾角得出dA,基于極大類似分類器和線性判別分析理論得出dw:
(11)
圖3 所用時間比較
為了顯示基于聚類建模的人臉識別系統(tǒng)相對傳統(tǒng)形變模型在計算效率上的優(yōu)勢,在CMUPIE人臉數(shù)據(jù)中隨機選取了100張人臉圖像進行實驗.實驗的辦法是任意從數(shù)據(jù)集中選取一張人臉圖像,然后通過與數(shù)據(jù)集中其他圖像進行比較,確定此人臉圖像的身份,即找出與此人臉圖像最接近的圖片.圖3顯示了人臉識別系統(tǒng)在計算效率上與傳統(tǒng)形變模型的差別.圖3中上面一條線表示傳統(tǒng)形變模型所用時間曲線,下面一條線是基于聚類建模的人臉識別系統(tǒng)時間曲線.
分析實驗結(jié)果可知,基于聚類建模的人臉識別系統(tǒng)相對傳統(tǒng)形變模型的系統(tǒng),所用的時間差距很大,本文提出的方法在進行人臉識別時所用的時間遠遠少于采用傳統(tǒng)形變模型的方法所用的時間,而且對人臉樣本的數(shù)量不敏感.
參考文獻
[1] 蔡雪君,謝松云,張 波.一種改進的利用五官特征的人臉識別方法[J].計算機仿真,2009,26(11):228-303.
[2] 王躍明,潘 綱,吳朝暉.三維人臉識別研究綜述[J].計算機輔助設計與圖形學學報.2008,20(7):819-829.
[3] Brendan J. Frey, Delbert Dueck. Clustering by passing messages between data points[J]. Science,2007,315:972-976.
[4] Mian A S,Bennamoun M,Owens R. An efficient muhimodal 2D-3D hybrid approach to automatic face recognition[J].IEEE Transactions on Pattern Recognition and Machine Intelligence,2007,29(11):1 927-1 943.
[5] Stan Z. Li,Anil K.Jain.Handbook of Face Recognition[M].Springer Science & Business Media,Inc.,New York,2004.