王斯藤,唐旭晟,陳丹
(福州大學(xué) a. 機(jī)械工程及自動(dòng)化學(xué)院, b. 電氣工程與自動(dòng)化學(xué)院,福建 福州 350116)
融合特征的神經(jīng)網(wǎng)絡(luò)在三維人臉識(shí)別中的應(yīng)用
王斯藤a,唐旭晟a,陳丹b
(福州大學(xué) a. 機(jī)械工程及自動(dòng)化學(xué)院, b. 電氣工程與自動(dòng)化學(xué)院,福建 福州 350116)
摘要:針對(duì)三維人臉特征表示問(wèn)題,提出了一種三維人臉輪廓曲線特征與二維Gabor小波特征相融合的人臉特征表示新方法?;谶@種新的融合特征,利用模糊自適應(yīng)共振神經(jīng)網(wǎng)絡(luò)(Fuzzy ARTMAP)進(jìn)行有監(jiān)督的學(xué)習(xí)訓(xùn)練,并構(gòu)建三維人臉識(shí)別分類器實(shí)現(xiàn)人臉識(shí)別。利用模糊自適應(yīng)共振神經(jīng)網(wǎng)絡(luò)分類器的增量學(xué)習(xí)能力,可以很好地解決隨著訓(xùn)練模型增加導(dǎo)致識(shí)別系統(tǒng)識(shí)別率降低的問(wèn)題。所提出的方法在FRGC v2.0三維人臉數(shù)據(jù)庫(kù)上,對(duì)人臉表情變化進(jìn)行了實(shí)驗(yàn)。結(jié)果表明具有一定的魯棒性,識(shí)別率高,且隨著新增人臉數(shù)量的增長(zhǎng)可以提高準(zhǔn)確率。
關(guān)鍵詞:三維人臉識(shí)別;模糊神經(jīng)網(wǎng)絡(luò);多特征融合;Gabor小波特征;三維曲線特征
Using Fuzzy ARTMAP with Multi-Features in 3D Face Recognition
WANG Sitenga,TANG Xushenga,CHEN Danb
(a. College of Mechanical Engineering and Automation,
b. College of Electrical Engineering and Automation, Fuzhou University, Fuzhou 350116, China)
Abstract:This paper presents a new representation of 3D face recognition features, includeing the 3D face curve features and 2D Gabor wavelet features. Based on the new multi-features, Fuzzy ARTMAP is used to train the network with supervised learning, and create a 3D face recognition classifier to distinguish human faces. The algorithm can be used to keep a high recognition rate with the incremental number of models. The experiment test on FRGC v2.0 database shows that the performance of multi-features fusion is perfect on robustness in changing expressions, and Fuzzy ARTMAP is used to keep a high recognition rate in the increasing number of human faces.
Keywords:3D face recognition; Fuzzy ARTMAP; multi-features fusion; gabor wavelet; three-dimensional curve
0引言
人臉識(shí)別主要用于門禁、安保等領(lǐng)域。與其他人體生物特征識(shí)別技術(shù)(指紋,虹膜等)相比,人臉識(shí)別具有自然、友好、對(duì)用戶干擾少、易被用戶接受等優(yōu)勢(shì)。而具有更廣闊的應(yīng)用前景。經(jīng)過(guò)研究人員多年的不懈努力,基于圖像的二維人臉識(shí)別技術(shù)在一定約束條件下已經(jīng)取得了較好的識(shí)別結(jié)果。然而,研究實(shí)驗(yàn)表明:二維人臉識(shí)別在光照、姿態(tài),表情,遮擋以及年齡老化等條件下,表現(xiàn)出許多局限性[1]。這主要是因?yàn)槎S圖像其本質(zhì)是三維物體在二維平面上的投影,是三維信息在二維空間中的簡(jiǎn)約。
近年來(lái),隨著三維數(shù)據(jù)采集技術(shù)的日益成熟,三維人臉識(shí)別日趨成為人臉識(shí)別研究領(lǐng)域的熱點(diǎn)。
三維人臉數(shù)據(jù)由激光掃描或三維重建而成,所體現(xiàn)出來(lái)的點(diǎn)云或深度圖像,具有人臉復(fù)雜的曲線和曲率特征,因此在信息量上比二維圖像豐富[2]。此外,采集獲得的臉部三維形狀數(shù)據(jù)可看作是不隨光照、視圖的變化而變化,且化妝等附屬物對(duì)三維數(shù)據(jù)影響不明顯,因而三維人臉識(shí)別被認(rèn)為具有光照不變,姿態(tài)不變的特性[3]。
文中提出了一種新的三維人臉深度圖像融合特征,即三維人臉深度數(shù)據(jù)的Gabor小波特征[4]和人臉曲線輪廓特征相融合,采用模糊神經(jīng)網(wǎng)絡(luò)(Fuzzy ARTMAP)對(duì)所提取的融合特征進(jìn)行分類識(shí)別。
Fuzzy ARTMAP是自適應(yīng)共振理論(ART)的進(jìn)化版,具有增量學(xué)習(xí)和監(jiān)督模式,可以提高分類的準(zhǔn)確度,具有更高的性能和廣泛的實(shí)用性。整個(gè)算法的框架流程圖如圖1所示。在FRGC v2.0三維人臉數(shù)據(jù)庫(kù)上測(cè)試實(shí)驗(yàn)表明:該算法具有較高的識(shí)別率,所提取的特征對(duì)人臉表情變化具有一定的魯棒性,且隨著新增人臉數(shù)量的增長(zhǎng),可以保證較高的準(zhǔn)確率。
圖1 三維人臉識(shí)別算法框架流程圖
1三維人臉深度圖像融合特征提取
1.1新的人臉深度數(shù)據(jù)局部曲線特征提取
在人臉識(shí)別的過(guò)程中,特征的提取直接影響到識(shí)別的結(jié)果。用于三維人臉識(shí)別的特征有很多種,比較常見(jiàn)的是基于人臉表面幾何信息和基于鄰域信息。文獻(xiàn)[5-6]采用等間隔提取面部輪廓曲線,但提取的輪廓線易受年齡的增長(zhǎng)和人的胖瘦變化而發(fā)生變化,從而影響實(shí)際應(yīng)用中的識(shí)別率。文獻(xiàn)[7]采用等深度輪廓線作為特征,該算法要求人臉要絕對(duì)正面,對(duì)預(yù)處理算法要求很高,并且不能有表情變化和任何遮擋,不利于實(shí)際中操作和應(yīng)用。文獻(xiàn)[8]采用標(biāo)準(zhǔn)化特征采樣點(diǎn),特征采樣點(diǎn)是事先經(jīng)過(guò)手工標(biāo)定的,這對(duì)數(shù)據(jù)的要求也過(guò)高,很難實(shí)際操作。
針對(duì)以上問(wèn)題,提出一種新的局部輪廓線特征提取的方法。該方法的基本思想:不同人之間的鼻尖、顴骨和額頭的深度特征差異顯著,而這些區(qū)域又屬于剛性區(qū)域,隨年齡的增長(zhǎng)變化最小。選取這些區(qū)域的局部輪廓曲線作為識(shí)別特征,既具有區(qū)分性同時(shí)又能極大降低人臉老化造成的影響,并且不易被眼鏡和口罩等遮擋物影響。具體方法如下:
1) 三維人臉數(shù)據(jù)經(jīng)過(guò)姿態(tài)校正,人臉切割及人臉歸一化預(yù)處理后得到200×182的人臉歸一化深度圖,如圖2中(a)所示。
2) 建立深度圖坐標(biāo)系:正方向?yàn)樗较蛴覟閤軸,人臉長(zhǎng)度方向豎直向上為y軸,人臉深度方向?yàn)閦軸,如圖2中(b)所示。
3) 取圖中深度值中最大的點(diǎn)為鼻尖點(diǎn),過(guò)鼻尖點(diǎn)P作yoz平面的平行面T,平面T與深度圖的交線作為中分輪廓線;過(guò)鼻尖點(diǎn)P作xoz平面的平行面U,平面U與深度圖的交線作為水平輪廓線,如圖2(b)所示。圖3列出了兩個(gè)不同人的中分輪廓線和水平輪廓線。
4) 分別以平面T和平面U為基準(zhǔn),向左右兩邊等間隔(間隔5個(gè)像素)各作兩個(gè)平行面,這10個(gè)平面與深度圖相交,得到5條豎直輪廓線和5條水平輪廓線,總共10條輪廓線,如圖2中(b)所示。
Rk=[Cj,Lw]j,w=1,2,3,4,5
圖2 三維人臉圖像提取曲線特征示意圖
圖3 中分輪廓線和水平輪廓線
圖4列出了不同人臉深度圖提取出的1910維人臉局部曲線特征向量,圖4中(a)(b)同一個(gè)人的不同深度圖的局部曲線特征向量,(c)(d)為另一個(gè)人的不同深度圖局部曲線特征向量。從圖4中可以觀察出,同一個(gè)人的不同深度圖的局部曲線特征向量具有相似性,不同人的深度圖的局部曲線特征向量具有顯著的可分性。
圖4 五條豎直輪廓線與五條水平輪廓線融合圖(a)(b)表示同一男性的兩張不同圖像,(c)(d)表示同一女性的兩張不同圖像
1.2基于整體深度數(shù)據(jù)的Gabor小波特征提取
a) 二維Gabor小波濾波變換
Gabor小波濾波在二維人臉識(shí)別中已經(jīng)得到廣泛的應(yīng)用[9],文中也采用Gabor小波變換[10]對(duì)三維人臉深度數(shù)據(jù)進(jìn)行多方向、多尺度特征提取。二維Gabor小波濾波器的定義為:
(1)
其中:z=(x,y)為行矢量,‖·‖表示求2范數(shù),σ=2π,kmax=π/2,kμ,ν的定義為:
kμ,ν=kνeiΦμ
(2)
這里按文獻(xiàn)[9]取5個(gè)不同中心強(qiáng)度頻率v={0,1,2,3,4}以及8個(gè)不同的方向μ={0,1,2,3,4,5,6,7}。
b) 三維人臉圖像的Gabor小波特征提取
Gabor小波變換可通過(guò)深度數(shù)據(jù)矩陣I與Gabor核函數(shù)進(jìn)行卷積實(shí)現(xiàn):
Jkμ,ν,x0=∫ψkμ,ν(x0-x)I(x)d2x=(ψkμ,ν*I)(x0)
(3)
卷積過(guò)程產(chǎn)生由實(shí)部和虛部?jī)蓚€(gè)分量構(gòu)成的復(fù)數(shù)響應(yīng)。對(duì)三維人臉識(shí)別,保留卷積后產(chǎn)生的復(fù)數(shù)響應(yīng)的幅值。對(duì)于一幅200×182大小的深度圖,將得到200×182×40=1456000維的Gabor特征向量。這么高維的數(shù)據(jù)將對(duì)后續(xù)的分類處理和計(jì)算能力要求較高,容易造成維數(shù)災(zāi)難。為了避免維數(shù)災(zāi)難,必須進(jìn)行降維操作。降維方法如下:
1) 先將原始深度圖等間隔(5個(gè)像素)稀疏采樣得到40×36大小的子深度圖像;
2) 40×36大小的子深度圖像經(jīng)Gabor濾波器卷積得到40個(gè)40×36大小的Gabor幅值特征圖像;
3) 將40個(gè)40×36大小的Gabor幅值特征圖像雙線性插值為11×10大小的Gabor特征子圖像,將所有40個(gè)Gabor特征子圖像(每個(gè)11×10=110維)幅值級(jí)聯(lián),就得到了4400個(gè)維度的輸入圖像I的Gabor 特征表示RI。
RI={Jp(x,y)|(x,y)∈I}
(4)
圖5展示了Gabor濾波器5個(gè)不同的中心頻率和8個(gè)不同方向與人臉深度圖卷積的結(jié)果。
圖5 三維人臉識(shí)別算法框架流程圖
1.3多特征融合
三維人臉深度數(shù)據(jù)不僅具有二維人臉的整體特征,而且又有不同維度上的曲線特征。采用特征融合方法,將1.1和1.2節(jié)所述的Gabor小波濾波后的整體特征向量RK與人臉曲線特征RI串聯(lián)起來(lái),作為最終的人臉特征輸入向量,如式(5)所示:
R=[RkRI]
(5)
這樣一張人臉深度圖像就可以得到一個(gè)6310維的融合特征行向量。
2FuzzyARTMAP分類器有監(jiān)督增量學(xué)習(xí)算法
目前運(yùn)用在人臉識(shí)別領(lǐng)域中的分類器有支持向量機(jī)(SVM)[11]、隱馬爾可夫模型(HMM)[12]、人工神經(jīng)網(wǎng)絡(luò)分類器(ANN)[13-14]等。在三維人臉識(shí)別中所采用的是神經(jīng)網(wǎng)絡(luò)中模糊自適應(yīng)共振理論(Fuzzy ARTMAP[15-16]),該算法克服了可塑性-穩(wěn)定性兩難的問(wèn)題,可以在不斷變化的條件下訓(xùn)練新的樣本,并且不會(huì)削弱之前已經(jīng)訓(xùn)練的樣本信息。Fuzzy ARTMAP綜合了模糊集理論和自適應(yīng)共振理論,具備很多優(yōu)越的性能。目前的ART模型已經(jīng)成百上千,有監(jiān)督式和無(wú)監(jiān)督式等。模糊ARTMAP摒棄了ARTMAP的集合觀點(diǎn),采用隸屬的函數(shù)方法來(lái)表達(dá)輸入特性,融入模糊集理論,能處理二進(jìn)制值和連續(xù)值,且具有監(jiān)督式的增量學(xué)習(xí)能力,可以提高分類的準(zhǔn)確度,具有更高的性能和廣泛的實(shí)用性[17]。
Fuzzy ARTMAP的原理如下:
一個(gè)Fuzzy ARTMAP系統(tǒng)包括一對(duì)自適應(yīng)共振模型(ARTa和ARTb)以及一個(gè)內(nèi)部映射域Fab,如圖6所示。在Fuzzy ARTMAP訓(xùn)練學(xué)習(xí)時(shí),ARTa接受輸入向量,進(jìn)行自適應(yīng)學(xué)習(xí),對(duì)輸入向量進(jìn)行自動(dòng)分類。ARTb接受正確的預(yù)測(cè)分類向量,進(jìn)行非監(jiān)督學(xué)習(xí),輸出導(dǎo)師信號(hào)。每一個(gè)Fuzzy ART模型為三層結(jié)構(gòu),至下而上分別為F0層、F1層和F2層,F0層的節(jié)點(diǎn)表示輸入向量。ARTa的F1層的節(jié)點(diǎn)接受F0至下而上的輸入以及F2層至上而下的輸入,F(xiàn)2層的節(jié)點(diǎn)表示有效的分類編號(hào)。F0層和F1層的節(jié)點(diǎn)數(shù)與輸入向量相關(guān),F(xiàn)2層的節(jié)點(diǎn)數(shù)是任意的,且根據(jù)激活的狀態(tài)發(fā)生變化。
權(quán)向量:聯(lián)系每個(gè)F2層分類節(jié)點(diǎn)的是一個(gè)自適應(yīng)權(quán)向量(也稱作LTM跟蹤),包括了ART-1網(wǎng)絡(luò)的至下而上和至上而下的權(quán)向量。
參數(shù):Fuzzy ARTMAP動(dòng)力學(xué)由選擇參數(shù)α>0所決定;學(xué)習(xí)速率參數(shù)β∈[0,1];警戒值ρ∈[0,1]。
圖6 Fuzzy ARTMAP結(jié)構(gòu)
在ARTa和ARTb中,為了防止類別增加,輸入模式a在傳遞給F2層前,需要在F1層進(jìn)行補(bǔ)碼編碼。補(bǔ)碼形式為I=(a,ac)=(a1,a2,1-a1,1-a2),F2層是一個(gè)勝者為王競(jìng)爭(zhēng)層,由一個(gè)類別選擇函數(shù)Tj來(lái)衡量輸入向量I與自適應(yīng)權(quán)重(第j個(gè)節(jié)點(diǎn)的權(quán)值wj)間的匹配程度:對(duì)每個(gè)輸入向量I和F2層的節(jié)點(diǎn)j,選擇函數(shù)Tj如式(6):
(6)
TJ=max{Tj:j=1...N}
(7)
(8)
警戒值ρ的取值范圍是[0,1]。權(quán)重向量由式(8)來(lái)計(jì)算。如果式(8)條件滿足,則x和I的差別不超過(guò)警戒值,獲勝神經(jīng)元與輸入I的類別發(fā)生共振。與獲勝神經(jīng)元相關(guān)的權(quán)值按照式(9)計(jì)算,使其與輸入模式更相似。
(9)
(10)
(11)
xab=
(12)
綜上所述,F(xiàn)uzzy ARTMAP的算法概括如下:
1) 初始化網(wǎng)絡(luò),包括連接權(quán)以及相關(guān)參數(shù)。
由表8感官評(píng)價(jià)的極差分析可以看出,各因素對(duì)姜汁保健果凍風(fēng)味口感影響的主次因素為姜汁添加量(A) >檸檬酸添加量(B) >β-環(huán)狀糊精添加量(C),說(shuō)明姜汁添加量是影響姜汁果凍風(fēng)味口感的主要因素,其次是檸檬酸添加量,再其次是β-環(huán)狀糊精添加量。并得出姜汁保健果凍感官品質(zhì)最佳的組合為A2B2C3。
2) 為ARTb提供一個(gè)分類目標(biāo)向量,確定ARTb中的獲勝神經(jīng)元,并進(jìn)行非監(jiān)督式學(xué)習(xí)。
3) 為ARTa提供與分類目標(biāo)向量相對(duì)應(yīng)的輸入模式矩陣,確定ARTa中的獲勝神經(jīng)元。
4) 確定映射域輸出向量xab并與ARTb的輸出向量進(jìn)行匹配。
5) 若兩向量匹配,映射域權(quán)向量和ARTa權(quán)向量都進(jìn)行學(xué)習(xí),轉(zhuǎn)至7)。
6) 若兩向量不匹配,則執(zhí)行匹配跟蹤,轉(zhuǎn)3)。
7) 若檢測(cè)到有未學(xué)習(xí)的模式,則返回2),否則結(jié)束。
3實(shí)驗(yàn)
3.1測(cè)試數(shù)據(jù)庫(kù)
人臉數(shù)據(jù)庫(kù)FRGC v2.0[18]中的三維人臉深度圖像的分辨率大小為640×480像素,其z軸上有30萬(wàn)個(gè)掃描點(diǎn)的深度數(shù)據(jù)。該數(shù)據(jù)庫(kù)包括466個(gè)人,共4007個(gè)三維人臉模型,分別在2003年至2004年春秋兩個(gè)不同時(shí)間采集。采集三維數(shù)據(jù)時(shí),也同時(shí)采集了二維紋理圖像。從中選取100個(gè)人的各4張圖片,共400張三維圖像構(gòu)成實(shí)驗(yàn)的數(shù)據(jù)庫(kù)。這些圖像允許10°以內(nèi)的偏轉(zhuǎn),每個(gè)人的人臉數(shù)據(jù)包括正常的表情以及頭發(fā)等遮擋,圖像采集于不同時(shí)間段。部分測(cè)試圖像示例如圖7。
圖7 測(cè)試數(shù)據(jù)庫(kù)圖像示例
3.2測(cè)試數(shù)據(jù)庫(kù)
a) 雙眼檢測(cè)和坐標(biāo)定位
該數(shù)據(jù)庫(kù)的深度圖像還配合著一張紋理彩色圖像,即二維照片。采用文獻(xiàn)[19]中二維人眼定位方法,可自動(dòng)定位出兩個(gè)瞳孔中心的位置坐標(biāo)x1、y1和x2、y2。
b) 人臉姿態(tài)矯正與切割
根據(jù)檢測(cè)出的雙眼的坐標(biāo)即可對(duì)z軸進(jìn)行旋轉(zhuǎn),使y1=y2,從而得到正的人臉,如圖8(b)(c)所示。為了進(jìn)一步消除頭發(fā),脖子,背景等非人臉本質(zhì)因素的影響,采用人臉圖像切割的方式對(duì)圖像進(jìn)行幾何歸一化。由定位出的雙眼瞳孔中心坐標(biāo)為基準(zhǔn),如圖9(a)所示的方式對(duì)人臉進(jìn)行切割。令雙眼間距為D,剪裁參數(shù)h、r、n分別為0.5、0.5、1.7,所有的圖像均歸一化成分辨率為200×182的圖像。
圖8 人臉姿態(tài)糾正與切割
圖9 試驗(yàn)中使用 的三維人臉圖像切割方法
3.3特征提取
根據(jù)1.1,1.2,1.3所述的方法分別提取了曲線特征、Gabor小波特征和融合特征,將這3種特征作為Fuzzy ARTMAP神經(jīng)網(wǎng)絡(luò)輸入向量。
3.4FuzzyARTMAP神經(jīng)網(wǎng)絡(luò)分類器訓(xùn)練與識(shí)別
進(jìn)行分類訓(xùn)練和識(shí)別實(shí)驗(yàn)時(shí),按如下方式生成訓(xùn)練集和測(cè)試集:從每個(gè)人4個(gè)模型中隨機(jī)選取3個(gè)作為訓(xùn)練樣本,剩下的1個(gè)作為測(cè)試樣本。總共進(jìn)行了50次不重復(fù)隨機(jī)測(cè)試實(shí)驗(yàn),取這50次實(shí)驗(yàn)的平均識(shí)別率作為算法的最終識(shí)別率。
訓(xùn)練時(shí)Fuzzy ARTMAP分類器的參數(shù)設(shè)定如下:警戒值ρa(bǔ)取0.8,訓(xùn)練次數(shù)100,學(xué)習(xí)速率β取1.0。
3.5測(cè)試結(jié)果與分析
按上述的實(shí)驗(yàn)規(guī)程,采用曲線特征、Gabor小波特征和融合特征這3種特征分別進(jìn)行了測(cè)試,測(cè)試結(jié)果如表1所示。從表1可以看出;1) 與局部曲線特征的平均識(shí)別率87.5%相比,Gabor特征的識(shí)別率提高到了95.6%,這說(shuō)明Gabor能更準(zhǔn)確且穩(wěn)定地描述人臉特征。2) 文中提出的融合特征的識(shí)別率提高到了97.5%,這從一個(gè)側(cè)面說(shuō)明了融合特征的有效性。
表1 各種特征算法識(shí)別率的比較
參考文獻(xiàn)表2列出了本方法與其他一些中的三維人臉識(shí)別實(shí)驗(yàn)結(jié)果比較。表2中各種算法的實(shí)驗(yàn)環(huán)境如下:文獻(xiàn)[20]的特征點(diǎn)距離法是在人工標(biāo)定特征點(diǎn)的Bosphorus 3D人臉數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn);文獻(xiàn)[21]的THD(topographic high-order derivatives)法是以空間微模型特征在FRGCv2 3D人臉數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn);文獻(xiàn)[22]的CPD(coherent point drift)方法是基于混合高斯曲率特征,通過(guò)計(jì)算標(biāo)志點(diǎn)之間的距離來(lái)進(jìn)行識(shí)別,從FRGC V2.0庫(kù)中選取了80人構(gòu)建測(cè)試數(shù)據(jù)庫(kù);文獻(xiàn)[23]采用改進(jìn)LBP算子和稀疏表示方法通過(guò)稀疏表示分類器來(lái)實(shí)現(xiàn)分類識(shí)別,在法國(guó)EURECOM KFD人臉數(shù)據(jù)庫(kù)上測(cè)試;文獻(xiàn)[24]的曲率降維法是以人臉深度圖像的曲率和紋理作為特征,利用PCA+LDA降維后,通過(guò)支持向量機(jī)(SVM)進(jìn)行分類識(shí)別,在SHREC數(shù)據(jù)庫(kù)上測(cè)試。
由于采用的數(shù)據(jù)庫(kù)并不完全相同,即使采用同樣的FRGCv2.0數(shù)據(jù)庫(kù)由于選擇不同圖像,其測(cè)試結(jié)果也不盡相同。通過(guò)對(duì)比,所采用的測(cè)試庫(kù)中的人數(shù)規(guī)模,面部表情,面部裝扮及背景的復(fù)雜度等方面均與這些文獻(xiàn)所采用的測(cè)試庫(kù)難度相當(dāng)。從表2中可以看出,文中的融合曲線特征與Gabor特征方法具有更高的識(shí)別率。這也從另一個(gè)側(cè)面說(shuō)明本算法的有效性。
表2 其他算法與本算法識(shí)別率的比較
為了驗(yàn)證Fuzzy ARTMAP分類算法的增量性和魯棒性,在三維人臉樣本庫(kù)中,分別按每次增加10人的方式分別進(jìn)行了10組識(shí)別測(cè)試,其結(jié)果如圖10所示。由圖10可以觀察得知:隨著人數(shù)的增加,提出的基于融合特征的Fuzzy ARTMAP分類算法的測(cè)試結(jié)果具有較好穩(wěn)定性。這是因?yàn)?,F(xiàn)uzzy ARTMAP分類算法能在不破壞原有訓(xùn)練集的情況下新增訓(xùn)練集,實(shí)現(xiàn)增量學(xué)習(xí)。因此,利用Fuzzy ARTMAP智能分類算法,有望在更多大型公共環(huán)境下對(duì)新增加的人臉樣本有更快的適應(yīng)性和準(zhǔn)確性。
圖10 單特征與融合特征在不同訓(xùn)練人數(shù)下的識(shí)別率
4結(jié)語(yǔ)
提出了一種Gabor小波濾波和人臉三維深度圖像曲線特征相融合的方法,運(yùn)用有監(jiān)督增量學(xué)習(xí)能力的模糊自適應(yīng)神經(jīng)網(wǎng)絡(luò)(Fuzzy ARTMAP)進(jìn)行人臉深度圖像的分類和識(shí)別。本算法的優(yōu)勢(shì)在于不僅能保證較高的識(shí)別率(大約97.5%),而且能在不破壞原有訓(xùn)練集的情況下新增訓(xùn)練集,實(shí)現(xiàn)增量學(xué)習(xí)。仿真實(shí)驗(yàn)表明:該算法具有較高的識(shí)別率,所提取的特征對(duì)人臉表情變化具有一定的魯棒性,且隨著新增人臉數(shù)量的增長(zhǎng),可以提高準(zhǔn)確率。
[1] 王躍明, 潘綱, 吳朝暉. 三維人臉識(shí)別研究綜述[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2008, 20(7): 819-829.
[2] Fadaifard H, Wolberg G, Haralick R M. Multiscale 3D feature extraction and matching with an application to 3D face recognition[J]. Graphical Models, 2013, 75(4): 157-176.
[3] Hiremath P S, Hiremath M. Depth and Intensity Gabor Features Based 3D Face Recognition Using Symbolic LDA and AdaBoost[J]. Image, Graphics and Signal Processing, 2014,(1): 32-39.
[4] Liu D H, Lam K M, Shen L S. Optimal sampling of Gabor features for face recognition[J]. Pattern Recognition Letters, 2004, 25(2): 267-276.
[5] Ter Haar F B, Veltkamp R C. SHREC'08 entry: 3D face recognition using facial contour curves[C]//Shape Modeling and Applications, 2008. SMI 2008. IEEE International Conference on. IEEE, 2008: 259-260.
[6] 鄒紅艷,達(dá)飛鵬.基于輪廓線局部描述符的三維人臉識(shí)別[J]. 計(jì)算機(jī)應(yīng)用研究, 2013, 30(5): 1561-1563.
[7] 劉曉寧,董衛(wèi)軍,周明全,等. 基于輪廓線的三維人臉識(shí)別的改進(jìn)算法[J]. 計(jì)算機(jī)工程, 2008, 33(11): 46-48.
[8] 莫建文, 李雁, 首照宇, 等. 改進(jìn)的三維人臉識(shí)別方法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2012, 33(11): 4328-4332.
[9] 惠斌,唐旭晟,羅海波,等. 基于gabor小波sdf匹配濾波器的人臉識(shí)別[J]. 信息與控制, 2008, 37(5):633-636.
[10] 孔華鋒, 魯宏偉, 馮悅. 基于二維 Gabor 小波特征的三維人臉識(shí)別算法[J]. 計(jì)算機(jī)工程, 2008, 34(17): 200-201.
[11] Lee K, Chung Y, Byun H. SVM-based face verification with feature set of small size[J]. Electronics Letters, 2002, 38(15): 787-789.
[12] Othman H, Aboulnasr T. A separable low complexity 2D HMM with application to face recognition[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2003, 25(10): 1229-1238.
[13] Nazeer S A, Omar N, Khalid M. Face recognition system using artificial neural networks approach[C]//Signal Processing, Communications and Networking,2007.ICSCN'07. International Conference on. IEEE, 2007: 420-425.
[14] Gu M, Zhou J Z, Li J Z. Online face recognition algorithm based on fuzzy ART[C]//Machine Learning and Cybernetics, 2008 International Conference on. IEEE, 2008,(1): 556-560.
[15] Carpenter G A, Grossberg S, Reynolds J H. ARTMAP: Supervised real-time learning and classification of nonstationary data by a self-organizing neural network[J]. Neural networks, 1991, 4(5): 565-588.
[16] Carpenter G A, Grossberg S, Markuzon N, et al. Fuzzy ARTMAP: A neural network architecture for incremental supervised learning of analog multidimensional maps[J]. Neural Networks, IEEE Transactions on, 1992, 3(5): 698-713.
[17] 鐘金宏, 楊善林. FUZZY ARTMAP 神經(jīng)網(wǎng)絡(luò)綜述[J]. 計(jì)算機(jī)科學(xué), 2001, 28(5): 89-92.
[18] Phillips P J, Flynn P J, Scruggs T, et al. Overview of the face recognition grand challenge[C]//Computer vision and pattern recognition, 2005. CVPR 2005. IEEE computer society conference on. IEEE, 2005,(1): 947-954.
[19] 唐旭晟, 歐宗瑛, 蘇鐵明, 等. 復(fù)雜背景下人眼的快速定位[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2006, 18(10): 1535-1540.
[20] 莫建文, 李雁, 首照宇, 等. 改進(jìn)的三維人臉識(shí)別方法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2012, 33(11): 4328-4332.
[21] Cheraghian A, Hajati F, Mian A S, et al. 3D FACE RECOGNITION USING TOPOGRAPHIC HIGH-ORDER DERIVATIVES[C]. Proc. of the The International Conference on Image Processing (ICIP), Sydney, 2013.
[22] ??_(dá)飛鵬,蔡亮,基于測(cè)地距離的三維人臉識(shí)別[C]. 重慶:2010年全國(guó)模式識(shí)別學(xué)術(shù)會(huì)議(CCPR2010), 2010.
[23] 陶麗君, 張希婧. 基于改進(jìn) LBP 算子和稀疏表示的三維人臉識(shí)別研究[J]. 現(xiàn)代計(jì)算機(jī) (普及版), 2013,(5): 23-26.
[24] Tonchev K, Manolova A, Paliy I. Comparative analysis of 3D face recognition algorithms using range image and curvature-based representations[C]// Intelligent Data Acquisition and Advanced Computing Systems (IDAACS), 2013 IEEE 7th International Conference on. IEEE, 2013,(1): 394-398.
收稿日期:2014-01-14
中圖分類號(hào):TP391.4;TP183
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1671-5276(2015)04-0126-06
作者簡(jiǎn)介:王斯藤(1988-),男,福建寧德人,碩士研究生,研究方向?yàn)閳D像處理。
基金項(xiàng)目:福建省自然科學(xué)基金資助(2013J01226)