薛曉利,胡 蓉,朱金陵
(1.西南交通大學(xué) 電氣工程學(xué)院,成都 610031;2.成都電子機(jī)械高等??茖W(xué)校 通信工程系,成都 610071)
人臉識(shí)別是生物特征鑒別技術(shù)的主要方向之一,它涉及圖像處理、模式識(shí)別、計(jì)算機(jī)視覺等各個(gè)領(lǐng)域。相對(duì)其他諸如指紋識(shí)別、虹膜識(shí)別等人體生物識(shí)別技術(shù)而言,人臉識(shí)別具有直接、容易接受、侵犯性小,較少或不需要用戶主動(dòng)配合等特點(diǎn),因此,人臉識(shí)別技術(shù)已經(jīng)成為近年來最熱門的研究領(lǐng)域。然而,由于受到光照、姿態(tài)、表情等因素的影響,人臉識(shí)別技術(shù)遠(yuǎn)沒有達(dá)到實(shí)際應(yīng)用的水平。其中,預(yù)處理、特征提取、分類器設(shè)計(jì)3個(gè)環(huán)節(jié)顯得尤為重要。本文將從特征提取的角度出發(fā),提出一種基于Sobel邊緣增強(qiáng)的Gabor小波變換算法,并將其成功應(yīng)用在人臉識(shí)別中。
Sobel算子是一種一階差分離散算子,主要用于邊緣檢測(cè)和邊緣增強(qiáng)。在圖像上的任意像素點(diǎn)運(yùn)算該算子,就可以得到對(duì)應(yīng)的梯度矢量或其法向量。Sobel算子主要包含2組的矩陣,分別為橫向和縱向,將其與圖像做卷積就得到橫向和縱向的亮度差分近似值。如果以I(x)來代表原始圖像,Gx(x)和Gy(x)分別代表橫向和縱向邊緣檢測(cè)的梯度圖像,則:
圖1 原圖及其梯形圖
Gabor特征通常采用一系列Gabor濾波器組來提取,一般選用5×8,4×8和3×8等[4,11]。研究人員比較了Gabor特征和幾何特征的識(shí)別性能,發(fā)現(xiàn)Gabor特征具有更好的識(shí)別性能。正因?yàn)槿绱?,近年來,Gabor變換作為一種有效的工具被廣泛應(yīng)用于圖像處理、模式識(shí)別等相關(guān)領(lǐng)域。一般來說,用2D的Gabor核函數(shù)進(jìn)行特征提取,其定義為:
本文中,vmax=5,μmax=8,σ =2π。這里,σ決定了高斯窗口的寬度與波長(zhǎng)之間的比率。因此,給定一幅圖像I(z),其Gabor變換Gj(z)定義為該圖像與上述Gabor核函數(shù)之間的卷積:Gj(z)=I(z)* Ψj(z),這里 z=(x,y)表示圖像的坐標(biāo)位置。Gj(z)表示以v為頻率、以μ為方向的卷積結(jié)果,該卷積結(jié)果是一個(gè)復(fù)數(shù),可以表示為:Gj(z)=Aj(z)·exp(iθj(z))。其中,Aj(z)表示幅度,θj(z)表示相位。采用上面定義的40個(gè)Gabor核函數(shù)對(duì)該圖像進(jìn)行卷積來得到Gabor實(shí)部和虛部特征,如圖2所示。
圖2 40個(gè)Gabor特征
在人臉識(shí)別中,預(yù)處理是個(gè)非常重要的過程。本文的預(yù)處理主要是根據(jù)雙眼坐標(biāo)位置進(jìn)行人臉圖片的旋轉(zhuǎn)、裁剪、矯正,其過程包含以下4個(gè)步驟:
1)手工定位雙眼瞳孔位置坐標(biāo)。
2)根據(jù)左右眼的位置坐標(biāo),旋轉(zhuǎn)圖片,使得雙眼處于水平位置,從而保證人臉方向的一致性。
3)根據(jù)雙眼位置坐標(biāo),確定人臉面部區(qū)域。
4)將人臉圖像縮放到同一個(gè)尺度大小。本文中將其縮放到70×70大小。
這里,采用Caltech、ORL、Yale、Bioid人臉庫來進(jìn)行測(cè)試。預(yù)處理結(jié)果如圖3所示。
圖3 原圖與預(yù)處理結(jié)果的比較
表1 2種算法的人臉識(shí)別結(jié)果比較
本文將Sobel-Gabor算法分別在Caltech人臉庫、ORL人臉庫、Yale人臉庫、Bioid人臉庫上進(jìn)行測(cè)試。詳細(xì)測(cè)試步驟如下:
1)根據(jù)手工標(biāo)定的雙眼瞳孔位置坐標(biāo),進(jìn)行人臉裁剪、旋轉(zhuǎn)、對(duì)齊、縮放操作。
2)將人臉圖像同Sobel算子做卷積,得到對(duì)應(yīng)的梯度圖;
3)在人臉梯度圖上,進(jìn)行Gabor小波變換,從而得到表征人臉的特征矢量V(x);
4)對(duì)任意兩個(gè)人臉圖片I1(x)和I2(x),分別計(jì)算其特征矢量V1(x)和V2(x);
5)用卡方距離χ2來計(jì)算兩個(gè)矢量之間的不相似度,即:
將本文提出的Sobel-Gabor算法結(jié)果同基于Gabor算法的人臉識(shí)別結(jié)果進(jìn)行對(duì)比,其測(cè)試結(jié)果如表1所示。結(jié)果表明:同基于Gabor小波變化的人臉識(shí)別算法相比,本文提出的Sobel-Gabor算法能顯著提高識(shí)別率,說明了該算法的有效性。
[1]萬峰,杜明輝.人臉識(shí)別中一種新的Gabor特征提取方法[J].華南理工大學(xué)學(xué)報(bào),2004,32(8):5-8,17.
[2]LEE T S.Image representation using 2D Gabor wavelets[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,1996,18(10):959.
[3]LIU C,WECHSLER H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition[J].IEEE Transaction on Image Processing,2002,11(4):467.
[4]DONATO G,BARTLETT M S,HAGER J C,et al.Classifying facial actions[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,1999,21(10):974.
[5]張文超,山世光,張洪明,等.基于局部Gabor變換直方圖序列的人臉描述與識(shí)別[J].軟件學(xué)報(bào),2006,17(12):2508-2517.
[6]朱振峰,盧漢清.基于奇Gabor濾波器與Rayleigh分布的邊緣檢測(cè)[J].中國圖象圖形學(xué)報(bào),2005,10(7):821-827.
[7]陳小光,封舉富.Gabor濾波器的快速實(shí)現(xiàn)[J].自動(dòng)化學(xué)報(bào),2007,33(5):456-461.
[8]程萬里,李偉生.基于Gabor-2DLDA方法的人臉識(shí)別研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(35):179-181.
[9]火元蓮,齊永峰.基于Gabor小波與共同向量的人臉識(shí)別方法[J].計(jì)算機(jī)應(yīng)用,2009,29(9):2970-2973.
[10]LIU C,WECHSLER H.Independent component analysis of Gabor features for face recognition[J].IEEE transaction on Neural Networks,2003,14(4):919.