羅 敏 ,劉 嵩 ,劉利平 ,李時東,張國平
(1.華中師范大學(xué) 物理科學(xué)與技術(shù)學(xué)院,武漢 430079;2.湖北民族學(xué)院 理學(xué)院,湖北 恩施 445000;3.湖北民族學(xué)院 信息工程學(xué)院,湖北 恩施 445000)
人臉識別是模式識別和計(jì)算機(jī)視覺領(lǐng)域的熱點(diǎn),有著重大的理論研究價值和廣泛的實(shí)踐應(yīng)用前景.目前受人臉姿態(tài)、光照等不利因素的影響,人臉識別性能還尚待提高,而Gabor特征對光照、表情和姿態(tài)造成的局部變化具有良好的魯棒性,引起了研究人員的關(guān)注,并取得了一定的成果[1-2].Lades和Vorbruggen等人作出了開創(chuàng)性的工作,首次將Gabor小波變換用于人臉識別[3].
Wiskott等人利用人臉的基準(zhǔn)特征點(diǎn)構(gòu)造拓?fù)鋱D,提出了彈性約束圖匹配算法[4].Liu 和Wechsler利用Fisher線性判別模型對Gabor特征進(jìn)行進(jìn)一步的提取和分類[5].
Gabor小波應(yīng)用于人臉識別優(yōu)點(diǎn)在于:
1)Gabor小波準(zhǔn)確逼近簡單細(xì)胞的感受野,在很大程度上反應(yīng)了人臉的不變信息;2)Gabor小波是唯一能夠達(dá)到時域測不準(zhǔn)下界的函數(shù),它能夠最好地兼顧信號在時域和頻域中的分辨能力,可以捕獲人臉圖像在不同頻率和不同方向下的局部特征,很好表達(dá)了人臉特征[6].而Gabor小波提取特征在本質(zhì)上是通過一系列多尺度、多方向的濾波器組,分別和人臉圖像作卷積.例如對于一張大小為112×92 的人臉圖像,使用Gabor 小波提取特征,當(dāng)使用的尺度和方向個數(shù)分別為5和8時,Gabor小波得到的特征就是通過40個濾波器與圖像卷積得到,特征維數(shù)為112×92×5×8=412160.可以看出,Gabor小波獲取的特征維數(shù)都很高,并且一定存在大量不利于分類識別的冗余信息,相應(yīng)的也增加了算法的時間復(fù)雜度和空間復(fù)雜度.因此改善Gabor小波變換算法的性能是亟待解決的問題.
代數(shù)特征體現(xiàn)了圖像的本質(zhì)屬性,奇異值分解(Singular Value Decomposition∶SVD)為提取圖像代數(shù)特征提供了新的方法.研究表明SVD 用于人臉識別不僅可以降低識別的存儲開銷,還可以通過快速算法減少識別時間開銷[7-8].Hong還證明了SVD 具有旋轉(zhuǎn)不變性、平移不變性、鏡像不變性和穩(wěn)定性[9].受以上啟發(fā),提出了一種改進(jìn)的基于Gabor小波的人臉識別算法,該算法將SVD 融合于Gabor的方法中,實(shí)驗(yàn)證明了該算法的有效性.
二維Gabor小波是經(jīng)高斯函數(shù)調(diào)制的正弦柵格,在頻域上表現(xiàn)為一種帶通濾波器,且主頻和方向可調(diào).二維Gabor小波的定義為[10][11]:
人臉圖像的Gabor小波變換就是人臉圖像矩陣與Gabor小波的卷積:
定理1 奇異值分解[13]設(shè)Αm×n是實(shí)矩陣(不失一般性,設(shè)m≥n),且rank()?。絢,則存在兩個正交矩陣Um×m和Vn×n及對角陣Dm×n使下式成立:
設(shè)A表示一圖像矩陣,根據(jù)定理1,A可按下式分解
圖1 圖像重構(gòu)Fig.1 The reconstructed image
本文提出的改進(jìn)的Gabor小波算法流程圖如圖2所示,具體描述如下.
圖2 算法流程圖Fig.2 Flow diagram of arithmetic
1)對訓(xùn)練圖像和測試圖像進(jìn)行預(yù)處理.預(yù)處理可以改善圖像質(zhì)量,消除不利于分類的因素.本文算法的預(yù)處理過程包括圖像平滑和灰度歸一化.圖像平滑采用鄰域平均法實(shí)現(xiàn),也即用像素鄰域內(nèi)各像素的灰度平均值代替該像素原來的灰度值.灰度歸一化通過灰度變換將圖像的灰度分布的均值和均方差統(tǒng)一調(diào)整到預(yù)定的數(shù)值,采用的灰度變換如下:
其中,I0(x,y),μ0,σ0分別為變換后的灰度值、均方差、均值,I(x,y),μ,σ分別為變換前的灰度值、均方差、均值.
3)SVD 提取特征.首先將測試集的Gabor特征圖像按公式(3)進(jìn)行奇異值分解,獲取測試樣本的奇異值特征和基空間.然后將訓(xùn)練集的Gabor特征圖像投影到基空間,獲取在同一基空間的奇異值.最后將提取的兩個樣本集的奇異值特征按尺度和方向由小到大的順序排列成列向量構(gòu)成融合特征.
4)分類識別.采用最近鄰分類器對提取的特征進(jìn)行分類,特征間的距離度量采用歐氏距離,距離最近者判決為同一類.
為了驗(yàn)證本文方法的有效性,在ORL人臉數(shù)據(jù)庫上進(jìn)行了相關(guān)實(shí)驗(yàn).ORL數(shù)據(jù)庫的每幅圖像大小為92×112,由40個人,每人10幅、共400幅.這些人臉圖像分別是在不同光照、不同姿態(tài)和不同表情條件下攝制而得,是目前使用最廣泛的標(biāo)準(zhǔn)圖像.實(shí)驗(yàn)的平臺環(huán)境:MATLAB 7.6,處理器E2210,內(nèi)存3G.為了提高識別結(jié)果的精確性,每一個實(shí)驗(yàn)都重復(fù)20次,最后取20次實(shí)驗(yàn)結(jié)果的平均.
實(shí)驗(yàn)中首先比較了Gabor小波方法和本文改進(jìn)的Gabor小波方法的性能.在實(shí)驗(yàn)中隨機(jī)抽取ORL庫中的每人5 幅圖像作為訓(xùn)練樣本,余下5幅圖像作為測試樣本,這樣訓(xùn)練樣本集和測試樣本集總數(shù)均為200,奇異值分解的基空間維數(shù)為5.圖3給出了不同的尺度和方向條件下兩種方法的識別率對比.從圖3可以看出,本文方法的識別率明顯高于單一的Gabor方法,說明本文方法能夠提取更有鑒別力的特征.
圖3 不同的尺度和方向條件下兩種方法的識別率Fig.3 Comparison in terms of recognition rate
圖4給出了不同的尺度和方向條件下兩種方法的訓(xùn)練時間和識別時間對比.從圖4可以看出,增加Gabor變換尺度、方向的數(shù)量可以提高人臉識別率,但數(shù)量的增加也導(dǎo)致了算法時間開銷和存儲開銷的增加.從算法實(shí)用性的角度考慮,算法復(fù)雜度是考量一個算法好壞與否的重要標(biāo)準(zhǔn).本文方法相當(dāng)于采用了奇異值分解對鑒別特征進(jìn)行壓縮,因此節(jié)約了大量內(nèi)存單元,空間復(fù)雜度改善很明顯.人臉識別時間包括訓(xùn)練時間和測試時間,而在實(shí)際應(yīng)用中,訓(xùn)練一般采用離線訓(xùn)練的方法,訓(xùn)練時間對算法的實(shí)時性并無影響,因而算法的時間復(fù)雜度主要取決于分類時間.由于本文方法在訓(xùn)練階段增加了奇異值分解的過程,所以與傳統(tǒng)方法比訓(xùn)練時間都增加了.但是在測試階段,由于本文方法采用SVD 的方法對特征圖像降維,減小了算法的分類時間,改善了算法的時間復(fù)雜度,特別是在尺度和方向較多的條件下,這種改善更為明顯.結(jié)合實(shí)驗(yàn)情況,綜合考慮選擇5個尺度8 個方向共40個小波參入特征提取,能夠使本文算法的綜合性能達(dá)到最優(yōu),此時識別率可以達(dá)到92%,而分類時間為18.5s,縮短了5.5s.
圖4 不同的尺度和方向條件下兩種方法的訓(xùn)練時間和識別時間對比Fig.4 Comparison in terms of recognition time
實(shí)驗(yàn)中還研究了樣本數(shù)目和基空間維數(shù)對本文算法的影響.Gabor小波的尺度和方向按前述最優(yōu)值分別為5、8.首先設(shè)置基空間維數(shù)為5,測試樣本數(shù)目對算識別率的影響,實(shí)驗(yàn)結(jié)果如表1所示.然后交換前述實(shí)驗(yàn)的訓(xùn)練集和測試集,改變基空間維數(shù),測試算法性能,實(shí)驗(yàn)結(jié)果如表2所示.
表1 樣本數(shù)目對識別率的影響Tab.1 Influence of samples number in terms of recognition rate
表2 基空間維數(shù)對算法的影響Tab.2 Influence of base-space dimensions in terms of recognition performance
從表1可以看出,樣本數(shù)目越多,算法的識別率越高,與理論結(jié)果完全一致.從表2可以看出,隨著基空間維數(shù)增加,算法的識別率也是增加的,當(dāng)增加到一定程度后,人臉識別率趨于穩(wěn)定,說明已經(jīng)提取了絕大部分鑒別特征了,舍棄的部分作用不是特別大.但是基空間維數(shù)增加,特征維數(shù)和識別時間迅速增加,考慮綜合性能,基空間的維數(shù)選擇5比較合適.
本文提出了一種改進(jìn)的Gabor小波變換的人臉識別方法,該方法充分利用了Gabor 小波和SVD 各自的優(yōu)勢,實(shí)驗(yàn)結(jié)果證明本文方法改善了Gabor小波變換方法的性能.然而Gabor小波變換用于人臉識別的實(shí)時性還沒有根本解決,這將是進(jìn)一步研究的重點(diǎn).
[1]張文超,張洪明.基于局部Gabor變化直方圖序列的人臉描述與識別[J].軟件學(xué)報(bào),2006,17(12):2508-2517.
[2]Zhao San-qiang,Gao Yong-sheng,Zhang Bao-chang.Gabor feature constrained statistical model for efficient and mark localization and face recognition[J].Pattern Recognition Letters,2009,30(10):922-930.
[3]Lades M,Vorbruggent J C,et al.Distortion invariant object recognition in the dynamic Link architecture[J].IEEE Trans On Computers,1993,42(3):300-311.
[4]Wiskott L,F(xiàn)ellous J M,Krugen N,et al.Face recognition by elastic bunch graph matching[J].IEEE Trans on PAMI,1997,19(7):775-779
[5]Liu C,Wechsler H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition[J].IEEE Transactions on Image Processing,2002,11(4):467-476.
[6]陳 洋,王潤生.結(jié)合Gabor濾波器和ICA 技術(shù)的紋理分類方法[J].電子學(xué)報(bào),2007,35(2):299-302.
[7]王宏勇,廖海斌,段新華.基于奇異值與特征融合矩陣的自適應(yīng)人臉識別[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(7):162-174.
[8]張新征.基于多小波子帶加權(quán)判別熵的SAR 目標(biāo)ICA 特征提取及識別[J].計(jì)算機(jī)應(yīng)用,2011,31(9):2468-2471.
[9]Hong Z Q.Algebraic feature extraction of image for recognition[J].Pattern Recognition,1991,24(3):211-219.
[10]頊改燕,徐 華,翟忠武.基于Gabor濾波器和BP神經(jīng)網(wǎng)絡(luò)的人臉皮膚皺紋區(qū)域自動識別[J].計(jì)算機(jī)應(yīng)用,2010,30(2):430-432.
[11]時書劍,馬 燕.基于Gabor濾波和KPCA 的人臉識別方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(4):51-57.
[12]鮑麗山,何光輝.Gabor變換仿生人臉識別[J].計(jì)算機(jī)應(yīng)用,2010,30(1):166-168.
[13]高全學(xué),梁 彥,潘 泉.SVD 用于人臉識別存在的問題及解決方法[J].中國圖象圖形學(xué)報(bào),2006,12(11):1785-1791.