劉傳領
(商丘師范學院計算機與信息技術學院,河南商丘476000)
人臉識別的關鍵是在特征提取階段提取特征點,并且特征點要具有可分類特性。人臉特征可分為兩類,即直觀特征和代數(shù)特征,截至目前,學者們已經(jīng)提出了很多的人臉特征提取算法,這些大致可分為兩類:經(jīng)典線性算法和基于流行學習的算法。PCA、LDA、ICA、MMC等方法被稱為經(jīng)典線性算法,拉普拉斯特征映射、局部保持性的投影方法、等容映射方法、局部線性嵌入方法和邊界分析法等被稱為基于流行學習的算法。二維圖像是人臉識別中表達人臉最常采用的圖像,原始特征和基于原始特征的變換特征是組成人臉圖像特征的兩個主要組成部分,基于原始特征的變換特征是采用某種變換核在原始圖像基礎上進行變換得到的,是一種全新的描述,是在一個空間針對原始圖像進行的。目前我們經(jīng)常用到的變換特征有基于頻率的特征、K-L變換特征、直方圖特征等。基于頻率的特征可細分為傅立葉變換特征、小波特征,小波特征也可以分成很多種類,如Harr特征、Gabor特征等。
任意?f∈L2(IR)的傅里葉變換為(w)=,由公式可以看出傅里葉變換可以很好地提取信號f(t)的整體頻率信息。但觀測信號在局部特性的情況下效果很差。[1]
1946年Dennis Gabor提出傅里葉變換,采取時間局部化的最優(yōu)窗——Gaussian函數(shù)。
其一維小波變換如下:
其中g(t)為高斯函數(shù)。因此對于?a>0,?f∈L2(IR)的小波變換如下:
其中g*(t-b)表示函數(shù)g(t-b)的共軛。因此可以看出Gabor滿足Parseval恒等式。
Daugman將Gabor擴展成二維形式
式中,Gabor小波核的方向和尺度分別是用u,v進行表示的,圖像中的像素點是用z=(x,y)進行表示的,相應值的歐氏范數(shù)是用 ·進行表示的。高斯窗口的寬度大小是用ku,v進行控制的,用式(6)來定義震蕩部分的方向及波長大小
式中,濾波器的采樣頻率用kv=kmaxfv表示。最大采樣頻率用kmax表示,間隔因子用f進行表示,作用為限制頻率中和函數(shù)。濾波器的方向選擇性用φu=πu8進行表示。高斯窗口的寬度大小與波長大小之比是由參數(shù)σ決定的,它與濾波器的帶寬的關系用式(7)進行表示:
其中,包含倍頻程的半峰帶寬用φ進行表示。他們之間的關系如下:φ=0.5倍頻,σ≈2π;φ=1倍頻程,σ≈π;φ=1.5 倍頻,σ≈2.5。
從式(5)可以看出中Gabor小波核函數(shù)具有自相似的特點。通過調(diào)節(jié)u及v,即改變方向參數(shù)尺度參數(shù),這樣它們就可以由母函數(shù)統(tǒng)一生成,對濾波器進行適當?shù)某叨茸儞Q及旋轉(zhuǎn)。震蕩部分是Gabor核的重要組成部分,補償直流分量是由第二部分完成的。參數(shù)σ的主要作用是決定高斯窗口寬度大小與波長大小之比的,直流分量在σ的值較大時,是可以忽略的。
通過Gabor函數(shù)與圖像I的卷積可以求出圖像I(x,y)的Gabor濾波z0(x0,y0),如果是圖像中一個像素點,點z0附近區(qū)域的圖像特征可以通過Gabor小波變換的卷積進行描述,其卷積計算過程用公式表示為:
其中,卷積用* 進行表示,點z0處的卷積值大小是用Ou,v(z0)進行表示的。為了獲得圖像特征,特別是在多方向、多尺度的局部顯著性特征,我們通常用一組Gabor核函數(shù)表示,它們各自具有不同的u及v(u=0,…,U-1,v=0,…,V-1),即方向參數(shù)和尺度參數(shù)。所以,集合S={Ou,v(z):u∈ {0,…,U-1}v∈{0,…,V-1}}形成了圖像I的Gabor小波特征表示。
對于Gabor的參數(shù)的選擇依然是一個開放性的問題。通常情況下,我們?nèi)=5(v=0,1,…,4),U
Gabor特征的維數(shù)過大增加了計算量和運算時間,為了減少Gabor特征的維數(shù),Liu和 Wechsler提出下采樣的技術理論,這種理論的核心思想是表示區(qū)域特征時,可以通過在小的局部區(qū)域計算 Gabor小波幅值的均值的方法。如果把計算得到的下采樣的特征按順序級聯(lián)起來,這樣就形成了人臉的特征向量集合,然后將特征向量通過投影映射到更低維的子空間,這個過程可以通過對線性判別分析法進行改進來計算。
由上論述可知一幅128*128的人臉圖像經(jīng)過Gabor變換之后變?yōu)?28*128*40,數(shù)據(jù)量顯著增大。針對該問題有的學者提出通過下采樣來把數(shù)據(jù)量降下來,即對于一個樣值序列間隔幾個樣值取樣一次,這樣得到新序列就是原序列。[2]假設每一對(u,v)取64個數(shù)據(jù)點,每幅圖像共產(chǎn)生64*40=2560個數(shù)據(jù)點。因此,數(shù)據(jù)量過大不利于直接進行識別,需要對圖像降維。降維的算法較多,本文針對FLDA(Fisher Linear Discriminant Analysis)進行。
設X=(x1,x2,L,xN)為樣本數(shù)據(jù)集,其中xi∈RD,i=1,2,L,N。cj∈ {1,2,L,Nc}為樣本xi的類別標簽,式中樣本數(shù)據(jù)集類別數(shù)為Nc,ni為第i類的樣本的總數(shù)。P為LDA尋求最優(yōu)的映射變換矩陣,將iD空間的數(shù)據(jù)通過映射投影到一個相對低維的特征空間id(d<<D)中。映射函數(shù)[3]可表示為:
i類樣本均值計算如下:
總體樣本均值:
LDA的目標函數(shù)如下:
式(14)對p求微分可得:
即:
由于和是半正定并且對稱的,當滿秩時,式(16)的特征值和特征向量的值可通過()-1進行計算。
利用LDA計算投影矩陣的步驟如下:
(1)利用Gabor提取每幅人臉圖像的特征形成x;
(2)x是輸入的訓練樣本,利用式(13)和(14)計算分別得到和,其中是類間離散度矩陣是類內(nèi)離散度矩陣;
(3)式(18)可用來計算特征值與特征值對應的特征向量;
(4)可以計算得到最大的d個特征值,用其對應的特征向量組成投影矩陣P。
本文以代數(shù)特征為研究重點,這些特征是圖像中具有最大分類特征、可分類特性非常好的像素點,這個環(huán)節(jié)是其中非常重要的一個環(huán)節(jié),也是人臉識別準確率的一個關鍵。人臉圖像包含非常多的冗余特征和信息,是高度冗余的圖像,去掉冗余特征后對最終的識別效果基本沒有影響。
[1]Mallat S.信號處理的小波導引[M].2版.楊力華,等譯.北京:機械工業(yè)出版社,2002.
[2]張立,趙福才,張玉.基于小波包分解的圖像特征提取及應用[J].艦船電子對抗,2007,30(4):92 -85.
[3]成禮智,王紅霞,羅永.小波的理論與應用[M].北京:科學出版社,2004.