伊力哈木·亞爾買買提
(新疆大學(xué) 電氣工程學(xué)院,新疆 烏魯木齊 830047)
新疆位于中國的西北部地區(qū),具有獨(dú)特的地理位置,少數(shù)民族眾多,其中維吾爾族屬于新疆最大的少數(shù)民族,具有獨(dú)特的面部特征,并且與中亞國家的人臉有著高度的相似面部特征,人臉識(shí)別技術(shù)的研究對于發(fā)展當(dāng)?shù)氐男畔⑻幚砟芰τ兄艽蟮膸椭?,而且其結(jié)果會(huì)影響到中亞乃至西亞地區(qū),具有很大的意義。人臉識(shí)別由于其自然性具有不被個(gè)體察覺的特點(diǎn),一直以來是模式識(shí)別和機(jī)器視覺領(lǐng)域的研究熱點(diǎn),但人臉容易受到光照、噪聲、表情和遮擋等的影響,如何有效獲取人臉特征信息一直是人臉識(shí)別研究重點(diǎn)[1]。
當(dāng)前研究表明,對人臉圖像的辨識(shí)率影響比較大的因素主要是非均勻光照和局部遮擋,尤其是在新疆南部地區(qū),南疆少數(shù)民族地區(qū)光照強(qiáng)烈并具有面部遮擋的習(xí)慣,比如胡須、面紗、帽子、眼鏡等自然遮擋物。研究者們?yōu)榱伺懦诜蔷鶆蚬庹兆兓途植空趽跸碌娜四樧R(shí)別問題,提出了其基本方法,即基于局部二值模式(LBP)[2-3]、POEM的人臉識(shí)別方法[4]、DCT和2D-PCA相結(jié)合的改進(jìn)算法[5]、加權(quán)分塊(2D)2PCA方法[6]、Gabor人臉特征提取[7]等識(shí)別方法。
以上這些方法雖然具有一定的辨識(shí)能力,但是也有不完善之處?;贚BP算法的人臉識(shí)別會(huì)導(dǎo)致其所獲得的LBP直方圖二維向量維數(shù)過大,計(jì)算量也多。單一的POEM融合了其方向和幅值特性,得到了很好的辨識(shí)性。但是卻忽視了塊與塊之間的二維像素問題,導(dǎo)致其辨識(shí)能力下降。DCT和2DPCA相融合的改進(jìn)算法雖然能夠很好地儲(chǔ)存非均勻光照、局部遮擋等非敏感信息并將識(shí)別時(shí)間大大縮短,但在特征提取方面的計(jì)算量較大;雖然應(yīng)用(2D)2PCA和圖像分塊想法得到比較完善的人臉特征信息,但其辨識(shí)效果不理想;Gabor人臉特征提取由于其多尺度方向的維數(shù)特征過高,導(dǎo)致計(jì)算過程比較復(fù)雜,因此很難實(shí)現(xiàn)實(shí)時(shí)性和有效性需求在實(shí)際中的應(yīng)用中[8]。
同時(shí)也有不同學(xué)者提出了不同方法,殷俊等[9]提出基于最近正交矩陣的二維鑒別投影及人臉識(shí)別應(yīng)用;Deng等[10]提出對光照變化具有較強(qiáng)適應(yīng)性的PCA(principal component analysis)特征臉,用于人臉特征表示; Y. Chen等[11]提出基于人臉識(shí)別的稀疏嵌入式詞典學(xué)習(xí);何林巍等[12]提出基于POEM_SLPP的人臉識(shí)別算法;Z. Chen等[13]提出了一種基于不相關(guān)判別稀疏保留投影的人臉識(shí)別方法;J.Lu等[14]提出基于圖像集人臉識(shí)別的并行特征與字典學(xué)習(xí);S.Guo等[15]提出基于卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的人臉識(shí)別。
鑒于以上工作,本文提出了二維離散余弦變換(2DDCT)與方向邊緣幅值模式(POEM)相融合的維吾爾族人臉識(shí)別算法,將二維離散余弦變換與方向邊緣幅值模式相互充分結(jié)合,在得到人臉梯度圖像的幅值和方向信息時(shí)考慮了非均勻光照與局部遮擋對維吾爾族人臉圖像整體像素的影響,使獲得的梯度信息更能反映維吾爾族人臉圖像的本質(zhì)特征,從而有效克服了光照和局部遮擋對人臉識(shí)別的影響,提取出的特征占用空間小,提高了識(shí)別率,通過特征融合方法,增加了特征豐富度,解決了利用單一類型特征識(shí)別率不高的問題。
假定一幅二維人臉圖像 I,其人臉梯度有效信息為
式中: I (x,y)代表了人臉圖像中隨意一點(diǎn)的灰度值。人臉圖像的梯度幅值和梯度方向可以分別表示為
POEM提取人臉特征的步驟如下:
1) 給定一幅二維人臉圖像,計(jì)算其梯度圖,即得到每個(gè)像素點(diǎn)的梯度圖和方向圖。二維人臉圖像像素點(diǎn)的梯度方向?yàn)?/p>
2) 將以像素點(diǎn) q為中心的 w ×w的圖像塊記為Cell,并以Cell塊為基本單位,構(gòu)建其局部時(shí)段直方圖,此直方圖表示該時(shí)段的中心二維像素點(diǎn) q的固有紋理特征[16]。
3) 對每個(gè)階段的中心二維像素點(diǎn)構(gòu)建最后的POEM直方圖,以中心二維像素點(diǎn)為核心的Cell塊與別的二維像素點(diǎn)的Cell塊來估算。
4)對每一個(gè)梯度方向,編碼過程是以中心二維像素點(diǎn)塊為核心,與圓周內(nèi)的其余二維像素點(diǎn)塊進(jìn)行如下計(jì)算。
在一個(gè)直徑為 R的圓形范圍,取 n個(gè)像素點(diǎn)CELL塊執(zhí)行編碼:
式中:Iq、 Ic分別為中心二維像素點(diǎn)及其鄰域像素點(diǎn),S(···)為 相似度函數(shù), f (x)為 其閾值為 p的二值函數(shù)。
然后將該固有特征點(diǎn) q的不同方向的POEM值級(jí)聯(lián),并獲取此特征點(diǎn)的固有紋理特征的級(jí)聯(lián)直方圖:
這樣就可以獲得每個(gè)二維像素點(diǎn)的POEM特征值。
一幅 M ×N 人 臉數(shù)字圖像 f (x,y),其二維離散余弦變換定義為
式中: Bp,q表 示DCT系數(shù)[17]; m =0,1,···,M ?1;n =0,1,···,N ?1; p=0,1,···,M ?1; q=0,1,···,N ?1[18]。
2DDCT是一種可逆的變換,它的逆變換為
離散余弦變換的特點(diǎn):當(dāng)二維頻率域改變因子p、 q較大時(shí),其DCT二維系數(shù)的值卻較?。欢S數(shù)值比較大的 Bp,q主要散布于p、q較小的坐標(biāo)部分,即有價(jià)值信息的集中區(qū)域[19]?;?DDCT二維系數(shù)重建人臉圖像其實(shí)就是積存少數(shù)離散余弦變換的非高頻部分,而剔除大部分中高頻部分,然后使用反變換即可構(gòu)建與原始人臉圖像類似的回復(fù)圖像。
經(jīng)過POEM與2DDCT融合算法后得到維吾爾族人臉紋理特征信息后,采用深度學(xué)習(xí)算法構(gòu)建人臉分類器。深度學(xué)習(xí)算法是基于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的一種全新算法,很好解決了其傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法的固有缺陷,即局部極小性在機(jī)器學(xué)習(xí)領(lǐng)域掀起了學(xué)習(xí)熱潮,并引起了廣泛關(guān)注[20]。
深度學(xué)習(xí)算法網(wǎng)絡(luò)本質(zhì)就是將幾個(gè)深度置信網(wǎng)絡(luò)疊加,每個(gè)深度置信網(wǎng)絡(luò)的可視層 (v )看作數(shù)據(jù)輸入層,隱藏層 (h )看作數(shù)據(jù)輸出層,進(jìn)而達(dá)到完成訓(xùn)練目的。
在訓(xùn)練的程序中,將可視向量二維值反映給隱元素單元,即可視元素單元由隱藏層元素單元重新構(gòu)建,把新的可視元素單元再次反映給隱藏層元素,就產(chǎn)生了新的隱藏層元素,繼而使用結(jié)合分布概率闡述輸入二維向量 x 和隱含二維向量 gi之間的關(guān)系為
式中: s i gm(t)=1/(1+e?t), bij是 第i層 第 j個(gè)單元元素的誤差值,Wi是 第i層的二維權(quán)矩陣。
預(yù)訓(xùn)練過程結(jié)束后,就要進(jìn)行微調(diào)解訓(xùn)練。依照其輸入信息和重構(gòu)信息損耗函數(shù)的關(guān)聯(lián)程度網(wǎng)絡(luò)二維參數(shù)進(jìn)行微調(diào)解,使損耗函數(shù)盡可能地減少到最小,損耗函數(shù)的公式為
式中:x 為訓(xùn)練數(shù)據(jù)信息可靠值, x′為DBN的融合函數(shù)值[21]。
維吾爾族人臉在光照以及部分遮擋下識(shí)別率會(huì)下降并且魯棒性會(huì)變差,因此提出了二維離散余弦變換(2DDCT)與方向邊緣幅值模式(POEM)相結(jié)合的維吾爾族人臉識(shí)別方法。具體識(shí)別步驟如下。
1) 將訓(xùn)練樣本維吾爾族人臉圖像規(guī)劃為 8 ×8子塊矩陣。
2) 對規(guī)劃的所有子塊的維吾爾族人臉圖像進(jìn)行2DDCT變換,將構(gòu)建到的2DDCT變換系數(shù)的左上角10個(gè)系數(shù)進(jìn)行存留,并進(jìn)行二維離散余弦逆變換得到重構(gòu)的維吾爾族人臉圖像。
3) 對所有的訓(xùn)練樣本維吾爾族人臉圖像進(jìn)行步驟1)、2)的處理后,將重構(gòu)的維吾爾族人臉圖像構(gòu)建成一個(gè)正方形塊,將正方形塊分割成A、B、C、D 4個(gè)區(qū)域,通過計(jì)算POEM特征的過程,得到相應(yīng)區(qū)域的維吾爾族人臉圖像的POEM直方圖。
4) 按照A到D的次序過程,將所有范圍內(nèi)的直方圖級(jí)聯(lián)在一起,作為該中心特征點(diǎn)的POEM固有紋理直方圖。
5) 在訓(xùn)練階段的人臉特征點(diǎn) q在 M 個(gè)訓(xùn)練集中的平均POEM直方圖通過式(10)計(jì)算得來:
由此, P OEML,w,n(q)就是訓(xùn)練過程中得到的該特征點(diǎn)的紋理信息。
6) 最后利用深度學(xué)習(xí)算法求得樣本所屬類別。
本文算法的具體流程如圖1所示。
圖1 2DDCT與POEM融合的維吾爾族人臉識(shí)別算法流程Fig. 1 Uygur face recognition algorithm flow of 2DDCT and POEM fusion
在這部分實(shí)驗(yàn)中,使用了課題組成員自己收集并自建的光照下的100幅男性維吾爾族人臉圖像數(shù)據(jù)庫,其維吾爾族人臉圖像均來自新疆不同地區(qū)、不同年齡段、不同性別,具有典型的代表性。在實(shí)驗(yàn)中選取20幅圖像作為訓(xùn)練樣本,其余為測試圖像,如圖2所示。
圖2 非均勻光照維吾爾族人臉自建部分?jǐn)?shù)據(jù)庫Fig. 2 Non-uniform illumination Uygur face self-built part of the database
從圖3、表1中的識(shí)別率可以看到,本文算法對維吾爾族人臉數(shù)據(jù)庫的識(shí)別達(dá)到了很高的效果,識(shí)別率也比傳統(tǒng)的識(shí)別算法具有很大的提升,因?yàn)榫S吾爾族人臉圖像的全局特征和局部特征比較明顯,因此該算法很適合識(shí)別維吾爾族人臉。
圖3 非均勻光照下維吾爾族人臉識(shí)別率Fig. 3 The recognition rate of Uygur characters in nonuniform illumination
表1 不同算法下的人臉識(shí)別率Table 1 Face recognition rate under different algorithms
本文采用了局部遮擋下自建的維吾爾族人臉自建數(shù)據(jù)庫,包含戴墨鏡、戴圍巾和胡子。選取了120幅遮擋下的維吾爾族人臉,將含有30幅戴墨鏡、30幅戴圍巾、30幅有胡子的維吾爾族人臉作為訓(xùn)練樣本,其余的作為測試樣本。在局部遮擋下的維吾爾族人臉實(shí)驗(yàn)中,設(shè)不確定的遮擋因素占據(jù)整個(gè)臉部的10%~20%,確定因素即墨鏡大概占據(jù)了整個(gè)臉部的30%左右,圍巾大概占據(jù)了整個(gè)臉部的40%左右,胡子加墨鏡大概占據(jù)了整個(gè)臉部的50%左右,口罩大概占據(jù)了45%左右。本文中采用了部分維吾爾族人臉加以實(shí)驗(yàn),如圖4所示。
圖4 局部遮擋下的維吾爾族人臉自建部分?jǐn)?shù)據(jù)庫Fig. 4 Local Uygur face self-built partial database
從圖5、表2中的識(shí)別率效果來看,本文所提出的算法在局部遮擋下的維吾爾族人臉自建數(shù)據(jù)庫中的實(shí)驗(yàn)識(shí)別率最好。當(dāng)遮擋率的面積在10%左右時(shí),除了2DDCT算法剩下的3個(gè)算法識(shí)別率都達(dá)到了90%以上;遮擋率在20%~30%時(shí)候,基于2DDCT算法識(shí)別率下降到了70%左右,而DCT+LDA算法和DCT+PCA算法的識(shí)別率也相應(yīng)地下降到了90%以下,本文所提出的算法識(shí)別率依然很高,仍然在90%以上;當(dāng)遮擋率在40%左右時(shí)候,除了本文所提出的算法識(shí)別率仍然在90%以上之外,其他3個(gè)算法其識(shí)別率下降都比較快;最后遮擋率在50%左右時(shí)候,可以看到,本文所提出的算法識(shí)別率高居榜首,在87.2%,而其余3個(gè)算法均低于60%。由此可見,本文所提出的算法在局部遮擋下的維吾爾族人臉自建數(shù)據(jù)庫的實(shí)驗(yàn)中,具有很強(qiáng)的魯棒性。
圖5 局部遮擋下的維吾爾族人臉識(shí)別率Fig. 5 Uygur face recognition rate under local occlusion
表2 局部遮擋下不同算法之間的人臉識(shí)別率Table 2 Face recognition rate among different algorithms under local occlusion
基于運(yùn)算速度考慮,在AMD A6-3420M APU 2.4 GHz的CPU,4 GB內(nèi)存的計(jì)算機(jī)上,利用MATLAB R2010a軟件進(jìn)行了本文算法、DCT+LDA算法、2DDCT算法及DCT+PCA算法在非均勻光照變化下與經(jīng)過遮擋的維吾爾人臉自建數(shù)據(jù)庫下的人臉識(shí)別的處理運(yùn)算速度的對比。實(shí)驗(yàn)中,采用了100,150,···,500個(gè)具有不同地區(qū)、不同性別、不同遮擋物的維吾爾人臉圖像來實(shí)驗(yàn),利用其時(shí)間計(jì)時(shí)功能函數(shù)tic與toc來運(yùn)行不同算法,并總結(jié)出其不同的運(yùn)算時(shí)間所對應(yīng)的不同算法,其結(jié)果如圖6所示。
圖6 不同算法的運(yùn)行時(shí)間對比曲線圖Fig. 6 Comparison of runtime of different algorithms
由圖6、表3中的數(shù)據(jù)顯示,本文所提出的算法在計(jì)算機(jī)運(yùn)行上有很大程度的提高,比DCT+LDA算法的速度提升了71.8%,比2DDCT算法速度提升了69%,比DCT+PCA算法速度提升了57%。這說明,本文提出的算法在自建維吾爾族人臉庫上的運(yùn)行時(shí)間有很大的優(yōu)勢,很大程度上縮短了時(shí)間。
表3 不同時(shí)間處理每幅圖像的平均時(shí)間Table 3 The average processing time for each image at different times
本文通過研究非均勻光照與局部遮擋因素干擾維吾爾族人臉識(shí)別效果,影響維吾爾族人臉的特征提取效率和維吾爾族人臉識(shí)別正確率的問題,提出了二維離散余弦變換(2DDCT)與方向邊緣幅值模式(POEM)相結(jié)合的維吾爾族人臉識(shí)別方法。本算法很好地降低了維吾爾族人臉圖像所需的特征維數(shù),進(jìn)一步縮短了計(jì)算量,并獲得了維吾爾族人臉的紋理特征信息,最后采用深度學(xué)習(xí)算法進(jìn)行分類識(shí)別。實(shí)驗(yàn)表明,本文算法在提高維吾爾族人臉有很高的識(shí)別率,魯棒性強(qiáng),擁有很好的優(yōu)勢。在今后的工作中,將就維吾爾族人臉在非均勻光照和局部遮擋方面做進(jìn)一步研究,以便提高其辨識(shí)率。