劉中華, 姚 楠, 劉文紅
(1. 上海電機(jī)學(xué)院 電子信息學(xué)院, 上海 200240; 2. 上海海事大學(xué) 信息工程學(xué)院, 上海 201306)
人臉識(shí)別是圖像處理領(lǐng)域的一個(gè)研究重點(diǎn)。通常,在人臉識(shí)別算法中,對(duì)人臉圖像特征的描述包含全局特征和局部特征兩大類[1-4],且多以向量的形式給出,稱為特征向量。其中,全局特征表示的特征向量包含了人臉圖像的全部,即整體信息[3-4];而局部特征僅包含了人臉圖像的一些局部,即細(xì)節(jié)信息[2-5]。常用的全局特征提取方法有主成分分析(Principal Component Analysis, PCA)等,局部特征提取方法有尺度不變特征轉(zhuǎn)換(Scale-invariant Feature Transform, SIFT)[6-7]、局部二值模式(Local Binary Patterns, LBP)[8-9]等。在常用的人臉識(shí)別算法中,由于受人的面部表情、裝飾物的變化以及環(huán)境因素等的影響,最重要的步驟就是如何描述和選取合適的人臉圖像特征,以提高人臉識(shí)別和檢索的精度。
目前,已經(jīng)有很多學(xué)者研究了基于特征匹配的人臉識(shí)別算法,包括基于單一特征的人臉識(shí)別[8],以及基于特征聯(lián)合的人臉識(shí)別[2-4,10]。其中,基于單一特征的人臉識(shí)別算法具有計(jì)算速度快、實(shí)時(shí)性強(qiáng)的優(yōu)點(diǎn);其缺點(diǎn)是很難克服光照、旋轉(zhuǎn)等的影響,在復(fù)雜背景下,識(shí)別率會(huì)降低。而基于特征聯(lián)合的人臉識(shí)別算法可以提高復(fù)雜背景下人臉識(shí)別的精度。在常用的基于特征聯(lián)合的人臉識(shí)別算法中,如基于全局和局部特征集成的人臉識(shí)別等算法中,不同的特征根據(jù)一定的規(guī)則融合在一起,每種特征均對(duì)識(shí)別率有貢獻(xiàn)。該方法最主要的優(yōu)點(diǎn)是有效信息全面;缺點(diǎn)是由于信息量相對(duì)較大,會(huì)導(dǎo)致識(shí)別算法實(shí)時(shí)性降低,常需要和降維算法結(jié)合使用,故提高了計(jì)算復(fù)雜度[2,10]。
為克服以上算法的缺點(diǎn),一種有效的方法是針對(duì)不同情景下獲取的圖像,分別采用不同的特征表達(dá)方式,使識(shí)別算法能自適應(yīng)地根據(jù)訓(xùn)練圖像自身的特點(diǎn),優(yōu)先選擇最具判別力的特征用于人臉的分類識(shí)別[11-13]。文獻(xiàn)[11-12]中分別提出了一種自適應(yīng)特征選擇方法。該類方法建立在一定的自適應(yīng)選取準(zhǔn)則之上,如線性判別分析算法的類內(nèi)、類間散度值等,利用鑒別能力分析等算法完成人臉圖像的識(shí)別過程。該類方法具有抗光照變化的優(yōu)點(diǎn),缺點(diǎn)是自適應(yīng)選取準(zhǔn)則的量度值需要人為確定。此外,文獻(xiàn)[14]中采用Adaboost算法對(duì)樣本數(shù)據(jù)庫(kù)中每幅樣本圖像進(jìn)行訓(xùn)練,選擇出最能表示圖像的若干個(gè)特征,并結(jié)合支持向量機(jī)(Support Vector Machine, SVM)等機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)對(duì)未知人臉圖像的有效識(shí)別。該方法能降低特征的維數(shù),提高分類識(shí)別的精度;缺點(diǎn)是對(duì)于樣本數(shù)據(jù)庫(kù)中的所有圖像,均使用相同的特征向量表達(dá)式,在樣本差異比較大的情況下(如樣本完全無(wú)遮擋以及樣本有部分遮擋),其識(shí)別率會(huì)降低。
受文獻(xiàn)[11-13]的啟發(fā),本文提出一種對(duì)待識(shí)別圖像自適應(yīng)選擇合適特征的人臉識(shí)別算法。該算法對(duì)不同情景下(如光照、遮擋影響、面部表情發(fā)生變化等)的人臉圖像分別提取全局、局部等特征,根據(jù)距離最小化的選取準(zhǔn)則,利用Adaboost算法[13-15]自適應(yīng)地為待測(cè)圖像選擇能最優(yōu)表達(dá)該圖像的特征向量以及相應(yīng)的分類器,能有效地提高人臉圖像的識(shí)別率。
AdaBoost樣本權(quán)重迭代更新算法是改進(jìn)的Boosting算法。在圖像處理領(lǐng)域,其主要被用于對(duì)圖像特征進(jìn)行選擇及對(duì)圖像的分類中。該算法可以靈活地運(yùn)用不同的分類學(xué)習(xí)方法,以提高算法的性能。
AdaBoost算法實(shí)現(xiàn)的是分類器的功能。該分類器被稱為強(qiáng)分類器或提升分類器,是多個(gè)稱為弱分類器的子分類器的組合。AdaBoost算法根據(jù)訓(xùn)練樣本數(shù)據(jù)庫(kù)進(jìn)行多輪迭代計(jì)算,每一輪迭代運(yùn)算均訓(xùn)練出一個(gè)最佳的弱分類器[7-8]。
在人臉識(shí)別應(yīng)用中,人臉圖像的特征與AdaBoost算法中的弱分類器相對(duì)應(yīng),即每一輪的迭代運(yùn)算過程,既是訓(xùn)練一個(gè)最佳弱分類器的過程,也是一個(gè)最佳圖像特征的選取過程。從另一個(gè)角度來(lái)說,AdaBoost算法可以選擇出能提高所建分類識(shí)別模型預(yù)測(cè)能力的最佳人臉特征。
對(duì)AdaBoost算法的具體計(jì)算步驟如下:
步驟1輸入。設(shè)訓(xùn)練樣本數(shù)據(jù)庫(kù)X包含n個(gè)樣本{(x1,y1),(x2,y2),…,(xn,yn)},其中,xi為算法輸入的訓(xùn)練樣本,其中,i∈[1,n];yi∈Y={1,2,…,k}表示k類樣本的標(biāo)簽。每個(gè)樣本初始化服從均勻分布的權(quán)重,即D1(i)=1/n;整數(shù)T為迭代次數(shù)。
步驟2對(duì)每個(gè)弱分類器ht,t=1,2,…,T,其中,T為弱分類器的個(gè)數(shù),進(jìn)行以下迭代運(yùn)算:
(1) 把權(quán)重歸一化為一個(gè)概率分布Dt;
(2) 返回一個(gè)弱分類器,即
ht:X→Y
(1)
(3) 計(jì)算弱分類器ht的誤差為
(2)
若εt>1/2,則設(shè)T=t-1,且終止循環(huán);
(4) 設(shè)弱分類器的權(quán)重為
(3)
(5) 更新樣本概率分布Dt,
(4)
式中,Zt為歸一化的常量。
步驟3所有被選出的最佳弱分類器組合成強(qiáng)分類器,為
(5)
本文提出一種新的為不同待測(cè)樣本自適應(yīng)選擇合適的人臉特征的方法: 對(duì)訓(xùn)練數(shù)據(jù)庫(kù)的每張圖像以及待測(cè)樣本圖像分別用M種特征提取方法提取M種特征;之后,針對(duì)上述M種特征,在訓(xùn)練樣本數(shù)據(jù)庫(kù)上,用AdaBoost算法訓(xùn)練一個(gè)強(qiáng)分類器。
對(duì)訓(xùn)練樣本數(shù)據(jù)庫(kù)做以下設(shè)置: 訓(xùn)練樣本數(shù)據(jù)庫(kù)設(shè)為Xt,包含C個(gè)子樣本數(shù)據(jù)庫(kù)X1,X2,…,Xi,…,XC,i∈[1,C],分別代表C類人臉圖像(如人臉正面圖像、受光照變化影響的圖像、受遮擋的圖像以及旋轉(zhuǎn)一定角度的圖像等),每個(gè)子數(shù)據(jù)庫(kù)又包含p個(gè)人的多幅圖像。
自適應(yīng)特征選擇算法的計(jì)算步驟如下:
(1) 對(duì)數(shù)據(jù)庫(kù)Xt中的每幅圖像,均用M種特征提取方法分別提取M個(gè)特征向量,組成特征庫(kù)F。
(2) 對(duì)子數(shù)據(jù)庫(kù)Xi分別用Adaboost算法獲得一個(gè)強(qiáng)分類器Hi。該強(qiáng)分類器是M個(gè)弱分類器的組合,即
其中,aij為每個(gè)弱分類器的加權(quán)系數(shù),且aij值最大的弱分類器對(duì)應(yīng)于Xi數(shù)據(jù)庫(kù)中,對(duì)分類貢獻(xiàn)最大,即最優(yōu)的特征fmi(fmi∈F,m∈[1,M],i∈[1,C])所屬的類別,并設(shè)最大的aij值為ai max,i∈[1,C];F為特征庫(kù)。
(3) 對(duì)數(shù)據(jù)庫(kù)Xt的每個(gè)子數(shù)據(jù)庫(kù)均執(zhí)行上述運(yùn)算,可得C個(gè)強(qiáng)分類器{Hi},i∈[1,C]。
(4) 分別計(jì)算待測(cè)樣本圖像的M個(gè)特征和特征庫(kù)F中同類特征之間的距離(如歐氏距離),并歸一化,找出歸一化距離最短的特征fo,并把歸一化距離作為特征選擇的準(zhǔn)則。
(5) 根據(jù)ai max,i∈[1,C]值和不同類別特征之間的關(guān)系,搜索特征fo對(duì)分類貢獻(xiàn)最大的分類器Hc,運(yùn)用該分類器完成對(duì)待測(cè)樣本圖像的識(shí)別。
該算法的結(jié)構(gòu)圖如圖1所示。
圖1 基于自適應(yīng)特征選擇的人臉識(shí)別算法Fig.1 Face recognition based on adaptive feature selection
本文實(shí)驗(yàn)所用的數(shù)據(jù)來(lái)源于GATV數(shù)據(jù)庫(kù),樣本數(shù)據(jù)庫(kù)包含以下4種類型的人臉圖像: 標(biāo)準(zhǔn)正面圖像、正面圖像帶表情變化、左側(cè)旋轉(zhuǎn)45°、有遮擋等,每類圖像有10個(gè)人的5幅圖像,故實(shí)驗(yàn)所用數(shù)據(jù)庫(kù)共包含200幅圖像。每幅圖像分別用PCA方法提取其全局特征,用LBP和SIFT算法分別提取其局部特征,故每幅圖像共提取3種特征。
圖2為實(shí)驗(yàn)所用數(shù)據(jù)庫(kù)包含的部分樣本圖像。
圖2 部分樣本圖像Fig.2 Part of image samples
(1) 在本文設(shè)置的樣本數(shù)據(jù)庫(kù)中,對(duì)于每類圖像,從每個(gè)人的5幅圖像中輪流選取一幅做測(cè)試圖像,剩余的4幅作為訓(xùn)練圖像,故每個(gè)人可以做5次分類識(shí)別實(shí)驗(yàn),10個(gè)人5次實(shí)驗(yàn)的平均識(shí)別率如圖3所示。同時(shí),為驗(yàn)證本文提出算法的有效性,圖3中還給出了采用PCA方法提取圖像的全局特征、用LBP和SIFT算法提取的局部特征的平均識(shí)別率。實(shí)驗(yàn)結(jié)果表明,本文提出的算法較其他3種算法在絕大多數(shù)實(shí)驗(yàn)樣本上具有相對(duì)較高的識(shí)別率。
圖3 基于不同特征的人臉識(shí)別算法平均識(shí)別率比較Fig.3 Comparison of average recognition rates of face recognition algorithms based on different features
(2) 在不同類型的人臉圖像子數(shù)據(jù)庫(kù)上,使用本文提出的算法和基于不同特征的識(shí)別算法分別進(jìn)行比較,取不同人臉同一類型的分類識(shí)別率的平均值作為實(shí)驗(yàn)結(jié)果,以驗(yàn)證本文算法在環(huán)境等因素的影響下的有效性,實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 不同算法在不同類型的人臉圖像子數(shù)據(jù)庫(kù)上的平均識(shí)別率比較Fig.4 Comparison of average recognition rate with different face recognition algorithms on different kinds of sub-database of face images
圖4為柱狀圖,每對(duì)柱狀圖的左側(cè)代表的是本文提出的自適應(yīng)特征選擇算法的平均識(shí)別率,右側(cè)為基于單一特征或組合特征的識(shí)別算法的平均分類識(shí)別率。在這些識(shí)別算法中分類器仍然采用AdaBoost算法。由圖可見,相比較單一的PCA、LBP、SIFT以及LBP+PCA人臉特征,在不同類型的人臉圖像數(shù)據(jù)庫(kù)上,本文算法均具有較高的識(shí)別率,尤其是對(duì)有遮擋的人臉圖像,本文提出的算法和傳統(tǒng)的SIFT算法相比較,具有較為明顯的優(yōu)勢(shì),識(shí)別效果相對(duì)較好。
針對(duì)常用的基于特征的人臉識(shí)別算法,由于所選擇的特征是固定的,對(duì)于所有的測(cè)試樣本并不完全適用的缺點(diǎn),本文提出了一種根據(jù)測(cè)試樣本圖像自適應(yīng)地選擇合適特征的人臉識(shí)別算法。該算法利用AdaBoost算法,針對(duì)不同情景下的人臉圖像自適應(yīng)地選擇合適的全局或局部特征,并通過實(shí)驗(yàn)證明該算法可有效地克服如光照、遮擋、面部表情發(fā)生變化等的影響,擴(kuò)展了算法的適用范圍,有效地提高了人臉圖像的識(shí)別率。
參考文獻(xiàn):
[1] Song Mingli,Tao Dacheng,Liu Zicheng,et al.Image ratio features for facial expression recognition application[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B: Cybernetics,2010,40(3): 779-788.
[2] 蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識(shí)別[J].軟件學(xué)報(bào),2010,21(8): 1849-1862.
[3] 徐效文,張荷萍.融合局部與全局特征提取的虹膜識(shí)別方法[J].計(jì)算機(jī)應(yīng)用研究,2012,29(11): 4378-4380,4397.
[4] Shang Junjun,Ke Yongzhen.An image recognition method using multi-features[C]∥Proceedings of the 11th International Symposium on Distributed Computing and Applications to Business, Engineering & Science.Guilin: IEEE,2012: 419-423.
[5] 薛冰,郭曉松,蒲鵬程.人臉識(shí)別技術(shù)綜述[J].四川兵工學(xué)報(bào),2010,31(7): 119-121.
[6] Zhou Qiangqiang,Zhao Zhenbing.Substation equipment image recognition based on SIFT feature matching[C]∥ Proceedings of 5th International Congress on Image and Signal Processing(CISP).Chongqing: IEEE,2012: 1344-1347.
[8] 袁寶華,王歡,任明武.基于完整LBP特征的人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用研究,2012,29(4): 1557-1559.
[9] Doshi N P,Schaefer G.Compact multi-dimensional LBP features for improved texture retrieval[C]∥Proceedings of the Second International Conference on Robot,Vision and Signal Processing.Washington,DC,USA: IEEE,2013: 51-55.
[10] 陳琦,郭順超,張世輝.基于特征聯(lián)合和支持向量機(jī)的人臉識(shí)別[J].燕山大學(xué)學(xué)報(bào),2012,36(6): 519-525.
[11] 王美,梁久禎.自適應(yīng)特征提取的光照魯棒性人臉識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(11): 164-169.
[12] 朱長(zhǎng)仁,王潤(rùn)生.人臉特征自適應(yīng)選取技術(shù)[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2002,14(1): 26-30.
[13] 潘崇,朱紅斌.基于自適應(yīng)特征選擇和SVM的圖像分類的研究[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(1): 244-246.
[14] 李巍,楊素錦,段曉華.Adaboost和隨機(jī)圖劃分的無(wú)監(jiān)督圖像分類[J].中國(guó)圖象圖形學(xué)報(bào),2012,17(10): 1245-1251.
[15] 方晶晶,李振波,姜宇.人體膚色區(qū)域的自適應(yīng)模型分割方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2013,25(2): 229-234.