王 林,鄧芳娟
(西安理工大學(xué) 自動化與信息工程學(xué)院,西安 710048)
人臉識別技術(shù)作為計算機視覺和模式識別領(lǐng)域研究的熱點課題之一,被廣泛用于身份證信息系統(tǒng)、銀行監(jiān)控、海關(guān)出入境檢查、犯罪嫌疑人追逃、校園安全、門禁系統(tǒng)等領(lǐng)域,具有巨大的潛在應(yīng)用前景.然而在實際的人臉識別系統(tǒng)中,所采集的人臉圖像是在不可控的自然環(huán)境下進行,常常含有光照、姿態(tài)、遮擋、表情、噪聲等類內(nèi)變化.因此,如何在含有較大干擾的人臉識別問題中高效地取得良好的識別結(jié)果,便成了當前人臉識別研究所關(guān)心的問題[1].
近年來,受壓縮感知理論[2]啟發(fā),Wright等人[3]提出基于稀疏表示(Sparse Representation-based Classification,SRC)的分類方法,該算法對圖像被腐蝕、遮擋及其他噪聲等復(fù)雜環(huán)境下的人臉識別問題獲得較好的識別效果.之后,一系列基于SRC分類方法的研究取得了一定進展,具有代表性的包括稀疏重構(gòu)算法的優(yōu)化策略[4]、添加對表示系數(shù)的不同約束工作[5]以及SRC方法與其他算法的結(jié)合[6,7]等.其中,Hui等人[8]在K最近鄰(K-Nearest Neighbors,KNN)算法的基礎(chǔ)上,提出了稀疏近鄰表示分類(Sparse Neighbor Representation based-Classification,SNRC)算法,利用K個近鄰樣本數(shù)據(jù)對測試樣本進行稀疏線性重構(gòu),一定程度上增強了人臉稀疏重構(gòu)精度,提高了人臉識別率.李佳等人[9]為了有效地提升壓縮感知圖像的重構(gòu)質(zhì)量,提出了基于加權(quán)結(jié)構(gòu)組稀疏表示(WSGS)算法,該算法明顯改善了圖像的重構(gòu)質(zhì)量,提高了稀疏重構(gòu)的精度.Fan等人[10]提出加權(quán)稀疏表示分類(Weighted Sparse Representation Classification,WSRC)的人臉識別算法,將樣本權(quán)重引入到訓(xùn)練字典中加權(quán)融合,增強了人臉識別的魯棒性,但算法比較耗時且不符合實時性要求.
可見,WSRC算法相比經(jīng)典的SRC算法,提高了人臉識別率,卻忽略了它的計算效率.事實上,雖然WSRC算法可以取得理想的識別結(jié)果,但是若該算法運用經(jīng)典的l1范數(shù)優(yōu)化方法(如l1_ls算法)來求解稀疏表示系數(shù),其計算效率會很低.尤其在實際的人臉識別應(yīng)用中,常采用的嵌入式系統(tǒng)無法滿足該算法高計算復(fù)雜度的要求.若要將WSRC算法付諸到實際應(yīng)用,既要獲得良好的分類效果,又要提高基于l1范數(shù)優(yōu)化問題的計算速度,就非常有必要對WSRC算法進行改進,在提高人臉識別率的同時考慮算法的時間效率.鑒于此,本文采用高斯核函數(shù)獲取訓(xùn)練樣本權(quán)重和DALM算法求解l1范數(shù)最小化模型,提出了一種改進的加權(quán)稀疏表示分類算法WSRC_DALM.在不同人臉數(shù)據(jù)庫上的實驗表明,基于對偶增廣拉格朗日乘子法(Dual Augmented Lagrange Multiplier,DALM)的加權(quán)稀疏表示分類算法不僅顯著提高了WSRC算法的人臉識別率,而且降低了時間復(fù)雜度,取得了魯棒性的識別效果.
SRC算法的核心思想是將測試樣本表示成訓(xùn)練樣本的線性組合,通過稀疏重構(gòu)求出稀疏系數(shù)進行圖像分類.其主要流程包括:人臉圖像的預(yù)處理、構(gòu)造超完備訓(xùn)練字典、圖像稀疏重構(gòu)、稀疏分類,具體如圖1所示.
圖1 稀疏表示分類框圖
在人臉識別中,假定一張人臉灰色圖片的像素為也是一個的二維矩陣信息,通過將這張圖片堆積成一個維度為的列向量.文獻[4]中表明,若人臉數(shù)據(jù)庫中有足夠多的圖像構(gòu)成訓(xùn)練字典,在第i類人臉圖像中,ni個樣本人臉圖像的所有列向量合并成矩陣第i類的一個新的測試樣本y∈Rm,那么y可被矩陣 Ai線性表示y=xi,1vi,1其中稀疏系數(shù)是第i類訓(xùn)練樣本對應(yīng)測試樣本y的稀疏系數(shù),也是測試樣本重構(gòu)系數(shù).當不知道y的類別時,就要對y在所有訓(xùn)練樣本上進行線性表示,即:y=Ax,其中表示理論上x中只有y所屬的那一類訓(xùn)練樣本對應(yīng)系數(shù)非零,而其他部分的系數(shù)均為零,則可根據(jù)最大的稀疏系數(shù)x對測試樣本y進行分類判別.
為提高WSRC算法的識別率和計算效率,本文提出了一種加權(quán)稀疏表示分類和DALM相結(jié)合的分類算法WSRC_DALM.其大體有兩方面改進:一方面是利用高斯核函數(shù)來計算訓(xùn)練樣本的權(quán)重,構(gòu)造加權(quán)訓(xùn)練字典 A′,保留數(shù)據(jù)的局部信息和減少計算量;另一方面是基于DALM算法來求解l1范數(shù)最小化問題,獲取稀疏表示系數(shù),在提高WSRC算法識別效果的基礎(chǔ)上,提高了算法的時間效率.
WSRC算法的核心思想是獲取每個訓(xùn)練樣本在表示測試樣本中的重要性,即訓(xùn)練樣本的權(quán)重,之后采用加權(quán)的訓(xùn)練樣本字典 A′用來執(zhí)行經(jīng)典的SRC算法.為改進WSRC算法[11]中訓(xùn)練樣本權(quán)重計算量大的問題,本文利用高斯核函數(shù)獲取每個訓(xùn)練樣本相對于測試樣本的權(quán)重.改進的WSRC算法的具體步驟如下:
(1) 輸入:訓(xùn)練字典 A∈Rm×N,一個測試樣本y∈Rm;其中訓(xùn)練字典A是由k種人的ni個不同的樣本圖像;
其中,k表示樣本類別,ni是每類人的所有樣本圖像,N是所有人的樣本圖像.
(2) 圖像預(yù)處理:對進行降維和列的歸一化處理;
(3) 計算權(quán)重:采用高斯核函數(shù)計算每個訓(xùn)練樣本和測試樣本之間的相似性[10],即訓(xùn)練樣本的權(quán)重wi,j;
其中,vi,j表示第i類樣本的第j個圖像;y表示測試圖像;σ是高斯核函數(shù)的寬度參數(shù),該參數(shù)需要實驗仿真時進行設(shè)置.
(4) 引入權(quán)重,構(gòu)造新的訓(xùn)練字典A′:
其中,wk,nk vk,nk表示加權(quán)后第k類樣本的第nk個圖像.
(5) 求解l0最小化問題:
(6) 計算出測試樣本對應(yīng)的每類人的殘差:
(7) 輸出:判斷y的類別:
式(4)l0范數(shù)問題是一個NP-hard問題,通常可轉(zhuǎn)換為l1范數(shù)的凸問題,當前利用基于最小化l1范數(shù)優(yōu)化問題的l1_ls算法大大增加了WSRC算法的計算復(fù)雜度,非常耗時.為了提高WSRC算法的時間效率,本文采用對偶增廣拉格朗日乘子法 (Dual Augmented Lagrange Multiplier,DALM)求解式(4).式(4)對應(yīng)的拉格朗日乘子函數(shù)[12]如下:
其中,μ >0是一個常數(shù)且表示的是將等式約束轉(zhuǎn)化為無約束問題的補償因子.γ是求出的拉格朗日乘子矢量.若 γ?是一個拉格朗日乘子矢量,且滿足優(yōu)化問題的二階充分條件,那么在補償因子 μ足夠大的情況下,稀疏優(yōu)化問題可通過下式求出,即:
由式(8)可知,要求出稀疏解x,必須要確定參數(shù)γ*和μ的取值,可通過迭代方法[13]來同時計算x和 γ的取值,即:
其中,{ μk}是一個正的單調(diào)遞增序列.
為了精確重構(gòu)測試圖像,將ALM算法運用在對偶問題上,即DALM算法[14],則式(4)可轉(zhuǎn)化為成:
其中,y?是重構(gòu)測試人臉圖像;稀疏系數(shù)x的取值區(qū)域為此時可將式(10)的拉格朗日函數(shù)形式的問題表示為:
其中,β是一個大于零的常數(shù)且為約束轉(zhuǎn)化為你等式補償因子;x是稀疏優(yōu)化算法最終得到的輸出;z是重構(gòu)過程中獲得的稀疏系數(shù).
對于求解初始化問題和對偶問題變量以及都很復(fù)雜,所以采用分部迭代更新方法進行求解.令x=xk,y*=yk,由此結(jié)果將zk更新為zk+1,即:
其中是投影到上的算子,若確定x=xk,z=zk,則y*可由下式計算,即:
DALM算法[2]可表示為:
可見由式(12)可精確求出重構(gòu)測試圖像,且可以保證該對偶算法的收斂性.
假設(shè)共有N個人臉圖像為訓(xùn)練樣本,每個人臉圖像的維數(shù)是m.經(jīng)典SRC算法的時間復(fù)雜度是WSRC算法中訓(xùn)練樣本的時間復(fù)雜度則其總的時間復(fù)雜度為本文的WSRC_DALM算法主要是計算訓(xùn)練樣本權(quán)重和求解稀疏表示系數(shù)中所需的時間較多.其中訓(xùn)練樣本的時間復(fù)雜度在相同的迭代次數(shù)下,DALM算法相比l1_ls算法的計算精度高,運行時間少[12].因此,總體上所提出的算法要比原始WSRC算法的時間復(fù)雜度低.
為了驗證WSRC_DALM算法在人臉識別中的有效性,進行了兩類實驗:一是算法識別效果和時間測試;二是算法對多姿態(tài)的魯棒性測試.本文的兩類實驗將WSRC_DALM算法與經(jīng)典SRC算法(即SRC(l1_ls)方法)、WSRC算法(即WSRC(l1_ls)方法)進行比較.實驗基于ORL[15]和FEI[1]兩個標準人臉數(shù)據(jù)庫,在2.60 GHz,4 G內(nèi)存,64位Win7的計算機系統(tǒng)下進行實驗.實驗之前,需要設(shè)置高斯核函數(shù)的寬度參數(shù),即本文將其設(shè)置成所有訓(xùn)練樣本之間的平均歐氏距離[16]:
其中,M是所有樣本之間的歐氏距離數(shù)目.
ORL人臉數(shù)據(jù)庫包含40人的400張灰度人臉圖像,每人有10幅樣本圖像,主要包含姿態(tài)和表情變化,每幅樣本圖像的大小為112×92.部分樣本人臉如圖2所示.
圖2 ORL人臉庫中部分圖像
實驗前,為了保證實驗過程中訓(xùn)練字典的完備性,即訓(xùn)練字典列的維數(shù)大于行的維數(shù),將所有圖像下采樣至14×12,形成168維的特征向量.選擇每類人不同數(shù)目的圖像組成訓(xùn)練樣本集,剩下的圖像作為測試樣本.各算法所得的識別率結(jié)果如表1所示.
表1 ORL中各算法下識別率比較(單位:%)
從表1中可知,本文算法識別精度上優(yōu)于SRC算法和WSRC算法.為了更好說明所提算法的計算效率,將WSRC算法和WSRC_DALM算法在訓(xùn)練樣本數(shù)目N=6下的運行時間進行了對比,如表2所示.可見在保證相同識別率的條件下,WSRC_DALM算法明顯在識別時間上較優(yōu)于WSRC算法.
表2 ORL中WSRC和WSRC_DALM算法的時間比較
FEI數(shù)據(jù)庫包含200種人的彩色圖像,其中每類14張圖像,含姿態(tài)和光照變化的影響.本文隨機選擇100種人的11張姿態(tài)各異的圖像,每幅圖像的大小是480×640.部分樣本人臉如圖3所示,其中編號1-5是從右側(cè)90度到正面過渡姿態(tài)圖像,編號6-10是從正面到左側(cè)90度的過渡姿態(tài)圖像,編號11是正面圖像.
圖3 FEI人臉數(shù)據(jù)庫中部分人臉圖像
由于FEI數(shù)據(jù)庫中所有的圖像是彩色的,首先對圖像進行灰度處理,其次下采樣至16×24,形成384維的特征向量.實驗中分別選擇每個人不同數(shù)目的圖像作為訓(xùn)練集構(gòu)成過完備字典,即N=5,6,7,8,9,10,則剩下的圖像作為測試樣本.對比SRC、WSRC和WSRC_DALM算法,所得識別率結(jié)果如表3所示.
表3 FEI中不同訓(xùn)練樣本姿態(tài)和算法下的識別率
從表3可知,隨著訓(xùn)練樣本的增加,即訓(xùn)練姿態(tài)的增加,本文算法的識別率明顯優(yōu)于其他算法.當N=8時,由于測試樣本的姿態(tài)是1、10、11,尤其是1和10兩種姿態(tài)影響了識別率,可見識別率的大小與所選擇的姿態(tài)存在相關(guān)性.
為了在視覺上體現(xiàn)出加權(quán)稀疏表示結(jié)合DALM算法在多姿態(tài)人臉識別中的優(yōu)越性,本文選取了一個被SRC誤分類的測試圖像進行驗證.圖4所示為訓(xùn)練字典中第51類人的訓(xùn)練集和測試圖像姿態(tài)10.
圖4 訓(xùn)練字典中第51類訓(xùn)練集和測試姿態(tài)10
當訓(xùn)練姿態(tài)樣本數(shù)目N=8時,第51類人的測試圖像姿態(tài)10被SRC方法誤分類,所得的稀疏系數(shù)解如圖5所示.對比WSRC_DALM算法,如圖6所示為第51類人的測試圖像姿態(tài)10的稀疏系數(shù)解.
圖5 SRC算法的稀疏系數(shù)解
圖6 WSRC_DALM算法的稀疏系數(shù)解
從圖5中可以看出,SRC算法將第51類人的測試圖像姿態(tài)10誤分類為第99類人訓(xùn)練集中的訓(xùn)練姿態(tài)8,且其他系數(shù)的干擾大.對比WSRC_DALM算法,從圖6中可知,將其分類成第51類人的訓(xùn)練集中的訓(xùn)練姿態(tài)9,剛好符合事實,也就說明姿態(tài)9和姿態(tài)10的相似性最大,同時其他稀疏系數(shù)的干擾也比較小.于是,獲取第51類人的測試圖像姿態(tài)10與訓(xùn)練字典中每個訓(xùn)練樣本的相似性,如圖7所示.
圖7 第51類人的測試圖像姿態(tài)10與所有訓(xùn)練樣本的相似性
從圖7中可以看出,第51類人的測試圖像姿態(tài)10與其姿態(tài)9的相似性最大,同時也發(fā)現(xiàn),姿態(tài)10與其他類人訓(xùn)練集的姿態(tài)9的相關(guān)性比其他姿態(tài)都高,說明了WSRC_DALM算法通過聯(lián)合稀疏性和數(shù)據(jù)局部性提高了多姿態(tài)人臉識別的魯棒性.
本文針對經(jīng)典SRC算法在人臉識別中的計算效率低和魯棒性差的問題,提出了一種改進的加權(quán)稀疏表示人臉識別算法WSRC_DALM.該方法采用高斯核函數(shù)計算所有訓(xùn)練樣本的權(quán)重,并將權(quán)重引入到訓(xùn)練字典中進行加權(quán)融合,保留了人臉局部數(shù)據(jù)信息,在此基礎(chǔ)上結(jié)合DALM算法實現(xiàn)l1范數(shù)最小化獲得稀疏解x,實現(xiàn)了一種基于DALM算法的快速WSRC人臉識別方法.在ORL和FEI人臉庫上的實驗結(jié)果表明,與其它人臉識別方法相比,本文算法在識別率上和識別時間上具有明顯優(yōu)勢,減小了較大視角的姿態(tài)變化對人臉識別的影響,具有較強的魯棒性,且在小樣本問題中具有較大的優(yōu)勢.
1 Cao FL,Hu HP,Lu J,et al.Pose and illumination variable face recognition via sparse representation and illumination dictionary.Knowledge-Based Systems,2016,107:117-128.[doi:10.1016/j.knosys.2016.06.001]
2 Donoho DL.Compressed sensing.IEEE Transactions on Information Theory,2006,52(4):1289-1306.[doi:10.1109/TIT.2006.871582]
3 Wright J,Yang AY,Ganesh A.Robust face recognition via sparse representation.IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.[doi:10.1109/TPAMI.2008.79]
4 姜輝明.基于稀疏表示的人臉識別方法研究[碩士學(xué)位論文].南昌:華東交通大學(xué),2013.
5 Yang AY,Sastry SS,Ganesh A,et al.Fastl1-minimization algorithms and an application in robust face recognition:A review.Proceedings of 2010 IEEE International Conference on Image Processing.Hong Kong,China.2010.1849-1852.
6 李光早,王士同.基于稀疏表示和彈性網(wǎng)絡(luò)的人臉識別.計算機應(yīng)用,2017,37(3):901-905.[doi:10.11772/j.issn.1001-9081.2017.03.901]
7 張疆勤,廖海斌,李原.基于因子分析與稀疏表示的多姿態(tài)人臉識別.計算機工程與應(yīng)用,2013,49(5):154-159.
8 Hui KH,Li CL,Zhang L.Sparse neighbor representation for classification.Pattern Recognition Letters,2012,33(5):661-669.[doi:10.1016/j.patrec.2011.11.010]
9 李佳,高志榮,熊承義,等.加權(quán)結(jié)構(gòu)組稀疏表示的圖像壓縮感知重構(gòu).通信學(xué)報,2017,38(2):196-202.[doi:10.11959/j.issn.1000-436x.2017041]
10 Fan ZZ,Ni M,Zhu Q,et al.Weighted sparse representation for face recognition.Neurocomputing,2015,151:304-309.[doi:10.1016/j.neucom.2014.09.035]
11 Lu CY,Min H,Gui J,et al.Face recognition via weighted sparse representation.Journal of Visual Communication and Image Representation,2013,24(2):111-116.[doi:10.1016/j.jvcir.2012.05.003]
12 Yang M,Zhang L,Yang J,et al.Robust sparse coding for face recognition.Proceedings of 2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Colorado Springs,CO,USA.2011.625-632.
13 Andreani R,Birgin EG,Martínez JM,et al.On augmented Lagrangian methods with general lower-level constraints.Siam Journal on Optimization,2007,18(4):1286-1309.
14 Tomioka R,Sugiyama M.Dual-augmented Lagrangian method for efficient sparse reconstruction.IEEE Signal Processing Letters,2009,16(12):1067-1070.[doi:10.1109/LSP.2009.2030111]
15 Zhang N,Yang J.K nearest neighbor based local sparse representation classifier. Proceedings 2010 Chinese Conference on Pattern Recognition (CCPR).Chongqing,China.2010.1-5.
16 卞則康,王士同.基于混合距離學(xué)習(xí)的魯棒的模糊C均值聚類算法.智能系統(tǒng)學(xué)報,2017,12(4):450-458.