陳 暉
(福建信息職業(yè)技術(shù)學(xué)院 計算機(jī)工程系,福州 350001)
基于稀疏表示的分類算法,經(jīng)過一系列的研究與實驗,被成功應(yīng)用于人臉識別系統(tǒng)的構(gòu)建過程中,基本原理就是將測試樣本圖像表示為訓(xùn)練樣本的線性組合.這種方法的應(yīng)用,使得人臉識別技術(shù)能夠更好的應(yīng)對光照、表情變化以及部分遮擋等對識別效果造成的不良影響,顯示出較高的魯棒性.另有Deng等人,基于這種分類算法,提出了一種原型加變差的表示模型,對單樣本人臉識別的問題進(jìn)行了有效解決,而本文則在此基礎(chǔ)上,將其與分塊處理思想融合,強(qiáng)化局部特征的作用,從而提升技術(shù)應(yīng)用效果.
基于稀疏表示的人臉識別算法,首先要進(jìn)行字典的構(gòu)造,完備字典的基本元素,就是訓(xùn)練集本身;然后進(jìn)行測試樣本以及稀疏表示分類,當(dāng)每一類都具有足夠的訓(xùn)練樣本時,通過同類別的樣本的線性組合,即可對測試樣本進(jìn)行表示,最終得到最稀疏的測試樣本的線性組合;將最稀疏的測試樣本的線性組合,通過最小l1范數(shù)進(jìn)行重購;最后通過隨機(jī)特征提取,進(jìn)一步判斷測試樣本與各類之間的殘差大小,從而有效確定識別標(biāo)簽[1].
充分利用稀疏表示的判別性,在人臉識別的過程中,任意的測試樣本都可以從字典中的訓(xùn)練集表示獲得,進(jìn)一步通過稀疏系數(shù)求解殘差,即可獲得識別標(biāo)簽.字典的構(gòu)造過程如下:
結(jié)合表示理論,能夠進(jìn)一步得到測試樣本y的線性組合:
在人臉識別技術(shù)的初期研究過程中,研究人員嘗試采用了多種基于稀疏表示的衍生算法,但在一些特定的環(huán)境當(dāng)中,如人臉圖像連續(xù)性遮擋等,相關(guān)算法并不能對其進(jìn)行有效處理.所以,在后續(xù)的研究中,研究人員轉(zhuǎn)變技術(shù)方向,將稀疏表示分類(SRC)與人臉圖像非重疊分塊方法相融合.這一新的算法,可以實現(xiàn)將人臉圖像進(jìn)行非重疊式分塊處理,進(jìn)而對所得的數(shù)塊圖像,分別進(jìn)行加權(quán),最終重新構(gòu)建一個新的人臉特征組合,確定識別標(biāo)簽.該算法的具體處理過程如下:
2)設(shè)計加權(quán)系數(shù).將測試圖片的模塊視為字典中Ak的線性組合,即:yk=Akxk.這種表示方式是一種欠定系統(tǒng),其目的就是獲得一個穩(wěn)定的、唯一的解.
算法運(yùn)行過程中,需要同步加入l1和l2范數(shù)的約束條件,相應(yīng)的優(yōu)化問題,一般表示為:
由此可見,基于非重疊分塊的加權(quán)稀疏表示算法,能夠緩解圖片當(dāng)中遮擋、光照或表情變化等所帶來的識別不準(zhǔn)確問題,相對于單一的基于稀疏表示的分類算法的人臉識別技術(shù),相應(yīng)的識別效果得到了一定的提升.
筆者將上述算法的運(yùn)用效果,與現(xiàn)有的幾種算法的應(yīng)用效果進(jìn)行了對比,在不同像素尺寸下,各個算法的識別率如表1所示.通過對比結(jié)果能夠發(fā)現(xiàn),當(dāng)圖像的尺寸增大到80*64時,其余算法的識別效果都相應(yīng)提升,而模塊加權(quán)算法自始至終,都能夠保持較高的識別率.
表1 不同像素尺寸下人臉識別算法的識別率
基于圖像重構(gòu)的人臉識別方法的基本原理,即利用多輸入圖像之間的相關(guān)性,將目標(biāo)圖像進(jìn)行重構(gòu),形成一幅更具代表性的圖片.此時,隨著訓(xùn)練數(shù)據(jù)或圖像位數(shù)的增加,人臉識別算法的運(yùn)算速率會大大降低.為此,引入哈希算法,將其與基于圖像系數(shù)表示的人臉識別算法相融合,能夠綜合提升人臉識別效果與識別速度[2].
基于圖像重構(gòu)和哈希的人臉識別算法,主要涉及到三方面的工作內(nèi)容如下:
1)組稀疏編碼.針對這一問題,可以利用一組目標(biāo)函數(shù),來實現(xiàn)對分類問題的有效求解:
ζ(a,x;Y,D)=‖Ya-Dx‖2+λψ(x)
在算法應(yīng)用過程中,從字典當(dāng)中獲取的測試樣本為y1,y2,…,yk;Y=[y1,y2,…,yk].a表示k維的向量,且a=[a1,a2,…,ak]T,其中,a1+a2+…+ak=1,a1,a2,…,ak均大于0.x表示稀疏系數(shù)向量,且x≠0;D表示訓(xùn)練矩陣.
在算法運(yùn)算過程中,向量a將多輸入樣本結(jié)合在一起之后,即可形成一個新的圖像向量,新向量的維數(shù)等同于多輸入樣本的維數(shù).
圖1 圖像不分塊示意圖
圖2 圖像分成4塊示意圖
運(yùn)算實現(xiàn)時,可借助Hash矩陣,將最初獲取到的高維數(shù)據(jù)矩陣,映射到一個低維的數(shù)據(jù)空間中,確保在新的環(huán)境中,數(shù)據(jù)僅為{0,+1,-1},在為算法的應(yīng)用降低計算量的同時,也就相應(yīng)提高了算法的運(yùn)算效率[3].
基于低秩分塊稀疏表示的人臉識別算法的核心,是一種新的結(jié)構(gòu)不相關(guān)的低秩矩陣恢復(fù)方法.此外,還進(jìn)一步結(jié)合了離散余弦變換方法.兩種方法的綜合運(yùn)用,能夠有效解決人臉識別過程中,人臉圖像中存在的遮擋或光照等問題;算法運(yùn)用過程中,還會采用一種重疊分塊方法,主要作用是利用冗余信息提高算法的識別率;分類時所采用的alignment pooling的方法,也能在一定程度上提高算法的識別速度.
低秩矩陣恢復(fù)在解決稀疏噪聲方面,具有較大的作用.利用低秩矩陣恢復(fù)技術(shù),其主要目的是將訓(xùn)練集的數(shù)據(jù)矩陣D分解生成A+E的形式,其中A表示的是低秩矩陣,而E表示的是分解后的稀疏誤差[4].對傳統(tǒng)的低秩矩陣恢復(fù)進(jìn)行一定的優(yōu)化處理,可對如下公式進(jìn)行求解,從而使低秩矩陣恢復(fù)變得更易于處理:
式中,‖A‖*表示的是矩陣A秩的近似值,為核范數(shù);而一范數(shù)‖E‖1代替了原本的零范數(shù)‖E‖0.對于這一問題進(jìn)行求解,其中的關(guān)鍵就在于對于矩陣A的秩的控制.當(dāng)矩陣A的秩不是很大時,矩陣E也就足夠稀疏,此時結(jié)合增廣拉格朗日乘法,能夠提高對低秩矩陣近似問題的求解效率.
而離散余弦變換的應(yīng)用,能夠有效提升人臉識別算法的能量聚焦性,在實際識別圖像的過程中,能夠?qū)D像從空間域變換到頻域當(dāng)中.此時,絕大多數(shù)的圖像信號能量,也就被集中在了變換域的少數(shù)系數(shù)上[5].基于此種技術(shù)原理,在進(jìn)行圖像識別時,目標(biāo)圖像受到了光照的影響,在開始識別之前,僅需要修改少量的頻域系數(shù),就可以做到調(diào)整圖像光照的效果,從而降低算法識別過程中,相應(yīng)的需要調(diào)節(jié)的參數(shù).
算法當(dāng)中的人臉重疊分塊與識別,其實現(xiàn)過程如下:
1)人臉重疊分塊的實現(xiàn).基于低秩分塊稀疏表示的人臉識別算法,其中包含的基于稀疏表示的人臉識別算法認(rèn)為,每一個目標(biāo)圖片,都是字典當(dāng)中訓(xùn)練圖片集的線性組合.相關(guān)稀疏編碼問題的解決過程如下:
將測試圖片的模塊視為字典中Ak的線性組合,則對任意一個測試模塊yk都有:yk=Akxk.這種表示方式是一種欠定系統(tǒng),其目的就是獲得一個穩(wěn)定的、唯一的解.
綜合對比多種算法的應(yīng)用效果,在不同像素尺寸下,各個算法的識別率如表2所示.通過對比能夠清楚的認(rèn)識到,對于小圖像來說,人臉特征相對較為缺乏,所以模塊化的識別方法,要比全局化的識別方法差一些.但上述利用人臉圖像當(dāng)中重疊部分的冗余信息,能夠有效提升其識別率.通過對比,能夠得出基于低秩分塊稀疏表示的人臉識別算法,對于不同像素尺寸的圖像,都能實現(xiàn)較高的識別效果.
表2 不同像素尺寸下人臉識別算法的識別率
基于圖像分塊稀疏表示的人臉識別算法作為生物識別領(lǐng)域的尖端技術(shù),將其與安防監(jiān)控相結(jié)合,能夠有效解決現(xiàn)階段視頻安防監(jiān)控中的多種問題,包括無法實時確定監(jiān)控場景實物、無法鎖定監(jiān)控對象、無法準(zhǔn)確識別監(jiān)控對象、未能實現(xiàn)智能化檢索等.從技術(shù)的角度分析,基于圖像分塊稀疏表示的人臉識別算法,能夠支撐對大量圖像數(shù)據(jù)的識別與檢索,且成功解決了光照、表情變化、遮擋等問題,將其應(yīng)用于視頻安防監(jiān)控系統(tǒng)當(dāng)中,能夠有效完成對生物特征的提取,以及相關(guān)圖像信息的比對.
以某博物館為例,該博物館將人臉識別系統(tǒng)嵌入在視頻安防系統(tǒng)當(dāng)中,重新構(gòu)建了一個視頻人臉預(yù)警及檢索系統(tǒng).系統(tǒng)的運(yùn)行過程中,可以對到館參觀的人員進(jìn)行全面的、有效的人臉采集;在采集的基礎(chǔ)上,若有被識別的參觀人員,在30 d內(nèi)第二次到館參觀,則系統(tǒng)可以自動識別出相關(guān)的人臉特征;當(dāng)同一人員第三次到館參觀時,系統(tǒng)會在預(yù)警響應(yīng)時間內(nèi),通過系統(tǒng)管理發(fā)布相應(yīng)的預(yù)警信息,同時將參觀人員的人臉特征呈現(xiàn)在交互界面上;準(zhǔn)確識別預(yù)警人員之后,系統(tǒng)還能進(jìn)一步將其前兩次的到館參觀信息通過檢索調(diào)出,并與公安系統(tǒng)或有關(guān)部門的黑名單人員進(jìn)行綜合比對[6].
現(xiàn)階段,人臉識別系統(tǒng)的應(yīng)用范圍包括情報領(lǐng)域、戶政管理、種族比對等,除相關(guān)以身份識別為核心的生物特征識別市場,隨著人臉識別技術(shù)水平的不斷提升,人臉識別技術(shù)逐漸被應(yīng)用在多種數(shù)字產(chǎn)品當(dāng)中,包括數(shù)碼相機(jī)、手機(jī)攝像頭等.由此可見,人臉識別技術(shù)的應(yīng)用前景十分廣泛,而隨著社會背景的變化,其應(yīng)用將呈現(xiàn)為多樣化的發(fā)展趨勢,包括網(wǎng)絡(luò)化趨勢、融合趨勢以及快速發(fā)展趨勢.以人臉識別系統(tǒng)為媒介,將進(jìn)一步促進(jìn)“身份識別+物聯(lián)網(wǎng)”的認(rèn)證模式;另外,隨著社會對于這一技術(shù)的需求標(biāo)準(zhǔn)越來越高,人臉識別系統(tǒng)將逐漸與其他技術(shù)進(jìn)行有機(jī)融合,綜合提升相關(guān)技術(shù)應(yīng)用的整體安全性,提高安防效果.
綜上所述,探究基于圖像分塊稀疏表示的人臉識別算法,對綜合提升人臉識別技術(shù)水平及應(yīng)用效果具有重要意義.通過相關(guān)分析,基于圖像分塊稀疏表示的人臉識別算法,對于不可控環(huán)境下拍攝的人臉圖片的識別效果更好,進(jìn)一步強(qiáng)化了系統(tǒng)對局部人臉特征的識別作用.這樣一來,系統(tǒng)能夠更好地應(yīng)對光照、部分遮擋等對識別效果的影響.