摘要:人臉識(shí)別技術(shù)以其非入侵的優(yōu)勢(shì)已經(jīng)在工作和生活的各領(lǐng)域中廣泛應(yīng)用,隨著科技的進(jìn)步,未來(lái)人臉識(shí)別的應(yīng)用將更加普遍。近幾十年來(lái),研究者們提出了許多的人臉識(shí)別算法。分析和研究基于子空間的人臉表示以及人臉?lè)诸惙椒?,通過(guò)重點(diǎn)介紹人臉?lè)诸惖膸追N具有代表性的方法并總結(jié)其優(yōu)缺點(diǎn),來(lái)探討未來(lái)人臉識(shí)別的研究方向。
關(guān)鍵詞:人臉表示;人臉?lè)诸?特征子空間;發(fā)展趨勢(shì)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)33-0185-02
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 引言
人臉識(shí)別作為一種非侵人性的生物識(shí)別技術(shù),目前已經(jīng)被廣泛應(yīng)用于各種場(chǎng)合,如公安檢查系統(tǒng),醫(yī)院和高校的門禁系統(tǒng),教室的考勤系統(tǒng)等。但目前的人臉識(shí)別技術(shù)仍然面臨較大的挑戰(zhàn),比如面部表情變化,光照變化,姿態(tài)變化,以及是否存在遮擋等,都會(huì)使得分類識(shí)別任務(wù)的準(zhǔn)確率下降,因而人臉識(shí)別還有很長(zhǎng)的路要走。近年來(lái),人臉識(shí)別的研究大多開(kāi)始轉(zhuǎn)向人臉姿態(tài)的矯正,表情的矯正,以及含遮擋的人臉圖像中遮擋的定位和遮擋下人臉圖像的重構(gòu)等。目前基于深度學(xué)習(xí)和3D人臉模型的姿態(tài)、表情矯正方法已經(jīng)取得顯著成果,但仍有提升的空間。而針對(duì)包含遮擋的人臉圖像,如墨鏡類的遮擋,能夠通過(guò)加入先驗(yàn)知識(shí)獲得較為理想的效果,但對(duì)于隨機(jī)的遮擋物,目前還沒(méi)有較好的定位遮擋的方法。
人臉識(shí)別的技術(shù)流程主要有人臉檢測(cè),人臉表示以及人臉?lè)诸?。人臉檢測(cè)的任務(wù)是檢測(cè)并定位出一幅圖像中的人臉;人臉表示是將人臉映射到特征子空間中來(lái)更好的描述人臉;而人臉?lè)诸惖娜蝿?wù)便是識(shí)別出人臉的身份或者標(biāo)簽。本文主要針對(duì)人臉表示和分類介紹相關(guān)的方法。在眾多已有的人臉識(shí)別的方法中,很多都是基于子空間的方法。
2 人臉表示的方法
人臉表示是將原本的人臉圖像中的特征信息表示成有利于分類器比較和分類的特征形式。一般分為局部特征和全局特征兩種。
2.1 全局特征的表示方法
主成分分析方法[1](Principal Component Analysis,PCA)和線性判別分析[2] (Linear Discriminate Analysis,LDA)是經(jīng)典的用于提取全局特征的方法,本質(zhì)上都是通過(guò)投影變換將樣本從一個(gè)特征空間變換到另一個(gè)特征空間的方法。PCA方法主要是通過(guò)K-L變換消除數(shù)據(jù)的相關(guān)性,并投影到一個(gè)子空間中,使得各類別數(shù)據(jù)能夠在該空間上較好的分離。所以PCA常用于特征降維,將高維特征投影到低維的特征空間中。缺點(diǎn)是由于PCA是一種無(wú)監(jiān)督的方法,缺乏類別信息的輔助,因而無(wú)法增強(qiáng)各類別數(shù)據(jù)之間的區(qū)分度。而LDA則是一種有監(jiān)督的方法,在PCA的基礎(chǔ)上引入Fisher準(zhǔn)則,在向子空間投影的同時(shí)進(jìn)行聚類。即使得同類樣本之間更加緊湊,不同類別樣本之間的距離更大,從而實(shí)現(xiàn)更好的分類效果。
2.2 局部特征的表示方法
由于全局特征無(wú)法有效捕捉細(xì)節(jié)信息,因此局部特征的提取方法逐漸興起。較有代表性的局部二值模式[3] (Local BinaryPattern,LBP)是一種描述圖像局部紋理特征的視覺(jué)算子,具有旋轉(zhuǎn)不變性和灰度不變性等優(yōu)點(diǎn)。如圖1所示,通過(guò)閾值標(biāo)記中心像素和其鄰域像素之間的差別,再將其二值化,得到該中心像素的特征值。但是基于空域的LBP特征及其變體對(duì)于光照等異常的魯棒性不足,因此研究者們又提出了很多基于頻域的特征。比如Gabor特征[4],通過(guò)傅立葉變換將圖像從空間域轉(zhuǎn)換到頻率域,再利用Gabor核在頻率域進(jìn)行加窗,然后對(duì)頻域圖像分塊求和得到原始圖像在某一方向和尺度下的特征向量。由于Gabor濾波器的頻率和方向與人類的視覺(jué)系統(tǒng)類似,因而特別適合于紋理表示與判別。
無(wú)論是全局特征還是局部特征,都是將原始樣本投影到某一個(gè)特征域(或特征子空間)上,在該特征子空間內(nèi)能比原始樣本空間更有效的表達(dá)樣本特征,從而更有利于接下來(lái)的分類。基于子空間的人臉表示方法如圖2所示。
3 人臉?lè)诸惖姆椒?/p>
用于人臉?lè)诸惖姆椒ㄖ饕谢谙∈璞硎镜姆椒ê突趨f(xié)同表示的方法。稀疏表示的目的是在給定的超完備字典中使用盡可能少的原子來(lái)表示信號(hào),使得信號(hào)的表示更加的簡(jiǎn)潔,從而更方便對(duì)信號(hào)加工處理。而系統(tǒng)表示則是盡可能利用更多不同類的樣本來(lái)協(xié)同表示一個(gè)測(cè)試樣本,以提高表示的效果。
3.1基于稀疏表示子空間的方法
由Wright等人于2009年提出了基于稀疏表示[6]的分類器(Sparse Representation based Classification。SRC),基于壓縮感知理論,通過(guò)最小L1范數(shù)的回歸因子,從相關(guān)性較強(qiáng)的各人臉子空間尋找能較好表達(dá)待識(shí)別圖像y的字典原子:
min ‖y - Ax ‖,+‖x‖.
其中x為重構(gòu)系數(shù)(回歸因子),A為訓(xùn)練樣本,y為測(cè)試樣本。L1范數(shù)會(huì)使得向量x中盡可能多的元素為0,從而讓其中的非零元素盡可能落在v所屬的類別子空間當(dāng)中。
雖然SRC可以得到較為理想的人臉識(shí)別的準(zhǔn)確率,但是由于原始訓(xùn)練樣本中可能存在噪聲等不確定的信息,因而在這種情況下可能無(wú)法有效的表示測(cè)試樣本。因此,Yang等人將字典學(xué)習(xí)[10,11]引入到SRC當(dāng)中,并加入Fisher準(zhǔn)則[9]以增強(qiáng)回歸因子的判別力,提出了Fisher判別字典學(xué)習(xí)[7]模型(Fisher Discrimina-tion Dictionary Learning, FDDL).
3.2 基于協(xié)同表示子空間的方法
Zhang等人于2011年提出了“協(xié)同表示”的思想,認(rèn)為SRC的成功不一定歸功于稀疏編碼,因?yàn)椴煌悩颖局g存在較大的相關(guān)性,因而一些不能被同類別樣本很好表示的特征也許能夠被其他類別的樣本表征。同時(shí),在保證測(cè)試樣本y能夠被訓(xùn)練樣本較好的表示的基礎(chǔ)上,還須保證編碼系數(shù)x的主要能量落在y所屬的子空間中,防止被其他類別上相似的局部特征“過(guò)度表達(dá)”。所以,zhang等人提出的基于協(xié)同表示[5]的分類(Col-laborative Representation based Classifier。CRC)模型如下:
其中,對(duì)回歸因子x的約束采用Lp(p=1,2)范數(shù),)L為平衡因子,e為表示誤差。
同SRC 一樣,CRC依然是采用訓(xùn)練樣本當(dāng)作字典,因而其表示能力有限。Cai等人于2014年將字典學(xué)習(xí)和支持向量的思想引入SRC中,提出了支持向量引導(dǎo)的字典學(xué)習(xí)[8](Support Vec-tor Guided Dictionary Learning,SVGDL)模型,作者證明該模型實(shí)際上是FDDL的更一般的形式。并且SVGDL自適應(yīng)的確定每對(duì)編碼向量的權(quán)重,能夠取得比FDDL更好的分類結(jié)果。
字典學(xué)習(xí)的實(shí)質(zhì)是通過(guò)迭代擬合原始訓(xùn)練樣本,得到訓(xùn)練樣本的一個(gè)魯棒的回歸子空。進(jìn)而通過(guò)將測(cè)試樣本投影到該子空間當(dāng)中,根據(jù)其與各類別樣本的相似程度確定其類別。無(wú)論是協(xié)同表示還是系數(shù)表示,最終都需要引入字典學(xué)習(xí)得到更加魯棒的表達(dá)樣本的子空間。基于子空間的人臉?lè)诸惙椒ㄈ鐖D3所示。
4 總結(jié)
隨著軟硬件技術(shù)的進(jìn)步,有許多性能優(yōu)異的人臉?lè)诸愃惴ǔ霈F(xiàn),但都只能適用于某一種特定的場(chǎng)景。實(shí)際應(yīng)用中,情況復(fù)雜多變,人臉識(shí)別還有很多難點(diǎn)需要攻克,比如圖像的質(zhì)量對(duì)于識(shí)別性能的影響,還有前文提到的表情、光照、遮擋等異常情況的出現(xiàn),甚至還有肉眼難以分辨的雙胞胎等問(wèn)題。
本文主要探討了一些經(jīng)典的人臉表示和分類方法及其產(chǎn)生動(dòng)機(jī)和優(yōu)缺點(diǎn)。人臉識(shí)別技術(shù)未來(lái)的發(fā)展趨勢(shì)可以從以下方面展開(kāi):1)如何定位面部圖像上出現(xiàn)的遮擋。2)如何矯正表情的變化以降低其對(duì)識(shí)別效果的影響。3)如何確定哪些局部特征能被有效協(xié)同表示并防止過(guò)度表達(dá)。相信未來(lái)人臉識(shí)別技術(shù)會(huì)更加完善,更加廣泛地應(yīng)用于實(shí)際生活當(dāng)中。
參考文獻(xiàn):
[1] Wold S,Esbensen K,Geladi P.Principal component analysis[J].Chemometrics and Intelligent Laboratory Systems, 1987, 2(1/2/3):37-52.
[2] Ye J, Janardan R, Li Q, et al. Two-Dimensional Linear Dis-criminant Analysis[C]. neural information processing systems, 2004: 1569-1576.
[3] Ahonen T,Hadid A,Pietikainen M.Face description with localbinary patterns:application to face recognition[J].lEEE Transac-tions on Pattem Analysis and Machine Intelligence, 2006, 28(12):2037-2041.
[4] Patil M K,Patekar S A,Sankhe P,et al.Gabor feature extractionfor gray scale image[C]//Proceedings of the International Con-ference & Workshop on Emerging Trends in Technology - IC-WET '11. February 25-26, 2011. Mumbai, Maharashtra, India.New York:ACM Press,2011:22-24.
[5] Lei Z,Meng Y,F(xiàn)eng X C.Sparse representation or collaborativerepresentation:Which helps face recognition?[C]//2011 Interna-tional Conference on Computer Vision.November 6-13, 2011,Barcelona,Spain.IEEE,2011:471-478.
[6] Wright J,Yang A Y,Ganesh A,et aI.Robust face recognition viasparse representation[J].lEEE Transactions on Pattern Analysisand Machine Intelligence,2009,31(2):210-227.
[7] Yang M,Zhang L,F(xiàn)eng X C,et aI.Fisher Discrimination Diction-ary Learning for sparse representation[C]//2011 InternationalConference on Computer Vision.November 6-13,20ll,Barcelo-na,Spain.lEEE,2011:543-550.
[8] Cai S J,Zuo W M,Zhang L,et aI.Support vector guided diction-ary learning[J].Computer Vision - ECCV 2014,2014: 624-639.D01:10.1007/97 8-3-319-105 93 -2_41.
[9] Gao Q X,Liu J J,Zhang H J,et aI.Enhanced fisher discriminantcriterion for image recognition[J].Pattern Recognition, 2012,45(10):3717-3724.
[10] Tosic I,F(xiàn)rossard P.Dictionary learning[J].lEEE Signal Process-ing Magazine,2011,28(2):27-38.
[11] Mairal J,Bach F,Ponce J,et aI.Supervised dictionary learning[EB/OL]. 2008: arXiv: 0809.3083[cs. CV]. https://arxiv. org/abs/0809.3083.
作者簡(jiǎn)介:呂芳芳(1983-),女,河南洛陽(yáng)人,中級(jí)職稱,碩士,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)及網(wǎng)絡(luò)安全、圖像處理。