汪漪
摘 要:人臉檢測(cè)是指對(duì)于給定的圖像對(duì)其進(jìn)行查找,判斷圖中有沒(méi)有人臉存在,倘若檢測(cè)到了人臉,那么就返回該臉的位置、大小和姿態(tài)。隨著社會(huì)公共安全的必要性進(jìn)一步凸顯,智能監(jiān)控在傳統(tǒng)的運(yùn)動(dòng)目標(biāo)檢測(cè)、行為分析、智能報(bào)警等方面的應(yīng)用越來(lái)越多,對(duì)人臉進(jìn)行識(shí)別已逐漸成為公共場(chǎng)所的緊要功能,受到了越來(lái)越多的關(guān)注。本文首先分析了人臉識(shí)別的應(yīng)用及其發(fā)展歷史。接著,分析了有關(guān)人臉檢測(cè)的算法,并對(duì)他們進(jìn)行了細(xì)致地分析,給出了相應(yīng)的評(píng)價(jià)。最后總結(jié)了人臉識(shí)別目前面對(duì)的困難,并提出了展望。
關(guān)鍵詞:人臉檢測(cè);模式識(shí)別;算法
中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2018)23-0037-02
1 引言
人通過(guò)感覺(jué)來(lái)感知外部環(huán)境,視覺(jué)是感覺(jué)的一個(gè)重要組成部分。然而在科技發(fā)展史上的很長(zhǎng)一段時(shí)間內(nèi),計(jì)算機(jī)就像是一個(gè)“盲人”,只能被動(dòng)的接受鍵盤(pán)輸入、文件讀取的信息,并不能像人類(lèi)的大腦一樣通過(guò)眼睛自動(dòng)從外部世界獲取所需要的信息并進(jìn)行信息處理。
隨著社會(huì)進(jìn)步和科技發(fā)展,機(jī)器勞動(dòng)將在一定程度上取代人類(lèi)勞動(dòng),這就要求機(jī)器具備能夠像人類(lèi)的感覺(jué)器官一樣感知外界的能力。計(jì)算機(jī)如果能夠?qū)⑦@些“客觀事物的個(gè)別屬性”記錄并分辨清楚,那么,就可以實(shí)現(xiàn)類(lèi)似感覺(jué)的功能。其中,計(jì)算機(jī)視覺(jué)在科學(xué)家們的不斷努力下取得了相當(dāng)大的發(fā)展。而人臉檢測(cè)是計(jì)算機(jī)視覺(jué)、模式識(shí)別等領(lǐng)域的重要組成部分,也是人臉識(shí)別的第一個(gè)環(huán)節(jié),其在安全監(jiān)控等方面的作用不可替代。
人臉檢測(cè)[1]是指對(duì)于給定的圖像對(duì)其進(jìn)行查找,判斷圖中有沒(méi)有人臉存在,倘若檢測(cè)到了人臉,那么就返回該臉的位置、大小和姿態(tài)。人臉相較于別的生物特征而言,更加的形象、具體、直觀。因此人臉檢測(cè)、識(shí)別等技術(shù)在越來(lái)越多的領(lǐng)域得以運(yùn)用。例如:
(1)智能監(jiān)控:用于機(jī)場(chǎng)、火車(chē)站等交通部門(mén),銀行、大型商場(chǎng)、政府涉密機(jī)關(guān)、國(guó)家情報(bào)部門(mén)等機(jī)構(gòu),監(jiān)控可疑人物行蹤和可疑事件過(guò)程。感知接口:模擬人眼功能,代替?zhèn)鹘y(tǒng)的鍵盤(pán)、鼠標(biāo)輸入和文件讀取,使得機(jī)器能夠更加容易地進(jìn)行交流。(2)虛擬現(xiàn)實(shí):游戲中人物形象模型、行為、關(guān)節(jié)、運(yùn)動(dòng)機(jī)制的建立;視頻會(huì)議、虛擬聊天室等虛擬現(xiàn)實(shí)情境。(3)視頻搜索:隨著媒體技術(shù)的成熟與發(fā)展,視頻內(nèi)容占網(wǎng)絡(luò)內(nèi)容的比重越來(lái)越高,基于人臉的搜索比基于文本的搜索更加的直觀、便捷。(4)電子商務(wù):隨著例如支付寶、微信支付等電子快捷支付應(yīng)用的迅速發(fā)展,電子商務(wù)領(lǐng)域急需高效的自動(dòng)身份認(rèn)證技術(shù),人臉識(shí)別技術(shù)加上密碼保護(hù)技術(shù)可以保證電子商務(wù)的安全性。
2 人臉檢測(cè)的發(fā)展
人臉檢測(cè)的發(fā)展大致分為三個(gè)階段。
(1)第一階段:1964年到1990年。
這是人臉檢測(cè)技術(shù)發(fā)展的初級(jí)和起步階段,采用的主要方法是將人臉的幾何結(jié)構(gòu)作為特征,并且結(jié)合了人工神經(jīng)網(wǎng)絡(luò)算法的應(yīng)用。
(2)第二階段:1991年到1997年。
在這一階段短短的七年時(shí)間之內(nèi),人臉檢測(cè)步入了黃金時(shí)代,各個(gè)科研機(jī)構(gòu)、實(shí)驗(yàn)室的研究人員通過(guò)不懈努力研究出了大量的人臉檢測(cè)算法。具體成果如:
1)Eigenface算法:Turk和Pentland,兩位來(lái)自麻省理工學(xué)院媒體實(shí)驗(yàn)室的研究員提出了該算法。2)FERET人臉檢測(cè)算法測(cè)試:由美國(guó)軍方組織進(jìn)行測(cè)試。3)對(duì)比模板匹配和結(jié)構(gòu)特征的人臉檢測(cè)算法的實(shí)驗(yàn):由Poggio和Brunelli,兩位來(lái)自麻省理工學(xué)院人工智能實(shí)驗(yàn)室的研究員于1992年執(zhí)行。該對(duì)比實(shí)驗(yàn)證明了模板匹配的人臉檢測(cè)算法的優(yōu)越性,為后續(xù)研究提出了方向。4)Fisherface算法:由Belhumeur提出。利用主成分分析(Principal Component Analysis,PCA)和線(xiàn)性判別分析(Linear Discriminant Analysis,LDA)兩大方法。該算法目前仍在使用,并且是主流算法之一。
(3)第三階段:1998年至今。
統(tǒng)計(jì)學(xué)習(xí)理論如支持向量機(jī)(Support Vector Machine,SVM)被運(yùn)用到人臉檢測(cè)當(dāng)中來(lái),并且人臉檢測(cè)技術(shù)的實(shí)際應(yīng)用得到了進(jìn)一步的發(fā)展。例如:法國(guó)將人臉檢測(cè)技術(shù)應(yīng)用于ATM上;德國(guó)DOS公司研發(fā)了多重模板識(shí)別技術(shù);美國(guó)在各大機(jī)場(chǎng)率先將人臉監(jiān)控技術(shù)用于人群監(jiān)控等。
中國(guó)的人臉檢測(cè)技術(shù)起步比較晚,國(guó)內(nèi)的清華大學(xué)、北京工業(yè)大學(xué)、微軟亞洲研究院、中國(guó)科學(xué)院自動(dòng)化研究所、中國(guó)科學(xué)院計(jì)算機(jī)技術(shù)研究所等機(jī)構(gòu)從事人臉檢測(cè)方面的研究?!度四樧R(shí)別系統(tǒng)》作為清華大學(xué)主持的國(guó)家“十五”項(xiàng)目于2005年1月18日通過(guò)了專(zhuān)家鑒定。此外,在人臉檢測(cè)技術(shù)方面,中國(guó)研究人員越來(lái)越多在IEEE中的FG\ICIP\ CVPR上發(fā)表優(yōu)秀論文,這標(biāo)志著中國(guó)人臉檢測(cè)技術(shù)研究的逐步深入。
3 人臉檢測(cè)算法
3.1 基于先驗(yàn)知識(shí)的人臉檢測(cè)
這是一種在實(shí)際使用過(guò)程中基于先驗(yàn)知識(shí)的算法。其對(duì)有關(guān)人臉的一些知識(shí)進(jìn)行編碼。比如一個(gè)人臉通常具有一些通用規(guī)則,這些檢測(cè)規(guī)則包括:人有兩個(gè)對(duì)稱(chēng)的眼睛、兩個(gè)對(duì)稱(chēng)的耳朵、一個(gè)鼻子、一個(gè)嘴巴,這些人體器官之間的位置、相對(duì)距離等。這些規(guī)則可以運(yùn)用來(lái)進(jìn)行檢測(cè),判斷圖片中是否含有人臉。這種方法實(shí)現(xiàn)比較困難。如果規(guī)則比較完善,則可能由于光線(xiàn)、噪聲和遮擋等不利因素的影響檢測(cè)不出完全符合這些規(guī)則的人臉。如果規(guī)則過(guò)于簡(jiǎn)單,則可能造成非人臉區(qū)域誤檢。[2-3]
3.2 基于膚色的人臉檢測(cè)
一幅彩色圖像,膚色是人臉的一個(gè)最為顯著的特征。并且面部膚色在彩色空間里的分布相對(duì)而言比較集中。該算法將膚色在顏色空間中聚類(lèi)成單獨(dú)的一類(lèi)以用于人臉和背景的分割??梢允褂玫念伾臻g有:RGB、HSV、HSI、GLHS等。該算法實(shí)現(xiàn)手段簡(jiǎn)單,但受光照、攝像頭色偏、背景顏色等因素影響較大。
在用膚色進(jìn)行人臉檢測(cè)時(shí),我們可以采用高斯模型、高斯混合模型或是非參數(shù)估計(jì)等方法進(jìn)行建模。其中,非參數(shù)估計(jì)模型方法可以有效地提高了人臉檢測(cè)的速度,并且針對(duì)面部遮擋和光照影響等問(wèn)題,可以有效提高其檢測(cè)率,具有一定的魯棒性。
3.3 基于特征的人臉檢測(cè)
基于特征的方法,是尋找人臉的不變特性用于人臉檢測(cè)。人臉具有一些對(duì)不同姿勢(shì)而言具有魯棒性的特征?;趯?duì)這些特征的提取,創(chuàng)建可以描述特征之間關(guān)系的統(tǒng)計(jì)模型,用以驗(yàn)證人臉的存在[3]。特征檢測(cè)法是把人臉的圖像特征空間看做眾多的一維向量,并且把它們?cè)俅巫儞Q到相對(duì)簡(jiǎn)單的特征空間。對(duì)于給定的圖像,我們計(jì)算其特征值和特征向量,判定是否為人臉。最常見(jiàn)的特征就是Haar-like特征。
人臉具有一些特點(diǎn),比如:人的眼睛和眉毛比面頰顏色深,嘴唇比四周顏色深,鼻梁比兩側(cè)顏色淺等。所以我們可以根據(jù)人臉顏色深淺的不同,選擇一些矩形,來(lái)表示人臉的這些特征。如圖1中所顯示的這些特征,我們稱(chēng)之為Haar-like特征。
該算法適應(yīng)性能好,是一種常見(jiàn)的檢測(cè)算法。但是,基于特征的算法存在的問(wèn)題是,由于人臉遮擋或是圖片拍攝儀器存在噪聲,人臉圖像的某些特征被嚴(yán)重破壞,人臉的特征邊界被弱化。或是由于光照產(chǎn)生陰影,這些陰影可能引起很強(qiáng)的邊緣,使得該算法的準(zhǔn)確度降低。
3.4 基于模板匹配的人臉檢測(cè)
模板匹配的方法是根據(jù)計(jì)算出的標(biāo)準(zhǔn)人臉模板和輸入圖片的相關(guān)性,來(lái)判斷圖片中是否含有人臉。在這些方法當(dāng)中,不同姿態(tài)的人臉圖樣被存儲(chǔ)在模板庫(kù)中,這些標(biāo)準(zhǔn)模板和輸入圖片的相關(guān)性被當(dāng)做了檢測(cè)標(biāo)準(zhǔn)。對(duì)于給定的輸入圖像,我們分別計(jì)算面部輪廓、鼻子、眼睛、嘴等部位與標(biāo)準(zhǔn)模板之間的相關(guān)性。目前,已經(jīng)提出了多尺度、多分辨率和可變形的模板。
3.5 基于人工神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)
人工神經(jīng)網(wǎng)絡(luò)算法是訓(xùn)練一個(gè)網(wǎng)絡(luò)結(jié)構(gòu),該神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、參數(shù)里包含了模式的統(tǒng)計(jì)特性。該方法被廣泛地運(yùn)用。目前得到廣泛應(yīng)用的該類(lèi)方法包括Boltzmann機(jī)(1985年提出)、多層反饋神經(jīng)網(wǎng)絡(luò)(BP算法,1986年提出)和徑向基網(wǎng)絡(luò)(RBF網(wǎng)絡(luò)方法,1988年提出)。人工神經(jīng)網(wǎng)絡(luò)算法的一個(gè)缺點(diǎn)是對(duì)于訓(xùn)練樣本數(shù)量要求比較高,否則識(shí)別效果比較差。
4 人臉檢測(cè)中存在的難點(diǎn)
人臉檢測(cè)存在很多不確定性因素,影響了人臉檢測(cè)的檢出率,并存在誤檢幾率。人臉檢測(cè)當(dāng)中存在的難點(diǎn)主要有以下幾點(diǎn):
(1)個(gè)體差異性。人臉有很多細(xì)節(jié),不同的人面部細(xì)節(jié)不同。比如不同的人種膚色不同,不同人的發(fā)型不同,眼睛睜開(kāi)和閉合等個(gè)體差異。(2)人臉的遮擋:實(shí)際運(yùn)用中,眼鏡、頭發(fā)以及各種小飾品會(huì)對(duì)人臉造成遮擋。同時(shí)外部環(huán)境如樹(shù)陰、路標(biāo)等等也會(huì)對(duì)人臉造成一定的遮擋。(3)人臉角度:實(shí)際當(dāng)中拍攝到的人臉有一定程度的傾斜,側(cè)面或是旋轉(zhuǎn)的人臉和正面人臉的特征有所不同。(4)背景:一些背景與人臉的膚色、形狀相似,難以分辨,造成了一定程度的誤檢。(5)成像條件:光照條件、成像設(shè)備等的影響。
5 總結(jié)與展望
本文歸納總結(jié)了人臉檢測(cè)的應(yīng)用領(lǐng)域,并回顧了人臉檢測(cè)的初級(jí)和起步階段、黃金階段以及現(xiàn)在相較成熟的階段,總結(jié)了人臉檢測(cè)的發(fā)展歷史。接著,將人臉檢測(cè)算法按照:基于先驗(yàn)知識(shí)的人臉檢測(cè)、基于膚色的人臉檢測(cè)、基于特征的人臉檢測(cè)、基于模板匹配的人臉檢測(cè)、基于人工神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)六個(gè)方面進(jìn)行分類(lèi),詳細(xì)分析了各類(lèi)算法的優(yōu)缺點(diǎn)。最后總結(jié)了人臉檢測(cè)目前仍然存在的問(wèn)題。
目前,隨著科技日益發(fā)展,用戶(hù)對(duì)識(shí)別的速度和精度有了越來(lái)越高的要求,這就要求人臉檢測(cè)系統(tǒng)能夠在相當(dāng)短的時(shí)間之內(nèi)迅速進(jìn)行大量的數(shù)據(jù)運(yùn)算。如今雖然進(jìn)行人臉檢測(cè)研究的機(jī)構(gòu)和和人比較多,但人臉檢測(cè)的速度和精度一直是研究人臉檢測(cè)算法的問(wèn)題所在。如何在保證的精度的前提下,有效提高人臉檢測(cè)的速度,是大家研究的關(guān)鍵目標(biāo)。由此,對(duì)人臉檢測(cè)的研究仍然迫在眉睫。
參考文獻(xiàn)
[1]M.Yang, D.J. Kriegman. Detecting faces in images[J]. Pattern Analysis and Machine Intelligence,2002:617-620.
[2]T.K.Leung, M.C.Burl,P.Perona. Finding faces in cluttered scenes using random labeled graph matching. Proc[C]. IEEE International Conference on Computer Vision. IEEE,1995:637-644.
[3]K.C.Yow, R. Cipolla. A probabilistic framework for perceptual grouping of features for human face detection[C]. IEEE International Conference on Automatic Face and Gesture Recognition.IEEE,1996:16-21.
[4]C.Han,M.Liao,K. Yu,L.Chen.Fast face detection via morphology-based pre-processing[C]. IEEE International Conference on Image Analysis and Processing.IEEE,1998:1701-171.