(蕪湖職業(yè)技術(shù)學(xué)院,安徽 蕪湖 241000)
隨著信息技術(shù)的發(fā)展,為了減少銀行前臺(tái)工作人員的工作量,現(xiàn)大量的存取現(xiàn)金的操作都在ATM 機(jī)上操作。目前全國(guó)有大量的ATM機(jī)在使用。ATM機(jī)無(wú)人值守的現(xiàn)象給不法分子提供了可乘之機(jī),很多起蓄意破壞ATM機(jī)的,或在ATM 機(jī)上安裝讀卡器盜刷信用卡的案件層出不窮?,F(xiàn)ATM機(jī)上都安裝攝像頭,自動(dòng)監(jiān)控接近ATM機(jī)人員的行為,以預(yù)防和減少犯罪。如發(fā)生不法行為,通過(guò)攝像頭捕捉人臉特征,利用人臉識(shí)別技術(shù),進(jìn)行人臉識(shí)別和人臉認(rèn)證,以幫助發(fā)現(xiàn)可疑人物。 然而ATM機(jī)視頻的人臉識(shí)別受光照、姿態(tài)變化、攝像頭低分辨率的影響,造成很大的計(jì)算負(fù)擔(dān)和系統(tǒng)損耗[1]。這就使得人臉識(shí)別技術(shù)本身也面對(duì)著一定難題[2]。
人臉識(shí)別技術(shù)是利用人臉的特征信息,根據(jù)已知的人臉數(shù)據(jù)庫(kù),對(duì)輸入的人臉信息進(jìn)行識(shí)別、驗(yàn)證。基于視頻的人臉識(shí)別不同于基于靜態(tài)圖像的人臉識(shí)別技術(shù),它利用視頻中的動(dòng)態(tài)信息進(jìn)行識(shí)別。目前基于視頻的人臉識(shí)別方法主要有:基于特征信息的人臉識(shí)別方法、基于統(tǒng)計(jì)模型的人臉識(shí)別方法和基于混合線索的人臉識(shí)別方法。基于視頻的人臉識(shí)別技術(shù)難點(diǎn)主要是:
(1) 光照影響
人臉識(shí)別受光線影響,特別是從視頻中提取動(dòng)態(tài)信息更受光照影響[3]。針對(duì)這一問(wèn)題,很多學(xué)者都提出自己的觀點(diǎn)。有學(xué)者提出才有主成分分析方法進(jìn)行識(shí)別,丟棄由光線對(duì)人臉識(shí)別的干擾。有學(xué)者提出局部二元模式,并將其改進(jìn),克服光照變化。
(2) 姿態(tài)變化的影響
人臉識(shí)別復(fù)雜性因素之一是姿態(tài)變化,由于該技術(shù)比較固定,基于視頻的人臉識(shí)別技術(shù)獲取的是視頻中的動(dòng)態(tài)信息,在視頻中人臉不斷在變化,姿態(tài)不斷改變,導(dǎo)致人臉信息的不確定性[4]。有文獻(xiàn)介紹基于多視角的人臉識(shí)別系統(tǒng),采用驗(yàn)證曲面捕捉視頻動(dòng)態(tài)信息;有文獻(xiàn)提出了改進(jìn)的AAM(主動(dòng)外觀模型),處理視頻中的姿態(tài)和表情變化。此外,視頻中動(dòng)態(tài)的人臉信息與現(xiàn)有的人臉數(shù)據(jù)庫(kù)會(huì)存在差異,也導(dǎo)致匹配的不一致性。
(3) 低分辨率的影響
ATM的視頻像素分辨率較低,視頻質(zhì)量不高,影響人臉識(shí)別。解決這一現(xiàn)象的方法目前常用的有:超分辨方法SR和多分辨率臉?lè)椒∕RF。SR方法能通過(guò)低分辨率的圖像估計(jì)出高分辨的圖像。MRF方法具有計(jì)算復(fù)雜和存儲(chǔ)空間高的要求。
由于ATM 機(jī)視頻中待識(shí)別者姿態(tài)變化比較大,現(xiàn)采用快速稀疏描述方法實(shí)現(xiàn)多圖像匹配得分層融合的方案。首先利用Viola 提出的運(yùn)用人臉Haar-like[5]特征并基于AdaBoost[6]訓(xùn)練的級(jí)聯(lián)人臉檢測(cè)方法完成人臉檢測(cè)的基礎(chǔ)上,我們把檢測(cè)出的圖像即待識(shí)別的人臉圖像歸一化為與訓(xùn)練樣本同尺寸(70*100)的灰度圖像。然后利用快速稀疏描述方法處理從視頻中隔幀提取圖像,最后利用融合算法將同一用戶的多張圖像處理結(jié)果融合的方法,實(shí)現(xiàn)基于視頻的人臉識(shí)別。
采用的技術(shù)方案如圖1所示。
圖1 技術(shù)方案流程圖
為了減少視頻圖像中動(dòng)態(tài)不穩(wěn)定性,采用廣泛認(rèn)可的AdaBoost 算法,提取圖像中穩(wěn)定特征。采用快速稀疏描述方法,將對(duì)單張圖像進(jìn)行人臉識(shí)別[7]。最后實(shí)現(xiàn)對(duì)同一用戶的不同人臉圖像的識(shí)別結(jié)果進(jìn)行匹配分層融合。具體步驟如下所述:
遞歸計(jì)算s(x,y)=s(x,y-I),ii(x,y)=ii(x-I,y),其中s(x,-I)=0,ii(-I,y)=0。
每個(gè)分類器都只使用一種特征進(jìn)行訓(xùn)練。那么對(duì)于該特征的誤
差ei可以這么衡量:ei=∑iwi|hj(xi)-yi|(j表示的是某個(gè)特征的索引,而i表示的是所有的所有的窗口) 。選擇擁有最低誤差的那個(gè)分類器記為ht。
Step4:采用快速稀疏描述方法實(shí)現(xiàn)人臉檢測(cè)。快速稀疏算法的核心思想是將整體樣本通過(guò)K近鄰確定訓(xùn)練樣本數(shù)量;線性組合K近鄰確定的訓(xùn)練樣本進(jìn)而分類測(cè)試。假設(shè)xip表示第i個(gè)用戶的第p幀圖,apk表示訓(xùn)練樣本yk在描述測(cè)試樣本xip的線性組合中的相應(yīng)系數(shù)。假設(shè)第i個(gè)用戶的p個(gè)測(cè)試樣本的所有訓(xùn)練樣本的線性組合分別為:
(1)
(2)
為了更好地測(cè)試基于視頻的人臉識(shí)別算法的性能,本實(shí)驗(yàn)采用兩個(gè)圖像庫(kù)一個(gè)靜態(tài)人臉圖像庫(kù),另一個(gè)是視頻人臉數(shù)據(jù)庫(kù)即動(dòng)態(tài)人臉庫(kù)。靜態(tài)人臉圖像庫(kù)從ATM監(jiān)控視頻中得到。從視頻中檢測(cè)出人臉后,將其歸一化為同樣的尺寸。人臉視頻庫(kù)是從真實(shí)視頻中截取的若干視頻片斷的集合,模擬實(shí)際環(huán)境。圖2是靜態(tài)圖像庫(kù)的部分截圖。
圖2 靜態(tài)圖像庫(kù)樣例
(1)靜態(tài)圖像庫(kù)測(cè)試。為測(cè)試技術(shù)方案中人臉識(shí)別算法的性能,使用靜態(tài)圖像庫(kù)進(jìn)行單張測(cè)試。統(tǒng)計(jì)識(shí)別結(jié)果,獲取識(shí)別出的圖像數(shù)量,統(tǒng)計(jì)出識(shí)別的正確率和錯(cuò)誤率。分析技術(shù)方案中人臉識(shí)別算法的識(shí)別率。
測(cè)試庫(kù)和訓(xùn)練庫(kù)的構(gòu)造。選取不同年齡、不同性別和不同光照情況,不同的姿態(tài)、表情和動(dòng)作等圖片作為實(shí)驗(yàn)對(duì)象。從靜態(tài)圖像庫(kù)中抽取圖像數(shù)量大于或等于10 的人作為實(shí)驗(yàn)對(duì)象。從每個(gè)待識(shí)別對(duì)象的全部圖像中隨機(jī)抽取了20~30 張人臉圖像作為訓(xùn)練樣本,又從剩下的圖像中任取4張作為測(cè)試樣本。
測(cè)試結(jié)果統(tǒng)計(jì)。測(cè)試結(jié)果統(tǒng)計(jì)如表1所示。
表1 測(cè)試結(jié)果統(tǒng)計(jì)
其中:
通過(guò)對(duì)實(shí)驗(yàn)結(jié)果分析,技術(shù)方案的人臉識(shí)別算法具有不錯(cuò)的識(shí)別率。不同的樣本識(shí)別率不同。
(2)視頻庫(kù)仿真實(shí)驗(yàn)
通過(guò)模擬應(yīng)用環(huán)境,測(cè)試技術(shù)方案的綜合性能。從ATM視頻中選取多張圖像,構(gòu)造圖像序列模擬視頻,進(jìn)行識(shí)別以及結(jié)果融合等處理。最后通過(guò)統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果分析技術(shù)方案的性能。
測(cè)試庫(kù)和訓(xùn)練庫(kù)的構(gòu)造。從視頻庫(kù)中截取部分視頻,提取相鄰幀的圖像,經(jīng)過(guò)處理,選取20~60個(gè)待識(shí)別對(duì)象的圖像數(shù)量,把待識(shí)別對(duì)象一半的圖像作為測(cè)試樣本,后一半的圖像作為訓(xùn)練樣本,再?gòu)拿總€(gè)待識(shí)別對(duì)象的測(cè)試樣本中選擇6 張不同的圖像進(jìn)行測(cè)試。
測(cè)試結(jié)果統(tǒng)計(jì)。測(cè)試結(jié)果統(tǒng)計(jì)如表2所示。
表2 測(cè)試結(jié)果統(tǒng)計(jì)
其中:
在實(shí)驗(yàn)過(guò)程中,實(shí)驗(yàn)過(guò)程閾值定為0.75,如果最優(yōu)的人得分大于等于0.75,被認(rèn)為錯(cuò)誤識(shí)別,表示當(dāng)前測(cè)試圖像中沒(méi)有該人,反之,如果最優(yōu)的人得分小于0.75,被認(rèn)為正確識(shí)別,表示當(dāng)前測(cè)試圖像為該人,提高了識(shí)別率。
人臉識(shí)別是ATM機(jī)上監(jiān)控系統(tǒng)的關(guān)鍵技術(shù),采用人臉識(shí)別算法,將快速稀疏描述方法和人臉檢測(cè)算法AdaBoost 算法結(jié)合,在一定程度上解決了人臉識(shí)別過(guò)程中受光照影響、姿態(tài)變化影響和ATM機(jī)上攝像頭低分辨率的影響等問(wèn)題。結(jié)果表明文中采用的技術(shù)方案人臉識(shí)別算法具有不錯(cuò)的識(shí)別率。