孫 玥,楊國(guó)為,2
1(青島大學(xué) 電子信息學(xué)院,山東 青島 266071)
2(南京審計(jì)大學(xué) 信息工程學(xué)院,南京 210000)
E-mail:yue_er94@163.com
在通過(guò)生物特征對(duì)人臉認(rèn)證識(shí)別時(shí),往往需要引入合適拒識(shí)機(jī)制[1-3],以便分類(lèi)器工作時(shí),要么拒識(shí),要么分類(lèi)絕對(duì)正確.也即要求:1)拒識(shí)率(在公共測(cè)試樣本庫(kù)中,拒識(shí)的樣本個(gè)數(shù)與測(cè)試樣本庫(kù)的總樣本個(gè)數(shù)之比)很小;2)正確識(shí)別率(在去掉拒識(shí)的樣本之后的測(cè)試樣本庫(kù)中,正確分類(lèi)樣本個(gè)數(shù)與總樣本數(shù)的比例)逼近100%.若拒識(shí)率較大,則分類(lèi)器的實(shí)用范圍和場(chǎng)合受到限制.若正確識(shí)別率不能逼近100%,則不能直接用該識(shí)別器去認(rèn)證一些特別重要場(chǎng)合.顯然拒識(shí)率小與正確識(shí)別率高是矛盾事件,解決該矛盾十分困難.
要做到拒識(shí)率小、正確識(shí)別率高實(shí)際上就是要設(shè)計(jì)識(shí)別器,使該識(shí)別器確定的同w類(lèi)樣本的特征區(qū)域(把區(qū)域內(nèi)的任一點(diǎn)視為w類(lèi)樣本點(diǎn),而把區(qū)域之外點(diǎn)視為別的類(lèi)點(diǎn)或拒識(shí)點(diǎn))幾乎包含了w類(lèi)所有樣本點(diǎn)形成的實(shí)際特征區(qū)域(幾乎不損失自己領(lǐng)域),同時(shí)幾乎不侵占別的已知類(lèi)的特征區(qū)域和未知可能類(lèi)的特征區(qū)域.
系列有代表性超球支持向量機(jī)(超球SVM)分類(lèi)算法思想[4-7]是將所有特征向量映射到一個(gè)很高維的空間里,在這個(gè)空間里建立一個(gè)滿(mǎn)足某種約束的半徑最小超球面,超球面包裹幾乎所有同類(lèi)樣本點(diǎn).該超球面或同心超球面對(duì)應(yīng)的原始空間曲面就是分類(lèi)決策面.但是超球SVM分類(lèi)決策面包裹區(qū)域侵占了未知類(lèi)別的特征區(qū)域,即分類(lèi)決策面沒(méi)有緊密包裹同類(lèi)樣本實(shí)際特征區(qū)域.在以上超球SVM分類(lèi)器中也存在問(wèn)題:
1)沒(méi)有引入合適拒識(shí)機(jī)制:因?yàn)椴环奖愦_定恰當(dāng)?shù)木茏R(shí)區(qū)域,或者勉強(qiáng)確定了拒識(shí)區(qū)域,但并不一定帶來(lái)正確識(shí)別率提高;
2)分類(lèi)決策面包裹區(qū)域侵占未知類(lèi)的特征區(qū)域,有把未知類(lèi)錯(cuò)判為某已知類(lèi)的風(fēng)險(xiǎn),分類(lèi)器正確識(shí)別率不能逼近100%.
本文針對(duì)支持向量數(shù)據(jù)描述(Support Vector Data Description,SVDD)設(shè)計(jì)中存在的難題,提出了一種具有合適拒識(shí)機(jī)制的高正確識(shí)別率分類(lèi)器設(shè)計(jì)算法—基于同類(lèi)特征點(diǎn)集的同類(lèi)特征區(qū)域緊密包裹曲面的求解算法(Closely Enveloped Surface-Support Vector Data Description,CES-SVDD),設(shè)置了所有緊密包裹面之外的公共區(qū)域?yàn)榉诸?lèi)器的拒識(shí)區(qū)域,從而得到一種具有合適拒識(shí)機(jī)制的高正確識(shí)別率分類(lèi)器設(shè)計(jì)算法.
如圖1所示,二維平面內(nèi)中,有兩個(gè)區(qū)域,一個(gè)形如香蕉的區(qū)域,另一個(gè)區(qū)域是香蕉以外的小部分區(qū)域.對(duì)兩區(qū)域做采樣,香蕉區(qū)域采樣點(diǎn)用*號(hào)表示,采樣50個(gè),其他區(qū)域內(nèi)采樣點(diǎn)用+表示,采樣10個(gè),分布在香蕉周?chē)?在SVDD模型中,訓(xùn)練*號(hào)點(diǎn)集超球面,映射到原始空間得到一個(gè)如圖類(lèi)似圓.很明顯類(lèi)似圓包裹不緊密,之間有較大空隙,分類(lèi)決策曲面包裹的區(qū)域侵占了未知類(lèi)特征區(qū)域.
圖1 分類(lèi)決策結(jié)構(gòu)圖
圖2 坐標(biāo)示意圖
CES-SVDD算法由“同類(lèi)特征集合的緊密包裹集構(gòu)造算法”、“基于同類(lèi)特征點(diǎn)集和包裹點(diǎn)集的同類(lèi)特征區(qū)域緊密包裹曲面的求解算法”、“多類(lèi)分類(lèi)器的合適拒識(shí)區(qū)域設(shè)置算法”組成.
第二步由每一個(gè)Xj=(xj1,…,xji,…,xjN),1≤j≤M派生出2N個(gè)點(diǎn)(xj1,…,xji±ε,…,xjN),1≤i≤N.
由前面定理1可知,I(C)中點(diǎn)的個(gè)數(shù)不少于C的邊界點(diǎn)個(gè)數(shù).
圖3 緊密包裹曲面示意圖
為了方便設(shè)C中有m1個(gè)點(diǎn),I(C)中有m2=n-m1個(gè)點(diǎn),c是高維空間的球心.我們建立以下優(yōu)化模型,通過(guò)求解優(yōu)化解來(lái)構(gòu)造同類(lèi)特征區(qū)域緊密包裹曲面.
(1)
s.t.‖φ(Xi)-c‖2≤r2-ξi, 1≤i≤m1‖φ(Xi)-c‖2-r2-ρ2+ξj),m1≤j≤n,0≤ξk,1≤k≤n
(2)
Lagrange函數(shù)的極值點(diǎn)應(yīng)滿(mǎn)足:
(3)
(4)
(5)
(6)
(7)
因此:
(8)
這樣得對(duì)偶問(wèn)題模型:
(9)
用K(Xi,Xj)替代φ(Xi)·φ(Xj),由可核函數(shù)性質(zhì)知:
(10)
對(duì)偶問(wèn)題是一個(gè)二次優(yōu)化問(wèn)題,可用二次優(yōu)化問(wèn)題求解方法求解[11,12].本文用經(jīng)典的序貫最小優(yōu)化(sequential minimal optimization,簡(jiǎn)稱(chēng)SMO)算法來(lái)求解.
在求解以上問(wèn)題之后,為求出r、ρ2和r2+ρ2,考慮兩集合:
(11)
(12)
令n1=|S1|,n2=|S2|,由KKT條件[13]知:
(13)
其中:
P1=∑xi∈S1‖φ(Xi)-c‖2
(14)
P2=∑xj∈S2‖φ(Xi)-c‖2
(15)
(16)
分類(lèi)決策函數(shù)為:
f(x)=sgn(r2-‖φ(X)-c‖2)
(17)
分類(lèi)決策曲面為:
r2-‖φ(X)-c‖2
(18)
該曲面(曲面上點(diǎn)求解可用數(shù)值計(jì)算方法求近似解)緊密包裹同類(lèi)特征區(qū)域.特征區(qū)域邊界到分類(lèi)決策邊界的坐標(biāo)方向距離(投影長(zhǎng)度)小于ε.
當(dāng)人臉識(shí)別應(yīng)用于人身份認(rèn)證識(shí)別、銀行儲(chǔ)蓄認(rèn)證識(shí)別、門(mén)禁系統(tǒng)認(rèn)證識(shí)別等高正確識(shí)別率的任務(wù)時(shí),對(duì)于無(wú)法確定的情況的出現(xiàn),我們必須要設(shè)置一定的拒識(shí)機(jī)制,從而有效遏制不良情況的出現(xiàn).
(19)
和分類(lèi)決策緊密包裹曲面:
jr2-‖φ(X)-jc‖2
(20)
實(shí)驗(yàn)數(shù)據(jù)使用ORL人臉數(shù)據(jù)庫(kù)和擴(kuò)展Yale B人臉數(shù)據(jù)庫(kù),樣例如圖4和圖5所示.ORL面部庫(kù)存由40個(gè)人在一定的光線,表情(微笑,眨眼,閉眼等)和配件(眼鏡)組成,每個(gè)都有10個(gè)圖像.其中前五張為訓(xùn)練集,后五張為測(cè)試集.擴(kuò)展Yale B包含16128張照片,包括38人在9個(gè)姿勢(shì)和64個(gè)照明條件下拍攝的圖像.本實(shí)驗(yàn)選用到的數(shù)據(jù)為30人的每人50張圖像,其中前30張為訓(xùn)練集,后20張為測(cè)試集,未被選用到的是光照太弱的模糊不清的圖像,即用到的圖像總數(shù)為1500張,數(shù)據(jù)庫(kù)中的圖像數(shù)據(jù)都是手動(dòng)對(duì)齊、裁剪的,然后重新調(diào)整到168×192大小的圖像.
圖4 ORL數(shù)據(jù)庫(kù)樣例
預(yù)處理所獲取的面部圖像是面部識(shí)別中的重要步驟.其目的是減小外界環(huán)境對(duì)要識(shí)別的目標(biāo)圖像的干擾,并且使圖像達(dá)到標(biāo)準(zhǔn)化[14,15].通過(guò)預(yù)處理,可以最大限度的把干擾減到最小,并對(duì)人臉識(shí)別性能的穩(wěn)定性起到一定作用.
由于主成分分析(PCA)是基于圖像灰度統(tǒng)計(jì)的算法,因此需要對(duì)面部圖像進(jìn)行適當(dāng)?shù)念A(yù)處理.首先,需要將彩色圖像轉(zhuǎn)換為灰度圖像,然后通過(guò)直方圖均衡化方法對(duì)直方圖圖像進(jìn)行歸一化,有效地消除了噪聲對(duì)人臉圖像灰度分布的影響.預(yù)處理原始圖像可以有效地解決基于統(tǒng)計(jì)提取特征的外部干擾引起的圖像差異(如照明,照片角度等與臉部圖像本身(每個(gè)臉部的大小不同)之間的差異.
特征提取是將對(duì)分類(lèi)模式識(shí)別最有效的特征提取出來(lái),通過(guò)這一過(guò)程可以壓縮模式的維數(shù),使之便于處理,減少損失.
特征提取后的特征空間是為了分類(lèi)使用的,對(duì)于相同的物體在不同的分類(lèi)規(guī)則下,提取的特征必須滿(mǎn)足某些標(biāo)準(zhǔn)下的最小分類(lèi)誤差.在特診提取的同時(shí)刪除貢獻(xiàn)微弱的特征,已達(dá)到減少分類(lèi)錯(cuò)誤額目的.
圖5 Yale B數(shù)據(jù)庫(kù)樣例
特征面部方法使用主成分分析(PCA),也稱(chēng)為KL變換,并且通常用于面部圖像的表示和識(shí)別[16].主成分分析最早用于統(tǒng)計(jì)學(xué),用來(lái)找出某一集合的主要成分.對(duì)于L×L維的面部圖像,可以認(rèn)為它屬于圖像空間,并且該圖像空間可以被定義為所有尺寸L×L的一組像素矩陣.并且圖像空間中的基矢量的數(shù)量是L×L,并且L×L個(gè)基矢量被任意加權(quán)和組合.您可以在圖像空間中獲取任何圖像.假設(shè)像素的灰度級(jí)為8,則圖像空間中共有256 L× L個(gè)圖像,這其中人臉空間只占很小的一部分,因此,使用圖像空間的基矢量來(lái)表示面部空間顯然會(huì)帶來(lái)冗余,以減少冗余,最合適的方法是用人臉空間本身的基向量來(lái)表示人臉.在面部空間進(jìn)行KL變換以進(jìn)行訓(xùn)練,以獲得面部空間本身的基礎(chǔ)矢量.它被稱(chēng)為特征向量,也稱(chēng)為特征面,所有特征面的集合稱(chēng)為特征面空間.使用這些特征向量來(lái)表示面部空間大大減少了冗余.
圖6 部分特征臉
對(duì)于ORL人臉庫(kù)來(lái)說(shuō),對(duì)所截取的人臉圖像通過(guò)預(yù)處理后,PCA降維至20維,低維空間的圖像是40*5*20的矩陣,每條線代表一個(gè)主要組件面,每個(gè)面都有20維特征.對(duì)于擴(kuò)展Yale B數(shù)據(jù)庫(kù)來(lái)說(shuō),對(duì)人臉圖像通過(guò)預(yù)處理后,PCA降維至20維,低維空間的圖像是30*30*20的矩陣,部分特征臉如圖6所示.
剩余的尺寸減小的面可以由特征面線性地表示.在選擇要識(shí)別的面以降低維數(shù)然后將由這些基底(特征面)形成的矩陣相乘之后,可以獲得這些面在低維度上的線性表示.這些表示就是識(shí)別的依據(jù).
將CES-SVDD算法用于人臉識(shí)別工作,并與最初的SVDD作對(duì)比,以此驗(yàn)證算法的有效性.對(duì)于ORL數(shù)據(jù)庫(kù)使用前5張作為訓(xùn)練集,共有200張圖片.使用矩陣表示200個(gè)映射,形成200*10304矩陣.后5張圖用來(lái)當(dāng)測(cè)試集,共有200張圖.對(duì)于擴(kuò)展Yale B數(shù)據(jù)庫(kù)來(lái)說(shuō),使用前30張作為訓(xùn)練集,共有900張圖片.使用矩陣表示900個(gè)映射,形成900*32256矩陣.后20張圖用來(lái)當(dāng)測(cè)試集,共有600張圖.
對(duì)兩個(gè)測(cè)試數(shù)據(jù)處理后,分別用SVDD和CES-SVDD進(jìn)行分類(lèi)識(shí)別,兩種方法各進(jìn)行5次實(shí)驗(yàn)后,結(jié)果如表1和表2所示,為了更加直觀的觀察實(shí)驗(yàn)結(jié)果,將5次實(shí)驗(yàn)結(jié)果生成折線圖,如圖7和圖8所示.其中,拒識(shí)率指在公共測(cè)試樣本庫(kù)中,拒識(shí)的樣本個(gè)數(shù)與測(cè)試樣本庫(kù)的總樣本個(gè)數(shù)之比;識(shí)別率指在去掉拒識(shí)的樣本之后的測(cè)試樣本庫(kù)中,正確分類(lèi)樣本個(gè)數(shù)與總樣本數(shù)的比例.
表1 ORL實(shí)驗(yàn)結(jié)果
Table 1 ORL experimental result
實(shí)驗(yàn)編號(hào)SVDD識(shí)別率%CES-SVDDCES-SVDD拒識(shí)率%識(shí)別率%1952.5100295.51.599.5391.52100492397.55980.599
表2 Yale B實(shí)驗(yàn)結(jié)果
Table 2 Yale B experimental result
實(shí)驗(yàn)編號(hào)SVDD識(shí)別率%CES-SVDDCES-SVDD拒識(shí)率%識(shí)別率% 190.2 3.399.8296.64.6100392.34.198.3491.22.399.1593.13.699.7
圖7 ORL實(shí)驗(yàn)結(jié)果
圖8 Yale B實(shí)驗(yàn)結(jié)果
由表1、表2可以看出,對(duì)于兩個(gè)數(shù)據(jù)庫(kù)來(lái)說(shuō),只要拒識(shí)率合適,識(shí)別準(zhǔn)確率都可以逼近100%,并且很明顯CES-SVDD的效果比沒(méi)有加緊密包裹集的SVDD的正確率高.
對(duì)于高識(shí)別率的識(shí)別器可以去認(rèn)證一些特別重要場(chǎng)合.比如公司考勤系統(tǒng),需要確保公司人員的高準(zhǔn)確率;銀行取款機(jī),在面臨大額交易下往往需要確保取款人員是否是本人,本文提出的識(shí)別方法在去除拒識(shí)圖片后識(shí)別率通常都會(huì)達(dá)到100%,可以用于這類(lèi)高要求的識(shí)別場(chǎng)合.效果如圖9所示.
圖9 識(shí)別效果
論文討論了通過(guò)生物特征對(duì)人臉認(rèn)證識(shí)別的高正確識(shí)別率分類(lèi)器設(shè)計(jì)要求,指出了現(xiàn)有一些超球SVM分類(lèi)器存在沒(méi)有合適拒識(shí)機(jī)制和正確識(shí)別率不能逼近100%等問(wèn)題.舉除了超球SVM分類(lèi)決策面不緊密包裹同類(lèi)特征的實(shí)例.證明了同類(lèi)特征集合的緊密包裹集的存在定理.提出了基于同類(lèi)特征集合和緊密包裹集的同類(lèi)特征區(qū)域緊密包裹面的求解算法.以O(shè)RL人臉庫(kù)和Yale B做對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)表明本文提出的分類(lèi)器設(shè)計(jì)算法是一種有效的高正確識(shí)別率分類(lèi)器設(shè)計(jì)方法.今后的方向主要是對(duì)于維度比較大模糊圖像的處理研究,爭(zhēng)取在降低拒識(shí)率的基礎(chǔ)上,提高識(shí)別的準(zhǔn)確率.