劉航
1引言
隨著大數(shù)據(jù)技術(shù)的發(fā)展,人臉照片或視頻更易獲得及時(shí)存儲(chǔ),有攻擊者用獲得的人臉照片或視頻對(duì)人臉識(shí)別系統(tǒng)進(jìn)行攻擊。因此,人臉識(shí)別系統(tǒng)加入活體檢測(cè)技術(shù)極其重要。本文提出基于Haralick特征和HOG特征的人臉活體檢測(cè),由識(shí)別準(zhǔn)確率及ROC曲線得知達(dá)到了人臉活體檢測(cè)的效果。
2關(guān)鍵技術(shù)
(1)Haralick特征
(2)HOG特征
HOG特征提取分為3個(gè)步驟,首先歸一化彩色圖像,其次分割圖像為塊,將塊分割成小單元,每個(gè)單元由8×8像素組成,接著計(jì)算像素點(diǎn)的梯度值和方向,劃分為16個(gè)直方圖,最后級(jí)聯(lián)每個(gè)單元的直方圖特征,得到塊的直方圖特征,最后順序級(jí)聯(lián)每塊直方圖特征,得到整幅圖像的HOG特征。
3分類特征
(1)LDA分類器
LDA模型是由Blei等人在2003年提出的一種生成概率模型,起初用于文本建模領(lǐng)域,近年來(lái),也成功應(yīng)用于圖像聚類等領(lǐng)域。LDA模型的基本思路是文檔是主題的組合,而主題又是單詞的混合。LDA模型中是出現(xiàn)某個(gè)主題的概率,
是給定主題下某個(gè)單詞出現(xiàn)的概率,和都服從狄利克雷分布,他們的參數(shù)分別是和,表示選擇的某個(gè)主題,是文檔個(gè)數(shù),代表文檔庫(kù)中的文檔個(gè)數(shù),代表文檔中的單詞個(gè)數(shù)。LDA模型包含超參數(shù),可以通過(guò)Gibbs采樣進(jìn)行估算。
(2)KNN分類算法
3本文算法
本文提出基于Haralick和HOG特征的人臉活體檢測(cè)方法。首先讀取圖像,接著轉(zhuǎn)換為灰度圖像,由于圖像大小不同,因此統(tǒng)一調(diào)整圖片到(128,128)像素大小,接著分別提取Haralick和HOG特征,得到的Haralick特征大小為(13),HOG特征大小為(3 200),然后融合Haralick和HOG特征,得到最終的特征,送入KNN分類算法和LDA分類器重進(jìn)行分類,并輸出分類結(jié)果,即判斷是真實(shí)人臉還是虛假人臉。
4實(shí)驗(yàn)分析
本文采用NUAA人臉欺騙數(shù)據(jù)庫(kù),包含15個(gè)拍照對(duì)象,每個(gè)對(duì)象采集約500張彩色圖片,大小為640×480像素。提出的算法在NUAA人臉欺騙數(shù)據(jù)庫(kù)上的準(zhǔn)確率和誤差。實(shí)驗(yàn)評(píng)估結(jié)果包含HTER,ROC曲線等,為了更加直觀,本文選擇ROC曲線衡量實(shí)驗(yàn)結(jié)果。ROC曲線是真正率(TPR)和假正率(FPR)關(guān)系的顯示,圖像越靠近左上角,效果越好。
本實(shí)驗(yàn)中LDA的分類效果好于KNN。由圖1可知,LDA的分類器算法更趨于左上角,因此分類效果更好,同時(shí)可以看出提出的算法達(dá)到了人臉活體檢測(cè)的要求。
5結(jié)束語(yǔ)
本文選擇從圖片中提取Haralick特征和HOG特征,接著融合特征送入LDA和KNN分類器分類,在本實(shí)驗(yàn)中,LDA分類效果好于KNN,由ROC曲線得知,實(shí)現(xiàn)了人臉活體檢測(cè)的效果。