賈澎濤,雷文華,張 婧
(西安科技大學 計算機科學與技術學院,陜西 西安 710054)
信息安全的重要性隨著數(shù)字化時代的到來日益凸顯。在信息安全領域,如何快速準確獲取個人身份信息成為眾多學者的研究重點。人臉識別作為生物特征識別技術的一種,因其生物自然性、非接觸性等優(yōu)勢而被廣泛應用。人臉識別的關鍵技術是人臉檢測,人臉檢測技術中使用的人臉圖像是一種高維含噪數(shù)據(jù),不利于提高人臉檢測的速率和準確率。因此,如何有效去噪且保留有效信息的前提下實現(xiàn)圖像降維壓縮,從而快速準確的定位到人臉區(qū)域,是人臉檢測研究領域急需攻克的關鍵技術難題[1-2]。
目前人臉圖像降維方法主要有線性降維方法和非線性降維方法,線性降維方法相比非線性降維方法思路比較簡單,時間復雜度較低,但是針對非線性關系的遠距離點存在降維后失真問題。線性降維方法中的線性判別法(LDA)存在過度擬合數(shù)據(jù)的現(xiàn)象,主成分分析法(PCA)的特征維度含義不夠清晰,忽略較小方差所包含的重要信息[3-4]。非線性降維方法中基于核函數(shù)的方法主要包含有核獨立成分分析(KICA)從樣本信號中提取同維數(shù)源信號,無法對含噪信息的樣本信號進行去噪降維,基于核主成分分析方法(KPCA)采用非線性映射函數(shù)將數(shù)據(jù)從低維映射到高維空間,獲取主元個數(shù)并計算非線性主成分[5-7]。非線性降維方法中基于特征值的方法有等距映射(ISOMAP)、局部線性嵌入(LLE)等,主要針對局部結(jié)構(gòu)進行降維,通過局部估算全局,如果數(shù)據(jù)之間存在較小差異性,會導致特征結(jié)果不具備代表性[8-9]。綜合來看,線性和非線性降維方法各有優(yōu)缺點,適用于不同的場景需求。線性降維方法更適用于對人臉檢測耗時有較高要求的應用場景。
奇異值分解(SVD)作為線性降維方法的一種,可降低圖像數(shù)據(jù)維度并有效提取圖像特征。早在1992年洪子泉、楊靜宇采用SVD方法抽取圖像特征,并提出圖像奇異值可以作為圖像的能量信息,其特征具有旋轉(zhuǎn)不變性、比例不變性、穩(wěn)定性等[10-12]。目前采用SVD對圖像進行降維,首先擬定奇異值個數(shù),根據(jù)奇異值個數(shù)對圖像實現(xiàn)降維,奇異值個數(shù)k的選取存在很大的隨機性,不能保證在保留有效特征的前提下,對人臉圖像實現(xiàn)降維重構(gòu)。因此,如何量化k值,針對不同的人臉圖像自適應確定較優(yōu)值,在較優(yōu)壓縮率和圖像識別的準確率之間找準均衡點顯得尤為重要。
基于降維預處理的圖像,進行人臉圖像檢測。近年來主要用于人臉檢測的方法有基于隱馬爾可夫的檢測方法、基于神經(jīng)網(wǎng)絡的檢測方法[13-15]、基于小波變換的檢測方法等[16],這些方法所耗費的時間較長,空間復雜度較高。相比較而言,基于哈爾(Haar)和梯度方向直方圖(HOG)特征的人臉檢測方法較優(yōu)。Haar特征最早是由VIOLA和JONE提出的,其檢查速率較快[17]。HOG特征算法是由DALAL教授提出的,該方法的運行速率相比Haar較低,但檢測率較高[18]。
為了有效提高人臉檢測速率和準確率,筆者提出基于最優(yōu)奇異值占比的融合特征人臉檢測模型ProSVD-HH(Proportion Singular Values Decomposition-Haar HOG)。對人臉圖像實現(xiàn)降維的基礎上,根據(jù)人臉檢測效果擇優(yōu)選取最優(yōu)奇異值占比值,根據(jù)集成分類思想融合Haar和HOG特征人臉檢測方法建立更高效人臉檢測模型。
SVD是線性代數(shù)中的一種高效的矩陣分解變換方法,可將任意類型的矩陣分解為左、右奇異矩陣和奇異值矩陣。奇異值分解描述如下[19-20]。
定義1:假設有一個m×n階(m (1) 式中U和V是一個正交實矩陣,奇異值矩陣∑m×n是一個對角陣,可表示為 ∑m×n=diag[σ1,σ2,…,σm] 奇異值矩陣中,對角線上的元素σ稱為矩陣A的奇異值[21-22]。 定義2:奇異值分解方法對圖像進行特征提取,奇異值占比θ定義為k個奇異值之和與全部奇異值之和的比值。奇異值占比θ作為奇異值σ的函數(shù),可表示如下。 (2) 例如:用于人臉檢測的人臉圖像如圖1所示。 圖1 人臉圖像示例Fig.1 Face image samples 對圖1(a)、圖1(b)進行SVD圖像分解處理后獲取92個奇異值,圖1(c)、圖1(d)有250個奇異值。針對圖1(a)展開深入分析,從92個奇異值中選取前27個奇異值對人臉圖像實現(xiàn)降維重構(gòu),重構(gòu)結(jié)果如圖2所示,可以看出奇異值個數(shù)越多,重構(gòu)人臉圖像越高清。 圖2 選取不同奇異值重構(gòu)后的人臉圖像Fig.2 Reconstructed face images with different singular values 在圖1(a)中92個奇異值中前27個奇異值之和占總量的90%,可表示為 同理,在圖1(b)中需32個奇異值,在圖1(c)中需27個奇異值,在圖1(d)中需30個奇異值。因此,選取相同的奇異值個數(shù)不能確保每幅圖像表達足夠的信息量,采用最優(yōu)奇異值占比的概念進一步量化分解圖像,實現(xiàn)更高效的降維重構(gòu)。 定義3:設f(θ)為人臉檢測率,檢測率差ω定義為前i個與前i+1個奇異值占比下人臉檢測結(jié)果的差值,檢測率f(θ)和檢測率差值ω的函數(shù)關系見式(3)。 ω=f(θi+1)-f(θi)=f(p(σi+1)-f(p(σi)), (i=1,2,…,m),ω≤ε (3) 當檢測率差值ε大于等于檢測率差ω時,當前的奇異值占比θ值確定為最優(yōu)奇異值占比值。 1.2.1 Haar方法 Haar特征檢測方法主要反映出圖像局部梯度變化的趨勢,采用矩形特征對目標進行檢測[23]。通過LIENHART等不斷研究,矩形特征種類增加為16種,分為邊緣特征、線性特征、中心特征3類[24],如圖3所示。 圖3 Haar矩形特征集Fig.3 Haar rectangular feature set 基于Haar特征的人臉檢測方法的主要任務是收集正負樣本并訓練分類器,分類器的分類效果取決于樣本質(zhì)量??蓪腥四樀那逦鷪D像作為正樣本,無人臉的圖像作為負樣本?;贖aar特征檢測方法檢測速率較高,但檢測準確率較低。 1.2.2 HOG方法 HOG特征檢測方法主要獲取圖像局部的梯度方向和幅值,通過局部圖像的梯度方向直方圖特征對目標進行檢測[25]。基于HOG特征的人臉檢測方法主要思想是:將圖像局部單元得到的梯度方向直方圖數(shù)據(jù)串接起來組成一個Block的特征,再將全部Block串聯(lián)起來組合為該圖像的特征圖,根據(jù)HOG特征圖進行人臉檢測。基于HOG檢測方法的檢測準確率較高,但檢測速率較低。 為改進Haar和HOG特征人臉檢測方法的性能,筆者提出ProSVD-HH人臉檢測模型,模型結(jié)構(gòu)如圖4所示。該模型分為2部分:第1部分對人臉圖像實現(xiàn)重構(gòu),采用最優(yōu)奇異值占比方法對人臉圖像進行降維、重構(gòu);第2部分實現(xiàn)更加高效的人臉檢測,采用基于Haar和HOG特征的人臉檢測方法的構(gòu)建串行集成分類器,首先利用檢測速率較快的Haar檢測器進行人臉檢測,若未檢測成功,將調(diào)用檢測準確率較高的基于HOG檢測器實現(xiàn)加強型人臉檢測,以此提高人臉檢測的準確率。 圖4 ProSVD-HH人臉檢測模型Fig.4 Model of ProSVD-HH face detection ProSVD-HH方法的人臉檢測流程如圖5所示。 圖5 ProSVD-HH人臉檢測流程Fig.5 Process of ProSVD-HH face detection 為驗證ProSVD-HH方法的有效性,采用人臉庫ORL(Olivetti Research Laboratory)作為實驗數(shù)據(jù)集。該數(shù)據(jù)庫是由英國劍橋大學提供,包含40個不同種族、性別、年齡的對象,每個人物對象包含不同角度、表情和姿態(tài)的10幅灰度圖像,ORL數(shù)據(jù)集總大小為4 024 KB,包含有400幅灰度級為256的人臉圖像,每幅圖像像素大小為112×92,數(shù)據(jù)庫部分人臉圖像如圖6所示。 圖6 數(shù)據(jù)庫的部分人臉圖像Fig.6 Partial face images of the database 應用ProSVD-HH方法進行人臉檢測的實驗步驟有 1)人臉圖像特征提取。在不同的奇異值占比下對人臉圖像進行SVD分解,實現(xiàn)降維重構(gòu)。 2)獲取最優(yōu)奇異值占比值θ。在不同的奇異值占比下,通過對比基于HOG,Haar特征人臉檢測結(jié)果與設定的閾值檢測率差ω獲取最優(yōu)值。 3)構(gòu)建ProSVD-HH人臉檢測模型?;诩煞诸愃枷耄诤?種人臉檢測方法實現(xiàn)高效人臉檢測,并驗證ProSVD-HH方法的可靠性。 在不同奇異值占比下,基于Haar,HOG特征人臉檢測方法的檢測率見表1,根據(jù)實驗結(jié)果可以得出奇異值占比越高人臉圖像的壓縮率越低,奇異值占比是影響人臉檢測率的關鍵因素?;?種人臉檢測方法,檢測率f(θ)與奇異值占比θ的對比結(jié)果如圖7(a)所示,檢測率差ω與奇異值占比θ的對比結(jié)果如圖7(b)所示。 從圖7(a)可以得出,人臉檢測率隨著奇異值占比的增大而增高;從圖7(b)可以得出,隨著奇異值占比提高,前后檢測率差值明顯降低。為獲取最優(yōu)奇異值占比,設定式(3)閾值ε為0.005,圖7的標記處滿足前后檢測率差同時不大于閾值ε,綜合考慮人臉檢測率和空間復雜度,標記處表現(xiàn)較優(yōu),此處為最優(yōu)奇異值占比值為98%?;谧顑?yōu)奇異值占比,ORL數(shù)據(jù)集的大小由4 024 KB縮小為865 KB,有效降低了人臉檢測的空間復雜度。 表1 不同奇異值占比人臉檢測結(jié)果分析 圖7 人臉檢測率和檢測率差對比結(jié)果Fig.7 Comparison results of face detection rates and difference between face detection rates 采用不同的人臉檢測方法,基于最優(yōu)奇異值占比的人臉檢測結(jié)果見表2,部分檢測效果如圖8所示。從表2可以看出,ProSVD-HH方法的檢測準確率較高,相比于HOG特征、LBP特征和Haar特征的人臉檢測方法提高了2%,17%和10%,相比基于CNN檢測方法檢測率降低了0.5%;根據(jù)檢測耗時情況來看,基于CNN的人臉檢測方法時間復雜度最高,ProSVD-HH方法相比HOG,CNN檢測方法其檢測速率分別提高了14.6%,99.2%。綜合來看,ProSVD-HH方法人臉檢測率較高的同時檢測速率較快,取得了較好的人臉檢測效果。 表2 人臉檢測率和耗時實驗結(jié)果 圖8 不同方法的部分檢測結(jié)果Fig.8 Partial test results of different methods 1)提出最優(yōu)奇異值占比的概念,基于最優(yōu)奇異值占比對人臉圖像進行重構(gòu),有效降低人臉檢測的空間復雜度。 2)基于集成分類的思想,綜合Haar和HOG算法的優(yōu)勢,提出了融合Haar和HOG特征的人臉檢測模型(ProSVD-HH)。對比其他檢測方法,ProSVD-HH在檢測率較高的同時耗時較短,取得較好的人臉檢測效果。 3)ProSVD-HH人臉檢測效果較好,但檢測速率還有待進一步提升。下一步的研究重點是在此基礎上,構(gòu)建高性能的人臉識別模型,有效提高算法的運行效率。1.2 Haar和HOG方法
1.3 融合Haar特征和HOG特征的人臉檢測
2 實驗結(jié)果與分析
2.1 實驗數(shù)據(jù)集
2.2 實驗步驟
2.3 最優(yōu)奇異值占比的確定
2.4 不同方法的人臉檢測結(jié)果與分析
3 結(jié) 論