基于最優(yōu)奇異值占比的融合特征人臉檢測

2022-12-08 13:15:16賈澎濤雷文華

西安科技大學學報 2022年6期

賈澎濤，雷文華，張婧

（西安科技大學計算機科學與技術學院，陜西西安 710054）

0 引言

信息安全的重要性隨著數(shù)字化時代的到來日益凸顯。在信息安全領域，如何快速準確獲取個人身份信息成為眾多學者的研究重點。人臉識別作為生物特征識別技術的一種，因其生物自然性、非接觸性等優(yōu)勢而被廣泛應用。人臉識別的關鍵技術是人臉檢測，人臉檢測技術中使用的人臉圖像是一種高維含噪數(shù)據(jù)，不利于提高人臉檢測的速率和準確率。因此，如何有效去噪且保留有效信息的前提下實現(xiàn)圖像降維壓縮，從而快速準確的定位到人臉區(qū)域，是人臉檢測研究領域急需攻克的關鍵技術難題[1-2]。

目前人臉圖像降維方法主要有線性降維方法和非線性降維方法，線性降維方法相比非線性降維方法思路比較簡單，時間復雜度較低，但是針對非線性關系的遠距離點存在降維后失真問題。線性降維方法中的線性判別法（LDA）存在過度擬合數(shù)據(jù)的現(xiàn)象，主成分分析法（PCA）的特征維度含義不夠清晰，忽略較小方差所包含的重要信息[3-4]。非線性降維方法中基于核函數(shù)的方法主要包含有核獨立成分分析（KICA）從樣本信號中提取同維數(shù)源信號，無法對含噪信息的樣本信號進行去噪降維，基于核主成分分析方法（KPCA）采用非線性映射函數(shù)將數(shù)據(jù)從低維映射到高維空間，獲取主元個數(shù)并計算非線性主成分[5-7]。非線性降維方法中基于特征值的方法有等距映射（ISOMAP）、局部線性嵌入（LLE）等，主要針對局部結(jié)構(gòu)進行降維，通過局部估算全局，如果數(shù)據(jù)之間存在較小差異性，會導致特征結(jié)果不具備代表性[8-9]。綜合來看，線性和非線性降維方法各有優(yōu)缺點，適用于不同的場景需求。線性降維方法更適用于對人臉檢測耗時有較高要求的應用場景。

奇異值分解（SVD）作為線性降維方法的一種，可降低圖像數(shù)據(jù)維度并有效提取圖像特征。早在1992年洪子泉、楊靜宇采用SVD方法抽取圖像特征，并提出圖像奇異值可以作為圖像的能量信息，其特征具有旋轉(zhuǎn)不變性、比例不變性、穩(wěn)定性等[10-12]。目前采用SVD對圖像進行降維，首先擬定奇異值個數(shù)，根據(jù)奇異值個數(shù)對圖像實現(xiàn)降維，奇異值個數(shù)k的選取存在很大的隨機性，不能保證在保留有效特征的前提下，對人臉圖像實現(xiàn)降維重構(gòu)。因此，如何量化k值，針對不同的人臉圖像自適應確定較優(yōu)值，在較優(yōu)壓縮率和圖像識別的準確率之間找準均衡點顯得尤為重要。

基于降維預處理的圖像，進行人臉圖像檢測。近年來主要用于人臉檢測的方法有基于隱馬爾可夫的檢測方法、基于神經(jīng)網(wǎng)絡的檢測方法[13-15]、基于小波變換的檢測方法等[16]，這些方法所耗費的時間較長，空間復雜度較高。相比較而言，基于哈爾（Haar）和梯度方向直方圖（HOG）特征的人臉檢測方法較優(yōu)。Haar特征最早是由VIOLA和JONE提出的，其檢查速率較快[17]。HOG特征算法是由DALAL教授提出的，該方法的運行速率相比Haar較低，但檢測率較高[18]。

為了有效提高人臉檢測速率和準確率，筆者提出基于最優(yōu)奇異值占比的融合特征人臉檢測模型ProSVD-HH（Proportion Singular Values Decomposition-Haar HOG）。對人臉圖像實現(xiàn)降維的基礎上，根據(jù)人臉檢測效果擇優(yōu)選取最優(yōu)奇異值占比值，根據(jù)集成分類思想融合Haar和HOG特征人臉檢測方法建立更高效人臉檢測模型。

1 ProSVD-HH人臉檢測方法

1.1 最優(yōu)奇異值占比原理

SVD是線性代數(shù)中的一種高效的矩陣分解變換方法，可將任意類型的矩陣分解為左、右奇異矩陣和奇異值矩陣。奇異值分解描述如下[19-20]。

定義1：假設有一個m×n階（m

（1）

式中U和V是一個正交實矩陣，奇異值矩陣∑m×n是一個對角陣，可表示為

∑m×n=diag[σ1,σ2,…,σm]

奇異值矩陣中，對角線上的元素σ稱為矩陣A的奇異值[21-22]。

定義2：奇異值分解方法對圖像進行特征提取，奇異值占比θ定義為k個奇異值之和與全部奇異值之和的比值。奇異值占比θ作為奇異值σ的函數(shù)，可表示如下。

（2）

例如：用于人臉檢測的人臉圖像如圖1所示。

圖1 人臉圖像示例Fig.1 Face image samples

對圖1（a）、圖1（b）進行SVD圖像分解處理后獲取92個奇異值，圖1（c）、圖1（d）有250個奇異值。針對圖1（a）展開深入分析，從92個奇異值中選取前27個奇異值對人臉圖像實現(xiàn)降維重構(gòu)，重構(gòu)結(jié)果如圖2所示，可以看出奇異值個數(shù)越多，重構(gòu)人臉圖像越高清。

圖2 選取不同奇異值重構(gòu)后的人臉圖像Fig.2 Reconstructed face images with different singular values

在圖1（a）中92個奇異值中前27個奇異值之和占總量的90%，可表示為

同理，在圖1（b）中需32個奇異值，在圖1（c）中需27個奇異值，在圖1（d）中需30個奇異值。因此，選取相同的奇異值個數(shù)不能確保每幅圖像表達足夠的信息量，采用最優(yōu)奇異值占比的概念進一步量化分解圖像，實現(xiàn)更高效的降維重構(gòu)。

定義3：設f（θ）為人臉檢測率，檢測率差ω定義為前i個與前i+1個奇異值占比下人臉檢測結(jié)果的差值，檢測率f（θ）和檢測率差值ω的函數(shù)關系見式（3）。

ω=f（θi+1）-f（θi）=f（p（σi+1）-f（p（σi））,

（i=1,2,…,m）,ω≤ε

（3）

當檢測率差值ε大于等于檢測率差ω時，當前的奇異值占比θ值確定為最優(yōu)奇異值占比值。

1.2 Haar和HOG方法

1.2.1 Haar方法

Haar特征檢測方法主要反映出圖像局部梯度變化的趨勢，采用矩形特征對目標進行檢測[23]。通過LIENHART等不斷研究，矩形特征種類增加為16種，分為邊緣特征、線性特征、中心特征3類[24]，如圖3所示。

圖3 Haar矩形特征集Fig.3 Haar rectangular feature set

基于Haar特征的人臉檢測方法的主要任務是收集正負樣本并訓練分類器，分類器的分類效果取決于樣本質(zhì)量?？蓪腥四樀那逦鷪D像作為正樣本，無人臉的圖像作為負樣本?；贖aar特征檢測方法檢測速率較高，但檢測準確率較低。

1.2.2 HOG方法

HOG特征檢測方法主要獲取圖像局部的梯度方向和幅值，通過局部圖像的梯度方向直方圖特征對目標進行檢測[25]。基于HOG特征的人臉檢測方法主要思想是：將圖像局部單元得到的梯度方向直方圖數(shù)據(jù)串接起來組成一個Block的特征，再將全部Block串聯(lián)起來組合為該圖像的特征圖，根據(jù)HOG特征圖進行人臉檢測。基于HOG檢測方法的檢測準確率較高，但檢測速率較低。

1.3 融合Haar特征和HOG特征的人臉檢測

為改進Haar和HOG特征人臉檢測方法的性能，筆者提出ProSVD-HH人臉檢測模型，模型結(jié)構(gòu)如圖4所示。該模型分為2部分：第1部分對人臉圖像實現(xiàn)重構(gòu)，采用最優(yōu)奇異值占比方法對人臉圖像進行降維、重構(gòu)；第2部分實現(xiàn)更加高效的人臉檢測，采用基于Haar和HOG特征的人臉檢測方法的構(gòu)建串行集成分類器，首先利用檢測速率較快的Haar檢測器進行人臉檢測，若未檢測成功，將調(diào)用檢測準確率較高的基于HOG檢測器實現(xiàn)加強型人臉檢測，以此提高人臉檢測的準確率。

圖4 ProSVD-HH人臉檢測模型Fig.4 Model of ProSVD-HH face detection

ProSVD-HH方法的人臉檢測流程如圖5所示。

圖5 ProSVD-HH人臉檢測流程Fig.5 Process of ProSVD-HH face detection

2 實驗結(jié)果與分析

2.1 實驗數(shù)據(jù)集

為驗證ProSVD-HH方法的有效性，采用人臉庫ORL（Olivetti Research Laboratory）作為實驗數(shù)據(jù)集。該數(shù)據(jù)庫是由英國劍橋大學提供，包含40個不同種族、性別、年齡的對象，每個人物對象包含不同角度、表情和姿態(tài)的10幅灰度圖像，ORL數(shù)據(jù)集總大小為4 024 KB，包含有400幅灰度級為256的人臉圖像，每幅圖像像素大小為112×92，數(shù)據(jù)庫部分人臉圖像如圖6所示。

圖6 數(shù)據(jù)庫的部分人臉圖像Fig.6 Partial face images of the database

2.2 實驗步驟

應用ProSVD-HH方法進行人臉檢測的實驗步驟有

1）人臉圖像特征提取。在不同的奇異值占比下對人臉圖像進行SVD分解，實現(xiàn)降維重構(gòu)。

2）獲取最優(yōu)奇異值占比值θ。在不同的奇異值占比下，通過對比基于HOG，Haar特征人臉檢測結(jié)果與設定的閾值檢測率差ω獲取最優(yōu)值。

3）構(gòu)建ProSVD-HH人臉檢測模型?；诩煞诸愃枷耄诤?種人臉檢測方法實現(xiàn)高效人臉檢測，并驗證ProSVD-HH方法的可靠性。

2.3 最優(yōu)奇異值占比的確定

在不同奇異值占比下，基于Haar，HOG特征人臉檢測方法的檢測率見表1，根據(jù)實驗結(jié)果可以得出奇異值占比越高人臉圖像的壓縮率越低，奇異值占比是影響人臉檢測率的關鍵因素?；?種人臉檢測方法，檢測率f（θ）與奇異值占比θ的對比結(jié)果如圖7（a）所示，檢測率差ω與奇異值占比θ的對比結(jié)果如圖7（b）所示。

從圖7（a）可以得出，人臉檢測率隨著奇異值占比的增大而增高；從圖7（b）可以得出，隨著奇異值占比提高，前后檢測率差值明顯降低。為獲取最優(yōu)奇異值占比，設定式（3）閾值ε為0.005，圖7的標記處滿足前后檢測率差同時不大于閾值ε，綜合考慮人臉檢測率和空間復雜度，標記處表現(xiàn)較優(yōu)，此處為最優(yōu)奇異值占比值為98%?；谧顑?yōu)奇異值占比，ORL數(shù)據(jù)集的大小由4 024 KB縮小為865 KB，有效降低了人臉檢測的空間復雜度。

表1 不同奇異值占比人臉檢測結(jié)果分析

圖7 人臉檢測率和檢測率差對比結(jié)果Fig.7 Comparison results of face detection rates and difference between face detection rates

2.4 不同方法的人臉檢測結(jié)果與分析

采用不同的人臉檢測方法，基于最優(yōu)奇異值占比的人臉檢測結(jié)果見表2，部分檢測效果如圖8所示。從表2可以看出，ProSVD-HH方法的檢測準確率較高，相比于HOG特征、LBP特征和Haar特征的人臉檢測方法提高了2%,17%和10%，相比基于CNN檢測方法檢測率降低了0.5%；根據(jù)檢測耗時情況來看，基于CNN的人臉檢測方法時間復雜度最高，ProSVD-HH方法相比HOG，CNN檢測方法其檢測速率分別提高了14.6%，99.2%。綜合來看，ProSVD-HH方法人臉檢測率較高的同時檢測速率較快，取得了較好的人臉檢測效果。

表2 人臉檢測率和耗時實驗結(jié)果

圖8 不同方法的部分檢測結(jié)果Fig.8 Partial test results of different methods

3 結(jié) 論

1）提出最優(yōu)奇異值占比的概念，基于最優(yōu)奇異值占比對人臉圖像進行重構(gòu)，有效降低人臉檢測的空間復雜度。

2）基于集成分類的思想，綜合Haar和HOG算法的優(yōu)勢，提出了融合Haar和HOG特征的人臉檢測模型（ProSVD-HH）。對比其他檢測方法，ProSVD-HH在檢測率較高的同時耗時較短，取得較好的人臉檢測效果。

3）ProSVD-HH人臉檢測效果較好，但檢測速率還有待進一步提升。下一步的研究重點是在此基礎上，構(gòu)建高性能的人臉識別模型，有效提高算法的運行效率。