單祖輝
(滇西科技師范學(xué)院 智能與信息工程學(xué)院,云南 臨滄 677000)
信息安全保障對社會穩(wěn)定發(fā)展和個人生活隱私都有著重要意義[1-2]。身份鑒定是保證信息安全的重要途徑,在計算機(jī)技術(shù)不斷發(fā)展的今天,人臉識別是一種簡單、方便且高效的身份鑒定技術(shù)[3],許多學(xué)者對此進(jìn)行了探討和研究。
鄭雯雯等研究了光照變化對人臉識別的影響,從而提出一種減弱光照干擾的方法,以提高人臉識別的精度[4]。巫春玲等提出并設(shè)計了一種基于人臉識別的高??记谙到y(tǒng),通過人臉識別技術(shù)和自動化技術(shù)優(yōu)化學(xué)生考勤流程,解決了傳統(tǒng)的高校考勤簽到方式效率低且費(fèi)時費(fèi)力的問題[5]。文珊在介紹人臉識別技術(shù)的基礎(chǔ)上,討論了人臉識別技術(shù)在醫(yī)院支付領(lǐng)域的發(fā)展[6]。
可以看出,與人臉識別技術(shù)相關(guān)的研究成果很多,但上述的人臉識別技術(shù)仍存在著識別效率和準(zhǔn)確率低的問題。因此,研究結(jié)合MTLBP 算法、2DPCA 算法以及SIFT 算法構(gòu)建出一種人臉識別模型。相比于傳統(tǒng)的人臉識別技術(shù),該模型的識別準(zhǔn)確率和效率均更高。人臉識別技術(shù)的改進(jìn),能夠?yàn)樾畔踩峁└€(wěn)定的保障,也能為社會帶來巨大的經(jīng)濟(jì)效益。
要想進(jìn)行人臉識別,首先要進(jìn)行人臉檢測。一般而言,需要利用積分圖來計算圖像的Haar 特征值,采用相應(yīng)的Adaboost 模型對其進(jìn)行識別和訓(xùn)練。Haar 特征分為3 種類型,即邊緣特征、線性特征以及中心特征。Haar 特征在Adaboost 模型中的訓(xùn)練過程如圖1 所示。
圖1 Haar 特征在Adaboost 模型中的訓(xùn)練過程
如圖1 所示,Haar 特征主要是由黑白區(qū)域組成,能夠反映圖像的灰度變化。利用Haar 特征對Adaboost 模型進(jìn)行訓(xùn)練后,Adaboost 模型就能夠通過與訓(xùn)練結(jié)果的對比來識別圖像特征,并根據(jù)對比結(jié)果判斷圖像是否是人臉圖像。除了人臉圖像檢測以外,圖像的預(yù)處理也是人臉識別技術(shù)中的重要環(huán)節(jié)。這是因?yàn)樵诓杉瘓D像的過程中,因此存儲或操作處理不當(dāng),許多人臉圖像會出現(xiàn)一定的噪聲,進(jìn)而導(dǎo)致失真現(xiàn)象,因此需要對人臉圖像進(jìn)行濾波、銳化等預(yù)處理操作。首先是通過大小校正、旋轉(zhuǎn)、平移變換、翻轉(zhuǎn)等操作處理待識別的圖像,完成歸一化處理,方便后續(xù)對圖像的識別和判斷。
其次,是灰度變換。人臉圖像通常情況下都是彩色圖像,其像素點(diǎn)包含了RGB(Red Green Blue)三原色,在計算機(jī)中由3 個通道存儲,該通道被稱為RGB 通道。而在人臉識別的過程中,圖像需要將彩色圖像進(jìn)行灰度處理[7]。灰度圖像只包含亮度信息,不包含顏色信息。因此,在進(jìn)行灰度轉(zhuǎn)化時,將圖像的亮度值分為0~255 量級,并將RGB 通道的分量按照公式(1)計算到灰度圖像中。
將原始圖像的像素灰度值(gray-scale value,Gray)表示為D=f(x,y),經(jīng)處理后的圖像Gray 值為D′=g(x,y),則灰度變換的方式可采用公式(2)來進(jìn)行。
公式(3)中,[i,j]為某個像素點(diǎn),(i2+j2)為高斯函數(shù)的半徑,σ為標(biāo)準(zhǔn)方差。接下來完成直方圖的均衡化后,即可完成人臉圖像的預(yù)處理。
人臉的局部特征是指面部五官區(qū)域梯度、面部紋理以及其他面部特征,如疤痕、酒窩等。紋理是一種常見的視覺特征,紋理識別在計算機(jī)視覺技術(shù)中發(fā)揮著重要作用。局部二值模式(Local Binary Patterns,LBP)是應(yīng)用最廣泛、效果也比較優(yōu)秀的紋理描述手段。LBP 算子對特征值的提取過程可用公式(4)進(jìn)行表述。
公式(4)中,(xc,yc)表示識別局部的相鄰區(qū)域的中間核心點(diǎn)的像素,g c為識別局部的中間核心點(diǎn)像素的Gray 值;g p為識別局部的相鄰區(qū)域的中間核心點(diǎn)像素的Gray 值。s(x)的定義如公式(5)所示。
傳統(tǒng)的LBP 算子只能用固定的模式對局部特征進(jìn)行描述,因此具有一定的局限性,需要對其進(jìn)行改進(jìn)。為使LBP 能夠從多方面對局部特征進(jìn)行描述,研究提出一種MTLBP 算子,其符號函數(shù)如公式(6)所示。
式(6)中,Ti為設(shè)定的閾值。當(dāng)閾值不同時,在提取圖像特征時獲取的特征值也會有變化,進(jìn)而更加詳細(xì)地描述圖像的面部局部特征。SIFT 算法是用于圖像處理領(lǐng)域的一種描述。這種描述具有尺度不變性,可在圖像中檢測出關(guān)鍵點(diǎn),是一種局部特征描述子。利用SIFT 算法提取圖像的特征點(diǎn)時,首先需要構(gòu)造高斯尺度空間。對于一張人臉圖像I(x,y),其尺度空間可以用公式(7)來進(jìn)行計算。
式(7)中,σ表示高斯正態(tài)分布標(biāo)準(zhǔn)差,即尺度因子,能夠反映圖像的模糊程度;G(x,yσ)為高斯函數(shù)。利用差分高斯(Difference of Gaussina,DOG)可計算出特征點(diǎn)較好的算子高斯拉普拉斯(Laplacian of Gaussian,LoG)。對DOG 空間中的極值點(diǎn)進(jìn)行采樣和檢測,但這些極值點(diǎn)中存在著較多的無效點(diǎn),因此研究采用尺度空間DOG 函數(shù)優(yōu)化極值點(diǎn)的提取過程,去除無效或穩(wěn)定性差的極值點(diǎn),提高特征提取的準(zhǔn)確性。結(jié)合上述內(nèi)容,構(gòu)建SIFT-MTLBP 算法,即可實(shí)現(xiàn)面部圖像局部特征的高精度提取。
除了局部特征以外,人臉的全局特征也是人臉識別技術(shù)中的重要環(huán)節(jié),全局特征能夠反映人臉的全局屬性。PCA 是一種基于正交變換(Karhunen-Loeve Transform,K-L)的降維思想統(tǒng)計方法,因此能夠壓縮數(shù)據(jù)量并利用K-L 變換實(shí)現(xiàn)特征提取。PCA 算法能夠?qū)D像轉(zhuǎn)化為向量的形式映射在某個低維特征空間中,然后通過散射矩陣來提取人面部特征。基于PCA 算法的人臉識別流程如圖2 所示。
圖2 基于PCA 算法的人臉識別流程
PCA 算法是將像素矩陣轉(zhuǎn)換為向量形式,當(dāng)圖像過大,或者訓(xùn)練樣本較少時,難以準(zhǔn)確地評估特征向量,影響到后續(xù)的特征點(diǎn)提取,因此研究提出一種2DPCA 算法來進(jìn)行人臉特征的提取。通過2DPCA 算法,能夠推導(dǎo)出一組最優(yōu)投影向量,以用于人臉特征的提取。在獲取圖像特征矩陣之后,可采用K 最近鄰分類器對這些特征進(jìn)行分類。若通過2DPCA 算法獲取的投影空間中任意兩個圖像特征矩陣向量Bi= [Y1,Y2,…Yd]與Bj= [Y1,Y2,…Yd],則兩者間的距離計算方式見公式(8)。
通過公式(8),可獲取所有樣本特征矩陣之間的距離,實(shí)現(xiàn)人臉圖像的全局特征提取,進(jìn)而判定該特征矩陣是否屬于某個圖像。將基于SIFT-MTLBP 的面部圖像局部特征提取方法,與基于2DPCA 算法的全局特征提取方法相結(jié)合,能夠表達(dá)出人臉圖像的完整信息,進(jìn)而提高人臉識別的準(zhǔn)確率。將局部特征向量組與全局特征向量組相結(jié)合,即可獲取到人臉圖像的全部信息特征。不同人臉之間的距離表達(dá)計算方式如公式(9)。
式(9)中,φ是人臉圖像的全部信息特征向量,B為圖像的全局特征向量,v為圖像的局部特征向量。綜合上述內(nèi)容,構(gòu)建人臉識別模型。
為驗(yàn)證人臉識別模型的性能,研究分別采用ORL 數(shù)據(jù)庫中和Yale 數(shù)據(jù)庫中的人力圖像對人臉識別模型進(jìn)行訓(xùn)練和測試。為了避免圖像中噪聲等因素對特征提取的影響,研究對圖像進(jìn)行了預(yù)處理。利用相同的樣本對人臉識別模型進(jìn)行訓(xùn)練和測試,其中一次采用經(jīng)過預(yù)處理的樣本圖像,一次采用未處理的樣本圖像,兩次訓(xùn)練的過程如圖3 所示。
圖3 兩次訓(xùn)練結(jié)果
由圖3 能夠看出,在樣本經(jīng)過預(yù)處理后,人臉識別模型在訓(xùn)練57 s 后達(dá)到目標(biāo)精度;而樣本未經(jīng)預(yù)處理時,人臉識別模型在訓(xùn)練100 s 后仍未達(dá)到目標(biāo)精度。上述結(jié)果表明,對人臉圖像進(jìn)行預(yù)處理,能夠有效地提高人臉識別的效率和精度,節(jié)約時間成本。隨機(jī)選取一張圖像,利用研究提出的方法處理,處理結(jié)果如圖4 所示。
圖4 研究提出方法對圖像的處理結(jié)果
由圖4(a)能夠看出,在預(yù)處理前,圖像的直方圖較為密集,概率密度較高,對比度較低;由圖4(b)能夠看出,在經(jīng)過預(yù)處理后,圖像的概率密度更加均勻,對比度更好,能夠更加簡單地進(jìn)行特征點(diǎn)的提取與識別。
為驗(yàn)證研究提出的2DPCA 算法對人臉圖像全局特征的識別與提取效果,利用相同的樣本圖像對2DPCA 算法以及PCA 算法進(jìn)行訓(xùn)練。訓(xùn)練完成后,利用數(shù)據(jù)庫中3 個人的圖像對兩種算法進(jìn)行測試,測試結(jié)果見圖5。
圖5 2DPCA 算法的全局特征提取性能測試
由圖5 能夠看出,在3 張圖像的全局特征點(diǎn)提取和識別中,2DPCA 算法的識別特征點(diǎn)數(shù)量和識別特征點(diǎn)的準(zhǔn)確率均明顯高于PCA 算法。其中,2DPCA 算法的識別特征點(diǎn)的準(zhǔn)確率平均為82.32%;而PCA 算法的識別特征點(diǎn)的準(zhǔn)確率平均為68.11%,上述結(jié)果表明,研究提出的2DPCA 算法在人臉圖像特征識別方面具有更好的性能。
分別基于研究提出的SIFT-MTLBP-2DPCA算法、SIFT-MTLBP 算法、SIFT 算法,以及2DPCA算法構(gòu)建人臉識別模型、模型2、模型3、模型4,利用相同的預(yù)處理后的樣本對上述模型進(jìn)行訓(xùn)練和測試,測試結(jié)果取10 次結(jié)果的平均值。相同訓(xùn)練樣本數(shù)量訓(xùn)練后,幾種模型在ORL 數(shù)據(jù)庫的測試結(jié)果如表1 所示。
表1 幾種模型在ORL 數(shù)據(jù)庫的測試結(jié)果
由表1 能夠看出,基于SIFT-MTLBP-2DPCA算法的人臉識別模型的圖像識別錯誤數(shù)量為5個,比模型2 少37 個,比模型3、模型4 分別少77和80 個;基于SIFT-MTLBP-2DPCA 算法的人臉識別模型的圖像識別率為92.6%,明顯高于模型2、模型3 以及模型4。在識別時間方面,基于SIFT-MTLBP-2DPCA 算法的人臉識別模型的識別時間為1.12 s,略低于其他3 種模型,識別速度稍慢,但相比于其高識別準(zhǔn)確率和低識別錯誤,這一點(diǎn)缺陷可以忽略不計。幾種模型在Yale 數(shù)據(jù)庫的測試結(jié)果見表2 所示。
表2 幾種模型在Yale 數(shù)據(jù)庫的測試結(jié)果
由表2 能夠看出,基于SIFT-MTLBP-2DPCA 算法的人臉識別模型的識別準(zhǔn)確率明顯高于其它3種模型,達(dá)到了87.7%;圖像識別錯誤數(shù)量則明顯低于其他3 種模型;識別時間略長于其他3 種模型。綜上所述,研究提出的人臉識別模型擁有更高的識別準(zhǔn)確率和識別效率,失誤率更低,是一種值得推廣的方法。
人臉識別技術(shù)是一種較為先進(jìn)的身份驗(yàn)證技術(shù),在各個領(lǐng)域內(nèi)均發(fā)揮著重要作用。研究結(jié)合SIFT 算法和MTLBP 算法構(gòu)建SIFT-MTLBP 算法,以進(jìn)行人臉圖像的局部特征提取和識別。采用2DPCA 算法進(jìn)行人臉圖像的全局特征提取,并結(jié)合兩種方法,構(gòu)建人臉識別模型,以對人臉圖像的全部特征進(jìn)行提取和識別,提高人臉識別準(zhǔn)確率;采用人臉圖像數(shù)據(jù)庫對模型進(jìn)行測試,測試結(jié)果表明,預(yù)處理后,圖像的概率密度更加均勻,對比度更好,2DPCA 算法的識別特征點(diǎn)的準(zhǔn)確率平均為82.32%,比PCA 算法高14.21%,在ORL數(shù)據(jù)庫中,人臉識別模型的準(zhǔn)確率達(dá)到了92.6%??梢钥闯?,相比于其他幾種模型,人臉識別模型的準(zhǔn)確率很高,錯誤識別率很低,這表明提出的人臉識別方法的識別效果好,能夠?yàn)槠渌四樧R別研究提供一定的借鑒思路。研究在測試中采用的樣本數(shù)據(jù)庫數(shù)量較少,可能無法完全排除樣本差異帶來的影響,因此還需要在日后進(jìn)一步深入研究。