• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    結合小波與遞歸神經(jīng)網(wǎng)絡的低分辨率人臉識別

    2019-12-24 06:23:26歐陽寧王先傲蔡曉東林樂平
    西安電子科技大學學報 2019年6期
    關鍵詞:低分辨率小波人臉識別

    歐陽寧,王先傲,蔡曉東,林樂平

    (桂林電子科技大學信息與通信學院,廣西壯族自治區(qū)桂林541004)

    針對低分辨率人臉識別,傳統(tǒng)解決方法可分為兩種:一種是先進行超分辨率增強,然后提取特征進行識別,即兩階段方法;另一種是對低分辨率 (Low Resolution,LR) 圖像提取穩(wěn)健性特征,然后進行人臉特征比對,即直接識別。相比第1種方式,當分辨率極低時,提取的穩(wěn)健性特征難以有效提高人臉識別準確率。而近年來隨著深度學習的快速發(fā)展,圖像超分辨率重建取得了較大進展。文中采用第1種方式進行低分辨率人臉識別。

    首先,低分辨率人臉重建是為了從退化圖像中恢復出高分辨率(High Resolution,HR)清晰圖像。在圖像增強、圖像壓縮以及人臉識別方面有重要應用。與其他圖像復原的任務一樣,人臉重建是一個不適定的問題,即一張低分辨率圖像對應的高分辨率圖像,存在非常多的可能性。文獻[1]提出了一種基于卷積神經(jīng)網(wǎng)絡的圖像超分辨率方法(Super Resolution Convolutional Neural Network,SRCNN),首先使用卷積神經(jīng)網(wǎng)絡解決圖像超分辨率問題,其良好的重建效果超越了傳統(tǒng)重建算法。在圖像重構任務中,稀疏表示是一種有效的方法,文獻[2]提出了一種全局稀疏梯度耦合張量擴散的圖像去噪模型,能得到較好的去噪結果。文獻[3]提出了一種多尺度模型,通過多尺度特征融合與局部殘差學習的方法,有效提高了模型性能。文獻[4]提出一種多映射卷積神經(jīng)網(wǎng)絡的重建方法,通過引入變分約束,能夠提高重構圖像的細節(jié)。文獻[5]提出了一種遞歸網(wǎng)絡(Deep Recursive Residual Network,DRRN),在模型中采用了遞歸模塊,并且利用權重共享減少了模型參數(shù),使生成圖像的峰值信噪比(Peak Signal to Noise Ratio,PSNR)進一步提高。文獻[6]將小波變換與神經(jīng)網(wǎng)絡相結合 (Wavelet-based Super Resolution Network,Wavelet-SRNet),即使是極低分辨率的人臉圖像,其仍能夠重建出高質量圖像,但是其生成圖像相對平滑。上述重建方法都是以圖像層面的均方誤差(Mean Squared Error,MSE)優(yōu)化模型參數(shù),使用均方誤差的優(yōu)點是可以帶來更高的PSNR值,但是并不一定能夠有效提高圖像重建后的識別率。

    為了提高重建圖像的判別能力,進而提升人臉識別準確率,筆者提出一種結合哈爾小波與遞歸神經(jīng)網(wǎng)絡的低分辨率人臉識別方法。其優(yōu)點如下:

    (1)以神經(jīng)網(wǎng)絡預測小波系數(shù),將人臉重建從低維到高維的映射過程轉化為同等維度的預測,能夠更有效地重建出清晰圖像;通過在卷積神經(jīng)網(wǎng)絡中加入遞歸模塊,能夠以同樣的參數(shù)達到更深的深度,來提高模型的擬合能力。

    (2)采用預訓練的人臉識別網(wǎng)絡,通過融合小波系數(shù)的重建損失與感知損失[7]優(yōu)化網(wǎng)絡參數(shù),最終能夠重建出有利于識別的人臉圖像,可以有效提高識別準確率。

    1 結合哈爾小波與遞歸神經(jīng)網(wǎng)絡的低分辨率人臉識別方法

    1.1 結合哈爾小波的人臉重建網(wǎng)絡設計

    哈爾小波的包分解可以將原始圖像分解為多個小波系數(shù),每個小波系數(shù)代表原始圖像的一個頻率分量。而且哈爾小波變換是最簡單的一種正交小波變換,易于實現(xiàn)的同時,能夠根據(jù)分解得到的小波系數(shù)可以無誤差地重構原始圖像。借助此特點,可以將哈爾小波變換融入到人臉重建過程當中,以神經(jīng)網(wǎng)絡預測小波系數(shù),然后通過小波逆變換得到高分辨率圖像。受文獻[6-8]的啟發(fā),文中將哈爾小波融入到人臉重建過程中,改進后的網(wǎng)絡結構如圖1所示。

    圖1 結合哈爾小波的人臉重建網(wǎng)絡

    為了能夠獲得判別能力更強的人臉圖像,筆者對文獻[6]提出的網(wǎng)絡結構進行了重新設計。整體網(wǎng)絡框架分為3個模塊,分別為深度特征提取、小波系數(shù)預測和人臉特征重建。

    (1)設計一個由殘差單元組成的深度網(wǎng)絡進行特征提取。深層次的網(wǎng)絡能夠提取更加抽象的特征,殘差單元以及批歸一化層(Batch Normalization,BN)[9]的加入,可在一定程度上緩解深度網(wǎng)絡帶來的梯度消失與梯度爆炸問題,加速網(wǎng)絡收斂。基礎殘差單元如圖2(a)所示。網(wǎng)絡中的卷積核大小均為3×3,相比大尺寸的卷積核,3×3的卷積核參數(shù)更少,并且可以通過堆疊多個3×3卷積核達到相同的感受野,同時提高非線性映射能力。

    (2)提出一個多支路遞歸卷積方法進行小波系數(shù)預測。由于小波系數(shù)之間有不同的頻率分量,擁有較強的獨立性,所以小波系數(shù)預測模塊由多個并行的支路組成,每個支路負責預測對應的小波系數(shù)。同時采用遞歸卷積[5]來減少參數(shù)冗余,所采用的遞歸模塊如圖2(b)所示。其中每個遞歸卷積塊共享參數(shù),圖中只有3個卷積層的參數(shù),但是可以達到9層的深度,能夠較大程度地提高模型的擬合能力,同時大大減少了參數(shù)數(shù)量。

    (3)提供一個結合感知損失[7]的人臉特征重建模塊以提高重建圖像的判別能力。感知損失是在特征層面做均方誤差,使得重建圖像與原始圖像的深度特征能夠保持一致。與文獻[7]不同的是,所提出的方法以基于角度度量損失的人臉識別網(wǎng)絡SphereFace[8]代替圖像識別模型(Visual Geometry Group,VGG)[10]網(wǎng)絡進行特征重建,角度度量損失對softmax損失做了進一步優(yōu)化,其能夠增大類間距離的同時減小類內(nèi)距離,相比VGG更適用于人臉特征提取。特征重建網(wǎng)絡結構如表1所示,其中S2表示步長為2,F(xiàn)c表示全連接層,特征重建采用第15層的卷積層。

    圖2 殘差單元與遞歸模塊結構

    表1 特征重建模塊結構

    文中所提出的算法優(yōu)化過程如算法1所示,其中iteration表示當前迭代次數(shù),Max-iteration表示最大迭代次數(shù)。

    算法1人臉重建算法優(yōu)化。

    輸入:尺寸為3×h×w的低分辨率人臉圖像。

    輸出:高分辨率圖像。

    While iteration

    (1)通過設計的深度特征提取網(wǎng)絡,將低分辨率圖像映射至多維特征空間。

    (4)根據(jù)目標圖像IHR,通過設計的人臉特征重建模塊,使用感知損失對ISR進行特征重建,計算感知損失Lp。

    (5)基于融合的重建與感知損失,反向傳播優(yōu)化參數(shù)。

    End。

    1.2 優(yōu)化的重建與感知損失融合方法

    大多數(shù)圖像重建方法以圖像層面的均方誤差作為重建損失,從而得到峰值信噪比較高的圖像。PSNR作為圖像質量評價指標,其表達式為

    (1)

    其中,IMSE表示兩幅圖像像素之間的均方誤差。

    由式(1)可以看出,兩幅圖像之間的均方誤差越小,則對應的峰值信噪比值越高,說明兩幅圖像之間的像素平均值更加接近,往往會生成相對平滑的圖像,在一定程度上可能會影響人臉識別的準確性。

    由于上述原因,所提出的方法沒有在圖像層面計算均方誤差,而是借鑒文獻[6]提出的小波系數(shù)重建損失,提出了一種將小波系數(shù)重建損失與感知損失[7]相融合的目標函數(shù),具體如下:

    L=Lwavelet+λLp,

    (2)

    (3)

    Lwavelet的主要作用是使預測的小波系數(shù)與原始圖像分解得到的小波系數(shù)保持一致,其又分為L1和L2兩部分,如式(3)所示。L1是計算小波系數(shù)與標簽之間的F范數(shù)。當i<4時,ρ=0.99,對應小波系數(shù)中的低頻信息;當i>4時,ρ=0.01,對應小波系數(shù)中的高頻信息。低頻信息采用較大的權重,是因為低頻信息對應人臉的輪廓,有助于網(wǎng)絡收斂與圖像的穩(wěn)定生成。而L2的作用是使得預測的小波系數(shù)的F范數(shù)與標簽接近,保證圖像的高頻信息非零,防止圖像細節(jié)退化。α與ε為平衡因子。

    感知損失Lp可表示為

    (4)

    2 實驗結果與分析

    文中實驗平臺的配置為GTX1080Ti 顯卡以及 Ubuntu14.04 操作系統(tǒng),并使用pytorch深度學習框架實現(xiàn)。

    2.1 實驗數(shù)據(jù)與預處理

    采用公開的CASIA-WebFace[11]人臉數(shù)據(jù)庫對網(wǎng)絡進行訓練,篩選掉錯誤的和重復的圖片之后,最終的樣本庫包含 10 575 人,共454 539 張圖片。使用公開人臉庫 (Lbeled Faces in the Wild,LFW)[12]進行測試。LFW 數(shù)據(jù)庫有 5 479個人,共 13 233 張人臉圖片。LFW數(shù)據(jù)集提供了一個6 000對人臉比對的標簽,使用LFW數(shù)據(jù)集進行了重建質量與識別率的對比。

    對所有訓練和測試樣本都進行相同的預處理,首先,使用 Multi-Task Cascaded Convolutional Networks (MTCCN)[13]算法對每一張樣本進行人臉檢測,最后將所有人臉下采樣至指定大小(8×8,16×16)。

    2.2 實驗參數(shù)設置

    在實驗中,平衡系數(shù)λ=0.01,μ2=1,α=1.2,ε=0。在網(wǎng)絡優(yōu)化過程中,以高斯分布進行參數(shù)初始化,固定學習速率為0.000 1,權重衰減設置為0.000 5,批次設為256。采用Adam[14](β1=0.9,β2=0.999)算法進行隨機梯度優(yōu)化。在學習過程中,預訓練的人臉特征提取網(wǎng)絡的參數(shù)保持不變,微調(diào)其他層參數(shù)。借鑒殘差模型[5-6,8]結構,并結合一定實驗,確定了網(wǎng)絡的層數(shù)。

    2.3 實驗結果分析

    測試結果分4個方面:①重建圖像的視覺效果對比,以人的視覺主觀判斷為主;②圖像重建質量對比,以峰值信噪比和結構相似度(Structural Similarity Index,SSIM)為參考標準;③重建圖像的識別準確率對比,將重建圖像與清晰圖像(兩幅圖像并不相同)進行1∶1人臉比對,得到人臉識別準確率。準確率越高,說明重建圖像的判別能力越強;④圖像識別實例分析。

    2.3.1 重建圖像的視覺效果對比

    文獻[15]對不同分辨率圖像的識別性能進行了對比,64×64與128×128的人臉圖像相比,其識別準確率相差較小。同時考慮到重建效率,所以將重建后的圖像大小設為64×64,并對8×8和16×16兩種分辨率進行了實驗。文中方法與其他方法的對比效果如圖3所示。

    由圖3可以看出,當輸入圖像分辨率為8×8時,SRCNN[1]與DRRN[5]均無法重建出清晰人臉圖像,Wavelet-SRNet[6]與筆者提出方法可以重建出與原圖較為接近的圖像,但Wavelet-SRNet方法相對更加平滑。當輸入圖像分辨率為16×16時,DRRN與Wavelet-SRNet的重建效果明顯好于SRCNN與Bicubic,相比之下,所提出方法的重建結果更加銳利,特別是牙齒與頭發(fā)部分。但是存在一定的塊狀效應,這是由于沒有在圖像層面優(yōu)化均方誤差,并且加入了感知損失所帶來的結果,需要做進一步研究尋找解決方法。

    圖3 文中方法與其他方法的重建結果對比(8×8分辨率)

    圖4 文中方法與其他方法的重建結果對比(16×16分辨率)

    2.3.2 圖像重建質量對比

    峰值信噪比與結構相似度是評價圖像重建質量的常用參考標準。雖然所提出的方法并沒有為了提高相應數(shù)值專門進行優(yōu)化,但是為了能夠更全面地對比圖像復原結果,通過LFW[11]測試數(shù)據(jù)集與其他方法進行了對比,如表2和表3所示。相比其他方法,文中的峰值信噪比與結構相似度數(shù)值并不高,其原因在于并沒有在圖像層面優(yōu)化均方誤差(MSE)。對于8×8的LR圖像,文中方法雖然低于DRRN的峰值信噪比值,但是通過圖3的對比可以看出,其可以更加準確地重建出人臉的五官,而峰值信噪比值較高并不一定意味著其用于識別任務的特征更加豐富,識別率對比如表4所示。

    表2 8×8分辨率放大8倍重建質量對比

    表3 16×16分辨率放大4倍重建質量對比

    2.3.3 重建圖像的識別率對比

    通過LFW數(shù)據(jù)集,對重建圖像的識別性能進行了測試,以表明方法的有效性。LFW數(shù)據(jù)集提供了一個6 000對人臉比對的標簽,將每對中的其中一張人臉用重建人臉代替,測試其1∶1比對的正確率。為區(qū)別于人臉重建網(wǎng)絡,人臉識別采用MobilefaceNets[16]中的人臉識別網(wǎng)絡,并以中心度量損失[17]進行了重新訓練。人臉識別準確率對比如表4所示,相比SRCNN、DRRN、Wavelet-SRNet方法,所提出方法的PSNR與SSIM數(shù)值雖然不是最高,但是其識別準確率相比其他方法得到了有效提升,尤其是在輸入圖像分辨率較低的情況下。針對目前重建效果領先的Wavelet-SRNet方法,對于放大8倍的8×8圖像,其識別準確率約提高2.53%;對于放大4倍的16×16人臉圖像,其識別準確率提升有限(約0.11%),這是因為16×16的圖像本身已經(jīng)包含了一定的信息,而且放大倍數(shù)有所降低,所以相比8×8分辨率,其識別率的提高沒有那么明顯。

    表4 重建圖像的識別率對比 %

    2.3.4 圖像識別實例分析

    文中方法與Wavelet-SRNet方法對識別樣例進行了對比,圖5所示為身份相同的人臉比對。Wavelet-SRNet方法無法準確地重建眼鏡部分,整體較為平滑,在比對時將其判斷為兩個人。文中提出的方法在一定程度上能夠重建出眼鏡的輪廓,雖然存在一定的塊狀效應,但人臉五官在視覺上更加清晰,在一定程度上有助于識別。

    圖5 圖像識別實例對比

    表5 模型的大小對比

    對于算法的時效性,采用放大4倍時的模型大小作為客觀衡量標準,對比結果如表5所示。其中,SRCNN的執(zhí)行效率最高,文中方法與Wavelet-SRNet相差不多,但是與SRCNN與DRRN還有一定差距,在時效性方面,文中方法還具有一定的進步空間。

    3 結束語

    筆者提出了一種結合哈爾小波與遞歸神經(jīng)網(wǎng)絡的低分辨率人臉識別方法。首先進行超分辨率增強,根據(jù)輸入的低分辨率圖像,使用神經(jīng)網(wǎng)絡預測對應的小波系數(shù),利用小波逆變換重構清晰圖像。通過加入遞歸模塊來加深網(wǎng)絡深度并降低參數(shù)冗余,對小波系數(shù)重建損失與感知損失進行聯(lián)合優(yōu)化,提高重建圖像的判別性。通過LFW數(shù)據(jù)集,與目前領先的重建算法進行了圖像視覺效果與識別性能對比,結果表明,提出的方法可以有效提高低分辨率人臉的識別準確率,但是重建圖像存在一定的塊狀效應,需要進一步研究來提高重建效果。

    猜你喜歡
    低分辨率小波人臉識別
    基于全局和局部特征集成的低分辨率人臉識別方法
    紅外熱成像中低分辨率行人小目標檢測方法
    紅外技術(2022年11期)2022-11-25 08:12:22
    基于偏移學習的低分辨率人體姿態(tài)估計
    人臉識別 等
    作文中學版(2022年1期)2022-04-14 08:00:34
    構造Daubechies小波的一些注記
    科技風(2021年19期)2021-09-07 14:04:29
    揭開人臉識別的神秘面紗
    學生天地(2020年31期)2020-06-01 02:32:06
    基于MATLAB的小波降噪研究
    電子制作(2019年13期)2020-01-14 03:15:32
    樹木的低分辨率三維模型資源創(chuàng)建實踐
    藝術科技(2018年2期)2018-07-23 06:35:17
    基于改進的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
    基于類獨立核稀疏表示的魯棒人臉識別
    計算機工程(2015年8期)2015-07-03 12:19:07
    卢湾区| 布尔津县| 广宗县| 高唐县| 灵川县| 洪雅县| 若尔盖县| 台中市| 东阳市| 龙山县| 灌阳县| 土默特左旗| 临高县| 长宁县| 班戈县| 仲巴县| 河西区| 女性| 嘉峪关市| 高台县| 类乌齐县| 旺苍县| 平果县| 忻城县| 罗江县| 乌兰察布市| 马边| 化州市| 嘉峪关市| 阿拉善盟| 雅安市| 望城县| 姚安县| 张家川| 化德县| 涿州市| 和龙市| 永州市| 射阳县| 老河口市| 讷河市|