• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多峰標(biāo)簽分布學(xué)習(xí)的多任務(wù)年齡估計(jì)方法

      2023-05-24 03:19:08何建輝胡春龍
      計(jì)算機(jī)應(yīng)用 2023年5期
      關(guān)鍵詞:高斯分布多任務(wù)人臉

      何建輝,胡春龍,束 鑫

      (江蘇科技大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 鎮(zhèn)江 212100)

      0 引言

      面部年齡估計(jì)指通過人臉面部圖像對(duì)人的真實(shí)年齡進(jìn)行預(yù)測(cè),是目前計(jì)算機(jī)視覺、生物特征識(shí)別領(lǐng)域的一個(gè)熱點(diǎn)課題?,F(xiàn)實(shí)中年齡信息的獲取難度較高,且普遍依賴于個(gè)人隱私信息的讀取,面部年齡識(shí)別技術(shù)能夠避免這一敏感問題,并且擴(kuò)展應(yīng)用在各種服務(wù)領(lǐng)域[1]。面部年齡估計(jì)過程主要包含兩個(gè)部分:特征提取和估計(jì)方法?;谏疃葘W(xué)習(xí)的特征提取方法能夠在像素級(jí)上捕捉人臉圖像中的特征信息,相比傳統(tǒng)的手工特征提取方法更具魯棒性,因此深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)已經(jīng)在年齡估計(jì)任務(wù)中的特征提取部分占據(jù)絕對(duì)位置。年齡估計(jì)任務(wù)的關(guān)鍵在于如何提取年齡標(biāo)簽間的順序性和模糊性,即年齡標(biāo)簽間存在著明顯的序數(shù)關(guān)系,并且標(biāo)簽越近,人臉特征越相似。在分類和回歸方法中常用的年齡標(biāo)簽表示方式如one-hot 編碼和回歸值難以體現(xiàn)出復(fù)雜的類間關(guān)系,因此將年齡估計(jì)任務(wù)簡單地劃分為分類任務(wù)或者回歸任務(wù)的研究方法并不嚴(yán)謹(jǐn)。標(biāo)簽分布學(xué)習(xí)(Label Distribution Learning,LDL)的目標(biāo)是預(yù)測(cè)一組年齡分布,通過標(biāo)簽的概率表示重新表達(dá)標(biāo)簽,這種方式不僅能夠準(zhǔn)確地表示標(biāo)簽,同時(shí)可以建立起標(biāo)簽間的關(guān)系,從而更好地利用標(biāo)簽的模糊性。

      標(biāo)簽的分布方式是LDL 的一個(gè)重要組成部分,要獲取真實(shí)的標(biāo)簽分布,理論上需要對(duì)同類樣本進(jìn)行大量的標(biāo)記,然而目前絕大部分年齡數(shù)據(jù)集的樣本數(shù)量都不具備上述條件,因此通常使用特殊的分布函數(shù)對(duì)目標(biāo)分布進(jìn)行擬合。高斯分布被廣泛應(yīng)用在許多基于標(biāo)簽分布的年齡估計(jì)任務(wù)[2-3]中,概率整體分布在均值μ附近,并且大約99.73%的分布集中在(μ-3σ,μ+3σ)區(qū)間。因此通過調(diào)整標(biāo)準(zhǔn)差σ,可以獲得大量不同模糊程度的年齡分布。然而高斯年齡分布同樣存在部分問題,因?yàn)楦咚购瘮?shù)的曲線具有明顯的對(duì)稱性,而距離相等的其他標(biāo)簽對(duì)真實(shí)標(biāo)簽的貢獻(xiàn)并非完全一致。而且研究[1]表明,人臉的老化趨勢(shì)具有階段性,因此各個(gè)年齡階段的老化模式可能對(duì)真實(shí)的年齡分布產(chǎn)生不同的影響。

      基于以上思想,本文設(shè)計(jì)了一種多峰分布(Multi-Peak Distribution,MPD)年齡編碼,并基于MPD 年齡編碼提出了一個(gè)多任務(wù)年齡估計(jì)方法MPDNet(MPD Network),主要工作如下:

      1)為提取年齡標(biāo)簽的相關(guān)性和模糊性,并擬合真實(shí)年齡分布的集中性、多階段和非對(duì)稱等特性,提出一種MPD 年齡編碼;

      2)將LDL 和回歸學(xué)習(xí)相結(jié)合提出一種深度多任務(wù)方法。多任務(wù)學(xué)習(xí)的共享信息表征有助于緩解LDL 訓(xùn)練目標(biāo)與測(cè)試目標(biāo)不一致的影響,同時(shí)減少訓(xùn)練數(shù)據(jù)不平衡對(duì)年齡回歸的影響;

      3)提出一個(gè)高度精簡的輕量化特征提取網(wǎng)絡(luò),在保證特征提取能力的同時(shí)減少了網(wǎng)絡(luò)參數(shù),使得網(wǎng)絡(luò)的訓(xùn)練時(shí)間大幅縮短,在一定程度上減少了網(wǎng)絡(luò)對(duì)大樣本數(shù)據(jù)集的依賴。

      1 相關(guān)工作

      1.1 面部特征提取

      隨著大量訓(xùn)練數(shù)據(jù)集的出現(xiàn)和計(jì)算能力的提高,近年來CNN在圖像分類、語義分割、目標(biāo)檢測(cè)等各個(gè)領(lǐng)域中都展現(xiàn)出了最先進(jìn)的性能。在年齡估計(jì)任務(wù)上,CNN 所學(xué)習(xí)到的年齡特征相較于傳統(tǒng)手工制作的特征描述符更具魯棒性,因此在非受限環(huán)境下,CNN 的準(zhǔn)確率更高。大多最先進(jìn)的年齡估計(jì)方法都采用如VGGNets(Visual Geometry Group Networks)[4]和殘差網(wǎng)絡(luò)(Residual Network,ResNet)[5]等大規(guī)模CNN 架構(gòu)作為基礎(chǔ)進(jìn)行特征提取。Rothe 等[6]在數(shù)據(jù)增強(qiáng)后的大規(guī)模數(shù)據(jù)集IMDB-WIKI 上訓(xùn)練了20 個(gè)VGG-16 網(wǎng)絡(luò)集合,并計(jì)算出預(yù)測(cè)的平均值作為估計(jì)年齡,該方法在第一屆ChaLearn LAP挑戰(zhàn)賽上獲得了第一名。第二年的ChaLearn LAP 挑戰(zhàn)賽冠軍發(fā)現(xiàn)特定年齡組的個(gè)性化特征提取才是提高預(yù)測(cè)精度的關(guān)鍵,于是集成了兩個(gè)VGG-16 網(wǎng)絡(luò),其中一個(gè)僅用于估計(jì)[0,12]歲兒童的表觀年齡[7]。Zhang 等[8]基于多任務(wù)的思想,將性別作為輔助信息引入年齡估計(jì),并采用了RoR(Residual network of Residual network)進(jìn)行特征提取,實(shí)驗(yàn)結(jié)果表明層次更深的RoR 效果比VGGNets 更好。雖然這些網(wǎng)絡(luò)在年齡估計(jì)中取得了較好的效果,但也具有龐大的網(wǎng)絡(luò)和大量的參數(shù)。隨著移動(dòng)端和嵌入式設(shè)備需求的不斷增加,一些小內(nèi)存的輕量級(jí)網(wǎng)絡(luò)被提出,例如采用深度可分離卷積代替標(biāo)準(zhǔn)卷積從而減少參數(shù)和計(jì)算量的DenseNet[9]和MobileNet[10]等。但減少網(wǎng)絡(luò)參數(shù)并不意味著必須使用更輕量的卷積方式,大量的研究表明,在年齡估計(jì)任務(wù)中使用標(biāo)準(zhǔn)卷積設(shè)計(jì)的輕量化網(wǎng)絡(luò)同樣可以達(dá)到良好的性能[11-14]。

      1.2 年齡估計(jì)方法

      根據(jù)年齡標(biāo)簽的處理方式不同可以將年齡估計(jì)方法劃分為分類、回歸、排序和分布學(xué)習(xí)四種。傳統(tǒng)方法將年齡估計(jì)視為分類或回歸問題。Liu 等[15]提出了AgeNet,該網(wǎng)絡(luò)采用一個(gè)22 層的GoogLeNet[16]作為特征提取器,分別進(jìn)行分類和回歸的端到端訓(xùn)練,最后通過融合兩個(gè)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果進(jìn)行表觀年齡的估計(jì),測(cè)試精度超過分類或回歸的單一任務(wù)。李大湘等[17]關(guān)注到年齡估計(jì)中存在的代價(jià)敏感問題,通過為每個(gè)年齡類設(shè)置不同的誤分類代價(jià),進(jìn)一步優(yōu)化了年齡估計(jì)的分類方法。而在基于排序的方法中,研究的重心在于提取年齡標(biāo)簽間的序數(shù)關(guān)系。Niu 等[18]將年齡估計(jì)問題轉(zhuǎn)化為一系列二分類子問題,并構(gòu)建了一個(gè)多輸出CNN 來集中解決這些分類子問題。為了提取不同標(biāo)簽樣本的判別性特征,Chen 等[19]訓(xùn)練了一系列基礎(chǔ)網(wǎng)絡(luò),然后聚合所有基礎(chǔ)網(wǎng)絡(luò)的二進(jìn)制輸出,完成最終的年齡預(yù)測(cè)。

      另一種流行的年齡編碼方式為標(biāo)簽分布學(xué)習(xí),為了提取標(biāo)簽間的模糊性,它將年齡標(biāo)簽值轉(zhuǎn)化為一組概率分布并通過優(yōu)化它與真實(shí)分布間的差異進(jìn)行年齡預(yù)測(cè)。Gao 等[20-21]預(yù)先對(duì)每個(gè)年齡標(biāo)簽進(jìn)行高斯分布編碼,然后使用KL(Kullback-Leibler)散度度量網(wǎng)絡(luò)預(yù)測(cè)的年齡分布與先驗(yàn)高斯分布之間的差異。年齡估計(jì)任務(wù)的最終目標(biāo)是預(yù)測(cè)一個(gè)具體的年齡值,為了解決標(biāo)簽分布學(xué)習(xí)中訓(xùn)練目標(biāo)和測(cè)試目標(biāo)不一致的問題,Gao 等[21]對(duì)標(biāo)簽分布的結(jié)果進(jìn)行回歸學(xué)習(xí),提出了DLDL(Deep Label Distribution Learning)框架。為了獲得更精確的年齡分布,Zhang 等[14]則通過減小標(biāo)簽分布的范圍,僅采用兩點(diǎn)分布將年齡標(biāo)簽轉(zhuǎn)化為兩個(gè)節(jié)點(diǎn)的概率表示,同時(shí)使用級(jí)聯(lián)網(wǎng)絡(luò)對(duì)多尺度的圖片進(jìn)行訓(xùn)練,充分利用了人臉的上下文信息。李睿鈺等[22]認(rèn)為基于先驗(yàn)的分布學(xué)習(xí)在正確刻畫標(biāo)簽相關(guān)性上可能存在誤差,于是提出在訓(xùn)練階段調(diào)整假設(shè)空間使網(wǎng)絡(luò)自動(dòng)生成具有特征約束的年齡分布。Pan 等[23]則從損失函數(shù)的設(shè)計(jì)出發(fā),提出了一種新的損失函數(shù)Mean-Variance Loss。該損失函數(shù)通過均值損失來懲罰估計(jì)的年齡分布與真實(shí)年齡的差值,通過方差損失懲罰估計(jì)的年齡分布方差,確保分布集中。最后將均值方差損失和Softmax 損失聯(lián)合嵌入到CNN 中進(jìn)行年齡估計(jì),并在多個(gè)數(shù)據(jù)集上驗(yàn)證了該方法優(yōu)于最先進(jìn)的年齡估計(jì)方法。

      1.3 多任務(wù)學(xué)習(xí)相關(guān)理論

      多任務(wù)學(xué)習(xí)[24-27]的目的是利用多個(gè)相關(guān)任務(wù)中的有用信息來幫助提高所有任務(wù)的泛化性能,與標(biāo)簽分布學(xué)習(xí)中常用的級(jí)聯(lián)網(wǎng)絡(luò)不同,多任務(wù)學(xué)習(xí)的子網(wǎng)絡(luò)只共享部分結(jié)構(gòu),并且單個(gè)任務(wù)的預(yù)測(cè)結(jié)果不會(huì)相互干擾。Niu 等[18]和Tan等[28]選擇將有序回歸問題轉(zhuǎn)化為一系列二值分類子問題,并使用多個(gè)CNN 分別進(jìn)行解決,其中每個(gè)CNN 輸出對(duì)應(yīng)一個(gè)二分類任務(wù),所有子任務(wù)共享相同的特征層。不同之處在于Tan 等[28]在年齡分組中編碼了相鄰年齡之間的關(guān)系,即相鄰年齡被分組為同一組。此類方法只修改單個(gè)CNN 的輸出層構(gòu)建多輸出網(wǎng)絡(luò),其中每個(gè)輸出判斷輸入圖像是否屬于相應(yīng)年齡組,因此這類多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)更像一個(gè)整體的回歸模型,仍然存在訓(xùn)練數(shù)據(jù)不均衡和數(shù)據(jù)分布異構(gòu)的問題。為了獲取更豐富的年齡特征,Xing 等[29]和Yi 等[30]將性別和種族等額外信息引入年齡估計(jì)任務(wù),迫使網(wǎng)絡(luò)學(xué)習(xí)更細(xì)粒度的年齡特征表示。但實(shí)驗(yàn)結(jié)果表明,引入性別、種族等其他標(biāo)簽與單任務(wù)網(wǎng)絡(luò)相比,精度的提高并不顯著。原因是只有當(dāng)多個(gè)任務(wù)緊密相關(guān)時(shí),深度多任務(wù)學(xué)習(xí)才能帶來多個(gè)任務(wù)性能的共同提升。

      2 MPDNet

      2.1 多峰年齡分布

      基于標(biāo)簽分布學(xué)習(xí)的年齡估計(jì)方法[21,23,31]采用單高斯分布生成真實(shí)標(biāo)簽對(duì)應(yīng)的概率分布,高斯分布的概率密度函數(shù)定義為:

      在上述方法中,通常將參數(shù)μ設(shè)置為標(biāo)簽值yn,將標(biāo)準(zhǔn)差σ設(shè)置為分布模糊程度的可調(diào)參數(shù)。

      單高斯分布的概率密度函數(shù)曲線具有對(duì)稱性,但不同年齡段人臉的衰老過程顯然不符合這一性質(zhì),并且受后天因素(如環(huán)境、化妝等)影響,樣本的真實(shí)年齡和圖像呈現(xiàn)的表觀年齡間存在偏差,人臉相比真實(shí)年齡會(huì)顯得更年輕或者更老。因此,為了減小真實(shí)年齡標(biāo)簽轉(zhuǎn)化為年齡分布的誤差,本文首先針對(duì)樣本標(biāo)簽的表觀年齡分布進(jìn)行建模。

      為了約束表觀年齡偏移的區(qū)間,本文以K為單位將年齡軸劃分為若干年齡組,定義真實(shí)標(biāo)簽所在年齡組的第一個(gè)標(biāo)簽值為峰值gi(i表示第i個(gè)年齡組),并作為該年齡組更年輕的表觀年齡代表:

      因此gi+1則為該年齡組更老偏向的表觀年齡代表,結(jié)合兩種偏移模式的綜合表達(dá),構(gòu)造了特定標(biāo)簽的表觀年齡分布,稱為雙峰年齡分布Gd:

      α為其中一個(gè)偏移模式對(duì)整體分布的影響因子,由兩個(gè)峰值點(diǎn)到標(biāo)簽的距離決定:

      可以證明Gd仍然滿足分布的性質(zhì):

      最后引入以真實(shí)標(biāo)簽值為峰值點(diǎn)的基本分布,構(gòu)成了具有原始標(biāo)簽相關(guān)性和標(biāo)簽個(gè)性化的多峰分布Gt:

      其中:β是用于控制單個(gè)高斯分布權(quán)重的可調(diào)整參數(shù)。為了使分布集中在標(biāo)簽值附近,對(duì)于兩個(gè)分布,本文采用了不同的方差值。

      對(duì)Gt分布中每個(gè)年齡組進(jìn)行積分,可以獲得具有階段信息的真實(shí)年齡概率分布,其中i表示第i個(gè)年齡組:

      2.2 多任務(wù)學(xué)習(xí)框架

      式(8)中,本文按照年齡組對(duì)年齡標(biāo)簽進(jìn)行了粒度為K的粗略分布,這種粗粒度的分布能夠盡可能多地提取類間信息,但同時(shí)對(duì)標(biāo)簽的精確表達(dá)具有一定的影響,因此本文引入回歸學(xué)習(xí),并構(gòu)建了一個(gè)多任務(wù)學(xué)習(xí)框架,如圖1 所示。

      圖1 多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)Fig.1 Multi-task learning network

      在分布學(xué)習(xí)任務(wù)流中,人臉圖像通過表1 所示的輕量級(jí)網(wǎng)絡(luò)進(jìn)行多階段的特征提取,然后采用一個(gè)全連接層構(gòu)建的分布層輸出預(yù)測(cè)分布,通過縮小和MPD 轉(zhuǎn)化的先驗(yàn)分布間的差異來確保預(yù)測(cè)分布的準(zhǔn)確性。

      表1 輕量級(jí)特征提取網(wǎng)絡(luò)結(jié)構(gòu)Tab.1 Lightweight feature extraction network structure

      本文采用KL 散度作為兩個(gè)分布間差異的度量。KL 散度的計(jì)算公式為:

      在回歸任務(wù)流中,本文使用了多階段年齡回歸,采用由粗到細(xì)的回歸策略,通過3 個(gè)全連接層構(gòu)成的回歸層分別計(jì)算特征提取網(wǎng)絡(luò)每個(gè)階段下的預(yù)測(cè)概率pi。最后結(jié)合3 個(gè)階段的預(yù)測(cè)計(jì)算最終的預(yù)測(cè)年齡值:

      其中:V表示整個(gè)年齡段;S表示粗粒度的階段數(shù);F表示每個(gè)粗粒度下細(xì)粒度的組數(shù)表示階段s下第f組的概率。對(duì)于回歸任務(wù)的損失函數(shù),本文采用最常用的評(píng)估指標(biāo)平均絕對(duì)誤差(Mean Absolute Error,MAE),確保訓(xùn)練目標(biāo)與測(cè)試目標(biāo)一致:

      多任務(wù)學(xué)習(xí)框架下完整的損失函數(shù)如下:

      其中:λ是一個(gè)平衡兩個(gè)任務(wù)權(quán)重的超參數(shù),通過調(diào)整λ可進(jìn)一步促進(jìn)多任務(wù)學(xué)習(xí)的互補(bǔ)效果。

      3 實(shí)驗(yàn)與結(jié)果分析

      3.1 實(shí)驗(yàn)環(huán)境

      所有實(shí)驗(yàn)均運(yùn)行在NVIDIA A100 40 GB 平臺(tái)上,內(nèi)存共計(jì)16 GB。

      本文采用以下兩個(gè)人臉年齡數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)訓(xùn)練:

      MORPH[32]:MORPH 是目前最受歡迎的年齡估計(jì)任務(wù)基準(zhǔn)數(shù)據(jù)集之一,分為Album I 和Album Ⅱ兩部分。Album I 包含1 724 張人臉圖像,年齡范圍為[15,68]歲,其中男性圖像1 430 張,女性圖像294 張;Album Ⅱ包含了在同一環(huán)境下拍攝的55 134 張人臉圖像。本文將Album Ⅱ進(jìn)行隨機(jī)劃分,其中80%作為訓(xùn)練集,20%作為測(cè)試集。

      MegaAge-Asian[33]:該數(shù)據(jù)集收集了40 000 張亞洲人的面部圖像,年齡范圍為[0,70]歲。這些圖像大多在非受限條件下拍攝,因此背景、光照、姿勢(shì)、表情等差異較大。本文使用了3 945 張圖像進(jìn)行測(cè)試,其余圖像用于訓(xùn)練。

      3.2 評(píng)估指標(biāo)

      目前面部年齡估計(jì)研究通常使用平均絕對(duì)誤差(MAE)和累積分?jǐn)?shù)(Cumulative Score,CS)來評(píng)估方法的性能。MAE 定義為實(shí)際年齡與預(yù)測(cè)年齡之間的平均距離,數(shù)值越小表示預(yù)測(cè)性能越好:

      其中:yi和分別表示真實(shí)標(biāo)簽和預(yù)測(cè)年齡值。

      CS 指標(biāo)主要關(guān)注方法在一定誤差內(nèi)的預(yù)測(cè)準(zhǔn)確率,計(jì)算公式為:

      其中:Ne≤j表示估計(jì)絕對(duì)誤差不超過j的測(cè)試圖像的數(shù)量,N是測(cè)試圖像的總數(shù),年齡估計(jì)任務(wù)中常用的閾值j主要為3 和5。

      3.3 實(shí)驗(yàn)內(nèi)容及結(jié)果分析

      實(shí)驗(yàn)中,本文將輸入的圖像與人臉對(duì)齊并裁剪,將其大小調(diào)整為112×112,然后在將圖像輸入到網(wǎng)絡(luò)之前對(duì)圖像進(jìn)行翻轉(zhuǎn)、旋轉(zhuǎn)和隨機(jī)擦除等預(yù)處理。初始學(xué)習(xí)率設(shè)為0.002,動(dòng)量和權(quán)重衰減分別為0.9 和0.000 1,batchsize 設(shè)為128。學(xué)習(xí)率每80 個(gè)epoch 下降到原來的1/10,共訓(xùn)練240 個(gè)epoch。年齡組長度K=10,MPD 中的σ1=5,σ2=2.5。

      3.3.1 MORPH數(shù)據(jù)集上的定量實(shí)驗(yàn)

      為了評(píng)估網(wǎng)絡(luò)的預(yù)測(cè)精確度,本文選擇目前主流的年齡估計(jì)方法在多個(gè)方面進(jìn)行對(duì)比,并根據(jù)方法中的網(wǎng)絡(luò)參數(shù)量劃分為輕量級(jí)和重量級(jí),實(shí)驗(yàn)結(jié)果如表2 所示??梢钥吹剑疚姆椒ǖ腗AE 達(dá)到2.67,在輕量級(jí)方法中僅弱于CEN(Coupled Evolutionary Network)[34]的1.91 和LRN(Label Refinement Network)[35]的1.90;然而CEN 和LRN 均采用知識(shí)蒸餾技術(shù),將上一個(gè)網(wǎng)絡(luò)作為新的學(xué)習(xí)對(duì)象,這需要大量的額外訓(xùn) 練。ORCNN(Ordinal Regression CNN)[18]、SSR-Net(Soft Stagewise Regression Network)[13]、C3AE[14]等方法都采用了一個(gè)輕量級(jí)網(wǎng)絡(luò)進(jìn)行特征提取,然而ORCNN 僅關(guān)注年齡特征間的序數(shù)關(guān)系,SSR-Net 和C3AE 則注重年齡特征的模糊性,都沒有將兩種特性聯(lián)系起來。輕量級(jí)方法中沒有對(duì)年齡標(biāo)簽進(jìn)行任何處理的DenseNet[9]和MobileNet[10]效果表現(xiàn)不佳,這說明年齡估計(jì)的精確度關(guān)鍵在于構(gòu)建更符合年齡老化模式的估計(jì)方法。同時(shí)和參數(shù)多達(dá)幾百倍的重量級(jí)方法相比,MPDNet 甚至超過了DEX(Deep EXpectation)[6]和RankingCNN(Ranking CNN)[19]。Posterior[33]、MV(Mean-Variance)[23]、DLDL[21]、BridgeNet[36]、DORFs(Deep Ordinal Regression Forests)[37]等方法雖然精度更高,但存在網(wǎng)絡(luò)參數(shù)龐大、訓(xùn)練時(shí)間長、存儲(chǔ)空間消耗大等缺點(diǎn),而本文方法訓(xùn)練時(shí)間短、占用空間小,更易部署在移動(dòng)端,因此同樣具有競(jìng)爭(zhēng)力。

      表2 在MORPH Ⅱ數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比Tab.2 Comparison of experimental results on MORPH Ⅱ dataset

      為進(jìn)一步驗(yàn)證多任務(wù)學(xué)習(xí)下多峰分布的有效性,針對(duì)式(7)和(12)中的參數(shù)β和λ進(jìn)行消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖2 和表3 所示。

      圖2 參數(shù)β的消融實(shí)驗(yàn)結(jié)果Fig.2 Ablation experimental results of parameter β

      表3 參數(shù)λ的消融實(shí)驗(yàn)結(jié)果Tab.3 Ablation experimental results of parameter λ

      圖2 中,β=0 和10 分別代表雙峰分布和高斯分布,其余均為不同模糊程度的多峰分布??梢钥闯觯瑑H使用高斯分布時(shí)的表現(xiàn)較差,當(dāng)引入多階段分布后,增強(qiáng)了目標(biāo)重要特征的準(zhǔn)確表達(dá),網(wǎng)絡(luò)能提取到更豐富的年齡類間信息,由圖2(k)、(a)和(f)可知,MAE 從2.83 分別下降到了2.75 和2.69,測(cè)試誤差下降了2.83%和4.95%。并且隨著多峰分布中單高斯分布比重在一定范圍內(nèi)增加,MAE 的曲線波動(dòng)逐漸減弱。在多個(gè)不同參數(shù)值下的MAE 測(cè)試結(jié)果波動(dòng)較小,這體現(xiàn)了多峰分布具有較強(qiáng)的穩(wěn)定性。

      在表3 所示消融實(shí)驗(yàn)結(jié)果中,當(dāng)λ=0 時(shí),網(wǎng)絡(luò)僅執(zhí)行回歸任務(wù),受到標(biāo)簽信息不足的限制,網(wǎng)絡(luò)學(xué)習(xí)到的特征有限,因此性能明顯下降。而當(dāng)λ為空,僅執(zhí)行高斯分布學(xué)習(xí)任務(wù)并將分布對(duì)應(yīng)期望值作為預(yù)測(cè)值時(shí),雖然引入了更多的標(biāo)簽類間信息,但模糊化的分布并非精準(zhǔn)的數(shù)值,本身存在一定的誤差,因此預(yù)測(cè)性能同樣下降明顯。相反,多任務(wù)學(xué)習(xí)下的MPDNet 性能始終優(yōu)于分布學(xué)習(xí)和回歸學(xué)習(xí),同時(shí)進(jìn)行回歸任務(wù)能夠有效降低年齡分布的期望值與真實(shí)年齡的差值,確保分布學(xué)習(xí)中訓(xùn)練目標(biāo)與測(cè)試目標(biāo)一致從而提高分布的準(zhǔn)確性。

      綜上可知,采用多峰分布對(duì)年齡標(biāo)簽進(jìn)行重編碼,再結(jié)合標(biāo)簽分布學(xué)習(xí)和回歸學(xué)習(xí)所構(gòu)成的多任務(wù)學(xué)習(xí)網(wǎng)絡(luò)增強(qiáng)特征提取能力和類間信息交互,能夠有效提升網(wǎng)絡(luò)在MORPH Ⅱ數(shù)據(jù)集上的預(yù)測(cè)精度。

      3.3.2 MegaAge-Asian數(shù)據(jù)集上的定量實(shí)驗(yàn)

      現(xiàn)有的大多數(shù)年齡估計(jì)數(shù)據(jù)集主要采集白人和黑人的人臉圖像,然而每個(gè)種族的人臉年齡特征并不完全相同,因此網(wǎng)絡(luò)提取的年齡特征可能并不完整。本文在Megaage-Asian 數(shù)據(jù)集上進(jìn)行了補(bǔ)充實(shí)驗(yàn),以證明MPDNet 的魯棒性,實(shí)驗(yàn)結(jié)果如表4 所示??梢钥吹?,MPDNet 在CS(3)和CS(5)指標(biāo)上分別達(dá)到了61.1%和81.2%。由于MegaAge-Asian 數(shù)據(jù)集來源于網(wǎng)絡(luò)爬取,人臉背景和光照都存在較大差異,因此對(duì)網(wǎng)絡(luò)特征提取能力要求更高,不同于MORPH Ⅱ數(shù)據(jù)集上的結(jié)果,參數(shù)更多的重量級(jí)方法顯然更具優(yōu)勢(shì)。在輕量級(jí)方法中,MPDNet 與CEN 和LRN 在精度上同樣具有競(jìng)爭(zhēng)力,并且MPDNet 在參數(shù)量上更具優(yōu)勢(shì)。同時(shí)與重量級(jí)方法Posterior 相比,MPDNet 也獲得了與之相當(dāng)?shù)男阅埽@說明MPDNet 所提取的人臉年齡特征和類間相關(guān)信息在不同環(huán)境下同樣有效。

      表4 在MegaAge-Asian數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比Tab.4 Comparison of experimental results on MegaAge-Asian dataset

      4 結(jié)語

      本文提出了一種用于年齡估計(jì)的多任務(wù)分布學(xué)習(xí)方法MPDNet,包含標(biāo)簽分布擬合和回歸細(xì)化兩個(gè)過程。所提出的多峰分布年齡編碼擬合了年齡標(biāo)簽特有的階段性和模糊性特征,有助于模擬真實(shí)標(biāo)簽的準(zhǔn)確分布。同時(shí)本文提出的輕量級(jí)網(wǎng)絡(luò)彌補(bǔ)了重量級(jí)網(wǎng)絡(luò)難以在移動(dòng)端或嵌入式設(shè)備上部署的缺陷。在Moprh Ⅱ和Megaage-Asian 上的實(shí)驗(yàn)結(jié)果驗(yàn)證了MPDNet 的優(yōu)越性,但該方法仍有改進(jìn)的空間,例如在處理非受限條件(如背景、姿態(tài)、表情等)的人臉圖像時(shí)精度有所下降,我們未來將對(duì)此作一步的研究與討論。

      猜你喜歡
      高斯分布多任務(wù)人臉
      有特點(diǎn)的人臉
      利用Box-Cox變換對(duì)移動(dòng)通信中小區(qū)級(jí)業(yè)務(wù)流量分布的研究
      2種非對(duì)稱廣義高斯分布模型的構(gòu)造
      基于中心化自動(dòng)加權(quán)多任務(wù)學(xué)習(xí)的早期輕度認(rèn)知障礙診斷
      三國漫——人臉解鎖
      一種基于改進(jìn)混合高斯模型的前景檢測(cè)
      基于判別性局部聯(lián)合稀疏模型的多任務(wù)跟蹤
      電測(cè)與儀表(2016年5期)2016-04-22 01:13:46
      馬面部與人臉相似度驚人
      長得象人臉的十種動(dòng)物
      奇聞怪事(2014年5期)2014-05-13 21:43:01
      云梦县| 宾川县| 广灵县| 龙海市| 吴忠市| 清原| 瑞金市| 沙湾县| 青阳县| 阿坝县| 辽宁省| 遵义市| 虎林市| 仲巴县| 崇州市| 桃园县| 庆安县| 扶绥县| 虞城县| 龙川县| 宾阳县| 来凤县| 枣阳市| 汝州市| 新余市| 沐川县| 碌曲县| 锡林郭勒盟| 陆川县| 铜陵市| 嘉祥县| 额尔古纳市| 太和县| 长丰县| 吉安市| 齐齐哈尔市| 德化县| 巫溪县| 巴里| 宁河县| 通渭县|