李俊瑤,黎智輝,謝蘭遲,侯欣雨,葉 東
1.江蘇警官學院 刑事科學技術系,南京210000
2.公安部物證鑒定中心,北京100032
隨著深度學習、神經網絡的快速發(fā)展,人臉識別已經廣泛應用于電子消費、安防、打擊犯罪等領域,ResNet[1]、DenseNet[2]等算法的識別準確率甚至高于人類。但是,對于失蹤兒童長大后身份驗證、逃犯長期追蹤與識別、積案累案偵辦等需要使用跨年齡人臉識別技術的問題,目前還沒有很好的解決方法。
目前,跨年齡識別問題較難解決是因為隨著年齡的增長,面部老化會引起面部特征的改變。對于兒童和青少年,身體未發(fā)育完全,顱面的生長導致面部輪廓發(fā)生變化;對于成年人和老年人,衰老導致皮膚老化,使得五官形狀改變、面部皺紋增多等[3]。當前,對于跨年齡人臉識別的研究主要分為兩大類:一類是研究人臉老化規(guī)律,利用不同時期的老化模型,合成老化人臉,基于合成的老化人臉進行人臉識別與匹配;另一類是探尋人臉的年齡不變量,強化跨年齡人臉識別中與受年齡影響較小的個體特征,提高跨年齡人臉識別相似度和準確性。
近幾年,部分學者對隨年齡進程的人臉老化模型進行過系統(tǒng)地梳理。其中,F(xiàn)u等人[4]總結了人臉老化合成和年齡估計相關算法,針對人臉老化合成,在深入剖析年齡進程中人臉特征變化的基礎上,將人臉模型分為幾何模型、圖像模型、外觀模型等,并從數(shù)據驅動合成、力學合成和統(tǒng)計學合成三個方面對現(xiàn)有的老化合成算法進行詳細描述。Shu等人[5]將人臉老化方法分為基于原型、基于PCA、基于重建、基于模型和基于學習五大類,并詳細介紹了和年齡進程有關的包括跨年人臉識別、年齡估計等應用場景的解決方法和常用的三個跨年齡人臉數(shù)據庫(FG-NET、MORPH和CACD)。隨著深度學習算法的不斷發(fā)展,基于老化模型的跨年齡識別方法也不斷出新。本文詳細研究基于老化模型的跨年齡識別問題,對各類老化模型、評價方法、跨年齡數(shù)據庫重新進行總結歸納。
基于原型的人臉老化是利用不同年齡段、不同性別、不同種族的原型人臉圖像合成老化后的人臉圖像,這些原型人臉通常是利用大規(guī)模數(shù)據庫計算得到的平均人臉圖像。這一類研究主要是將原始年齡和目標年齡對應原型之間的差異轉換到輸入的人臉中,從而得到老化后的人臉圖像,其研究重點在于確定不同年齡組的原型。
Burt等人[6]提出在輸入圖像中加入原型之間的差值,將原始年齡的輸入人臉圖像轉換為目標年齡的老化人臉圖像,如公式(1)所示:
其中,In(t1)是輸入的原始人臉圖像,AgingFace(t2)是輸出的老化后的人臉圖像,t1為原始年齡,t2為老化后的目標年齡,AverageFace(t1)和AverageFace(t2)為t1、t2對應年齡的原型人臉圖像。如圖1所示,左側一列為原始年齡的輸入圖像,第二列為目標年齡對應的原型人臉(平均人臉),第三列為原始年齡對應的原型人臉(平均人臉),右側一列為老化后的人臉圖像,可實現(xiàn)人臉老化,但是面部老化紋理真實性較差。
圖1 基于原型的人臉老化方法Fig.1 Prototype-based face aging method
為解決紋理真實性問題,Tiddeman等人[7]在紋理增強中加入小波變換,突出老化過程中的紋理特征變化,效果更加明顯。王章野等人[8]基于黃種人不同臉型老化模式存在差異的情況,建立黃種人人臉原型庫,提出了一種基于人臉輪廓特征的老化方法,通過計算輸入人臉臉型特征點的局部曲率標準差,匹配人臉數(shù)據庫中的多個原型人臉圖像,利用原型人臉圖像進行人臉紋理合成以及臉部形狀、膚色調整,得到比較真實的老化人臉。Kemelmacher等人[9]提出了一種光照感知年齡(IAAP)方法,考慮場景光照和陰影,利用光流場對原型人臉進行光照調整,使得老化后的人臉紋理真實、清晰。
為解決原型人臉中缺乏個性特征的問題,Shu等人[10]利用親屬關系信息改善年齡老化特征,提出了親屬關系引導的人臉老化方法(KinGAP)。該方法增強了人臉老化中的個性特征,但老化后圖像容易受親屬原型圖像中光照、表情等影響,原型圖像中的重影問題也會弱化面部特征。因此,為了消除原型人臉中的重影問題,Wang等人[11]利用相鄰年齡組之間的演化狀態(tài),提出了基于遞歸神經網絡的遞歸人臉老化(RFA)方法,得到更加真實的老化人臉。
基于原型的人臉老化方法綜合考慮了人臉外觀特征隨年齡增長的變化,包括面部皺紋增多、頭發(fā)變白等,可以反映面部衰老的真實情況,有較好的視覺效果,而且算法簡單、易于實現(xiàn)。但是,該方法對姿態(tài)、表情要求較高,待老化人臉與模型人臉之間的姿態(tài)和表情差異會影響老化效果。另一方面,該類方法的年齡特征信息主要來源于原型人臉,而通過人臉平均方法計算得到的原型人臉通常缺少個體特征,使得老化模型同化,導致老化后的人臉具有一定的相似性,降低跨年齡人臉識別的準確率。
基于傳統(tǒng)模型的老化方法是建立人臉的參數(shù)模型,利用人體測量學等理論,仿真模擬出人臉的骨骼輪廓生長、皮膚紋理變化等,從而對輸入人臉進行老化渲染,老化后的人臉可以保存部分個體特征。
用于模擬人臉結構和皮膚的物理模型有很多,如參數(shù)模型[12]、幾何模型[13]、肌肉動作模型[14]、張力網模型[15]、人臉凹凸和紋理映射模型[16]、表情和皺紋的幾何混合模型[17]、主動外觀模型AAM[18]等,早期的模型主要研究人臉的靜態(tài)模型,對于老化特征細節(jié)研究較少。
人臉老化過程中,五官形狀和皺紋的變化是由面部肌肉、皮膚紋理等生理結構決定的。因此,可以通過表征面部生理結構的參數(shù)模型模擬人臉老化過程,實現(xiàn)老化特征細節(jié)增強。
Wu等人[19]基于靜態(tài)人臉模型和人體測量學提出了用三層結構(肌肉層、結締組織層、皮膚層)模擬人臉老化的方法,采用B樣條插值、線性范性模型等表現(xiàn)層結構的不同特征。雖然對人臉老化過程有較好的表示,但是該模型為動畫模型,無法直接應用于真實人臉的跨年齡識別?;谏锝Y構可以根據受力的大小和方向進行重構的原理,Todd等人[20]利用幾何變換模擬面部結構的老化過程,提出了流體靜力模型模擬人臉生長變化。該模型對面部輪廓隨著年齡變化產生的細微變化具有較高的靈敏度,但模型過于依賴不同類型幾何變換的使用,對于未知的個體,界定合適的變換組合模式需要大量對比實驗,模型泛化能力有待提高。
Ramanathan等人[21]利用面部標志參數(shù)的平均變化來表示年輕人臉的輪廓變化,但是無法模擬復雜的老化紋理,而且實驗過程對樣本要求高,計算量大。在此基礎上,他們設計了基于物理的參數(shù)化肌肉模型和基于圖像梯度的紋理變換函數(shù)兩種新模型[22],分別表示面部肌肉和皮膚皺紋在老化過程中的變化,用以模擬成年人的人臉老化過程,另外,在老化過程中還考慮了體重變化對人臉老化的影響,如圖2所示。此外,還有學者提出通過數(shù)據訓練得到臉部肌肉的生長參數(shù),構建肌肉模型[23],利用年齡子空間中的肌肉幾何和紋理變化信息合成老化后的人臉。
圖2 基于肌肉模型和皮膚紋理的老化模型Fig.2 Face aging model based on muscle model and skin texture
基于生理結構的方法,雖從生物學角度對老化問題進行了建模,但是對解剖學知識要求較高,且參數(shù)較多,模型復雜,計算量較大。因此,部分學者從AAM模型出發(fā),建立人臉老化模型。
AAM模型是通過參數(shù)化的采樣形狀來構建面部形狀模型[24],利用PCA方法描述形狀和紋理特征。Lanitis等人[25]針對兒童的面部成長規(guī)律,建立全局老化函數(shù)描述面部年齡和AAM模型參數(shù)之間的關系,基于已知老化進程的人臉圖像建立老化模型參數(shù)數(shù)據集,模擬兒童的人臉老化過程,但是該方法是利用待老化人臉與數(shù)據庫中人臉圖像的相似性計算衰老參數(shù),真實性與準確性受數(shù)據集影響較大。Patterson等人[26]在主動外觀模型(AAM)中加入人臉老化過程中產生的五官形狀、輪廓變化等參數(shù),使用SVR對AAM模型中年齡相關的參數(shù)進行訓練[27],得到年齡參數(shù)表,合成老化后的人臉,但是該方法未考慮老化過程中的外觀紋理變化。
Wang等人[28]將超分辨率方法[29]與AAM模型相結合,合成人臉老化過程中的面部紋理,并通過構造張量基空間中的單位參數(shù)向量[30]提高算法效率,可以實現(xiàn)人臉老化和逆向合成。但是,受到數(shù)據集規(guī)模的影響,老化后的人臉圖像會出現(xiàn)特征模糊、紋理重疊等情況,合成質量有待進一步提高。Du等人[31]結合NMF算法,提出了一種基于稀疏約束的人臉老化模擬方法,從面部形狀和紋理分別進行老化模擬。為加快運算速度,該方法將圖像轉為灰度圖像進行處理,有一定的數(shù)據損失。基于AAM模型的老化方法可以相對簡化模型,且不需要研究者掌握人類解剖學相關專業(yè)知識,擴展了應用范圍。
此外,Suo等人[32-33]根據圖模型原理,提出了一種多層表示的高分辨率語法人臉模型,將人臉分為整體外觀變化、人臉五官特征和各區(qū)域的皺紋等細節(jié)特征三個層次,用“與-或”圖譜表示,并在時間軸上用動態(tài)馬爾科夫模擬老化過程,如圖3所示,有效地表現(xiàn)了衰老過程中面部外觀的變化,有較好的視覺效果,但是采用面部組件拼接實現(xiàn)的人臉老化,缺少個體特征,且分辨率較低,面部細節(jié)表征較差。
圖3 “與-或”圖譜表示的人臉老化過程Fig.3 Face aging process represented by“and-or”map
基于傳統(tǒng)模型的老化方法通過提取人臉老化的輪廓、形狀和紋理特征,建立老化模型,將人臉圖像像素映射到高維空間,較好地解決了人臉老化合成問題。通過微調不同的模型參數(shù),可以保留部分個體特征。但是,模型類型、參數(shù)設置、老化模式等都會對結果有很大的影響,有時甚至會出現(xiàn)較大的偏差,因此,大部分方法要求研究人員有一定的解剖學知識,了解面部衰老的生物學原理,先驗知識要求較高。另外,該類方法對實驗數(shù)據依懶性強、要求高,通常需要個體多個階段、在時間軸上較為連續(xù)的臉部圖像,算法模型通常較為復雜、實驗仿真時間消耗長。
隨著深度學習、神經網絡方法的不斷推陳出新,人臉識別準確率大大提升,很多研究人員也將深度學習方法應用于人臉老化研究,取得了不錯的效果。
人臉老化的模擬本質上屬于對人臉的合成,目前在圖像合成方面表現(xiàn)最為突出、廣泛的是生成式對抗神經網絡(GAN),因此,現(xiàn)有的基于深度學習的老化方法都是基于GAN模型展開的[34]。
GAN同時訓練兩個模型:一個是生成模型G,用來捕捉訓練樣本的數(shù)據分布,學習生成新的樣本加入訓練;一個是判別模型D,對生成樣本的真實性進行判別。模型G和D利用公式(2)所示的最大最小目標函數(shù)進行動態(tài)博弈,交替訓練,從而得到“以假亂真”的合成圖像。
其中,pdata(x)為訓練數(shù)據,z為服從分布p(z)隨機采樣的向量。
為了解決直接將GAN應用于人臉老化合成帶來的網絡不穩(wěn)定、結果不收斂等問題,Antipov等人[35]首先提出將生成模型G用于在要求年齡類別內生成合成圖像。將GAN改進為基于年齡條件的生成式對抗模型(Age-cGAN),保留原始人臉的身份信息,該模型需要解決每個圖像的L-BFGS算法優(yōu)化問題,因此,該方法效率較低。Liu等人[36]提出了一種條件生成式對抗神經網絡(C-GANs),將判別模型擴展為年齡判別網絡Da和過渡模式判別網絡Dt,其中,年齡判別網絡與每個個體年齡組分布相關過渡模式判別網絡與相鄰兩個年齡組的過渡模式相關,進而增強生成圖像的真實性。
Wang等人[37]設計了一種保留身份的條件生成式對抗神經網絡(IPCGANs)框架,包括條件生成式對抗神經網絡模型(CGAN)、身份保留模塊、年齡分類器三個模塊,在IPCGANs的目標中引入了感知損失,可以有效保存身份信息。Yang等人[38]將CNN[39]用于生成模型的訓練,并提出了一種金字塔結構判別模型模擬高齡人臉特征,按照公式(3)和公式(4)對G模型和D模型交替訓練。該方法對年齡跨度較大的人臉老化效果較好,年齡差低于30歲的老化效果較差。在此基礎上,他們加入條件年齡信息,將模型更新為包含中間老化狀態(tài)的漸進式老化模式[40],進一步細化面部年齡進階和逆向合成過程。
Zeng等人[41]設計了一個基于單個生成式對抗神經網絡的FaceGAN訓練架構,可以實現(xiàn)無監(jiān)督學習,在判別模型中加入輔助多類分類器,引入了預先訓練的深度人臉識別模型[42]和預先訓練的深度年齡估計模型,更好地保留了人臉的身份信息和年齡相似性。Shi等人[43]將注意力模型引入人臉老化過程,構建了CAN-GAN網絡,并設計了有“貢獻”意識的年齡分類器(CAAC),為人臉向量分配不同的權重,提高分類器的能力,增強老化合成的效果,但是老化后人臉的年齡估計與真實年齡相差較大,年齡屬性的準確性有待進一步提高。
Palsson等人[44]提出了基于CycleGAN的模型來進一步細化老化效應,利用周期一致性損失來保存身份信息。在此基礎上,Yang等人[45]針對不同性別老化模式存在差異的問題,提出基于性別差異性的約束模型,用WGAN-GP替換了損失函數(shù),得到更真實的老化人臉。
Liu等人[46]針對兒童人臉生長的特殊性,提出了兒童的人臉老化框架,將老化分為輪廓變化和紋理變化,分別設計幾何形變GAN(GD-GAN)和紋理變化GAN(TV-GAN)模擬兒童及青少年在成長過程中的臉部變化。Fang等人[47]提出了三重生成式對抗神經網絡(Triple-GAN),引入三重變換損失和增強型對抗損失,如圖4所示。使得不同年齡域之間的漸進映射可以完全相關,從而模擬年齡間的復雜相關性,改進老化效果,該方法利用年齡估計值作為收斂條件,年齡表征準確性高,但是面部個體信息損失較多,年齡識別準確率較低。針對未成年的人臉老化問題,Chandaliya等人[48]提出用自注意模塊(SAB)[49]學習兒童面部特征,建立多尺度GAN模型(SAMSP-GAN)。
圖4 Triple-GAN結構圖Fig.4 Framework of Triple-GAN
由于GAN的生成模型是由隨機噪聲產生的,缺乏語義信息,另外有時會產生訓練不穩(wěn)定、梯度消失、模式崩潰等問題。因此有研究學者提出自編碼器(AE)[50]、對抗性自編碼器(AAE)[51]實現(xiàn)圖像合成,如圖5所示。編碼器學習將數(shù)據分布轉換為先驗分布,解碼器學習得到深度生成模型。
圖5 AAE網絡結構圖Fig.5 Structure of AAE network
Zhang等人[52]假設人臉建模于與年齡相關的高維流體上,提出了一種條件對抗性的自編碼器(CAAE),通過隱空間對人臉流形進行學習,從而實現(xiàn)平滑的年齡增長和回歸,如圖6所示。但是由于訓練鑒別器的表達能力不足,僅呈現(xiàn)老化過程中的粗糙皺紋,細節(jié)特征表現(xiàn)較差。Xiao等人[53]在CAAE結構中加入性別分類器,并利用VGG[54]架構最大化原始人臉和老化人臉的面部特征相似性,從而保留身份特征。
圖6 CAAE網絡結構圖Fig.6 Structure of CAAE network
由于深度學習對人臉隱性特征有較強的理解能力,對衰老過程有優(yōu)秀的擬合能力,基于深度學習的老化方法視覺效果明顯優(yōu)于其他方法,真實感得到有效提高。另外,不同層次的網絡設計也可以保留個體特征,用于跨年齡人臉識別。與基于傳統(tǒng)模型的老化方法相比,通過各類網絡結構、合成方法,可以有效減少先驗知識對構建模型的影響,極大地擴大了人臉老化的應用場景。另外,受神經網絡強大學習能力的影響,基于深度學習的人臉老化方法不僅可以擬合低齡到高齡的衰老過程,也可以實現(xiàn)高齡到低齡的人臉逆生長[55]。但是,當前的老化合成方法對五官細節(jié)特征、面部邊緣融合效果較差,圖像分辨率也可以進一步提高。由于人臉的屬性特征是相互糾纏的,改變局部特征會對其他面部特征產生影響,導致年齡估計與人臉識別的準確率仍未同時達到高準確率。
表1 總結梳理了當前人臉老化方法的研究概況。可以看出:(1)基于原型的老化方法老化效果由原型決定,模型同化,缺少個體特征,但是算法相對簡單,對面部的紋理變化表征較好,易于實現(xiàn);(2)基于傳統(tǒng)模型的老化方法按照不同的算法機制可以分為基于面部生理結構、基于AAM模型和基于圖模型,該類方法在老化過程中可以保留一定的個體特征,除增加面部紋理外,實現(xiàn)面部輪廓、五官形狀的變化。但是模型復雜,跨年齡小的人臉老化效果較差;(3)基于深度學習的老化方法可以較好地保留個體特征,老化效果真實,可以分為基于GAN和基于AEE兩類,對于兒童和成年人的人臉老化都有較好的效果,但是現(xiàn)有方法所生成的老化后人臉圖像用于人臉識別準確率較低,基于人臉老化的跨年齡人臉識別方法有待進一步改進。
表1 人臉老化方法總結Table 1 Summary of face aging methods
人臉老化模型的準確性評價、性能評價等是衡量老化算法優(yōu)劣的關鍵環(huán)節(jié)。不同的文獻中,評價方法不盡相同,暫未形成統(tǒng)一的評價體系。目前,常用的評價方法有外觀評價、年齡估計、身份保持評價等。
通過對合成圖像的直接展示,對老化后的人臉圖像整體及細節(jié)部分進行視覺效果分析,如面部的皺紋變化、未成年的顱面生長變化、五官的衰老特征及頭發(fā)顏色的變化等(如圖7所示),主要用于評價老化模式的真實性,包括本算法視覺效果分析和與其他算法的對比實驗等。外觀評價直觀、清晰,是人臉老化模型的基礎評價方法,屬于定性評價。
圖7 外觀評價Fig.7 Appearance evaluation
另外,也可以利用數(shù)據集中的真實老化圖像,基于真實年輕圖像對合成老化圖像和真實老化圖像進行比較評分[27]或判斷哪一張更可能是真實年輕圖像的老化圖像[9],從而對合成老化圖像進行定量的外觀評價。
年齡估計是對合成后的圖像進行年齡評估,從而分析合成的圖像是否能正確表現(xiàn)老化后的年齡,具體的估計方法主要包括兩大類:
第一類是通過志愿者對合成后人臉的年齡進行估計[7,36-37,44],與老化后的實際年齡進行比較,評價老化模型對年齡表現(xiàn)的準確性。這種估計方法主觀性強,受志愿者人數(shù)、年齡評估能力、人臉分辨能力影響較大,對非志愿者本種族的年齡估計誤差較大。
第二類是利用已有的人臉識別方法。在深度學習方法快速發(fā)展后,年齡估計算法也日漸成熟和穩(wěn)定,使用成熟的年齡估計算法(軟件)如Face++[37-38,43,46,52,55-56]、百度人臉識別平臺[46]等對老化后的人臉進行年齡估計,并與老化模型中設置的老化年齡參數(shù)進行比較,評價老化算法表現(xiàn)年齡的準確性和魯棒性。
如表2所示,以使用MORPH數(shù)據集的老化方法為例,將老化后的年齡分為31~40、41~50、51~60三個年齡區(qū)間,利用Face++對老化合成后的人臉進行年齡估計,計算合成老化后的年齡估計值與實際老化年齡的差值的平均值(表中“平均年齡差”),可以直觀地表現(xiàn)出不同算法對不同年齡段的老化效果。
表2 人臉老化方法的年齡估計誤差Table 2 Age estimation error of face aging methods
通過對比老化合成圖像與原始圖像、不同年齡的老化合成圖像、老化合成圖像與真實老化圖像,評估老化方法對人臉圖像中身份信息的保持情況??梢酝ㄟ^主觀評價[45]和成熟的人臉比對算法(軟件)如Face++[38,43,46-47,55]、Open AI[37]、Open Face[35]等對人臉圖像進行相似度評價。
如表3所示,以使用MORPH數(shù)據集的老化方法為例,將老化后的年齡分為31~40、41~50、51~60三個年齡區(qū)間,利用Face++對老化合成后的人臉和原始圖像進行驗證,其中Face++的閾值為76.5,F(xiàn)AR為10-5。
表3 人臉老化方法的身份保持評價結果Table 3 Face verification results of face aging methods
由于大部分數(shù)據庫中缺少真實老齡人臉圖像,當前的絕大部分文獻只對身份保持評價中的前兩項或其中一項進行相似度比較,對于老化合成圖像和真實老化圖像的評價方法使用得較少。
由于無法有效評價人臉老化模型身份保持的準確性,現(xiàn)有方法雖然可以得到較好的視覺效果,但是仍停留在理論研究階段,很難直接應用于犯罪長期在逃人員、長期失蹤兒童的人臉識別中。
MORPH數(shù)據集是2003年至2007年之間收錄的67 600個個體在不同年齡段的402 055張人臉圖像[58],如圖8所示,主要為標準條件下拍攝的正面免冠人臉圖像,無遮擋、光照條件和面部表情相似,廣泛應用于年齡估計[59-60]、人臉老化等領域。
圖8 MORPH數(shù)據集示例Fig.8 Example of MORPH dataset
該數(shù)據集包含年齡、性別、種族等標簽信息,如表4、表5所示。數(shù)據集的年齡從16歲至77歲,范圍較大,但是多集中于中青年階段,未成年和老年的人臉圖像較少。另外,受收集時間的限制,個體的年齡變化最多為4.6年,年齡跨度較小,老化特征變化不明顯。在種族屬性方面,主要是非洲人和歐洲人,亞洲人的人臉圖像較少。
表4 MORPH數(shù)據集的圖像數(shù)據統(tǒng)計Table 4 Image data statistics in MORPH dataset
表5 MORPH數(shù)據集的個體數(shù)據統(tǒng)計Table 5 Individual data statistics in MORPH dataset
跨年齡名人數(shù)據集(Cross-Age Celebrity Dataset,CACD)是從互聯(lián)網上收集的2 000位明星的163 446張圖像[61],數(shù)據集中每張圖像提供了16個人臉關鍵點的標注信息,年齡范圍從16歲至62歲,如圖9所示,包含個體不同年齡、光照環(huán)境、表情和角度的人臉圖像,主要用于年齡估計[62]、跨年齡的人臉識別和檢索。
圖9 CACD數(shù)據集示例Fig.9 Example of CACD dataset
該數(shù)據集中大部分圖像都是化妝后的人臉圖像,對年齡估計、老化特征提取與分析等造成一定影響。數(shù)據集中的個體年齡跨度較大,同一個體不同年齡的人臉圖像相對較多,但是個體的年齡是通過網絡檢索得到的拍攝日期減去出生日期估算得到的,年齡標簽存在誤差。
FG-Net數(shù)據集[4]包含82個個體在不同年齡段的1 002張圖像,且每幅圖像中包含68個人臉關鍵點信息,年齡范圍從0歲到69歲,如圖10所示,為同一個體在不同年齡階段的拍攝的人臉圖像,常用于年齡估計[63]、跨年齡人臉識別、年齡變化推演[64]等。
圖10 FG-Net數(shù)據集示例Fig.10 Example of FG-Net dataset
數(shù)據集來源于舊照片掃描,圖像分辨率和清晰度不穩(wěn)定,存在黑白圖像,且圖像背景、色調、光照強度上都存在較大差異。該數(shù)據集中,87.13%的圖像為30歲以下的人臉圖像,70%以上的個體包含低齡照片,適用于低齡的跨年齡人臉識別和年齡估計研究。另外,數(shù)據集中的個體絕大部分為白種人,缺少其他種族的跨年齡人臉圖像。
IMDB-WIKI數(shù)據集[65]是目前規(guī)模最大的跨年齡數(shù)據集之一,分為IMDN數(shù)據集和Wikipedia數(shù)據集兩部分,分別從互聯(lián)網電影資料庫(Internet Movie Database,IMDB)網站和維基百科網站上獲取得到,其中,IMDB數(shù)據集包含20 284位明星的460 723張圖像,Wikipedia數(shù)據集包含這些名人的62 328張圖像,一共523 051張人臉圖像。年齡范圍從0至119歲,如圖11所示,人臉圖像標注有性別、年齡等標簽信息,包括不同人數(shù)、遮擋、姿態(tài)、光照、背景、表情等情形,可以用于年齡估計[66]、性別識別[67]、人臉老化等研究。
圖11 IMDB-WIKI數(shù)據集示例Fig.11 Example of IMDB-WIKI dataset
該數(shù)據集中的人臉圖像大部分是化妝后圖像,會影響年齡估計、人臉老化的準確性。人臉圖像中的年齡信息通過圖像拍攝時間戳和出生日期估算得到,由于數(shù)據集標注過程是自動處理的,因此標注一般質量不高,且年齡信息存在錯誤內容,訓練前需要過濾錯誤信息。
UTKFace數(shù)據集是從互聯(lián)網獲取的23 708張人臉圖像,年齡范圍從0歲至116歲,如圖12所示。每張圖像有68個標注點,標注有年齡、性別、種族等信息。包括不同的姿勢、面部表情、光照、遮擋等,可以用于年齡估計[68]、人臉老化、種族識別[69]等研究。
圖12 UTKFace數(shù)據集示例Fig.12 Example of UTKFace dataset
該數(shù)據集中包含已經剪裁、對齊的人臉圖像,年齡、種族、性別等信息是通過DEX算法估計得出,存在一定誤差。另外,該數(shù)據集主要按照年齡屬性進行分類,缺少個人信息,無法獲取個體的年齡跨度信息。
對上述跨年齡數(shù)據集及其在基于人臉老化的跨年齡人臉識別算法中的使用情況進行比較和分析,如表6、表7所示。MORPH數(shù)據集和IMDB-WIKI數(shù)據集在個體數(shù)和人臉圖像數(shù)量上有一定的優(yōu)勢,IMDB-WIKI數(shù)據集和UTKFace數(shù)據集的年齡范圍較大,而FG-Net數(shù)據集中個體的年齡跨度較大,且包含未成年人的臉部圖像,對于研究兒童的人臉老化有較好的作用。
表6 跨年齡人臉圖像數(shù)據集的對比Table 6 Comparison of cross-age face image datasets
表7 數(shù)據集在文獻中的使用情況Table 7 Use of datasets in literature
其中,CACD數(shù)據集和IMDB-WIKI數(shù)據集是網絡獲取的圖像,個體年齡通過網絡信息估算得到,誤差較大,另一方面,這兩個數(shù)據集都是以明星為主,照片大部分為劇照、采訪照、寫真照等,圖像質量參差不齊,且化妝效果、表情都會對普通人臉老化的模擬產生影響。MORPH數(shù)據集雖在數(shù)量上有一定的優(yōu)勢,但是年齡跨度太小,對于人臉老化的進程研究作用較小。FG-Net數(shù)據集的個體數(shù)和圖像數(shù)較少,用于神經網絡訓練容易產生較大的偏移。UTKFace數(shù)據集中的個體雖然年齡范圍較大,但是由于缺乏個體信息,無法得到個體隨年齡變化的臉部特征。另外,這些數(shù)據庫絕大多數(shù)的個體都是歐洲裔和非洲裔,缺少亞洲跨年齡人臉圖像。
作為跨年齡人臉識別中的重要部分之一,人臉老化研究取得了相當?shù)倪M展,但是另一方面,對于實際應用,尤其是犯罪長期在逃人員、長期失蹤兒童的人臉識別等問題,仍然存在現(xiàn)有數(shù)據不充分、評價體系不完整、實際應用難實現(xiàn)、方法待改進等問題。因此,未來研究可以考慮以下幾個方面:
(1)建立人臉老化數(shù)據集
數(shù)據集的數(shù)量和質量對于深度學習模型訓練有著非常重要的作用,人臉老化研究的關鍵在于分析個體在不同年齡段的臉部特征變化。當前的數(shù)據集都不能完全滿足這一條件。其次,當前的可以用于人臉老化研究的數(shù)據集中亞洲人(尤其是中國人)的數(shù)據較少。未來,建立隨年齡(年齡段)連續(xù)變化的人臉圖像數(shù)據集將是跨年齡人臉識別研究的首要任務。
(2)降低老化模型數(shù)據依賴
當前,跨年齡數(shù)據集的不完備性大大影響了基于人臉老化的跨年齡人臉識別技術發(fā)展,在隨年齡連續(xù)性變化人臉樣本圖像較少的情況下,改進現(xiàn)有基于深度學習的人臉老化方法,減少老化模型對數(shù)據依賴,將弱監(jiān)督[70-71]、自監(jiān)督[72-73]學習方法融入深度學習網絡中,利用現(xiàn)有的小樣本數(shù)據得到更為真實、準確的人臉老化模型,從而達到智能學習的目的。
(3)考慮群體特征與個體特征差異
現(xiàn)有研究在實際中應用較少,是因為依賴生成模型的人臉老化實質上是對低齡人臉的重新生成[74],當前的人臉老化模型大都是研究人類衰老過程的一般規(guī)律(即群體特征),個體老化特征考慮較少,會導致老化后的人臉損失個人身份信息,降低跨年齡人臉識別準確率。為解決這一問題,可以引入注意力機制[75],利用群體特征和個體特征的權重設置和定向屬性修改,實現(xiàn)對老化屬性特征的進一步細化控制,提高老化模型真實性的同時,保留個體特征,提高跨年齡識別的準確率。
(4)三維人臉老化研究
老化后的人臉三維模型比二維更加直觀,特征也更加豐富,融合二維圖像和三維數(shù)據的人臉識別結果明顯優(yōu)于僅使用單模態(tài)數(shù)據的識別結果[76],對于多姿態(tài)的跨年齡人臉識別有著更重要的作用。雖然,三維人臉合成技術已經有了一定的研究成果[77-78],但是三維人臉老化過程中涉及的面部輪廓變化、不同角度的皮膚紋理、為表現(xiàn)立體感而引入的渲染與重光照步驟以及維度增加導致的數(shù)據量增長,都會提高模型的復雜度和數(shù)據訓練的難度,是未來待解決的重要問題之一。