陳月 吳戀 周華麗 熊琴 代芳穗 田芳
摘 要:針對替考現(xiàn)象屢禁不止的現(xiàn)狀,提出了基于Deep ID人臉檢測身份技術(shù)來辨別考生的真實性。臉部是每個人最具代表性的特征,每個人的臉部紋路都具有唯一性,且更易提取,所以人臉識別將是考場驗證的首選。隨著深度學(xué)習(xí)的提出,人臉識別的使用頻率不斷提高,其準確率也不斷提升。人臉識別運用于多個領(lǐng)域,并取得了重大突破,根據(jù)最新的研究,建議使用、人臉識別算法Deep ID技術(shù)驗證考生身份。文中闡述了人臉識別用于檢測考生身份一致性的可行性,可有效防止考生替考作弊等情況出現(xiàn)。
關(guān)鍵詞:深度學(xué)習(xí);身份驗證;卷積神經(jīng)網(wǎng)絡(luò);Deep ID
中圖分類號:TP393 文獻標識碼:A 文章編號:2095-1302(2018)07-00-03
0 引 言
通過數(shù)據(jù)分析可知,替考現(xiàn)象屢禁不止,由于人眼識別的準確率較低,不論大型還是小型考試都存在不公平現(xiàn)象。如今,深度學(xué)習(xí)技術(shù)已滲入各領(lǐng)域,Deep ID更掀起了一股學(xué)習(xí)新潮,因此將Deep ID人臉識別技術(shù)運用到考生認證中,提高考生的考前認證效率與準確率,避免替考,實現(xiàn)考試的公平公正。
1 人臉識別的研究發(fā)展
中國研究人臉識別技術(shù)時,側(cè)重人臉識別及多種模式的人機交互技術(shù)[1],其中Deep ID算法所應(yīng)用的人臉識別技術(shù)已被應(yīng)用到諸多領(lǐng)域?,F(xiàn)階段,人臉識別已逐漸延伸到多種實際生活場景中。人臉檢測技術(shù)已由圖片的簡單處理發(fā)展到圖像的實時處理,已從傳統(tǒng)技術(shù)轉(zhuǎn)變?yōu)樯疃葘W(xué)習(xí)技術(shù)[2]。
2 常用人臉識別技術(shù)簡介
2.1 TENCENT-BESTIMAGE
早先,相冊產(chǎn)品中出現(xiàn)了優(yōu)圖人臉檢測器[3]。之后,優(yōu)圖人臉檢測器相繼應(yīng)用于諸多APP移動產(chǎn)品中。2014年,優(yōu)圖為保證高準確率,挑選出十萬張沒有人臉的照片作為負樣本進行訓(xùn)練,奪得FDDB桂冠。
優(yōu)圖不斷優(yōu)化技術(shù),在Viola與Jones提出瀑布式檢測框架后[4],利用不一樣的特征提取方式,增加了系統(tǒng)的表達能力;采用光照分離技術(shù),進行多次技術(shù)改進與算法迭代后[5],技術(shù)發(fā)生了革命性變化,利用AUC技術(shù)提高設(shè)備分類能力,使用Vector Boosting等技術(shù)將不同特征的人臉歸屬到一個框架。
2.2 FaceNet
FaceNet人臉檢測算法[6]將CNN和Triplet Mining相結(jié)合,在LFW數(shù)據(jù)集上測試,其準確度高達99.63%,在YouTube人臉數(shù)據(jù)集上進行測試[7],其準確度也達到95.12%,相比之前的準確度提高了近30%。通過卷積神經(jīng)網(wǎng)絡(luò)技術(shù)將人臉圖像映射到特定的特征向量中,可由此計算出不同的人臉特征距離。
判斷兩張人臉照片是否屬于同一個體可通過計算照片的人臉特征[8],距離閾值等方法。谷歌通過CNN技術(shù)把圖像映射到特定的歐幾里得空間內(nèi)[9]。圖片相似度與空間距離成正相關(guān),該映射確定下來后,人臉識別任務(wù)將變得簡單。
2.3 Face++
Face++是曠視科技公司研發(fā)的人臉識別云服務(wù)平臺[10]。近年,他們推出一款游戲,曾位居APP Store國內(nèi)區(qū)排行榜前五,可由于游戲開發(fā)經(jīng)驗不足及基礎(chǔ)知識掌握不夠,他們隨即將精力轉(zhuǎn)移到人臉識別檢測的基層技術(shù)完善方面。
Face++應(yīng)用的人臉識別技術(shù)中有兩個特殊例子。其中一個例子是世紀佳緣網(wǎng)站,客戶可根據(jù)自己對另一半的要求,輸入另一半長相的特征點,搜索相似外貌的異性用戶,這個搜索在數(shù)據(jù)庫中進行,當(dāng)下該數(shù)據(jù)庫是世紀佳緣網(wǎng)站的內(nèi)部數(shù)據(jù)庫,日后可成為各大社交網(wǎng)絡(luò)上的人臉數(shù)據(jù)庫。第二個例子是與360搜索引擎合作,在360搜索的圖片搜索中利用識別檢測技術(shù)對圖片進行檢索。
如今Face++已發(fā)展到能夠穩(wěn)定應(yīng)對不同人臉姿態(tài)并對其處理的地步,且其技術(shù)已更新為深度學(xué)習(xí)算法,此外,F(xiàn)ace++還通過自己獨特的算法可將每張人臉壓縮到僅有幾個字節(jié)的長度。
3 基于深度學(xué)習(xí)的人臉識別技術(shù)
3.1 深度學(xué)習(xí)技術(shù)
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
近些年,人臉識別領(lǐng)域一直密切關(guān)注CNN的相關(guān)技術(shù)。特別是CNNs在FRUE上取得的令人印象深刻的成果。20世紀60年代,Hubel與Wiesel在研究貓腦皮層時發(fā)現(xiàn)了獨特的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并由此進行相關(guān)研究。CNN是一種前饋神經(jīng)網(wǎng)絡(luò),是圖像處理領(lǐng)域的一種應(yīng)用,其中人工神經(jīng)元可以對應(yīng)周圍的單元,進行大型圖像處理。CNN含有兩層,第一層為提取層,神經(jīng)元輸入時跟上一層接受域相連;第二層為映射層,每個特征映射為一個平面,全部神經(jīng)元權(quán)值相等。卷積神經(jīng)網(wǎng)絡(luò)的每個卷積層都有一個分計算層,用來計算局部平均二次提取值,減少分辨率。卷積神經(jīng)網(wǎng)絡(luò)主要用于識別扭曲不變的二維圖像,其特點局部權(quán)值共享在圖像處理方面具有優(yōu)越性,利用梯度下降+鏈式求導(dǎo)法則對節(jié)點進行求導(dǎo),能從不同種類的值組成的集合中學(xué)習(xí)得到需要的函數(shù)。
圖像中的對象并不完全一致,但在訓(xùn)練CNN之前臉部圖像效果較好。它在Deep Face中聲明,一個池層在本地轉(zhuǎn)換健壯性和保存紋理細節(jié)之間需要很好的平衡。Deep Face的另一個貢獻是3D人臉對齊。傳統(tǒng)方法中,人臉圖像在輸入之前可以使用二維相似變換來對齊。然而,該2D對齊無法處理平面旋轉(zhuǎn)。為克服這一局限性,DeepFace提出了一種利用仿射攝像機模型的三維對準方法。
3.1.2 Deep ID
孫祎是香港中文大學(xué)的博士,是Deep ID人臉算法的發(fā)明者。Deep ID算法充分利用卷積神經(jīng)網(wǎng)絡(luò),能夠表征1 000多種分類的特征,且分類精度較好,不會因數(shù)據(jù)集過小而產(chǎn)生擬合,在人臉識別數(shù)據(jù)集LFW上測試的準確度高達97.45%。
Deep ID技術(shù)中卷積神經(jīng)網(wǎng)絡(luò)起到了學(xué)習(xí)特征的作用,輸入圖片后,Deep ID將得到一個160維的向量,之后在該160維向量上使用現(xiàn)有的貝葉斯學(xué)習(xí)組合進行分類,得出結(jié)論。卷積神經(jīng)網(wǎng)絡(luò)計算的特征值區(qū)分度大且緊湊,因此得到的效果將會更好。其數(shù)據(jù)集對于Deep ID或任何卷積神經(jīng)網(wǎng)絡(luò)都較為重要,數(shù)據(jù)集將會使卷積神經(jīng)網(wǎng)絡(luò)得到充分訓(xùn)練,Deep ID將增加新的數(shù)據(jù)[11]與更多圖片。其次是裁剪圖片,多角度裁剪,然后使用PCA降維計算好的向量組合。
Deep ID與Deep Face存在截然不同的地方,Deep Face在訓(xùn)練神經(jīng)網(wǎng)絡(luò)之前會使用對齊方法。我們認為一旦經(jīng)過人臉對齊,人臉的面部特征就會固定在部分像素中,就可利用卷積神經(jīng)網(wǎng)絡(luò)對其進行特征學(xué)習(xí)。針對同樣的問題,Deep ID并未采用對齊方法,而是將一個人臉劃分成很多部分,每個部分都會訓(xùn)練一個模型,然后將模型聚合。
Deep ID2在Deep ID上改進了CNN的結(jié)構(gòu),采用圖像識別方面的最新網(wǎng)絡(luò)結(jié)構(gòu),且層數(shù)加深。Deep ID2與Deep ID的不同之處在于新的網(wǎng)絡(luò)結(jié)構(gòu)以47×55的圖片為輸入,并添加了驗證信號,網(wǎng)絡(luò)結(jié)構(gòu)也得到了修改,提取到的特征維度也得到了增加。利用前向-后向貪心算法選擇小的圖像塊[12]。Deep ID2+在Deep ID2的基礎(chǔ)上修改了網(wǎng)絡(luò)架構(gòu),接著對卷積神經(jīng)網(wǎng)絡(luò)進行分析和研究,將向量從160維提升到512維,結(jié)合CeLeFaces+與WDRef數(shù)據(jù)集組成訓(xùn)練集,第一層和第二層max-pooling層都分別連接到Deep ID層。
Deep ID3在LFW上的測試準確率為99.53%,相比Deep ID2+性能大幅提升,更加精確。
3.2 驗證身份技術(shù)
3.2.1 人臉檢測
技術(shù)部門可通過攝像頭采集不同的人臉圖像,當(dāng)客戶處于拍攝范圍內(nèi)時,攝像頭將通過界面控制按鍵實時拍攝客戶的人臉,可實時、準確地找出人臉的特征位置點。
3.2.2 人臉特征提取
人臉特征提取過程中,攝像頭首先感應(yīng)到人臉的5個特征點,即兩個眼睛、鼻子邊界點和嘴巴的邊界點,基于兩眼和嘴巴對齊。將人臉劃分為60個部分,其中包括10個子區(qū)域、3個尺度和顏色通道等。
3.2.3 人臉驗證
選中向量后利用PCA降維,對于輸出后的向量可以使用聯(lián)合貝葉斯模型進行分類。利用得出的數(shù)值來衡量身份證和真人是否為同一個人[13]。在訓(xùn)練集上可以得到一個相似值,當(dāng)相似度值大于固定值時,為同一個人;當(dāng)相似度小于固定值時,非同一個人。在進行確認分析中即可得出結(jié)論。
4 驗證身份真實性的人臉識別系統(tǒng)市場意義
作弊是一種欺騙行為,為了自己的利益而忽視了對他人的公平使考試的功能沒有得到正常發(fā)揮,因此研究防作弊的科技手段十分必要。
如今,各個行業(yè)都離不開科技的支撐,教育界亦然。近幾年較熱門的技術(shù)就是人臉識別研究,并且隨著人臉識別技術(shù)的不斷突破,學(xué)者們的研究熱情高漲。
人臉識別已不是一個新詞,但是它的研究卻從未停下,在當(dāng)今科技發(fā)展的時代,我們也與時俱進使用最新的算法——Deep ID,盡可能達到驗證的準確率和高效率。證件的照片與真人比對,顯示兩者相似度,機器識別代替人眼,有效杜絕替考。
5 結(jié) 語
實驗結(jié)果證明,將身份證人臉識別系統(tǒng)運用在考生驗證上效果明顯,準確率高,還可對意在作弊的考生起到震懾作用。與傳統(tǒng)驗證方法相比,該方法可明顯降低核對時間,減輕監(jiān)考老師任務(wù),更加有利地降低考生作弊的頻率。
參考文獻
[1] SUN Y,LIANG D,WANG X,et al. Deepid3:Face recognition with very deep neural networks[Z]. Computer Science,2015.
[2] ZHU Z,LUO P,WANG X,et al.Recover canonical-view faces in the wild with deep neural networks[Z].Eprint Arxiv,2014.
[3] SCHROFF F,KALENICHENKO D,PHILBINJ. Face Net:a unified embedding for face recognition and clustering[Z].Computer Vision & Pattern Recognition,2015:815-823.
[4] TRAN A T,HASSNERT,MASI I,et al.Regressing robust and discriminative 3D norph able models with a very deep neural network[C].IEEE Conference on Computer Vision & Pattern Recognition,2017:1493-1502.
[5] CHOI H C,KIM S Y,OH S H,et al.Pose invariant face recognition with 3D morph able model and neural network[J]. IEEE International Joint Conference on Neural Networks,2008,48(1):4131-4136.
[6] HE K,SUN J.Convolutional neural networks at constrained time Cost[C].IEEE Conference on Computer Vision & Pattern Recognition,2015.
[7] TAIGMAN Y,YANG M,RANZATO M A,et al. Deep face:Closingthe gap to human-level performance in face verification[C]//Comput-er Vision and Pattern Recognition,IEEE Conferenceon. IEEE,2014:1701-1708.
[8] MOHADDAM B,PENTLAND A. Probabilistic visual learning for object recognition[J].IEEE Trans.,Pattern Analysisand Machine Intelligence,1997,19(7):696-710.
[9] HUANG T S,YANG G Z.Human face detection in a complex background[J].Pattern Recognition,1994,27(1):53-63.
[10] SAMAL A,IYENGAR P A.Automatic recognition and analysis of human faces and facial expressions:A Survey[J].Elsevier Science,1992,25(1):65-77.
[11] GOLDSTION R J,HARMON L D,LESK A B. Man-machine interaction in human face identification[J]. Bell Syst Tech Journal,2014,51(2):399-427.
[12] PARKER F.Computer Generated Animation of Faces[C].In Proceedings ACM ANN Conference. New York,1972,1:451-457.
[13] ALLEN A L.Personal descriptions[M].Lodon:Butterworth,1950.
[14] GUO S H,YONG X Y. When face recognition meets with deep learning:an evaluation of convolutional neural networks for face recognition[Z].