程冠琦
摘要:人臉識(shí)別技術(shù)作為一種生物識(shí)別技術(shù),已經(jīng)廣泛地應(yīng)用于各個(gè)領(lǐng)域內(nèi)的身份驗(yàn)證系統(tǒng),課堂考勤系統(tǒng)是人臉識(shí)別技術(shù)應(yīng)用的重要領(lǐng)域。傳統(tǒng)的人臉識(shí)別課堂考勤存在著識(shí)別速度慢、準(zhǔn)確率低的問題。隨著深度學(xué)習(xí)的流行,基于深度學(xué)習(xí)的人臉識(shí)別逐漸取代了傳統(tǒng)的人臉識(shí)別。
本文利用了基于深度學(xué)習(xí)的SSD目標(biāo)檢測算法、FaceNet算法和SENet算法,結(jié)合谷歌的深度學(xué)習(xí)框架平臺(tái)TensorFlow,對傳統(tǒng)的人臉識(shí)別課堂考勤系統(tǒng)進(jìn)行了改進(jìn)和優(yōu)化,有效地提升了人臉識(shí)別考勤的效率和準(zhǔn)確度。
關(guān)鍵詞:深度學(xué)習(xí);人臉識(shí)別;課堂考勤
中圖分類號(hào):TP18? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)13-0182-02
Abstract: As a biometric technology, face recognition technology has been widely used in various fields of identity verification system, classroom attendance system is an important application field of face recognition technology. Traditional face recognition classroom attendance has the problems of slow recognition speed and low accuracy. With the popularity of deep learning, face recognition based on deep learning gradually replaces the traditional face recognition.
This paper uses SSD target detection algorithm based on deep learning, facenet algorithm and senet algorithm, combined with Google's deep learning framework platform tensorflow, to improve and optimize the traditional face recognition class attendance system, effectively improving the efficiency and accuracy of face recognition attendance.
Key words:deep learning;face recognition;class attendance
人臉識(shí)別技術(shù)作為一種高安全性的生物識(shí)別技術(shù),近年來已經(jīng)成為研究的熱點(diǎn)。
人臉識(shí)別算法于20世紀(jì)60年代開始研究,到目前經(jīng)過了三個(gè)發(fā)展歷史階段。第一個(gè)階段是早期的人臉識(shí)別算法,該階段的算法包括基于幾何特征的算法、基于模板匹配的算法、基于子空間算法等。
第二個(gè)階段是基于人工特征和分類器的算法。此階段中,人臉圖像是否能夠進(jìn)行識(shí)別和區(qū)分,取決于人工特征的設(shè)計(jì)質(zhì)量。有HOG、SIFT、Gabor、LBP等多種方法用于描述圖像的特征,用來設(shè)計(jì)和解決人臉識(shí)別問題。
第三個(gè)階段是基于深度學(xué)習(xí)的人臉識(shí)別算法。自2012年深度學(xué)習(xí)在ILSVRC-2012取得成功之后,基于深度學(xué)習(xí)的方法被廣泛應(yīng)用,發(fā)展迅猛?;谏疃葘W(xué)習(xí)的方法中,核心技術(shù)是卷積神經(jīng)網(wǎng)絡(luò)。通過對海量樣本的訓(xùn)練學(xué)習(xí),大大提升了前兩個(gè)階段的人臉識(shí)別效果。
基于此,研究基于深度學(xué)習(xí)的人臉識(shí)別算法,改進(jìn)傳統(tǒng)的人臉識(shí)別算法,具有重要的意義。
1深度學(xué)習(xí)
深度學(xué)習(xí)(Deep Learning)概念屬于機(jī)器學(xué)習(xí)的范疇,是指通過對海量訓(xùn)練樣本的訓(xùn)練和學(xué)習(xí),獲得訓(xùn)練樣本的內(nèi)在規(guī)律和表示層次,從而能夠使機(jī)器獲得接近于人的學(xué)習(xí)分析、識(shí)別文字、圖像和聲音數(shù)據(jù)的能力。
深度學(xué)習(xí)廣泛地應(yīng)用于數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、自然語言處理等多個(gè)領(lǐng)域,大大推動(dòng)了人工智能技術(shù)的進(jìn)步。
2卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)最早起源于19世紀(jì)60年代,當(dāng)時(shí)研究發(fā)現(xiàn),每個(gè)視覺神經(jīng)元中只能處理一小塊區(qū)域的視覺圖像,即感受野(Receptive)的概念。20世紀(jì)80年代,作為最早的CNN原型,神經(jīng)認(rèn)知機(jī)這一概念被提出并問世。神經(jīng)認(rèn)知機(jī)中包含了用于提取特征的神經(jīng)元和用于抗形變的神經(jīng)元,分別對應(yīng)于卷積核濾波操作和激活函數(shù)、池化等操作。
卷積神經(jīng)網(wǎng)絡(luò)包含了卷積層、池化層、全連接層三大部分,其中前兩者的主要作用是提取和選擇人臉圖像的特征,而全連接層一般出現(xiàn)在整個(gè)網(wǎng)絡(luò)的最后幾層,起到了對整個(gè)網(wǎng)絡(luò)進(jìn)行分類的作用。卷積神經(jīng)網(wǎng)絡(luò)最為核心的部分包括局部連接、權(quán)值共享、池化層、降采樣。其中局部連接和權(quán)值共享極大地降低了參數(shù)的數(shù)量和訓(xùn)練的復(fù)雜度、簡化了過度擬合問題。
卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。
目前,幾種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),如AlexNet、VGGNet、InceptionNet、ResNet,在人臉識(shí)別和檢測上已經(jīng)取得了顯著的效果。
3基于深度學(xué)習(xí)的人臉識(shí)別算法
人臉檢測、人臉識(shí)別、人臉關(guān)鍵點(diǎn)定位是人臉識(shí)別的三個(gè)關(guān)鍵步驟。在此,對三個(gè)關(guān)鍵步驟實(shí)現(xiàn)的深度學(xué)習(xí)算法進(jìn)行闡述。
基于深度學(xué)習(xí)的SSD目標(biāo)檢測算法是人臉檢測步驟中應(yīng)用較為廣泛的算法。這是一種通用物體的檢測算法,該算法由ECCV2016提出,采用了Anchor機(jī)制,完整地實(shí)現(xiàn)了端到端的訓(xùn)練。
SSD目標(biāo)檢測算法的模型結(jié)構(gòu)中,主干網(wǎng)絡(luò)可以是VGGNet,ResNet,目標(biāo)物體的特征學(xué)習(xí)主要通過主干網(wǎng)絡(luò)和多尺度的特征圖來進(jìn)行完成。SSD目標(biāo)檢測算法的模型結(jié)構(gòu)圖如圖2所示。
在人臉的識(shí)別方面,目前由于卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方面的廣泛應(yīng)用,基于CNN的人臉識(shí)別算法也不斷涌現(xiàn),如DeepFace算法、DeepID算法、FaceNet算法等等。DeepFace算法是最早的把CNN應(yīng)用于人臉識(shí)別的算法,可以看作是由傳統(tǒng)算法向基于深度學(xué)習(xí)的算法的過渡,它采用了檢測、對齊、提取和分類的過程。DeepID算法與DeepFace算法類似,同樣沿用了檢測、對齊、提取和分類的過程。
FaceNet算法由谷歌公司提出,該算法的核心在于人臉圖像空間和歐幾里得空間的映射,進(jìn)而通過計(jì)算圖像在歐幾里得空間之間的距離來判斷圖像之間的類似程度。FaceNet算法的模型結(jié)構(gòu)如圖3所示。
在人臉關(guān)鍵點(diǎn)定位方面,目前比較流行的是基于深度學(xué)習(xí)的SENet算法,該算法的關(guān)鍵在于獲取特征通道的權(quán)重以及基于權(quán)重的排序,排序完成之后可以提取相關(guān)特征,從而提高網(wǎng)絡(luò)的性能,是一種輕量級(jí)的算法。
SENet算法的模型結(jié)構(gòu)如圖4所示。
4深度學(xué)習(xí)人臉識(shí)別算法在課堂考勤中的應(yīng)用
考勤作為課堂管理和學(xué)生評(píng)價(jià)的一個(gè)重要環(huán)節(jié),歷來受到極大的關(guān)注??记诜椒ê图夹g(shù)也經(jīng)歷了一個(gè)較長的發(fā)展階段。從最初的人工考勤、刷卡考勤、基于移動(dòng)端的考勤到目前的生物識(shí)別考勤技術(shù)(如虹膜識(shí)別、指紋識(shí)別、人臉識(shí)別)。本質(zhì)上講,課堂考勤是人臉識(shí)別技術(shù)應(yīng)用的一個(gè)重要領(lǐng)域,但目前而言,應(yīng)用于課堂考勤的人臉識(shí)別技術(shù)基本還停留在傳統(tǒng)的人臉識(shí)別算法,在識(shí)別率、速度和準(zhǔn)確率上還無法達(dá)到目前智慧校園和智慧課堂建設(shè)的要求,因此,將基于深度學(xué)習(xí)人臉識(shí)別算法應(yīng)用于課堂考勤,改進(jìn)傳統(tǒng)人臉識(shí)別算法,是非常有必要的。
本文利用谷歌的深度學(xué)習(xí)框架平臺(tái)TensorFlow,結(jié)合OpenCV開源庫,采用目前流行的Python編程語言,選用MySQL后臺(tái)數(shù)據(jù)庫,對考勤系統(tǒng)進(jìn)行改進(jìn)和優(yōu)化。
系統(tǒng)整體架構(gòu)上采用傳統(tǒng)的客戶端/服務(wù)器端的架構(gòu)模式。服務(wù)器端是系統(tǒng)的核心部分,也是算法應(yīng)用的重點(diǎn)。人臉識(shí)別的主要流程和算法,包括人臉圖像檢測、注冊、識(shí)別和算法模型的加載等等,都在服務(wù)器端實(shí)現(xiàn)。初始化結(jié)束之后,先調(diào)用基于SSD算法的人臉檢測模型,進(jìn)入人臉檢測模塊;檢測完成之后,調(diào)用加載好的基于FaceNet的人臉識(shí)別模型,從中提取人臉特征信息,然后保存在MySQL數(shù)據(jù)庫中;人臉登錄模塊將對輸入的人臉圖像提取體征值后,按照FaceNet算法計(jì)算與數(shù)據(jù)庫中注冊的人臉的空間距離;人臉識(shí)別模塊在完成上述的步驟后,調(diào)用加載好的基于SENet的人臉關(guān)鍵點(diǎn)定位模型,進(jìn)行歸一化處理,用于后續(xù)的屬性狀態(tài)。
系統(tǒng)的客戶端采用了微信小程序接口API、HTML、CSS和JavaScript,完成對攝像頭的調(diào)用,結(jié)合定時(shí)器實(shí)現(xiàn)定時(shí)拍照功能,來獲取人臉圖像。
5結(jié)束語
本文首先分析了傳統(tǒng)的人臉識(shí)別算法,然后提出基于深度學(xué)習(xí)的人臉識(shí)別算法,改進(jìn)了傳統(tǒng)的人臉識(shí)別算法,同時(shí)利用了基于深度學(xué)習(xí)的SSD目標(biāo)檢測算法、FaceNet算法和SENet算法,結(jié)合谷歌的深度學(xué)習(xí)框架平臺(tái)TensorFlow,對傳統(tǒng)的人臉識(shí)別課堂考勤系統(tǒng)進(jìn)行了改進(jìn)和優(yōu)化,有效地提升了人臉識(shí)別考勤的效率和準(zhǔn)確度。
參考文獻(xiàn):
[1] 安豐波.基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別技術(shù)綜述[J].中國新通信,2019,21(5):61.
[2] 陳華官.基于端到端深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別算法[D].杭州:浙江大學(xué),2017.
[3] 陳奎,邢雪妍,田欣沅,等.基于CNN的人臉識(shí)別門禁系統(tǒng)設(shè)計(jì)[J].徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2018,33(4):89-92.
[4] 常亮,鄧小明,周明全,等.圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J].自動(dòng)化學(xué)報(bào),2016,42(9):1300-1312.
[5] 程實(shí),陳曉勇,沐燕舟,等.嵌入式人臉檢測攝像機(jī)的開發(fā)與應(yīng)用研究[J].江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,31(6):781-786.
[6] 段君瑋.大數(shù)據(jù)環(huán)境下人臉識(shí)別技術(shù)研究[J].電子世界,2019(1):185,187.
[7] 付學(xué)桐.基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)研究[J].通訊世界,2019,26(2):299-300.
[8] 黃建愷.人臉識(shí)別的活體檢測技術(shù)研究[D].武漢:華中師范大學(xué),2018.
[9] 景晨凱,宋濤,莊雷,等.基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用與軟件,2018,35(1):223-231.
[10] 姜新猛.基于TensorFlow的卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用研究[D].武漢:華中師范大學(xué),2017.
【通聯(lián)編輯:唐一東】