張 杰
(四川數(shù)聚智造科技有限公司,四川 成都 610000)
人臉識(shí)別門(mén)禁系統(tǒng)將人臉作為一個(gè)人的身份代表,通過(guò)對(duì)人臉進(jìn)行判斷識(shí)別,根據(jù)識(shí)別算法的相關(guān)設(shè)置輸出識(shí)別結(jié)果并反饋給控制器,控制器根據(jù)識(shí)別結(jié)果發(fā)出相應(yīng)的指令給門(mén)禁執(zhí)行模塊,執(zhí)行模塊進(jìn)行開(kāi)啟門(mén)鎖或振鈴等操作[1-4]。大部分決策由門(mén)禁系統(tǒng)自身判決執(zhí)行,基本實(shí)現(xiàn)了智能檢測(cè)、智能識(shí)別以及智能控制等功能[5]。生活中人們?cè)谑褂萌四橀T(mén)禁系統(tǒng)時(shí)會(huì)因?yàn)殚_(kāi)門(mén)時(shí)的站立姿態(tài)與采集攝像頭產(chǎn)生角度變化,不同時(shí)間段開(kāi)門(mén)的光照強(qiáng)度不同,每次開(kāi)門(mén)時(shí)人的表情、發(fā)型、面部遮擋等都存在差異,為了盡量降低這些因素對(duì)門(mén)禁人臉識(shí)別的影響,本文提出了融合多特征的神經(jīng)網(wǎng)絡(luò)識(shí)別算法。利用局部方向模式(Local Derivative Pattern,LDP)、離散小波轉(zhuǎn)換(Discrete Wavelet Transformation,DWT)的特征優(yōu)勢(shì)和神經(jīng)網(wǎng)絡(luò)強(qiáng)大的聯(lián)想、容錯(cuò)、自適應(yīng)力,提升門(mén)禁識(shí)別系統(tǒng)的識(shí)別率和魯棒性。
門(mén)禁系統(tǒng)設(shè)計(jì)的基礎(chǔ)是對(duì)擁有訪問(wèn)權(quán)、管理權(quán)的人員完成人臉數(shù)據(jù)庫(kù)的建立,將有權(quán)利進(jìn)入門(mén)禁系統(tǒng)的全部人員的人臉信息采集存儲(chǔ)到人臉數(shù)據(jù)庫(kù)中,其中擁有管理權(quán)的人員能夠刪除或修改數(shù)據(jù)庫(kù)。當(dāng)某一個(gè)人對(duì)門(mén)禁系統(tǒng)進(jìn)行訪問(wèn)時(shí),人臉識(shí)別系統(tǒng)會(huì)先通過(guò)攝像頭獲取人臉信息,然后將信息傳輸?shù)教幚砥髦羞M(jìn)行人臉識(shí)別。這個(gè)過(guò)程需要系統(tǒng)對(duì)來(lái)訪者的人臉信息進(jìn)行預(yù)處理,避免表情、光照以及輸入設(shè)備的不良影響[6-8]。將經(jīng)過(guò)預(yù)處理的人臉進(jìn)行特征提取,將提取的信息與存儲(chǔ)的人臉圖像進(jìn)行識(shí)別對(duì)比并記錄識(shí)別結(jié)果,將判斷結(jié)果傳輸?shù)教幚砥?,再發(fā)出相應(yīng)執(zhí)行指令。否則,處理器不會(huì)發(fā)出開(kāi)門(mén)指令,門(mén)禁系統(tǒng)也不會(huì)打開(kāi)。與此同時(shí),記錄存儲(chǔ)訪問(wèn)者的人臉信息,方便后續(xù)監(jiān)督。
人臉識(shí)別門(mén)禁系統(tǒng)主要由以ARM11處理器為主的控制電路模塊、攝像頭模塊、圖像處理模塊、人臉識(shí)別及眨眼模塊以及門(mén)禁執(zhí)行模塊組成。其中人臉識(shí)別是系統(tǒng)的核心模塊,通過(guò)對(duì)人臉識(shí)別系統(tǒng)的算法設(shè)計(jì)實(shí)現(xiàn)人臉門(mén)禁控制。在人臉識(shí)別門(mén)禁系統(tǒng)中,人臉特征的提取、識(shí)別、匹配是整個(gè)系統(tǒng)的關(guān)鍵,而人臉圖像的預(yù)處理則是整個(gè)系統(tǒng)的基礎(chǔ),處理結(jié)果的好壞直接影響到整個(gè)系統(tǒng)的安全性和可靠性[9]。
(1)控制模塊。該模塊是整個(gè)系統(tǒng)的核心,根據(jù)每個(gè)模塊的反饋結(jié)果發(fā)送相應(yīng)的操作指令,指揮整個(gè)門(mén)禁系統(tǒng)按照步驟運(yùn)行。
(2)圖像采集模塊。人臉圖像的獲取由攝像頭與ARM11處理器組合實(shí)現(xiàn),來(lái)訪者要進(jìn)入時(shí)按下開(kāi)門(mén)按鈕啟動(dòng)圖像獲取模塊,處理器控制攝像頭對(duì)人臉進(jìn)行拍照保存,并送至圖像處理模塊進(jìn)行特征提取。
(3)人臉圖像處理模塊。對(duì)采集模塊獲取的人臉圖像進(jìn)行預(yù)處理及特征提取,預(yù)處理階段對(duì)獲取的人臉圖片實(shí)現(xiàn)歸一化處理。選擇多種特征融合提取,特征分別選擇LDP、DWT特征,將2種特征圖像分別送入識(shí)別模塊。
(4)人臉識(shí)別及眨眼模塊。識(shí)別模塊是整個(gè)門(mén)禁系統(tǒng)的核心,其識(shí)別結(jié)果直接控制著門(mén)禁的執(zhí)行。人臉識(shí)別的核心算法為卷積神經(jīng)網(wǎng)絡(luò),在應(yīng)用到門(mén)禁系統(tǒng)之前需要先對(duì)人臉識(shí)別卷積網(wǎng)絡(luò)訓(xùn)練集學(xué)習(xí),訓(xùn)練好的識(shí)別系統(tǒng)才可以投入使用。將處理好的人臉圖像的2種特征圖分別輸入到訓(xùn)練好的雙層卷積網(wǎng)絡(luò)的第一個(gè)卷積層,卷積網(wǎng)絡(luò)會(huì)對(duì)這些特征再學(xué)習(xí),在全連接層非線性變化后輸出1維特征向量。將得到的人臉特征與人臉數(shù)據(jù)庫(kù)得到的特征向量進(jìn)行對(duì)比,按照設(shè)定的判定閾值輸出結(jié)果[10]。若判斷結(jié)果符合,則進(jìn)入到眨眼檢測(cè)模塊。為防止照片識(shí)人事件的發(fā)生,系統(tǒng)會(huì)提示來(lái)訪者執(zhí)行左、右眨眼睛操作并拍照,提取特征值再次識(shí)別,以此驗(yàn)證是否為真人。若判斷結(jié)果不符合,會(huì)有彈框提示返回重新拍照,并將采集的照片保存到處理器的特定文件夾。
(5)門(mén)禁執(zhí)行模塊。該模塊是門(mén)禁控制系統(tǒng)的執(zhí)行模塊,根據(jù)最終的判決結(jié)果輸入到處理器,由處理器給門(mén)禁系統(tǒng)發(fā)送指令,執(zhí)行開(kāi)門(mén)操作。識(shí)別不通過(guò)時(shí),會(huì)提示來(lái)訪者是否需要再次識(shí)別。如果3次均不通過(guò),則會(huì)提示是否需要通過(guò)手機(jī)端輸入密碼進(jìn)入。手機(jī)端密碼不正確時(shí),會(huì)觸發(fā)警鈴。
(6)算法模塊。項(xiàng)目采用融合多特征的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)人臉?lè)诸?lèi),對(duì)預(yù)處理過(guò)的人臉圖像進(jìn)行多特征提取,提取的2種特征為L(zhǎng)DP、DWT。將這2種特征圖以雙通道的形式輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行自適應(yīng)融合,提取的DWT特征圖為32×32像素,提取的LDP特征圖為64×64像素。為了在后續(xù)的算法中對(duì)2種特征進(jìn)行融合,對(duì)LDP特征采用2×2平均采樣的方式降維,最終得到2張大小相同特征圖,以雙層的形式輸入到卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行自適應(yīng)融合。
(7)數(shù)據(jù)模塊。將該人臉庫(kù)的400張照片按照采集對(duì)象分為40個(gè)目標(biāo)文件夾,每個(gè)文件夾有10張不同姿態(tài)下的人臉圖像,訓(xùn)練集和測(cè)試集的分配比例為7∶3。整個(gè)ORL庫(kù)訓(xùn)練集和測(cè)試集的人臉樣本數(shù)分別為280個(gè)和120個(gè),對(duì)每個(gè)人臉圖像提取LDP特征圖、DWT特征圖,并歸一化處理,將其分別作為雙卷積層卷積塊的輸入圖像[11-13]。
(1)控制電路模塊。以ARM11為中央處理器,其含有很多處理指令可以實(shí)現(xiàn)對(duì)圖像的快速處理。ARM11的新型儲(chǔ)存器進(jìn)一步提高了操作系統(tǒng)性能,還提供新指令來(lái)加速實(shí)時(shí)性能和中斷響應(yīng)。
(2)攝像頭。對(duì)來(lái)訪人員進(jìn)行人臉的圖像采集,后續(xù)圖像處理識(shí)別模塊將對(duì)其調(diào)用處理??紤]到人臉采集的便捷性與門(mén)禁系統(tǒng)的集成簡(jiǎn)易度,參考當(dāng)前市面上的門(mén)禁安裝位置,保證圖像采集的范圍盡可能大。
(3)人臉圖像處理識(shí)別。對(duì)攝像頭采集的人臉圖像提取人臉的特征值,并將提取后的特征值保存到ARM11中。通過(guò)軟件算法調(diào)用得到人臉特征值,將其與數(shù)據(jù)庫(kù)人臉模板對(duì)比,輸出是否有權(quán)限進(jìn)入,再將結(jié)果傳輸給控制電路。人臉識(shí)別通過(guò)后,還需要再通過(guò)附屬的眨眼識(shí)別系統(tǒng)再次采集圖像并處理,判斷是否為真人,并將結(jié)果輸出給處理器。
(4)門(mén)禁控制器。根據(jù)識(shí)別系統(tǒng)的輸出由控制電路傳輸相應(yīng)的指令,控制門(mén)是否打開(kāi)。如果人臉識(shí)別異常,則記錄來(lái)訪者照片,以備后期查詢(xún);如果人臉識(shí)別通過(guò),則控制門(mén)禁打開(kāi),允許進(jìn)入。
不同人臉特征對(duì)不同影響因素的敏感度不同,利用不同特征對(duì)光照等因素的不敏感性?xún)?yōu)勢(shì),將互補(bǔ)的多個(gè)特征結(jié)合提高整個(gè)系統(tǒng)的識(shí)別率。與此同時(shí),利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的聯(lián)想、容錯(cuò)、自適應(yīng)力來(lái)提升識(shí)別系統(tǒng)的識(shí)別率和魯棒性。
軟件設(shè)計(jì)的核心是人臉識(shí)別算法,基于卷積神經(jīng)網(wǎng)絡(luò)算法進(jìn)行多特征融合取人臉識(shí)別。首先針對(duì)人臉采集模塊獲取的人臉建立數(shù)據(jù)庫(kù),對(duì)這些圖像進(jìn)行檢測(cè)定位,獲得人臉數(shù)據(jù)后對(duì)其預(yù)處理,實(shí)現(xiàn)尺寸歸一化;其次對(duì)預(yù)處理后的圖像進(jìn)行特征提取,獲得每幅圖像的LDP、DWT特征圖,將特征圖輸入神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練再學(xué)習(xí);最后將實(shí)時(shí)采集到的人臉圖像特征圖輸入訓(xùn)練好的網(wǎng)絡(luò),逐一與數(shù)據(jù)庫(kù)模板數(shù)據(jù)進(jìn)行對(duì)比實(shí)現(xiàn)人臉識(shí)別。人臉識(shí)別算法流程如圖1所示。
圖1 人臉識(shí)別算法流程
基于人臉識(shí)別的門(mén)禁系統(tǒng)整體流程如圖2所示。
圖2 基于人臉識(shí)別的門(mén)禁系統(tǒng)整體流程
人臉識(shí)別系統(tǒng)通過(guò)攝像頭獲取人臉圖像信息,圖像處理模塊對(duì)獲取到的圖像進(jìn)行特征提取,而后將特征值輸入到采用神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練好的識(shí)別系統(tǒng)中,對(duì)數(shù)據(jù)進(jìn)行識(shí)別分類(lèi),判斷其是否有權(quán)限進(jìn)入。識(shí)別成功后,附加眨眼檢測(cè),防止照片識(shí)人事件的發(fā)生。第一次識(shí)別不成功后,會(huì)提示再次識(shí)別,如果識(shí)別3次均不過(guò),會(huì)保存人臉圖像并提示手機(jī)端驗(yàn)證。手機(jī)端輸入密碼可以執(zhí)行開(kāi)鎖,手機(jī)端密碼錯(cuò)誤的話(huà)會(huì)觸發(fā)振鈴。
整個(gè)門(mén)禁系統(tǒng)的硬件模塊主要包括控制電路模塊、電源管理模塊、圖像處理識(shí)別模塊、攝像機(jī)以及門(mén)禁控制器等,各模塊之間根據(jù)控制電路的指令協(xié)同合作。軟件設(shè)計(jì)方面主要是整個(gè)門(mén)禁系統(tǒng)識(shí)別的實(shí)現(xiàn)步驟,包括系統(tǒng)啟動(dòng)、人臉采集、人臉特征提取、人臉識(shí)別、眨眼驗(yàn)證以及手機(jī)端驗(yàn)證等。通過(guò)以上分析,設(shè)計(jì)實(shí)現(xiàn)了基于人臉識(shí)別的門(mén)禁系統(tǒng),實(shí)際應(yīng)用效果較好,值得參考。