摘? 要:針對(duì)當(dāng)前人臉識(shí)別技術(shù)在大型人臉圖形數(shù)據(jù)庫(kù)研究應(yīng)用存在的兩大問(wèn)題,一是批量處理人臉圖像數(shù)據(jù)效率低;二是一種算法只對(duì)某一類人臉圖像庫(kù)有較好的處理效果,沒(méi)有一種通用的處理算法,提出了基于分布式運(yùn)算的多網(wǎng)格索引人臉識(shí)別方法,介紹了其模型結(jié)構(gòu)、核心算法以及優(yōu)點(diǎn)特色,對(duì)于人臉識(shí)別方法的研究和應(yīng)用具有一定的借鑒價(jià)值。
關(guān)鍵詞:人臉識(shí)別;分布式;多網(wǎng)格索引;模型;算法
0? ? 引言
隨著網(wǎng)絡(luò)技術(shù)和人工智能技術(shù)的迅速發(fā)展,人臉識(shí)別作為一種身份識(shí)別的重要手段,成為當(dāng)前人工智能領(lǐng)域的研究熱點(diǎn)。人臉識(shí)別是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù),用攝像頭采集包含人臉的圖像或視頻流,并通過(guò)相關(guān)的算法自動(dòng)在圖像或視頻流中檢測(cè)人臉,獲取人臉的位置信息,再對(duì)人臉進(jìn)行特征提取、特征比對(duì)、輸出人臉信息等一系列相關(guān)操作[1]。目前,人臉識(shí)別技術(shù)廣泛應(yīng)用于智能門禁、公安刑偵、商業(yè)金融、信息安全等領(lǐng)域,具體包括大規(guī)模人臉檢索,幫助公安尋找罪犯;考勤打卡,門禁進(jìn)出;公共商業(yè)場(chǎng)所的自助服務(wù);手機(jī)支付、身份識(shí)別;信息安全管控等。但是,人臉識(shí)別技術(shù)還并不算成熟,人臉檢測(cè)與識(shí)別的速度和準(zhǔn)確度仍然是研究重點(diǎn)。
1? ? 國(guó)內(nèi)外研究現(xiàn)狀
國(guó)外對(duì)人臉識(shí)別的研究可追溯到20世紀(jì)60年代,牛津大學(xué)、卡內(nèi)基梅隆大學(xué)、麻省理工學(xué)院、斯坦福大學(xué)、美國(guó)陸軍研究實(shí)驗(yàn)室等研究機(jī)構(gòu)提出了很多著名的人臉識(shí)別算法,比如幾何特征算法、特定人臉子空間(FSS)算法、可變形模板法、基于神經(jīng)網(wǎng)絡(luò)的方法、基于深度學(xué)習(xí)的方法等[2]。
國(guó)內(nèi)對(duì)人臉識(shí)別的研究雖然起步較晚,但也取得了不錯(cuò)的成就,已經(jīng)掌握了一定的核心技術(shù),達(dá)到了國(guó)際先進(jìn)水平。研究機(jī)構(gòu)主要有清華大學(xué)、香港中文大學(xué)、中國(guó)科學(xué)院自動(dòng)化研究所等高校和科研院所,還有百度、騰訊、曠視科技、商湯科技、科大訊飛等企業(yè)。中國(guó)科學(xué)院自動(dòng)化研究所提出了Webface理論,并公布了生成的人臉數(shù)據(jù)庫(kù)——CASIA-Webface數(shù)據(jù)庫(kù),香港中文大學(xué)湯曉鷗教授研究組提出了著名的Deep ID算法,這些都為人臉識(shí)別技術(shù)研究做出了很大貢獻(xiàn)[2]。
2? ? 人臉識(shí)別技術(shù)存在的問(wèn)題
人臉識(shí)別技術(shù)對(duì)大型人臉圖形數(shù)據(jù)庫(kù)的識(shí)別還存在兩大關(guān)鍵問(wèn)題:一是對(duì)海量人臉圖像數(shù)據(jù)的處理能力。目前,識(shí)別率較高的人臉識(shí)別技術(shù)基本都采用深度學(xué)習(xí)方法來(lái)實(shí)現(xiàn),雖然深度學(xué)習(xí)能得到較高的人臉識(shí)別準(zhǔn)確率,但是學(xué)習(xí)效率并不高,不能滿足高吞吐率、高容錯(cuò)性和實(shí)時(shí)響應(yīng)的要求,直接運(yùn)用到人工智能領(lǐng)域進(jìn)行實(shí)時(shí)交互依然存在著較大問(wèn)題。二是在不同光照、姿態(tài)和復(fù)雜背景等條件下,人臉識(shí)別算法存在魯棒性問(wèn)題,即某一種算法只對(duì)某一類人臉庫(kù)有較好的處理效果,而沒(méi)有一個(gè)通用的處理算法。
3? ? 基于分布式運(yùn)算的多網(wǎng)格索引人臉識(shí)別方法
為在提高人臉識(shí)別準(zhǔn)確率的同時(shí)達(dá)到較高的批量識(shí)別處理效率,本研究團(tuán)隊(duì)提出了“基于分布式運(yùn)算的多網(wǎng)格索引人臉識(shí)別”方法,并進(jìn)行研究實(shí)驗(yàn),取得了較好的效果。分布式運(yùn)算是把多種算法集成調(diào)用進(jìn)行計(jì)算。利用網(wǎng)格技術(shù)建立一個(gè)通用的、協(xié)同的、智能的虛擬處理平臺(tái)以充分利用和共享各種資源,提高處理速度和能力,實(shí)現(xiàn)資源共享,包括數(shù)據(jù)資源、計(jì)算資源等,從而有效利用閑置資源。對(duì)于大型人臉庫(kù)的人臉識(shí)別中存在的兩個(gè)關(guān)鍵問(wèn)題,前者可以通過(guò)基于網(wǎng)格的分布式數(shù)據(jù)庫(kù),把大型人臉圖像庫(kù)劃分為中、小型人臉圖像庫(kù),并借鑒計(jì)算網(wǎng)格、數(shù)據(jù)網(wǎng)格以及Globus等的實(shí)際應(yīng)用來(lái)解決;后者可以基于應(yīng)用共享的網(wǎng)格來(lái)實(shí)現(xiàn),最后統(tǒng)一集成到一個(gè)虛擬處理平臺(tái)下[3]。
3.1? ? 方法模型
基于分布式運(yùn)算的多網(wǎng)格索引人臉識(shí)別方法包含了圖片預(yù)處理、人臉多姿態(tài)的分析與識(shí)別、多種算法融合進(jìn)行人臉深度編碼、多網(wǎng)格計(jì)算大規(guī)模人臉數(shù)據(jù)庫(kù)這幾個(gè)方面,其模型如圖1所示。
具體過(guò)程是運(yùn)用多張照片對(duì)人臉進(jìn)行多層次的學(xué)習(xí)和訓(xùn)練,通過(guò)分布式運(yùn)算的多網(wǎng)格索引多類別的數(shù)據(jù)算法進(jìn)行權(quán)值特征提取,利用人臉深度,訓(xùn)練出人臉更高層次的編碼。首先稀疏提取人臉特征點(diǎn)及環(huán)境特征點(diǎn),對(duì)人像圖片預(yù)處理,根據(jù)圖片的特征進(jìn)行分類,建立索引,增加人臉特征。采用強(qiáng)化學(xué)習(xí)(Deep Q Network)對(duì)多種姿態(tài)人臉進(jìn)行猜想及還原,前期數(shù)據(jù)分類及索引后,經(jīng)線性分析和判斷,人工智能對(duì)數(shù)據(jù)訓(xùn)練和調(diào)優(yōu),最后通過(guò)多類別的數(shù)據(jù)算法進(jìn)行權(quán)值特征提取,再利用人臉深度,訓(xùn)練出更高層次的編碼,找出最接近正常姿態(tài)的人臉,從而提高在多環(huán)境、多姿態(tài)下的識(shí)別率,減少了人臉識(shí)別受到的尺寸、環(huán)境光線、多姿態(tài)、飾品等不穩(wěn)定因素的影響,提高識(shí)別準(zhǔn)確率的同時(shí),也提高了大批量處理的識(shí)別速度。
(1)預(yù)處理。照片通過(guò)PC或移動(dòng)應(yīng)用端攝像頭獲取后被送入數(shù)據(jù)處理中心,通常為GPU進(jìn)行圖像分類處理及壓縮,并行大規(guī)模運(yùn)行。稀疏提取人臉特征點(diǎn)及環(huán)境特征點(diǎn),對(duì)人像圖片進(jìn)行預(yù)處理,通過(guò)特征進(jìn)行分類建立索引,從而增加人臉特征,減少環(huán)境光及不穩(wěn)定因素對(duì)人臉圖片的影響。
(2)人臉多姿態(tài)的分析與識(shí)別。常規(guī)人臉識(shí)別技術(shù)應(yīng)用于多姿態(tài)的人臉識(shí)別存在多種問(wèn)題,容易受尺寸、環(huán)境光、姿態(tài)的影響。為了在不同的姿態(tài)下更精準(zhǔn)地識(shí)別人臉,本方法主要利用強(qiáng)化學(xué)習(xí)(Deep Q Network)來(lái)對(duì)多種姿態(tài)的人臉進(jìn)行猜想和還原,通過(guò)前期數(shù)據(jù)的分類及索引,然后進(jìn)行線性分析和判斷,再通過(guò)人工智能進(jìn)行數(shù)據(jù)訓(xùn)練和調(diào)優(yōu),找出最接近正常姿態(tài)的人臉,最后進(jìn)行常規(guī)的人臉處理。
(3)多種算法融合,人臉深度編碼。大多傳統(tǒng)的深度學(xué)習(xí)只是在平面上對(duì)人臉進(jìn)行學(xué)習(xí)、訓(xùn)練和編碼。本方法運(yùn)用大量照片對(duì)人臉進(jìn)行多層次的學(xué)習(xí)和訓(xùn)練,通過(guò)多種類別的數(shù)據(jù)算法進(jìn)行權(quán)值特征提取,然后利用人臉深度,訓(xùn)練出人臉更高層次的編碼,從而提高人臉識(shí)別的精度。
(4)多網(wǎng)格計(jì)算大規(guī)模人臉數(shù)據(jù)庫(kù)。利用數(shù)據(jù)網(wǎng)格的分布處理策略,構(gòu)成一個(gè)分層樹形結(jié)構(gòu)的人臉識(shí)別網(wǎng)格。將待識(shí)別的人臉圖像及與其有關(guān)的信息以任務(wù)的形式提交給人臉識(shí)別網(wǎng)格,網(wǎng)格將所提交的任務(wù)逐級(jí)分解到最低層的計(jì)算中心和計(jì)算節(jié)點(diǎn)上,并根據(jù)大規(guī)模人臉數(shù)據(jù)庫(kù)的劃分準(zhǔn)則產(chǎn)生符合條件的中小型人臉數(shù)據(jù)庫(kù),計(jì)算中心通過(guò)融合各計(jì)算節(jié)點(diǎn)上的多種算法的識(shí)別結(jié)果即可獲得最終的識(shí)別結(jié)果,可以有效地解決大規(guī)模人臉數(shù)據(jù)庫(kù)人臉識(shí)別計(jì)算耗時(shí)的問(wèn)題。
3.2? ? 核心算法
算法是整個(gè)系統(tǒng)的核心,通過(guò)不同算法的結(jié)果,取得相應(yīng)的權(quán)值,最終通過(guò)人工智能學(xué)習(xí),獲取不同權(quán)值的組合,來(lái)判定其準(zhǔn)確率。
分布式算法集群每種算法對(duì)應(yīng)不同的模型,預(yù)先經(jīng)過(guò)檢索分類,針對(duì)不同的服務(wù)獲取數(shù)據(jù),將大量需處理數(shù)據(jù)分布到不同算法區(qū)間,每種算法初期的權(quán)值各不相同;同時(shí)對(duì)大批量照片進(jìn)行人臉識(shí)別,根據(jù)獲取人臉的數(shù)據(jù)特點(diǎn),將照片分類到不同算法的特定模型中,其結(jié)果可快速反饋到前端。通過(guò)大量數(shù)據(jù)的喂養(yǎng),每種算法的權(quán)值經(jīng)過(guò)不斷的調(diào)整、修訂、反饋、再調(diào)整,逐漸提升識(shí)別準(zhǔn)確率和識(shí)別速度。核心算法如圖2所示。
4? ? 特色和優(yōu)點(diǎn)
(1)升維識(shí)別。本方法運(yùn)用了人臉深度編碼,脫離了傳統(tǒng)的平面的人臉編碼和識(shí)別。結(jié)合強(qiáng)化學(xué)習(xí)(Deep Q Network)來(lái)預(yù)測(cè)及還原多姿態(tài)和多環(huán)境下人臉的正面圖,將二維(2D)推向了更多特征點(diǎn)的三維(3D)人臉,人臉更加立體化,增加了人臉關(guān)鍵點(diǎn),可以對(duì)小部分或者殘缺的人臉圖片進(jìn)行識(shí)別,更全面地還原人臉。
(2)提高了運(yùn)算速度。分布式運(yùn)算把需要非常巨大的計(jì)算能力才能解決的問(wèn)題分成許多小的部分,然后分配給許多計(jì)算機(jī)進(jìn)行處理,最后把這些計(jì)算結(jié)果綜合起來(lái),得到最終的結(jié)果。本研究提出的多網(wǎng)格分布式運(yùn)算模式,先對(duì)圖片按特征進(jìn)行預(yù)處理并進(jìn)行索引分類,再經(jīng)過(guò)線性分析和判斷,基于人工智能對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和調(diào)優(yōu),最后通過(guò)多類別的數(shù)據(jù)算法進(jìn)行權(quán)值特征提取,再利用人臉深度,訓(xùn)練出更高層次的編碼,送入對(duì)應(yīng)的一種或多種算法同時(shí)進(jìn)行處理,大大提高了運(yùn)算和數(shù)據(jù)前后反饋比對(duì)矯正的速度,實(shí)現(xiàn)了大批量圖片的高速同時(shí)識(shí)別。
(3)通用性強(qiáng),可應(yīng)用并產(chǎn)生效益的場(chǎng)景較多。此算法程序可直接集成到硬件設(shè)備,或者嵌入到所需系統(tǒng)或App應(yīng)用程序里,供多種場(chǎng)合使用。
[參考文獻(xiàn)]
[1] 胡亞洲,周亞麗,張奇志.基于深度學(xué)習(xí)的人臉識(shí)別算法研究[J].計(jì)算機(jī)應(yīng)用研究,2020,37(5):1432-1436.
[2] 王震.基于深度學(xué)習(xí)的人臉識(shí)別方法的研究[D].蘭州:蘭州理工大學(xué),2018.
[3] 張迪.基于網(wǎng)格計(jì)算技術(shù)的人臉識(shí)別研究[D].重慶:重慶大學(xué),2007.
收稿日期:2020-06-29
作者簡(jiǎn)介:張子容(1984—),女,四川簡(jiǎn)陽(yáng)人,碩士,講師,主要從事機(jī)械電子控制工程、工業(yè)機(jī)器人技術(shù)方向的教學(xué)和研究工作。