彭業(yè)勝 龔利英
摘要:本文針對人臉表情識別技術(shù)進行了深入的探討,其主要采用了深度卷積神經(jīng)網(wǎng)絡(luò)中具有映射作用的方法,通過此方法對使用者進行了面部關(guān)鍵點定位計算,最終提出了魯棒表情關(guān)鍵點定位算法。
關(guān)鍵詞:深度學(xué)習(xí);魯棒表情;關(guān)鍵點;定位算法
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2018)06-0142-01
近年來,深度學(xué)習(xí)的魯棒表情得到了突破性進展,促進了其相關(guān)研究領(lǐng)域的突破和創(chuàng)新。目前,最具有技術(shù)性的信息傳遞方式就是面部表情,能夠及時反映出人們最真實的內(nèi)心情感,起到相互溝通交流的作用。隨著現(xiàn)代信息技術(shù)的飛速發(fā)展,人臉識別的方式越來越廣泛,無論在通信、心理、醫(yī)療、人機交互還是國防安全中都開始流行人臉表情識別??梢姡捎萌四槺砬樽R別的方式能夠促進科學(xué)發(fā)展,具備可觀的市場價值。
1 微表情魯棒關(guān)鍵點識別定位的意義
人類具有面部表情、語言、肢體動作等表達表達思想情感的方式。美國有相關(guān)專家通過研究發(fā)現(xiàn),人與人交流中,信息主要通過語言傳遞僅僅占有7%,而絕大部分信息傳遞都是依靠面部表情,其主要占有55%。普通表情和微表情是面部表情的主要類型,其中,微表情囊括了用戶人們所有的面部表情,微表情能夠直接真實的反映出人們的內(nèi)心情緒以及情感。因此,對微表情進行分析識別是一項具有交叉性的研究項目,因為其涉及到很多領(lǐng)域,主要包括信息處理、臨床心理學(xué)、信號強度、計算機等,是一項值得研究和開發(fā)的項目,能夠推動各個領(lǐng)域共同發(fā)展,促進各領(lǐng)域間的聯(lián)系和交流。
即使測謊儀已經(jīng)廣泛應(yīng)用于國際反恐、國家安全、司法偵訊中,雖然能夠通過腦成像技術(shù)以及ERP技術(shù)進行測謊,但是在現(xiàn)實生活中缺乏應(yīng)用。而且,在使用過程中,人體難免會直接到這些儀器設(shè)備,若接觸到人體就會喚醒用戶的情緒,進而對測試結(jié)果進行干擾。通過對此,采用相關(guān)的設(shè)備對用戶的微表情進行檢測,就可以在用戶不知情的情況下實行心理測試。在司法領(lǐng)域,法官能夠借助犯罪嫌疑人的微表情,來檢測犯人說話的真實性;在臨床領(lǐng)域中,心理學(xué)家和醫(yī)生能夠通過患者的微表情了解患者對特定行為的真實態(tài)度,從而對癥治療;在安全領(lǐng)域中,工作人員通過觀察微表情的方式,來判斷出對方有無攻擊性意圖。因此,本文在信號、計算機、臨床心理學(xué)和信息處理等多個領(lǐng)域具有不言而喻的應(yīng)用價值。
2 深度學(xué)習(xí)的算法原理
機器學(xué)習(xí)歸屬于人工智能,其原理是通過算法使得機器從大量的數(shù)據(jù)中尋求和使用規(guī)律,從而通過智能的形式識別更多的樣本,還可以對未來進行預(yù)測。在人工神經(jīng)網(wǎng)絡(luò)中,有一種全新的學(xué)習(xí)方式叫做深度學(xué)習(xí),主要對腦神經(jīng)網(wǎng)絡(luò)進行模擬,從而實現(xiàn)分析學(xué)習(xí),不僅如此,還可以借助分布式并行算法對人腦信息進行分析。深度學(xué)習(xí)是集特征以及分類器于一體,在算法中,又主要集構(gòu)建多隱層以及非線性變換模型于一體,從基礎(chǔ)數(shù)據(jù)中抽象出高層特征。本文介紹了兩種典型的深度學(xué)習(xí)網(wǎng)絡(luò),并重點介紹了卷積神經(jīng)網(wǎng)絡(luò)的算法原理和機制。
3 典型深度學(xué)習(xí)網(wǎng)絡(luò)
深度學(xué)習(xí)是將大量的數(shù)據(jù)以學(xué)習(xí)模型的方式進行規(guī)律尋找,能夠?qū)τ杏锰卣鞯倪M行把握學(xué)習(xí),能確保分類和預(yù)測的精準性。深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)繁多,并且每個結(jié)構(gòu)都有不同的應(yīng)用領(lǐng)域和條件,無法在數(shù)據(jù)集中進行統(tǒng)一,所以就不能對它們的性能做出統(tǒng)一的比較。本文主要介紹了深度置信網(wǎng)絡(luò)和深度玻爾茲曼機。
(1)深度置信網(wǎng)絡(luò)。其主要是由概率而生成的模型,主要的概率分布和邏輯關(guān)系是依靠具體數(shù)據(jù)與標簽進行確定的。多層限制性玻爾茲曼形成了DBN,主要采用無監(jiān)督、分層訓(xùn)練的學(xué)習(xí)方法。與玻爾茲曼機相比,深度信念網(wǎng)絡(luò)進一步完善了對權(quán)重的計算方法。在深度置信網(wǎng)路中不適宜進行常規(guī)的反向傳播算法,存在選取不當會導(dǎo)致無法到達的收斂狀態(tài)的問題,并且學(xué)習(xí)訓(xùn)練周期長,效率較低。為此,研究者提出了新的訓(xùn)練方法,該方法的思路主要為采用自上而下的監(jiān)督學(xué)習(xí)方法調(diào)整參數(shù)、對每層網(wǎng)絡(luò)進行無監(jiān)督學(xué)習(xí)的形式進行學(xué)習(xí)、訓(xùn)練,每層網(wǎng)絡(luò)的輸入數(shù)據(jù)都是上一層網(wǎng)絡(luò)的學(xué)習(xí)結(jié)果,這就是分層網(wǎng)絡(luò)。這種訓(xùn)練方法有效的避免了梯度彌散現(xiàn)象的出現(xiàn)。同時,DBN反向傳播算法僅限于搜索部分權(quán)值空間,不需要對全局網(wǎng)絡(luò)進行調(diào)整,這樣就可以節(jié)約大量的網(wǎng)絡(luò)訓(xùn)練時間,保證了算法的有效率。
(2)深度玻爾茲曼機。玻爾茲曼機是1985年由Sejnowski和Hintonti提出的,它是一個由耦合的隨機二值單元構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu),采用全連接的結(jié)構(gòu),能夠提高自我學(xué)習(xí)的能力,但是,訓(xùn)練時間長、計算困難成為了玻爾茲曼機的主要問題。因此,研究者改進了算法,簡化了原玻爾茲曼機計算復(fù)雜度。為了學(xué)習(xí)更加復(fù)雜的特征,提高表達能力,又提出了深度玻爾茲曼機。深度玻爾茲曼機能夠從有限的特定數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而調(diào)整無標簽輸入數(shù)據(jù)建立的表征。除此之外,DBM采用自下而上和自上而下的兩個方向的推理和訓(xùn)練,能夠更好的表達復(fù)雜的和抽象的特征,只是計算量太大,無法應(yīng)用于大型數(shù)據(jù)量。
4 魯棒級聯(lián)形狀回歸算法
魯棒級聯(lián)形狀回歸算法(RCPR)是在級聯(lián)形狀回歸的算法的基礎(chǔ)上優(yōu)化算法。CPR算法則是把面部特征點定位問題抽象成一個回歸函數(shù),通過逐個訓(xùn)練回歸器,使得回歸函數(shù)不斷逼近目標的形狀。CPR在人臉數(shù)據(jù)收集上取得了突破性的實驗結(jié)果,但是算法的不足表現(xiàn)在對初始化形狀敏感,對姿態(tài)和遮擋的魯棒性太差。PCPR算法克服了上述問題,提高了算法對姿態(tài)和遮擋的魯棒性。級聯(lián)形狀回歸算法具有運行速度快,計算復(fù)雜度小的優(yōu)點,但是該算法對初始化形狀過于敏感,對初始值選擇不當會在很大程度上影響定位效果。雖然多次測試能夠在一定程度上緩解這個問題,但相應(yīng)的增大了運算量。此外,人臉出現(xiàn)姿態(tài)變化或受到遮擋時,定位效果不明顯。在PCPR算法中,采用智能重啟技術(shù)解決了對形狀初始化敏感的問題,采用遮擋檢測避免了遮擋對定位的影響。
5 多任務(wù)深度卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上的魯棒定位算法
多任務(wù)深度卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上的魯棒定位算法把機器學(xué)習(xí)中的多任務(wù)學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來定位表情關(guān)鍵點,解決了現(xiàn)有的深度人臉表情關(guān)鍵點定位算法中對姿態(tài)變化和遮擋魯棒性較差的問題。這種方法把人臉表情特征點定位作為主要任務(wù),人臉屬性和頭部姿態(tài)識別作為輔助任務(wù),把深度卷積神經(jīng)網(wǎng)絡(luò)和不同的任務(wù)學(xué)習(xí)難度相結(jié)合,能夠提高人臉特征點定位對于遮擋和姿態(tài)的魯棒性。
6 結(jié)語
現(xiàn)代科技發(fā)展中最具有技術(shù)性的信息傳遞方式就是面部表情,能夠及時反映出人們最真實的內(nèi)心情感,起到相互溝通交流的作用。本文針對人臉表情識別技術(shù)進行了深入的探討,其主要采用了深度卷積神經(jīng)網(wǎng)絡(luò)中具有映射作用的方法,通過此方法對使用者進行了面部關(guān)鍵點定位計算,還與傳統(tǒng)的面部關(guān)鍵點計算進行了比較,最終研發(fā)出了提出了魯棒表情關(guān)鍵點定位算法。但由于人臉姿勢和遮擋變化多樣,實驗數(shù)據(jù)有限,基于深度學(xué)習(xí)的魯棒性關(guān)鍵點定位算法設(shè)計還有很大的研究空間。
Abstract:This paper makes an in-depth study of facial expression recognition technology. It mainly uses the mapping method in the deep convolution neural network. Through this method, the user's face key point location is calculated. Finally, the key point positioning algorithm of robust expression is proposed.
Key words:deep learning; robust expression; key points; localization algorithm.