段佳寧
摘 要:人臉檢測,是從被測圖像中檢測出是否含有人臉,若含有人臉,就進一步給出人臉的位置、大小等信息的一種技術,是人臉跟蹤、身份識別等應用功能的基礎。本文簡單介紹了人臉檢測技術的發(fā)展現狀與功能特點,以及詳細介紹了人臉檢測的實現過程包括采集樣本、特征提取、建立模型和測試等幾個步驟,提出了在人臉檢測過程中存在的人臉的相似性、角度和圖像質量等一些局限性,并針對這些局限性總結了一些改善和解決辦法,例如樣本處理、構建立體模型等,最后對人臉檢測的發(fā)展和應用進行了展望。
關鍵詞:人臉檢測;樣本采集;特征提取;隨機森林
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1671-2064(2018)22-0040-02
人臉識別技術,已經廣泛應用于安保、金融、社保、考試、考勤等領域,尤其是從iPhone X手機的人臉解鎖開始,很多帶攝像頭的智能手機都增加了人臉解鎖的功能,在使用中大大提高了便利性。隨著人們生活水平的提高和應用領域的進一步拓展,人們對人臉識別技術的速度、準確度和安全等方面有了更高的要求。人臉識別是將靜態(tài)圖像或視頻圖像中檢測出的人臉圖像與數據庫中的人臉圖像進行對比,從中找出與之匹配的人臉的過程,以達到身份識別與鑒定的目的[1]。人臉檢測是整個人臉識別系統的初始階段和關鍵環(huán)節(jié),只有快速、準確地檢測出人臉,才能對其進行進一步的人臉跟蹤和身份識別等。所以,理解人臉檢測的實現過程和特點,提高檢測速度和準確度,對人臉識別系統的發(fā)展和應用有著十分重要的意義。
1 人臉檢測的發(fā)展與特點
1.1 人臉檢測的發(fā)展
國外的人臉檢測技術發(fā)展較早,現在也有很多機構從事此方面的研究,比較著名的有MIT、CMU等;國內的清華大學、中科院計算所和自動化所等一些大學和研究機構也長期進行著人臉檢測相關的研究。隨著人臉檢測研究的深入,國際上發(fā)表的有關論文數量也大幅度增長,如IEEE的FG、ICIP、CVPR等重要國際會議上,每年都有大量關于人臉檢測的論文,占有關人臉研究論文的1/3之多,由此可以看到世界對人臉檢測技術的重視[2]。
1.2 人臉檢測的特點
(1)非強制性:人臉檢測不需要被檢測對象的配合,即可自動完成采集人臉圖像并進行分析。(2)并發(fā)性:人臉檢測可以同時對一個圖像中含有的多個人臉進行分析判斷。(3)非接觸性:人臉檢測從采集人臉圖像到完成檢測的整個過程中,都不需要與被檢測對象發(fā)生接觸,隨著硬件設備的進步,可以在更遠的距離完成人臉檢測。
2 人臉檢測的實現過程
人臉檢測一般分為以下四個步驟:采集樣本,提取特征,建立模型,測試模型。人臉檢測首先要對圖像進行預處理,主要是利用中值濾波、直方圖均衡等方法對人臉圖像的對比度、光線強度、噪聲、方向、距離等進行處理,得到大小、質量相近的人臉圖像。
2.1 采集樣本
人臉檢測需要學習大量關于人臉圖像的正、負樣本,通過給出的正樣本和負樣本的集合中歸納產生出接受所有正樣本同時排除所有負樣本的規(guī)則,以實現系統對人臉圖像的精確判斷以及進一步分析處理,如圖1所示。
在人臉檢測的訓練過程中,正負樣本的采集同樣重要。采集正樣本,即圖像中包含不同性別、年齡、表情、角度、光照等條件下的不同人臉。采集的正樣本數量保證在萬張級別,并對采集到的正樣本進行篩選,剔除模糊、面部不完整等不符合要求的樣本。負樣本的采集簡單說就是采集那些不包含人臉的圖像,采集的負樣本與正樣本保持同一數量級。另外,為了提高訓練效率,負樣本的選取應與目標場景相關。例如,如果要進行火車候車室這類特定場景的人臉識別,那么負樣本就應該是與候車室有關的列車時刻表、椅子、檢票口、柜臺等場景圖片。
2.2 提取特征
特征提取是決定人臉檢測成功率的重要步驟。特征提取的算法好,可以提高檢測的速度、準確性和模型的泛化效果。在選擇特征的過程中要去掉不相關的特征和避免特征之間的相互依賴。提取人臉特征就是利用人臉的幾何特征、代數特征等建模的過程?;诿娌科鞴俚奶卣魈崛》椒?,是根據人臉器官的形狀和之間的距離等數據作為檢測人臉的特征?;谀0宓奶卣魈崛》椒?,是先定義一個或者多個標準人臉模板,然后將采集的數據樣品與標準人臉模型進行匹配,并利用閾值來判斷是否存在人臉[3],如圖2所示。
2.3 建立模型
將上述采集到的樣本集以及特征輸入到決策樹中,將生成決策樹的參數,包括每棵決策樹的深度以及決策樹棵數等。通過對樣本多次重采樣的方式,將得到多(n)顆決策樹,即構成隨機森林,由隨機森林中的每棵決策樹參與投票,之后依據少數服從多數的原則生成隨機森林的結果,也就是最終的分類結果。
2.4 進行檢測
取一部分未知屬性的圖片,輸入到上述訓練出來的模型中,對得到的結果進行分類。對于正樣本漏檢的和負樣本誤檢的圖像,分析采集的樣本與特征以及模型的參數,不斷調整優(yōu)化,直至正確檢出率達到設定值為止。
3 人臉檢測的不足與改善
3.1 人臉檢測技術的局限性
人臉檢測技術雖然獲得了較大的發(fā)展,但是還存在一些局限性,影響了檢測的準確度及速度。主要有以下幾方面:
(1)人臉的相似性及漸變性:長相接近的兩人或者隨著年齡增長臉部特征發(fā)生變化,影響人臉識別的準確度。(2)圖像質量和遮擋物的干擾:圖像分辨率低或者人臉上的眼鏡、化妝等導致識別率降低。(3)人臉的角度和光線的變化:人臉的不同角度包含的特征不一樣,包括光線的強弱變化也都會影響人臉的檢測效果。(4)隱私問題:由于人臉檢測的非強制性和非接觸性特點,被檢測人往往在不知情的情況下,自己的人臉特征和個人信息就被第三方采集利用。
3.2 改善人臉檢測技術的局限性的方法
3.2.1 樣本處理
在樣本采集之前,針對應用的場景不同,對樣本的圖像進行人工的篩選,確保篩選出的正、負樣本的數量基本平衡,減少某一樣本的錯誤率,同時采用合理方法,提升訓練效果。
3.2.2 構建立體模型
人臉是一個三維的空間結構,利用相關算法將一個人不同角度的臉部圖像合成為三維模型結構,通過對三維結構的比對可以較大程度地提高準確度。目前許多新的提取人臉特征的算法比以前的算法有了較大的優(yōu)化,更加的科學合理,其中最突出的就是結合3D人臉信息的特征點提取技術?;诖鷶堤卣鞯淖R別方法是目前在實際應用中使用得最多的一類方法,其主要原因是由于代數特征矢量(即人臉圖像在特征空間的投影結果)對角度、表情等因素都具有一定的穩(wěn)定性[4]。
3.2.3 層次分析
如果將人臉圖像的每一幀都進行細致的數據處理能夠提高檢測的準確度,但是卻大大延長了檢測時間,降低了檢測效率,使其在檢測速度方面失去作用。所以,對檢測數據處理應分層次進行,首先確定人種、性別、年齡段等大致范圍,再具體到五官特征,最后進行具體細節(jié)的比對分析,這樣可以兼顧人臉檢測的速度和準確度。
3.2.4 清除無關因素
人臉檢測采集的人臉圖像四周不可避免會出現檢測對象所處環(huán)境等背景因素,在進行檢測比對之前應首先消除這些因素的影響,將其忽略,這樣則可以進一步提高檢測速度。對于圖像的預處理就是通過人工干預,提高采樣和建立模型的效率,降低光照和姿態(tài)等對人臉檢測的影響。
4 總結與展望
人臉檢測技術的準確率和可靠性在某些領域暫時還達不到要求,現階段的應用主要是利用機器的優(yōu)勢替代人做一些人臉檢測方面的簡單重復性工作,用以提高工作效率,降低勞動強度。
人臉檢測不同于其他傳統識別模式,人臉圖像較為復雜,包含的層次信息豐富,數據維數高。目前人臉檢測的算法很多,通過優(yōu)化算法,在不減少提取的數據量的情況下提高檢測速度,可以通過隨機森林、深度學習的方法,不斷提升其判斷的準確率、容錯性等。隨著人工智能、機器學習、計算機視覺等軟硬件技術的不斷發(fā)展,人臉檢測系統必將滿足并且超過人類的需求,逐漸擴展到其他更多的應用領域,實現更大的社會價值和經濟效益。
參考文獻
[1]吳巾一,周德龍.人臉識別方法綜述[J],計算機應用研究,2009,26(9):3205-3209.
[2]余孟杰.基于小波變換圖像融合算法的人看檢測[D].浙江工業(yè)大學,2009.
[3]徐曉艷.人臉識別技術綜述[J].電子測試,2015,(5X):885-894.
[4]孔祥棟.基于膚色和AdaBoost算法人臉檢測的研究[D].燕山大學,2010.