姚俊
(上海交通大學自動化系,上海 200240)
基于視頻圖像的人臉檢測
姚俊
(上海交通大學自動化系,上海 200240)
視頻圖像的人臉識別技術(shù)發(fā)展,促進了數(shù)字視頻監(jiān)控等系統(tǒng)的廣泛應用。本文對基于特征、模板、統(tǒng)計理論等視頻圖像的人臉檢測基本方法進行了介紹,對人臉檢測系統(tǒng)的圖像采集、圖像處理、特征定位、人臉識別處理等設計進行了闡述,對人臉檢測方法的改進進行了嘗試。
人臉檢測 視頻圖像 數(shù)字技術(shù)
信息技術(shù)數(shù)字化、智能化在安防監(jiān)控領域的發(fā)展,誕生了智能人臉識別技術(shù)人。人臉識別綜合了光電技術(shù)、網(wǎng)絡工程等技術(shù),它作為自動人臉識別的關鍵環(huán)節(jié),在安全識別、刑偵、信息檢索等方面得到廣泛的應用。
人臉圖像檢測既是人臉識別系統(tǒng)的主要組成部分,也是人臉信息處理中的一項關鍵技術(shù),在基于內(nèi)容的圖像檢索、視頻會議、可視電話、遠程視頻監(jiān)控以及人機交互等方面都有著很重要的應用價值。但在人臉視頻圖像中,由于人臉本身復雜的細節(jié)變化、人臉多姿態(tài)、各種遮擋、光照不均勻、以及復雜背景時,人臉檢測和識別普遍存在計算量大、速度慢、魯棒性差的弱點。
人臉檢測作為人臉識別系統(tǒng)的一個組成部分,在實際中主要是在圖像中準確標定出各種復雜環(huán)境下的人臉的位置和大小,然后進行統(tǒng)一人臉位置以及圖像信息的格式。
由于人臉圖像中包含的模式特征十分豐富,如直方圖、顏色、模板、結(jié)構(gòu)及Haar等特征。如果將其中有代表典型意義的有用的信息挑出來,就可以利用這些信息,實現(xiàn)實現(xiàn)對人臉檢測。人臉檢測以及定位子系統(tǒng)的準確性和性能將直接關系到整個人臉識別系統(tǒng)的可行性、實時性。
(1)迭代算法。本算法是自動從多個弱分類器的空間中挑選出若干個分類器,構(gòu)成一個分類能力很強的強分類器。其改變數(shù)據(jù)分布,根據(jù)每次訓練集中各個樣本的分類是否正確以及上次的總體分類的準確率來確定每個樣本的權(quán)值。將修改過權(quán)值的新數(shù)據(jù)送給下層分類器進行訓練,最后將每次訓練得到的分類器融合起來,作為最后的決策分類器。
(2)基于特征的方法。本方法是利用人臉的等先驗知識導出的規(guī)則進行人臉檢測。邊緣和形狀特征人臉及人臉器官具有典型的邊緣和形狀特征,如人臉輪廓、虹膜輪廓等都可以近似為常見的幾何單元。紋理特征人臉具有特定的紋理特征,紋理是在圖上表現(xiàn)為灰度或顏色分布的某種規(guī)律性,其在不同類別的紋理中有其不同特點。顏色特征人臉的皮膚顏色是人臉表面最為顯著的特征。
(3)基于模板的方法。本方法是通過計算人臉模板和待檢測圖像之間的相關性來實現(xiàn)人臉檢測功能的。其通過使用人工定義的方法來給出人臉通用模板。對于待檢測的人臉圖像,分別計算眼睛、鼻子、嘴等特征同人臉模板的相關性,由相關性的大小來判斷是否存在人臉。通用模板匹配方法的優(yōu)點是算法簡單,容易實現(xiàn),但是它也有自身缺點,如模板的尺寸、大小、形狀不能進行自適應的變化,從而導致了這種方法適用范圍較窄。
其也可以通過設計一個可變模型,利用監(jiān)測圖像的邊緣、波峰和波谷值構(gòu)造能量函數(shù),當能量函數(shù)取得最小值時,此時所對應的模型的參數(shù)即為人臉面部的幾何特征。這種方法存在的不足之處在于能量函數(shù)在優(yōu)化時十分復雜,消耗時間較長,并且能量函數(shù)中的各個加權(quán)系數(shù)都是靠經(jīng)驗值確定的,在實際應用中有一定的局限性。
(4)基于統(tǒng)計理論的方法。本方法是指利用統(tǒng)計分析與機器學習的方法分別尋找人臉與非人臉樣本特征,利用這些特征構(gòu)建分類器,使用分類進行人臉檢測。它主要包括神經(jīng)網(wǎng)絡方法,支持向量機方法和隱馬爾可夫模型方法?;诮y(tǒng)計理論的方法是通過樣本學習而不是根據(jù)人們的直觀印象得到的表象規(guī)律,因此可以減小由于人眼觀測不完整和不精確帶來的錯誤而不得不擴大檢測的范圍,但是這種方法需要大量的統(tǒng)計特性,樣本訓練費時費力。
人臉檢測之前,首先要采集影像視頻信息,并以指定的多媒體格式進行存儲。人臉識別檢測系統(tǒng)的視頻圖像采集、存儲的處理:
(1)設計并生成基礎構(gòu)件,然后進行連接?;A構(gòu)件包括圖像管理器、圖像捕獲管理器。
(2)枚舉系統(tǒng)中的視頻設備,循環(huán)查找可用的視頻設備,然后綁定到圖像捕獲管理器,將圖像捕獲管理器連接到圖像組件管理器中。
(3)系統(tǒng)枚舉可用的視頻圖像壓縮器,選擇對應的壓縮器,連接到圖像管理器。
(4)捕獲各種環(huán)境下的人臉視頻影像,系統(tǒng)保存為指定視頻格式的文件。
本系統(tǒng)的目標是從視頻影像背景中提取編號區(qū)域的影像信息,為了方便對視頻影像中的目標進行分類和處理,從而獲得有效的人臉影像區(qū)域。由于檢測系統(tǒng)是基于運動影像的,因此只需用考慮運動變化中的影像像素信息。對于運動檢測的工作,主要的處理方法有:背景剪除法、時間差分法、光流分時法等方法。
人臉特征定位目的是排除非人臉區(qū)域。實時采集的人臉影像在某些環(huán)境下并不是出于正面的位置。在人臉特征定位系統(tǒng)中,通過對人臉的主要器官:眼、耳、鼻、口等部位進行驗證,旋轉(zhuǎn)人臉等多種技巧來確定人臉區(qū)域。在系統(tǒng)中,主要考慮到視頻監(jiān)控系統(tǒng)的環(huán)境布局等因素,參考了眼睛在幾何與灰度色彩方面特征來定位眼睛,據(jù)此來確認最終的人臉區(qū)域,采取從局部到整體的策略。
人臉識別系統(tǒng)是整個系統(tǒng)的核心,在紛繁復雜的識別技術(shù)中,主要使用K-L的特征臉識別算法EigenFace。考慮到人臉特征的分類情況,可以充分利用特征分類的詳細信息,這樣可以改善識別的性能。在綜合了這兩種識別方法的基礎上,還要考慮到光照、攝像機方向?qū)ψR別結(jié)果的影響。由于大多數(shù)情況下,實時視頻監(jiān)控系統(tǒng)周圍的環(huán)境、光照、方向都不是確定的,因此必須要消除光照等因素的影響,從而提高系統(tǒng)的識別效率和性能。
人臉的檢測方法盡管很多,并且一定的成效。為了盡量減小由外界環(huán)境和自身因素以及由算法本身缺陷造成的影響,提高檢測效率和精確性,人臉檢測的還有許多需要改進。
不變矩理論是計算機視覺、模式識別、圖像處理的重要內(nèi)容,基于區(qū)域的不變矩理論最早是由Hu提出來的,在人臉檢測中主要應用了Hu矩處理的旋轉(zhuǎn)、縮放、平移三不變的特性。此特性與Adaboost算法結(jié)合使用,彌補Adaboost在旋轉(zhuǎn)角度過大或者完全側(cè)面人間不能檢測的缺點,實驗結(jié)果證明這是可行的。
改進方法,把RGB彩色空間轉(zhuǎn)換到Y(jié)CrCb空間:首先進行光補償,將各個像素的R、G、B分別擴展到最高的255。Y是亮度分量,Cb是藍色色度分量,Cr是紅色色度分量。轉(zhuǎn)換成YCbCr彩色空間具有將亮度和色度空間相分離的特點,膚色聚類效果也很好,而且該空間計算方法簡單,速度快,易于實現(xiàn)。
將轉(zhuǎn)化后的Cb分量與Cr分量圖作差得到初級圖像,最后利用自動閾值將灰度圖像處理成二值圖像。通過以上做法得到了人臉,但手,胳膊,頸部都顯示出來。再結(jié)合眼部特征進行檢測確定是否存在人臉及其人臉的位置。結(jié)合膚色特征通過圖像差分方法提取清晰準確的活動區(qū)域,有效地解決了視頻中人臉檢測的問題。
決策樹是數(shù)據(jù)挖掘中的一種分類方法主要用于分類和決策,根據(jù)FCM劃分的結(jié)果,構(gòu)建一個自頂而下的樹經(jīng)過若干次分類劃分為原來混雜的樣本集,最終分裂為以一個個類別純度高的子集。使樹的每一個節(jié)點表示一個屬性上的測試,每個分枝代表一個測試輸出,而每個樹葉節(jié)點表示一個類或類的分布,樹的最頂層節(jié)點是根節(jié)點。實驗證明這種檢測方法提高了檢測的速度而且具有很好的檢測性能。
人臉檢測是一項在困難中不斷發(fā)展的技術(shù)。目前,人臉的檢測方法取得了許多成功,由于光照、遮擋等環(huán)境變化和人臉本身復雜性,檢測的精確度和魯棒性仍然存在缺點和不足,隨著模式識別技術(shù)的發(fā)展,相信肯定可以在可以預計的將來,做到在圖片以及視頻中迅速準確地定位到概定的目標。
[1]熊平,徐敏.基于視頻的實時人臉識別的研究與實踐[D].長沙:中南大學,2010.
[2]馮東青,丁鍇.視頻中基于膚色模型的人臉檢測[J].計算機應用與軟件,2010,27.
[3]張建明,汪大慶.基于視頻的實時人臉檢測研究[D].鎮(zhèn)江:江蘇大學,2010.