摘 要:基于膚色模型、唇色模型和幾何特征的人臉檢測(cè)確定方法,在機(jī)器視覺(jué)、智能人機(jī)交互系統(tǒng)、以及圖文排版與校對(duì)等領(lǐng)域發(fā)揮著重要的作用。
關(guān)鍵詞:人臉檢測(cè)與識(shí)別;膚色模型;幾何特征
人臉檢測(cè)與識(shí)別是模式識(shí)別和機(jī)器智能領(lǐng)域的一項(xiàng)具有挑戰(zhàn)性的研究課題,在機(jī)器視覺(jué)、智能人機(jī)交互系統(tǒng)、以及圖文排版與校對(duì)等領(lǐng)域發(fā)揮著重要的作用,是人臉識(shí)別、人臉跟蹤、人臉確認(rèn)、人臉修正等研究的基礎(chǔ)工作。本文采用高斯模型的膚色檢測(cè)的方法,首先定位出圖像中的膚色區(qū)域作為候選人臉。然后在候選人臉上使用高斯模型的唇色檢測(cè),定位出唇色區(qū)域,然后使用人臉的幾何特征來(lái)精確定位人臉,并可以引來(lái)達(dá)到對(duì)人臉為主的圖像的確定與修正。
1 算法流程
我們首先在整幅圖像上用膚色高斯模型進(jìn)行膚色區(qū)域的分割,然后用特征三角形定位眼睛,最后用橢圓特征精確定位人臉。
1.1 膚色檢測(cè)
本文所采用的方法主要是利用人體的膚色,主要是臉部的膚色在YCbCr色彩空間中分布穩(wěn)定聚類的特性,通過(guò)形成彩色空間的膚色高斯模型,從而達(dá)到人體的膚色與人體所在背景的分離來(lái)實(shí)現(xiàn)。實(shí)踐中我們發(fā)現(xiàn),基于膚色模型的膚色檢測(cè)與確定方法,受環(huán)境影響的較小,即使復(fù)雜背景也不會(huì)有明顯影響,而且對(duì)個(gè)體或者人較多的情況都可以精確識(shí)別人臉的圖像。這種方法操作也比較簡(jiǎn)單,效率高,而且牽扯到的計(jì)算程序少,對(duì)于人體采用什么姿勢(shì)或者什么狀態(tài)都不會(huì)有影響圖像的質(zhì)量與效果。利用公式2將每一幅膚色樣本由RGB色彩空間轉(zhuǎn)換到Y(jié)CbCr空間,得出每一個(gè)像素點(diǎn)的Cb分量值和Cr分量值。用公式3計(jì)算他們的均值向量m和協(xié)方差矩陣c。
將上面的均值向量m與協(xié)方差矩陣c代入高斯模型G(m,c2)中,就可以建立如圖2.3所示的膚色高斯模型。
1.2 確定人臉候選區(qū)域
一般來(lái)說(shuō)人臉的長(zhǎng)寬比范圍在[0.9,1.2]之間,考慮到膚色檢測(cè)的結(jié)果可能會(huì)將人臉區(qū)域與脖子區(qū)域連通,可以將長(zhǎng)寬比的范圍適當(dāng)放寬,以保證存在人臉的區(qū)域不被錯(cuò)刪。候選區(qū)域的選定要盡量保證所有的包含人臉的區(qū)域都被保留下來(lái)。
1.3 特征三角形定位
人眼的位置總是在人臉對(duì)稱軸的兩側(cè),國(guó)內(nèi)外學(xué)者對(duì)人臉器官的幾何關(guān)系做了大量的研究,我們通過(guò)實(shí)驗(yàn)和分析發(fā)現(xiàn),人的兩眼的中心點(diǎn)和人的嘴唇的中心點(diǎn),通過(guò)連線就可以發(fā)現(xiàn),正好是一個(gè)等腰三角形。通過(guò)測(cè)量可以確定,兩眼中心的距離基本上是左眼和右眼分別與嘴唇中心的距離,偏差大約是90%~110%波動(dòng),主要是人的臉形以及臉形形成圖像不同所決定的。事實(shí)上,人臉的圖像受到各種因素影響,包括環(huán)境因素、光線因素、成像角度因素,以及取像的設(shè)備因素,當(dāng)然包括有人為因素、非人為因素等影響,另外傳輸過(guò)程中也會(huì)產(chǎn)生直接的影響,一般來(lái)說(shuō),存在一定的誤差或偏差是正常的,只要正常范圍內(nèi)就行(允許誤差在25%左右)。在實(shí)際工作中,我們可以注意到,人臉活動(dòng)的幅度對(duì)成像影響很大,包括低臉和仰臉都會(huì)對(duì)成像產(chǎn)生直接而明顯的影響,因此,你人臉的圖像可以把誤差范圍定義在30%左右就可以,而且對(duì)人像有選取采用從左到右、由下往上的的辦法來(lái)i 其中abs 代表絕對(duì)值,D(i,j)代表左眼與嘴部中央的距離;D(i,k)代表兩眼之間的距離;D(j,k)代表嘴部中央與右眼間的距離。 1.4 人臉區(qū)域的定位 把確定的雙眼位置以及嘴唇位置作為畫面的中心,就可以以此來(lái)確定人臉的中心位置即雙眼位置與嘴唇位置構(gòu)成的等腰三角形的位置部分。我們把人臉中心位置即等腰三角形部分為中心,畫一個(gè)橢圓形,作為人臉的外面邊界部分。這樣,人臉的中心正好是我們自己廟宇的橢圓的中心部分,人臉中心和嘴唇中心的連線所在的直線為橢圓長(zhǎng)軸所在直線,嘴唇中心點(diǎn)和它關(guān)于橢圓中心的對(duì)稱點(diǎn)為橢圓的焦點(diǎn)。為了簡(jiǎn)化計(jì)算,在生成橢圓時(shí)我們?cè)O(shè)定橢圓的短半軸d的大小為兩倍的焦距,橢圓的長(zhǎng)半軸可以在[d,2d]之間變化,這樣生成一系列的橢圓。將一系列橢圓與人臉圖像的Canny邊緣圖像做與運(yùn)算,與圖像邊緣重合最多的橢圓就是最優(yōu)的表示人臉大小和方向的橢圓, 2 實(shí)驗(yàn)結(jié)果 實(shí)驗(yàn)數(shù)據(jù)庫(kù)里一共有188張圖片,包含212張人臉,這些圖像的采集條件各異(光照條件,背景,攝像機(jī)參數(shù)等),圖像大小質(zhì)量各異。采用檢測(cè)率,誤檢率這兩個(gè)參數(shù)評(píng)價(jià)人臉檢測(cè)與識(shí)別算法的性能。檢測(cè)率是指能正確被檢測(cè)出來(lái)的人臉占總?cè)四様?shù)目的百分比。誤檢率指檢測(cè)錯(cuò)誤的人臉占總?cè)四様?shù)目的百分比,所謂檢測(cè)錯(cuò)誤的人臉是指不是人臉區(qū)域被錯(cuò)誤當(dāng)成人臉區(qū)域檢測(cè)出來(lái)。 這種方法在一定的條件下具有魯棒性和較高的檢測(cè)率。但是由于算法基于人臉五官的先驗(yàn)信息,所以當(dāng)人臉被其他物體遮擋,某些檢測(cè)需要的特征消失,我們的算法將無(wú)法檢測(cè)出這種情況下的人臉。這也是未來(lái)我們需要改進(jìn)的地方。 參考文獻(xiàn): [1]G Yang and T S Huang. Human Face Detection in Complex Background [J].Pattern Recognition,2014,27(1):53-63. [2]陳鍛生,劉政凱.膚色檢測(cè)技術(shù)綜述[J].計(jì)算機(jī)學(xué)報(bào),2016,29(2):194-207. 作者簡(jiǎn)介:秦琴(1979-),女,山東昌樂(lè)人,本科,助理工程師。