馬 爽,姜月秋,趙 陽,高宏偉
(沈陽理工大學(xué) 信息科學(xué)與工程學(xué)院,沈陽 110159)
?
一種基于連通標記的教室人數(shù)檢測算法研究
馬爽,姜月秋,趙陽,高宏偉
(沈陽理工大學(xué) 信息科學(xué)與工程學(xué)院,沈陽 110159)
摘要:提出一種改進的基于連通區(qū)域標記的人數(shù)檢測算法。用實時的圖像與教室背景圖像作背景差分分割出目標人員;利用人臉膚色模型和頭發(fā)顏色信息對人員頭部進行不同顏色的標記;針對處理之后的三值圖像,用改進的連通區(qū)域標記算法對人員進行檢測,檢測結(jié)果可對建筑內(nèi)自動照明系統(tǒng)控制和自習(xí)室管理提供依據(jù)。實驗結(jié)果表明,該方法對于檢測教室人數(shù)具有較高的準確率。
關(guān)鍵詞:目標分割;頭部標記;連通區(qū)域標記;人員檢測
隨著圖像處理、計算機視覺等技術(shù)的發(fā)展,利用相關(guān)技術(shù)對室內(nèi)人員的數(shù)量進行檢測已成為可能。在大學(xué)校園內(nèi),教室人數(shù)檢測有重要的意義:既可以將統(tǒng)計的教室人數(shù)顯示在教學(xué)樓的顯示屏上,避免學(xué)生盲目地在教學(xué)樓里尋找教室而耽誤時間,還能依據(jù)教室人數(shù)自動控制教室中燈具等設(shè)備以達到節(jié)能目的。目前,對于燈具的自動控制裝置多采用傳感器技術(shù)實現(xiàn)[1],該技術(shù)適合檢測動態(tài)人員,不能準確地檢測靜態(tài)人員,并且需要精確計算傳感器安裝位置[2]。
上世紀90年代,國外的研究人員提出把圖像處理技術(shù)應(yīng)用到教室人數(shù)檢測中,即通過對CCD攝像頭采集的教室圖像,用圖像處理技術(shù)檢測出教室的人數(shù)。近年來,我國一些學(xué)者也開始研究這方面技術(shù),文獻[3]把實時教室圖像進行二值化和邊緣檢測,再利用邊界跟蹤算法檢測人員。該算法基于二值圖像,很容易因為前后人員的遮擋導(dǎo)致檢測不準確。文獻[4]用垂直投影直方圖的方法對人體的頭肩部分進行提取,再用二維主成分分析法進行后續(xù)檢測。此方法只考慮人員的形態(tài)特征,而教室中的其他物體容易對檢測造成干擾。近年來研究較為廣泛的還有用haar分類器進行人臉檢測的方法[5],但此方法對于教室中低頭、側(cè)臉或是遮擋等特殊姿勢的人員,檢測效果并不理想。本文用背景差分法分割出目標人員,用膚色模型和頭發(fā)顏色對標記出人員,再用改進的連通標記算法進行人數(shù)檢測,實驗結(jié)果表明此方法對教室內(nèi)正臉和特殊姿勢的人員均有較理想的檢測效果。
1目標人員分割方法
1.1運動目標檢測
目前在視頻圖像處理中,運動目標檢測常用方法有三種:幀差法、背景差分法、光流方法[6]。幀差法很難檢測出靜止的人員目標,且不易提取出完整的運動目標,而光流法復(fù)雜度較高、計算量較大。背景差分法常用于靜止背景的運動目標提取[7],運算速度快,實時性好,更適合于教室人員檢測。
Heikkila等[8]對于背景差分法給出一個簡單的數(shù)學(xué)表達式:
(1)
式中:t代表t時刻;It(x,y)為t時刻的圖像;Bt(x,y)為背景圖像;τ表示設(shè)定的閾值。目標圖像由背景差分值大于閾值的像素組成。背景模型更新一般利用公式(2)。
Bt+1=Bt+(α1(2-Mt)+α2Mt)Dt
(2)
式中:Bt是當(dāng)前背景的灰度值;α1、α2為表示背景變化的因子;Mt是當(dāng)前運動目標的二值化值;Dt是當(dāng)前幀與背景灰度值的差值。
1.2基于HSV顏色空間下的背景差分法
對于運動目標檢測系統(tǒng),大多數(shù)的背景差分法都是在RGB顏色空間下進行的。但由于R、G、B三個分量間很大的關(guān)聯(lián)性,容易在圖像進行背景差分算法后出現(xiàn)原圖像沒有的新顏色。HSV顏色空間不依賴處理設(shè)備,且更符合人對于色彩的感知。故用基于HSV顏色空間的背景差分算法來確定圖像的前景像素和背景像素,即確定教室人員和教室背景區(qū)域。H、S分量可以描述圖像的大部分色彩信息,且分量圖像更接近于原圖。用實時圖像的這兩個分量值分別與背景圖像的兩個分量值作差,當(dāng)差值小于設(shè)定的閾值時,認為是背景像素,反之則認為是前景像素。根據(jù)分量與原圖的相關(guān)性大小,設(shè)定H分量差值的閾值要大于分量的閾值。
圖1和圖2為實時圖像與背景圖像。用F(x,y)表示當(dāng)前幀圖像中像素(x,y)的各分量值,且F(x,y)滿足公式F(x,y)={R,G,B}={H,S,V},用B(x,y)表示相同位置背景像素的各分量值,且B(x,y)={Rt,Gt,Bt}={Ht,St,Vt}。背景差分后該位置像素的值用D(x,y)={ΔR,ΔG,ΔB}表示。
圖1 實時圖像
圖2 背景圖像
根據(jù)H、S分量與閾值的關(guān)系判斷背景和前景,若是背景像素則對差分像素賦值為白色,若是前景像素則對差分像素賦值為當(dāng)前幀像素值,在賦值時直接取R、G、B分量值,減少計算量且便于顯示。其計算公式如下:
(3)
(4)
(5)
D(x,y)={ΔR,ΔG,ΔB}=
(6)
RGB顏色空間和HSV顏色空間下的背景差分效果圖如圖3和圖4所示。
圖3 RGB空間下的背景差
圖4 HSV空間下的背景差
1.3彩色全方位腐蝕膨脹方法去噪
彩色全方位腐蝕膨脹的方法是在傳統(tǒng)的腐蝕膨脹算法上作出改進。本文分割出人員目標的圖像的背景被賦為白色,定義結(jié)構(gòu)元素S,包括(x,y)、(x,y+1)、(x,y-1)、(x+1,y)、(x-1,y)五個位置的結(jié)構(gòu),目標圖像T,它為原圖像A經(jīng)膨脹或腐蝕后得到的圖像。
彩色膨脹是將S在彩色圖像A上作平移,平移到某個位置,若S中存在某一位置在A的對應(yīng)位置上的像素不為前景像素,則記下結(jié)構(gòu)元素S中的原點在中的位置,記為(i,j),此位置有可能是要處理的空洞點,把S上所有在A中相應(yīng)位置上的像素R、G、B的值分別相加作平均,得到的R、G、B值賦值到目標圖像T中(i,j)位置上。最后把所有滿足上述情況的像素點都賦值到T中,不滿足的像素賦值為白色,便得到經(jīng)彩色全方位膨脹操作后的彩色圖像。
彩色腐蝕是將S在彩色圖像A上作平移,平移到某個位置,若S的所有元素在A內(nèi)的對應(yīng)位置上都不為白色,則記下S中的原點在A中的位置,記為(i,j)。把原圖A中此位置上的R、G、B值賦值到目標圖像T中的相應(yīng)位置上。最后把所有滿足上述情況的像素點都賦值到T中,不滿足的像素賦值為白色,便得到了經(jīng)彩色全方位膨脹或腐蝕操作后的彩色圖像。
基于HSV顏色空間的背景差分效果圖如圖4經(jīng)過彩色膨脹腐蝕處理后的效果圖如圖5所示。
圖5 彩色膨脹腐蝕去噪
2教室人員數(shù)量檢測技術(shù)研究
2.1膚色和頭發(fā)建模
對人臉膚色進行建模,有基于統(tǒng)計的方法和基于物理的方法,基于統(tǒng)計的膚色模型可分為基于靜態(tài)的和基于動態(tài)的膚色模型兩類[9]。靜態(tài)膚色模型常用的方法有:確定膚色閾值方法、單高斯、混合高斯模型和橢圓模型[10]。動態(tài)膚色模型有兩種,一種能針對序列圖像,使圖像可以適應(yīng)時間的變化;另一種是調(diào)節(jié)膚色模型的參數(shù)使之與某幅靜態(tài)圖像相適應(yīng)[11]。確定膚色閾值方法是通過對人物膚色圖像進行統(tǒng)計、分析得出膚色像素的顏色范圍值,方法和實現(xiàn)都較為簡單。利用高斯模型檢測膚色效果較完整清楚,但處理時間長。橢圓膚色模型相對有較多的噪聲點,但檢測效果較準確且實時性好。本文選擇在YCbCr顏色空間的橢圓建模來進行膚色檢測。
對于頭發(fā)建模,本文取大量的人臉圖像,提取出其中的頭發(fā)區(qū)域的YCbCr值,經(jīng)過多次實驗分析得出,人員的頭發(fā)區(qū)域在YCbCr顏色空間的判決范圍:Cr∈[124,140],Cb∈[123,139],Y<40。
2.2基于膚色和頭發(fā)顏色的人頭標記
Anil K Jain等人從HHI圖像庫中選出853571個膚色像素點,并繪制在YCbCr顏色空間中。結(jié)果發(fā)現(xiàn)膚色聚簇類似于紡錘形狀,沿著Y軸方向不同Y值其聚簇范圍大小不同,呈現(xiàn)兩頭尖的狀態(tài)。由此必須考慮Y軸方向,對YCbCr顏色空間進行非線性分段色彩變換。經(jīng)過變換處理之后發(fā)現(xiàn)膚色聚簇在YCb′Cr′空間,并將其投影到Cb′-Cr′之后,得到的是一個類似于橢圓形狀的膚色區(qū)域,并且可用表達式表示:
(7)
式中:a、b中較大者為橢圓長半軸長,較短者為短半軸長;x、y分別為像素的坐標值。公式(7)中的常量值分別為:cx=109.38,cy=152.02,θ=2.53,ecx=1.60,ecy=2.41,a=25.39,b=14.03。人臉膚色的判定決策是:若像素坐標(Cr,Cb)落在橢圓內(nèi),即可判定為人的膚色像素點,否則不是膚色像素點。針對膚色模型和發(fā)區(qū)域的閾值范圍對圖5做皮膚和頭發(fā)標記,膚色部分用紅色標記,頭發(fā)部分別用藍色標記,背景部分則為白色。其處理效果圖如圖6所示。
圖6 膚色頭發(fā)標記效果圖
2.3改進的連通區(qū)域人臉檢測
針對處理后的紅藍白“三值”圖,對傳統(tǒng)的二值圖像的連通標記法做出改進??紤]到頭發(fā)像素(藍色)應(yīng)該在臉部像素(紅色)的上方位置,認為若圖像中的藍色區(qū)域在紅色區(qū)域的外部或是上邊位置,則表示紅藍區(qū)域連通,并且需要分別標注紅藍區(qū)域;若藍色區(qū)域的上邊位置是紅色區(qū)域,則可認為它們不屬于一個連通區(qū)域內(nèi)。這樣便可排除把前后排人頭部區(qū)域被劃成同一連通區(qū)域的可能。
改進后的4連通標記法,須既包含所屬連通區(qū)域值,也包含代表此像素屬于頭發(fā)或是皮膚區(qū)域的值。所以標記值由兩部分構(gòu)成,一部分是連通標記值,另一部分是紅藍標記值。紅藍標記值只需通過掃描圖像時此像素的索引值(1代表紅色,2代表藍色)來確定。連通標記值改進了傳統(tǒng)標記算法。同樣對圖像按從左到右,自上而下的順序掃描圖像。若掃描的此像素是白色,則連通標記值為0,并掃描下一個像素。若此像素為藍色(可能是頭發(fā)像素),分以下幾種情況分別討論:
1)判斷左邊和上邊的像素,若都為藍色且連通標記值相同,賦此像素為相同標記。
2)若左邊和上邊像素都為藍色且連通標記值不同,則賦此像素為與其中一個相同的標記,并做個表明這兩個是等價標記的記號。
3)若左邊和上邊像素都為白色,則賦予此像素新的連通標記值。
4)若此像素的上邊像素為紅色,無論左邊像素是什么顏色,則賦予此像素新的連通標記值。
5)若此像素的左邊為紅色,上邊為藍色,且連通標記相同,則賦予此像素相同的連通標記;若連通標記不同,則賦予和藍色相同的連通標記。
若此像素為紅色像素,也分幾種情況進行討論,其中1)、2)、3)條和上述的類似:
1)判斷左邊和上邊的像素,若都為紅色且連通標記值相同,賦此像素為相同標記。
2)若左邊和上邊像素都為紅色且連通標記值不同,則賦此像素為與其中一個相同的標記,并做個表明這兩個是等價標記的記號。
3)若左邊和上邊像素都為白色,則賦予此像素新的連通標記值。
4)若左邊和上邊像素都為藍色且標記相同,則賦予此像素相同的連通標記;若同為藍色標記不相同,則賦予此像素和上邊像素相同的連通標記值。
5)若左邊和上邊的像素是一藍一紅,則賦此像素與紅色像素相同的連通標記。
第一遍掃描結(jié)束后,把等價的標記全部歸類到等價組,并對每個等價組標以不同的記號。再進行第二次掃描時,用標記所在的等價組的標記去替換圖像在第一遍掃描時的標記。判定為人的頭部應(yīng)該滿足:相同的連通區(qū)域并且此區(qū)域中的紅色和藍色面積要符合一定的范圍和比例,通??紤]人員低頭和抬頭兩種情況下的比例,得出判定公式:
(8)
式中:S(hair)、S(skin)表示同一連通區(qū)域中藍色、紅色區(qū)域的面積;α、β是常量。
3人員數(shù)量檢測結(jié)果與分析
圖7為利用改進的連通區(qū)域標記法對教室人員進行檢測的效果圖。采用數(shù)碼相機取景于本校的大教室。
圖7 人員檢測效果圖
本實驗采集了不同數(shù)目人員的教室圖像樣本進行檢測實驗,用文獻[5]的Haar分類器方法和本文的方法對圖像進行檢測,并比較這兩種方法的檢測結(jié)果,如表1、表2所示。實驗證明Haar分類器方法和本文方法檢測正臉人數(shù)均有較好的效果。對于圖像中的一些特殊姿勢如低頭、側(cè)臉或是有被部分遮擋的人員,Haar分類器方法有明顯的不足,而本文方法檢測效果良好,對比結(jié)果如表3所示。
表1 Haar分類器方法檢測正臉人員結(jié)果
表2 本文方法檢測正臉人員結(jié)果
表3Haar分類器法和本文方法檢測特殊姿勢人員的對比結(jié)果
測試方法特殊姿勢人員實際數(shù)目檢測出的特殊姿勢人員數(shù)目Haar分類器法115本文方法1110
4結(jié)論
提出一種改進的連通區(qū)域標記法。先用背景差分算法分割出人員目標,用彩色全方位腐蝕膨脹方法對圖像進行去噪處理,良好地保護了圖像的顏色信息。然后利用膚色模型和頭發(fā)顏色信息對人員頭部的膚色和頭發(fā)進行不同顏色的標記。最后采用針對三值圖像的改進的連通區(qū)域標記算法檢測教室人數(shù)。實驗結(jié)果表明,本文提出的方法對于教室人員無論在抬頭、低頭、側(cè)臉或是被遮擋情況下,都具有較高的正確檢測率。
參考文獻:
[1]傅莉.公共場所照明節(jié)電智能控制系統(tǒng)設(shè)計[J].電子科技,2011,24(5):85-88.
[2]陳九江,吳桐,王術(shù),等.教室照明系統(tǒng)的智能控制[J].黑龍江大學(xué)自然科學(xué)學(xué)報,2006,23(3):314-316.
[3]聶雄,黃斌全,陳華.一種教室節(jié)能照明系統(tǒng)的人員識別算法[J].電視機術(shù),2011,35(15):16-20.
[4]王飛杰.基于頭肩特征的人體實時檢測與跟蹤[D].長春:吉林大學(xué),2010.
[5]李長風(fēng).基于AdaBoost算法的人臉檢測研究[D].蘭州:蘭州理工大學(xué),2014.
[6]孫統(tǒng)義.實時視頻監(jiān)控人數(shù)統(tǒng)計關(guān)鍵技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2011.
[7]楊枝靈,王開.VC++數(shù)字圖像獲取、處理及實踐應(yīng)用[M].北京:人民郵電出版社,2002:153-170.
[8]Heikkila J,O Silven.A real-time system for monitoring of cyclists and pedestrians[C]//Sccond IEEE Workshop on Visual Surveillance,Fort Collins,1999:74-81.
[9]楊國林,馮喬生,張亞萍.基于膚色的人臉檢測綜述[J].軟件,2013(3):7-9.
[10]易軼虎,曲道奎,徐方.基于參數(shù)查找表的膚色檢測算法[J].計算機科學(xué),2010(3):262-264.
[11]張犀.復(fù)雜背景下膚色檢測的研究[D].杭州:杭州電子科技大學(xué),2011.
(責(zé)任編輯:馬金發(fā))
Research on People Counting Detection in Classroom Based on Connected Labeling
MA Shuang,JIANG Yueqiu,ZHAO Yang,GAO Hongwei
(Shenyang Ligong University,Shenyang 110159,China)
Abstract:An improved people counting detection algorithm based on connected labeling is proposed.In this method,background subtraction method is used to achieve the segmentation of foreground from background.For human detection,skin and hair are marked in different colors based on skin model and hair color information.Based on the three values image,an improved connected labeling method is used to detect human,the test results can be used in automatic lighting control system and classroom management.Experimental results show that this method has a higher detection rate.
Key words:human detection;object segmentation;head labeling;connected labeling
中圖分類號:TP391.41
文獻標志碼:A
文章編號:1003-1251(2016)01-0017-05
作者簡介:馬爽(1989—),女,碩士研究生;通訊作者:姜月秋(1975—),女,教授,博士,研究方向:圖像處理。
收稿日期:2014-12-09