郭志濤,曹小青,厲成元,于洪澤,王卿粹
(1.天津電氣科學(xué)研究院有限公司,天津 300301;2.河北工業(yè)大學(xué) 電子信息工程學(xué)院,天津 300401)
運(yùn)動(dòng)目標(biāo)檢測(cè)[1]是智能視頻處理和計(jì)算機(jī)視覺(jué)過(guò)程中的關(guān)鍵技術(shù),其主要目的是將視頻信息中的運(yùn)動(dòng)目標(biāo)與背景分離開(kāi),以提取到清晰完整的運(yùn)動(dòng)目標(biāo)。當(dāng)前常見(jiàn)的運(yùn)動(dòng)目標(biāo)檢測(cè)方法主要包括光流法[2]、背景差分法、幀間差分法[3]、視覺(jué)背景提取法等。視覺(jué)背景提取算法(ViBe算法[4])是目前比較高效的背景建模方法,其內(nèi)存占用少運(yùn)行速度快,抗噪性能好,十分適用于對(duì)精確度與實(shí)時(shí)性均要求較高的實(shí)時(shí)視頻監(jiān)控及智能處理領(lǐng)域。但是 ViBe 算法在處理比較復(fù)雜情景時(shí)可能會(huì)出現(xiàn)運(yùn)動(dòng)目標(biāo)檢測(cè)不完整的問(wèn)題,包括運(yùn)動(dòng)目標(biāo)內(nèi)部有大量空洞、運(yùn)動(dòng)目標(biāo)中間有斷層等[5],同時(shí)在交通監(jiān)控視頻中還容易出現(xiàn)陰影問(wèn)題[6],需要及時(shí)消除才能保證檢測(cè)的準(zhǔn)確度。
ViBe算法主要由背景模型的初始化、前景檢測(cè)過(guò)程、背景模型的更新策略[7]三個(gè)部分組成:
(1)背景模型的初始化。ViBe算法利用視頻序列的第一幀來(lái)初始化背景模型,再以幀為單位迭代對(duì)每幀的每個(gè)像素點(diǎn)進(jìn)行建模。在用視頻序列第一幀初始化背景模型時(shí),用v(x)表示像素點(diǎn)x處的背景像素值,用M(x)表示x處的背景樣本集,其背景模型為(1)式。
M(x)={v1,v2,…,vN}
(1)
(2)前景檢測(cè)過(guò)程。比較每個(gè)新像素值v(x)和樣本值M(x),若新像素值和樣本集中每個(gè)樣本值的歐式空間距離小于閾值R,則近似樣本點(diǎn)數(shù)增加,一旦近似樣本點(diǎn)數(shù)大于判定閾值Min,則判定其為背景點(diǎn),否則為前景點(diǎn)。
(3)背景模型的更新策略。ViBe算法背景模型的隨機(jī)更新策略主要包括:第一,無(wú)記憶更新策略。用新的像素值隨機(jī)取代像素點(diǎn)樣本集M(x)中的一個(gè)樣本值來(lái)確定該像素點(diǎn)需要進(jìn)行更新的背景模型。第二,時(shí)間取樣更新策略。實(shí)際過(guò)程中并不是每幀都更新,而是按一定的更新率更新背景模型。
針對(duì)傳統(tǒng)ViBe算法閾值R固定,容易出現(xiàn)背景誤檢為前景和前景誤檢為背景的問(wèn)題,本文分別定義了兩種誤檢情況對(duì)應(yīng)的評(píng)價(jià)函數(shù)evaluation1(k)和evaluation2(k)來(lái)動(dòng)態(tài)調(diào)整閾值R。下面將分別介紹兩種評(píng)價(jià)函數(shù)以及動(dòng)態(tài)閾值R的定義式。
2.1.1 評(píng)價(jià)函數(shù)evaluation1(k)定義
評(píng)價(jià)函數(shù)evaluation1(k)以視頻幀中目標(biāo)像素點(diǎn)數(shù)量的變化情況為評(píng)價(jià)對(duì)象,如果檢測(cè)到小范圍幀內(nèi)目標(biāo)像素點(diǎn)數(shù)量發(fā)生劇烈波動(dòng)則說(shuō)明前景目標(biāo)區(qū)域檢測(cè)并不穩(wěn)定,此時(shí)需要提高背景模型的準(zhǔn)確度。
首先,用傳統(tǒng)ViBe背景建模方法得到K幀(例K取值為20)圖像的運(yùn)動(dòng)目標(biāo)二值圖并統(tǒng)計(jì)每幀二值圖的目標(biāo)像素點(diǎn)個(gè)數(shù)Data(i) (i=1,2,...,K),再統(tǒng)計(jì)這K幀圖像目標(biāo)像素點(diǎn)個(gè)數(shù)Data(i)與第一幀目標(biāo)像素點(diǎn)個(gè)數(shù)Data(1)差值的波動(dòng)情況,并設(shè)定波動(dòng)范圍為正負(fù)T1。第一種評(píng)價(jià)函數(shù)的定義如式(2)所示。
(2)
其中,W、H分別為圖像的寬和高。最后用同樣方法得到第(K,2K),(2K,3K),...幀的評(píng)價(jià)函數(shù)。
2.1.2 評(píng)價(jià)函數(shù)evaluation2(k)定義
評(píng)價(jià)函數(shù)evaluation2(k)以檢測(cè)完整率為評(píng)價(jià)對(duì)象,即單幀圖像運(yùn)動(dòng)目標(biāo)檢測(cè)的完整性,評(píng)價(jià)目標(biāo)是否存在內(nèi)部有空洞、斷層、邊緣呈C字型凹陷等問(wèn)題。
定義ViBe算法檢測(cè)到的單幀圖像的運(yùn)動(dòng)目標(biāo)區(qū)域?yàn)閍rea1,包含目標(biāo)區(qū)域的最小凸形區(qū)域?yàn)閍rea2,則區(qū)域差Δarea如式(3)所示。
Δarea=area2-area1
(3)
若圖像里包括n個(gè)獨(dú)立的目標(biāo)區(qū)域,則圖像的總區(qū)域差定義為式(4):
(4)
該式表明第二種誤檢情況不僅與閾值R有關(guān)系,也與圖像內(nèi)的運(yùn)動(dòng)目標(biāo)個(gè)數(shù)n有關(guān)。為了更好地表明第二種評(píng)價(jià)函數(shù)與閾值R及運(yùn)動(dòng)目標(biāo)個(gè)數(shù)n之間的關(guān)系,其定義式如式(5)所示。
(5)
2.1.3 動(dòng)態(tài)閾值R調(diào)整方法
基于以上兩種評(píng)價(jià)函數(shù)對(duì)閾值R的影響分析,定義閾值R的動(dòng)態(tài)調(diào)整式如式(6)所示。
(6)
其中T1、T2分別為評(píng)價(jià)函數(shù)evaluation1(k)、evaluation2(k)的比較門(mén)限,ΔR為閾值R的增量。
傳統(tǒng)ViBe算法根據(jù)上式(6)實(shí)現(xiàn)閾值R動(dòng)態(tài)更新后,得到的檢測(cè)目標(biāo)圖再進(jìn)行中值濾波。
在交通監(jiān)控視頻中,除了上述提到的運(yùn)動(dòng)目標(biāo)檢測(cè)完整性,陰影能否及時(shí)有效消除也直接影響運(yùn)動(dòng)目標(biāo)提取的準(zhǔn)確度,關(guān)系著后續(xù)目標(biāo)的識(shí)別、跟蹤過(guò)程,因此本文提出了一種融合顏色特征和角點(diǎn)特征的陰影消除方法。
2.2.1 顏色特征
陰影區(qū)域的像素亮度值相較于同位置的背景區(qū)域會(huì)更低[8],根據(jù)這一特性可以初步判定陰影區(qū)域。判定方法為將RGB顏色空間內(nèi)一個(gè)像素的R、G、B分量與參考背景像素的R、G、B分量進(jìn)行比較,若均有所降低,則該像素被初步判定為疑似陰影像素點(diǎn),以此方法得到一個(gè)疑似陰影像素點(diǎn)集??紤]到現(xiàn)實(shí)視頻中存在的噪聲問(wèn)題,定義判定公式如式(7)。
(7)
其中SRGB為疑似陰影像素點(diǎn)集, (xbg,ybg)為參考背景像素點(diǎn),(x,y)為當(dāng)前幀像素點(diǎn),(t1,t2,t3)為噪聲干擾量,可依視頻情況調(diào)整。參考背景像素點(diǎn)(xbg,ybg)由ViBe算法背景建模取均值給出并進(jìn)行更新。
2.2.2 角點(diǎn)特征
角點(diǎn)為鄰域內(nèi)具有兩個(gè)主方向的特征點(diǎn),其所在的區(qū)域通常穩(wěn)定且包含信息豐富,具有光照不變性、仿射不變性[9]。角點(diǎn)檢測(cè)結(jié)果在同一場(chǎng)景中不受光照變化影響,而且角點(diǎn)分布情況與車(chē)輛結(jié)構(gòu)密切相關(guān),陰影區(qū)域形狀較光滑角點(diǎn)少,而車(chē)輛區(qū)域處角點(diǎn)密集。
采用Shi-Tomasi方法[10]提取視頻流中的角點(diǎn)特征,標(biāo)注為彩色圓點(diǎn),檢測(cè)結(jié)果圖如圖1所示。由于角點(diǎn)特征主要集中在車(chē)輛車(chē)燈、車(chē)窗、防護(hù)杠等處,且成帶狀或聚合狀分布,因此可以采用最小距離聚類(lèi)算法進(jìn)行模式聚類(lèi),轉(zhuǎn)換角點(diǎn)分布問(wèn)題為點(diǎn)集聚類(lèi)問(wèn)題。根據(jù)得到的聚類(lèi)結(jié)果,利用快速凸包方法畫(huà)出一個(gè)包含聚類(lèi)點(diǎn)集的面積最小的凸多邊形,該凸包即為可能的運(yùn)動(dòng)車(chē)輛區(qū)域。將根據(jù)顏色特征判定的結(jié)果與角點(diǎn)特征得到的凸包進(jìn)行陰影融合,即可以得到陰影區(qū)域并進(jìn)行清除。
圖1 角點(diǎn)檢測(cè)結(jié)果圖
本文實(shí)驗(yàn)環(huán)境為:Win 7系統(tǒng),雙核 Intel Core i5-5200U @ 2.20 GHz,8 GB內(nèi)存的計(jì)算機(jī);算法采用 Visual Studio 2010和 Open CV 2.4.11編譯實(shí)現(xiàn)。實(shí)驗(yàn)數(shù)據(jù)采用三個(gè)標(biāo)準(zhǔn)測(cè)試視頻,并與傳統(tǒng)ViBe算法進(jìn)行對(duì)比實(shí)驗(yàn)。三個(gè)視頻數(shù)據(jù)具體信息如表1所示。
表11 測(cè)試視頻數(shù)據(jù)信息
視頻名稱(chēng)分辨率幀率總幀數(shù)highwayⅠ320×24014438Intelligentroom320×24010300campus352×288101 170
在測(cè)試中根據(jù)測(cè)試結(jié)果不斷調(diào)整評(píng)價(jià)函數(shù)比較門(mén)限和閾值R的增量,最終確定當(dāng)T1=0.05,T2=0.2,增量ΔR=2時(shí)得到最好的檢測(cè)結(jié)果。為了更全面驗(yàn)證改進(jìn)算法在各種視頻環(huán)境中的效果,本文選取三種典型的監(jiān)控視頻進(jìn)行測(cè)試。視頻intelligentroom為室內(nèi)監(jiān)控視頻,視頻campus為室外監(jiān)控視頻,這兩個(gè)測(cè)試視頻均背景較復(fù)雜。視頻highwayⅠ為交通監(jiān)控視頻,目標(biāo)動(dòng)態(tài)性較強(qiáng),且容易有陰影干擾檢測(cè)結(jié)果。
表2為intelligentroom 視頻第284幀和Campus視頻第1064幀的檢測(cè)結(jié)果。從中可以看出intelligentroom 視頻室內(nèi)背景復(fù)雜,運(yùn)動(dòng)目標(biāo)與背景區(qū)分不大,傳統(tǒng)ViBe算法不能根據(jù)不同情況及時(shí)調(diào)整R,因此運(yùn)動(dòng)目標(biāo)檢測(cè)準(zhǔn)確度并不高,可能會(huì)出現(xiàn)284幀目標(biāo)內(nèi)部有空洞、目標(biāo)邊緣殘缺的問(wèn)題。Campus視頻中室外光照條件不是很理想,背景較復(fù)雜,運(yùn)動(dòng)目標(biāo)較小,這幾個(gè)因素均為運(yùn)動(dòng)目標(biāo)提取造成困難,其第1064幀出現(xiàn)了目標(biāo)中間有斷層的問(wèn)題。本文改進(jìn)算法有效解決了以上問(wèn)題,得到更為清晰完整的目標(biāo),為后續(xù)視頻分析處理提供良好的基礎(chǔ)。
表12 intelligentroom、Campus 視頻檢測(cè)結(jié)果
幀數(shù)原始圖像原Vibe結(jié)果改進(jìn)Vibe結(jié)果2841 064
圖2為highwayⅠ測(cè)試視頻第308幀的目標(biāo)檢測(cè)結(jié)果,交通監(jiān)控視頻中運(yùn)動(dòng)目標(biāo)移動(dòng)速度快,傳統(tǒng)ViBe算法由于閾值固定很難達(dá)到實(shí)時(shí)調(diào)整的要求,故而容易出現(xiàn)目標(biāo)內(nèi)部有空洞和目標(biāo)邊緣殘缺等問(wèn)題。本論文的改進(jìn)算法自適應(yīng)調(diào)整閾值R,并結(jié)合上述提出的融合顏色特征和角點(diǎn)特征的陰影消除方法,其檢測(cè)結(jié)果較傳統(tǒng)算法更加清晰,檢測(cè)準(zhǔn)確度較高。
圖2 highwayⅠ視頻檢測(cè)結(jié)果
傳統(tǒng)ViBe算法檢測(cè)背景復(fù)雜或目標(biāo)動(dòng)態(tài)性較強(qiáng)的視頻時(shí)容易出現(xiàn)檢測(cè)不完整的問(wèn)題,本論文針對(duì)這一問(wèn)題分別定義了兩種評(píng)價(jià)函數(shù)來(lái)動(dòng)態(tài)調(diào)整閾值R,使其在不同檢測(cè)情況下自適應(yīng)調(diào)整,得到更加準(zhǔn)確、完整的目標(biāo)區(qū)域。同時(shí)提出的融合顏色特征和角點(diǎn)特征的陰影消除方法也可以及時(shí)消除交通監(jiān)控視頻的陰影區(qū)域,檢測(cè)結(jié)果更加準(zhǔn)確。實(shí)驗(yàn)結(jié)果表明改進(jìn)算法在各項(xiàng)評(píng)價(jià)指標(biāo)上較傳統(tǒng)ViBe算法均有所改進(jìn),在視頻監(jiān)控應(yīng)用方面具有一定的實(shí)用性。