張楠波 俞孟蕻 黃煒亮 李 袁
(江蘇科技大學(xué)計(jì)算機(jī)學(xué)院 鎮(zhèn)江 212000)
隨著視頻設(shè)備的普及與圖像處理技術(shù)的快速發(fā)展,通過視頻監(jiān)控盡早檢測到火焰的發(fā)生變的越來越重要[1]。傳統(tǒng)的視頻火焰探測技術(shù)首先從空間特征模型與時間特征模型來提取特征,繼而用機(jī)器學(xué)習(xí)來訓(xùn)練得出火焰模型??臻g特征模型從火焰的光譜信息,空間結(jié)構(gòu)信息來描述火焰的候選區(qū)域,如火焰的顏色、亮度、幾何特征、區(qū)域結(jié)構(gòu)等[2]。時間特征模型從火焰的整體運(yùn)動、隨機(jī)頻閃等信息來描述[3]。而上述這些特征有些需要有先驗(yàn)知識來手動設(shè)定參數(shù),如顏色特征;有些受燃燒物、空氣流動等外在因素影響較大,如幾何特征;有些因?yàn)檎系K物遮擋并不能有效觀察測量,如火焰的整體運(yùn)動。
由于上述傳統(tǒng)火焰檢測方式的缺點(diǎn),一種直接基于人類感知視覺系統(tǒng)的檢測方法開始流行起來。人類的視覺機(jī)制可以幫助人們在觀察場景時從大量的雜亂信息中快速準(zhǔn)確的找到自己最感興趣的區(qū)域[4]。在火焰視頻中,火焰的亮度、顏色以及動態(tài)特征在人類視覺中具有較高的顯著性。
為了檢測火焰像素點(diǎn),一般的做法是在某種顏色模型中設(shè)置單個或者多個顏色通道的閾值來實(shí)現(xiàn)[5]。但是這種方法比較簡單原始,當(dāng)火焰材料或環(huán)境改變時檢驗(yàn)失敗的概率比較高。因此,本文提出了一種基于RGB顏色通道的高斯分布模型。我們假定火焰區(qū)域像素點(diǎn)各通道是相互獨(dú)立的,令向量 f表示火焰區(qū)域像素點(diǎn)平均采樣,分別代表其中的R、G、B通道。滿足分布:
其中,px(x0)表示變量x0在隨機(jī)變量X的概率密度函數(shù)的值,Robs,Gobs,Bobs分別待觀測像素的各通道值。我們以DR為例,DR可以被解釋為一個歸一化度量,它表示指定像素點(diǎn)在R通道上是否為火焰像素點(diǎn)的概率。當(dāng)Robs越是接近μfR,DR越大且越來越接近1,就越能斷定待定像素點(diǎn)在R通道上為火焰像素點(diǎn)。
假定Robs,Gobs,Bobs是相互獨(dú)立的,根據(jù)概率學(xué)理論公式,我們提出度量函數(shù)D來指示候選區(qū)域是否為火焰區(qū)域。
D可以表示為候選像素點(diǎn)可表示為火焰像素點(diǎn)的概率置信度(僅從顏色方面分析),通過實(shí)驗(yàn)我們可以得知,若候選區(qū)域?yàn)榛鹧鎱^(qū)域,則一般有D>0.8。
我們知道,圖像中的火焰區(qū)域紅色是非常飽滿的[6]。在此我們定義一種偏度測量R通道像素值分布在其平均值周圍的不對稱程度。當(dāng)偏度為0時,表示分布式對稱的;大于0時,表示分布更加傾向于右側(cè);小于0時,表示分布更加傾向于左側(cè)。
在一般情況下,我們觀察火焰區(qū)域中的R同道直方圖,我們會發(fā)現(xiàn)像素大都聚集到高飽和度的地方,即數(shù)值高的區(qū)域。這也導(dǎo)致了火焰區(qū)域的偏度是一個正數(shù)值,分布是傾向于右側(cè)的。因此,我們將偏度作為一個檢驗(yàn)圖像區(qū)域是否為火焰區(qū)域的重要因素,公式如下:
其中 fR(m,n)代表火焰區(qū)域的R通道像素點(diǎn)分布,J表示區(qū)域像素點(diǎn)的個數(shù),代表分布均值,代表分布方差。若候選區(qū)域?yàn)榛鹧鎱^(qū)域,則一般有。
視覺的顯著性反映了圖像中某個像素或者某一個區(qū)域與周圍像素或環(huán)境的差異性,這種顯著性差異與選取的特征有關(guān)[7]。常見的特征有方向特征,亮度特征,顏色特征等。在不同的圖像中,同一特征對視覺顯著性的影響是不同的。對于火焰圖像來說,其方向特征的作用并不明顯,只會增加計(jì)算的復(fù)雜度。而其亮度與顏色特征確是非常明顯的。
本文先分別介紹并計(jì)算出圖像的局部顯著性,全局顯著性,稀疏顯著性。然后通過融合算法得出最終的顯著圖。
圖像的局部顯著性指的是該像素點(diǎn)或像素區(qū)域與周圍像素點(diǎn)的對比度,對比度越大,則該像素或該區(qū)域越顯著。張巧榮[8]從頻域分析著手,通過傅里葉變換,提取幅度譜與相位譜,對相位譜進(jìn)行重構(gòu)來獲得局部顯著性,這個方法復(fù)雜度高。
為了計(jì)算簡單,加大算法檢測的實(shí)時性,本文使用了AC算法來檢測圖像的局部性,該方法計(jì)算候選像素與周圍鄰域像素均值的歐式距離得出鄰域的局部顯著性,又根據(jù)不同的鄰域?qū)挾日{(diào)整影響權(quán)值,線性加權(quán)計(jì)算最終的局部顯著圖像。
考慮到火焰燃燒的無規(guī)律性與背景的復(fù)雜性,僅使用局部顯著性計(jì)算鄰域像素的對比度是不可行的,它會導(dǎo)致圖像內(nèi)一些邊緣特征區(qū)域或者噪聲干擾區(qū)域產(chǎn)生較高的顯著性,而火焰內(nèi)部的平滑區(qū)域賦予較低測顯著性。因此,還需要計(jì)算出像素與整幅火焰圖像的對比度,即圖像的全局顯著性。這樣做能抑制經(jīng)常出現(xiàn)的邊緣特征干擾,把大范圍的平滑漸變區(qū)域分割開來[9]。
考慮到Lab顏色空間比RGB空間更加符合人類的認(rèn)知習(xí)慣,全局顯著性是在Lab空間計(jì)算的:
公式中,Ii(x,y)為圖像在L,a,b上的分量,M、N分別為圖像的寬和高,fi(x,y)為圖像在各個通道上的平均值,Sgi為每個通道的全局顯著性。在分量融合過程中,由于火焰圖像的特殊性,L亮度通道是最顯著的,所以給予的權(quán)值最多,其次是表征紅綠的a通道,而表征黃藍(lán)的b通道給予的權(quán)值最少。
在有些火焰圖像中,相對于比較大的遮擋物,零散小火苗的全局顯著性并不明顯。因此我們利用直方圖統(tǒng)計(jì)像素,來計(jì)算出圖像的稀疏性。稀疏性意味著該像素在圖像中出現(xiàn)的次數(shù)越少,相對于全局它就越顯著。在圖像中,噪聲像素出現(xiàn)的次數(shù)也比較少,為了防止噪聲干擾,在這里我們要給出兩個閾值,次數(shù)小于該閾值u1時判定為噪聲,次數(shù)大于u2要給與稀疏性抑制。公式如下:
其中Sr(x,y)為圖像的稀疏性度量,h(I(x,y))為圖像的直方統(tǒng)計(jì)圖。實(shí)驗(yàn)中u1取值64,u2取值1024。抑制參數(shù) c1取800,c2取200。
前文中已經(jīng)分析了全局顯著性,局部顯著性和稀疏性的特性,綜合考慮這些因素,必須對這些特性進(jìn)行融合。在實(shí)驗(yàn)中為了對比效果,將融合結(jié)果進(jìn)行拉伸處理,公式如下:
式中 Sl(x,y),Sg(x,y),Sr(x,y)分別為上文中的全局顯著性、局部顯著性、稀疏性,Sfuse為初步融合結(jié)果,Savg為融合結(jié)果的平均值,Sfinal為拉伸后的最終結(jié)果。
圖1 火焰圖像各顯著性圖效果
在最終的融合顯著性圖像中,亮度越高表示區(qū)域越顯著。火焰一般是圖像里比較顯著的,如果有火焰產(chǎn)生,那么火焰在這些區(qū)域的可能性就越大。本文在融合顯著性圖像中選取灰度級200~255的范圍來表示候選火焰區(qū)域。
機(jī)器學(xué)習(xí)算法是對各個特征綜合考量的分類決策算法[10],它在這一方面比人類更具有優(yōu)勢,當(dāng)提出的特征合適時,機(jī)器學(xué)習(xí)算法就有了很好的準(zhǔn)確性與穩(wěn)定性。本文采用支持向量機(jī)分類器[11]依據(jù)火焰特征訓(xùn)練好模型,進(jìn)而通過訓(xùn)練好的模型對火焰進(jìn)行分類檢測。
為了獲得更好的訓(xùn)練效果,本文模擬真實(shí)的自然環(huán)境,從國外視覺實(shí)驗(yàn)室網(wǎng)站上選取了10段火焰視頻,這10個火焰視頻中燃燒背景不相同,燃燒火焰的動靜態(tài)各方面特征也不完全相同。選取了5段非火焰視頻,其中包含了各種類似火焰的干擾物,紅色的楓葉,晚上的路燈,閃爍的螢火蟲等。每段火焰視頻與非火焰視頻中各取連續(xù)的100幀32*32大小的圖像塊,共計(jì)1500個圖像塊,其中80%當(dāng)做訓(xùn)練集,20%當(dāng)做測試集。對于訓(xùn)練集與測試集中的圖像塊分布提取顏色置信度、矩形度[12]、邊界粗糙度[13]、偏度、尖角個數(shù)[14],質(zhì)心運(yùn)動方向[15]特征,那么每一個樣本就包含了一個長度為7的特征向量 X=[D,R,B,P,J,Mx,My]。給訓(xùn)練集和測試集按有無火焰加上0~1標(biāo)簽后,就可以用支持向量機(jī)開始訓(xùn)練了,在訓(xùn)練過程中不斷優(yōu)化模型。
部分火焰圖像特征如表1所示,非火焰圖像特征如表2所示,支持向量機(jī)參數(shù)如表3所示。
表1 火焰圖像特征特征數(shù)據(jù)列表
表2 非火焰圖像特征特征數(shù)據(jù)列表
表3 非火焰圖像特征特征數(shù)據(jù)列表
在支持向量機(jī)模型訓(xùn)練完成后,本文選取了其他視頻進(jìn)行檢驗(yàn)測試。實(shí)驗(yàn)結(jié)果表示,通過融合顯著性算法后,基本能將火焰區(qū)域正確的標(biāo)識出來。然后將標(biāo)記出的區(qū)域通過基于RGB顏色通道的高斯分布模型與運(yùn)動前景目標(biāo)檢測,實(shí)驗(yàn)中非火焰顏色的目標(biāo)與類似火焰顏色的靜態(tài)目標(biāo)也能正確得被排除,只剩下一些與火焰動靜態(tài)特征都很類似的干擾,比如在風(fēng)中搖擺的電燈。提取目標(biāo)區(qū)域的特征放入訓(xùn)練好的支持向量機(jī)模型后,是否為火焰也能得到正確的判斷,實(shí)驗(yàn)結(jié)果如圖2~3。
圖2 檢測火焰發(fā)生
圖3 類似火焰干擾物未被誤檢
最終實(shí)驗(yàn)表明,決策準(zhǔn)確率較高,視頻中的小型火焰和大型火災(zāi)基本能被檢測出來。與其他算法對比,該算法在抗干擾能力比較強(qiáng),常被其他算法誤檢的目標(biāo),如變化的霓虹燈,移動的橘紅色物體等干擾都能被有效排除。
傳統(tǒng)的獲取視頻火焰候選區(qū)域的的主流算法包括顏色區(qū)間模型等靜態(tài)檢測算法和運(yùn)動目標(biāo)前景檢測方法等。顏色區(qū)間模型只關(guān)注了火焰的顏色特性,運(yùn)動目標(biāo)前景檢測方法只關(guān)注了火焰序列幀之間的變化性,而融合顯著性的候選區(qū)域提取方式從人的視覺機(jī)制出發(fā),更加關(guān)注火焰區(qū)域與周圍環(huán)境的區(qū)別大小問題。通過顯著性提取火焰候選區(qū)域,然后再利用顏色空間和動態(tài)特性對候選區(qū)域進(jìn)一步篩選,這種方式只計(jì)算了當(dāng)前幀圖像,并不需要其他幀圖像進(jìn)行建模,減少計(jì)算量的同時也能保證準(zhǔn)確率。對于與火焰動靜態(tài)特征都相似的干擾物,獲取多維特征進(jìn)行支持向量機(jī)決策能有效地進(jìn)行判別區(qū)分。