劉 穎,顧小東,李大湘
(西安郵電大學(xué) 通信與信息工程學(xué)院, 陜西 西安 710121)
基于LSA和SVM的火災(zāi)煙霧檢測算法
劉 穎,顧小東,李大湘
(西安郵電大學(xué) 通信與信息工程學(xué)院, 陜西 西安 710121)
為了解決視頻煙霧檢測中特征提取難度較大、復(fù)雜度較高的問題,提出一種基于潛在語義(Latent Semantic Analysis, LSA)特征和支持向量機(jī)(Support Vector Machine, SVM)的煙霧檢測算法。該算法首先將煙霧圖像庫中的每幅圖像進(jìn)行有重疊分塊,提取每個分塊的小波紋理與HSV顏色特征;再對所有分塊特征進(jìn)行聚類、量化成“視覺字”,并且根據(jù)每個“視覺字”在每幅煙霧圖像中出現(xiàn)的頻率,建立“詞-文檔”矩陣;然后采用LSA方法獲得每幅煙霧圖像的潛在語義特征;最后結(jié)合SVM,實(shí)現(xiàn)視頻煙霧檢測。對比實(shí)驗(yàn)表明,該算法特征提取簡便,可以更快檢測煙霧的發(fā)生,提高了煙霧檢測效率。
煙霧檢測;潛在語義特征;支持向量機(jī);特征提?。换馂?zāi)識別
及時(shí)準(zhǔn)確的煙霧檢測,對于預(yù)防火災(zāi)的發(fā)生具有重要的意義。傳統(tǒng)的煙霧檢測技術(shù),如感溫、感煙、感光等技術(shù)易受到空間高度、氣流、粉塵等因素的影響,不適合在大空間以及戶外的環(huán)境??梢暬馂?zāi)檢測技術(shù)由于其反應(yīng)速度快,檢測范圍廣,監(jiān)測距離遠(yuǎn)等優(yōu)點(diǎn)越來越受到人們的重視。它是將計(jì)算機(jī)視覺與圖像處理相結(jié)合,利用煙霧的顏色、頻譜、運(yùn)動、輪廓等特征來檢測是否存在煙霧。
目前現(xiàn)有的算法大多集中于運(yùn)動區(qū)域的提取和幀間的特征提取方面。文獻(xiàn)[1]利用小波變換分析圖像幀在時(shí)域和空域的頻率特性來檢測是否存在煙霧,該算法很透徹地分析了煙霧的小波特性;文獻(xiàn)[2]在運(yùn)動區(qū)域提取時(shí)引入了煙霧的顏色模型和亮度模型確定煙霧的疑似區(qū)域,而后應(yīng)用小波分析和稀疏光流法進(jìn)行煙霧識別;文獻(xiàn)[3]提出一種基于自適應(yīng)神經(jīng)模糊推理系統(tǒng)的視頻煙霧檢測算法;文獻(xiàn)[4]提出基于空間區(qū)域生長和模糊推理的視頻煙霧檢測方法,采用三幀法與三通道區(qū)域生長分割算法提取煙霧疑似區(qū)域;文獻(xiàn)[5]利用RGB和HSV空間的色彩和亮度特征,結(jié)合運(yùn)動主方向檢測煙霧;文獻(xiàn)[6]通過背景相減提取運(yùn)動物體,分析其顏色和紋理特點(diǎn)來判斷煙霧是否存在;文獻(xiàn)[7]應(yīng)用煙霧區(qū)生長速度、區(qū)域不規(guī)則性、背景模糊性來檢測煙霧;鄭璐等[8]通過運(yùn)動目標(biāo)檢測,再引入RGB模型降低誤警率;文獻(xiàn)[9]提出了一種基于塊的視頻煙霧檢測算法;文獻(xiàn)[10]提出一種基于碼本模型和多特征的早期煙霧檢測算法,該算法碼本模型進(jìn)行前景提取,結(jié)合顏色模型、形狀模型檢測疑似煙霧區(qū)域,利用煙霧動態(tài)特征識別煙霧;文獻(xiàn)[11]提出一種基于最小二乘支持向量機(jī)的視頻火災(zāi)煙霧識別算法。上述算法大多應(yīng)用多幀差分獲取運(yùn)動區(qū)域以及利用煙霧的動態(tài)特征,算法相對復(fù)雜,代碼代價(jià)較高。
本文提出了一種基于潛在語義(Latent Semantic Analysis, LSA)特征[12]和支持向量機(jī)(Support Vector Machine, SVM)[13-14]相結(jié)合的煙霧檢測實(shí)現(xiàn)方法,即先針對視頻中單幀圖像提取其LSA特征,再應(yīng)用SVM分類器進(jìn)行煙霧識別。
通過對圖像分塊、特征提取來建立視覺詞匯表,進(jìn)而得到“詞-文檔”矩陣,之后再對該矩陣進(jìn)行奇異值分解得到煙霧圖庫中每幅圖像的潛在語義特征。
1.1 圖像有重疊分塊和特征提取
選取不同場景的煙霧圖像和非煙霧圖像,建立實(shí)驗(yàn)圖像數(shù)據(jù)庫。庫中任意圖像設(shè)為:Bi(i=1,2,…,N),其中N為庫中圖像總數(shù)。對每幅圖像進(jìn)行方形有重疊分塊,假設(shè)第i個圖像Bi被分割成mi小分塊,其中第j塊記作xij(j=1,2,…,mi),則圖像Bi可記作:
Bi={xij:j=1,2,…,mi}。
提取每個分塊xij的小波紋理特征和HSV顏色特征。(1)小波紋理:采用Daubechies小波對圖像進(jìn)行3級小波變換,每一級均得到一個低頻分量cA和三個高頻分量:水平cH、垂直cV和對角cD,然后分別計(jì)算每級分解三個高頻分量的均值與方差,得到18維小波紋理特征。(2)HSV顏色特征:將圖像變換到HSV空間,分別計(jì)算H、S、V三個分量的均值與方差,得到6維顏色特征。這樣每幅小分塊可用24維特征來描述。假設(shè)用hij表示分塊xij的紋理與顏色特征,則圖記為
Bi={hij:j=1,2,…,mi}。
1.2 建立視覺詞匯表
將煙霧圖像庫記為
D={(B1,y1),(B2,y2),…,(BN,yN)},
(1)
其中yi為圖像標(biāo)號且yi∈{-1,+1}(i=1,2,…,N),-1表示無煙圖像,+1表示有煙圖像。將所有分塊的特征hij排列在一起,記作
S={ht:t=1,2,…,T},
(2)
在特征空間中,采用K-Means方法將相近的特征聚集到一起,把S中的元素聚成K類,每個聚類中心都代表具有相近視覺特征的圖像分塊,稱之為“視覺字”(visual word,VW),記作vi,將這K個視覺字組合到一起就構(gòu)成“視覺詞匯表”,記作
R={v1,v2,…,vk}。
(3)
1.3 建立“詞-文檔”矩陣
統(tǒng)計(jì)不同“視覺字”在各圖像中出現(xiàn)的頻數(shù),則庫中的每幅圖像都可以用分塊出現(xiàn)頻數(shù)表示成一個列向量,記作
Bj=[n1,j,n2,j,…,ni,j,…,nK,j]T,
(4)
其中ni,j表示第i個“視覺字”在Bj中出現(xiàn)的次數(shù),在統(tǒng)計(jì)頻率時(shí),進(jìn)行TF-IDF加權(quán),即
ωi,j=ni,j×log2(1+N/dfi),
(5)
其中ni,j表示“視覺字”vi在圖像Bi中出現(xiàn)的次數(shù),dfi表示庫中包含“視覺字”vi的個數(shù);N為庫中圖像總數(shù)。ωi,j表示了“視覺字”vi在庫中圖像Bi中的重要程度。
為了將ωi,j控制在相同的變化區(qū)間,提高分類性能,將其歸一化處理,即
(6)
庫中每個圖像則可以表示成
(7)
這樣將庫中所有圖像對應(yīng)的列向量排在一起,可以得到圖像庫所對應(yīng)的“詞-文檔”矩陣,記作
AK×N=[B1,B2,…,BN]=
(8)
1.4 LSA特征提取
潛在語義分析(LSA),作為一種自然語言的處理方法,其核心觀點(diǎn)是:通過截?cái)嗟钠娈愔捣纸?,把在高維向量空間模型表示的文檔矩陣映射到低維的潛在語義空間。根據(jù)奇異值分解定理,AK×N可以分解成3個矩陣相乘的形式,即
AK×N=UK×nSn×n(VN×n)T,
(9)
其中UK×N和VK×n為與AK×N奇異值相對應(yīng)的左、右正交奇異值矩陣,既滿足
UTU=VTV=I,
(10)
S是將奇異值按由大到小的順序排列構(gòu)成的對角矩陣。K為原特征空間的維數(shù),N是圖像總數(shù),并且
n=min{K,N}。
(11)
如果在Sn×n中取前T個最大的奇異值,以及UK×n和VN×n的前T列,即UK×T、ST×T和(VN×T)T,則
AK×N≈UK×TST×T(VN×T)T,
(12)
即是AK×N在T階最小二乘意義上的最佳近似。
式(12)通常被稱為截?cái)嗟钠娈愔捣纸?,AK×N降維后變?yōu)?/p>
(13)
另設(shè)一幅測試圖像
B=[ω1,ω2,…,ωk]T,
(14)
由
A=USVTUTA?UTUSDT?
UTA?SVT
(15)
推導(dǎo)出其潛在語義特征
(16)
其中UK×T為T個列向量所張成的潛在語義空間,這T個列向量就是潛在語義空間的基。
支持向量機(jī)(SVM)的目標(biāo)是在潛在語義特征空間尋求最佳分類超平面,將問題轉(zhuǎn)化為求解二次規(guī)劃問題,即求解
(17)
的最優(yōu)解,得到最優(yōu)Lagrange乘子a*。其中K為核函數(shù),C為懲罰參數(shù)。
利用樣本庫中的一個支持向量Bi帶入判別函數(shù)
(18)
f(B)為其類別值(-1或1),則可得到偏差值b*。
LSA-SVM算法包括兩個步驟:
(1)LSA-SVM訓(xùn)練
輸入為聚類數(shù)目K值和截?cái)嗑S數(shù)T,以及樣本集合
D={(B1,y1),(B2,y2),…,(BN,yN)} 。
輸出為煙霧圖像庫中所有圖像的LSA特征、潛在語義空間的基UK×T以及SVM分類器。
訓(xùn)練步驟如下。
Step1 圖像分塊及特征提取
對D中任意圖像Bi,用1.1節(jié)所述方法對其進(jìn)行分塊及特征提取。
Step2 構(gòu)造“詞-文檔”矩陣AK×N
利用K-Means方法對D中所有圖像所有分塊的視覺特征聚成K類,構(gòu)造“視覺詞匯表”,按照式(1)~式(8)得到歸一化的“詞-文檔”矩陣。
Step3 LSA特征提取
對庫中任意圖像Bi∈D,按照式(9)~式(16),計(jì)算出其潛在語義特征,存入訓(xùn)練集中。
Step4 訓(xùn)練SVM分類器。
基于訓(xùn)練圖像的潛在語義特征,求解式(17)的優(yōu)化問題,得到SVM分類器(a*,b*)。
(2)煙霧識別
對任意被檢測的新圖像Bj,由式(16)計(jì)算得出潛在語義特征,送入SVM分類器(a*,b*)中,即由式(18)對其進(jìn)行識別。
實(shí)驗(yàn)中選取的煙霧視頻[15-16]總共包含不同的場景的煙霧視頻15個和無煙視頻8個。算法實(shí)現(xiàn)基于Win7操作系統(tǒng),仿真軟件Matlab2010b,計(jì)算機(jī)配置Inte l(R)Core(TM)2 Duo CPU 2.0GHz。
每隔20幀讀取一幅圖像,從中篩選出不同的煙霧圖像和非煙霧圖像,建立圖像庫,庫中總圖片1 735張,煙霧圖像826張,無煙圖像909張。對庫中每幅圖像進(jìn)行有重疊分塊,大小取50×50,步長取30,這樣所有圖像總共被劃分成203 194個小分塊。
每次訓(xùn)練中均利用“2-fold交叉檢驗(yàn)”,尋找最優(yōu)的SVM參數(shù)C(懲罰因子)與g(核函數(shù)控制因子)。SVM分類器參數(shù)尺度因子g=0.01,懲罰因子c=500。
從庫中隨機(jī)選取N(N可取400)張煙霧圖像和N(取500)張無煙圖像,作為訓(xùn)練樣本,其余的圖片作為測試樣本,尋求最佳T(所截取的奇異值數(shù)目),將T由50取到240,步長為10,觀察AUC值,如圖1所示。
圖1 不同T值下的AUC值
由實(shí)驗(yàn)結(jié)果可以看出,當(dāng)聚類中心K=300時(shí),得到T=190,效果最佳。
在取得最佳T值的情況下,統(tǒng)計(jì)數(shù)據(jù)選取庫中8組不同場景的有煙測試視頻,共8 842幀,6組無煙干擾視頻,共2 067幀,分別進(jìn)行檢測。圖2和圖3分別給出了不同干擾情況下典型的煙霧視頻和非煙霧視頻的截圖。
圖2 煙霧圖像
圖3 非煙霧圖像
從圖中可以看出,視頻中存在人物走動、車輛行進(jìn)、白色背景、夜晚強(qiáng)光等因素的干擾。表2和表3分別為煙霧視頻和無煙視頻的檢測結(jié)果且各參數(shù)均取最佳值。結(jié)果表明,多種場景下本算法的平均成功率91.31%,在差別較大的背景下平均誤警率為0.76%,在有強(qiáng)光和白色物干擾情況下,平均誤警率7.65%,訓(xùn)練過后的SVM能夠一定程度地辨別強(qiáng)光、白墻等非煙霧造成的干擾,但效果不是很明顯。
表2 有煙視頻檢測結(jié)果
表3 無煙視頻檢測結(jié)果
為了驗(yàn)證LSA-SVM算法的可行性,基于相同的訓(xùn)練與測試集,與文獻(xiàn)[5]、文獻(xiàn)[11]做對比實(shí)驗(yàn),得到平均查準(zhǔn)率、誤警率(誤警率按干擾較大的場景計(jì)算),試驗(yàn)結(jié)果如表4所示。由表4中數(shù)據(jù)可以看出,文獻(xiàn)[5]中由于處理的煙霧特征較多,相對復(fù)雜,所以程序運(yùn)行較慢;文獻(xiàn)[11]平均成功率較低,原因是應(yīng)用LS-SVM對每一個數(shù)據(jù)點(diǎn)都加入一個改正量,使不等式約束變?yōu)榈仁郊s束,只需求解一個線性方程,從而導(dǎo)致準(zhǔn)確率下降。
表4 不同算法檢測對比
實(shí)驗(yàn)提供了解決煙霧檢測的新方法,在特定的場景下,應(yīng)用潛在語義特征訓(xùn)練SVM分類器可以快速檢測可能的煙霧發(fā)生。實(shí)驗(yàn)中,每隔10幀至30幀(對于10~15幀/s的視頻)從視頻中提取一幅圖像,較之利用視頻幀間信息、連續(xù)地處理圖像,減少了一定的計(jì)算量。再加上算法復(fù)雜度低,運(yùn)行較快,這樣就在很大程度上增加了煙霧檢測效率。如果檢測到有煙霧出現(xiàn),可以繼續(xù)增加其他較復(fù)雜的算法再進(jìn)行識別判斷。
基于LSA特征和SVM的煙霧檢測算法為一種新的解決煙霧檢測的方法。充分利用了幀內(nèi)圖像信息檢測視頻煙霧,目的是提高檢測煙霧的效率,同時(shí)避免連續(xù)處理幀間特征的運(yùn)算量。首先對圖像分塊并且提取分塊的小波紋理特征和顏色特征,再利用潛在語義分析方法得到整幅圖像的潛在語義特征。然后根據(jù)訓(xùn)練集中圖像的潛在語義特征以及圖像標(biāo)號訓(xùn)練SVM分類器。對比試驗(yàn)證明,該算法簡便可行,在特定的場景中,檢測成功率高,但是由于選取特征較少,魯棒性上有待提高。
[1] 帥師, 周平, 汪亞明,等. 基于小波的實(shí)時(shí)煙霧檢測[J]. 計(jì)算機(jī)應(yīng)用研究, 2007, 24(3): 309-311.
[2] 姚太偉, 王慧琴, 胡燕. 基于小波變換和稀疏光流法的火災(zāi)煙霧檢測[J]. 計(jì)算機(jī)工程, 2012, 38(6): 204-206.
[3] 王濤, 劉淵, 謝振平. 基于自適應(yīng)神經(jīng)模糊推理系統(tǒng)的視頻煙霧檢測[J]. 計(jì)算機(jī)工程, 2011, 37(23): 186-188.
[4] 高彥飛, 王慧琴, 胡燕. 基于空間區(qū)域生長和模糊推理的視頻煙霧檢測[J]. 計(jì)算機(jī)工程, 2012,38(4): 287-289.
[5] 胡燕, 王慧琴, 姚太偉,等. 基于塊分割和SVM的視頻火災(zāi)煙霧識別[J]. 計(jì)算機(jī)仿真, 2012, 29(9): 170-173.
[6] Calderara S, Piccinini P, Cucchiara R. Smoke detection in video surveillance: a MoG model in the wavelet domain[C] // Proc. of the 6th international conference on Computer vision systems. Berlin Heidelberg: Springer, 2008: 119-128.
[7] Wu Dongmei, Wang Nanan, Yan Hongmei. Smoke detection based on multi-feature fusion[C] // Proc. of the 5th International Congress on Image and Signal Processing(CISP), Berlin Heidelberg: Springer, 2012: 220-223.
[8] Zheng Lu, Chen Junzhou. Smoke detection algorithm of video based on motion and color[J]. Computer Engineering and Design, 2010, 31(21): 4650-4652.
[9] 李文輝, 肖林廠, 王瑩,等. 一種基于塊的視頻煙霧檢測算法[J]. 吉林大學(xué)學(xué)報(bào): 理學(xué)版, 2012,50(5), 979-986.
[10] 姜明新, 王洪玉, 蔡興洋. 基于碼本模型和多特征的早期煙霧檢測[J]. 中國圖象圖形學(xué)報(bào), 2012, 17(9): 1102-1108.
[11] 賈潔, 王慧琴, 胡燕,等. 基于最小二乘支持向量機(jī)的火災(zāi)煙霧識別算法[J]. 計(jì)算機(jī)工程, 2012, 38(2): 272-275.
[12] 李大湘, 趙小強(qiáng), 劉穎,等. 基于SIFT和MIL的紅外人臉識別算法[J]. 西安郵電學(xué)院學(xué)報(bào), 2012, 17 (4): 15-20.
[13] 楊淑瑩. 模式識別與智能計(jì)算[M]. 2版,北京: 電子工業(yè)出版社, 2011:126-133.
[14] 吳青, 趙雄. 一類新樣條光滑支持向量機(jī)[J]. 西安郵電大學(xué)學(xué)報(bào), 2013, 18(6): 68-74.
[15] Signal, Image And Video Processing Group. Index of /VisiFire/Demo/SmokeClips[EB/OL], (2006-05-07) (2014-04-05). http://signal.ee.bilkent.edu.tr/VisiFire/Demo/SmokeClips/.
[16] Piccinini P. Videos for Smoke detection[EB/OL]. (2007-10-12) (2014-04-05).http://imagelab.ing.unimore.it/visor/video_videosInCategory.asp?idcategory=-1.
[責(zé)任編輯:祝劍]
A fire smoke detection algorithm based on SVM and LSA features
LIU Ying, GU Xiaodong, LI Daxiang
(School of Communication and Information Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710121,China)
Feature extraction algorithms in video smoke detection are complex with high computational load which make it difficult to realize real-time smoke detection. To solve this problem, a smoke detection algorithm based on LSA feature and SVM is proposed in this paper. In this algorithm, firstly the images in the library are divided into overlapping blocks and both wavelet texture and HSV color feature of each block are extracted. Secondly, the feature of each block is clustered into different class and every block is quantified into a “visual word”. According to the frequency of each “visual word” appearing in each smoke image, a “word-document” matrix is established. Thirdly, latent semantic features of each image are obtained by using latent semantic analysis (LSA) method. Lastly video smoke detection is achieved by the LSA-SVM algorithm combining support vector machine (SVM). Comparative experiments show that this algorithm is simple and convenient in feature detection, can detect smoke more quickly, and therefore can improve the efficiency of smoke detection.Keywords:smoke detection, LSA, SVM, feature extraction, fire recognition
10.13682/j.issn.2095-6533.2014.06.002
2014-06-03
國家自然科學(xué)基金青年資助項(xiàng)目(61202183);陜西省自然科學(xué)基金資助項(xiàng)目(2013JM8031);公安部科技強(qiáng)警基礎(chǔ)工作專項(xiàng)基金資助項(xiàng)目(2014GABJC022);陜西省國際科技合作計(jì)劃基金資助項(xiàng)目(2013KW04-05)
劉穎(1972-),女,博士,高級工程師,從事圖像檢索及圖像/視頻特征分析研究。E-mail: ly_yolanda@sina.com 顧小東(1987-),男,碩士研究生,研究方向?yàn)樾盘柵c信息處理。E-mail: 836081632@qq.com
TP391
A
2095-6533(2014)06-0006-05