劉麗紅+曾志高+彭程+楊凡穩(wěn)+周丹+姚慧丹
摘要:針對線性判別分析只能提取線性特征而不能描述非線性特征的缺點,本文采用將核函數(shù)和Fisher判別分析方法的可分性結(jié)合起來的核Fisher判別分析的方法對視頻中的運(yùn)動目標(biāo)進(jìn)行自動分類,運(yùn)動目標(biāo)包含人、汽車和寵物三類。該方法取得了較好的分類效果,且在查全率、查準(zhǔn)率和F1?-Measure獲得了滿意的性能。
關(guān)鍵詞:線性判別分析;特征提取;核Fisher判別分析;運(yùn)動目標(biāo)分類;視頻
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A
Classification??of??Moving??Targets??in??Video??Based??on??the??Kernel??Fisher??Discriminant??Analysis.
Liu?Li?hong1,??Zeng?Zhi?gao1*,?Pen?Cheng2,?Yang?Fangwen1,?Zhou?Dan1,?Yao?Huidan1
2.?School?Of?energy?Power?And?Mechanical?Engineering,?Beijing,?102206)
Abstract:?In?order?to?overcome?the?shortage?of?linear?discriminant?analysis?which?can?only?extract?linear?features?and?can?not?describe?nonlinear?characteristics,?the?Kernel?Fisher?Discriminant?Analysis?algorithm,?which?combines?the?kernel?learning?and?the?separation?of?linear?discriminant?analysis,?is?adopted?to?automatically?classify?the?moving?objects?in?video,?and?in?this?paper,?the?objects?include?three?categories:?people,?cars?and?pets.?The?method?has?obtained?satisfying?performance?both?in?this?system?and?in?the?recall,?precision?and?F1-score.
Keywords:?linear?discriminant?analysis;?feature?extraction,;kernel?Fisher?discriminant?analysis;moving?object?classification,;video
1?引言
隨著社會的發(fā)展人們安防意識的逐步增強(qiáng),大量的視頻監(jiān)控被安裝到小區(qū)門口、寫字樓、商場、交通路口、車站、機(jī)場等公共場所。監(jiān)控視頻得到的海量視頻數(shù)據(jù)靠人為的傳統(tǒng)處理方式已經(jīng)不能滿足當(dāng)前社會的安全需求[1]。
因此,視頻監(jiān)控的智能化給計算機(jī)視覺在公共安全領(lǐng)域的應(yīng)用提供了廣闊的前景[2]。視頻監(jiān)控是對場景中的異常事件或人的異常行為進(jìn)行監(jiān)控[3]。運(yùn)動目標(biāo)檢測和分類識別一直是機(jī)器視覺研究應(yīng)用及智能視頻監(jiān)控中的關(guān)鍵技術(shù),一直是研究的熱點之一,許多的分類算法被提
出[4]。文獻(xiàn)[2]中的分類方法要對目標(biāo)的實際高度
和寬度等參數(shù)進(jìn)行統(tǒng)計,工作量非常大且不能對空中的目標(biāo)進(jìn)行識別分類。文獻(xiàn)[5]基于形狀特征的運(yùn)動目標(biāo)分類方法采用的形狀特征受到前景檢測的影響,不能使用不同環(huán)境下的視頻監(jiān)控應(yīng)用。周維[6]提出的方法對前景和背景的區(qū)分能力比較強(qiáng),但識別率不是很顯著。郭玲[7]采用顏色直方圖對目標(biāo)進(jìn)行識別,背景對其影響比較大,識別效果不是很好。針對之前的方法識別率不高和操作復(fù)雜的問題,本文采用核Fisher判別分析(Kernel?Fisher?Discrimination?Analysis,KFDA)算法[8,9]對視頻監(jiān)控圖像中的車子、人以及寵物三類目標(biāo)進(jìn)行分類,且取得了較好的分類效果。
2?視頻中運(yùn)動目標(biāo)的特征提取
對于大多數(shù)的實際數(shù)據(jù)一般的非線性方法不能很好地描述圖像中一些復(fù)雜的非線性變化[10]。核Fisher判別分析既具有核技巧的非線性描述能力,又繼承了Fisher線性判別分析的優(yōu)點[10]。本文采用核Fisher判別分析來做視頻監(jiān)控中運(yùn)動目標(biāo)的分類。
核方法比普通的非線性方法更具有優(yōu)勢,它可以借助核函數(shù),避免“維數(shù)災(zāi)難”,減少計算量,且需要對輸入的空間進(jìn)行任何直接的非線性映射。下面我們來介紹下核函數(shù)。
2.1?核函數(shù)
核函數(shù)就是把輸入樣本采用非線性變換將其映射到一個合適的特征空間中,然后應(yīng)用統(tǒng)計學(xué)等方法去解決問題。
一般核函數(shù)都是使用Mencer核實現(xiàn),本文采取的是多項式核函數(shù):
2.2?核Fisher判別準(zhǔn)則
KFDA算法簡單的說就是將核技巧應(yīng)用到
Fisher線性鑒別分析中。KFDA算法的基本思想:首先將原始訓(xùn)練樣本通過一個非線性映射函數(shù)映射到一個高維的特征空間中,再在高維特征空間中進(jìn)行Fisher線性鑒別分析,這樣就隱含的實現(xiàn)了原輸入空間的非線性判別。之后只需要在高維特征空間中進(jìn)行Fisher線性鑒別分析,這樣相對于原始空間來說進(jìn)行的就是非線性鑒別分析。
KFDA算法的核學(xué)習(xí)方法的技巧就是通過原始空間的內(nèi)積核函數(shù)在進(jìn)行所有的運(yùn)算,并沒有涉及到具體的非線性映射[9]。KFDA算法能夠?qū)D像的非線性特征提取出來,這些非線性特征更有利于分類。
2.3?核Fisher算法實現(xiàn)步驟
基于核Fisher分類要首先實現(xiàn)兩類分類,返回最接近待測樣品的類別,然后用返回的類別和新的類別做兩類分類,又能夠得到比較接近的類別,最后得出未知樣品的類別。
① 首先創(chuàng)建一個核PCA分量將輸入空間映射到KPDA特征空間中,在KPCA空間中計算出類間散布矩陣和類內(nèi)散布矩陣。
④ 利用最優(yōu)鑒別向量對映射到空間中的訓(xùn)練樣本和測試樣本進(jìn)行投影,對投影后的對數(shù)據(jù)通過最近鄰法進(jìn)行分類。
3?實驗結(jié)果
為了驗證本文算法的優(yōu)越性,所以在相同的條件下運(yùn)用KFDA算法、PCA算法和PCA結(jié)合LDA的算法同時對視頻靜態(tài)背景中的三類目標(biāo)(人、汽車和寵物)進(jìn)行分類,并且對分類器的性能進(jìn)行了比較和分析。
實驗環(huán)境:MATLAB?R2012a,Intel(R)?Pentium(R)?CPUG2030?3.00GHz.訓(xùn)練集中每類
包含10張圖片,測試集每類包含174張照片。
3.1?分類結(jié)果圖
基于KFDA算法的部分分類結(jié)果圖如下:
圖1?基于KFDA算法的部分分類效果圖
3.2?分類器性能評價標(biāo)準(zhǔn)
3.3?分類器性能分析
對PCA算法、PCA+LDA(PLA)算法和KFDA算法的分類結(jié)果進(jìn)行比較和分析。下面的表格是對實驗結(jié)果的記錄和分析。
由表(1)可以計算出基于各個算法分類的查準(zhǔn)率P,查全率R,F(xiàn)-Measure?F,以及總的分類準(zhǔn)確率M,數(shù)據(jù)如下表:
表(2)查準(zhǔn)率P,查全率R,F(xiàn)1-score以及
總的分類準(zhǔn)確率的比較
為了更為直觀的表示數(shù)據(jù),我們采用圖表的方式對表(2)進(jìn)行描述,如下圖所示:
(A)?查準(zhǔn)率P????????(B)查全率R
(C)F1-Measure????(D)總的分類正確率
圖2?(A),(B),(C),(D)分別代表查準(zhǔn)率,
查全率,F(xiàn)1-Measureh和總的分類正確率;
從圖(D)中看出本文采取的KFDA算法在總的分類正確率是最高的,從單一的結(jié)果來看分類器的性能是不全面的,應(yīng)該從各個分類器對各個類別的分類性能去研究和分析。查準(zhǔn)率標(biāo)準(zhǔn)下的各個算法的分類性能比較:基于PCA算法和PCA+LDA算法的分類對人的分類性能比對車子和寵物的要稍高些,本文采取的基于KFDA算法則對各個類別的分類性能都不錯,且各個種類的性能均優(yōu)于前兩種算法。查全率標(biāo)準(zhǔn)下各個算法的分類性能比較:基于PCA算法的分類對車子的分類性能是最佳的,基于PCA+LDA算法的分類對寵物的分類最好,本文采取的KFDA算法對所有的類別的分類性能都比其他兩種算法要好?;赑CA算法和基于PCA+LDA算法對人的查準(zhǔn)率雖然最高,但是其查全率比較低,所以得到的F-Score則不是最高的。從(C)中我們可以看出PCA+LDA算法對車子的分類性能最好,對人的其次,最差的就是對寵物的分類。從綜合的F-Measure可以看出基于PCA+LDA算法的分類性能總體都要比基于PCA算法的分類性能要好,基于KFDA算法的分類性能則比基于PCA+LDA算法的性能高。
4?總?結(jié)
本文采用基于核的Fisher判別方法對監(jiān)控視頻中的運(yùn)動目標(biāo)進(jìn)行分類,并與基于PCA和
PCA結(jié)合LDA的算法進(jìn)行了比較分析。結(jié)果表明
本文算法取得了很好的分類效果,并且各方面
性能指數(shù)要優(yōu)于其他兩種算法。但是仍然有兩
點問題,在分類的過程中我們會把受到的外部環(huán)境的影響和物體的角度等造成的非線性特征抽取出來了,且KFDA算法一樣的要面對小樣本問題。如何降低這些問題的影響是我們要進(jìn)一步研究的內(nèi)容。本文做的是靜態(tài)的目標(biāo)檢測,下一步要研究的是將該算法應(yīng)用到動態(tài)場景中。
參考文獻(xiàn):
[1] ?李占闖.?監(jiān)控視頻中的運(yùn)動目標(biāo)分類算法研究[D].?西南大學(xué).?2010年.
[2] ?陳大海.?智能視頻監(jiān)控系統(tǒng)中目標(biāo)分類技術(shù)研究與應(yīng)用[D].廣西大學(xué).?2011年.
[3] ?張建軍,黃山,張洪斌,楊權(quán),汪勤.??基于視頻的運(yùn)動目標(biāo)檢測與識別[J].??現(xiàn)代電子技術(shù).?2009,?08(295).
[4] ?王建平,劉偉,王金玲.一種視頻運(yùn)動目標(biāo)的檢測與識別方法[J].?計算機(jī)技術(shù)與自動化.2007,26(3):78-80.
[5] ?李崇輝.視頻監(jiān)控中運(yùn)動目標(biāo)的分類方法研究[D].華南理工大學(xué).?2013年.
[6] ?周維.視頻監(jiān)控中運(yùn)動目標(biāo)發(fā)現(xiàn)與跟蹤算法研究[D].中國科學(xué)技術(shù)大學(xué).2012年.
[7] ?郭玲.智能視頻監(jiān)控中運(yùn)動目標(biāo)檢測的算法研究[D].華南理工大學(xué).2013年.
[8] ?Volker?Roth,?Volker?Steinghage.?Nonlinear?discriminant?analysis?using?kernel?functions?[A].?Proc?of?Neural?Information?Processing?Systems[C].?Denver,1995:568-574.
[9] ?Sebastian?Mika,?Gunnai?Ratsch,?Jason?Weston,?et?al.?Fisher?discriminant?analysis?with?kernel[A].IEEE?Workshop?on?Networks?for?Signal?Processing[C].Piscataway,1999:41-48.
[10] ?杜世強(qiáng);基于核Fisher判別的人臉識別方法研究[D].陜西師范大學(xué).?2007年.
[11] ?Volker?Roth,?Vokler?Steinhage.?Nolinear?discriminant?analysis?using?kernel?funtions[C].?In?S.A.Solla,T.K.Lene,?K.R.Muller,?ediotrs.?Advance?in?Neuar?Information?Processing?Systmes12.?Cambridge,MA:MTT?Press,?2000:?568-574.
[12] ?Ming-Hsuan?Yang,?Kernel?Eigenface?vs.?kernel?Fisher:?face?recongnition?using?kernel?methods.?Proceding?of?the?Fifth?IEEE?International?Conference?on?Autiomatic?Face?and?Guesture?Recongnition.?Washington?D.C,?2002:215-220.