陳建新 尹雪飛 陳克安
(1 西北工業(yè)大學(xué)電子信息學(xué)院 西安 710129)
(2 西北工業(yè)大學(xué)航海學(xué)院 西安 710072)
近年來(lái),隨著我國(guó)經(jīng)濟(jì)的迅速發(fā)展,全社會(huì)的汽車擁有量增加,從而導(dǎo)致了一系列的交通問(wèn)題,例如交通擁堵、交通事故。智能交通系統(tǒng)是緩解道路交通問(wèn)題的有效方法,該系統(tǒng)能夠合理地利用交通資源,實(shí)現(xiàn)現(xiàn)有交通網(wǎng)絡(luò)的高效率運(yùn)轉(zhuǎn)和信息化管理。車型分類技術(shù)在智能交通系統(tǒng)中占據(jù)了重要的地位,正確地分類識(shí)別出車型對(duì)公路收費(fèi)、交通監(jiān)控指揮、車流量統(tǒng)計(jì)等方面有重大意義。目前,用于車輛檢測(cè)的技術(shù)有很多,例如感應(yīng)線圈、視頻圖像和微波等,它們都存在一定缺陷,感應(yīng)線圈安裝維護(hù)不方便;視頻圖像易受光線和遮擋物影響;微波技術(shù)主要用來(lái)檢測(cè)而不是分類。車輛行駛時(shí)產(chǎn)生的噪聲信號(hào)攜帶具有區(qū)分性的車型信息,可以用于車輛目標(biāo)的分類識(shí)別?;诼曅盘?hào)的車型分類技術(shù)屬于被動(dòng)分類技術(shù),具有隱蔽性高、安全性好、成本低和安裝方便等優(yōu)勢(shì)。因此該技術(shù)受到國(guó)內(nèi)外研究者的廣泛關(guān)注。
實(shí)現(xiàn)該技術(shù)的關(guān)鍵之一是特征提取,目前聲目標(biāo)特征提取的研究主要包括兩方面:一方面是基于信號(hào)處理方法分析其時(shí)頻結(jié)構(gòu)并從中提取有效特征,例如,Aljaafreh 等[1]使用基于頻譜分布和小波包變換的方法提取特征用于車型分類;另一方面是鑒于人的聽(tīng)覺(jué)系統(tǒng)在聽(tīng)音辨物方面優(yōu)勢(shì),從人對(duì)聲音的聽(tīng)覺(jué)感知出發(fā)提取聽(tīng)覺(jué)特征,例如,陳克安等[2]使用基于Shamma 模型的聽(tīng)覺(jué)譜特性用于車輛目標(biāo)識(shí)別。這些特征大多是基于信號(hào)幅度譜的,而忽略了信號(hào)相位信息的重要性,主要原因是在傳統(tǒng)的語(yǔ)音信號(hào)處理中人們認(rèn)為感知系統(tǒng)對(duì)相位不敏感,然而近年來(lái)隨著研究的深入,發(fā)現(xiàn)相位信息在語(yǔ)音識(shí)別方面也是重要的。Nakagawa 等[3]通過(guò)聯(lián)合Mel頻率倒譜系數(shù)(Mel frequency cepstrum coefficient,MFCC)特征和相位信息提高了說(shuō)話人識(shí)別的準(zhǔn)確率,Paliwal 等[4]發(fā)現(xiàn)相位譜也能夠像幅度譜一樣對(duì)語(yǔ)音清晰度做出貢獻(xiàn)。
鑒于此,本文利用相位的一階導(dǎo)數(shù)瞬時(shí)頻率(Instantaneous frequency,IF)來(lái)進(jìn)行特征提取,使用耳蝸濾波器組將車輛噪聲信號(hào)分解成子帶信號(hào),提出一種基于子帶信號(hào)瞬時(shí)頻率的特征提取方法,并將所提特征與對(duì)數(shù)能量結(jié)合,通過(guò)支持向量機(jī)(Support vector machine,SVM)進(jìn)行分類識(shí)別,實(shí)驗(yàn)表明,本文算法性能良好,有一定應(yīng)用價(jià)值。
實(shí)驗(yàn)數(shù)據(jù)一共包括兩個(gè)數(shù)據(jù)集。數(shù)據(jù)集1 來(lái)自DARPA /IXOs SensIT 項(xiàng)目的實(shí)驗(yàn)[5],該數(shù)據(jù)包含兩種軍用車輛,即履帶車(AAV)和重型輪式卡車(DW)的聲波、地震波和紅外波數(shù)據(jù)。文中選取聲波數(shù)據(jù)進(jìn)行車型分類實(shí)驗(yàn),該聲波數(shù)據(jù)的采樣率為4960 Hz。為了保證實(shí)驗(yàn)的正確性,選取兩類車型車次和采樣點(diǎn)相同的數(shù)據(jù),即AAV3~AAV11 和DW3~DW11的第51、52、53、54、55、56、58、59、60、61采樣點(diǎn),共180條數(shù)據(jù),每條數(shù)據(jù)截取時(shí)長(zhǎng)3 s,其中AAV5 和DW8 的 第53 采樣點(diǎn)總時(shí)長(zhǎng)只有1.5 s,分別用AAV3 的第42 采樣點(diǎn)DW12 的第53 采樣點(diǎn)代替。
數(shù)據(jù)集2 是通過(guò)自主實(shí)驗(yàn)采集到的數(shù)據(jù),采集時(shí)間為2018年3月到6月,地點(diǎn)位于西北工業(yè)大學(xué)長(zhǎng)安校區(qū)東大路,通過(guò)錄音設(shè)備錄制了公共汽車、小轎車、摩托車和卡車四種道路交通中常見(jiàn)車型行駛時(shí)產(chǎn)生的噪聲信號(hào)。每類車型錄制了120個(gè)樣本,共480個(gè)樣本,所有樣本均是在單一車輛行駛經(jīng)過(guò)的情況下收集的,采樣頻率為44.1 kHz,每條樣本截取的時(shí)長(zhǎng)為3 s,經(jīng)分析發(fā)現(xiàn),車輛噪聲信號(hào)主要集中在低頻范圍,為了降低計(jì)算量,將樣本采樣頻率降到16 kHz。為了方便實(shí)驗(yàn)描述,將上述四種車型分別記為A、B、C和D。
瞬時(shí)頻率估計(jì)比較常用的方法是希爾伯特變換法,該方法通過(guò)對(duì)信號(hào)進(jìn)行希爾伯特變換求其解析信號(hào),然后計(jì)算解析信號(hào)的瞬時(shí)幅度和相位信息,最后通過(guò)求解相位的一階導(dǎo)數(shù)估計(jì)瞬時(shí)頻率。
能量有限實(shí)信號(hào)s(t)的解析信號(hào)定義為
其中,sh(t)是信號(hào)s(t)的希爾伯特變換,通過(guò)Sh(w)的傅里葉反變換得到
解析信號(hào)sa(t)的極坐標(biāo)表示形式如下:
其中,sa(t)和θ(t)分別是信號(hào)的幅度包絡(luò)和解析相位,其中:
然后可以得到信號(hào)的瞬時(shí)相位:
通過(guò)對(duì)相位函數(shù)進(jìn)行求導(dǎo)獲得其瞬時(shí)頻率:
式(5)的相位角θ(t)存在相位卷繞問(wèn)題,不能直接用于瞬時(shí)頻率估計(jì),需要將其展開,但相位展開算法通常是不準(zhǔn)確的,因此會(huì)影響到瞬時(shí)頻率估計(jì)。為了解決這個(gè)問(wèn)題,使用傅里葉變換性質(zhì)在沒(méi)有顯式求出θ(t)的情況下直接計(jì)算瞬時(shí)頻率。
對(duì)式(3)兩邊同時(shí)取對(duì)數(shù),并對(duì)時(shí)間求導(dǎo)數(shù),可以得到如下式子:
其中,Im{·}表示復(fù)數(shù)的虛部。可以用傅里葉變換的微分性質(zhì)來(lái)計(jì)算解析信號(hào)的導(dǎo)數(shù):
其中,F(xiàn)?1表示傅里葉反變換,SA(jw)是sa(t)的傅里葉變換,因此瞬時(shí)頻率可以表示為
其中,Re{·}表示復(fù)數(shù)的實(shí)部。因?yàn)樗褂玫乃矔r(shí)頻率計(jì)算并不涉及到解析相位的計(jì)算,所以其不受相位卷繞的影響,性能更加穩(wěn)定。
此外,為了進(jìn)一步精確地表示子帶信號(hào)的瞬時(shí)頻率,通常進(jìn)行瞬時(shí)幅度加權(quán)處理,這樣能夠使得瞬時(shí)頻率的估計(jì)值在復(fù)雜情況下穩(wěn)健性更好[6],計(jì)算表達(dá)式如下:
其中,τ為一幀信號(hào)的長(zhǎng)度,t0為該幀信號(hào)的起始點(diǎn),fi(t)為第i個(gè)子帶信號(hào)的瞬時(shí)頻率,ai(t)為第i個(gè)子帶信號(hào)的瞬時(shí)幅度值。
車輛噪聲信號(hào)成分復(fù)雜,不能直接對(duì)其進(jìn)行瞬時(shí)頻率估計(jì),需要將其分解成一系列的窄帶信號(hào),常用的做法是使用一組相互重疊的窄帶濾波器組進(jìn)行處理。本文使用能夠模擬人聽(tīng)覺(jué)系統(tǒng)的耳蝸濾波器組[7],相關(guān)研究發(fā)現(xiàn),在耳蝸濾波器的每個(gè)中心頻率中,從基底膜的底部到頂部,行波發(fā)生快速相位移動(dòng)[8],這種快速的相位變化可以通過(guò)其一階導(dǎo)數(shù)瞬時(shí)頻率來(lái)捕獲,文獻(xiàn)[9]證明了這一觀點(diǎn)。此外,目前模擬耳蝸濾波的聽(tīng)覺(jué)模型主要用于研究其在不同中心頻率下的幅度響應(yīng),雖然效果顯著,但并不能完全等同于聽(tīng)覺(jué)系統(tǒng)對(duì)聲音的處理過(guò)程,尤其是對(duì)相位的處理。因此研究了不同尺度下中心頻率分布以及不同帶寬下的耳蝸濾波器組對(duì)所提取特征性能的影響。
耳蝸濾波器的時(shí)域表達(dá)式定義為
其中,α >0,β >0,用來(lái)確定耳蝸濾波器在頻域中的形狀和帶寬,通常α取3,β取0.2或0.035;u(t)是單位階躍函數(shù),當(dāng)t0 時(shí),u(t)=1,否則,u(t)=0;θ值的選擇應(yīng)當(dāng)滿足ψ(t)dt=0;b是時(shí)移變量,a是尺度變量,a取值與耳蝸濾波器組的中心頻率分布有關(guān),定義為最低中心頻率fl與當(dāng)前中心頻率fc的比值,即a=fl/fc。圖1 顯示了耳蝸濾波器組的幅頻響應(yīng)。
圖1 耳蝸濾波器組的幅頻響應(yīng)(α=3,β =0.2)Fig.1 Amplitude frequency response of cochlear filter banks(α=3,β =0.2)
使用耳蝸濾波器組提取瞬時(shí)頻率特征的步驟如下:
(1)在分析頻率范圍內(nèi)設(shè)計(jì)K個(gè)耳蝸濾波器,其中心頻率分布為線性或非線性尺度。
(2)使用耳蝸濾波器組對(duì)車輛噪聲信號(hào)濾波處理,一共獲得K個(gè)子帶信號(hào),使用式(12)估計(jì)每個(gè)子帶信號(hào)每幀的瞬時(shí)頻率,假設(shè)一共分了N幀,那么就會(huì)獲得一個(gè)K×N的矩陣。
(3)使用等效矩形帶寬(Equivalent rectangular bandwidth,ERB)尺度壓縮瞬時(shí)頻率動(dòng)態(tài)范圍,該尺度的計(jì)算公式定義為fERB=21.4×lg(4.37×f/1000+1),其中f為線性頻率,fERB為壓縮后的頻率。
(4)使用離散余弦變換進(jìn)行去相關(guān)和降維處理,將所提取的特征記為IF特征。
本文的分析頻率范圍為50 Hz~fs/2,fs為最終采樣頻率,對(duì)于數(shù)據(jù)集1fs=4960 Hz,對(duì)于數(shù)據(jù)集2fs=16 kHz。濾波器的個(gè)數(shù)為40,特征維數(shù)為13。濾波器組的中心頻率分布選擇線性尺度和Mel尺度兩種。
信號(hào)的短時(shí)能量用來(lái)度量其幅值變化,定義為加窗聲信號(hào)區(qū)域的振幅絕對(duì)值的平方和。其表達(dá)式如下:
其中,En是短時(shí)能量,x(m)是待分析的車輛噪聲信號(hào),w(n)是窗函數(shù),N是窗長(zhǎng)。當(dāng)窗函數(shù)為矩形窗時(shí),短時(shí)能量描述如下:
本文在計(jì)算該值時(shí)選用矩形窗函數(shù),考慮人的聽(tīng)覺(jué)特性,使用短時(shí)能量的自然對(duì)數(shù)ln(En)作為特征參數(shù),并稱之為對(duì)數(shù)能量[10]。
使用瞬時(shí)頻率特征和對(duì)數(shù)能量特征聯(lián)合獲得組合特征參數(shù),主要具有兩大優(yōu)勢(shì):首先,對(duì)數(shù)能量從能量的角度描述車輛噪聲信號(hào),瞬時(shí)頻率從相位的角度描述車輛噪聲信號(hào),兩者具有互相補(bǔ)充作用;其次,對(duì)數(shù)能量作為標(biāo)量值,不會(huì)引起特征維度過(guò)高而導(dǎo)致運(yùn)算量過(guò)大問(wèn)題。本文將瞬時(shí)頻率特征和對(duì)數(shù)能量聯(lián)合獲得組合特征,計(jì)算每幀的對(duì)數(shù)能量作為該組合特征參數(shù)的第1 維特征,組合特征的維數(shù)為14。
在進(jìn)行目標(biāo)識(shí)別時(shí),要求所提取的特征盡可能區(qū)分各個(gè)模式類,希望其類內(nèi)間距盡可能小,類間間距盡可能大。為了衡量本文所提取車輛噪聲信號(hào)特征的優(yōu)劣,援引文獻(xiàn)[11]構(gòu)造特征距離可分性測(cè)度:
其中,d2(ai,bj)表示A 與B 的類間距離的平方,對(duì)應(yīng)兩類特征集合{ai,i=1,2,··· ,ka}和{bi,i=1,2,··· ,kb},其中ai ∈A 類,bi ∈B 類,計(jì)算公式如下:
d2({ai},{ai})為類內(nèi)距離的平方,對(duì)于某一類特征集合{ai,i=1,2,··· ,k},定義為
通常JA,B越大,類別間可分性越好;JA,B越小,其可分性越差。
耳蝸濾波器的帶寬會(huì)影響到IF特征的提取,帶寬過(guò)窄,會(huì)遺漏重要頻率成分;帶寬過(guò)寬,會(huì)影響到瞬時(shí)頻率估計(jì),如何選擇合適的帶寬是需要進(jìn)一步研究的問(wèn)題。根據(jù)上文描述,其帶寬可以通過(guò)β值調(diào)節(jié),β值通常取0.035 或0.2。本節(jié)通過(guò)實(shí)驗(yàn)來(lái)研究特征的可分性,其中IF 特征是在Mel 尺度下提取的。其可分性測(cè)度值如表1 和表2 所示。觀察表1,可以看出隨著β值的增加,IF特征對(duì)兩種車型的可分性增加;觀察表2,β為0.2 時(shí)IF 特征關(guān)于四種車型可分性測(cè)度值相對(duì)于β為0.035 時(shí)平均增加了0.0978(其中部分有所降低)。綜合上面的實(shí)驗(yàn)結(jié)果,IF特征對(duì)車型的分類率與β值有關(guān)。
表3 和表4 顯示了IF 特征和對(duì)數(shù)能量聯(lián)合的可分性測(cè)度結(jié)果。對(duì)比表1 和表3,通過(guò)特征聯(lián)合,兩種車型的可分性測(cè)度值明顯增加;對(duì)比表2 和表4,當(dāng)β為0.035 時(shí),四種車型的可分性測(cè)度值平均增加了0.1413,β為0.2 時(shí),其可分性測(cè)度值平均增加0.2194(其中部分有所降低)。表明對(duì)數(shù)能量與IF特征聯(lián)合可以增加車型的可分性。
表1 IF 特征的可分性分析(數(shù)據(jù)集1)Table 1 Separability analysis of IF feature(Data Set 1)
表2 IF 特征的可分性分析(數(shù)據(jù)集2)Table 2 Separability analysis of IF feature(Data Set 2)
表3 聯(lián)合特征的可分性分析(數(shù)據(jù)集1)Table 3 Separability analysis of combination feature(Data Set 1)
表4 聯(lián)合特征的可分性分析(數(shù)據(jù)集2)Table 4 Separability analysis of combination feature (Data Set 2)
支持向量機(jī)是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,適用于小樣本、非線性、高維數(shù)和局部極小值點(diǎn)等實(shí)際問(wèn)題,分類性能良好[12],本文使用帶有線性核函數(shù)的SVM 進(jìn)行分類。實(shí)驗(yàn)時(shí),每種車型取1/2 作為訓(xùn)練集,1/2作為測(cè)試集,取10次重復(fù)實(shí)驗(yàn)的平均值作為分類結(jié)果。
通過(guò)第4 節(jié)的特征評(píng)價(jià)實(shí)驗(yàn)表明IF 特征的分類性能會(huì)受到β值影響,取β等于0.035、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0,計(jì)算在線性尺度和Mel 尺度下所提取IF 特征對(duì)車型的分類能力。圖2和圖3 顯示了耳蝸濾波器組取不同參數(shù)時(shí)的IF 特征分類結(jié)果。觀察圖2 和圖3 可發(fā)現(xiàn)使用不同β值提取的IF 特征對(duì)車型進(jìn)行分類時(shí),其分類率先增加后減小,這驗(yàn)證了之前的分析,即耳蝸濾波器的帶寬過(guò)寬或過(guò)窄都會(huì)影響子帶信號(hào)的瞬時(shí)頻率估計(jì),只有選擇合適的帶寬才能提取性能更優(yōu)的IF 特征。此外耳蝸濾波器組的中心頻率分布同樣會(huì)影響特征性能,Mel 尺度下的IF 特征對(duì)車型的分類能力明顯高于線性尺度下的IF特征,主要原因是車輛噪聲信號(hào)的有用信息集中在低頻范圍,而Mel 尺度在低頻時(shí)分辨率高,因此性能更佳。當(dāng)β為0.4 時(shí),IF特征在數(shù)據(jù)集1 上關(guān)于線性尺度和Mel尺度上獲得最高分類率分別為89.78%和91.56%,β為0.5時(shí),IF特征在數(shù)據(jù)集2 上關(guān)于線性尺度和Mel尺度上獲得最高分類率分別為79.58%和84.42%,表明該特征具有適應(yīng)性,對(duì)不同數(shù)據(jù)集可以通過(guò)調(diào)節(jié)β值使其獲得最高分類率。
圖2 不同參數(shù)下的IF 特征分類性能對(duì)比圖(數(shù)據(jù)集1)Fig.2 Comparison of IF feature classification performance under different parameters (Data Set 1)
圖3 不同參數(shù)下的IF 特征分類性能對(duì)比圖(數(shù)據(jù)集2)Fig.3 Comparison of IF feature classification performance under different parameters (Data Set 2)
表5和表6顯示了最高分類率下的IF特征及聯(lián)合特征在兩個(gè)數(shù)據(jù)集上的分類率。綜合兩個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,IF 特征與對(duì)數(shù)能量聯(lián)合能夠有效提高車型分類率,在兩個(gè)數(shù)據(jù)集上大約有4%~5%左右提升。為了進(jìn)一步驗(yàn)證本文算法的有效性,比較了文獻(xiàn)[13]和文獻(xiàn)[14]的實(shí)驗(yàn)結(jié)果,本文算法均優(yōu)于文獻(xiàn)[14]的算法,雖然單一特征矢量相對(duì)文獻(xiàn)[13]中的結(jié)果略差,但通過(guò)特征聯(lián)合可以有效提升分類性能。此外值得注意的是,無(wú)論是本文的IF特征還是文獻(xiàn)[13]和文獻(xiàn)[14]中的兩種分類方法對(duì)DW車型的分類率相對(duì)偏低,而本文提出的聯(lián)合特征則能在提高總體分類率的前提下,縮小兩種車型間分類準(zhǔn)確率差異,使得車型DW 分類率接近AAV。
表5 IF 特征及聯(lián)合特征的分類率(數(shù)據(jù)集1)Table 5 Classification accuracy of IF feature and combination feature (Data Set 1)(單位:%)
表6 IF 特征及聯(lián)合特征的分類率(數(shù)據(jù)集2)Table 6 Classification accuracy of IF feature and combination feature (Data Set 2)(單位:%)
在實(shí)際應(yīng)用中,車型識(shí)別容易受到噪聲干擾,為了驗(yàn)證所提算法的抗噪性,使用文獻(xiàn)[15]的方法提取13維MFCC特征進(jìn)行對(duì)比實(shí)驗(yàn)。圖4 和圖5給出了Mel 尺度下的IF 特征及MFCC 特征在加入不同信噪比白噪聲下的分類性能。從中可以看出IF(Mel)特征的分類性能在低信噪比下較差,在較高信噪比下分類性能普遍優(yōu)于MFCC特征。在較強(qiáng)噪聲存在的情況下,可以考慮在分類前端對(duì)車輛噪聲信號(hào)進(jìn)行降噪預(yù)處理操作以提高系統(tǒng)的噪聲魯棒性。
圖4 不同信噪比下兩種特征分類性能比較(數(shù)據(jù)集1)Fig.4 Comparison of two features classification performance under different signal to noise ratio(Data Set 1)
圖5 不同信噪比下兩種特征分類性能比較(數(shù)據(jù)集2)Fig.5 Comparison of two features classification performance under different signal to noise ratio(Data Set 2)
在基于聲信號(hào)的車型分類研究中,本文提出了一種基于耳蝸濾波器組的IF特征提取算法,并將該特征與對(duì)數(shù)能量相結(jié)合,通過(guò)可分性測(cè)度和分類實(shí)驗(yàn)表明所提取特征可以有效地實(shí)現(xiàn)車型分類并且抗噪性良好。本文實(shí)驗(yàn)也驗(yàn)證了相位信息同樣能夠反映聲目標(biāo)的重要信息,在聲目標(biāo)識(shí)別上有巨大應(yīng)用潛力。