王鴻姍,周靜雷,房喬楚
(西安工程大學(xué) 電子信息學(xué)院,陜西 西安 710048)
音圈摩擦、振膜脫落和雜物混入等原因,都會導(dǎo)致?lián)P聲器異常音的產(chǎn)生。傳統(tǒng)的異常音檢測方法是由聽音員以人工聽音的方式在生產(chǎn)線上進(jìn)行檢測,但人工檢測的準(zhǔn)確率和穩(wěn)定性會受到聽音員專業(yè)水平、身體狀態(tài)和不同個體間主觀評定差異的影響[1]。近年來,國內(nèi)外關(guān)于揚聲器異常音檢測方法的研究越來越多。TEMME[2]利用了人耳感知模型進(jìn)行揚聲器異常音檢測,此方法計算較為復(fù)雜;RUIZ[3]使用ZAMD變換,對時頻圖進(jìn)行分割,通過比較與標(biāo)準(zhǔn)樣品的馬氏距離,對有異常音的揚聲器進(jìn)行判別;文獻(xiàn)[4]使用了短時傅里葉變換獲得揚聲器的聲響應(yīng)信號時頻圖,但只提取時頻圖的高次諧波能量作為特征量來判斷其是否存在異常音,缺乏對時頻圖的進(jìn)一步分析;在此基礎(chǔ)上,文獻(xiàn)[5]根據(jù)異常音信號的特點提取時頻圖與黃金樣本各區(qū)域?qū)?yīng)的矩陣,對時頻圖作進(jìn)一步分析,通過計算對應(yīng)矩陣之間的柯爾莫哥洛夫距離來判斷異常音的存在。
本文針對揚聲器異常音特征提取問題,給出基于小波包分解和樣本熵的揚聲器異常音特征提取方法。在基頻陷波預(yù)處理后,應(yīng)用小波包分解和樣本熵的特征提取方法,并使用SVM算法測試分類準(zhǔn)確性,驗證了本文特征提取方法的有效性。
小波包分解可以靈活地劃分頻域[6],具有同時分解低頻信號和高頻信號的特點[7],相比于小波分解更加精細(xì)。小波包分解所投影到的小波包空間滿足如下條件:
(1)
(2)
式中:hk和gk表示濾波器系數(shù)。
小波包系數(shù)的遞推公式為
(3)
式中:j和n表示小波包節(jié)點號;d表示小波包分解系數(shù);l和k為分解層數(shù)。
Richman等提出的樣本熵是在Pincus提出的近似熵基礎(chǔ)上的一種改進(jìn),作為一種時間序列復(fù)雜度測量方法[8],降低了對時間序列長度的依賴,被廣泛應(yīng)用于特征提取領(lǐng)域,例如:電信號處理、機械故障整數(shù)及去噪等方面[9-14]。具體算法如下:
(1) 時間序列{x(i):1≤i≤N}依順序組成m維向量;
(2) 定義d[Xm(i),Xm(j)]表示Xm(i)和Xm(j)兩者對應(yīng)元素中差值最大的距離;
(4)
(5)
(6)
(7)
(5) 此時間序列的樣本熵S(m,r)定義為
(8)
當(dāng)時間序列長度為N時,樣本熵S(m,r,N)為
(9)
在特征提取方法中,揚聲器的聲響應(yīng)信號經(jīng)過小波包分解實現(xiàn)了升維,隨后針對重構(gòu)信號的樣本熵計算又實現(xiàn)了降維處理,算法如下:
(1) 對揚聲器聲響應(yīng)信號進(jìn)行3層小波包分解,得到8個頻帶系數(shù);
(2) 對8個子頻帶進(jìn)行重構(gòu);
(3) 利用重構(gòu)信號的樣本熵值構(gòu)成維數(shù)為8的特征向量。
為了檢驗特征提取方法的有效性,搭建數(shù)據(jù)采集平臺并采集揚聲器聲響應(yīng)信號數(shù)據(jù),進(jìn)行特征提取并測試分類性能。數(shù)據(jù)采集平臺框圖如圖1所示。
圖 1 數(shù)據(jù)采集平臺框圖Fig.1 Block diagram of data acquisition system
將揚聲器和傳聲器放置于消音箱中,能夠顯著減少環(huán)境噪聲的影響。數(shù)據(jù)采集過程中,輸出和輸入聲卡的采樣頻率設(shè)置為44.1 kHz。
設(shè)計的揚聲器激勵信號按1/3倍頻程選取頻率點。對激勵信號由高頻至低頻掃描[15],信號的頻率范圍設(shè)置為5 000~20 Hz,激勵信號的持續(xù)時間為2.38 s。激勵信號的時頻圖如圖2所示。
圖 2 激勵信號的時頻圖Fig.2 Time-frequency spectrum of stimulus signal
實驗使用額定功率為10 W, 阻抗為8 Ω的揚聲器。 選取質(zhì)量合格和振膜破損的揚聲器各30個, 每個揚聲器采集5次聲響應(yīng)信號, 質(zhì)量合格的揚聲器聲響應(yīng)信號作為正常樣本, 振膜破損的揚聲器聲響應(yīng)信號作為異常樣本, 組成正常樣本和異常樣本各150個。
揚聲器的聲響應(yīng)信號中包含與激勵信號相同頻率的基頻成分和各階次諧波成分。 基頻信號的能量通常占信號總能量的 95% 以上, 高頻諧波易被掩蔽[16]。
對聲響應(yīng)信號進(jìn)行基頻陷波預(yù)處理,能夠?qū)χC波信號成分和異常音成分進(jìn)行更為有效的分析。為抵消聲響應(yīng)信號中的基頻成分,保留各階諧波成分和異常音成分的信號。使用一個二階IIR陷波器去除單頻干擾作為預(yù)處理方法[17]。二階IIR數(shù)字陷波器的傳遞函數(shù)為
(10)
用exp(jw)代替z,得到頻率特性H(exp(jw)):
(11)
將采集到的揚聲器聲響應(yīng)信號根據(jù)已知的激勵信號頻率在時域上進(jìn)行分割,得到25段時域信號數(shù)據(jù),分別對每一段信號使用二階 IIR 陷波器做基頻陷波操作。一個振膜破損的揚聲器的聲響應(yīng)信號經(jīng)過基頻陷波預(yù)處理前后的時域波形如圖3(a),(c)所示,一個正常的揚聲器的聲響應(yīng)信號經(jīng)過基頻陷波預(yù)處理前后的時域波形如圖3(b),(d)所示,振膜破損的揚聲器聲的響應(yīng)信號中的高頻諧波更加明顯。
圖 3 基頻陷波預(yù)處理Fig.3 Pitch notching preprocessing
經(jīng)過基頻陷波后的揚聲器聲響應(yīng)信號更加有利于小波包分解分析。對預(yù)處理后的信號進(jìn)行3層小波包分解,小波基選擇db12小波。對分解得到的第3層的8個子頻帶進(jìn)行重構(gòu),利用計算所得的重構(gòu)信號的樣本熵值,構(gòu)成維數(shù)為8的特征向量。樣本熵的2個主要參數(shù)為嵌入維數(shù)m和閾值r,根據(jù) Pincus 的研究成果,當(dāng)取m=1或m=2,r=0.1~0.25時能得到具有較合理統(tǒng)計特性的結(jié)果,本文取參數(shù)m=2,r=0.15。圖4(a)為一個經(jīng)預(yù)處理后的振膜破損揚聲器聲響應(yīng)信號經(jīng)過3層小波包分解后的各節(jié)點重構(gòu)信號,圖4(b)為一個經(jīng)預(yù)處理后的正常揚聲器聲響應(yīng)信號經(jīng)過3層小波包分解后的各節(jié)點重構(gòu)信號。
由圖4可以看到, 經(jīng)過3層小波包分解后, 預(yù)處理后的揚聲器聲響應(yīng)信號由一維信號變換為8個重構(gòu)信號, 在本文特征提取方法中, 小波包分解的作用在于對采集到的揚聲器聲響應(yīng)一維信號做出升維處理, 隨后針對每個重構(gòu)信號進(jìn)行樣本熵計算, 實現(xiàn)了對每個重構(gòu)信號的降維處理, 得到維數(shù)為8的特征向量。
隨機抽取的5個正常樣本和5個異常樣本的子頻帶重構(gòu)信號的樣本熵值如表1所示。
(a) 振膜破損 (b) 正常樣本圖 4 振膜破損和正常樣本的3層小波包分解重構(gòu)信號Fig.4 The 3-level wavelet packet decomposition reconstructed signal about diaphragm damaged and normal sample
樣本編號樣本熵12345678 正常1#2.460 05.082 26.857 85.541 36.028 56.786 56.860 37.203 7 正常2#2.394 75.556 36.896 85.592 26.014 56.800 47.046 47.227 8 正常3#2.980 35.407 76.955 45.597 46.108 96.820 37.056 57.309 0 正常4#2.579 45.562 36.868 25.569 36.034 76.767 16.956 17.234 5 正常5#3.003 15.585 56.965 05.593 06.096 36.838 17.038 27.258 6 振膜破損1#2.012 46.832 37.460 87.832 66.700 66.877 97.075 96.832 6 振膜破損2#1.788 36.624 47.461 27.742 86.677 16.920 97.164 16.904 2 振膜破損3#1.706 56.488 37.406 17.636 76.610 96.824 87.056 66.708 2 振膜破損4#1.636 86.410 77.468 17.694 66.622 76.942 27.061 16.873 4 振膜破損5#1.779 46.628 57.527 07.792 86.751 56.943 87.149 86.985 4
為驗證小波包分解和樣本熵處理后的揚聲器異常音特征提取方法的有效性,與頻率能量均值法進(jìn)行對比,該方法對掃頻信號激勵下的揚聲器聲響應(yīng)信號進(jìn)行短時傅里葉變換,將所獲時頻圖劃分為若干區(qū)域,并對時頻圖部分區(qū)域的各列數(shù)值求取局部均值,將其均值分布用特征曲線描述,再利用特征距離表現(xiàn)被診斷揚聲器與正常揚聲器的差異。具體如下:
γ(t)為窗函數(shù),x(t)為信號,x(t)的短時傅里葉變換可定義為
exp(-jωt)dt
(12)
離散短時傅里葉變換為
T{x[n]}(m,γ)= ∑x[n]γ[n-m]
exp(-jωn)
(13)
利用揚聲器響應(yīng)信號短時傅里葉變換后的時頻圖的能量均值Mi作為診斷參數(shù):
(14)
式中:E(i,j)為時頻圖中在(i,j)點的能量;Ni為第i列的像素個數(shù)。
圖5(a)為一個經(jīng)預(yù)處理后的振膜破損揚聲器聲響應(yīng)信號的STFT時頻圖,圖5(b)為一個經(jīng)預(yù)處理后的正常揚聲器聲響應(yīng)信號的STFT時頻圖,高為900像素,寬為1 200像素。
(a) 振膜破損
(b) 正常樣本圖 5 聲響應(yīng)信號的STFT時頻圖
Fig.5 STFT Time-frequency map of response signal
支持向量機(SVM,support vector machine)是由Vapnik等提出的機器學(xué)習(xí)算法,采用結(jié)構(gòu)風(fēng)險最小化的思想[18],針對線性不可分問題,SVM可以通過非線性映射轉(zhuǎn)化為高維空間的線性問題[19-20]。本文使用LIBSVM 3.22軟件包進(jìn)行特征提取的有效性驗證。針對總數(shù)為300個樣本,其中正常樣本和異常樣本各150個,利用MATLAB 7.14平臺對其進(jìn)行預(yù)處理和特征提取,其中小波包和樣本熵方法的特征向量維數(shù)為8,頻率能量均值法的特征向量維數(shù)為1 200,按照時域均分,降維至8維,從數(shù)據(jù)集中隨機抽取20%的數(shù)據(jù)作為測試集,其余80%的數(shù)據(jù)作為訓(xùn)練集。
SVM的核函數(shù)為徑向基函數(shù),采用網(wǎng)格搜索法進(jìn)行參數(shù)選擇,其中小波包和樣本熵方法的數(shù)據(jù)集的懲罰因子C為18.379,核函數(shù)參數(shù)g為5.278,頻率能量均值法的數(shù)據(jù)集的懲罰因子C為27.857,核函數(shù)參數(shù)g為3.482,實驗結(jié)果得到,小波包和樣本熵的特征提取方法所取得的分類準(zhǔn)確率為93.33%,頻率能量均值方法取得的分類準(zhǔn)確率為88.33%。
本文針對揚聲器異常音分類問題給出了基于小波包分解和樣本熵特征提取方法,對揚聲器的聲響應(yīng)信號數(shù)據(jù)進(jìn)行檢驗,應(yīng)用基頻陷波預(yù)處理,使揚聲器的聲響應(yīng)信號中的基頻信號大幅降低,有利于異常音特征的提取;與應(yīng)用較廣的頻率能量均值方法相比,在小樣本的情況下,SVM算法使用小波包分解和樣本熵的特征提取方法取得了更高的分類準(zhǔn)確率,證明了此特征提取方法的有效性。