周靜雷, 周 智, 崔 琳
(西安工程大學(xué) 電子信息學(xué)院,西安 710600)
揚(yáng)聲器被廣泛的應(yīng)用在手機(jī)、耳機(jī)、智能音箱、家庭影院、筆記本電腦等設(shè)備上,其品質(zhì)的好壞直接決定人們的音效體驗(yàn)。因此無(wú)論在揚(yáng)聲器的研發(fā)、制樣及生產(chǎn)環(huán)節(jié),都需要對(duì)揚(yáng)聲器進(jìn)行異常聲檢測(cè)。有無(wú)異常聲已是揚(yáng)聲器的關(guān)鍵必檢特性之一。而檢測(cè)的準(zhǔn)確性、時(shí)效性和自動(dòng)化,對(duì)于揚(yáng)聲器生產(chǎn)而言,具有重要意義[1]。
揚(yáng)聲器異常聲檢測(cè)一般由激勵(lì)及響應(yīng)捕捉、響應(yīng)信號(hào)的特征提取、特征選擇以及分類(lèi)構(gòu)成。由于揚(yáng)聲器的異常聲信號(hào)是非線(xiàn)性非平穩(wěn)信號(hào)[2]。對(duì)于此類(lèi)信號(hào),一般采用時(shí)頻域分析的方法,以提取最佳的信號(hào)特征[3]。特征提取的方法主要有高階諧波失真(high-order harmonic distor-tion)[4]、短時(shí)傅里葉變換(short-time Fourier transform,STFT)[5]、小波包分解(wavelet packet decomposition,WPD)[6]、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)[7]。高階諧波失真提取法需要有經(jīng)驗(yàn)的工程師設(shè)置合理的門(mén)限;STFT分辨率單一,依賴(lài)選擇的窗函數(shù),缺乏自適應(yīng)性[8];WPD雖然可以同時(shí)分解低頻與高頻信號(hào),但是其受小波函數(shù)、信號(hào)采樣頻率等影響,存在能量泄露問(wèn)題[9];EMD分解具有良好的自適應(yīng)性,但是易出現(xiàn)模態(tài)混疊和端點(diǎn)效應(yīng)[10]。VMD分解[11]相比EMD,有更好的抗模態(tài)混疊和降噪性能[12]。VMD分解被廣泛的應(yīng)用在機(jī)械故障診斷[13]以及心音信號(hào)[14]處理,本論文在文獻(xiàn)[15]的研究基礎(chǔ)上,著重討論特征選擇及不同分類(lèi)方法在異常聲檢測(cè)中的應(yīng)用。
特征選擇[16]是為了篩選出最有效的特征、降低特征空間維數(shù)以達(dá)到最高的分類(lèi)精度。依據(jù)評(píng)價(jià)方式,可分為過(guò)濾式(Filter)和封裝式(Wrapper)[17]兩種。Filter式采用某種評(píng)價(jià)準(zhǔn)則或搜索策略進(jìn)行特征子集選擇,計(jì)算效率比較高[18],但不能與具體的分類(lèi)器結(jié)合,特征子集的冗余較高、分類(lèi)效果較差;Wrapper式則直接以分類(lèi)性能的好壞作為特征子集的評(píng)價(jià)標(biāo)準(zhǔn),在合理的學(xué)習(xí)算法中得到的較好的特征子集和分類(lèi)性能[19]。隨機(jī)森林(random forest,RF)是一種典型的Wrapper式特征選擇算法,其內(nèi)置了特征重要性評(píng)價(jià)機(jī)制,在高效特征選擇的同時(shí),還能保持著較好的選擇效果。為了選取最優(yōu)的特征選擇效果,提出了基于隨機(jī)森林結(jié)合遞歸特征消除[20](random forest and recursive feature elimination,RF-RFE)的特征選擇算法。
揚(yáng)聲器異常聲檢測(cè)中,通常采用特征距離公式、BP神經(jīng)網(wǎng)絡(luò)[21]、支持向量機(jī)(support vector machine,SVM)[22]等方法對(duì)異常聲進(jìn)行分類(lèi)。但是特征距離公式通常只能檢測(cè)出是否有異常聲,不能判斷異常聲的類(lèi)別;SVM雖然可以進(jìn)行多分類(lèi),但其依賴(lài)選擇的核函數(shù),消耗時(shí)間較長(zhǎng)。RF是一種集成模型,相比SVM有著更強(qiáng)的魯棒性和分類(lèi)效果,適用于多分類(lèi)問(wèn)題,本文選用RF作為分類(lèi)器。
為了更好提取揚(yáng)聲器異常聲最佳的信號(hào)特征、有效提高診斷系統(tǒng)分類(lèi)性能,本文提出了基于VMD與RF-RFE的揚(yáng)聲器異常聲分類(lèi)方法。首先,對(duì)揚(yáng)聲器單元的聲響應(yīng)信號(hào)進(jìn)行VMD預(yù)分解,根據(jù)中心頻率相近法確定VMD分解后的模態(tài)K的個(gè)數(shù),之后以確定的K值對(duì)揚(yáng)聲器單元聲響應(yīng)信號(hào)進(jìn)行VMD分解,提取每個(gè)模態(tài)的時(shí)、頻域特征構(gòu)成原始特征數(shù)據(jù)集;其次使用RF-RFE模型對(duì)原始特征集進(jìn)行特征選擇,確定最優(yōu)特征個(gè)數(shù)以及最優(yōu)特征子集;最后將得到的最優(yōu)特征子集輸入至RF算法中進(jìn)行判斷,輸出分類(lèi)結(jié)果。試驗(yàn)表明本文提出的方法能夠有效地診斷揚(yáng)聲器的故障類(lèi)型。
VMD以各模態(tài)帶寬最小和原則,采用非遞歸方式搜尋變分模型最優(yōu)解。其實(shí)質(zhì)為如式(1)所示的變分約束問(wèn)題的求解
(1)
其具體求解步驟為:
步驟2更新迭代次數(shù)n=n+1;
步驟3fork=1∶K
(2)
(3)
步驟4采用對(duì)偶上升法,更新
(4)
式中:n+1為迭代次數(shù);τ為噪聲容限,一般情況下τ=0。
步驟5重復(fù)步驟1~步驟4,直到滿(mǎn)足收斂條件
(5)
式中,ε為收斂精度,大小通常為10-6。
VMD分解之后,分別求得各模態(tài)波形因子(Es)(X1)、波峰因子(Ec)(X2)、脈沖因子(Ed)(X3)、最大值(X4)、平均值(X5)、標(biāo)準(zhǔn)差(X6)、均方根值(X7)、方差(X8)、最小值(X9)、峰峰值(X10)、均方幅值(X11)、平均幅值(X12)、峭度(Eku)(X13)、偏度(Esk)(X14)、能量熵(Eentropy)(X15)、排列熵[23](X16)、過(guò)零點(diǎn)數(shù)(X17)、VMD分解中心頻率(X18)以及VMD-Hilbert時(shí)頻熵(Et)(X19)構(gòu)成原始的特征向量。對(duì)長(zhǎng)度為N的模態(tài)分量ui,部分特征的計(jì)算公式為
(6)
(7)
(8)
(9)
(10)
(11)
(12)
隨機(jī)森林是一種集成算法,由多顆子樹(shù)構(gòu)成,每一顆子樹(shù)均通過(guò)Bootstrap抽樣方法產(chǎn)生,每一顆子樹(shù)的分布相同且獨(dú)立,最后由分類(lèi)樹(shù)投票的多少?zèng)Q定新數(shù)據(jù)的分類(lèi)。隨機(jī)森林算法不僅具有模型簡(jiǎn)單、分類(lèi)效果好的特點(diǎn),同時(shí)其魯棒性強(qiáng),不易過(guò)擬合,因此被廣泛的應(yīng)用在各種分類(lèi)、預(yù)測(cè)以及特征選擇等相關(guān)問(wèn)題當(dāng)中[24]。
利用RF-RFE進(jìn)行特征選擇包含特征重要性計(jì)算和遞歸特征消除兩個(gè)部分。特征重要性計(jì)算是RF內(nèi)嵌的功能,以袋外(out-of-bag,OOB)數(shù)據(jù)分類(lèi)準(zhǔn)確率的變量為評(píng)價(jià)準(zhǔn)則。
假設(shè)有bootstrap樣本k=1,2,…,K,K表示訓(xùn)練樣本的個(gè)數(shù),每個(gè)樣本有N個(gè)特征,特征重要性排序的計(jì)算步驟如下:
步驟1初始化k=1,創(chuàng)建決策樹(shù)Tk;
步驟4對(duì)于k=2,3,…,K重復(fù)步驟1~步驟3。
步驟5特征Xj的重要性度量Pj通過(guò)式(13)計(jì)算
(13)
步驟6對(duì)Pj降序排列,得到特征重要性排序。
將排序好的特征輸入至遞歸特征消除算法中,反復(fù)構(gòu)建模型,選出得分最高的特征放到最優(yōu)特征子集中,之后剩余的特征重復(fù)上述過(guò)程,直到遍歷所有特征后停止,最終得到最佳的特征數(shù)量和最優(yōu)的特征子集。
本文提出的分類(lèi)方法分為 VMD信號(hào)分解及特征提取、基于 RF-RFE的特征選擇和基于RF的分類(lèi) 3個(gè)階段,如圖1所示。
第一階段,對(duì)采集到的揚(yáng)聲器響應(yīng)信號(hào)進(jìn)行VMD分解,得到K個(gè)模態(tài)分量,分別提取每個(gè)模態(tài)的時(shí)域及頻域特征,構(gòu)成原始的特征數(shù)據(jù)集;
第二階段,將原始的特征數(shù)據(jù)集輸入至RF中,得到特征重要性排序,再通過(guò)RFE得到最佳的特征數(shù)量和最優(yōu)的特征子集,將特征子集劃分為訓(xùn)練樣本和測(cè)試樣本;
第三階段,使用訓(xùn)練樣本集訓(xùn)練RF分類(lèi)器,之后使用測(cè)試樣本集對(duì)訓(xùn)練所得的RF模型進(jìn)行測(cè)試,最后輸出分類(lèi)結(jié)果。
試驗(yàn)采用諧振頻率為180 Hz的3580-3型彩電揚(yáng)聲器單元,阻抗為6 Ω,額定功率為10 W,該型號(hào)揚(yáng)聲器異常聲多發(fā)于低頻段,揚(yáng)聲器單元在其諧振頻率的附近振幅將達(dá)到最大,更容易激發(fā)出潛在的異常聲。在進(jìn)行揚(yáng)聲器單元測(cè)量時(shí),使用高頻到低頻的掃描方式可以有效減少其穩(wěn)定時(shí)間[25]。因此,本次試驗(yàn)采用1 800~20 Hz的連續(xù)對(duì)數(shù)掃頻信號(hào),其時(shí)域圖如圖2所示,由高頻到低頻的掃描方式激勵(lì)被測(cè)揚(yáng)聲器單元,激勵(lì)時(shí)長(zhǎng)為1 s,激勵(lì)電壓為1 V。本次試驗(yàn)所采用的平臺(tái)如圖3所示。
本次試驗(yàn)共測(cè)試了良品、異物、缺膠、碰圈、脫盆架、音小、紙盆聲7種狀態(tài)下的揚(yáng)聲器單元,每種狀態(tài)下的揚(yáng)聲器單元各14個(gè)。其中異物指揚(yáng)聲器單元中存在鐵屑等松散顆粒,缺膠指防塵帽或壓邊缺膠,碰圈指音圈變形或支架不平導(dǎo)致與磁體發(fā)生碰撞,脫盆架指盆架安裝松動(dòng),音小指支片沾有膠水或者磁鋼未充磁,紙盆聲指紙盆破裂變形等。對(duì)上述七種揚(yáng)聲器單元狀態(tài),分別貼標(biāo)簽為1、2、3、4、5、6、7。對(duì)每個(gè)揚(yáng)聲器單元進(jìn)行5次測(cè)試,減小隨機(jī)信號(hào)對(duì)數(shù)據(jù)影響的同時(shí)也增加了樣本的數(shù)量。
本試驗(yàn)中所用消聲箱體積較小,在低頻段,箱內(nèi)聲場(chǎng)接近壓力場(chǎng),如圖4、圖5分別為合格揚(yáng)聲器在自由場(chǎng)和消音箱條件下聲響應(yīng)信號(hào)的頻域圖,采樣時(shí)間為1 s,采樣頻率為44.1 kHz。對(duì)揚(yáng)聲器信號(hào)進(jìn)行VMD分解前需要確定模態(tài)數(shù)K。本文采用觀察中心頻率法來(lái)確定K值,不同K值的中心頻率如表1所示。
表1 不同K值對(duì)應(yīng)的中心頻率Tab.1 Center frequency corresponding to different K values
當(dāng)K=7時(shí),出現(xiàn)中心頻率為1 204 Hz和1 300 Hz兩個(gè)模態(tài),認(rèn)為其中心頻率較近,出現(xiàn)過(guò)分解。因此選擇K=6,同時(shí)α設(shè)定為2 000,此時(shí)可以取得理想的分解效果。如圖6、圖7分別為VMD分解所得的揚(yáng)聲器在不同狀態(tài)中各模態(tài)的時(shí)域和頻域圖。
由圖6、圖7可以看出, VMD分解不僅能將合格揚(yáng)聲器單元的聲響應(yīng)信號(hào)分解到各個(gè)頻帶中,同時(shí)也能將各種異常揚(yáng)聲器單元的聲響應(yīng)信號(hào)分解到各個(gè)頻帶中,每一個(gè)頻帶對(duì)應(yīng)著一個(gè)模態(tài)分量,并且各頻帶的頻率中心未出現(xiàn)交叉和過(guò)分解,且不存在混疊現(xiàn)象,充分體現(xiàn)出VMD分解的優(yōu)勢(shì)。
針對(duì)上述7種揚(yáng)聲器聲響應(yīng)信號(hào),將其分解為6個(gè)模態(tài)分量,分別提取每個(gè)模態(tài)的X1-X18特征,以及VMD-Hilbert變換后的X19特征。由此得到109維原始特征向量,維數(shù)較高,可能存在冗余特征,影響后續(xù)分類(lèi)結(jié)果,因此利用RF-RFE模型對(duì)其進(jìn)行特征選擇,篩選出具有較高鑒別力的特征。由于RF中受決策樹(shù)數(shù)量(T)、樹(shù)的最大深度(D)、每棵樹(shù)每個(gè)節(jié)點(diǎn)分裂所需最小樣本數(shù)(S)影響較大,因此首先使用隨機(jī)搜索策略[26]對(duì)其進(jìn)行尋優(yōu),尋優(yōu)范圍及結(jié)果如表2所示。
表2 隨機(jī)森林參數(shù)優(yōu)化Tab.2 Random forest parameter optimization
將原始特征向量輸入至調(diào)參后的RF-RFE模型中,采用十折交叉驗(yàn)證法,從當(dāng)前的109個(gè)特征中修剪最不重要的特征。在修剪的集合上遞歸地重復(fù)該過(guò)程,直到最終到達(dá)所需特征的數(shù)量,在交叉驗(yàn)證中得到最佳特征的數(shù)量如圖8所示,最優(yōu)特征子集重要性排序如圖9所示。
由圖8可得出最佳的特征數(shù)量為22個(gè),相比較原始特征集減少了87個(gè)特征,得到最優(yōu)特征子集重要性排序如圖9所示,其中u6X15表示模態(tài)u6的特征X15。由圖9可得,所篩選出的22個(gè)特征重要性之和為0.554(所有特征重要性和為1),說(shuō)明此特征選擇的方法不僅極大程度減少了特征數(shù)量、去除了冗余特征,同時(shí)所篩選出的特征鑒別能力也較強(qiáng)。
將選擇好的最優(yōu)特征數(shù)據(jù)集輸入至RF算法中進(jìn)行分類(lèi)識(shí)別。在分類(lèi)試驗(yàn)中,將最優(yōu)特征數(shù)據(jù)集隨機(jī)分為5i(1≤i≤5)份,其中第i份為測(cè)試集,其余4份為訓(xùn)練集,將5次結(jié)果取平均值作為最后測(cè)試結(jié)果,結(jié)果如表3~表5所示。這樣可以有效減少測(cè)試集、訓(xùn)練集選取不同樣本帶來(lái)的誤差,使得結(jié)果更為真實(shí)有效。
表3 隨機(jī)森林分類(lèi)混淆矩陣Tab.3 Random forest classification confusion matrix
混淆矩陣[27]描繪了各測(cè)試樣本數(shù)據(jù)的真實(shí)屬性和預(yù)測(cè)結(jié)果之間的關(guān)系,可以用于評(píng)價(jià)分類(lèi)算法的性能,如表3為隨機(jī)森林分類(lèi)準(zhǔn)確率的混淆矩陣,其第一行為實(shí)際類(lèi)別,第一列為預(yù)測(cè)類(lèi)別。由表看出異物與脫盆架的識(shí)別率達(dá)到100%,良品識(shí)別率為99.06%,同時(shí)可以計(jì)算出平均識(shí)別率為98.61%,說(shuō)明該方法分類(lèi)效果好,同時(shí)具有更好的特征區(qū)分度。
同時(shí)為了說(shuō)明本文方法的優(yōu)勢(shì),進(jìn)行了對(duì)比試驗(yàn)。對(duì)7種揚(yáng)聲器單元進(jìn)行WPD分解;分解之后對(duì)每個(gè)子帶提取特征后進(jìn)行特征選擇;最后使用RF、Adaboost及SVM進(jìn)行分類(lèi)試驗(yàn),分類(lèi)結(jié)果如表4所示。
表4 不同分解方法及不同分類(lèi)器結(jié)果對(duì)比Tab.4 Comparison of different decomposition methods and results of different classifiers
表5 特征選擇方法對(duì)比Tab.5 Comparison of feature selection methods
由3個(gè)分類(lèi)器的平均分類(lèi)準(zhǔn)確率可以看出,經(jīng)VMD分解后,分類(lèi)效果要優(yōu)于WPD,說(shuō)明VMD分解算法能將非平穩(wěn)的復(fù)雜信號(hào)較好地分離開(kāi),避免了能量泄露和端點(diǎn)效應(yīng)。在分類(lèi)器方面,RF分類(lèi)效果要優(yōu)于Adaboost和SVM,說(shuō)明了RF分類(lèi)效果好,抗噪能力強(qiáng)。
RF-RFE與序列前項(xiàng)選擇(sequential forward selection, SFS)在耗時(shí)和選擇效果上進(jìn)行了對(duì)比,信號(hào)分解方法為VMD,分類(lèi)器為RF。表5給出了不同特征選擇方法下的結(jié)果對(duì)比,其中的耗時(shí)是全部數(shù)據(jù)的總處理時(shí)間??梢钥吹轿唇?jīng)過(guò)特征選擇算法由于存在冗余特征導(dǎo)致分類(lèi)準(zhǔn)確率降低,同時(shí)RF-RFE在特征選擇和耗時(shí)上比 SFS 更好,RF-RFE在耗時(shí)和選擇效果上取得了較好的平衡。充分表明了本文所提方法在揚(yáng)聲器異常聲分類(lèi)中的具有更好的效果。
論文提出了一種結(jié)合VMD和隨機(jī)森林特征選擇的揚(yáng)聲器異常聲分類(lèi)的方法,分別提取各模態(tài)的時(shí)頻域特征,并利用RF-RFE算法篩選出最優(yōu)特征子集,輸入隨機(jī)森林中進(jìn)行分類(lèi)識(shí)別。通過(guò)對(duì)采集到的揚(yáng)聲器響應(yīng)信號(hào)進(jìn)行分析和試驗(yàn),結(jié)論如下:
(1)針對(duì)論文中7種揚(yáng)聲器單元狀態(tài),利用VMD分解可以將揚(yáng)聲器聲響應(yīng)信號(hào)較好的分離為各個(gè)模態(tài),具有更好的自適應(yīng)性和能量聚焦性,其分解效果優(yōu)于WPD分解。
(2)結(jié)合隨機(jī)森林特征重要性排序和遞歸特征消除算法,能更加有效的從多維特征中選擇出鑒別能力較好的特征,在特征選擇速度和分類(lèi)精度上均優(yōu)于SFS。
(3)提出的基于隨機(jī)森林的分類(lèi)方法在平均準(zhǔn)確率上均高于SVM和Adaboost。表明了本文所提分類(lèi)方法在揚(yáng)聲器異常聲分類(lèi)中有著更好的分類(lèi)準(zhǔn)確度和泛化能力。
揚(yáng)聲器單元故障類(lèi)型繁多,本文只選擇了7種進(jìn)行分類(lèi),未來(lái)還需對(duì)多種不同的故障種類(lèi)進(jìn)行診斷,同時(shí)還需分析何種激勵(lì)信號(hào)能更好的激發(fā)揚(yáng)聲器異常聲。