李丹鶴,陳曉東
(1.唐山工業(yè)職業(yè)技術(shù)學(xué)院,河北 唐山 063200;2.遼東學(xué)院工程技術(shù)學(xué)院,遼寧 丹東 118000)
公共場(chǎng)所的安全防護(hù)和廣場(chǎng)、街道等區(qū)域突發(fā)事件的實(shí)時(shí)監(jiān)測(cè),隨著經(jīng)濟(jì)的發(fā)展越來越受到高度重視,異常事件的發(fā)生通常伴有尖叫、物品破碎及爆炸等與事件相關(guān)的異常聲音,準(zhǔn)確識(shí)別這些公共場(chǎng)所的異常聲音以輔助安全監(jiān)控對(duì)維護(hù)秩序、保護(hù)公共財(cái)務(wù)和公民安全,具有重要的研究意義[1],已成為當(dāng)前公共安全領(lǐng)域研究發(fā)展的重要方向。
國(guó)內(nèi)外學(xué)者對(duì)各種環(huán)境下的異常聲音事件檢測(cè)展開了大量研究,文獻(xiàn)[2]在對(duì)異常聲信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)總體平均分解基礎(chǔ)上,提取分解固有模態(tài)函數(shù)的MPCC、短時(shí)能量等特征,提取方法,并采用改進(jìn)無環(huán)圖SVM 進(jìn)行識(shí)別,但算法僅適于五種特征信號(hào);文獻(xiàn)[3]借助粒子群算法的連續(xù)字典集特性對(duì)粒子濾波進(jìn)行優(yōu)化改進(jìn),然后將改進(jìn)的粒子濾波用于SVM 中,以提高SVM 跳出局部最優(yōu)的能力,從而提高算法對(duì)公共環(huán)境中異常聲音的識(shí)別率并降低算法復(fù)雜度;文獻(xiàn)[4]提取異常聲音信號(hào)的過零率、相關(guān)系數(shù)、MPCC 等多特征組成復(fù)合特征,通過粒子群優(yōu)化改進(jìn)的SVM 算法對(duì)四類聲信號(hào)進(jìn)行分類。文獻(xiàn)[5]通過判決表示和聲譜圖提取異常聲音信號(hào)的組合特征并將SVM 和神經(jīng)網(wǎng)絡(luò)的分類識(shí)別優(yōu)勢(shì)融合后對(duì)組合特征進(jìn)行分類,但算法在多隱層DNN 訓(xùn)練時(shí)易形成深層錯(cuò)誤問題。
由于公共場(chǎng)所的背景噪聲具有非線性和存在耒知突變等復(fù)雜性,已有方法進(jìn)行實(shí)際環(huán)境的異常聲音識(shí)別時(shí)往往噪聲干擾過強(qiáng)而達(dá)不到理想識(shí)別效果[3]。正交匹配追蹤(Orthogonal Matching Pursuit,OMP)[6]遵循信息的自適應(yīng)分解原則,通過在一個(gè)過完備集中追蹤時(shí)頻特征能夠自適應(yīng)最佳匹配原始信號(hào)內(nèi)部結(jié)構(gòu)的最優(yōu)原子,實(shí)現(xiàn)聲信號(hào)的稀疏分解并重構(gòu),適于非平穩(wěn)非線性噪聲環(huán)境下的聲音事件識(shí)別。文獻(xiàn)[6]通過沖激響應(yīng)稀疏模型優(yōu)化MP算法提取聲信號(hào)的時(shí)頻參數(shù)特征,但參數(shù)難以保證對(duì)非平衡背景噪聲的適應(yīng)性;文獻(xiàn)[7]通過反卷積法優(yōu)化MP 重構(gòu)聲源信號(hào),基于數(shù)值仿真成像圖和偏差值分析聲源信號(hào)的頻率、信噪比等特征;文獻(xiàn)[8]采用基于優(yōu)化OMP 和短時(shí)譜估計(jì)的二次重構(gòu)方法消除公共環(huán)境中的非平衡非線性噪聲,然后提取MPCC 和MP 時(shí)頻參數(shù)等特征通過DBN 實(shí)現(xiàn)聲信號(hào)識(shí)別,并通過40 種聲事件對(duì)算法的有效性進(jìn)行了驗(yàn)證。
在已有研究基礎(chǔ)上,提出基于自適應(yīng)連續(xù)集MP 稀疏分解的公共環(huán)境異常聲音識(shí)別算法。算法通過相關(guān)參數(shù)的自適應(yīng)改進(jìn)實(shí)現(xiàn)自適應(yīng)PSO 算法,然后借助PSO 算法的連續(xù)空間搜索優(yōu)勢(shì)對(duì)MP 稀疏分解進(jìn)行優(yōu)化和構(gòu)建連續(xù)Gabor 超完備原子集,從而提高稀疏分解獲得的最優(yōu)原子的匹配度,最后提取重構(gòu)聲信號(hào)的復(fù)合特征以SVM 算法實(shí)現(xiàn)異常聲音事件的快速準(zhǔn)確識(shí)別,實(shí)驗(yàn)驗(yàn)證了算法的有效性和對(duì)公共環(huán)境噪聲的魯棒性。
匹配追蹤的思想是將信號(hào)表示為一系列最優(yōu)匹配的時(shí)頻原子的線性組合,利用最優(yōu)原子精確描述含噪信號(hào)中的純凈目標(biāo)信號(hào)。數(shù)學(xué)上,OMP 通過Hilbert 空間H=RN的一個(gè)過完備集D={gi,i=1,2,L,Q}中的原子組 a={a1,a2,L,am}來線性組合表示信號(hào)f∈H,即 f=a·g,如果 a 中大部分值近似于 0,則認(rèn)為 f=a·g 是稀疏的。
遍歷過完備集中的所有原子,利用式(1)所示內(nèi)積計(jì)算式搜索最優(yōu)原子,即時(shí)頻原子可以最優(yōu)的逐步匹配原始信號(hào)的某一特征,
為使‖R1f‖取得最小值,以使最優(yōu)原子組線性組合最優(yōu)表達(dá)原始信號(hào),須在每次迭代時(shí)取得最大值。令MP 迭代開始時(shí)f=R0f,進(jìn)行k 次迭代后的剩余信號(hào)為fk=Rkf,則以其作為待匹配信號(hào),繼續(xù)重復(fù)式(1),在D 中搜索最優(yōu)匹配原子D,則得到分解所得的最優(yōu)原子,即滿足:
不斷重復(fù)式(1)直到剩余信號(hào)振幅小于預(yù)設(shè)并值,此時(shí),原始信號(hào)f 的MP 稀疏分解可表示為:
OMP 算法在稀疏分解的每次迭代過程中,都需要遍歷D 中的所有原子以搜索剩余信號(hào)的最優(yōu)匹配原子,因而計(jì)算量巨大,且要求D 為有限[5],通常選擇參數(shù)離散方式獲得的Gabor 集作為過完備原子集。這樣,在進(jìn)行實(shí)際聲音檢測(cè)時(shí),MP 稀疏分解對(duì)γ 的離散化和Gabor 集的冗余性需求,本質(zhì)上存在一定的矛盾。PSO 算法能夠?qū)崿F(xiàn)連續(xù)空間的全局搜索優(yōu)化[6],因而通過目標(biāo)函數(shù)調(diào)整改進(jìn),可以將PSO 的連續(xù)空間能力用以改進(jìn)MP 稀疏分解,提高最優(yōu)匹配原子的匹配性能。
PSO 算法[10]將種群的個(gè)體視為多維空間搜索的粒子,以位置、速度和適應(yīng)度三個(gè)特征值表示第個(gè)粒子特征,m 個(gè)粒子在d維空間以一定的速度飛行,根據(jù)自身與其他粒子的飛行經(jīng)驗(yàn),即個(gè)體歷史最優(yōu)和種群歷史最優(yōu),改變其飛行的速度和方向,從而實(shí)現(xiàn)全局搜索的尋優(yōu)過程。種群慣性權(quán)重用以平衡全局探測(cè)和局部開采,學(xué)習(xí)因子控制粒子向最位置飛行的步長(zhǎng)。
借助密度聚類方法,將種群粒子自適應(yīng)劃分,子群采用不同的學(xué)習(xí)策略以提高多樣性。對(duì)每個(gè)粒子賦于局部密度ρi和間距兩個(gè)變量,定義為:
式中:dii—兩粒子之間的距離;dc—其截距,當(dāng)某子類的局部密度最大,則有ρi=maxidij。根據(jù)式(6)可得子群的聚類中心為ρi和δi都較大的粒子,其他粒子則可以歸入與其距離最近的中心粒子局部子群中。
劃分后對(duì)子群內(nèi)的非最優(yōu)粒子需要基于最優(yōu)粒子位置引導(dǎo),提高其局部搜索能力以獲得更優(yōu)位置,采用式(7)進(jìn)行位置更新,即:
式中:ω、c1和 c2—PSO 算法的慣性權(quán)重和學(xué)習(xí)因子—位于[0,1]且滿足均勻分布的隨機(jī)數(shù)—子群c 的最優(yōu)位置粒子,而對(duì)于需要根據(jù)種群歷史最優(yōu)進(jìn)行位置和速度的更新,更新公式為:
每個(gè)子群中的最優(yōu)粒子是全局最優(yōu)解的可能性最大,因而采用式(8)子群平均信息引入其更新,以加強(qiáng)子群尋優(yōu)信息交互,避免局部最優(yōu)。
已有研究表明,增加擾動(dòng)到粒子更新過程中有利于幫助粒子跳出局部解,因此采用高斯變異進(jìn)一步增加PSO 粒子多樣性,避免局部最優(yōu)。由高斯概率函數(shù)重構(gòu)高斯變異函數(shù)Gi(t):
經(jīng)過一定迭代次數(shù)后,大部分粒子位置向最優(yōu)粒子飛行,易造成算法“早熟“,為此,采用Gi(t)增加擾動(dòng),以減少粒子進(jìn)入局部解的概率,基于高斯變異擾動(dòng)的粒子位置更新式為:
基于高斯窗函數(shù)伸縮變換得到的Gabor 字典集,其信號(hào)特性與聲事件特性相關(guān)性較好[10],基于PSO 函數(shù)的連續(xù)空間搜索能力,采用連續(xù)Gabor 過完備集進(jìn)行改進(jìn)MP 稀疏分解。
設(shè)含噪聲信號(hào)為f=fs+fn,式中:fs—純凈聲信號(hào),而fn—噪聲。則文中PSO 改進(jìn)MP 的目標(biāo)函數(shù)為:
根據(jù)目標(biāo)函數(shù),初始化后,在迭代過程中,根據(jù)適應(yīng)度函數(shù)更新粒子的位置和速度。迭代次數(shù)的增加會(huì)使最優(yōu)字典集的維數(shù)逐漸增高,使算法在重構(gòu)信號(hào)時(shí)復(fù)雜度激增,為此采用Hermitian求逆實(shí)現(xiàn)信號(hào)重構(gòu)。
分塊形式表示Hermitian:
根據(jù)式(13),在信號(hào)重構(gòu)時(shí),當(dāng)次矩陣求逆可以表示為前次求逆結(jié)果線性組合,從而提高矩陣求逆效率。
設(shè)PSO 改進(jìn)MP 稀疏分解的每次迭代更新后,原子集字典變?yōu)?DΔk=[DΔk-1gyk],gyk—當(dāng)次迭代更新后獲得的最優(yōu)匹配原子,則有:ΘΔk=[ΘΔk-1dyk],其中,ΘΔk=φψΔk,dyk=φgyk。φ 為觀測(cè)矩陣。
熟悉金剛石專業(yè)加工設(shè)備的操作及維護(hù),金剛石刀具結(jié)構(gòu)設(shè)計(jì),金剛石模具裝配、裝料和取料,掌握金剛石檢測(cè)工具的選擇與合理使用及加工工藝。
圖1 改進(jìn)算法的稀疏分解流程Fig.1 Improved Algorithm Sparse Decomposition Process
通過高斯函數(shù)變換獲得的Gabor 集中的原子能夠較好的描述公共環(huán)境中異常聲信號(hào)的時(shí)頻特性[9],而與環(huán)境背景噪聲的相關(guān)性較低,因而實(shí)際環(huán)境中獲得的含噪信號(hào)經(jīng)改進(jìn)MP 稀疏分解算法分解后,其最優(yōu)原子組的時(shí)頻參數(shù)集合可以較好的描述實(shí)際信號(hào)中的純凈聲信號(hào),而有效消除噪聲干擾,可以作為聲信號(hào)識(shí)別的特征,這里以時(shí)頻參數(shù)集合中的與的均值和標(biāo)準(zhǔn)差作為公共環(huán)境異常聲音的識(shí)別特征。設(shè)實(shí)際采集聲信號(hào)經(jīng)預(yù)處理后被分為M幀,則采用改進(jìn)算法對(duì)信號(hào)完成MP 稀疏分解后,最優(yōu)原子組中的s與 v 分別為 s=[S1,S2,L,Sλ,L,SM]和 v=[v1,v2,L,vλ,L,vM],識(shí)別特征為 Fmp(λ)={u(Sλ,vλ),σ(Sλ,vλ)}。
SVM 可以在訓(xùn)練樣本量較少的情況下取得最優(yōu)的分類識(shí)別結(jié)果,適合公共場(chǎng)所的異常聲識(shí)別環(huán)境。為此,采用SVM 算法以提取的 Fmp(λ)={u(Sλ,vλ),σ(Sλ,vλ)}進(jìn)行聲信號(hào)識(shí)別。
為驗(yàn)證改進(jìn)算法(簡(jiǎn)記為APso-MP)在公共環(huán)境噪聲下的異常聲音識(shí)別性能,實(shí)驗(yàn)以DCASE[10]庫(kù)中的5 種室內(nèi)聲音和10 種公共場(chǎng)所異常聲音為數(shù)據(jù),選取雨天環(huán)境噪聲、車站環(huán)境噪聲、鬧市環(huán)境噪聲和高斯噪聲四種噪聲進(jìn)行不同信噪比混合,以仿真實(shí)際環(huán)境實(shí)測(cè)聲信號(hào),采樣率fs=22.05Hz,訓(xùn)練樣本100 組,測(cè)試樣本30 組。最大迭代次數(shù)kmax=200,粒子群算法的位置邊界Xmax=[N,N,π,2π],初始位置為邊界內(nèi)隨機(jī)值。
從實(shí)驗(yàn)數(shù)據(jù)中隨機(jī)50 組聲信號(hào)樣本,并與四種噪聲以-5 dB 分段信噪隨機(jī)混合,改進(jìn)算法對(duì)某含胡高斯噪聲的聲信號(hào)稀疏分解并重構(gòu)后的波形圖和時(shí)頻譜圖,如圖2 所示??梢钥闯?,算法較好的降低噪聲干擾,并保持聲信號(hào)波形,時(shí)頻譜圖中也顯示出算法較好的降噪作用。進(jìn)一步,采用這里算法、PSO 改進(jìn)MP 算法(記為 Pso-MP)[4]及原始 OMP 算法對(duì)重構(gòu)信號(hào)的均方誤差(MSE)、波形相似性(NCC)[9]及信噪比(SNR)等評(píng)價(jià)指標(biāo)進(jìn)行分析,多次實(shí)驗(yàn)結(jié)果平均值,如表2 所示。
圖2 改進(jìn)算法重構(gòu)信號(hào)Fig.2 Reconstruction Signal of the Proposed Algorithm
表2 實(shí)驗(yàn)結(jié)果進(jìn)一步驗(yàn)證了這里改進(jìn)算法在信號(hào)稀疏分解和重構(gòu)方面的優(yōu)勢(shì),自適應(yīng)的參數(shù)設(shè)置增加算法對(duì)不同異常聲信號(hào)的適應(yīng)性,而連續(xù)集最優(yōu)原子增加了與聲信號(hào)的匹配程序。
表2 重構(gòu)性能分析實(shí)驗(yàn)結(jié)果Tab.2 Calculation and Reconstruction Performance
為驗(yàn)證算法別性能,以識(shí)別率p=(U1/U)×100%為指標(biāo),式中:U—總樣本數(shù);U1—準(zhǔn)確識(shí)別樣本數(shù)。將這里APso-MPSVM 算法與 OMPSVM[10]、Pso-MPSVM[9]、APso-MPRF 三種已有算法進(jìn)行聲信號(hào)識(shí)別性能比較,APso-MPRF 算法為以文中改進(jìn)MP 稀疏分解重構(gòu)信號(hào)而采用樹數(shù)500 分類屬性5 的隨機(jī)森林作為分類器。將測(cè)試樣本以不同分段信噪比與噪聲混合進(jìn)行識(shí)別,多次實(shí)驗(yàn)平均值,如圖3 所示。
圖3 實(shí)驗(yàn)算法在4 種噪聲環(huán)境的聲音識(shí)別率Fig.3 Average Recognition Rate of Each Algorithm in 4 Noise Environments
從圖3 中可以看出,APso-MPSVM 算法的異常聲信號(hào)識(shí)別率最高。在分類器相同下APso-MPSVM 算法比APso-MPSVM 算法的平均識(shí)別率更高,說明APso-MP 分解獲得的最優(yōu)原子組參數(shù)具有更好的識(shí)別性能,主要因?yàn)閰?shù)自適應(yīng)設(shè)置使得算法對(duì)不同聲信號(hào)具有更好的適應(yīng)性,而連續(xù)超完備集的使用又使最優(yōu)原子與聲信號(hào)匹配性更好。
為實(shí)現(xiàn)公共環(huán)境復(fù)雜背景中異常聲信號(hào)識(shí)別以輔助公共場(chǎng)所安全監(jiān)控,提出基于連續(xù)完備集的自適應(yīng)MP 稀疏分解聲音識(shí)別算法,算法通過相關(guān)參數(shù)改進(jìn)實(shí)現(xiàn)自適應(yīng)PSO 算法,然后借助PSO 算法的連續(xù)空間搜索優(yōu)勢(shì)對(duì)MP 稀疏分解進(jìn)行連續(xù)集優(yōu)化,從而提高稀疏分解最優(yōu)原子的匹配度,最后提取重構(gòu)聲信號(hào)的時(shí)頻參數(shù)特征以SVM 算法實(shí)現(xiàn)異常聲音事件的快速準(zhǔn)確識(shí)別。實(shí)驗(yàn)結(jié)果表明,與已有算法相比,所提識(shí)別算法顯著降低了計(jì)算量,并取得了最優(yōu)的聲音識(shí)別率和識(shí)別魯棒性。