張穎花,李 增,崔 璨,白云天
中國人民警察大學(xué)a.警務(wù)裝備技術(shù)學(xué)院; b.研究生院,河北 廊坊 065000
在警務(wù)及消防救援人員正常出警處理案件期間,外界環(huán)境是動態(tài)變化的,現(xiàn)場的環(huán)境噪聲種類多,且噪聲音量大,不利于警務(wù)及消防救援人員有序處理案件。在現(xiàn)場環(huán)境中,夾雜著各類噪聲音源,比如汽車警報聲、汽車鳴笛聲、車輛發(fā)動機(jī)聲、群眾呼喊聲等,這些聲音混雜在一起干擾正常通信。在警務(wù)及消防救援人員通信過程中,人員之間的通信基本依賴于對講機(jī),而受眾多噪音源影響,對講機(jī)可能無法正常通信,或者對講機(jī)通信期間雜音過多,影響正常指令的傳輸,通信質(zhì)量大為降低?;谏鲜霈F(xiàn)實(shí)情況,有效提升通信質(zhì)量是目前警務(wù)和消防救援通信研究中重點(diǎn)關(guān)注的一個課題。由此衍生了基于警務(wù)和消防救援現(xiàn)場噪聲的自適應(yīng)濾波降噪方案,使現(xiàn)場噪聲處理系統(tǒng)化。
自適應(yīng)濾波降噪系統(tǒng)在音頻降噪方面有著一定的應(yīng)用效果,也是一個值得研究的方向。自適應(yīng)濾波降噪主要是通過識別噪聲頻率,分析音頻信號中噪聲與注冊噪聲的區(qū)別,根據(jù)噪聲的重合性作出合適的判斷[1]。通過構(gòu)建自適應(yīng)濾波降噪系統(tǒng),能夠?qū)σ纛l系數(shù)進(jìn)行分化,從中提取一個完整的模塊,與噪聲抑制模塊相貼合,完整的噪聲自適應(yīng)濾波降噪系統(tǒng)組成板塊包括以下幾個部分:音頻信號采集模塊、音頻信號預(yù)處理模塊、相似度計(jì)算模塊、系統(tǒng)決策模塊,整體框架流程如圖1所示。
對于音頻信號的預(yù)處理,主要是對音頻特征參數(shù)進(jìn)行提取,在正式提取之前,需要對音頻信號進(jìn)行分化處理,這個處理過程也被稱為音頻信號預(yù)處理。音頻信號預(yù)處理對于降噪系統(tǒng)的降噪性能有直接的影響,所以應(yīng)重視音頻信號預(yù)處理[2],做好細(xì)節(jié)方面的處理工作,確保各個環(huán)節(jié)有序銜接,其具體的處理流程框架如圖2所示。
圖2 音頻信號預(yù)處理框圖
在音頻信號采集過程中,收集到的聲音種類比較多,相對來說聲音收集的數(shù)據(jù)量比較龐大,對于原始音頻信號數(shù)據(jù)的提取,是一個復(fù)雜的過程,數(shù)據(jù)提取量非常大,而且容易導(dǎo)致數(shù)據(jù)出現(xiàn)不穩(wěn)定的情況。而音頻信號本身具有一定的動態(tài)性,通過音頻特征對噪聲音頻進(jìn)行提取,可以有效減少數(shù)據(jù)運(yùn)行量,有效提升系統(tǒng)效率,而且對噪聲的抵御指標(biāo)也會有所提升??乖胄阅艿奶嵘軌蚋玫刈屜到y(tǒng)抵御噪聲的影響[3],要從多個角度規(guī)劃好音頻特征,借助于音頻特征完成噪聲提取,使之能適合自適應(yīng)濾波降噪處理。在降噪系統(tǒng)中,音頻特征參數(shù)的選擇對于自適應(yīng)濾波的影響比較大。
在警務(wù)和消防救援現(xiàn)場中,應(yīng)對系統(tǒng)運(yùn)行過程所選擇的頻譜分析進(jìn)行調(diào)控,以伽瑪通頻率倒譜系數(shù)(GFCC)特征對噪聲進(jìn)行降噪,其特征向量表達(dá)式如公式(1)所示:
(1)
式中,M代表通道數(shù)量;n代表通道編號,其值范圍為0~31。在v>13情況下,GFCC的大部分值近似為0,其壓縮數(shù)學(xué)表達(dá)式為:
(2)
科學(xué)技術(shù)水平的提升進(jìn)一步推動了自適應(yīng)濾波降噪系統(tǒng)的發(fā)展進(jìn)程,在降噪系統(tǒng)中對音頻特征識別模型的應(yīng)用頻率也越來越高,音頻特征識別模型具有一定的分化性,模型種類較為多樣化。不同的模型適用范圍不同,針對線性情況和非線性情況,主要有向量機(jī)模型、身份模型、隱馬爾可夫模型、高斯混合模型等[4],不同的模型側(cè)重點(diǎn)不同,隨著降噪系統(tǒng)的深入發(fā)展,很多模型在自適應(yīng)濾波降噪系統(tǒng)中都有較好的應(yīng)用效果。
近幾年,濾波降噪技術(shù)在各類環(huán)境下的應(yīng)用頻率逐漸增多,但是由于噪聲環(huán)境的多樣化,使得該技術(shù)的應(yīng)用效果無法充分發(fā)揮,針對這種問題,設(shè)計(jì)了詳細(xì)的規(guī)劃方案,具體內(nèi)容指標(biāo)如圖3所示。
圖3 自適應(yīng)濾波降噪系統(tǒng)設(shè)計(jì)方案
該模塊是對聲音信息進(jìn)行歸類處理,將收集的聲音數(shù)據(jù)一一拆分,根據(jù)識別標(biāo)準(zhǔn)將這些聲音分類,將其中冗余聲音數(shù)據(jù)一一去除掉,也可以針對性地消除某一個節(jié)點(diǎn)的聲音,達(dá)到一定的降噪效果。在聲音預(yù)處理過程中,應(yīng)使用專門的算法進(jìn)行計(jì)算,其中維納波降噪需要結(jié)合聲音特征,有一定的降噪要求,譜減算法在噪聲環(huán)境中容易失調(diào),在有色的噪聲環(huán)境中失調(diào)會加重,使用中值濾波法降噪效果相對來說比較好,對于跳變噪聲去除效果也較為明顯,能夠完成對聲音信號的平滑降噪處理。
特征提取模塊涉及多種特征參數(shù),如伽瑪通頻率倒譜系數(shù)(GFCC)。在不同噪聲環(huán)境下,不同特征參數(shù)變化情況是不同的,噪聲環(huán)境下GFCC特征參數(shù)的辨識度最高,有著良好的抗噪性。對GFCC特征參數(shù)進(jìn)行深入分析,發(fā)現(xiàn)其在噪聲辨識方面存在一定的局限性,為了提高對噪聲的精準(zhǔn)辨識,需要對GFCC特征參數(shù)進(jìn)行優(yōu)化和完善,改進(jìn)自適應(yīng)壓縮ACGFCC特征參數(shù),形成全新的特征參數(shù)指標(biāo)。
這個模塊包含了多個節(jié)點(diǎn),以多個模塊為基礎(chǔ)框架,對噪聲辨識進(jìn)行系統(tǒng)化的環(huán)境訓(xùn)練,實(shí)現(xiàn)對噪聲辨識模型參數(shù)的有效優(yōu)化。
高斯分布(Gaussian Distribution)具有一定的廣義性,單純從概念上理解也被稱為正態(tài)分布(Normal Distribution),它是一個連續(xù)概率分布的函數(shù),以單值為中心,呈聚集分散的狀態(tài)。從現(xiàn)實(shí)情況來看,很多心理測試分?jǐn)?shù)與高斯分布都有極高的貼合性。而高斯混合模型(Gaussian Mixture Model,GMM)是基于高斯密度函數(shù)演化而來,高斯混合模型包含的內(nèi)容比較多,具有一定的機(jī)構(gòu)化特點(diǎn),從某種程度上來說,它滿足任意形式的概率密度分布要求,所以在各個行業(yè)領(lǐng)域都有一定的應(yīng)用價值,直觀體現(xiàn)在圖像識別、音頻識別、噪聲辨識等方面[5]。
在音頻特征識別過程中,可通過識別指標(biāo)構(gòu)建高斯混合模型。從本質(zhì)上來看,音頻特征識別采用的識別模型,就是通過識別的方式對噪聲源構(gòu)建一個專門的GMM模型,其框架結(jié)構(gòu)如圖4所示。
圖4 高斯混合模型圖
從概率學(xué)的角度來看,單一化的高斯分布存在一個最大值,用一維的高斯概率分布無法有效描述其分布情況,需要導(dǎo)入高斯混合模型,通過高斯分布疊加的方式進(jìn)行辨識[6],一個多維高斯分布的聯(lián)合正態(tài)分布表達(dá)式見式(3)。
(3)
式中,ui是高斯分布的均值向量;∑i是它的協(xié)方差矩陣,ωi表示其權(quán)重,其約束條件為∑i=1,根據(jù)高斯混合模型的定義,M階高斯混合模型的概率密度函數(shù)數(shù)學(xué)表達(dá)式見式(4)。
一個音頻特征識別GMM模型由其均值向量、協(xié)方差矩陣、混合權(quán)重來表示,如圖5所示。
在模型訓(xùn)練過程中,受多方面因素影響,訓(xùn)練音頻信號的樣品數(shù)量存在一定不足,使得GMM模型并不具備全面性特點(diǎn)。針對這個問題,在本次模型訓(xùn)練中,引入了通用背景模型,這種模型對訓(xùn)練要求比較低,只要通過很少的語音訓(xùn)練集就可以有效提高對噪聲的辨識度。
圖5 音頻特征識別GMM模型的表示
通用背景模型(UBM)具有一定的綜合性特點(diǎn),這種模型就是提前將各種警務(wù)和消防救援現(xiàn)場噪聲的音頻數(shù)據(jù)進(jìn)行整合,然后訓(xùn)練成一個完整性的GMM模型,這種模型能夠辨識音源和噪聲的分布情況。在現(xiàn)場的噪聲可以通過GMM模型參數(shù)調(diào)整辨識出來,這得益于現(xiàn)場噪聲背景的提前收錄。目標(biāo)模型主要通過目標(biāo)聲音最大化后驗(yàn)算概率得到。UBM模型本身就比較大型化,訓(xùn)練時與GMM模型的訓(xùn)練方式大同小異,其結(jié)構(gòu)如圖6所示。這種噪聲辨識模型不僅節(jié)省時間,而且對于噪聲辨識的準(zhǔn)確性也比較高。
圖6 GMM—UBM模型
本文從常規(guī)組網(wǎng)通信中噪聲自適應(yīng)濾波降噪技術(shù)的角度出發(fā),研究了警務(wù)及消防救援現(xiàn)場噪聲環(huán)境下如何有效提高降噪指標(biāo),并對音頻信號進(jìn)行預(yù)處理,從而完成音頻特征的識別。在噪聲干擾的情況下,自適應(yīng)濾波降噪系統(tǒng)的識別功能會極大程度上降低。針對這一問題,需要從降噪模型角度出發(fā),提高模型性能指標(biāo),融入先進(jìn)的科學(xué)技術(shù),將高斯混合模型融入其中,作為系統(tǒng)的基礎(chǔ)優(yōu)化模板,有效提高系統(tǒng)噪聲的辨識性,更好地滿足現(xiàn)場噪聲濾波降噪處理要求。