徐文超,王光艷,耿艷香,白 芳,費(fèi) 騰
天津商業(yè)大學(xué) 信息工程學(xué)院,天津 300134
語音增強(qiáng)技術(shù)是語音信號處理方向的課題之一,是在語音通信系統(tǒng)中語音傳輸受到噪聲干擾時(shí)提高語音信號質(zhì)量的技術(shù),語音增強(qiáng)的一個(gè)主要目的是將盡可能純凈的有用語音從含有噪聲語音信號中提取出來[1]。噪聲的來源不同,應(yīng)用的環(huán)境各異,其特性是千變?nèi)f化的,因此,語音增強(qiáng)技術(shù)在語音通信系統(tǒng)傳輸過程中起著非常重要的作用。國內(nèi)外的研究人員已取得了一些基礎(chǔ)性研究成果,Boll假設(shè)噪聲是平穩(wěn)的加性噪聲,原始語音信號和噪聲不相關(guān)的情況下,提出了譜減法[2-4](Spectral Subtraction),此方法具有運(yùn)算量小,易于實(shí)現(xiàn)和去噪效果顯著的特點(diǎn);利用人耳的聽覺掩蔽效應(yīng)的語音增強(qiáng)方法也取得較好效果;Lim和Oppenheim提出了提高語音信號質(zhì)量的維納濾波方法,但這是基于信號短時(shí)平穩(wěn)的。在實(shí)際應(yīng)用的語音環(huán)境中,語音信號中的噪聲是隨環(huán)境和時(shí)間發(fā)生變化的,并不能完全消除噪聲,而LMS自適應(yīng)濾波器[5-7]是利用前一時(shí)刻得到的濾波器參數(shù)來控制后一時(shí)刻的濾波器參數(shù),來適應(yīng)未知的信號和噪聲,因此LMS自適應(yīng)濾波成為有效增強(qiáng)語音方法之一。
傳統(tǒng)的LMS自適應(yīng)濾波算法步長因子固定,而步長的變化對提高收斂速度、跟蹤能力和縮小穩(wěn)態(tài)誤差方面的要求是相互矛盾的。人們對各種改進(jìn)的變步長LMS自適應(yīng)濾波[8-13]做了大量的研究,文獻(xiàn)[8]提出了改進(jìn)的變步長的函數(shù),但存在誤差接近零時(shí)步長變化太快的不足;文獻(xiàn)[12-13]提出的算法中引入了控制步長變化速度和取值范圍的因子,但步長公式中會出現(xiàn)平方項(xiàng),自適應(yīng)算法不容易得到最優(yōu)解,不能準(zhǔn)確地反應(yīng)算法自適應(yīng)狀態(tài)。本文在研究了各種變步長LMS自適應(yīng)濾波算法的基礎(chǔ)上,提出了對原始語音信號先進(jìn)行譜減法后采用變步長LMS自適應(yīng)濾波算法聯(lián)合去噪的方法。該方法將步長公式作了進(jìn)一步的改進(jìn),將誤差的平方項(xiàng)e2(m)改為|e(m)×e(m-1)|來調(diào)節(jié)步長,即步長公式變?yōu)棣?m)=β(1-exp(-α|e(m)e(m-1)|)),以提高算法對不相關(guān)噪聲的抑制能力,并且采用“先固定后變化”的原則,將步長公式在暫態(tài)時(shí)使用固定值μ1,在穩(wěn)態(tài)時(shí)使用變化的值,信號的信噪比有了較大提高,降低了背景噪聲干擾,PESQ[14-18]分值得到了提高,取得較好的增強(qiáng)效果。
基本譜減法的思想假設(shè)噪聲是加性噪聲(零均值的高斯白噪聲)的,且與短時(shí)平穩(wěn)的語音信號在相互獨(dú)立的情況下,將含噪的語音信號y(m)進(jìn)行傅里葉變換,然后取其幅度的平方和相位,語音信號s(m)的功率譜估計(jì)由含噪語音的功率譜減去噪聲功率譜得到,然后語音信號的功率譜估計(jì)開方后得到語音幅度估計(jì),將語音幅度估計(jì)重新插入相位,然后再采用逆傅立葉變換恢復(fù)時(shí)域信號。假設(shè)s(m)為純凈語音信號,n(m)為噪聲信號,y(m)為帶噪語音信號,則帶噪語音模型有:
將信號y(m)、s(m)、n(m)進(jìn)行傅里葉變換后得到Y(jié)(w)、S(w)、N(w),則
式(3)兩邊取數(shù)學(xué)期望得:
因?yàn)閟(m)和n(m)相互獨(dú)立,因此S(w)和N(w)也獨(dú)立,由于假設(shè)噪聲為零均值的高斯分布,所以2E{Re[S(w)N*(w)]}=0,即
所以對于一個(gè)短時(shí)平穩(wěn)過程,可以有:
由于采用的模型是基于寬平穩(wěn)假設(shè),噪聲是局部平穩(wěn)的,發(fā)音前噪聲的功率譜和在發(fā)音期間認(rèn)為是相同的,噪聲和在發(fā)音前的那段噪聲具有相同的統(tǒng)計(jì)特性,所以根據(jù)發(fā)音前的“寂靜段”可以來估計(jì)噪聲的功率譜|N(w)|2,因此可以得到:
這樣得到純凈語音的估計(jì)值為:
由于人耳對語音的感知主要是通過語音幅度譜獲得的,而對相位譜不敏感,可以由估計(jì)后的語音信號的相位譜來代替原含有噪聲的語音信號Y(w)的相位譜,這樣處理后得到降噪后的語音時(shí)域信號。基本譜減法思想的算法流程圖,如圖1所示。
圖1 基本譜減法算法流程圖
語音信號中的背景噪聲是隨環(huán)境和時(shí)間變化的,會很難濾除,在低輸入信噪比時(shí)可經(jīng)過譜減法后通過LMS自適應(yīng)算法調(diào)整濾波器系數(shù),使濾波器的特性隨信號和噪聲的變化而變化,聯(lián)合進(jìn)行去噪達(dá)到最優(yōu)的濾波效果。
自適應(yīng)噪聲濾波的關(guān)鍵是對噪聲求得最佳估計(jì),利用前一時(shí)刻得到的濾波器參數(shù)來調(diào)整后一時(shí)刻控制參數(shù),獲得系統(tǒng)的誤差函數(shù)e(m)來提高信噪比。在處理過程中為獲得噪聲信息增加一個(gè)參考噪聲x(m),如參考噪聲x(m)在其與信號中的噪聲相關(guān),可以較好地抵消噪聲的隨機(jī)性,完全消除噪聲,但在參考噪聲與信號中的噪聲不相關(guān)或相關(guān)性很弱時(shí),噪聲不能完全被抵消,濾波效果不明顯。
自適應(yīng)噪聲濾波原理如圖2所示。
圖2 自適應(yīng)噪聲濾波原理
圖2中,帶有噪聲的語音信號y1(m)包括信號s(m)和噪聲N(m),x(m)作為輸入?yún)⒖荚肼?,N1(m)和N(m)相關(guān),N1(m)與s(m)不相關(guān)。
自適應(yīng)噪聲濾波的算法思想如下:
式(8)兩端取數(shù)學(xué)期望從而得到:
因?yàn)閟(m)與N(m)不相關(guān),s(m)與N1(m)不相關(guān),因此2E[s(m)·(N(m)-d(m))]=0 ,即
通過LMS自適應(yīng)濾波器調(diào)整權(quán)系數(shù),求得非線性函數(shù)E[e2(m)]的極小值點(diǎn),式(9)左端E[e2(m)]值取最小時(shí),式(9)右端E[N(m)-d(m)]2值也同時(shí)為最小,E[s2(m)]的值不發(fā)生變化,自適應(yīng)濾波器的輸出d(m)為N(m)的最佳估計(jì),系統(tǒng)輸出為:
這樣LMS自適應(yīng)濾波器的輸出在d(m)值最接近N(m)值時(shí),e(m)=s(m)。
基本LMS算法的遞歸關(guān)系式為:
μ0是控制自適應(yīng)速度與穩(wěn)定性的常數(shù),又稱步長因子。步長因子μ0取值較小時(shí),穩(wěn)態(tài)失調(diào)噪聲較小,算法收斂慢,精度高,但是會引起算法的收斂和跟蹤速度的降低,所以采用固定步長μ0的算法是不適合的。人們提出各種不同的變步長的LMS自適應(yīng)濾波算法,文獻(xiàn)[9]提出的步長公式:
本文的改進(jìn)中,將誤差的平方項(xiàng)e2(m)修改為:|e(m)×e(m-1)|來調(diào)節(jié)步長,即步長公式變?yōu)棣?m)=β(1-exp(-α|e(m)e(m-1)|)),以提高算法對不相關(guān)噪聲的抑制能力,并且采用“先固定后變化”的原則,將步長公式在暫態(tài)時(shí)使用固定值μ1(μ1的取值應(yīng)符合0<μ1<λmax,λmax表示相關(guān)矩陣R的最大特征值),在穩(wěn)態(tài)時(shí)使用變化的β(1-exp(-α|e(m)e(m-1)|)),即
在處理過程中,N0的取值根據(jù)處理語音信號的長度和實(shí)際情況中LMS算法收斂到穩(wěn)態(tài)時(shí)的迭代次數(shù)來確定,當(dāng)?shù)螖?shù)m 將誤差的平方項(xiàng)調(diào)整為|e(m)×e(m-1)|后進(jìn)行算法分析。 LMS自適應(yīng)濾波器的輸出誤差項(xiàng): 期望得到的理想信號y1(m): φ(m)是均值為零的獨(dú)立干擾項(xiàng),W*(m)為濾波器時(shí)變的最佳權(quán)系數(shù)。 使k(m)表示權(quán)系數(shù)的誤差: 由此可以得到 將式(17)代入式(13),步長公式μ(m)中將出現(xiàn)φ2(m)項(xiàng),這樣不容易使自適應(yīng)算法得到最優(yōu)解,而且μ(m)不再準(zhǔn)確地反應(yīng)算法收斂前的自適應(yīng)狀態(tài),只能在最優(yōu)解的范圍內(nèi)波動,如果波動較大則會出現(xiàn)較大的失調(diào)。將誤差的平方項(xiàng)e2(m)調(diào)整為|e(m)×e(m-1)|后,φ2(m)項(xiàng)就不會影響步長μ(m),濾波器自適應(yīng)狀態(tài)能得到更準(zhǔn)確的反應(yīng),使權(quán)系數(shù)更加接近最優(yōu)值。 為了檢驗(yàn)本文改進(jìn)后的語音增強(qiáng)方法的效果,評估此方法的性能,在MATLAB仿真環(huán)境,不同信噪比下比較譜減法和先經(jīng)過譜減法后采用變步長的LMS算法的實(shí)驗(yàn)效果,將SNR(輸出信噪比)和PESQ(語音感知質(zhì)量評價(jià))作為評價(jià)語音質(zhì)量的評價(jià)指標(biāo): 其中m為采樣點(diǎn)數(shù),d(m)為增強(qiáng)后的語音信號。 PESQ用來評價(jià)語音的主觀聽覺效果,是主客觀相關(guān)性最高的評估算法,得分在 -0.5~4.5之間,分值越高說明語音音質(zhì)越好。 采用一段標(biāo)準(zhǔn)的女生聲音作為語音信號源,輸入的內(nèi)容是:“天津商業(yè)大學(xué)”,此信號源語速正常,在夜間實(shí)驗(yàn)室環(huán)境下錄制,加入的寬帶噪聲相對平穩(wěn),進(jìn)行了不同信噪比(10 dB,0 dB)下的實(shí)驗(yàn),語音信號和噪聲信號采樣頻率均為8 000 Hz,16bit量化,N0=200,使用Hamming窗對含噪信號進(jìn)行分幀,每幀512個(gè)采樣點(diǎn),幀間疊加 128個(gè)采樣點(diǎn)。圖 3(a)、圖4(a)為純凈的原始語音信號,圖3為輸入信噪比為10 dB時(shí)的實(shí)驗(yàn)結(jié)果對比,圖4為輸入信噪比為0 dB時(shí)的實(shí)驗(yàn)結(jié)果對比。不同的算法處理后的信噪比結(jié)果如表1。圖3(c)、圖3(d)分別為在10 dB時(shí)譜減法實(shí)驗(yàn)去噪效果和先經(jīng)譜減法后采用LMS自適應(yīng)濾波聯(lián)合去噪后的效果;圖4(c)、圖4(d)分別為在0 dB時(shí)譜減法實(shí)驗(yàn)去噪效果和先經(jīng)譜減法后采用LMS自適應(yīng)濾波聯(lián)合去噪后的效果。 表1是在不同信噪比下,帶噪語音分別使用三種算法增強(qiáng)后的輸出信噪比和PESQ得分。 圖3 信噪比10 dB時(shí)實(shí)驗(yàn)效果對比 圖4 信噪比為0 dB時(shí)實(shí)驗(yàn)效果對比 表1 不同算法處理后性能比較 從圖3、圖4的實(shí)驗(yàn)效果中可以看出:在信噪比10 dB及以下時(shí)先經(jīng)過基本譜減法后再進(jìn)行變步長的LMS自適應(yīng)濾波算法對語音的增強(qiáng)效果要明顯優(yōu)于基本譜減法;在信噪比0 dB時(shí)本文提出的方法仍然有較好的效果,降低了背景噪聲。由表1中可以看出,本文方法使信噪比得到了提高,PESQ評測上,本文方法PESQ得分有較大的提高,增強(qiáng)后的語音質(zhì)量要好于分別單獨(dú)使用譜減法和變步長LMS自適應(yīng)濾波算法,表明本文所做的改進(jìn)對提高語音質(zhì)量有一定的效果。 在總結(jié)了前人變步長LMS自適應(yīng)濾波語音增強(qiáng)的基礎(chǔ)上,本文把譜減法和變步長LMS自適應(yīng)濾波算法聯(lián)合去噪的方法應(yīng)用到語音增強(qiáng)中。算法中對步長采用先固定后變化的原則,在不同信噪比下經(jīng)過大量的實(shí)驗(yàn)測試得到:本文提出的譜減法和改進(jìn)后的變步長LMS自適應(yīng)濾波聯(lián)合去噪的方法降低了背景噪聲,使信噪比得到較大的提高,PESQ分值也有較大的提高,主觀聽覺表現(xiàn)上取得較好的試聽效果。 [1]易克初,田斌,付強(qiáng).語音信號處理[M].北京:國防工業(yè)出版社,2006. [2]Boll S.Suppression of acoustic noise in speech using spectral subtraction[J].IEEE Trans on Acoustic,Speech and Signal Processing,1979,27(2):113-120. [3]張滿,陶亮,周健.基于實(shí)值離散Gabor變換的譜減法語音增強(qiáng)[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(29):109-113. [4]洪曉芬.基于譜減法的改進(jìn)語音增強(qiáng)方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(22):5453-5454. [5]陳琪,郭英,張群,等.基于聽覺感知的LSA-MMSE改進(jìn)型語音增強(qiáng)方法[J].信號處理,2008,24(6):1037-1040. [6]索忠偉,王建英,魏陽,等.一種基于LMS改進(jìn)算法的語音增強(qiáng)方法[J].微計(jì)算機(jī)信息,2006,22(4):237-238. [7]高榕,張仕凱,李靖.自適應(yīng)濾波器消除語音信號中混合噪聲[J].河南科技大學(xué)學(xué)報(bào),2012,33(4):42-45. [8]賈景繁,歐陽景正.一種新的變步長LMS自適應(yīng)濾波算法[J].數(shù)據(jù)采集與處理,1997,12(3):171-174. [9]高鷹,謝勝利.一種變步長LMS自適應(yīng)濾波算法及分析[J].電子學(xué)報(bào),2001,29(8):1094-1097. [10]華強(qiáng),夏哲雷,祝劍英.一種改進(jìn)的變步長LMS自適應(yīng)濾波算法及仿真[J].中國計(jì)量學(xué)院學(xué)報(bào),2012,23(3):304-308. [11]王丹,楊雷,普杰信.基于小波變換變步長LMS自適應(yīng)信道均衡的新方法[J].電訊技術(shù),2011,51(9):112-116. [12]王俊峰.一種改進(jìn)的變步長LMS算法及其DSP實(shí)現(xiàn)[J].儀表技術(shù)與傳感器,2012(11):128-129. [13]姜占才,孫燕,王得芳.基于譜減和LMS的自適應(yīng)語音增強(qiáng)[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(7):142-145. [14]李善姬.一種用于自適應(yīng)噪聲抵消的變步長LMS算法[J].電訊技術(shù),2010,50(11):30-33. [15]倪萍,魏芳.基于PESQ彩鈴鈴音算法的質(zhì)量評估系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(10):145-147. [16]徐巖,孟靜.基于粉紅噪聲的語音增強(qiáng)算法性能評價(jià)研究[J].鐵道學(xué)報(bào),2011,33(4):53-58. [17]馮流保.基于聽覺掩蔽效應(yīng)的小波包語音增強(qiáng)[J].通信技術(shù),2010,43(3):139-141. [18]周璐,邱小軍,林志斌.PESQ測量語音增強(qiáng)算法性能不確定性的研究[J].電聲技術(shù),2010,34(1):71-73.4 實(shí)驗(yàn)結(jié)果分析與仿真
5 結(jié)束語