張娓娓 陳樂(lè)瑞
(1.河南工業(yè)職業(yè)技術(shù)學(xué)院電氣工程系,河南 南陽(yáng) 473000;2.鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450001)
基于PSO-BP的語(yǔ)音增強(qiáng)方法研究
張娓娓1陳樂(lè)瑞2
(1.河南工業(yè)職業(yè)技術(shù)學(xué)院電氣工程系,河南 南陽(yáng) 473000;2.鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450001)
針對(duì)一些常用語(yǔ)音增強(qiáng)方法的特點(diǎn)和不足,本文提出將改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)算法用于語(yǔ)音增強(qiáng),仿真結(jié)果表明:基于PSO-BP神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法可以較大幅度的提升帶噪語(yǔ)音信號(hào)的信噪比,效果明顯。
語(yǔ)音增強(qiáng);帶噪語(yǔ)音信號(hào);信噪比
語(yǔ)音增強(qiáng)[1]是指當(dāng)語(yǔ)音信號(hào)受到噪聲干擾,從含噪語(yǔ)音中提取盡可能純凈的原始語(yǔ)音的技術(shù)。目前,國(guó)內(nèi)外諸多學(xué)者對(duì)語(yǔ)音增強(qiáng)領(lǐng)域進(jìn)行了研究,并提出了多種方法,譜減法[2,3]因?yàn)槠溆?jì)算量比較小,比較容易實(shí)現(xiàn),應(yīng)用得也較多。文獻(xiàn)[2]提出了小波分層閾值處理法,其對(duì)于低信噪比下的處理結(jié)果不太理想,為此本文使用改進(jìn)的粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法對(duì)低信噪比下的帶噪語(yǔ)音信號(hào)進(jìn)行了進(jìn)一步處理。
2.1 PSO優(yōu)化BP網(wǎng)絡(luò)算法
2.1.1 基本粒子群算法
在允許范圍內(nèi)隨機(jī)產(chǎn)生粒子的速度和位移,之后根據(jù)(1)、(2)式迭代,直到找到滿意的解為止。
2.1.2 粒子群算法的改進(jìn)
2.1.3 改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)步驟
第一步:初始化設(shè)置。
第二步:先對(duì)每個(gè)粒子的適應(yīng)度值進(jìn)行計(jì)算,然后將計(jì)算出來(lái)的各個(gè)粒子的適應(yīng)度值進(jìn)行比較,并對(duì)各個(gè)粒子的適應(yīng)度值進(jìn)行線性排列。
第三步:按照(1)和(2)式更新粒子的位移以及其速度,(1)式中w由w(k)代替。
第四步:計(jì)算各個(gè)個(gè)體的選擇概率,之后選擇、交叉,使得新一代種群生成。
第五步:若粒子群優(yōu)化BP網(wǎng)絡(luò)算法的終止條件被滿足,可以求出最優(yōu)解。如若終止條件沒(méi)有得到滿足,需要轉(zhuǎn)到第二步繼續(xù)進(jìn)行。
第六步:確定網(wǎng)絡(luò)參數(shù),使用相應(yīng)的訓(xùn)練樣本對(duì)網(wǎng)絡(luò)進(jìn)行分幀訓(xùn)練。
第七步:停止運(yùn)算。
2.2 仿真結(jié)果分析
原始信號(hào)的時(shí)域波形圖,以及在該原始信號(hào)上加噪后的時(shí)域波形圖如圖1所示,從圖1中可以明顯看出,噪聲完全淹沒(méi)了原始的語(yǔ)音信號(hào)。針對(duì)這樣的情況,單靠傳統(tǒng)的濾波器沒(méi)有辦法將噪聲濾掉,即無(wú)法將原始信號(hào)從噪聲中提煉出來(lái),而神經(jīng)網(wǎng)絡(luò)卻具備了很好的非線性映射能力,正是利用網(wǎng)絡(luò)非線性映射能力這一特點(diǎn),可以對(duì)低信噪比下的帶噪信號(hào)進(jìn)行增強(qiáng)處理。
圖 1 原始語(yǔ)音信號(hào)波形圖和帶噪信號(hào)的波形圖
圖2 使用BP和PSO-BP網(wǎng)絡(luò)對(duì)帶噪語(yǔ)音的處理結(jié)果
圖2是使用BP網(wǎng)絡(luò)和改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)對(duì)同一段帶噪語(yǔ)音的處理結(jié)果。在處理效果上,與BP網(wǎng)絡(luò)相比,帶噪語(yǔ)音經(jīng)改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)處理后,其噪聲成分有了更大衰減。在主觀聽(tīng)覺(jué)上,使用改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)算法處理后的語(yǔ)音中仍然有較大噪聲存在,但與BP網(wǎng)絡(luò)的處理結(jié)果相比,原始語(yǔ)音可以聽(tīng)得更清楚。
3.1 實(shí)錄環(huán)境
錄音環(huán)境為一報(bào)告廳,可容納300人,錄音時(shí)的噪聲有腳步聲,拿東西和放東西聲,竊竊私語(yǔ)聲,翻動(dòng)紙張聲等,即報(bào)告廳常見(jiàn)噪聲。錄音軟件采用Windows系統(tǒng)自帶的錄音機(jī)軟件,量化為16位,采樣頻率為11025。
3.2 仿真結(jié)果分析
實(shí)錄語(yǔ)音段的內(nèi)容為:“過(guò)程控制系統(tǒng)是實(shí)現(xiàn)生產(chǎn)過(guò)程自動(dòng)化的平臺(tái),而過(guò)程控制儀表與裝置是過(guò)程控制系統(tǒng)不可缺少的重要組成部分。”使用改進(jìn)PSO-BP網(wǎng)絡(luò)對(duì)上述帶噪語(yǔ)音段進(jìn)行增強(qiáng)處理,在未進(jìn)行增強(qiáng)處理時(shí),語(yǔ)音信號(hào)被淹沒(méi)在噪聲里,主觀聽(tīng)覺(jué)上,語(yǔ)音段內(nèi)容幾乎聽(tīng)不到。經(jīng)語(yǔ)音方法增強(qiáng)后有所改觀,但是譜減法的語(yǔ)音增強(qiáng)處理結(jié)果和小波分層閾值法語(yǔ)音增強(qiáng)處理結(jié)果,效果并不是太明顯,平均意見(jiàn)得分也僅在1.5左右。但是經(jīng)過(guò)PSO-BP網(wǎng)絡(luò)處理后,語(yǔ)音的內(nèi)容已經(jīng)基本上能聽(tīng)清楚,語(yǔ)音的質(zhì)量和可懂度也得到了提高,平均意見(jiàn)得分為2.2。
分別使用譜減法、小波分層閾值法、BP網(wǎng)絡(luò)、改進(jìn)PSO-BP方法對(duì)同一段信噪比為-9.66dB的帶噪語(yǔ)音信號(hào)進(jìn)行增強(qiáng)處理的性能比較如表1所示。
表 1 不同方法的性能
本文提出了改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)算法,并分別用譜減法、小波分層閾值法、BP網(wǎng)絡(luò)、改進(jìn)PSO-BP對(duì)語(yǔ)音信號(hào)進(jìn)行了仿真處理。仿真結(jié)果表明,使用PSO-BP神經(jīng)網(wǎng)絡(luò)對(duì)帶噪語(yǔ)音進(jìn)行增強(qiáng)處理,可以大幅提高信噪比,效果明顯。
圖 3 極端噪聲環(huán)境下不同方法的處理結(jié)果
[1]張雄偉,陳亮,楊吉斌.現(xiàn)代語(yǔ)音處理技術(shù)及應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2003.
[2]靳志強(qiáng),萬(wàn)紅.小波分層閾值處理在語(yǔ)音增強(qiáng)中的應(yīng)用[J],煤炭技術(shù),2010:54-56.
[3]李季,孫秀霞,李士波,等.基于遺傳交叉因子的改進(jìn)粒子群優(yōu)化算法[J].計(jì)算機(jī)工程,2008,34(2):181~183.
[4]韓瑞通,王書(shū)明,黃理善,等.交叉粒子群算法在大地電磁反演中的應(yīng)用[J].工程地球物理學(xué)報(bào).2009,6(2):223~228.
[5]Adam Borowicz,Alexandr Petrovsky.Signal subspace ap?proach for psy-choacoustically motivated speech enhancement[J]. Speech Communicat-ion.2010(2).
[6]阮兆文.基于聲學(xué)模型和小波變換的語(yǔ)音增強(qiáng)方法研究[D].合肥:中國(guó)科技大學(xué),2009.
[7]李如瑋,鮑長(zhǎng)春,竇慧晶.基于小波變換的語(yǔ)音增強(qiáng)算法綜述[J].數(shù)據(jù)采集與處理.2009(03).
[8]Stephen So,Kuldip K.Paliwal.Modulationdomain Kal?man filtering for single-channel speech enhan-cement[J]. Speech Communication.2011(6).
TN912
A
1671-0037(2014)04-60-1.7