任永梅
【摘 要】為了進(jìn)一步減少傳統(tǒng)子空間語(yǔ)音增強(qiáng)方法增強(qiáng)的語(yǔ)音中的殘留噪聲,提出一種改進(jìn)的子空間語(yǔ)音增強(qiáng)算法。新算法首先對(duì)帶噪語(yǔ)音進(jìn)行KL(Karhunen-Loeve Transform)變換,得到帶噪語(yǔ)音的特征值;接著用遞歸最小二乘算法(RLS)估計(jì)出噪聲特征值,對(duì)傳統(tǒng)子空間算法容易引起的特征值估計(jì)偏差問(wèn)題進(jìn)行修正;最后用帶噪語(yǔ)音特征值減去RLS方法估計(jì)出的噪聲特征值并由KL逆變換還原出純凈語(yǔ)音。仿真結(jié)果表明,在高斯白噪聲背景下,與傳統(tǒng)子空間語(yǔ)音增強(qiáng)算法相比,新算法提高了增強(qiáng)語(yǔ)音的信噪比,減少了語(yǔ)音失真。
【關(guān)鍵詞】語(yǔ)音增強(qiáng);子空間;遞歸最小二乘算法;SNR
New Improved Subspace Method of Speech Enhancement
REN Yong-mei1,2
(1.School of Electrical and Information Engineering, Hunan Institute of Technology, Hengyang Hunan 421002, China;
2.Key Laboratory of Signal & Information Processing, Hunan Institute of Technology, Hengyang Hunan 421002, China)
【Abstract】In order to reduce the residual noise in enhanced speech that by using the traditional subspace speech enhancement method,this paper proposed the new improved subspace method of speech enhancement. The new algorithm firstly does Karhunen Loeve Transform to noisy speech and gets its eigenvalues, then it uses the Recursive least squares algorithm (RLS) to estimate noise characteristic value, which fixes the problem that the traditional subspace speech enhancement algorithm causes speech feature value estimation deviation; finally it uses the noisy speech eigenvalues to minus the noise characteristic value and the clean speech is gained by KL reverse transformation. Simulation experimental results show that comparing with subspace speech enhancement method, the new proposed algorithm improves the signal-to-noise ratio(SNR) of the enhanced speech and reduces the distortion of the speech in white Gaussian noise background.
【Key words】Speech enhancement; Subspace; RLS; SNR
0 引言
語(yǔ)音增強(qiáng)技術(shù)是語(yǔ)音信號(hào)處理技術(shù)中的一個(gè)重要分支,它可以有效去除數(shù)字通信系統(tǒng)中的噪聲,因此,人們?cè)絹?lái)越重視語(yǔ)音增強(qiáng)在語(yǔ)音處理方面的作用。近年來(lái),子空間方法在語(yǔ)音增強(qiáng)研究中已有了較大發(fā)展[1-2]。該方法的基本思想是將帶噪語(yǔ)音信號(hào)映射到疊加噪聲的信號(hào)子空間與噪聲子空間中,再將噪聲子空間消除掉,在疊加噪聲的信號(hào)子空間中估計(jì)原始信號(hào)[3-4]。傳統(tǒng)的子空間算法不能濾除整個(gè)噪聲子空間,所以在估計(jì)語(yǔ)音特征值時(shí)很容易引起偏差,致使增強(qiáng)的語(yǔ)音信號(hào)中有失真,因此本文提出一種改進(jìn)的子空間語(yǔ)音增強(qiáng)算法。新算法先對(duì)帶噪語(yǔ)音做KL變換并計(jì)算其特征值;接著利用RLS方法估計(jì)出噪聲特征值,以修正傳統(tǒng)方法中僅用無(wú)聲段的方差平均值來(lái)估計(jì)噪聲特征值;最后用帶噪語(yǔ)音特征值減去估計(jì)出的噪聲特征值,并做KL逆變換以得到增強(qiáng)語(yǔ)音。實(shí)驗(yàn)結(jié)果表明新算法在高斯白噪聲背景下能夠更好地去除噪聲,減少了語(yǔ)音失真。
1 改進(jìn)的子空間語(yǔ)音增強(qiáng)算法
1.1 遞歸最小二乘算法的原理
遞歸最小二乘算法(RLS)是自適應(yīng)濾波器[5]中通常采用的一種自適應(yīng)方法,其本質(zhì)是一種有限長(zhǎng)單位脈沖響應(yīng)維納濾波器的時(shí)間遞推算法,并嚴(yán)格以最小二乘法準(zhǔn)則為依據(jù)[6]。自適應(yīng)濾波器的原理圖如圖1所示。
結(jié)合圖1,對(duì)RLS算法的具體原理描述如下:
④自適應(yīng)更新過(guò)程
1.2 改進(jìn)的子空間語(yǔ)音增強(qiáng)算法
傳統(tǒng)的子空間語(yǔ)音增強(qiáng)算法僅僅用無(wú)聲段(一般為前3000個(gè)采樣點(diǎn))的方差平均值估計(jì)噪聲特征值,會(huì)對(duì)語(yǔ)音特征值的估計(jì)出現(xiàn)偏差,引起語(yǔ)音失真。鑒于此,提出改進(jìn)的子空間語(yǔ)音增強(qiáng)算法,其流程圖如圖2所示。由圖2可知新算法步驟如下:
①對(duì)輸入的噪聲語(yǔ)音做KL變換,得出其在子空間域的特征值?撰Y和特征向量;
②通過(guò)RLS遞歸更新方法估計(jì)出噪聲并計(jì)算其特征值?撰N,實(shí)現(xiàn)對(duì)傳統(tǒng)方法中的噪聲特征值的修正,達(dá)到減少語(yǔ)音失真的目的。
③計(jì)算純凈語(yǔ)音的特征值?撰S,即用?撰Y減去?撰N;
④由KL逆變換得到增強(qiáng)語(yǔ)音。
圖2 改進(jìn)的子空間語(yǔ)音增強(qiáng)算法流程圖
2 仿真實(shí)驗(yàn)與分析
用MATLAB軟件對(duì)新算法進(jìn)行了仿真實(shí)驗(yàn),并和傳統(tǒng)子空間方法進(jìn)行了對(duì)比,驗(yàn)證了算法的有效性。在實(shí)驗(yàn)中,純凈語(yǔ)音資料為NOIZEUS語(yǔ)音庫(kù)中的英語(yǔ)男聲短句“The birch canoe slid on the smooth planks.”,噪聲來(lái)源于Noisex-92數(shù)據(jù)庫(kù)的高斯白噪聲,語(yǔ)音和噪聲的采樣率均為8kHz,依照實(shí)驗(yàn)結(jié)果最優(yōu)的原則,設(shè)置幀長(zhǎng)為40個(gè)采樣點(diǎn),幀移為一半。圖3是信噪比為5dB的高斯白噪聲背景下兩種算法得到的增強(qiáng)語(yǔ)音的時(shí)域波形圖。
圖3 高斯白噪聲背景下兩種算法增強(qiáng)語(yǔ)音時(shí)域波形圖
從圖3可以看出,傳統(tǒng)子空間語(yǔ)音增強(qiáng)方法增強(qiáng)的語(yǔ)音仍有很多殘留噪聲;而新算法增強(qiáng)的語(yǔ)音的時(shí)域波形圖最接近于原始語(yǔ)音的時(shí)域波形圖,減少了語(yǔ)音失真。
本文采用信噪比來(lái)測(cè)評(píng)增強(qiáng)后的語(yǔ)音性能,仿真結(jié)果如表1。
表1 兩種算法增強(qiáng)的語(yǔ)音的信噪比/dB
從表1可看出,在輸入信噪比相同的情況下,新算法增強(qiáng)語(yǔ)音的信噪比值要比傳統(tǒng)算法增強(qiáng)語(yǔ)音的信噪比值高,尤其在0dB和5dB時(shí)提高的幅度更大,在15dB時(shí),信噪比值稍微有降低,但這并不影響該算法的整體優(yōu)越性。
3 結(jié)束語(yǔ)
本文提出的改進(jìn)的子空間語(yǔ)音增強(qiáng)算法,利用RLS方法對(duì)傳統(tǒng)子空間語(yǔ)音增強(qiáng)算法中的噪聲特征值作了修正,進(jìn)一步改善了傳統(tǒng)子空間語(yǔ)音增強(qiáng)算法的增強(qiáng)效果;實(shí)驗(yàn)結(jié)果表明,新算法可以更多的抑制噪聲,減少語(yǔ)音失真。
【參考文獻(xiàn)】
[1]Ephraim Y, Van Trees H L.A signal subspace approach for speech enhancement[J]. IEEE Trans Speech and Audio Process-ing, 1995,3(4):251-266.
[2]吳北平,李輝,戴蓓倩,等.基于子空間域噪聲特征值估計(jì)的語(yǔ)音增強(qiáng)方法[J].信號(hào)處理,2009,25(3):460-463.
[3]牛銅.基于子空間的語(yǔ)音增強(qiáng)算法研究[D].鄭州:解放軍信息工程大學(xué),2009.
[4]曹玉萍.基于信號(hào)子空間的語(yǔ)音增強(qiáng)方法[J].電子測(cè)試,2012(6):54-57.
[5]肖哲.基于Matlab的RLS自適應(yīng)語(yǔ)音噪聲對(duì)消系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].長(zhǎng)沙大學(xué)學(xué)報(bào),2006,20(2):83-86.
[6]羅文超,張友純.在MATLAB中采用RLS算法實(shí)現(xiàn)FIR自適應(yīng)濾波器[J].軟件導(dǎo)刊,2008,7(1):107-108.
[責(zé)任編輯:湯靜]