劉柏森,蘇凌峰,葉樹(shù)江
(1.黑龍江工程學(xué)院 電氣與信息工程學(xué)院,黑龍江 哈爾濱150050,2.中船重工第七研究院,北京100192)
為了在強(qiáng)噪聲環(huán)境下,從含噪語(yǔ)音信號(hào)中獲得盡可能純凈的語(yǔ)音信號(hào),提高語(yǔ)音處理系統(tǒng)的穩(wěn)定性,降低噪聲對(duì)系統(tǒng)的影響,目前切實(shí)可行的辦法就是對(duì)信號(hào)進(jìn)行語(yǔ)音增強(qiáng),來(lái)減少噪音對(duì)系統(tǒng)的干擾[1]。語(yǔ)音增強(qiáng)可以提高語(yǔ)音處理系統(tǒng)的抗噪聲能力和輸入信號(hào)的信噪比,它是語(yǔ)音信號(hào)處理與識(shí)別系統(tǒng)的重要組成部分,而且在解決噪聲干擾、改進(jìn)帶噪語(yǔ)音信號(hào)的質(zhì)量、提高語(yǔ)音的可懂度等方面發(fā)揮著非常重要的作用。因此,尋求一種有效的語(yǔ)音增強(qiáng)算法對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行處理具有重要的研究?jī)r(jià)值。
采用極值域均值模式分解算法[2]進(jìn)行語(yǔ)音增強(qiáng)處理是一種很有效的方法。如果信號(hào)間的能量和頻率比例過(guò)大,極值域均值模式分解算法不能分解出正確的單一分量,會(huì)使噪聲能量的集中性變差,出現(xiàn)多個(gè)固有模態(tài)分量都與噪聲有一定的最大相似度,噪聲能量分散使得濾波處理時(shí)可能出現(xiàn)過(guò)濾波情況。因此,提出一種極值域均值模式分解與獨(dú)立分量分析相結(jié)合的增強(qiáng)算法。該算法不僅可以利用極值域均值的自適應(yīng)分解及分解后信號(hào)的窄帶特性,構(gòu)建欠定盲源情況的虛擬通道,解決欠定盲源情況。還可以通過(guò)對(duì)各固有模態(tài)分量進(jìn)行獨(dú)立分量分析,構(gòu)造與噪聲更相近的另一路噪聲,使得處理后得到的部分獨(dú)立分量具有更大的噪聲最大相似度,更有利于噪聲的濾除,從而提高復(fù)雜環(huán)境下低信噪比語(yǔ)音信號(hào)的增強(qiáng)效果。該方法對(duì)于高斯噪聲尤其有效,中心極限定理指出:在自然界與生產(chǎn)中,一切現(xiàn)象受到許多相互獨(dú)立的隨機(jī)因素的影響,如果每個(gè)因素所產(chǎn)生的影響都很微小時(shí),總的影響可以看作是服從正態(tài)分布,所以提高高斯噪聲干擾下的低信噪比語(yǔ)音信號(hào)信噪比有著重要的意義。
獨(dú)立分量分析(Independent Component Analysis,ICA)是一種較為有效的盲源分離算法,它廣泛應(yīng)用于語(yǔ)音信號(hào)處理、信號(hào)分析、通信、陣列信號(hào)處理、生物醫(yī)學(xué)信號(hào)處理及過(guò)程控制的信號(hào)去噪和特征提取等領(lǐng)域,還可以用于數(shù)據(jù)挖掘。基本的獨(dú)立分量分析是指從多個(gè)源信號(hào)的線(xiàn)性混合信號(hào)中分離出源信號(hào)的技術(shù)。除了已知源信號(hào)是統(tǒng)計(jì)獨(dú)立外,無(wú)其他先驗(yàn)知識(shí)。但是獨(dú)立分量分析的主要假設(shè)條件是:觀測(cè)信號(hào)的數(shù)目一定要大于等于源信號(hào)數(shù)目,這種情況稱(chēng)之為非欠定情況。一方面這種假設(shè)與分離的“盲”性是沖突的;另一方面,在許多實(shí)際問(wèn)題中,如語(yǔ)音傳輸、識(shí)別等情況下,都屬于欠定盲源情況。
1.1.1 獨(dú)立分量分析基本問(wèn)題
設(shè)A是一個(gè)M×N維矩陣,一般稱(chēng)為混合矩陣(Mixing Matrix)。設(shè)有N 個(gè)未知的源信號(hào)si(t),i=1~N,構(gòu)成一個(gè)列向量S(t)=[s1(t),s2(t),…,sN(t)]T,其中t是離散時(shí)間點(diǎn),取值為0,1,2,…。設(shè)x(t)=[x1(t),x2(t),…,xM(t)]T是由 M 個(gè)可觀測(cè)信號(hào)xi(t)構(gòu)成的列向量,這里i=1~M,且滿(mǎn)足方程[3-5]:
對(duì)任何時(shí)刻t,在A未知的條件下,根據(jù)已知的x(t)求未知的S(t),這就是BSS命題。這樣就構(gòu)成了一個(gè)無(wú)噪聲的盲信號(hào)分離問(wèn)題。由于不能直接觀察到分量si(t),所以式(1)中的As(t)是一種統(tǒng)計(jì)“隱藏變量”模型,si(t)是隱藏的變量。
獨(dú)立分量分析就是按照以下基本假設(shè)條件來(lái)解決BSS問(wèn)題。這些基本假設(shè)條件是[6]:
1)各源信號(hào)之間統(tǒng)計(jì)獨(dú)立,si(t)均為0均值、實(shí)隨機(jī)變量;
2)源信號(hào)中至多只能有一個(gè)信號(hào)源是高斯型信源;
3)觀測(cè)信號(hào)數(shù)N不小于源信號(hào)數(shù)M,即N≤M,這時(shí)混合矩陣A是一個(gè)確定且未知的N×N維方陣;
4)關(guān)于各源信號(hào)的概率密度略有一些先驗(yàn)知識(shí);
5)各觀測(cè)器噪聲很小,可以忽略不計(jì)。用式(1)描述源信號(hào)與觀測(cè)信號(hào)之間的關(guān)系。
1.1.2 獨(dú)立分量分析主要思路
設(shè)置一個(gè)N×N維反混合矩陣B,x(t)經(jīng)過(guò)B變換后得到N 維列向量輸出y(t)=[y1(t),y2(t),…,yN(t)],這是ICA的思路,即
通過(guò)學(xué)習(xí),如果可以實(shí)現(xiàn)BA=I(I是N×N維單位陣),則y(t)=s(t),從而源信號(hào)分離的目標(biāo)得以實(shí)現(xiàn)。這一學(xué)習(xí)只能是自組織的,因?yàn)闆](méi)有任何參照目標(biāo)。由于是自組織的,那么建立一個(gè)以B為變?cè)哪繕?biāo)函數(shù)J(B),如果某個(gè)^Β能使J(B)達(dá)到極大或極小值,該B即為所需的解,這是它的過(guò)程的第一步[7]。第二步即是用一種有效的算法求^Β,也稱(chēng)優(yōu)化算法[8]。
只有一路有效的觀測(cè)信號(hào),即一路低信噪比語(yǔ)音信號(hào),從理論上來(lái)說(shuō)是不能應(yīng)用獨(dú)立分量分析來(lái)處理的。為了得到足夠的觀測(cè)信號(hào),首先對(duì)已檢測(cè)的語(yǔ)音信號(hào)進(jìn)行極值域均值模式分解。得到一組固有模態(tài)分量和一個(gè)殘余分量,由于這組固有模態(tài)分量與信號(hào)源、噪聲源都存在一定的關(guān)系。故初步嘗試將該組固有模態(tài)分量作為觀測(cè)信號(hào)。為驗(yàn)證極值域均值模式分解得到的固有模態(tài)分量是否滿(mǎn)足獨(dú)立分量分析的假設(shè)條件,將這幾個(gè)固有模態(tài)分量進(jìn)行相關(guān)運(yùn)算,通過(guò)相關(guān)系數(shù)觀察其獨(dú)立性。
測(cè)試語(yǔ)音為“聲源1”,各模態(tài)分量的相關(guān)系數(shù)為CC(Correlation Coefficient),含噪語(yǔ)音信號(hào)(S1)與各固有模態(tài)分量之間的相關(guān)系數(shù)見(jiàn)表1。
表1 含噪語(yǔ)音信號(hào)與各固有模態(tài)分量的相關(guān)系數(shù)
而通過(guò)表1可以看到,含噪語(yǔ)音信號(hào)與各模態(tài)分量的相關(guān)系數(shù)有的較大,有的較小,它們的獨(dú)立性較弱。據(jù)此,可以推斷各固有模態(tài)分量滿(mǎn)足獨(dú)立分量分析的假設(shè)條件——各源信號(hào)之間統(tǒng)計(jì)獨(dú)立。
下面分析各固有模態(tài)分量與純凈語(yǔ)音信號(hào)(S0)和噪聲信號(hào)(Noise)與各固有模態(tài)分量的相關(guān)系數(shù)。通過(guò)表2可以看出,不是所有固有模態(tài)分量都與純凈語(yǔ)音信號(hào)相關(guān)系數(shù)很大,只有中間幾個(gè)相關(guān)系數(shù)較大。從表3可以看出,第一個(gè)和第二個(gè)固有模態(tài)分量與噪聲相關(guān)系數(shù)較大。如果對(duì)IMF1、IMF2、IMF3直接進(jìn)行濾波處理,雖然可以起到降低噪聲的目的,但同時(shí)也會(huì)誤處理語(yǔ)音信號(hào)。為了盡可能減少誤處理情況,進(jìn)一步集中噪聲能量,對(duì)某些固有模態(tài)分量進(jìn)行獨(dú)立分量分析。
表2 純凈語(yǔ)音信號(hào)與各固有模態(tài)分量的相關(guān)系數(shù)
表3 噪聲信號(hào)與各固有模態(tài)分量的相關(guān)系數(shù)
由于在處理實(shí)際信號(hào)時(shí),無(wú)法實(shí)現(xiàn)準(zhǔn)確地得到摻雜在語(yǔ)音段的噪聲信號(hào),所以在選取獨(dú)立分量的觀測(cè)量時(shí),還是要通過(guò)最大相似度進(jìn)行選取,即通過(guò)表4選取。
表4 噪聲信號(hào)與各固有模態(tài)分量的最大相似度
在選取固有模態(tài)分量時(shí),并不是將所有固有模態(tài)分量作為觀測(cè)量,因?yàn)殡m各固有模態(tài)分量都有可能存在噪聲分量,但通過(guò)最大相似度篩選出部分噪聲成分較多的固有模態(tài)分量作為觀測(cè)量,這里選擇前4個(gè)作為觀測(cè)量。這樣處理的另外一個(gè)好處是可以減少獨(dú)立分量分析的運(yùn)算量,有效防止無(wú)法收斂現(xiàn)象的發(fā)生。
通過(guò)表5可以看出,ICA1、ICA2與IMF1、IMF4的最大相似度差別不大,但I(xiàn)CA3的最大相似度顯著提高,ICA4的最大相似度顯著下降,這意味著有一個(gè)分量的噪聲能量顯著上升,一個(gè)顯著下降。在濾波過(guò)程中,可以對(duì)ICA4不作處理,這樣可以有效地保留語(yǔ)音信號(hào),對(duì)ICA1、ICA2、ICA3進(jìn)行時(shí)域?yàn)V波處理。由于獨(dú)立分量分析的結(jié)果具有幅值和位置的不確定性,而且對(duì)于語(yǔ)音增強(qiáng)而言,不能只觀察噪聲的變化規(guī)律,還要保證語(yǔ)音信號(hào)的重構(gòu),故這里對(duì)獨(dú)立分量分析的結(jié)果進(jìn)行逆變換,重構(gòu)固有模態(tài)分量,再利用重構(gòu)的固有模態(tài)分量和未處理的固有模態(tài)分量重構(gòu)語(yǔ)音信號(hào),即兩度重構(gòu)。
表5 獨(dú)立分量分析結(jié)果與噪聲的最大相似度
根據(jù)以上分析,制定基于極值域均值模式分解與獨(dú)立分量分析的語(yǔ)音增強(qiáng)步驟:
1)對(duì)檢測(cè)到的含噪語(yǔ)音信號(hào)進(jìn)行極值域均值模式分解;
2)設(shè)定閾值,選取部分固有模態(tài)分量作為獨(dú)立分量分析的觀測(cè)信號(hào);
3)對(duì)觀測(cè)信號(hào)進(jìn)行獨(dú)立分量分析(fastICA算法[9-10]);
4)對(duì)獨(dú)立分量分析的結(jié)果進(jìn)行最大相似度計(jì)算,篩選出需要處理的分量;
5)對(duì)篩選出的分量進(jìn)行時(shí)域閾值濾波;
6)對(duì)經(jīng)處理后的獨(dú)立分量分析結(jié)果進(jìn)行兩度重構(gòu),得到增強(qiáng)后信號(hào)。
在高斯噪聲環(huán)境下,基于極值域均值模式分解與獨(dú)立分量分析相結(jié)合的增強(qiáng)算法來(lái)進(jìn)行實(shí)驗(yàn),結(jié)果如圖1所示。
圖1 當(dāng)SNR=0dB時(shí)語(yǔ)音增強(qiáng)結(jié)果
通過(guò)圖1~圖3可以看出本文方法的有效性,再?gòu)目陀^評(píng)價(jià)的角度進(jìn)一步分析一下本文方法。通過(guò)表6可以看出,輸入信噪比為0dB情況下,經(jīng)本文方法增強(qiáng)處理后信噪比提高了近11dB,在輸入信噪比為-8dB情況下,提高了12dB。
表6 基于改進(jìn)的方法分析語(yǔ)音增強(qiáng)結(jié)果
圖4是基于極值域均值模式分解與獨(dú)立分量分析相結(jié)合的方法同基于極值域均值模式分解最大相似度語(yǔ)音增強(qiáng)方法、改進(jìn)小波算法的對(duì)比圖。橫坐標(biāo)是輸入信噪比,縱坐標(biāo)是增強(qiáng)后的輸出信噪比?!皁”代表本文提出的方法,“x”代表基于極值域均值模式分解最大相似度語(yǔ)音增強(qiáng)方法,“*”代表改進(jìn)小波的方法??梢钥闯霰疚奶岢龅姆椒ㄍㄟ^(guò)對(duì)固有模態(tài)進(jìn)行獨(dú)立分量分析后,提高了某些固有模態(tài)與噪聲的最大相關(guān)度,這十分有利于噪聲的濾除。通過(guò)實(shí)驗(yàn)結(jié)果證實(shí)了這一算法的效果,本文方法在增強(qiáng)結(jié)果上略?xún)?yōu)于基于極值域均值模式分解最大相似度語(yǔ)音增強(qiáng)方法,優(yōu)于改進(jìn)的小波算法。但是由于引入了獨(dú)立分量分析,故在計(jì)算速度上有所降低,而且獨(dú)立分量分析存在不收斂的風(fēng)險(xiǎn)。
圖4 高斯噪聲環(huán)境下3種增強(qiáng)方法
通過(guò)引入獨(dú)立分量分析算法,增加了極值域均值模式分解后部分模態(tài)分量的獨(dú)立性,構(gòu)造了與噪聲相似度更高的分量,從而克服了對(duì)固有模態(tài)分量的過(guò)濾波。在選取觀測(cè)量時(shí),通過(guò)最大相似度采用部分選取的方式,這樣即提高了效率,又降低了獨(dú)立分量分析有可能存在不收斂的風(fēng)險(xiǎn)。實(shí)驗(yàn)表明,該算法可以實(shí)現(xiàn)分解后噪聲能量比較分散情況下的低信噪比語(yǔ)音增強(qiáng),同時(shí)該算法還可以有效提高高斯噪聲等環(huán)境下的增強(qiáng)效果。
[1]Beritelli F.,Casale S.,Serrano S..Adaptive Robust speech processing based on acoustic noise estimation and classification.Proceedings of the Fifth IEEE International Symposium on Signal Processing and Information Technology[C].2005:773-777.
[2]S.D.Hawley,L.E.Atlas,H.J.Chizeck.Some Properties of an Empirical Mode Type Signal Decomposition Algorithm.IEEE Signal Processing Letters[C].2010,17(1):24-27.
[3]ChengM Y,Su K H,Wang S F.Contourerror reduction for free form contour following tasks of biaxial motion control system.Robotics and Computer Integrated Manufacturing[M].2009,25:323-333.
[4]Lee T W,Girolami M,Sejnowski T J.Independent component analysis using an extended infomax algorithm for mixed subgaussian and supergaussian sourees[J].Neural Computation,1999,11:417-441.
[5]劉據(jù),何振亞.利用高階累積量和獨(dú)立分量分析網(wǎng)絡(luò)進(jìn)行盲均衡與系統(tǒng)辨識(shí)[J].數(shù)據(jù)采集與處理,1998,13(3):201-205.
[6]P.Comon.Independent component analysis.Internat.Signal Processing workshop on High-order Statistics[M].Chamrousse,F(xiàn)ranee,1991(7):111-120.
[7]Du X,Li Y,Zhu Y,et al.Removal of artifacts from EEG signal.Sheng Wu Yi Xue Gong Cheng Xue Za Zhi[J].2008,25(2):464-467,471.
[8]Hyvarinen A and Oja E.A fast fixed-point algorithm for independent component analysis.Neural Computation[J].1997,9(7):1483-1492.