馬 誠,李云紅,陳錦妮
(西安工程大學(xué) 電子信息學(xué)院 西安 710048)
信源數(shù)目估計(jì)是盲信號(hào)分離算法應(yīng)用的前提,也是一個(gè)技術(shù)難點(diǎn)[1-2]。盲信號(hào)分離[3-6]也一直是信號(hào)處理領(lǐng)域的研究熱點(diǎn),其可以根據(jù)混合信號(hào)和源信號(hào)的維數(shù)分為欠定[7]、適定[8]、超定[9]三種情況。目前,大多數(shù)盲信號(hào)分離算法屬于適定盲分離[10-11],即源信號(hào)維數(shù)與混合信號(hào)維數(shù)相等,然而在實(shí)際應(yīng)用中,源信號(hào)維數(shù)往往未知且處于動(dòng)態(tài)變化中,并且信號(hào)在傳播過程中易受噪聲的干擾,因此,信源數(shù)目準(zhǔn)確估計(jì)的難度大幅度提高,并直接影響盲信號(hào)分離效果。
隨著盲信號(hào)分離算法的發(fā)展,出現(xiàn)了一些性能較好的盲信號(hào)分離算法。主分量分析[12]作為其中分離性能較好的方法之一,其假定信號(hào)服從高斯分布,只考慮信號(hào)的二階統(tǒng)計(jì)特性,而無法描述信號(hào)的概率分布特性。非線性主分量分析[13](Nonlinear Principle Component Analysis)方法通過在算法中添加非線性函數(shù),使得變換后的信號(hào)服從高斯分布,因而算法實(shí)質(zhì)上考慮了信號(hào)的高階統(tǒng)計(jì)特性。核主分量分析方法的提出,進(jìn)一步拓展了其應(yīng)用范圍。
目前,盲信號(hào)分離主要面臨兩個(gè)主要難題:一是傳感器接收到的信號(hào)會(huì)受到信道噪聲的影響;二是混合信號(hào)的維數(shù)不一定和源信號(hào)的維數(shù)相等。這就使得信道噪聲去除和源信號(hào)維數(shù)估計(jì)顯得尤為重要。因此,針對(duì)上述問題,本文提出基于信源數(shù)目估計(jì)的超定盲源信號(hào)分離方法,能有效去除信道中的噪聲,并對(duì)源信號(hào)維數(shù)準(zhǔn)確估計(jì),實(shí)現(xiàn)盲信號(hào)的準(zhǔn)確分離。
含信道噪聲的盲信號(hào)分離的數(shù)學(xué)模型如下:
X(m×N)=A(m×n)·S(n×N)+ξ(m×N)。
(1)
式中:S=[s1,s2,…,sn]T為n維源信號(hào),A是m×n維混合矩陣,ξ表示信道噪聲,N代表信號(hào)樣本個(gè)數(shù),X=[x1,x2,…,xn]T表示傳感器觀測的m維數(shù)據(jù)向量即混合信號(hào)。
白化是有效的盲源分離預(yù)處理方法。白化不僅可以消除原數(shù)據(jù)之間的相關(guān)性,而且一定程度上可以抑制噪聲。
當(dāng)樣本個(gè)數(shù)N足夠大時(shí),并且假定源信號(hào)S已經(jīng)經(jīng)過單位化處理,根據(jù)中心極限定理觀測信號(hào)的協(xié)方差矩陣Σ可以表示為
Σ=AAT+ψ。
(2)
式中:Σ=XXT/N,噪聲協(xié)方差矩陣ψ=ξξT/N是對(duì)角矩陣。
標(biāo)準(zhǔn)主分量分析算法用于預(yù)白化處理,當(dāng)公式(1)的噪聲為零時(shí)或者信噪比非常高時(shí)C-AAT應(yīng)該趨近于零。根據(jù)主分量分析思想,可將AAT進(jìn)行特征值分解,如公式(3)所示:
(3)
式中:Λn表示由矩陣C的前n個(gè)最大的特征值組成的對(duì)角矩陣,Un是其對(duì)應(yīng)的特征向量。則有
(4)
令
z=Λn-1/2UnTX,
(5)
則有E(zzT)=In,代表z各個(gè)分量之間相互正交,即各維信號(hào)之間不相關(guān)。
對(duì)于包含信道噪聲的數(shù)據(jù),特別是當(dāng)信噪比較低時(shí),公式(2)中的噪聲協(xié)方差矩陣ψ無法忽略,上述方法無法直接應(yīng)用。
采用類似于標(biāo)準(zhǔn)主分量分析方法,由公式(2)可發(fā)現(xiàn),C-ψ應(yīng)該與AAT相等。式(2)中假定噪聲協(xié)方差矩陣ψ是已知的,然而實(shí)際上噪聲協(xié)方差矩陣ψ未知,因此必須估計(jì)噪聲協(xié)方差矩陣。建立如下的評(píng)價(jià)函數(shù):
J(A,ψ)=tr[AAT-(C-ψ)][AAT-(C-ψ)]T。
(6)
很顯然,評(píng)價(jià)函數(shù)越小,C-ψ應(yīng)該與AAT越接近。評(píng)價(jià)函數(shù)的微分為
(7)
則可得到
(8)
設(shè)x=Af+ε,其協(xié)方差矩陣具有結(jié)構(gòu)Σ=AAT+ψ。這里A是n×m階矩陣,rank(A)=m,則A和ψ的極大似然估計(jì)滿足下面的方程組:
(9)
式中:矩陣S滿足
(10)
公式(9)方程組的解并不唯一,并且迭代法求解方程組時(shí)算法也有可能不收斂。Joreskog提出了一種求解方法,同時(shí)滿足解的唯一性條件和算法的收斂性要求。
假設(shè)A和ψ滿足唯一性條件ATψ-1A=Δ,則A和ψ的極大似然估計(jì)滿足
(11)
而且tr[(AAT+ψ)S-1]=n。通過公式(11)可得到ψ的估計(jì)。
(12)
則變換完后新的數(shù)據(jù)為
z=Qx。
(13)
交叉驗(yàn)證法(Cross-validation)是多變量統(tǒng)計(jì)技術(shù)常用的一種方法,其基本思想是,一組數(shù)據(jù)用來提取特征,另一組數(shù)據(jù)來對(duì)數(shù)據(jù)進(jìn)行驗(yàn)證。本文也將采用該方法對(duì)源信號(hào)的維數(shù)進(jìn)行估計(jì)。
(14)
根據(jù)上述描述方法,用于噪聲去除和源信號(hào)估計(jì)的方法的簡要步驟如下:
Step1 根據(jù)信號(hào)X計(jì)算其協(xié)方差矩陣C,并設(shè)置噪聲協(xié)方差矩陣ψ的初始值。
Step5 重復(fù)Step 3和Step 4,直至估計(jì)值收斂。
為了驗(yàn)證本文方法的性能,選擇盲信號(hào)分離中常用的信噪比作為評(píng)價(jià)指標(biāo),其計(jì)算方式如式(15)所示:
(15)
圖1是由Matlab的系統(tǒng)函數(shù)生成的正弦波信號(hào),周期分別為20 s和80 s,采樣點(diǎn)數(shù)為1 000,歸一化峭度分別為-1.297和-1.521。
圖1 源信號(hào)
圖2是線性混合后的信號(hào)?;旌暇仃嘇服從區(qū)間[0,1]上均勻分布的6×2隨機(jī)矩陣,并在信道中添加高斯噪聲,信噪比為-10 dB。從圖2可看出,經(jīng)過線性混合之后,由于包含較強(qiáng)的高斯白噪聲,源信號(hào)已經(jīng)淹沒在噪聲信號(hào)中,無法看出原始信號(hào)。
圖2 線性混合信號(hào)
圖3 源信號(hào)維數(shù)估計(jì)
圖4是針對(duì)輕拖尾與輕拖尾混合信號(hào)采用擴(kuò)展最大熵、Kernel ICA與高斯混合模型三種盲信號(hào)分離算法的信號(hào)分離結(jié)果。圖4(a)為擴(kuò)展最大熵的信號(hào)分離效果,圖4(b)為Kernel ICA的信號(hào)分離效果,圖4(c)是經(jīng)過數(shù)據(jù)預(yù)處理后采用基于高斯混合模型盲信號(hào)分離算法的分離結(jié)果。通過對(duì)比可看出,經(jīng)過預(yù)處理后,可以很好地分離信號(hào),并且分離信號(hào)與源信號(hào)較為接近。
(a)擴(kuò)展最大熵分離信號(hào)
表1為三種方法的分離性能、運(yùn)算時(shí)間的對(duì)比。從表中可知,高斯混合模型盲信號(hào)分離方法的信噪比最高,說明該方法的分離效果最好;同時(shí),該方法運(yùn)算時(shí)間也較少。
表1 三種方法分離輕拖尾與輕拖尾信號(hào)實(shí)驗(yàn)結(jié)果
圖5是兩個(gè)正弦波信號(hào)和一段真實(shí)語音信號(hào),三個(gè)源信號(hào)的歸一化峭度分別為0.373 9、-1.297和-1.521,樣本點(diǎn)個(gè)數(shù)為1 000個(gè)。
圖5 源信號(hào)
圖6是線性混合后的信號(hào),混合矩陣A為服從區(qū)間[0,1]上均勻分布的6×3隨機(jī)矩陣,并在信道中添加高斯噪聲,信噪比為-12 dB。從圖中可看出,經(jīng)過混合之后,各維信號(hào)混合較為明顯,已經(jīng)無法看出原始信號(hào)。
圖6 線性混合信號(hào)
圖7是采用本文預(yù)處理方法對(duì)源信號(hào)維數(shù)進(jìn)行估計(jì)的結(jié)果,橫坐標(biāo)為源信號(hào)數(shù)目的估計(jì)值,范圍為1~6。從圖中可以看出,當(dāng)估計(jì)的維數(shù)為3時(shí)誤差值最小,也就是源信號(hào)的維數(shù)為3,這與真實(shí)信號(hào)數(shù)目是一致的。
圖7 源信號(hào)維數(shù)估計(jì)
圖8是針對(duì)重拖尾與輕拖尾混合信號(hào)采用擴(kuò)展最大熵、Kernel ICA與高斯混合模型三種盲信號(hào)分離算法的信號(hào)分離結(jié)果。圖8(a)為擴(kuò)展最大熵對(duì)重拖尾與輕拖尾混合信號(hào)的分離效果,圖8(b)為Kernel ICA的分離結(jié)果,圖8(c)是經(jīng)過數(shù)據(jù)預(yù)處理后采用基于高斯混合模型盲信號(hào)分離算法的分離結(jié)果。從圖中可看出,采用基于高斯混合模型盲信號(hào)分離算法經(jīng)過預(yù)處理后可以很好地分離信號(hào),并且分離信號(hào)與源信號(hào)較為接近,該方法還可以有效地恢復(fù)出源信號(hào)。
(a)擴(kuò)展最大熵分離信號(hào)
表2為三種方法的實(shí)驗(yàn)對(duì)比結(jié)果。從運(yùn)算時(shí)間和恢復(fù)效果來看,本文方法能在相對(duì)較短的時(shí)間內(nèi)對(duì)信號(hào)進(jìn)行有效恢復(fù)。
表2 三種方法對(duì)比實(shí)驗(yàn)性能
從兩組實(shí)驗(yàn)的仿真結(jié)果可得出,對(duì)于多種類型的混合信號(hào),本文提出的噪聲去除和源信號(hào)維數(shù)估計(jì)方法能對(duì)源信號(hào)維數(shù)準(zhǔn)確估計(jì),根據(jù)估計(jì)結(jié)果可對(duì)盲信號(hào)準(zhǔn)確分離。
本文提出了一種用于信道噪聲去除和源信號(hào)維數(shù)估計(jì)的數(shù)據(jù)預(yù)處理方法。采用本文算法對(duì)含噪聲的輕拖尾與輕拖尾、重拖尾與輕拖尾兩組混合信號(hào)的源信號(hào)個(gè)數(shù)進(jìn)行估計(jì),仿真結(jié)果表明,該算法能去除信道中的噪聲并準(zhǔn)確估計(jì)盲源個(gè)數(shù),平均信噪比增加了2.4 dB,平均運(yùn)行時(shí)間提高了近50%。但是,該方法主要適合于服從高斯分布的噪聲,對(duì)于其他分布類型噪聲去除效果并不理想,這一點(diǎn)還有待進(jìn)一步改進(jìn)。