• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于麥克風(fēng)陣列的GCC時(shí)延估計(jì)算法分析①

      2019-12-20 02:31:56唐浩洋陳子為
      關(guān)鍵詞:麥克風(fēng)聲源時(shí)延

      唐浩洋,陳子為,黃 維

      (成都信息工程大學(xué) 電子工程學(xué)院,成都 610225)

      基于麥克風(fēng)陣列的聲源定位技術(shù)在人工智能、雷達(dá)探測(cè)、電話會(huì)議等多個(gè)領(lǐng)域有廣泛的應(yīng)用.根據(jù)Brandstein的分類方法[1],將基于麥克風(fēng)陣列的聲源定位技術(shù)分為3類:基于到達(dá)時(shí)間差的定位技術(shù)(TDOA)、基于最大輸出功率的可控波束形成技術(shù)和基于高分辨率譜估計(jì)的定位技術(shù).基于到達(dá)時(shí)間差的定位方法在定位準(zhǔn)確性上,優(yōu)于另外2種方法[2],并且由于其計(jì)算量相對(duì)較小、在實(shí)時(shí)系統(tǒng)中可以實(shí)現(xiàn)等原因,在聲源定位方面受到了更多的青睞,被廣泛使用.對(duì)于TDOA,獲得準(zhǔn)確的時(shí)延估計(jì)是聲源定位精確的前提條件.根據(jù)所采用的不同物理參量可將時(shí)延估計(jì)分為2類:1)基于廣義互相關(guān)函數(shù)(Generalized Cross Correlation,GCC)[3]的時(shí)延估計(jì)算法;2)基于自適應(yīng)最小均方(Least Mean Square,LMS)[4]的時(shí)延估計(jì)算法.在實(shí)際應(yīng)用中,由于噪聲的干擾和語(yǔ)音信號(hào)的短時(shí)處理,可能會(huì)使GCC時(shí)延估計(jì)算法出現(xiàn)較大的誤差,通常的做法是引入加權(quán)函數(shù)來(lái)抑制噪聲干擾.本文介紹了麥克風(fēng)陣列時(shí)延估計(jì)模型和廣義互相關(guān)時(shí)延估計(jì)算法以及一種改進(jìn)算法,并對(duì)這幾種加權(quán)方法進(jìn)行了Matlab仿真,通過(guò)比較各加權(quán)方法的時(shí)延估計(jì)效果以及聲源定位精度,分析其優(yōu)劣性.

      1 基于麥克風(fēng)陣列的聲源定位算法

      麥克風(fēng)陣列中,當(dāng)不同陣元接收同一聲源信號(hào)時(shí),由于信號(hào)傳輸距離的不同引起了時(shí)間上的差別.通過(guò)聲源信號(hào)到達(dá)各麥克風(fēng)的時(shí)間差(即時(shí)延)和聲音在媒質(zhì)中的傳播速度即可估計(jì)聲源的方向和位置,從而來(lái)實(shí)現(xiàn)聲源定位.在這個(gè)過(guò)程中準(zhǔn)確的時(shí)延估計(jì)是基于TDOA的聲源定位技術(shù)的前提.

      1.1 麥克風(fēng)陣列聲源定位模型

      麥克風(fēng)陣列是由麥克風(fēng)作為陣元按一定的方法排列組成的陣列.根據(jù)聲源離麥克風(fēng)的距離遠(yuǎn)近,可將聲源傳遞的波分為近場(chǎng)波和遠(yuǎn)場(chǎng)波.假設(shè)聲源距麥克風(fēng)陣列較遠(yuǎn),產(chǎn)生的是遠(yuǎn)場(chǎng)波.此時(shí)可以將遠(yuǎn)場(chǎng)波近似看作成平面波.此外,為了簡(jiǎn)化分析,將麥克風(fēng)陣列抽象為均勻線性陣列(Uniform Linear Array,ULA),該陣列由同一直線上距離相同間隔的多個(gè)麥克風(fēng)組成.構(gòu)建的麥克風(fēng)陣列模型如圖1所示[2].

      圖1 麥克風(fēng)陣列模型

      圖1中,d表示兩陣元的間距,一般通過(guò)測(cè)量得到,是已知值;φ表示聲源信號(hào)與麥克風(fēng)陣列法線的夾角.

      由圖1可知,對(duì)于兩個(gè)相鄰的陣元,語(yǔ)音信號(hào)在傳播過(guò)程中存在dsinφ的距離差,這也就使得兩相鄰陣元在接收信號(hào)時(shí)存在一個(gè)時(shí)間延遲,即:

      式中,c表示聲音的傳播速度,此處假設(shè)聲音在1個(gè)標(biāo)準(zhǔn)大氣壓和15 ℃的條件下傳播,即c=340 m/s.由式(1)可知,通過(guò)計(jì)算時(shí)間延遲即可估計(jì)聲源的方向和位置.

      1.2 基于互相關(guān)的時(shí)延估計(jì)算法

      在基于TDOA的聲源定位算法中,Knapp和Carter[3]提出的廣義互相關(guān)函數(shù)的時(shí)延估計(jì)算法是一種傳統(tǒng)的TDE算法.因?yàn)閬?lái)自同一聲源的信號(hào)必然存在一定的相關(guān)性,該算法根據(jù)這一特點(diǎn),通過(guò)計(jì)算不同陣元接收到的聲源信號(hào)之間相關(guān)函數(shù),利用數(shù)學(xué)中相關(guān)函數(shù)的性質(zhì),選取使互相關(guān)函數(shù)最大的時(shí)刻,即可估算出不同陣元間的時(shí)延差值.

      在一個(gè)麥克風(fēng)陣列系統(tǒng)中,任意選取陣列中的2個(gè)麥克風(fēng),假設(shè)這2個(gè)麥克風(fēng)接收到的信號(hào)分別為x(n)和y(n),則這兩路信號(hào)可表示為:

      其中,n表示接收到的數(shù)字信號(hào)的時(shí)間采樣點(diǎn);s(n)表示陣列接收到的有用信號(hào);和表示兩個(gè)陣元在接收時(shí)產(chǎn)生的加性噪聲,此處將噪聲假定為零均值平穩(wěn)噪聲且與有用信號(hào)s(n)相互獨(dú)立;和表示聲音在傳播過(guò)程中的衰減系數(shù),T表示兩個(gè)陣元接收到的有用信號(hào)之間的時(shí)延.

      對(duì)于兩個(gè)麥克風(fēng)陣元,其接收到的信號(hào)x(n)和y(n)的互相關(guān)函數(shù)可表示為:

      其中,E[·]為數(shù)學(xué)期望.假設(shè)有用信號(hào)s(n)和加性噪聲v(n)相互獨(dú)立,在無(wú)混響條件下,將式(2)和式(3)代入到式(4)中,可得:

      其中,Rss(τ-T)表示聲源的有用信號(hào)s(n)的自相關(guān)函數(shù);Rvxvy(τ)表示噪聲vx(n)和vv(n)的互相關(guān)函數(shù).

      由式(5)可得,若陣元接收到的信號(hào)的信噪比足夠的大,由相關(guān)函數(shù)的性質(zhì)可知,當(dāng) τ =T時(shí),Rss(τ-T)取得最大值.所以,求出當(dāng)Rxv(τ)取峰值時(shí)對(duì)應(yīng)的 τ就可得到了信號(hào)x(n)和y(n)之間的時(shí)延T,即進(jìn)行了時(shí)延估計(jì).

      2 廣義互相關(guān)時(shí)延估計(jì)算法

      2.1 GCC時(shí)延估計(jì)算法

      根據(jù)維納-辛欽定理[5,6],互相關(guān)函數(shù)及其互功率譜之間的關(guān)系可表示為:

      由于混響、噪聲和語(yǔ)音信號(hào)的短時(shí)處理,信號(hào)中可能會(huì)包含多個(gè)回波分量.在這種情況下,若采用基于互相關(guān)函數(shù)的時(shí)延估計(jì)算法計(jì)算得到的互相關(guān)函數(shù)是包含直達(dá)波與反射波共同形成的峰值,這些峰在低信噪比的情況中會(huì)降低時(shí)延估計(jì)的精度.此外,對(duì)于寬帶語(yǔ)音信號(hào),基音周期的存在使得互相關(guān)函數(shù)更加復(fù)雜[7].為了保證時(shí)延估計(jì)不受信號(hào)本身的影響,盡可能地抑制混響等影響,提高時(shí)延估計(jì)精度,需要對(duì)該算法進(jìn)行改進(jìn).常用的方法就是在信號(hào)的功率譜中進(jìn)行加權(quán),從而在時(shí)域中抑制噪聲干擾,銳化相關(guān)的信號(hào),使時(shí)延估計(jì)準(zhǔn)確.這種方法得到的互相關(guān)函數(shù)就是廣義互相關(guān)函數(shù),即[2]:

      其中,ψxy(ω)表示GCC的加權(quán)函數(shù).GCC的基本原理如圖2所示.

      圖2 GCC基本原理

      圖 2 中,(·)*表示取共軛運(yùn)算;|·|表示求模運(yùn)算.

      在實(shí)際應(yīng)用中,針對(duì)不同的噪聲情況可以選擇不同的加權(quán)函數(shù) ψxy(ω),來(lái)達(dá)到有效抑制噪聲的目的.將幾種常用的加權(quán)函數(shù)以表格的形式進(jìn)行歸納,如表1所示.

      表1 常用GCC加權(quán)函數(shù)及其特性

      2.2 GCC時(shí)延估計(jì)流程

      語(yǔ)音信號(hào)是明顯的非平穩(wěn)信號(hào),但在10~30 ms的時(shí)段上,語(yǔ)音信號(hào)是具有短時(shí)平穩(wěn)性的.因此,對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理[9]是至關(guān)重要的.選取幀長(zhǎng)度為256個(gè)點(diǎn),在8 KHz采樣頻率下,這樣大概是32 ms長(zhǎng)度的信號(hào).為消除每幀信號(hào)的邊緣效應(yīng),采用哈明窗(Hamming)對(duì)輸入信號(hào)加窗.時(shí)延估計(jì)算法流程如圖3所示.

      3 改進(jìn)的PHAT-GCC時(shí)延估計(jì)算法

      在眾多加權(quán)函數(shù)的廣義互相關(guān)時(shí)延估計(jì)算法中,PHAT-GCC能夠更好地抑制噪聲,使互相關(guān)函數(shù)得到更好的銳化效果,從而提高時(shí)延估計(jì)的精度.加之其算法復(fù)雜度低等優(yōu)點(diǎn),PHAT-GCC時(shí)延估計(jì)算法被廣泛地應(yīng)用于實(shí)際生活.然而,該算法仍存在一定的弊端,當(dāng)環(huán)境噪聲過(guò)大,出現(xiàn)混響,或者信噪比突變的時(shí)候,PHAT-GCC算法的性能也會(huì)急劇下降.基于此,本文提出了一種改進(jìn)的PHAT-GCC算法.

      圖3 時(shí)延估計(jì)算法流程圖

      3.1 語(yǔ)音信號(hào)預(yù)處理

      當(dāng)語(yǔ)音信號(hào)受到噪聲的干擾,其最明顯的影響就是語(yǔ)音信號(hào)的幅值會(huì)發(fā)生一定的變化.因?yàn)樵肼暰哂懈哳l率,低幅值的特點(diǎn),當(dāng)語(yǔ)音信號(hào)某時(shí)刻幅值較小,噪聲甚至?xí)蜎](méi)該時(shí)刻信號(hào).所以提出將接收到的語(yǔ)音信號(hào)乘上3次方,即x(n)轉(zhuǎn)化為x3(n).處理之后,原語(yǔ)音信號(hào)中幅值較大的信號(hào)更大,而幅值較低的更小,能夠有效地抑制噪聲.

      3.2 功率譜的噪聲削弱

      在實(shí)際情況下,尤其是在封閉環(huán)境中,噪聲會(huì)利用墻壁等實(shí)體反射,進(jìn)而導(dǎo)致兩個(gè)麥克風(fēng)陣元接收到的噪聲并非不相關(guān).因此,在PHAT-GCC算法中,需要把PHAT加權(quán)函數(shù)中的互功率譜減去相關(guān)噪聲的互功率譜.改進(jìn)后的加權(quán)函數(shù)為:

      其中,Gvxvy(ω)表示x(n)和y(n)兩傳感器接收到的噪聲的互功率譜.

      3.3 信噪比加權(quán)

      考慮到在實(shí)際情況中,整個(gè)頻域內(nèi)的信噪比不可能完全相同.也就是說(shuō),對(duì)于不同的 ω,信噪比SNR的值也可能不同.為了加強(qiáng)互相關(guān)函數(shù)的銳化效果,得到更為精確的時(shí)延估計(jì).對(duì)于信噪比較大的部分,應(yīng)賦予一個(gè)更大的權(quán)值,而當(dāng)信噪比較小時(shí),賦予較小的權(quán)值.因此,構(gòu)造一個(gè)新的加權(quán)函數(shù):

      其中,加權(quán)因子 ρ隨環(huán)境信噪比的變化而變化,其具體值需要多次通過(guò)實(shí)驗(yàn)測(cè)試優(yōu)化得到.

      3.4 相干函數(shù)的運(yùn)用

      在PHAT-GCC算法中,當(dāng)信號(hào)能量較小時(shí),加權(quán)函數(shù)的分母項(xiàng)趨于0,而加權(quán)函數(shù)整體趨于無(wú)窮大,從而會(huì)出現(xiàn)一個(gè)較大的誤差.通常的做法是添加一個(gè)非零因子 β來(lái)解決該問(wèn)題[10].此時(shí)的加權(quán)函數(shù)為:

      為了切合廣義互相關(guān)算法的思想,本文考慮采用相干函數(shù)的概念作為非零因子 β的選擇依據(jù).對(duì)于文中兩個(gè)麥克風(fēng)陣元所接收到的語(yǔ)音信號(hào),其功率譜的相干函數(shù)為:

      在實(shí)際的系統(tǒng)中,兩個(gè)麥克風(fēng)陣元接收到的信號(hào)不可能完全相干,也不可能完全無(wú)干,所以 γ2xy(ω)介于0~1之間,這種情況也符合環(huán)境噪聲對(duì)相干性的影響.用相干函數(shù) γ2xy(ω)來(lái)表征 β,保證了在信號(hào)能量較小時(shí)減小加權(quán)函數(shù)的誤差,也避免了 β取值過(guò)大而過(guò)多地影響PHAT加權(quán)函數(shù).

      綜上所述,最終改進(jìn)的PHAT-GCC加權(quán)函數(shù)為:

      4 仿真結(jié)果與分析

      為了比較分析不同加權(quán)函數(shù)的GCC時(shí)延估計(jì)和聲源定位的性能,本文模擬麥克風(fēng)陣元間距為d=0.1 m的麥克風(fēng)陣列接收語(yǔ)音信號(hào).所采集的語(yǔ)音信號(hào)時(shí)長(zhǎng)大約3 s,采樣頻率8 KHz,聲源方向角 φ =60°.該語(yǔ)音信號(hào)的波形圖如圖4所示.

      圖4 語(yǔ)音信號(hào)

      廣義互相關(guān)函數(shù)的峰值尖銳程度是時(shí)延估計(jì)準(zhǔn)確度的表征[2],峰值越尖銳,時(shí)延估計(jì)越準(zhǔn)確.在50 dB、20 dB和5 dB 3種信噪比情況下,選取CC、Roth、PHAT和改進(jìn)的PHAT 4種加權(quán)函數(shù)做廣義互相關(guān)MATLAB仿真.其中對(duì)于改進(jìn)的PHAT-GCC算法,語(yǔ)音信號(hào)的預(yù)處理如圖5所示.

      對(duì)于4種加權(quán)函數(shù)的GCC算法仿真結(jié)果如圖6~圖8所示.

      由圖1麥克風(fēng)陣列模型和式(1)可知,真正的時(shí)間延遲 τ是一個(gè)關(guān)于入射角 φ的函數(shù).因?yàn)?φ是從-90°到90°連續(xù)變化的物理量,這使得 τ也是一個(gè)連續(xù)變量.而麥克風(fēng)陣列中處理的是數(shù)字信號(hào),即時(shí)間是一個(gè)個(gè)離散點(diǎn).對(duì)于式(3)的參數(shù)T,由于x(n)和y(n)是數(shù)字信號(hào),所以T只能取整數(shù).因此,T實(shí)際上是時(shí)間延遲 τ的一個(gè)近似值.

      圖5 改進(jìn)的PHAT-GCC語(yǔ)音信號(hào)預(yù)處理

      將仿真得到的4種加權(quán)函數(shù)的GCC時(shí)延估計(jì)代入式(1),比較在不同信噪比下,聲源定位的準(zhǔn)確程度.所得到的數(shù)據(jù)均保留兩位小數(shù),結(jié)果如表2所示.

      表2 不同加權(quán)函數(shù)聲源定位結(jié)果

      圖6 信噪比50 dB時(shí),不同加權(quán)函數(shù)GCC的仿真結(jié)果

      圖7 信噪比20 dB時(shí),不同加權(quán)函數(shù)GCC的仿真結(jié)果

      圖8 信噪比5 dB時(shí),不同加權(quán)函數(shù)GCC的仿真結(jié)果

      根據(jù)仿真結(jié)果,在高信噪比情況下,4種加權(quán)函數(shù)得到的廣義互相關(guān)函數(shù)峰值均較尖銳,聲源定位精度也很高.但隨著信噪比降低,前3種加權(quán)方式的廣義互相關(guān)函數(shù)的峰值尖銳程度降低,同時(shí)干擾峰值隨之增多,有用信號(hào)相關(guān)函數(shù)的峰值也不夠明顯.這表明GCC算法的時(shí)延估計(jì)準(zhǔn)確性隨信噪比的降低而惡化,聲源定位精度也隨之驟降.特別地,對(duì)于Roth加權(quán),隨著信噪比的降低,性能急劇下降,峰值受噪聲影響嚴(yán)重,幾乎淹沒(méi)在噪聲中.對(duì)于PHAT加權(quán),在高信噪比條件下,峰值尖銳,噪聲波動(dòng)較小,被很好地抑制;在低信噪比條件下,相對(duì)于CC和Roth加權(quán),峰值更加尖銳,保持著良好的抗噪特性.此外,相較于一般的PHAT加權(quán),改進(jìn)后的PHAT加權(quán)法在低信噪比情況下性能明顯更優(yōu),峰值最為尖銳且噪聲能夠被更好地抑制掉,聲源定位的誤差也是最小的.綜合來(lái)看,改進(jìn)的PHAT加權(quán)的廣義互相關(guān)法表現(xiàn)出最優(yōu)的時(shí)延估計(jì)性能,而Roth加權(quán)的廣義互相關(guān)法表現(xiàn)出最劣的時(shí)延估計(jì)性能.

      5 結(jié)論與展望

      本文通過(guò)Matlab仿真,分析了3種常用加權(quán)函數(shù)的GCC時(shí)延估計(jì)算法的優(yōu)劣性.通過(guò)比較廣義互相關(guān)函數(shù)、時(shí)延估計(jì)準(zhǔn)確度和聲源定位精度,發(fā)現(xiàn)PHAT加權(quán)有更好的抗噪特性,能夠更加準(zhǔn)確地做出時(shí)延估計(jì).但總體來(lái)說(shuō),GCC時(shí)延估計(jì)的準(zhǔn)確性隨信噪比的降低,性能逐漸下降.因此,本文提出了一種改進(jìn)的PHATGCC算法.從實(shí)驗(yàn)結(jié)果來(lái)看,該算法在低信噪比情況下也能有效地抑制噪聲銳化峰值,從而提高聲源定位的精度.這對(duì)麥克風(fēng)陣列的研究和設(shè)計(jì)有著積極地指導(dǎo)意義.在后續(xù)工作中,為了進(jìn)一步優(yōu)化改進(jìn)的PHAT-GCC算法,考慮采用神經(jīng)網(wǎng)絡(luò)算法,訓(xùn)練得到一個(gè)更優(yōu)的參數(shù)組合,從而提高該算法的性能.

      猜你喜歡
      麥克風(fēng)聲源時(shí)延
      虛擬聲源定位的等效源近場(chǎng)聲全息算法
      Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
      基于GCC-nearest時(shí)延估計(jì)的室內(nèi)聲源定位
      電子制作(2019年23期)2019-02-23 13:21:12
      基于數(shù)字麥克風(fēng)的WIFI語(yǔ)音發(fā)射機(jī)
      基于改進(jìn)二次相關(guān)算法的TDOA時(shí)延估計(jì)
      麥克風(fēng)的藝術(shù)
      運(yùn)用內(nèi)積相關(guān)性結(jié)合迭代相減識(shí)別兩點(diǎn)聲源
      FRFT在水聲信道時(shí)延頻移聯(lián)合估計(jì)中的應(yīng)用
      基于分段CEEMD降噪的時(shí)延估計(jì)研究
      麥克風(fēng)
      新化县| 东丽区| 兴山县| 凤山市| 乌鲁木齐县| 隆林| 屏东市| 平安县| 永宁县| 石泉县| 平武县| 噶尔县| 绥江县| 大渡口区| 中山市| 错那县| 大竹县| 张掖市| 科尔| 兴仁县| 上蔡县| 安庆市| 盐池县| 武宣县| 通许县| 霍林郭勒市| 左权县| 桐梓县| 建瓯市| 萍乡市| 彰化县| 开江县| 印江| 遵义县| 拉孜县| 龙川县| 阿荣旗| 安康市| 大港区| 柳州市| 西畴县|