張奕,李娟,張敏
(大連大學(xué)信息工程學(xué)院,遼寧 大連 116622)
目前,在視頻會(huì)議、智能機(jī)器人、車載電話、語(yǔ)音增強(qiáng)等領(lǐng)域中,基于麥克風(fēng)陣列的聲源定位技術(shù)現(xiàn)已得到廣泛應(yīng)用[1]。傳統(tǒng)的聲源定位算法主要基于以下3種:1) 基于波束形成的定位算法,該算法采用波束形成技術(shù),通過(guò)調(diào)節(jié)麥克風(fēng)陣列的指向?qū)φ麄€(gè)接收空間進(jìn)行搜索,使陣列波束對(duì)準(zhǔn)聲源而獲得最大的輸出功率[2];2) 基于高分辨率譜估計(jì)的定位算法,通過(guò)求解陣列接收信號(hào)的協(xié)方差矩陣獲得空間譜函數(shù),再由此信息進(jìn)行聲源定位,使用較廣泛的算法有 MUSIC(multiple signal classification)、ESPRIT(estimating signal parameter via rotational invariance techniques)、子空間擬合等[3];3) 基于到達(dá)時(shí)延差的方法,此為當(dāng)前應(yīng)用最廣泛的一種定位方法,該算法根據(jù)聲源信號(hào)到達(dá)不同位置麥克風(fēng)的時(shí)間差,計(jì)算出聲源位置相對(duì)于多組麥克風(fēng)所在的多個(gè)雙曲面,其交點(diǎn)就是聲源的位置[4]。然而傳統(tǒng)的麥克風(fēng)陣列聲源定位技術(shù)都無(wú)法擺脫三角定位的限制,在混響環(huán)境下受到更大挑戰(zhàn),即使采用信道盲分離技術(shù),可恢復(fù)的空間聲源數(shù)目也無(wú)法超過(guò)麥克風(fēng)數(shù)量,這使得現(xiàn)有的具有實(shí)用價(jià)值的麥克風(fēng)陣列系統(tǒng)都是海量陣列。
壓縮感知(CS, compressed sensing)理論提出以后,很多學(xué)者將其引進(jìn)到語(yǔ)音信號(hào)處理的多個(gè)領(lǐng)域中。例如,Asaei 利用結(jié)構(gòu)性稀疏的壓縮感知框架來(lái)進(jìn)行多說(shuō)話人語(yǔ)音識(shí)別,實(shí)現(xiàn)了4個(gè)麥克風(fēng)以95%的正確率識(shí)別9個(gè)說(shuō)話人[5]。Wabnitz利用壓縮感知框架進(jìn)行三維空間聲場(chǎng)重構(gòu),極大地減少了數(shù)據(jù)集的處理量,并擴(kuò)大了聽(tīng)覺(jué)甜點(diǎn)的范圍[6]。Benichoux利用壓縮感知技術(shù),突破了全房間沖激響應(yīng)估計(jì)中麥克風(fēng)數(shù)量大于等于聲源數(shù)目的限制[7]。Mignot利用壓縮感知技術(shù)通過(guò)低頻插值來(lái)恢復(fù)房間的全沖激響應(yīng)[8],僅采用120個(gè)麥克風(fēng)的空間采樣點(diǎn)即可恢復(fù)全房間沖激響應(yīng),極大地減少了麥克風(fēng)的使用數(shù)量。Chardon采用MMV(multi- measurement vector)框架,利用隨機(jī)稀疏字典構(gòu)造廣義MUSIC算法進(jìn)行多聲源識(shí)別和定位[9]。廣義MUSIC算法在較少麥克風(fēng)情況下仍可取得理想定位效果,但該算法基于理想模型假設(shè),只適用于線性陣列。
文獻(xiàn)[10]基于壓縮感知框架,提出了使用麥克風(fēng)陣列定位單個(gè)聲源的定位算法。該算法假設(shè)麥克風(fēng)陣列和聲源處于同一水平面,將聲源可能存在的空間離散成I個(gè)位置,并以這I個(gè)位置的房間沖激響應(yīng)來(lái)構(gòu)建字典,再采用OMP(orthogonal matching pursuit)算法恢復(fù)出聲源信號(hào)矢量,則矢量中最大元素對(duì)應(yīng)的位置即為實(shí)際聲源的位置。相位變換加權(quán)的可控響應(yīng)功率(SRP-PHAT,steered response power-phase transform)[11]定位算法通過(guò)搜索空間中使SRP(steered response power)函數(shù)最大的點(diǎn)作為聲源的估計(jì)位置,該類算法對(duì)混響的頑健性較強(qiáng),但在多聲源條件下會(huì)受到各聲源之間的相互影響,使傳統(tǒng)的 SRP-PHAT算法的多聲源定位性能并不高。文獻(xiàn)[12]對(duì)此做出改進(jìn),提出了基于子帶可控響應(yīng)功率的多聲源定位算法(SRP-sub,sub-band steered response power),該算法對(duì)語(yǔ)音信號(hào)頻譜進(jìn)行劃分之后,在每個(gè)子帶尋求SRP的最大值以定位聲源。以上算法雖然都能在混響環(huán)境下達(dá)到聲源定位的目的,但要取得顯著的定位效果,所采用的麥克風(fēng)數(shù)目必須遠(yuǎn)多于空間中聲源的數(shù)目。
本文基于壓縮感知框架,結(jié)合房間混響所帶來(lái)的空間信息來(lái)構(gòu)建室內(nèi)混響環(huán)境下采用雙麥克風(fēng)進(jìn)行多聲源(至少3個(gè)聲源)定位的模型。該模型將混響環(huán)境下的多聲源定位描述為多點(diǎn)聲源經(jīng)由房間沖激響應(yīng)模板壓縮到麥克風(fēng)的壓縮感知問(wèn)題,從而提出了一種基于壓縮感知的雙麥克風(fēng)混響多聲源定位算法。由于在本文的研究框架下,多點(diǎn)聲源相對(duì)房間的整個(gè)空頻域而言呈現(xiàn)塊稀疏特性,而塊稀疏所需的觀測(cè)量(麥克風(fēng)數(shù)目)要比普通稀疏的觀測(cè)量少得多,故對(duì)塊稀疏信號(hào)的求解使得使用欠定數(shù)量(麥克風(fēng)數(shù)目小于聲源數(shù)目)的麥克風(fēng)陣列定位多聲源成為可能。
室內(nèi)混響環(huán)境下,聲源數(shù)目未知的多聲源多信道的時(shí)域模型為
其中,xm表示第m個(gè)麥克風(fēng)接收的信號(hào),表示第n個(gè)聲源信號(hào),表示第n個(gè)聲源與第m個(gè)麥克風(fēng)之間的房間沖激響應(yīng),*為卷積符號(hào),M為麥克風(fēng)的數(shù)量[13](本文中M=2)。經(jīng)短時(shí)傅里葉變換得到式(2)。
假設(shè)N×1維的矢量在稀疏基上有如式(3)的表示。
則稱在稀疏基ψ上,信號(hào)Z是稀疏的。其中矢量S中非零值的個(gè)數(shù)為k,也被稱為稀疏度,且
壓縮感知理論指出,若矢量Z本身稀疏或者其在某一已知基ψ上的系數(shù)呈現(xiàn)稀疏性,則可通過(guò)一個(gè)維的壓縮觀測(cè)矩陣Φ將矢量Z線性投影到一個(gè)低維的觀測(cè)矢量X中[14],其中該線性投影可以表示為其中A被稱為 CS矩陣,
當(dāng) CS矩陣A滿足有限等距約束時(shí),通過(guò)低維的觀測(cè)數(shù)據(jù)可以高概率重構(gòu)出原始信號(hào)[15]。信號(hào)Z稀疏或Z在某個(gè)基上稀疏的情況下,欠定方程組X=AS可以通過(guò)l0范數(shù)最小化約束來(lái)求解[16],即
由于l0范數(shù)求解屬于非凸問(wèn)題,一般采用范數(shù)近似地對(duì)S的稀疏性進(jìn)行約束而取得更好的重構(gòu)效果。
根據(jù)CS理論,信號(hào)重構(gòu)可以看作是在一定條件下的優(yōu)化問(wèn)題。現(xiàn)有的重構(gòu)算法主要基于以下三類[17]:第一類為貪婪迭代算法,主要有匹配追蹤(MP,matching pursuit)算法、正交匹配追蹤(OMP,orthogonal matching pursuit)算法等[18];第二類為凸優(yōu)化算法,常用的有基追蹤(BP,basic pursuit)算法[19];第三類是基于貝葉斯框架提出的算法[20]。
為簡(jiǎn)化問(wèn)題,本文將房間看作二維平面(俯視面),將該平面區(qū)域分割成G個(gè)網(wǎng)格[21],每個(gè)聲源最多只占據(jù)一個(gè)網(wǎng)格。假設(shè)房間中存在K個(gè)聲源且在時(shí)間觀測(cè)窗內(nèi)聲源位置不變,在每個(gè)網(wǎng)格g處選取F個(gè)頻點(diǎn),即并將所有網(wǎng)格點(diǎn)的頻點(diǎn)數(shù)據(jù)按列堆疊成一維向量。該方法同樣適用于三維空間,只需要將三維空間劃分的網(wǎng)格平鋪到一維即可。當(dāng)空間中只存在K個(gè)聲源時(shí),理論上有聲源的網(wǎng)格對(duì)應(yīng)的在頻點(diǎn)處就會(huì)出現(xiàn)非零值。如圖1所示,房間被劃分成G個(gè)網(wǎng)格,黑色網(wǎng)格表示聲源所在位置,其頻域表示如圖1右側(cè)所示,而其他沒(méi)有聲源的網(wǎng)格在各頻點(diǎn)的值均為 0。這使得多個(gè)聲源信號(hào)的空-頻域表達(dá)S具有某種結(jié)構(gòu)稀疏性,由于在這一結(jié)構(gòu)中,非零元素成塊出現(xiàn),故也稱聲源信號(hào)在空-頻域上具有塊稀疏性,即有幾個(gè)說(shuō)話人(聲源)就對(duì)應(yīng)幾個(gè)非零塊,塊的大小等于選取的頻點(diǎn)數(shù)。
假設(shè)已知房間為有限阻抗墻壁組成的矩形封閉結(jié)構(gòu),則可利用Image方法[22]構(gòu)造房間中任意空間點(diǎn)聲源到達(dá)某一空間位置麥克風(fēng)的房間沖激響應(yīng)。Image方法又叫鏡像法,麥克風(fēng)接收到的聲源信號(hào)包括了直達(dá)聲和經(jīng)多次反射后的信號(hào),Image方法與光的鏡面反射特性相似,將反射的信號(hào)看成是墻壁另一側(cè)的虛聲源傳播到麥克風(fēng)的信號(hào)??紤]到多徑效應(yīng),則網(wǎng)格g處到第m個(gè)麥克風(fēng)的投影可采用Green函數(shù)表示,如式(5)所示。
圖1 具有塊稀疏結(jié)構(gòu)的聲源位置分布的空-頻域示意
l為第r次反射的反射系數(shù);α為衰減常數(shù),在球面?zhèn)鞑ツP椭?,?1;c表示聲速[23]。采用式(5)的聲源-麥克風(fēng)投影構(gòu)造F個(gè)頻點(diǎn)的頻域投影矩陣為
則所有網(wǎng)格點(diǎn)經(jīng)由房間投影到第m個(gè)麥克風(fēng)對(duì)應(yīng)的壓縮觀測(cè)模板為
所以麥克風(fēng)陣列對(duì)應(yīng)的壓縮觀測(cè)模板為
將Φ′按列歸一化后得到壓縮觀測(cè)矩陣如式(9)所示。
基于以上描述,本文算法整體流程如下。
1) 采用Image方法產(chǎn)生全房間沖激響應(yīng),并根據(jù)式(6)~式(9)完成壓縮觀測(cè)矩陣Φ的構(gòu)造。
2) 利用壓縮感知框架描述語(yǔ)音定位問(wèn)題,并采用塊稀疏優(yōu)化算法恢復(fù)出聲源信號(hào)的估計(jì)
綜上,使用雙麥克風(fēng)對(duì)多個(gè)聲源進(jìn)行定位的問(wèn)題可表示為求解線性方程組,如式(10)所示。
式(3)寫成矩陣的形式為
式(10)中,等式左側(cè)項(xiàng)表示 2個(gè)麥克風(fēng)接收的信號(hào)在不同頻點(diǎn)的值,其中,下標(biāo) 1、2為麥克風(fēng)編號(hào),即第一個(gè)麥克風(fēng)和第二個(gè)麥克風(fēng)。等式右側(cè)第一項(xiàng)為根據(jù)式(6)~(9)選取的F個(gè)頻點(diǎn)構(gòu)造的壓縮觀測(cè)矩陣,第二項(xiàng)為各個(gè)網(wǎng)格點(diǎn)的信號(hào)在頻域的表示,每個(gè)網(wǎng)格各取F個(gè)頻點(diǎn)。理論上,有聲源的網(wǎng)格對(duì)應(yīng)的頻點(diǎn)值存在非零值,而無(wú)聲源的網(wǎng)格處,其所有頻點(diǎn)值對(duì)應(yīng)為零值;即空間中聲源的位置和式(11)信號(hào)S中的非零塊所在的位置之間存在一一對(duì)應(yīng)的關(guān)系,故估計(jì)空間中多聲源的位置問(wèn)題可轉(zhuǎn)換為確定非零塊在S中的位置問(wèn)題。
要確定S中的非零塊需要先通過(guò)求解式(10)的欠定線性方程組來(lái)獲得聲源信號(hào)的估計(jì)為簡(jiǎn)化問(wèn)題描述,在本文的雙麥克風(fēng)定位研究中,假設(shè)使用頻點(diǎn)數(shù)為2,聲源數(shù)目為3,麥克風(fēng)數(shù)為2,并將房間劃分為4個(gè)網(wǎng)格,則式(10)可以簡(jiǎn)化為式(12)。
對(duì)于求解如式(12)所示的欠定線性方程組,如果僅從普通稀疏優(yōu)化的角度,即基于l0范數(shù)優(yōu)化的角度,信號(hào)S的維度n=8,非零變量個(gè)數(shù)為6(稀疏度k=6),則至少需要m=6個(gè)觀測(cè)數(shù)據(jù)才能恢復(fù);如果采用基于l1范數(shù)的優(yōu)化算法,則需要滿足更嚴(yán)格的 RIP(restricted isometry property)約束條件,所需的觀測(cè)數(shù)據(jù)量因此,式(12)的4個(gè)觀測(cè)數(shù)據(jù)采用普通稀疏優(yōu)化時(shí),無(wú)法唯一恢復(fù)信號(hào),即采用普通稀疏算法時(shí),無(wú)法僅使用2個(gè)麥克風(fēng)定位3個(gè)聲源。然而,如3.2節(jié)所述,由于該聲源信號(hào)在空-頻域具有結(jié)構(gòu)稀疏性,所以,當(dāng)對(duì)其進(jìn)行塊結(jié)構(gòu)約束時(shí),對(duì)于信號(hào)S的N=4個(gè)塊中,非零塊K=3,每個(gè)非零塊大小d=2,則采用塊稀疏優(yōu)化算法(基于l0范數(shù)優(yōu)化)只需3個(gè)觀測(cè)數(shù)據(jù)即可得到該3個(gè)非零塊的全部數(shù)據(jù);若采用基于l1范數(shù)的優(yōu)化算法,則需滿足 block RIP,即觀測(cè)數(shù)據(jù)量最少滿足可見(jiàn)塊稀疏所需的觀測(cè)量是普通稀疏數(shù)據(jù)量的此時(shí)2個(gè)麥克風(fēng)可以定位3個(gè)聲源,即采用塊稀疏優(yōu)化時(shí),式(12)可解。所以,式(10)的欠定線性方程組可采用塊稀疏約束求解。
本文采用 ReGOMP(regularized group orthogonal matching pursuit)[24]塊稀疏重構(gòu)算法求解,這是 Majumdar提出的一種結(jié)合了正則化正交匹配追蹤(ROMP,regularized orthogonal matching pursuit)算法[25]和塊正交匹配追蹤(BOMP,block orthogonal matching pursuit)算法[26]的針對(duì)塊稀疏信號(hào)的重構(gòu)算法。該算法在每次迭代時(shí)首先挑選出與殘差最匹配的K個(gè)塊,然后在正則化過(guò)程中篩選出其能量介于最大能量與最大能量的一半之間的塊集合作為候選支撐塊集合。正則化過(guò)程提高了篩選的準(zhǔn)確性,同時(shí)相比BOMP算法每次只選擇一個(gè)支撐塊,ReGOMP算法每次選取多個(gè)支撐塊,加快了收斂速率,解決了ROMP算法不能解決的塊稀疏問(wèn)題;其缺點(diǎn)是塊稀疏度必須先驗(yàn)已知。
在使用ReGOMP算法求得聲源信號(hào)的估計(jì)?S后,根據(jù)選取的頻點(diǎn)數(shù)F重新整合分塊。如式(13)所示,對(duì)每F個(gè)頻點(diǎn)求解其l2范數(shù),則非零范數(shù)(非零塊)在?S中的位置對(duì)應(yīng)的就是空間中聲源所在網(wǎng)格點(diǎn)的位置。
為進(jìn)一步驗(yàn)證上述所提出的算法的有效性,本文使用Matlab 2014b進(jìn)行軟件仿真實(shí)驗(yàn)。首先對(duì)不同說(shuō)話人同時(shí)位于房間不同位置時(shí)的情況進(jìn)行雙麥克風(fēng)定位模擬,然后分別就混響時(shí)間RT60對(duì)定位成功率的影響,頻點(diǎn)數(shù)F的變化對(duì)定位成功率的影響以及可定位的聲源數(shù)目增加時(shí)算法的定位性能進(jìn)行討論,并分別和文獻(xiàn)[12]的多聲源定位算法SRP-sub進(jìn)行仿真實(shí)驗(yàn)對(duì)比,最后從平均運(yùn)行時(shí)間的角度分析了本文算法的復(fù)雜度。
仿真使用的矩形房間為3.3 m×4.4 m×2.5 m(長(zhǎng)×寬×高)。分別以0.3 m×0.4 m為間隔將房間二維平面劃分為10×10的網(wǎng)格,2個(gè)全向麥克風(fēng)位置坐標(biāo)分別為[1.6,1.6,1.7] m和[1.4,1.9,1.7] m。假設(shè)說(shuō)話人與麥克風(fēng)陣列處于同一水平面,采樣頻率,聲速c= 343m/s ,墻壁反射系數(shù)為0.7,采用Image方法產(chǎn)生全房間沖激響應(yīng),長(zhǎng)度約為2 500點(diǎn),統(tǒng)一截取前1 000個(gè)頻點(diǎn)的值,在頻域進(jìn)行2 048點(diǎn)的傅里葉變換,并等間隔選取F個(gè)頻點(diǎn)構(gòu)造壓縮觀測(cè)矩陣。
圖2模擬了不同說(shuō)話人(聲源)同時(shí)位于房間不同位置時(shí),采用本文算法和文獻(xiàn)[12]算法的定位情況?;祉憰r(shí)間RT60=0.3s,頻點(diǎn)數(shù)F=80。
從圖2可以看出本文算法對(duì)多聲源定位的優(yōu)勢(shì)。SRP-sub算法雖然采用子帶劃分的思想來(lái)避免多個(gè)聲源距離較近時(shí)出現(xiàn)易混淆的現(xiàn)象,但在麥克風(fēng)數(shù)量少于聲源數(shù)目時(shí),表現(xiàn)依然乏力。所以,在一定的誤差條件下,使用雙麥克風(fēng)在混響條件下進(jìn)行多聲源定位是可行的。
本實(shí)驗(yàn)中,混響時(shí)間RT60分別取0.2 s、0.3 s、0.4 s、0.5 s、0.6 s產(chǎn)生全房間沖激響應(yīng),等間隔取個(gè)頻點(diǎn)構(gòu)造壓縮觀測(cè)矩陣,并分別采用本文算法和SRP-sub算法進(jìn)行多聲源定位,兩者在不同混響時(shí)間下的定位結(jié)果如圖3所示。由圖3可知,當(dāng)混響時(shí)間增加時(shí),本文算法的定位能力不但沒(méi)有降低反而略有上升的趨勢(shì),可見(jiàn)本文算法對(duì)混響時(shí)間的頑健性。而SRP-sub算法在多聲源情況下本身定位性能不高,高混響更是嚴(yán)重影響了其對(duì)多聲源定位的能力。
參考4.2節(jié)的仿真結(jié)果,取混響時(shí)間RT60=0.3s,統(tǒng)計(jì)頻點(diǎn)數(shù)F取值為 20、40、60、80、100、120時(shí)分別采用本文算法和SRP-sub算法對(duì)多聲源的定位成功率,其結(jié)果如圖4所示。
由圖4可知,隨頻點(diǎn)數(shù)的增加,本文算法的定位成功率逐漸提升,但超過(guò)某一頻點(diǎn)數(shù)時(shí),其上升趨勢(shì)漸趨緩慢。這是因?yàn)楸疚乃惴ㄔ谛盘?hào)重構(gòu)之后需要再整合F個(gè)頻點(diǎn)的能量信息來(lái)進(jìn)行分塊,當(dāng)頻點(diǎn)數(shù)達(dá)到一定數(shù)值時(shí),由于這些頻點(diǎn)已經(jīng)包含了整個(gè)信號(hào)的絕大部分能量,所以繼續(xù)增加頻點(diǎn)數(shù)目,對(duì)算法的定位性能提升較少。而對(duì)于SRP-sub算法,由于其每個(gè)子帶的SRP函數(shù)也依賴于各頻點(diǎn)的值,所以頻點(diǎn)數(shù)的增加也使SRP-sub算法的定位性能得到提升,但整體而言,本文算法在雙麥克風(fēng)條件下的多聲源定位性能遠(yuǎn)高于SRP-sub算法。
圖2 不同說(shuō)話人同時(shí)位于房間的不同位置
圖3 不同混響時(shí)間下的定位成功率
圖4 頻點(diǎn)數(shù)對(duì)定位成功率的影響
參考4.2節(jié)與4.3節(jié)的仿真結(jié)果,設(shè)置混響時(shí)間RT60=0.3s,頻點(diǎn)數(shù)F=60,在可定位的聲源數(shù)目分別為3、4、5、6、7時(shí),分別采用2種算法進(jìn)行定位仿真實(shí)驗(yàn),其定位成功率統(tǒng)計(jì)結(jié)果如圖5所示。
圖5 可定位的聲源數(shù)目與對(duì)應(yīng)的定位成功率
由圖5可知,在以上混響時(shí)間和頻點(diǎn)數(shù)條件下,使用本文算法定位 3~4個(gè)聲源的結(jié)果是可以接受的,而SRP-sub算法在同等條件下表現(xiàn)較差。盡管對(duì)于更多聲源的情況,本文算法未能取得很好的效果,但整體性能依然優(yōu)于SRP-sub算法。同時(shí)本文的算法很好地說(shuō)明了混響環(huán)境下欠定數(shù)量(麥克風(fēng)數(shù)量小于聲源數(shù)量)的麥克風(fēng)陣列多聲源定位的可行性和潛力,這對(duì)體積受限的通信設(shè)備來(lái)說(shuō)具有極大的研究?jī)r(jià)值。
本文的定位算法中,假設(shè)全房間沖激響應(yīng)已知,故不考慮計(jì)算壓縮觀測(cè)矩陣的時(shí)間,這樣算法的運(yùn)行時(shí)間僅是利用 ReGOMP算法恢復(fù)塊稀疏信號(hào)的時(shí)間與對(duì)該信號(hào)整合分塊的時(shí)間之和。圖6記錄了在不同頻點(diǎn)數(shù)和塊稀疏度時(shí),使用雙麥克風(fēng)定位1 000次的平均運(yùn)行時(shí)間。由于本文的塊稀疏優(yōu)化算法的稀疏度為先驗(yàn)已知的,實(shí)驗(yàn)中塊稀疏度等于聲源數(shù)目,所以在不同塊稀疏度時(shí)的運(yùn)行時(shí)間可認(rèn)為是不同聲源數(shù)目時(shí)的運(yùn)行時(shí)間。
由圖6可知,頻點(diǎn)數(shù)取值在20~80時(shí),塊稀疏度(聲源數(shù)目)增加,本文算法的平均運(yùn)行時(shí)間只是略微增加;頻點(diǎn)數(shù)取值100~120時(shí),本文算法的平均運(yùn)行時(shí)間隨塊稀疏度的增加增幅稍大。圖6也反映了頻點(diǎn)數(shù)對(duì)算法的運(yùn)行時(shí)間的影響比塊稀疏度對(duì)運(yùn)行時(shí)間的影響更大。但通過(guò)4.3節(jié)的實(shí)驗(yàn)也說(shuō)明了當(dāng)頻點(diǎn)數(shù)超過(guò)一定數(shù)值時(shí),算法的定位性能提升幅度較小,所以可酌情選擇頻點(diǎn)數(shù)目,使得在保證一定的定位成功率的情況下,運(yùn)行時(shí)間不至于很大。
圖6 算法在不同塊稀疏度和頻點(diǎn)數(shù)時(shí)的平均運(yùn)行時(shí)間
基于麥克風(fēng)陣列的聲源定位技術(shù)是陣列信號(hào)處理領(lǐng)域的一項(xiàng)研究熱點(diǎn),而壓縮感知的出現(xiàn)又為該領(lǐng)域的發(fā)展提供了一個(gè)嶄新的視角。本文提出的基于壓縮感知的雙麥克風(fēng)陣列混響多聲源定位算法以歸一化的全房間沖激響應(yīng)為特征,構(gòu)建壓縮觀測(cè)矩陣,將多聲源定位問(wèn)題轉(zhuǎn)化為塊稀疏信號(hào)的重構(gòu)問(wèn)題,通過(guò)重構(gòu)信號(hào)的塊與空間聲源的對(duì)應(yīng)關(guān)系得到實(shí)際聲源的位置。
該算法不僅能解決室內(nèi)混響環(huán)境,如會(huì)議室、小型會(huì)議場(chǎng)等的定位問(wèn)題,且麥克風(fēng)數(shù)量的減少可大大減輕系統(tǒng)的運(yùn)算負(fù)擔(dān)和硬件成本。本文僅使用2個(gè)麥克風(fēng)就能對(duì)混響空間中至少3個(gè)聲源進(jìn)行定位,其中聲源數(shù)目為3~4個(gè)時(shí),定位效果較好。雖然本文算法對(duì)于更多聲源的定位情況不是很理想,但依然擺脫了傳統(tǒng)聲源定位算法中,麥克風(fēng)數(shù)量必須大于聲源數(shù)目的限制。這對(duì)于室內(nèi)混響空間中小型化的便捷語(yǔ)音設(shè)備而言很有研究?jī)r(jià)值。