董曉紅,康 平
(包頭職業(yè)技術(shù)學(xué)院 人文與藝術(shù)設(shè)計系,內(nèi)蒙古 包頭 014030)
假定在一個全部由光滑大理石組成的大廳里,只有一個走動的人,發(fā)出清晰的腳步聲,在大廳里放一個麥克風(fēng)樹。通過建立合理的數(shù)學(xué)模型,設(shè)計一個成本盡量低,能夠達到使用要求的麥克風(fēng)樹。設(shè)計每只麥克風(fēng)的相對位置以及相對于地面的高度。根據(jù)聲源定位,確定人的位置和測量大廳輪廓尺寸。
“廣義互相關(guān)(GCC)時延估計法”可以看作麥克風(fēng)陣列的一種聲音定位法[1],該算法定位精確度高,應(yīng)用性強。步驟有:定位和時間延遲估計,如圖1如示。
圖1 算法原理
本文研究的是麥克風(fēng)線性陣列,然后估計各個TDOA的時延,最后進行麥克風(fēng)聲源定位[2]。在實際應(yīng)用中,基于時延估計法進行麥克風(fēng)聲源定位的方法有很多,廣義互相關(guān)應(yīng)用的比較多。
建模如下:
X1(n)=S1(n-ψ1)+n1(n)X2(n)=S2(n-ψ2)+n2(n)
(1)
S(n)為聲源信號,n1(n),n2(n)是一對互不相關(guān)的高斯白噪聲,二者與s(n)互不相關(guān)。τ1,τ,2為聲波傳導(dǎo)時間,τ12=τ1-τ2,兩麥克風(fēng)陣列間時延為τ12。
x1(n)和x2(n)的相關(guān)函數(shù)R12(τ)可表示為:
R12(τ)=E[x1(n)x2(n-τ)]
(2)
將式(1)帶入,得:
R12(τ)=E[s(n-τ1)s(n-τ1-τ)+E(s(n-τ1)n2(n-τ))]+E(s(n-τ2-τ)n1(n))+E[n1(n)n2(n-τ)]因為s(n),n1(n)和n2(n)三者互不相關(guān),從上面可知
R12(τ)=E[s(n-τ1)s(n-τ1-τ)]=Rs(τ-(τ1-τ2))
(3)
根據(jù)上面的函數(shù)性質(zhì)可知,當(dāng)這個時延條件τ-(τ1-τ2)=0成立時,R12(*)達到峰值,可得出R12(τ)最大值,此最大值所對的τ即兩麥克風(fēng)間時延τ12。此方法簡單明了,假設(shè)不同信號間、不同噪聲間互不相關(guān)的條件,實際不容易做到[3]。因此采用廣義互相關(guān)函數(shù)時延估計法,來減輕或消除噪聲干擾的影響,提高精度。原理如圖2所示。
圖2 廣義互相關(guān)GCC求時延估計原理
其中G12(w)是傳感器接收信號的x1(n)與x2(n)的互功率譜。
聲源信號的廣義互相關(guān)函數(shù),即:
其中Ψ12(w)為加權(quán)的廣義互相關(guān)函數(shù),主要由噪聲與反射情況來選擇廣義互相關(guān)加權(quán)函數(shù)。
本文主要研究平面的聲源定位,只要測出θ即可。首先在MATLAB中先定義一個聲源是s(θ,r),然后用N-1來定義下一個信號的來源,計算出其中的時延。下面是均勻線陣遠場模型:聲源s(θ,r)。
(1)本文運用了數(shù)字、表格和文字說明,以及MATLAB分析圖軟件等來說明如何通過麥克風(fēng)樹“遠場定位模型”與“廣義互相關(guān)時延估計法”來確定聲源的位置這一實際問題,解決了單個麥克風(fēng)無法分辨聲源方向的難題。
(2)本文所建立的模型與實際緊密聯(lián)系,推廣性較強。
(1)本文建模時,將某些變量忽略不計,可能會出現(xiàn)一些誤差。
(2)本文所建立的模型,忽略了空氣的濕度、氣壓、噪聲等因素對結(jié)果的精確度影響,還應(yīng)加強這些因素的研究。
在本文所用的模型中,主要研究對單個聲源的定位,今后還需進一步對多目標(biāo)的聲源定位展開研究。
(1)聲源定位遠場模型中麥克風(fēng)收集到的聲波為平面波,所以每個麥克風(fēng)接收到的信號相位相同,便于研究。
(2)本文使用基于GCC的算法對聲源進行定位研究,該算法計算量小,定位較為準(zhǔn)確。
(3)麥克風(fēng)樹排列麥克風(fēng)的方法很多,有一維、二維和三維麥克風(fēng)陣列,通過本文的研究,發(fā)現(xiàn)使用線性陣列,其陣元之間距離相等、相位及靈敏度一致,更利于研究。
(4)本文用MATLAB的仿真實驗,求出時延TDOA,然后進行反向推導(dǎo)就可以求出θ,從而確定聲源的位置。
(5)與單個麥克風(fēng)相比,麥克風(fēng)樹由多個麥克風(fēng)構(gòu)成,具有拾音范圍廣,性價比高,受環(huán)境影響小等優(yōu)點,在語音信號處理中更占優(yōu)勢。
文章運用了數(shù)字、表格和文字說明,以及Matlab分析圖軟件等來說明如何通過麥克風(fēng)樹“遠場定位模型”與“廣義互相關(guān)時延估計法”來確定聲源的位置這一實際問題,解決了單個麥克風(fēng)無法分辨聲源方向的難題,所建立的模型與實際緊密聯(lián)系,推廣性較強。