竇育強(qiáng),王暉,張勤
(1中國傳媒大學(xué) 信息工程學(xué)院 北京 100024;2河南師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院 河南新鄉(xiāng) 453007)
?
基于距離差、能量比和到達(dá)角的兩麥克風(fēng)聲源定位
竇育強(qiáng)1,2,王暉1,張勤1
(1中國傳媒大學(xué) 信息工程學(xué)院 北京 100024;2河南師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院 河南新鄉(xiāng) 453007)
減少定位聲源所需麥克風(fēng)數(shù)量對于特定場合是重要的,提出在兩麥克風(fēng)條件下利用距離差、能量比和到達(dá)角聯(lián)合對單個(gè)聲源進(jìn)行二維定位的最大似然法和一種閉式解。在高斯噪聲條件下,最大似然法將轉(zhuǎn)化為加權(quán)最小二乘問題,為減小求解復(fù)雜度利用了粒子群算法進(jìn)行迭代求解。通過仿真分析了最大似然法和閉式解法的抗噪聲性能。
距離差;能量比;到達(dá)角;最大似然;粒子群
近年來,基于麥克風(fēng)陣列的聲源定位得到了很多研究者的關(guān)注。一類常用的方法是基于距離差的方法[1-4],已經(jīng)得到了很多研究;另一類基于能量和能量比的定位方法也受到了重視。基于能量比的方法首先由Hu和Li[5]提出,文中給出了基于能量的最大似然估計(jì)方法,在對單個(gè)聲源定位時(shí)給出了基于能量比的最小二乘法。D.Blatt和A.D.Hero[6]針對最小二乘算法容易陷入局部最優(yōu)的缺點(diǎn),提出了一種凸集投影法,在一定條件下可求得全局最優(yōu)解。2007年,K.C.Ho和Ming Sun[7]提出了一種利用能量比信息進(jìn)行定位的代數(shù)閉式解。Chen Feng等[8]利用陣列接收信號的能量信息建立了實(shí)現(xiàn)多源定位的壓縮感知模型。這些方法都僅僅利用了聲源的能量比特征,并且所用麥克風(fēng)陣列陣元數(shù)量都超過兩個(gè)。W.Cui[9]和Pourmohammad[10]利用距離差和能量比對聲源在二維空間進(jìn)行定位,給出了閉式解,并且將麥克風(fēng)數(shù)量降到了兩個(gè),但信噪比過高時(shí),可能存在無解情況,還需要對得到的兩根做分析。Wenyi Zhang[11]利用兩個(gè)麥克風(fēng)實(shí)現(xiàn)了對多聲源的方向估計(jì)。本文對利用兩麥克風(fēng)進(jìn)行聲源定位方法進(jìn)行了分析,給出了基于距離差、能量比和到達(dá)角聯(lián)合進(jìn)行聲源定位的最大似然方法,并利用粒子群算法進(jìn)行求解;給出了利用距離差、能量比和到達(dá)角聯(lián)合進(jìn)行聲源定位的閉式解。
本文第二部分論述了利用距離差、能量比和到達(dá)角聯(lián)合進(jìn)行聲源定位的方法原理,第三部分對所提算法進(jìn)行了實(shí)驗(yàn)仿真,并對結(jié)果進(jìn)行了分析,第四部分得出結(jié)論。
2.1基于距離差、能量比和到達(dá)角的最大似然法
在笛卡爾坐標(biāo)系中,兩個(gè)麥克風(fēng)坐標(biāo)分別為r1=(x1,y1)和r2=(x2,y2),聲源位于r=(x,y)點(diǎn)處,則聲源到兩個(gè)麥克風(fēng)的距離分別為:
聲源信號為x(t),幅度衰減與距離成反比,在第i個(gè)麥克風(fēng)處接收到信號為
其中g(shù)i為第i個(gè)麥克風(fēng)增益,ξi為觀測噪聲,首先忽略噪聲,有
假設(shè)所有麥克風(fēng)增益均為1,忽略相位延遲引起的能量差,則麥克風(fēng)1與麥克風(fēng)2接收到的信號能量比為
κ12稱為能量比因子,則
(1)
聲源距離麥克風(fēng)2和麥克風(fēng)1的距離差為
d12=cτ12=‖r2‖-‖r1‖
(2)
τ12為聲源到麥克風(fēng)2與麥克風(fēng)1的時(shí)延差τ12=τ2-τ1,c為聲速。
由于實(shí)際測量會有誤差存在,實(shí)際的能量比和距離差估計(jì)值應(yīng)該表示為
(3)
其中
f2(r)=‖r2‖-‖r1‖
(4)
由于測量誤差的存在,實(shí)際的到達(dá)角余弦應(yīng)該表示為
(5)
其中
(6)
vi,j(t+1)=ωvi,j(t)+c1s1[pi,j-ui,j(t)]
+c2s2[pg,j-ui,j(t)]
ui,j(t+1)=ui,j(t)+vi,j(t+1),j=1,2.,
其中c1和c2為學(xué)習(xí)因子,均大于零,ω為慣性權(quán)重,s1和s2為隨機(jī)數(shù),在0到1之間均勻分布。
2.2基于距離差、能量比和到達(dá)角的閉式解
整理(1)式與(2)式得
(7)
(8)
將(7)式和(8)式整理可以得到兩個(gè)用于定位的圓
其中
再整理可以得到關(guān)于x,y,R2=x2+y2的兩個(gè)線性方程
(9)
(10)
其中
將(3)式也寫成關(guān)于x,y,R2的線性方程
kx-y+0·R2=-ak
(11)
其中k=tanα。
將式(9),(10)和 (11)寫成矩陣形式
對其進(jìn)行求解得
為了檢驗(yàn)本文算法的性能,進(jìn)行了計(jì)算機(jī)仿真實(shí)驗(yàn)。為方便論述,分別記2.1和2.2中的算法為方法1和方法2;記文獻(xiàn)[9]中的算法為方法3。
兩個(gè)麥克風(fēng)位置分別為r1=(-40,0)和r2=(40,0),聲源位于r=(1346,2350),單位均為cm。
圖1 方法1,方法2和方法3的定位均方誤差比較,
圖2 方法1,方法2和方法3的定位均方誤差比較,
圖3 方法1,方法2和方法3的定位均方誤差比較,
4結(jié)論
本文對基于兩個(gè)麥克風(fēng)的聲源定位方法進(jìn)行了研究,提出了利用距離差、能量比和到達(dá)角的最大似然解法和一種閉式解法。最大似然法轉(zhuǎn)化為加權(quán)最小二乘問題后,利用粒子群算法進(jìn)行求解。
通過仿真實(shí)驗(yàn)表明,利用最大似然法具有優(yōu)于其他算法的性能,閉式解法在高信噪比時(shí)具有一定的優(yōu)越性。
[1]Schau H C,Robinson A Z.Passive source localization employing intersection spherical、surfaces from time-of-arrival differences[J].IEEE Transactions on Acoustic,Speech and Signal Processing,1987,35(8):1223-1225.
[2]Huang N,Benesty J,Elko G W,et a1.Real-time passive source localization:an unbiased linear-correction least-squares approach[J].IEEE Transactions on Speech and Audio Processing,2001,9(8):943-956.
[3]K C Ho.bias reduction for an explicit solution of source localization using tdoa[J]. IEEE Trans Signal Process,2012,60(5):2101-2114.
[4]Jamali-Rad,H,Leus,G.Sparsity-Aware Multi-Source TDOA Localization[J]. in Signal Processing,IEEE Transactions on ,2013,61(19):4874-4887.
[5]DLiandYHHu.Energybasedcollaborativesourcelocalizationusingacousticmicro-sensorarray[J].EURASIPJApplSignalProcess,2003,4:321-337.
[6]DBlattandADHero.Energy-basedsensornetworksourcelocalizationviaprojectionontoconvexsets[J].IEEETransSignalProcess,2006,54(9):3614-3619.
[7]KCHoandMingSun.AnAccurateAlgebraicClosed-FormSolutionforEnergy-BasedSourceLocalization[J].IEEETransOnAudioSpeechandLanguageProcessing,2007,15.
[8]ChenFeng,AuWSA,ValaeeS,ZhenhuiTan.Received-Signal-Strength-BasedIndoorPositioningUsingCompressiveSensing[J].inMobile Computing,IEEE Transactions on,2012,11(12):1983-1993.
[9]WCui,ZCao,andJWei.Dual-microphonesourcelocationmethodin2-Dspace[J].inProcIEEEIntConfAcoust,Speech,SignalProcess,2006,845-848.[10]Pourmohammad A,Ahadi S M.TDE-ILD-based 2D half plane real time high accuracy sound source localization using only two microphones and source counting[J].inElectronicsandInformationEngineering(ICEIE),2010InternationalConferenceOn,2010,1:566-572.
[11]Wenyi Zhang,Rao B D.A Two Microphone-Based Approach for Source Localization of Multiple Speech Sources[J]. inAudio,Speech,andLanguageProcessing,IEEETransactionson,2010,18(8):1913-1928.
[12]Kennedy J,Ebethart R.Partiele Swarm Optimization[C].In Proceeding of IEEE International Conference on Neural Networks,Piscataway,NJ:IEEE CS,1995:1942-1948.
[13]Ebethart R,Kennedy J.A new Optimizer using particle swarm theory[C].In:Proceeding of the 6thInternational Symposium on Micro Machine and Human Science,NJ:IEEECS,1995:39-43.
(責(zé)任編輯:馬玉鳳)
Sound Source Localization Using Range Differences,Energy Ratios and Angle of Arrival with Two Microphones
DOU Yu-qiang1,2,WANG Hui1,ZHANG Qin1
(1.Information Engineering School,Communication University of China,Beijing 100024; 2.Computer and Information Engineering School,Henan Normal University,Xinxiang of Henan 453007)
To reduce the required number of microphones of sound source location is important for specific occasions.A maximum-likelihood location estimator and a closed-form estimator are proposed for one sound source localization using range differences of arrival,energy ratios of arrival and angle of arrival with two microphones.The maximum-likelihood method is converted into a weighted least squares problem under the condition of gaussian noise,which is solved by an improved particle swarm optimization (PSO) algorithm.The performance of this algorithms against noise are analyzed in this paper.
range differences;energy ratios;angle of arrival;two microphones;PSO
2016-03-04
國家自然科學(xué)基金“三維音頻基礎(chǔ)理論與關(guān)鍵技術(shù)研究”(61231015)
竇育強(qiáng)(1980-),男(漢族),河南新鄉(xiāng)人,中國傳媒大學(xué)在讀博士,河南師范大學(xué)講師.E-mail:double_story@126.com
TN912
A
1673-4793(2016)03-0026-05