• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    麥克風(fēng)陣列下互相關(guān)函數(shù)分類的聲源定位

    2020-02-18 15:19:18張歲歲黃麗霞張雪英
    關(guān)鍵詞:混響麥克風(fēng)聲源

    張歲歲,黃麗霞,王 杰,張雪英

    太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,太原030024

    1 引言

    聲源定位技術(shù)是一種利用麥克風(fēng)陣列接收并處理聲場(chǎng)信號(hào)以確定聲源位置的技術(shù),其在基于麥克風(fēng)陣列的應(yīng)用中發(fā)揮著越來(lái)越重要的作用,如視頻會(huì)議[1]、語(yǔ)音增強(qiáng)、智能家居設(shè)計(jì)[2]、語(yǔ)音識(shí)別、智能機(jī)器人[3]、智能視頻監(jiān)控系統(tǒng)[4]等。

    目前在基于麥克風(fēng)陣列的聲源定位算法方面已經(jīng)有了比較成熟的理論和方法。傳統(tǒng)的聲源定位算法大致可以分為兩大類[5]:?jiǎn)尾椒ê碗p步法。最大似然算法(Maximum Likelihood,ML)是單步法中最主要的算法,此類算法中最熟悉的即可控相應(yīng)功率相位變換(Steered Response Power-Phase Transformation,SRP-PHAT)算法;另一種單步算法即高分辨率譜估計(jì)算法。雙步法中,第一種涉及到了到達(dá)時(shí)間差(Time Difference of Arrival,TDOA)估計(jì);另一種是基于自適應(yīng)特征值分解的子空間法和廣義特征值分解。雙步法中的基于時(shí)延估計(jì)的算法因其計(jì)算量小,便于實(shí)時(shí)處理,在實(shí)際的定位系統(tǒng)中應(yīng)用較多。然而室內(nèi)實(shí)際環(huán)境中存在各種干擾和影響等,會(huì)對(duì)系統(tǒng)的定位存在很強(qiáng)的混響作用。傳統(tǒng)的聲源定位方法在高混響的惡劣環(huán)境下,定位精度下降。

    近年來(lái),機(jī)器學(xué)習(xí)和模式識(shí)別技術(shù)已經(jīng)被用來(lái)解決聲源定位問(wèn)題。Strobel等人[6]提出一種基于時(shí)延估計(jì)分類的聲源定位算法,詳細(xì)研究了ML分類和基于直方圖的分類方法,在惡劣的聲學(xué)條件下,與傳統(tǒng)算法和ML分類算法相比較,基于直方圖分類的方法定位準(zhǔn)確率提高60%以上。Zhang等人[7]提出了一種基于雙麥克風(fēng)的多聲源定位技術(shù),該技術(shù)利用語(yǔ)音特性和聚類及線性擬合技術(shù)。Sun等人[8]在混響環(huán)境中利用圓形麥克風(fēng)陣列進(jìn)行聲源數(shù)目估計(jì)和定位,通過(guò)在選定的TF(Time-Frequency)點(diǎn)上進(jìn)行單聲源定位來(lái)解決這一問(wèn)題,用無(wú)限個(gè)高斯混合模型得到到達(dá)方向(Direction of Arrival,DOA)估計(jì),采用貝葉斯方法估計(jì)聲源和DOA的數(shù)目。該算法最大的優(yōu)勢(shì)是對(duì)聲源的個(gè)數(shù)沒(méi)有限制。Lee等人[9]提出了一種新的k均值聚類算法,即競(jìng)爭(zhēng)k均值聚類算法。將其性能與自適應(yīng)k-means++算法進(jìn)行了比較,驗(yàn)證了算法的有效性。最后將其應(yīng)用于多聲源定位中,取得了滿意的效果。Salvati等人[10]提出了一種在混響環(huán)境中使用加權(quán)最小方差無(wú)失真響應(yīng)(Weighted Minimum Variance Distortionless Response,WMVDR)的近場(chǎng)聲源定位算法?;跈C(jī)器學(xué)習(xí)計(jì)算WMVDR的可控響應(yīng)功率,采用支持向量機(jī)(Support Vector Machine,SVM)分類器對(duì)融合分量進(jìn)行選擇。Sun等人[11]提出了一種新的加權(quán)決策方法(Weighted Decision Making Method,WDMM),通過(guò)重新訪問(wèn)相鄰子空間的概率,有效地提高了基于似然分類算法的定位精度。

    本文主要研究了基于相位變換加權(quán)函數(shù)分類的聲源定位問(wèn)題,引入了Fisher加權(quán)樸素貝葉斯分類器。通過(guò)PHAT互相關(guān)函數(shù)得到特征向量,然后利用Fisher加權(quán)樸素貝葉斯分類器估計(jì)聲源位置。設(shè)計(jì)并實(shí)現(xiàn)了僅基于兩個(gè)麥克風(fēng)的聲源定位系統(tǒng),并將改進(jìn)的定位算法在實(shí)際環(huán)境中進(jìn)行了聲源定位實(shí)驗(yàn)。

    2 加權(quán)廣義互相關(guān)函數(shù)特征提取

    2.1 信號(hào)模型

    在實(shí)際環(huán)境中,室內(nèi)麥克風(fēng)陣列接收到的信號(hào)不僅包括聲源發(fā)出的信號(hào),而且還包含房間背景噪聲和房間混響。對(duì)于由M個(gè)陣元組成的麥克風(fēng)陣列,第m個(gè)麥克風(fēng)接收到的信號(hào)可由下式表示:

    其中,s(n)表示聲源;hm(n)表示聲源到第m個(gè)麥克風(fēng)的房間脈沖響應(yīng),包含多徑傳播和衰減信息;wm(n)表示房間背景噪聲;?表示卷積算子。本文重點(diǎn)研究混響對(duì)定位算法的影響,即假設(shè)wm(n)=0。

    其中,Prl(Y' )由均值向量Url和協(xié)方差矩陣Qrl決定。

    2.2 加權(quán)廣義互相關(guān)函數(shù)

    兩個(gè)麥克風(fēng)接收到的信號(hào)可以分別表示為x1(t)、x2(t),兩個(gè)信號(hào)的廣義互相關(guān)函數(shù)(Generalized Cross-Correlation,GCC)等于兩信號(hào)互功率譜的傅里葉變換,如下式表示:

    其中,Gx1x2(τ)=x1(ω)x?2(ω)表示被測(cè)信號(hào)x1(t)、x2(t)的互功率譜密度函數(shù);x1(ω)、x2(ω)分別表示麥克風(fēng)m1m2接收到信號(hào)x1(t)、x2(t)的傅里葉變換;?表示復(fù)共軛。

    但在高混響環(huán)境下,容易引起互相關(guān)函數(shù)峰值變寬,出現(xiàn)假峰值。為了銳化峰值,在信號(hào)中加入不同的加權(quán)函數(shù),首先抑制混響干擾,提高互相關(guān)函數(shù)的抗混響能力。因此,式(3)可以描述為:

    這里,ψ12(ω)表示不同的加權(quán)函數(shù),實(shí)際應(yīng)用中,選擇最合適的加權(quán)函數(shù)對(duì)GCC函數(shù)的性能非常重要[13]。很多文獻(xiàn)中提出了各種加權(quán)函數(shù),本文主要涉及PHAT加權(quán)函數(shù):

    將式(5)帶入式(4),兩信號(hào)的廣義互相關(guān)函數(shù)如下:

    2.3 特征提取

    基于互相關(guān)函數(shù)分類的聲源定位算法分為兩個(gè)階段:訓(xùn)練階段和定位階段。

    算法訓(xùn)練階段如圖1所示。樸素貝葉斯分類器的訓(xùn)練階段就是利用特征向量進(jìn)行訓(xùn)練,得到相應(yīng)特征的均值uij和方差σ2ij,由廣義互相關(guān)函數(shù)Rx1x2(τ)形成特征向量。

    圖1 算法訓(xùn)練階段

    訓(xùn)練階段位置rl,l=1,2,…,L處的特征向量為:

    這里,D表示兩個(gè)麥克風(fēng)之間的距離;c表示聲速;fs表示采樣頻率;δ表示因子,在后面的實(shí)驗(yàn)中設(shè)為1.67;round(?)表示取整。

    3 基于互相關(guān)函數(shù)分類的聲源定位

    3.1 樸素貝葉斯理論

    樸素貝葉斯分類器[14]在估計(jì)類條件概率密度時(shí)假設(shè)屬性之間條件獨(dú)立,即特征獨(dú)立性假設(shè),高斯分布通常被用來(lái)表示連續(xù)屬性的類條件概率分布。高斯分布的兩個(gè)參數(shù)分別是均值uij和方差,對(duì)于每個(gè)類yj,屬性Xi的類條件概率由下式表示:

    參數(shù)uij可以用類yj的所有訓(xùn)練記錄關(guān)于Xi的樣本均值來(lái)估計(jì)。同理,可以用這些訓(xùn)練記錄的樣本方差來(lái)估計(jì)。

    3.2 基于Fisher加權(quán)的樸素貝葉斯分類器

    NBC模型認(rèn)為[15],所有特征對(duì)于最終的分類結(jié)果具有同等重要的意義(即權(quán)重為1)。但是單個(gè)特征和類別之間存在不同程度的相關(guān)性,樸素貝葉斯算法直接忽略了這種相關(guān)性,可能會(huì)增加分類的誤判。本文將特征加權(quán)算法與樸素貝葉斯分類器相結(jié)合,根據(jù)其對(duì)分類的重要性給出不同的權(quán)重。屬性權(quán)重越大,屬性對(duì)分類的影響越大。將NBC擴(kuò)展到加權(quán)NBC(Weighted Naive Bayes Classifier,WNBC),以提高分類器的性能。本文采用Fisher判別準(zhǔn)則函數(shù),確定各個(gè)特征的分類權(quán)重。

    在位置rl,l=1,2,…,L處分別使用M幀數(shù)據(jù)估計(jì)單個(gè)特征的均值、方差和權(quán)重,即:

    類間離差值和類內(nèi)離差值分別為:

    則特征yi,i=1,2,…,2τm+1的Fisher準(zhǔn)則判別函數(shù)如下:

    在Fisher判別理論中,類間離差值被用來(lái)描述不同類之間的差距。類內(nèi)離差值用來(lái)描述同一類樣本之間的差距。

    當(dāng)特征的權(quán)重高于平均值時(shí),權(quán)重應(yīng)大于1,以增加其對(duì)分類的影響;當(dāng)特征的權(quán)重低于平均值時(shí),權(quán)重應(yīng)小于1,以減少其對(duì)分類的影響。

    最終確定權(quán)重的方法定義如下:

    3.3 基于互相關(guān)函數(shù)分類的聲源定位

    基于互相關(guān)函數(shù)分類的聲源定位算法的測(cè)試階段如圖2所示。

    圖2 算法測(cè)試階段

    由以上內(nèi)容可知,假設(shè)對(duì)于每個(gè)特征yli,i=1,2,…,2τm+1是相互獨(dú)立的,那么測(cè)試階段位置rl,l=1,2,…,K的特征向量Y(rl)的概率密度函數(shù)由下式給出:

    因此,采用Fisher加權(quán)的樸素貝葉斯分類器的判別函數(shù)為:

    假設(shè)在測(cè)試階段使用多幀特征向量即特征向量集合Y'(rl)={Yt(rl), t=1,2,…,N},則集合Y'的概率密度函數(shù)為:這里表示第l個(gè)位置第t幀測(cè)試數(shù)據(jù)的第i個(gè)特征。

    最終聲源位于使得概率密度函數(shù)Prl(Y' )或者Prl(Y)取得最大值的位置,即:

    4 實(shí)驗(yàn)結(jié)果與分析

    4.1 仿真實(shí)驗(yàn)

    4.1.1 實(shí)驗(yàn)環(huán)境和條件

    實(shí)驗(yàn)用鏡像法(Image)生成房間脈沖響應(yīng),來(lái)模擬一個(gè)普通的實(shí)驗(yàn)室環(huán)境,房間尺寸為6 m×4 m×3 m,兩麥克風(fēng)的坐標(biāo)分別是M1(3.85,2.5,1.2)、M2(4.15,2.5,1.2),采樣率16 kHz,聲源距離兩個(gè)麥克風(fēng)中點(diǎn)的距離距離為2 m。假設(shè)房間墻壁的反射系數(shù)β相同,根據(jù)混響時(shí)間T60與反射系數(shù)β的關(guān)系可得,反射系數(shù)越大,混響時(shí)間越大。訓(xùn)練和定位階段使用雙門限端點(diǎn)檢測(cè)算法對(duì)信號(hào)進(jìn)行端點(diǎn)檢測(cè),并對(duì)信號(hào)進(jìn)行分幀,幀長(zhǎng)512,幀移256,每幀信號(hào)加矩形窗。在實(shí)驗(yàn)過(guò)程中,聲源的位置有17個(gè),即聲源與兩麥克風(fēng)中點(diǎn)的夾角分別為(10°,20°,… ,170°)。仿真房間平面圖如圖3所示。

    4.1.2 仿真結(jié)果與分析

    為了便于描述,將使用樸素貝葉斯分類器的分類算法標(biāo)記為NBC_P,將使用基于Fisher加權(quán)的樸素貝葉斯分類器的分類算法標(biāo)記為FWNBC_P。

    (1)房間混響的影響

    在本實(shí)驗(yàn)中,主要驗(yàn)證了算法在不同混響環(huán)境下的定位性能。測(cè)試幀數(shù)分別為4幀、5幀和6幀。

    圖3 仿真房間平面圖

    圖4實(shí)驗(yàn)結(jié)果表明,在不同的混響β=0.2,0.4,0.6,0.8環(huán)境下,與NBC_P算法相比,F(xiàn)WNBC_P算法在不同測(cè)試數(shù)據(jù)幀下定位精度都有一定程度的提高。當(dāng)使用較少的測(cè)試數(shù)據(jù)幀(4幀)時(shí),兩種算法的精度隨著混響的增加而顯著降低,與NBC_P算法相比,F(xiàn)WNBC_P算法的定位準(zhǔn)確率平均提高11.71%;當(dāng)使用較多的測(cè)試數(shù)據(jù)幀(5幀)時(shí),與NBC_P算法相比,F(xiàn)WNBC_P算法的定位準(zhǔn)確率平均提高7.73%。當(dāng)使用更多的測(cè)試幀(6幀)時(shí),F(xiàn)WNBC_P算法表現(xiàn)出更好的性能,定位準(zhǔn)確率平均提高16.16%。

    通過(guò)以上分析,可以看出在不同混響條件下,與NBC_P算法相比較,F(xiàn)WNBC_P算法的定位精度都有一定程度的提高。

    (2)測(cè)試數(shù)據(jù)幀的影響

    在本實(shí)驗(yàn)中,主要驗(yàn)證了算法在不同測(cè)試數(shù)據(jù)幀數(shù)下的定位性能,反射系數(shù)分別為0.4、0.6、0.8。

    圖4 不同混響環(huán)境下不同幀測(cè)試數(shù)據(jù)的兩種算法的定位精度

    圖5 不同測(cè)試數(shù)據(jù)幀時(shí)兩種算法的定位準(zhǔn)確率

    圖5實(shí)驗(yàn)結(jié)果表明,在不同的測(cè)試數(shù)據(jù)幀下,與NBC_P算法相比,F(xiàn)WNBC_P算法在不同測(cè)試數(shù)據(jù)幀下定位精度都有一定程度的提高。當(dāng)混響較低(β=0.4)時(shí),兩種算法的準(zhǔn)確率隨著測(cè)試數(shù)據(jù)幀數(shù)的增加而顯著提高,與NBC_P算法相比,F(xiàn)WNBC_P算法的定位準(zhǔn)確率平均提高10.54%;當(dāng)混響增強(qiáng)(β=0.6)時(shí),與NBC_P算法相比,F(xiàn)WNBC_P算法的定位準(zhǔn)確率平均提高11.32%;當(dāng)處于強(qiáng)混響環(huán)境(β=0.8)時(shí),F(xiàn)WNBC_P算法的定位準(zhǔn)確率平均提高4.88%。

    通過(guò)以上分析,可以看出在不同混響條件下,隨著測(cè)試數(shù)據(jù)幀數(shù)的增加,兩種算法的定位準(zhǔn)確率都有所提高。與NBC_P算法相比較,F(xiàn)WNBC_P算法有更好的魯棒性。

    4.2 真實(shí)實(shí)驗(yàn)

    4.2.1 實(shí)驗(yàn)環(huán)境

    為了評(píng)估基于互相關(guān)函數(shù)分類的定位算法在真實(shí)環(huán)境中的可行性,在一個(gè)小型會(huì)議室中進(jìn)行了初步的真實(shí)數(shù)據(jù)的實(shí)驗(yàn),房間大小是8 m×7 m×3 m。實(shí)驗(yàn)過(guò)程中存在一定的噪聲和混響,噪聲包含電腦運(yùn)轉(zhuǎn)的聲音以及房間外人員走動(dòng)的腳步聲,房間內(nèi)有桌椅、書(shū)櫥以及墻壁等障礙物,實(shí)驗(yàn)過(guò)程中盡量保證聲源與麥克風(fēng)之間不存在障礙物。使用兩元麥克風(fēng)陣列,兩麥克風(fēng)的間距為25 cm,采樣頻率為8 kHz。搭建的實(shí)際環(huán)境下的定位圖如圖6所示。整個(gè)系統(tǒng)分為軟件和硬件兩部分,如圖7所示。

    圖6 實(shí)際環(huán)境下的聲源定位系統(tǒng)

    圖7 聲源定位系統(tǒng)的組成

    4.2.2 系統(tǒng)組成

    (1)麥克風(fēng)陣列。陣列采用兩元線陣麥克風(fēng)陣列,麥克風(fēng)使用了MP40傳聲器。MP40傳聲器是1/4英寸預(yù)極化自由場(chǎng)測(cè)量傳聲器,無(wú)需極化電壓,是一款與前置放大器不可分離的產(chǎn)品,具有靈敏度高、穩(wěn)定性好、可靠性高等特點(diǎn)。

    (2)采集卡。本文采用SKC公司的USB數(shù)據(jù)采集卡Q801,這是一款基于USB總線的高性能多功能數(shù)據(jù)采集卡,具有8路單端16位高速同步模擬信號(hào)采集功能。

    4.2.3 工作過(guò)程

    本聲源定位系統(tǒng)的實(shí)現(xiàn)過(guò)程如下:首先將麥克風(fēng)按照一定的結(jié)構(gòu)組成麥克風(fēng)陣列(一字線陣),進(jìn)行系統(tǒng)的初始化;然后對(duì)各個(gè)麥克風(fēng)進(jìn)行AD采樣;如果麥克風(fēng)陣列接收到音頻信號(hào),則將采樣后的音頻信號(hào)數(shù)據(jù)傳給PC機(jī);利用PC機(jī)對(duì)音頻信號(hào)進(jìn)行相關(guān)去噪和預(yù)處理,最后利用本文算法進(jìn)行互相關(guān)函數(shù)的鑒別,從而確定最終聲源位置。

    4.3 實(shí)驗(yàn)結(jié)果分析

    本實(shí)驗(yàn)采用不同的聲源位置,聲源距離兩麥克風(fēng)中點(diǎn)的距離分別為1.0 m、1.5 m、2.0 m,測(cè)試數(shù)據(jù)幀分別使用5幀、6幀,麥克風(fēng)坐標(biāo)M1(-0.125,0,0),M2(0.125,0,0),真實(shí)實(shí)驗(yàn)過(guò)程中設(shè)計(jì)了18組實(shí)驗(yàn)來(lái)估計(jì)聲源位置。表1給出了使用5幀測(cè)試數(shù)據(jù)且聲源距離麥克風(fēng)陣列中心距離分別為1.0 m、1.5 m、2.0 m時(shí)的不同測(cè)試位置的定位準(zhǔn)確率。

    表1 真實(shí)實(shí)驗(yàn)不同測(cè)試位置定位準(zhǔn)確率%

    與仿真實(shí)驗(yàn)相比,真實(shí)實(shí)驗(yàn)過(guò)程中存在更多的影響實(shí)驗(yàn)精度的因素,包括桌椅、書(shū)櫥、實(shí)驗(yàn)人員、四周墻壁等障礙物以及房間外的不同噪聲、采集卡和麥克風(fēng)陣列的精度等,造成真實(shí)實(shí)驗(yàn)結(jié)果與仿真實(shí)驗(yàn)相比較,定位精度有一定程度的降低。

    圖8實(shí)驗(yàn)結(jié)果顯示,F(xiàn)WNBC_P算法在實(shí)際環(huán)境下搭建的定位系統(tǒng)中定位準(zhǔn)確率優(yōu)于NBC_P算法。聲源距離為1.0 m時(shí),F(xiàn)WNBC_P算法的定位準(zhǔn)確率與NBC_P算法相比,平均提高1.62%;聲源距離1.5 m時(shí),F(xiàn)WNBC_P算法的準(zhǔn)確率與NBC_P算法相比,平均提高0.46%;聲源距離為2.0 m時(shí),與NBC_P算法相比,F(xiàn)WNBC_P算法的準(zhǔn)確率平均提高3.24%。

    5 結(jié)束語(yǔ)

    圖8 實(shí)際環(huán)境下系統(tǒng)的定位準(zhǔn)確率

    本文主要研究了基于相位變換加權(quán)的互相關(guān)函數(shù)分類的聲源定位問(wèn)題,引入了Fisher加權(quán)樸素貝葉斯分類器。通過(guò)PHAT互相關(guān)函數(shù)得到特征向量,然后利用Fisher加權(quán)樸素貝葉斯分類器估計(jì)聲源位置。同時(shí),設(shè)計(jì)并實(shí)現(xiàn)了僅基于兩個(gè)麥克風(fēng)的聲源定位系統(tǒng),并將改進(jìn)的定位算法在實(shí)際環(huán)境中進(jìn)行了聲源定位實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示,與參考算法NBC_P相比較,改進(jìn)算法在仿真實(shí)驗(yàn)和真實(shí)實(shí)驗(yàn)中,都有較好的魯棒性。在今后的研究工作中,應(yīng)當(dāng)考慮噪聲對(duì)算法準(zhǔn)確率的影響,以及考慮將該算法應(yīng)用于多聲源定位研究中。

    猜你喜歡
    混響麥克風(fēng)聲源
    板式混響在錄音鼓組中產(chǎn)生的作用
    三角洲(2024年15期)2024-12-31 00:00:00
    虛擬聲源定位的等效源近場(chǎng)聲全息算法
    Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
    基于GCC-nearest時(shí)延估計(jì)的室內(nèi)聲源定位
    電子制作(2019年23期)2019-02-23 13:21:12
    基于數(shù)字麥克風(fēng)的WIFI語(yǔ)音發(fā)射機(jī)
    海洋混響特性分析與建模仿真研究?
    麥克風(fēng)的藝術(shù)
    運(yùn)用內(nèi)積相關(guān)性結(jié)合迭代相減識(shí)別兩點(diǎn)聲源
    用于室內(nèi)環(huán)境說(shuō)話人識(shí)別的混響補(bǔ)償方法
    麥克風(fēng)
    昆山市| 南乐县| 吉木萨尔县| 剑川县| 汶上县| 宣汉县| 治县。| 武乡县| 丘北县| 钦州市| 长岭县| 阿勒泰市| 衡南县| 临西县| 错那县| 呼和浩特市| 五指山市| 晋中市| 唐山市| 齐齐哈尔市| 屏边| 奎屯市| 科尔| 个旧市| 信丰县| 安岳县| 平利县| 广德县| 兴安盟| 于都县| 壤塘县| 兴国县| 山阳县| 宜宾县| 绿春县| 容城县| 六枝特区| 酒泉市| 平江县| 枞阳县| 珠海市|