• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于線性判別分析的室內(nèi)聲源定位方法

      2017-06-27 08:14:13顧曉瑜
      關(guān)鍵詞:混響麥克風(fēng)聲源

      楊 悅,顧曉瑜

      (南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)

      基于線性判別分析的室內(nèi)聲源定位方法

      楊 悅,顧曉瑜

      (南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)

      在小信噪比和混響時(shí)間較長(zhǎng)的惡劣環(huán)境下,基于模式分類的手段能夠有效克服傳統(tǒng)的聲源定位算法魯棒能力不足的缺點(diǎn),其中樸素貝葉斯分類器定位的準(zhǔn)確率高,計(jì)算量小,魯棒能力強(qiáng)。在此基礎(chǔ)上,為了獲得更好的定位性能,提出使用線性判別分析(LDA)分類器進(jìn)行聲源定位。使用Matlab進(jìn)行仿真,截取聲源信號(hào)的相位變換加權(quán)廣義互相關(guān)函數(shù)(PHAT-GCC)作為特征向量,通過投影變換,找到最佳的特征空間來區(qū)分特征數(shù)據(jù),從而訓(xùn)練得到線性判別分析分類器。然后在不同的混響時(shí)間和信噪比的條件下,進(jìn)行定位測(cè)試,比較了線性判別分析分類器和樸素貝葉斯分類器的性能。仿真結(jié)果表明,在環(huán)境惡劣場(chǎng)合更宜使用線性判別分析分類器,特別是混響嚴(yán)重時(shí),線性判別分析分類器的定位準(zhǔn)確率比樸素貝葉斯分類器高1%~2%。

      聲源定位;相位變換加權(quán)廣義互相關(guān)函數(shù);LDA分類器;樸素貝葉斯分類器

      0 引 言

      基于麥克風(fēng)陣列的聲源定位技術(shù)一直是國(guó)內(nèi)外研究的一項(xiàng)熱點(diǎn)。它的主要原理是:通過具有一定幾何拓?fù)浣Y(jié)構(gòu)的麥克風(fēng)陣列采集聲源信號(hào),通過陣列信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行處理和分析,從而確定聲源位置?;邴溈孙L(fēng)陣列的聲源定位技術(shù)已廣泛應(yīng)用于許多領(lǐng)域,如視頻會(huì)議、聲音檢測(cè)、語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別、說話人識(shí)別、智能機(jī)器人、監(jiān)控監(jiān)聽系統(tǒng)、助聽裝置等。傳統(tǒng)的聲源定位技術(shù)研究大體上分為三類:基于最大輸出功率可控波束形成技術(shù)、基于高分辨率譜估計(jì)技術(shù)、基于時(shí)延估計(jì)技術(shù)。其中,基于廣義互相關(guān)時(shí)延估計(jì)算法(Generalized Cross-Correlation,GCC)由于其計(jì)算量小、方法簡(jiǎn)單、容易實(shí)現(xiàn),得到了廣泛應(yīng)用[1-3]。

      由于房間墻壁的吸收,聲源發(fā)出的聲波在各方向來回反射,又逐漸衰減的現(xiàn)象,稱為室內(nèi)混響。當(dāng)聲源停止后,從初始的聲壓降到60 dB所需的時(shí)間稱為混響時(shí)間,在這里用T60表示室內(nèi)聲音的混響時(shí)間[1-2]。室內(nèi)混響的存在,對(duì)時(shí)延估計(jì)影響很大。因此,對(duì)于聲源定位算法來說,如何提高抗噪聲和抗混響能力是長(zhǎng)久以來的研究重心,很多改進(jìn)方法的提出對(duì)克服糟糕的環(huán)境影響有一定的作用,如對(duì)GCC進(jìn)行加權(quán)處理[4-5],但是在信噪比很小,混響很嚴(yán)重的情況下,基于傳統(tǒng)算法的改進(jìn)措施很難有明顯的效果;此外當(dāng)麥克風(fēng)無法接收到聲源的直達(dá)聲時(shí),也難以定位。

      近年來,隨著統(tǒng)計(jì)機(jī)器學(xué)習(xí)的發(fā)展,很多傳統(tǒng)的問題有了新興的解決方式[6],聲源定位領(lǐng)域也是如此。文獻(xiàn)[7-8]提出了針對(duì)頭相關(guān)函數(shù)(HRTF)特征提取并通過K-Means聚類和神經(jīng)網(wǎng)絡(luò)進(jìn)行聲源定位的方法;文獻(xiàn)[9-10]使用樸素貝葉斯分類器,通過鑒別互相關(guān)函數(shù)的方法進(jìn)行聲源定位。這類方法能有效解決傳統(tǒng)聲源定位算法的缺點(diǎn),不僅有很好的魯棒性,而且計(jì)算效率高。

      在此基礎(chǔ)上,為了能夠進(jìn)一步提高在惡劣條件下聲源定位的效果,提出采用LDA(線性判別分析)分類器鑒別相位變換加權(quán)廣義互相關(guān)函數(shù)來進(jìn)行聲源定位的方法,并對(duì)其進(jìn)行了實(shí)驗(yàn)。

      1 PHAT-GCC

      PHAT-GCC(PHAse Transform Generalized Cross -Correlation)方法是經(jīng)典的基于時(shí)延的聲源定位技術(shù)之一。輕量級(jí)的計(jì)算復(fù)雜度和易于實(shí)現(xiàn)的特點(diǎn)使其應(yīng)用廣泛。

      由于來自同一聲源的信號(hào)具有一定的相關(guān)性,通過計(jì)算不同麥克風(fēng)接收到的信號(hào)的相關(guān)函數(shù),由相關(guān)函數(shù)的峰值可以確定時(shí)延差,從而計(jì)算出聲源的位置。相關(guān)函數(shù)的計(jì)算如式(1):

      (1)

      然而在實(shí)際環(huán)境中,由于噪聲和混響的影響,相關(guān)函數(shù)的最大峰會(huì)被弱化,有時(shí)還會(huì)出現(xiàn)多個(gè)峰值,給實(shí)際峰值檢測(cè)帶來了困難。因此,對(duì)于互相關(guān)函數(shù)法,常使用加權(quán)函數(shù)突出時(shí)延峰值來減小混響和噪聲的影響,其中PHAT(相位加權(quán))能在噪聲較小時(shí)有效地抗混響。相位加權(quán)廣義互相關(guān)函數(shù)的計(jì)算如式(2):

      (2)

      (3)

      其中,ψ1,2(ω)為相位加權(quán),相當(dāng)于白化濾波,改進(jìn)后的互功率譜是一個(gè)純相位函數(shù),它的幅值為1,因此PHAT加權(quán)是用相位的信息來求時(shí)延。

      但當(dāng)噪聲增大時(shí),信噪比較低的頻率逐漸增多,PHAT-GCC的性能逐漸下降,這種方法就不管用了。對(duì)于PHAT-GCC來說,當(dāng)噪聲和混響嚴(yán)重時(shí),可能會(huì)出現(xiàn)多個(gè)虛假譜峰,但是在相同的室內(nèi)環(huán)境下,同一位置聲源引起的混響對(duì)譜峰的干擾是類似的,如果使用模式識(shí)別的方法,將帶有混響的信號(hào)的PHAT-GCC作為特征,而非峰值檢測(cè)的方法。由混響產(chǎn)生的虛假譜峰也能看成是一種特征,可以一定程度上減小混響的影響,在小信噪比的情況下定位性能不至于迅速下降,比傳統(tǒng)的時(shí)延定位算法有更強(qiáng)的魯棒性。

      2 線性判別分析

      LDA是一種經(jīng)典的線性學(xué)習(xí)方法,也稱“Fisher判別分析”,常常作為特征提取和降維算法用于人臉識(shí)別、人臉檢測(cè)中[11-13],也可直接作為分類器使用[14-16]。其思想是將高維的樣本投影到最佳鑒別矢量空間,以達(dá)到抽取分類信息和壓縮特征空間維數(shù)的效果,使投影后的樣本在新的子空間有最大的類間距離和最小的類內(nèi)距離,從而能更好地分辨模式類別[17]。LDA投影示例如圖1所示[18]。

      圖1 LDA投影示例

      則引入目標(biāo)函數(shù)J:

      (4)

      定義“類內(nèi)散度矩陣”為:

      (5)

      定義“類間散度矩陣”為:

      Sb=(μ1-μ2)(μ1-μ2)T

      (6)

      則式(3)可重寫為:

      (7)

      計(jì)算出LDA模型參數(shù)后,即可將測(cè)試樣本數(shù)據(jù)y投影到w上,得到投影結(jié)果Z=wTy。再由判決式(8)決定類別:

      (8)

      (9)

      其中,N1和N2分別是第一類訓(xùn)練樣本和第二類訓(xùn)練樣本的個(gè)數(shù)。

      3 基于LDA分類器的聲源定位方法

      3.1 PHAT-GCC特征提取

      在房間中放置2個(gè)麥克風(fēng)的麥克風(fēng)陣,位于ls的聲源S到第i個(gè)麥克風(fēng)的房間脈沖響應(yīng)為hi(ls,t)(i=1,2)。設(shè)聲源S發(fā)出的信號(hào)為s(t),則麥克風(fēng)接收到的信號(hào)為xi(t)=hi(ls,t)*s(t),其離散傅里葉變換為Xi(k)。由式(2)可以求得長(zhǎng)度為K幀的PHAT-GCC:Rj(τ),j=1,2,…,K。

      對(duì)于任意一幀Rj(τ),截取特征數(shù)據(jù):

      (10)

      (11)

      其中,round為取整函數(shù);D為麥克風(fēng)間距;fs為采樣頻率;c為聲速;因子α設(shè)為1.67。

      即截取PHAT-GCC譜線上所有可能取得譜峰的時(shí)延點(diǎn)的數(shù)據(jù),轉(zhuǎn)化為特征數(shù)據(jù)集,最終可以得到:Y=[y1,y2,…,yK]。

      3.2 訓(xùn)練LDA分類器模型

      聲源位于L個(gè)不同的方位角,即分類目標(biāo)有多種類別,因此需要訓(xùn)練多分類LDA模型。對(duì)于LDA的多分類問題,可以直接從二分類問題的求解方式推廣出來,也可以使用“One vs Rest”或“One vs All”方法[17]將多分類任務(wù)拆分成若干個(gè)二分類任務(wù)來實(shí)現(xiàn)。這里通過直接多分類的方式求解模型。

      對(duì)于L個(gè)類別的訓(xùn)練數(shù)據(jù)Yi(i=1,2,…,L),使用D個(gè)投影向量W=[w1,w2,…,wD],對(duì)K幀訓(xùn)練數(shù)據(jù)進(jìn)行投影,結(jié)果為Z=WTYi。此時(shí)類內(nèi)散度矩陣由式(5)推廣到:

      (12)

      (13)

      類間散度矩陣由式(6)推廣到:

      (14)

      其中,μ為全體樣本均值。

      此時(shí)目標(biāo)函數(shù)可選擇:

      (15)

      其中,tr(·)表示矩陣的跡。

      3.3 定位測(cè)試

      對(duì)于K'幀的測(cè)試數(shù)據(jù),可以使用單幀PHAT-GCC數(shù)據(jù)測(cè)試一個(gè)方位,測(cè)試K'次;也可以同時(shí)使用多幀數(shù)據(jù)進(jìn)行定位。

      LDA分類器的聲源定位流程見圖2。

      圖2 LDA分類器的聲源定位流程

      4 仿真實(shí)驗(yàn)

      實(shí)驗(yàn)使用Matlab R2014A進(jìn)行仿真。使用RoomSim工具包[19]模擬室內(nèi)環(huán)境,使用LDA分類器在小信噪比和較嚴(yán)重的混響環(huán)境下進(jìn)行定位,并將結(jié)果和樸素貝葉斯分類器的定位結(jié)果進(jìn)行對(duì)比。

      4.1 實(shí)驗(yàn)數(shù)據(jù)

      仿真的房間尺寸為8 m×6 m×3 m,使用2個(gè)麥克風(fēng)組成麥克風(fēng)陣,麥克風(fēng)陣位于(4,2.5,1.5)處,麥克風(fēng)間距0.3 m;對(duì)接收到的信號(hào)分幀加漢寧窗,每幀512點(diǎn),幀移256點(diǎn),即每幀信號(hào)長(zhǎng)度32 ms,使用100幀訓(xùn)練數(shù)據(jù)Ytrain=[y1,y2,…,y100]和400幀測(cè)試數(shù)據(jù)Ytest=[y101,y102,…,y500];聲源信號(hào)采用麻省理工學(xué)院TIMIT語(yǔ)音庫(kù)的語(yǔ)音。聲源位于以麥克風(fēng)陣中點(diǎn)為圓心,半徑為2 m的圓弧上,方向角為10°、30°、50°、70°、90°、110°、130°、150°、170°共9個(gè)位置,如圖3所示。

      圖3 仿真的房間平面圖

      實(shí)驗(yàn)參數(shù)如下:中等的混響時(shí)間T60=300 ms和嚴(yán)重的混響時(shí)間T60=600 ms;加性白噪聲信噪比為clean(無噪)、25 dB、20 dB、15 dB、10 dB和5 dB;特征屬性使用單幀PHAT-GCC。

      4.2 結(jié)果與分析

      在混響時(shí)間T60=300 ms和T60=600 ms這兩種情況下,分別比較了LDA算法和樸素貝葉斯算法在6種信噪比情況下的定位準(zhǔn)確率,如圖4和圖5所示。

      圖4 T60=300 ms時(shí)的定位準(zhǔn)確率比較

      從實(shí)驗(yàn)結(jié)果中可以看出,定位準(zhǔn)確率隨著信噪比的降低而降低,隨著混響的加強(qiáng)而降低。在T60=300 ms時(shí),信噪比為25 dB,20 dB,15 dB,10 dB的情況下,使用LDA算法定位的準(zhǔn)確率相比樸素貝葉斯算法有1%左右的小幅提升。當(dāng)T60=600 ms時(shí),6種信噪比的情況下,使用LDA算法定位的準(zhǔn)確率相比樸素貝葉斯算法都有明顯提升,能提高2%左右的準(zhǔn)確率。顯然,混響嚴(yán)重的情況下更宜使用LDA分類器進(jìn)行定位。

      5 結(jié)束語(yǔ)

      為了提高惡劣環(huán)境下聲源定位的性能,提出了一種基于LDA分類器的聲源定位方法,使用PHAT-GCC作為特征。實(shí)驗(yàn)中僅使用了單幀(32 ms)PHAT-GCC作為特征屬性,實(shí)際環(huán)境下可以使用多幀PHAT-GCC數(shù)據(jù),能得到更高的準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,LDA分類器在聲源定位的性能上優(yōu)于樸素貝葉斯分類器,特別是在混響嚴(yán)重的情況下有明顯優(yōu)勢(shì),顯著改善了在惡劣環(huán)境下聲源定位的效果。

      [1] 萬新旺.基于陣列信號(hào)處理與空間聽覺的聲源定位算法研究[D].南京:東南大學(xué),2011.

      [2] 周 峰.室內(nèi)麥克風(fēng)陣列聲源定位算法研究和實(shí)現(xiàn)[D].上海:復(fù)旦大學(xué),2009.

      [3] 劉 超.基于麥克風(fēng)陣列的聲源定位算法研究[D].南京:南京大學(xué),2015.

      [4] 崔瑋瑋,曹志剛,魏建強(qiáng).聲源定位中的時(shí)延估計(jì)技術(shù)[J].數(shù)據(jù)采集與處理,2007,22(1):90-99.

      [5] 夏 陽(yáng),張?jiān)?基于矩形麥克風(fēng)陣列的改進(jìn)的GCC-PHAT語(yǔ)音定位算法[J].山東科學(xué),2011,24(6):75-79.

      [6] 檀何鳳,劉政怡.模式分類方法比較研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2015,25(2):99-102.

      [7] 馬 浩,吳鎮(zhèn)揚(yáng),張 杰,等.與頭相關(guān)傳遞函數(shù)的雙耳特征提取與分類[J].電路與系統(tǒng)學(xué)報(bào),2007,12(5):58-64.

      [8] 馬 浩,周 琳,胡紅梅,等.基于與頭相關(guān)傳遞函數(shù)的神經(jīng)網(wǎng)絡(luò)聲源定位方法研究[J].電子與信息學(xué)報(bào),2007,29(9):2058-2062.

      [9] Wan Xinwang,Wu Zhenyang.Sound source localization based on discrimination of cross-correlation functions[J].AppliedAcoustics,2013,74(1):28-37.

      [10] Wan Xinwang,Liang Juan.Improved sound source localization using classifier in reverberant noisy environment[J].Journal of Applied Science,2013,13(21):4897-4901.

      [11] 李道紅.線性判別分析新方法研究及其應(yīng)用[D].南京:南京航空航天大學(xué),2004.

      [12] 王建國(guó),楊萬扣,鄭宇杰,等.一種基于ICA和模糊LDA的特征提取方法[J].模式識(shí)別與人工智能,2008,21(6):819-823.

      [13] 謝永林.LDA算法及其在人臉識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(19):189-192.

      [14] Mansor M N,Rejab M N,Syam S,et al.Automatically infant pain recognition based on LDA classifier[C]//International symposium on instrumentation & measurement,sensor network and automation.[s.l.]:[s.n.],2012:380-382.

      [15] Zhang Y,Zhou X,Witt R M,et al.Automated spine detection using curvilinear structure detector and LDA classifier[J].Neuroimage,2007,36(2):346-360.

      [16] 陳惠勤,駱德漢.基于擴(kuò)散映射和LDA的辛味中藥材鑒別研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2015,25(5):192-195.

      [17] 周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.

      [18] Bishop C.Pattern recognition and machine learning[M].[s.l.]:Springer,2007.

      [19] Campbell D.ROOMSIMtoolbox[EB/OL].2012-08-08.http://media.paisley.ac.uk/~campbell/Roomsim/.

      Indoor Acoustic Source Localization Method with LDA

      YANG Yue,GU Xiao-yu

      (College of Telecommunications and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

      The method based on pattern classification can overcome the deficiency of traditional acoustic source localization algorithms which has an insufficient robust ability in the harsh environment of small SNR and severe reverberation.Among them,Naive Bayes classifier has high location accuracy with a small amount of calculation and strong robustness.In order to achieve better localization performance,Linear Discriminant Analysis (LDA) classifier is adopted to locate acoustic source on the basis of former research.It has been tested by Matlab,while the Phase Transform Generalized Cross-Correlation (PHAT-GCC) function would be used as feature vector.LDA classifier has been trained through projection transformation which could help to find a better feature space to discriminate the feature data.Subsequently,the source would be located in different reverberation and noisy conditions to compare the performance with LDA classifier and Naive Bayes classifier.The simulation results have demonstrated that LDA classifier is a better choice in harsh environment and that the location accuracy of LDA classifier is higher than that of Naive Bayes classifier by 1% to 2%,especially in severe reverberation environment.

      acoustic localization;PHAT-GCC;LDA classifier;Naive Bayes classifier

      2016-07-07

      2016-10-13 網(wǎng)絡(luò)出版時(shí)間:2017-04-28

      江蘇省自然科學(xué)基金(BK20140891);聲納技術(shù)國(guó)防科技重點(diǎn)實(shí)驗(yàn)室開放研究基金(KF201503)

      楊 悅(1989-),男,碩士研究生,研究方向?yàn)檎Z(yǔ)音處理、聲源定位、機(jī)器學(xué)習(xí)。

      http://kns.cnki.net/kcms/detail/61.1450.TP.20170428.1703.058.html

      TP301

      A

      1673-629X(2017)06-0187-04

      10.3969/j.issn.1673-629X.2017.06.039

      猜你喜歡
      混響麥克風(fēng)聲源
      板式混響在錄音鼓組中產(chǎn)生的作用
      三角洲(2024年15期)2024-12-31 00:00:00
      虛擬聲源定位的等效源近場(chǎng)聲全息算法
      Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
      基于GCC-nearest時(shí)延估計(jì)的室內(nèi)聲源定位
      電子制作(2019年23期)2019-02-23 13:21:12
      基于數(shù)字麥克風(fēng)的WIFI語(yǔ)音發(fā)射機(jī)
      海洋混響特性分析與建模仿真研究?
      麥克風(fēng)的藝術(shù)
      運(yùn)用內(nèi)積相關(guān)性結(jié)合迭代相減識(shí)別兩點(diǎn)聲源
      用于室內(nèi)環(huán)境說話人識(shí)別的混響補(bǔ)償方法
      麥克風(fēng)
      罗山县| 阿拉善右旗| 庆城县| 丰宁| 余干县| 石狮市| 沙坪坝区| 玛纳斯县| 交口县| 孝感市| 栾川县| 闽侯县| 湘阴县| 新乡县| 方城县| 确山县| 清流县| 大厂| 晋江市| 伊吾县| 克什克腾旗| 昔阳县| 阿拉善盟| 洪洞县| 廉江市| 鹤庆县| 丹巴县| 丰顺县| 鸡西市| 汝城县| 桐庐县| 沈阳市| 扎赉特旗| 廉江市| 五峰| 安丘市| 南和县| 雅江县| 阿尔山市| 昆山市| 循化|