基于陣列麥克風(fēng)的語音采集增強(qiáng)系統(tǒng)設(shè)計

2016-05-08 07:34:04蔡渤

襄陽職業(yè)技術(shù)學(xué)院學(xué)報 2016年2期

蔡渤

（武漢職業(yè)技術(shù)學(xué)院，武漢 430074）

多媒體教學(xué)、安防、智能家居和展覽展示等方面均需要高性能的語音采集及處理技術(shù)。模擬拾音器由于技術(shù)路線的局限，采集的音頻信號質(zhì)量不高，制約了音頻監(jiān)控系統(tǒng)的進(jìn)一步使用。多通道語音增強(qiáng)方法利用麥克風(fēng)陣列，在時、頻域?qū)г胝Z音信號進(jìn)行濾波，同時可以通過DOA估計獲取聲場空間信息進(jìn)行波束形成，從而進(jìn)行更好的空間指向性濾波，使得麥克風(fēng)陣列在獲取感興趣語音信號的同時，對噪聲信號與混響具有抑制作用。[1]

一、麥克風(fēng)陣列簡介

麥克風(fēng)陣列是指按一定距離排列放置的一組麥克風(fēng)，通過聲波抵消陣列中每個麥克風(fēng)之間微小時差的相互作用，麥克風(fēng)陣列可以得到比單個的麥克風(fēng)更好的指向性。[2]其在時域和頻域的基礎(chǔ)上增加一個空間域,對來自空間不同方位的信號進(jìn)行空時頻聯(lián)合處理,它既繼承了天線陣列的有關(guān)算法,同時又吸收了一些單麥克風(fēng)語音處理的方法?；谶@一特點(diǎn),與單個麥克風(fēng)相比,麥克風(fēng)陣列具有空間選擇性,使它在捕獲特定方向的高質(zhì)量信號的同時,又減少了噪聲和其它干擾。因此,麥克風(fēng)陣列可以廣泛應(yīng)用于各種具有嘈雜背景的語音通信環(huán)境，如會場、多媒體教室、助聽器、車載免提電話、戰(zhàn)場等,以提高語音通信質(zhì)量。

在麥克風(fēng)陣列的設(shè)計中首要的改進(jìn)是引入了波束形成、陣列指向性與波束寬度的概念。通過對所有麥克風(fēng)信號的綜合處理，麥克風(fēng)陣列可以組合成為所要求的強(qiáng)指向性麥克風(fēng)，形成被稱為“波束”的指向特性。麥克風(fēng)陣列的波束可以經(jīng)由特殊電路或程序算法軟件控制,使其指向聲源方向而加強(qiáng)音頻采集效果。

所謂基于麥克風(fēng)陣列的語音增強(qiáng)，就是通過對麥克風(fēng)陣列接收的多通道數(shù)據(jù)進(jìn)行處理，增強(qiáng)感興趣的聲源信號，抑制不感興趣的聲源信號和噪聲。[3]由于噪聲種類繁多且特性各不相同，需要針對不同的噪聲環(huán)境選擇不同的方法。

二、基于陣列麥克風(fēng)的語音增強(qiáng)系統(tǒng)

本文創(chuàng)新地實(shí)現(xiàn)一種基于麥克風(fēng)陣列的子帶自適應(yīng)波束形成和自適應(yīng)后置濾波聯(lián)合的語音增強(qiáng)系統(tǒng)，由麥克風(fēng)陣列拾音器、子帶分割濾波器、自適應(yīng)波束形成器、波束更新控制單元、后置濾波器、子帶聚焦濾波器、長線驅(qū)動器、嘯叫抑制單元、后臺硬盤錄音儀和網(wǎng)絡(luò)錄音管理終端組成。內(nèi)部框圖如圖1所示。

本項目源于陣列天線波束形成和信源定位思想，在人機(jī)交互、視頻會議、安防與機(jī)器人聽覺等諸多領(lǐng)域具有廣泛的應(yīng)用?，F(xiàn)有的語音拾取設(shè)備在強(qiáng)噪聲下性能急劇下降，而麥克風(fēng)陣列波束形成技術(shù)是這一問題的有效解決方案。初步設(shè)計具有陣列拾音器模塊、波束形成和后置濾波模塊、長線驅(qū)動和嘯叫抑制模塊及Web管理模塊。下面分別介紹各個模塊。

圖1 麥克風(fēng)陣列增強(qiáng)系統(tǒng)內(nèi)部框圖

（一）陣列拾音器模塊

陣列信號處理技術(shù)已經(jīng)廣泛應(yīng)用于雷達(dá)、通信、聲納等領(lǐng)域，可以同時處理多個到達(dá)信號，擁有靈活的波束控制能力、較強(qiáng)的抗外界干擾能力及分辨率、測向精度和靈敏度更高等優(yōu)勢?？臻g譜估計集中研究空間中多傳感器陣列處理系統(tǒng)對感興趣的空間信號的各種參數(shù)進(jìn)行準(zhǔn)確估計的能力，其中對信源方向的估計稱為波達(dá)方向（DOA：direction of arrival）估計（或測向），是波束形成的重要基礎(chǔ)和依據(jù)。本文采用波束形成處理低頻相關(guān)噪聲，將麥克風(fēng)陣列語音增強(qiáng)技術(shù)應(yīng)用到拾音器上，解決了抑制環(huán)境噪聲和干擾及移動時語音采集的難點(diǎn)。在車載系統(tǒng)、視頻會議系統(tǒng)、非手持式移動電話、音控系統(tǒng)和助聽器等系統(tǒng)中，麥克風(fēng)陣列具有提供一種自然通信方式的潛質(zhì)。這使得使用者無論置身于任何復(fù)雜聲學(xué)環(huán)境中，都能獲得高質(zhì)量語音信號，可以自由走動而無需佩戴耳機(jī)和麥克風(fēng)。

（二）波束形成和后置濾波模塊

采用C6657雙核DSP處理器，其軟件驗證框架如圖2所示。

圖2 C6657雙核處理框架

由于麥克風(fēng)陣列每個接收通道包括6個咪頭組成的麥克風(fēng)陣列、放大器、正交相位A/D等模擬器件，具有一定的寬帶性能。這些電路特性的變化，會引起系統(tǒng)頻率特性的變化，而這種變化是隨機(jī)的，從而導(dǎo)致各通道之間頻率特性是不一致的，這種頻帶不一致性（通道失配），導(dǎo)致波束形成和陣列流形不同，不能直接應(yīng)用窄帶信號的處理方法。本文提出了用子帶分割法將寬帶語音信號分割成多組不同頻率的窄帶信號子帶，[4]基于均勻DFT子帶波束形成器將各個頻段分別進(jìn)行信號處理，處理后進(jìn)行聚焦，很好地解決了通道間的頻帶不一致性問題，獲得了良好的自適應(yīng)陣列處理性能。

（三）長線驅(qū)動和嘯叫抑制模塊

將進(jìn)行增強(qiáng)處理并聚焦后的語音信號功率放大后進(jìn)行平衡傳輸，利用相位抵消的原理將音頻信號傳輸過程中所受的其他干擾降至最低。實(shí)際使用情況表明，該長線驅(qū)動器可使信號傳輸距離達(dá)到2 000 m；經(jīng)后續(xù)改進(jìn)后，可驅(qū)動音頻信號傳輸距離可達(dá)3 000 m。本項目引入了基于調(diào)頻和移相的嘯叫抑制單元。

嘯叫抑制單元采用移頻技術(shù)使擴(kuò)聲系統(tǒng)的聲反饋向高頻和低頻區(qū)偏移，避免聲反饋與聲場峰點(diǎn)的累加，有效抑制了擴(kuò)音系統(tǒng)的嘯叫現(xiàn)象。在后續(xù)改進(jìn)中，本項目在移頻處理的基礎(chǔ)上引入調(diào)相方式對嘯叫進(jìn)行聯(lián)合抑制，通過改變輸入信號的相位來破壞嘯叫的建立條件，同時減小移頻數(shù)至3 Hz，在語音失真較小的前提下完成對系統(tǒng)自激嘯叫的抑制。

（四）網(wǎng)絡(luò)管理終端

網(wǎng)絡(luò)管理終端系統(tǒng)是為了配合硬盤錄音儀而使用的，查詢錄音數(shù)據(jù)，可以不用訪問錄音儀，方便用戶通過Web瀏覽器訪問本系統(tǒng)。

三、結(jié)束語

本文實(shí)現(xiàn)一種基于麥克風(fēng)陣列的子帶自適應(yīng)波束形成和自適應(yīng)后置濾波聯(lián)合的語音增強(qiáng)系統(tǒng)。應(yīng)用麥克風(fēng)陣列語音增強(qiáng)技術(shù)，解決了抑制環(huán)境噪聲干擾的問題。系統(tǒng)通過多核DSP平臺實(shí)現(xiàn)，采用麥克風(fēng)陣列自適應(yīng)波束形成技術(shù)達(dá)到增強(qiáng)期望方向的語音，對噪聲的抑制采用在方向圖上產(chǎn)生零陷，對非相干噪聲采用后置自適應(yīng)濾波技術(shù)，能極大地提高系統(tǒng)采集語音的性能。

參考文獻(xiàn)：

［1］楊毅，楊宇，余達(dá)太.麥克風(fēng)陣列及其消噪性能研究[J].計算機(jī)工程，2006（2）：191-193.

［2］洪鷗.麥克風(fēng)陣列語音增強(qiáng)技術(shù)及其應(yīng)用[J].傳感器與儀器儀表，2006（1）：142-145.

［3］何成林，杜利民，馬聽.基于子帶廣義旁瓣相消器的麥克風(fēng)陣列語音增強(qiáng)[J].計算機(jī)應(yīng)用研究，2006（4）：208一210.

［4］B.Cai,Y.M.Li and H.Y.Wang.Forward/backword spatial reconstruction method for directions of arrival estimation of uncorrelated and coherent signals[J].IET Microwaves,Antennas&Propagation,2012（6）：1498-1505.