• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于時域濾波多頻段MMSE的語音增強研究

      2017-11-25 09:57:07劉郭杉張小宇
      科技資訊 2017年28期

      劉郭杉++張小宇

      摘 要:本文提出一種時域濾波中多頻帶語音增強的方法,通過將時域中的未處理語音過濾成各種等效的基于矩形帶寬的子帶,然后在每個頻帶中使用基于離散余弦變換(DCT)MMSE來估計清晰語音。該算法在0~10dB的SNR水平上優(yōu)于用于汽車、餐廳、列車、白色和工廠噪聲的現(xiàn)有技術(shù)。

      關(guān)鍵詞:MMSE 多頻帶 DCT

      中圖分類號:TN91 文獻標(biāo)識碼:A 文章編號:1672-3791(2017)10(a)-0030-02

      語音通信系統(tǒng)的性能特征在于語音質(zhì)量和可懂度。然而,這些因素容易受到外部噪聲源干擾而劣化。在這些源中,背景噪聲是最常見的,并且以加法方式影響語音信號。

      頻域語音增強的噪聲去除方法主要使用傅里葉變換(FT)衍生的頻譜。這種方法不僅可以增強未處理語音的幅度頻譜,同時可以保持未處理語音的相位不受干擾。雖然這些技術(shù)顯著改善了語音質(zhì)量,但是它們作為單個實體作用于整個頻帶,而語音和噪聲分量并不是均勻地分布在所有的頻帶上。因此,提出了改進的多頻帶譜減法,將未處理語音頻譜線性或非線性劃分各個子帶,并且獨立地對每個子帶執(zhí)行噪聲去除,即通過傅里葉變換給每個頻帶不同的權(quán)重,將信號分解成含有不同權(quán)重的頻率分量。未處理語音由于噪聲的不均勻分布,頻域頻帶劃分將導(dǎo)致子帶具有不同的信噪比(SNR),當(dāng)每個子帶中的語音分量被增強時,每個子帶的SNR改變,即頻率分量的分布也與之前的不同。所以,在使用導(dǎo)出原始未處理語音的權(quán)重就會導(dǎo)致純凈語音的不準(zhǔn)確估計。為了克服這些問題,使用時域濾波可能會更合適。

      1 全頻帶MMSE(DCT-C)

      MMSE頻譜幅度估計器使用從UP語音頻譜分量估計的先驗SNR和后驗SNR來估計干凈語音頻譜。UP語音信號的DCT導(dǎo)出頻譜的MMSE估計器收斂到Weiner濾波器用于實變換,并且其由下式給出:

      其中,是由決策指導(dǎo)方法估計的先驗SNR,并且是當(dāng)前段是語音段的似然性。固定值表現(xiàn)出對特定情況(僅噪聲/語音)的偏差。另一方面,對于基于多頻段DCT的MMSE估計器,提出了一種基于全局和局部先驗SNR來計算閾值的方法,并且在下面的部分中討論。

      2 時域濾波多頻帶MMSE(TMB-MMSE)

      當(dāng)前的工作中,使用頻帶特定的閾值來計算用于多頻帶MMSE的。在每個頻帶信號中,基于兩個因素,即(i)全局先驗SNR()和(ii)局部先驗SNR()來計算用于固定的閾值,其中前者是為UP全帶信號,后者是為子帶信號估計的先驗SNR。對全帶UP語音段和第i個子帶濾波段的第T段估計的全局1和局部2先驗SNR由下式給出:

      其中,是針對第T個語音段中的第n個樣本估計的先驗SNR,并且N是段中的樣本的總數(shù)。

      3 性能評價

      語音增強算法使用從TIMIT語料庫,NOISEX-92是一個噪聲數(shù)據(jù)庫,包括8種不同的非固定噪聲、如工廠、機槍、白噪聲、粉紅噪聲等。將來自NOISEX-92和AURORA數(shù)據(jù)庫的噪聲以不同的SNR水平被添加到TIMIT和NOIZEUS數(shù)據(jù)庫中的干凈的語音中,獲得未處理語音信號。在這個系統(tǒng)中,以0~10dB的SNR水平,添加5個不同的噪聲,即,餐廳噪聲,白噪聲,工廠噪聲(選自NOISEX-92)、汽車噪聲和火車噪聲(選自AURORA)。UP語音信號是以25ms的幀大小和段之間50%重疊的漢明窗口。

      TMB-MMSE與DFT-C和DCT-C的比較:TMB-MMSE,DFT-C和DCT-C算法的目標(biāo)質(zhì)量度量顯示如下。

      所提出的方法(TMB-MMSE)導(dǎo)致所考慮的所有噪聲條件下PESQ評分的語音質(zhì)量得到改善。對于汽車,工廠和白噪聲,質(zhì)量提高了0.3~0.8,而對于火車和汽車噪聲,TMB-MMSE參考UP語音實現(xiàn)了0.2~0.4的改善(見表1)。

      根據(jù)SD分數(shù),TMB-MMSE與DCT-C和DFT-C相比較。

      通過TMB-MMSE增強的語音中的殘余噪聲與DCT-C和DFT-C相比較,通過TMB-MMSE增強的語音中BD的減少對于汽車,白色和工廠噪聲為0.3~0.5左右,而對于混音和列車噪聲,分別減少了0.1和0.2(見表2)。

      總而言之,TMB-MMSE通過DCT-C顯著地提高了整體增強的語音質(zhì)量,DCT-C提高了0.1~0.3,DFT-C提高了0.02~0.3。

      4 結(jié)語

      在這項工作中,使用DCT派生的頻譜開發(fā)了時域濾波多頻帶(基于ERB)語音增強算法。通過時域濾波克服了存在于頻域多頻帶方法中的相鄰頻帶頻率分量的影響。實驗結(jié)果可以看出,本文提出的算法比傳統(tǒng)的語音增強方法增強效果好。PESQ值驗證了改進的算法具有更好的語音質(zhì)量。使用改進的算法具有比傳統(tǒng)算法低的SD量和BD量。

      參考文獻

      [1] 于文慧.基于短時譜估計的MMSE語音增強算法研究[D].長春:吉林大學(xué),2012.

      [2] 寧礦鳳,王景芳.DCT域維納濾波語音增強[J].計算機工程與應(yīng)用,2015,51(8):226-230.endprint

      屏山县| 肇东市| 长汀县| 新蔡县| 阜宁县| 怀化市| 梅河口市| 汪清县| 磐安县| 长寿区| 德清县| 邓州市| 海淀区| 渭源县| 萨迦县| 徐州市| 云浮市| 山西省| 福贡县| 井冈山市| 泗阳县| 浏阳市| 清徐县| 汉沽区| 南乐县| 从化市| 建宁县| 盐亭县| 永春县| 锦州市| 徐水县| 三江| 普兰店市| 德江县| 新沂市| 兰溪市| 宜宾县| 柘荣县| 阿城市| 腾冲县| 余姚市|