• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種強(qiáng)噪聲環(huán)境下的語音端點(diǎn)檢測算法

      2015-09-06 08:51:37
      關(guān)鍵詞:頻帶端點(diǎn)方差

      蔡 萍

      (閩江學(xué)院 物理學(xué)與電子信息工程系,福建 福州 350108)

      一種強(qiáng)噪聲環(huán)境下的語音端點(diǎn)檢測算法

      蔡萍

      (閩江學(xué)院 物理學(xué)與電子信息工程系,福建 福州350108)

      語音識別中語音信號端點(diǎn)檢測的準(zhǔn)確度起著至關(guān)重要的作用,傳統(tǒng)的頻帶方差算法在強(qiáng)背景噪聲環(huán)境下性能下降。提出一種改進(jìn)算法,在保證算法復(fù)雜度較低的條件下,大大提高了檢測的準(zhǔn)確度。仿真證明,該算法在低信噪比條件下也具有較強(qiáng)的魯棒性。

      端點(diǎn)檢測;低信噪比;頻帶方差

      端點(diǎn)檢測的作用是從連續(xù)采樣的數(shù)字信號中確定語音段和噪聲段的起止時刻[1]。語音識別的一個關(guān)鍵問題就是如何將語音信號精確地檢測出來,以減少運(yùn)算量及提高效率[2]。在高信噪比條件下,傳統(tǒng)的端點(diǎn)檢測算法,如基于短時能量和過零率、能量譜方差、倒譜距離和熵的算法已經(jīng)得到很好的運(yùn)用;在低信噪比條件下,這些算法的性能急劇下降,有的甚至無法工作[3]。如何在強(qiáng)背景噪聲環(huán)境下準(zhǔn)確地進(jìn)行端點(diǎn)檢測已成為一個棘手的問題。本文首先描述了傳統(tǒng)的頻帶方差檢測算法,在此基礎(chǔ)上進(jìn)行改進(jìn),提出一種新的語音段起止端點(diǎn)檢測算法,最后通過具體實(shí)驗(yàn)得出結(jié)論。

      1 端點(diǎn)檢測的基本步驟

      語音信號端點(diǎn)檢測的基本步驟為:

      (1)分幀。把語音信號分割為相互重疊的若干幀。由于語音信號具有短時平穩(wěn)性,即語音信號在10~30 ms的時間內(nèi)可以看做是平穩(wěn)過程,所以在幀長的選取上也是基于這個原則。

      (2)提取特征向量。對每一幀語音,計算其某一種特征向量。比如在能量判決法中,每幀信號的能量或能量的對數(shù)被視為判決特征。

      (3)判決。根據(jù)(2)中提取的特征向量序列,利用一定的判決規(guī)則,判斷該幀信號是語音段還是噪聲段。

      (4)后處理。后處理過程的作用是對(3)得出的結(jié)果進(jìn)行修正,最終得出語音信號和噪聲信號的檢測結(jié)果。在步驟(3)中,可能會把人在正常發(fā)聲過程中的自然停頓判為噪聲,這個停頓包括句子內(nèi)的停頓,甚至是詞內(nèi)的停頓,這些錯誤判決要進(jìn)行糾正。

      2 頻帶方差及改進(jìn)算法

      頻帶方差,指的是短時頻帶方差,因?yàn)橄到y(tǒng)是個時變系統(tǒng)。它的實(shí)質(zhì)就是計算一幀信號各個頻帶能量的方差。語音和噪聲的頻帶方差相差很大。假設(shè)噪聲是高斯白噪聲,之所以稱其為白噪聲,是因?yàn)樵谠肼暤念l譜特性中,各個頻帶的能量相差不大,或者說各頻帶之間變化很平緩。而語音信號是有色的,各頻帶之間變化較劇烈。根據(jù)這一特征,可以很明顯地區(qū)分語音和噪聲[4]。

      定義矢量

      ω1,ω2,…,ωn表示帶通濾波器的中心頻率。yi(ωi)表示數(shù)字信號通過中心頻率為ωi的濾波器的輸出能量。數(shù)字信號最低頻是0,最高頻是π,于是帶通濾波器的帶寬為π/N,中心頻率從0到π等步長遞增。yi(ωi)的計算方法:計算一幀信號的FFT(Fast Fourier Transform,快速傅里葉變換),然后把幾個相鄰頻率分量組合而得[5]。

      計算Y的平均值

      (1)

      定義為頻帶方差。

      通常可認(rèn)為一段語音信號的前幾幀是噪聲幀。以n=5為例,取前5幀計算頻帶方差,計算5個頻帶方差的均值Dn。取門限值G=2Dn,超過這個門限值判斷為噪聲幀,否則為語音幀。

      對傳統(tǒng)的頻帶方差算法進(jìn)行以下幾點(diǎn)改進(jìn),既減小了計算量,又提高了檢測的準(zhǔn)確度。

      (1)將平方運(yùn)算轉(zhuǎn)化為絕對值運(yùn)算。

      (2)在頻域上取相鄰5個點(diǎn)的值求平均進(jìn)行平滑。與傳統(tǒng)的相鄰3點(diǎn)平滑相比,語音段的檢測參數(shù)沒有太大的變化;而在噪聲段,假定噪聲是白噪聲,本身能量譜的起伏就不大,加上5點(diǎn)平滑后起伏就更小了,從而拉開了語音幀和噪聲幀的差距,使門限的設(shè)定更加簡單。

      (3)僅取前50個點(diǎn)的能量譜進(jìn)行計算。假設(shè)對每幀進(jìn)行256點(diǎn)的離散傅里葉變換。語音信號的能量主要集中在低頻部分。從譜特征上看,也是低頻部分的震蕩幅度大,高頻部分的震蕩幅度小。僅取前半部分參與計算,可大大簡化計算量。

      (4)能量譜間隔5個點(diǎn)取差值,即

      (2)

      這一改進(jìn)措施同樣是為了拉開語音幀與噪聲幀的檢測參數(shù)。對噪聲幀來說,相鄰2點(diǎn)的差與相鄰5點(diǎn)的差差別不大,而語音幀差別極大。

      3 仿真結(jié)果與分析

      在MATLAB環(huán)境下進(jìn)行仿真實(shí)驗(yàn)。聲音信號樣本由男、女生發(fā)聲,在實(shí)驗(yàn)室安靜環(huán)境下以聲卡采集,純凈語音信號采樣率為8 kHz,量化位數(shù)為16bit,以wav格式存儲。噪聲采用平穩(wěn)高斯白噪聲。純凈語音和高斯白噪聲以-5 dB的信噪比進(jìn)行混合,形成帶噪語音。

      圖1a是歸一化后的純凈語音信號,圖1b是-5dB的帶噪語音信號,圖1c與圖1d是根據(jù)傳統(tǒng)算法即公式(1)計算得出的頻帶方差以及根據(jù)該曲線設(shè)定門限后得到的檢測結(jié)果,圖1e與圖1f是根據(jù)改進(jìn)算法即公式(2)計算出的參數(shù)和判定結(jié)果。從圖1可以看出,用傳統(tǒng)算法計算的檢測參數(shù)在語音段和噪聲段的差別不明顯,而改進(jìn)算法語音段的檢測參數(shù)大大高于噪聲段,因此后者對判決門限的靈敏度低。

      a 純凈語音信號

      b 帶噪語音信號

      c 傳統(tǒng)算法計算得的頻帶方差

      d 傳統(tǒng)頻帶方差檢測結(jié)果

      e 改進(jìn)算法的頻帶參數(shù)

      f 改進(jìn)算法的檢測結(jié)果圖1 傳統(tǒng)算法與改進(jìn)算法的仿真結(jié)果Fig.1 Simulation result of traditional algorithm and improved algorithm

      從實(shí)驗(yàn)結(jié)果可以看出,傳統(tǒng)的頻帶方差檢測方法在低信噪比的條件下性能不佳,一個發(fā)音音節(jié)內(nèi)判決出既有語音段又有噪聲段的結(jié)果;改進(jìn)后的算法具有較強(qiáng)的魯棒性。這是因?yàn)樵诘托旁氡葪l件下,噪聲的能量較強(qiáng)而語音的能量較弱,傳統(tǒng)的頻帶方差檢測算法在語音段和噪聲段的檢測參數(shù)差距不大,因而對門限選擇的要求極高,否則會出現(xiàn)誤判的結(jié)果;而改進(jìn)后的算法一是增加了平滑,使噪聲段的檢測參數(shù)明顯下降,二是用相鄰5點(diǎn)的能量譜進(jìn)行差分,提高了語音段的檢測參數(shù),使檢測結(jié)果涇渭分明,提高了算法的準(zhǔn)確度。

      [1] 席大林,李如瑋,陳海龍.基于自相關(guān)最大值和過門限率的語音端點(diǎn)檢測[J].語音技術(shù),2010,34(4):53-57.

      [2] 董胡.一種改進(jìn)的基于倒譜距離端點(diǎn)檢測算法研究[J].計算機(jī)與數(shù)字工程,2013,41(7):1 078-1 080.

      [3] 尹巖巖,殷業(yè),羅漢文,等.基于短時能零熵的端點(diǎn)檢測方法[J].計算機(jī)仿真,2012,29(11):408-411.

      [4] 王忠禹. 現(xiàn)代譜估計[M].南京:東南大學(xué)出版社,1990:35-36.

      [5] 李祖鵬,姚佩陽. 一種語音段起止端點(diǎn)檢測新方法[J].電訊技術(shù),2000,20(3):68-70.

      (責(zé)任編輯:李華云)

      Speech Endpoint Detection Algorithm Based on Strong Noise Environment

      CAI Ping

      (Department of Physics & Electronic Information Engineering,Minjiang University, Fuzhou Fujian350108, China)

      The accuracy of speech recognition in speech signal endpoint detection plays an important role. Traditional frequency band variance algorithm gives a bad performance in strong noise environment. In ensuring a lower computational complexity conditions, Put forward an improved algorithm, which can greatly improve the accuracy of detection. The simulation results show that the algorithm has strong robustness under low SNR condition.

      endpoint detection; low SNR; frequency band variance

      10.16018/j.cnki.cn32-1650/n.201503010

      2015-05-07

      蔡萍(1981-),女,福建寧德人,講師,主要研究方向?yàn)檎Z音信號處理。

      TP301.6

      A

      1671-5322(2015)03-0044-03

      猜你喜歡
      頻帶端點(diǎn)方差
      方差怎么算
      非特征端點(diǎn)條件下PM函數(shù)的迭代根
      概率與統(tǒng)計(2)——離散型隨機(jī)變量的期望與方差
      Wi-Fi網(wǎng)絡(luò)中5G和2.4G是什么?有何區(qū)別?
      不等式求解過程中端點(diǎn)的確定
      計算方差用哪個公式
      單音及部分頻帶干擾下DSSS系統(tǒng)性能分析
      雙頻帶隔板極化器
      電子測試(2017年15期)2017-12-18 07:18:51
      方差生活秀
      參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計
      视频| 乌拉特后旗| 普兰店市| 浦东新区| 运城市| 雷波县| 高唐县| 家居| 镶黄旗| 布拖县| 翁牛特旗| 岱山县| 会理县| 衡水市| 汕尾市| 牡丹江市| 葵青区| 大英县| 南充市| 会理县| 邮箱| 文安县| 鹤壁市| 兴文县| 繁峙县| 枣强县| 天门市| 广平县| 陆丰市| 彭州市| 叶城县| 克山县| 巴青县| 华坪县| 额敏县| 营山县| 綦江县| 平顶山市| 丹江口市| 安国市| 兴海县|