• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    低信噪比下的端點(diǎn)檢測(cè)算法研究

    2016-10-12 02:45:11靳宗信
    關(guān)鍵詞:子帶頻帶端點(diǎn)

    韓 芳,靳宗信

    (黃河科技學(xué)院信息工程學(xué)院,河南鄭州 450063)

    ?

    低信噪比下的端點(diǎn)檢測(cè)算法研究

    韓芳,靳宗信

    (黃河科技學(xué)院信息工程學(xué)院,河南鄭州450063)

    語(yǔ)音端點(diǎn)檢測(cè)是語(yǔ)音處理分析過(guò)程中的一個(gè)重要組成部分,針對(duì)方差法在低信噪比下對(duì)語(yǔ)音信號(hào)端點(diǎn)檢測(cè)準(zhǔn)確率低的問(wèn)題,本文提出一種子帶頻帶方差法和譜減法相結(jié)合的檢測(cè)算法,算法中采用多窗譜估計(jì)改進(jìn)譜減法對(duì)河南方言語(yǔ)音進(jìn)行降噪處理,并將得到的信號(hào)的子帶頻帶方差進(jìn)行端點(diǎn)檢測(cè).用Matlab進(jìn)行仿真驗(yàn)證了此方法在端點(diǎn)檢測(cè)中的準(zhǔn)確性,該方法降低了河南方言語(yǔ)音處理的時(shí)間,為進(jìn)一步提取河南方言語(yǔ)音識(shí)別特征參數(shù)提供了條件.

    語(yǔ)音端點(diǎn)檢測(cè);多窗譜;頻帶方差;譜減法

    語(yǔ)音端點(diǎn)檢測(cè)中的語(yǔ)音信號(hào)處理非常重要,特別是在語(yǔ)音信號(hào)處理中精確的找出語(yǔ)音信號(hào)的起點(diǎn)和終點(diǎn)[1-2].端點(diǎn)檢測(cè)的常用方法是將一段語(yǔ)音分成連續(xù)或交疊的幀,然后提取每個(gè)幀的對(duì)應(yīng)參數(shù),和預(yù)先設(shè)定的閥值作對(duì)比,從而判定語(yǔ)音的開(kāi)始點(diǎn)和結(jié)束點(diǎn)[3-4].端點(diǎn)檢測(cè)的有效性在某種程度上直接影響了語(yǔ)音識(shí)別的成敗.

    目前語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方法有兩類(lèi):一類(lèi)是基于模式識(shí)別的方法[5],但是該方法復(fù)雜度高,運(yùn)算量大,在實(shí)時(shí)系統(tǒng)中很難使用;另一類(lèi)是基于特征的檢測(cè)方法[6-7],根據(jù)噪聲和語(yǔ)音的不同特征來(lái)進(jìn)行端點(diǎn)檢測(cè),本方法被廣泛研究和使用.傳統(tǒng)的端點(diǎn)檢測(cè)方法有很多,但都有一定的局限性,例如,文獻(xiàn)[8]提出了采用短時(shí)平均能量和短時(shí)過(guò)零率相結(jié)合的方法來(lái)檢測(cè)語(yǔ)音的端點(diǎn),此方法簡(jiǎn)單易行,處理沒(méi)有噪聲情況下的語(yǔ)音端點(diǎn)檢測(cè)效果良好,但是實(shí)際處理中語(yǔ)音往往處于復(fù)雜的噪聲環(huán)境中;為了提高抗噪性,文獻(xiàn)[9]結(jié)合語(yǔ)音能量和倒譜特征進(jìn)行端點(diǎn)檢測(cè),在穩(wěn)定噪聲環(huán)境中取得了較好效果,但是隨著噪聲的變化,倒譜特征提取也會(huì)受到干擾,在實(shí)際語(yǔ)音環(huán)境中,該方法也不能得到較好效果;文獻(xiàn)[10]提出了用譜熵和譜能量結(jié)合的方法,提高了端點(diǎn)檢測(cè)的正確率,但在低信噪比下效果仍不理想.

    針對(duì)以上方法存在的問(wèn)題,本文通過(guò)研究方差法的端點(diǎn)檢測(cè)算法,分析其在低信噪比環(huán)境中檢測(cè)準(zhǔn)確率低的原因,提出了一種改進(jìn)的譜減法和子帶頻帶方差法相結(jié)合的語(yǔ)音端點(diǎn)檢測(cè)算法.結(jié)合Matlab的仿真功能對(duì)河南方言進(jìn)行端點(diǎn)檢測(cè)驗(yàn)證,將Matlab實(shí)驗(yàn)仿真結(jié)果與子帶頻帶方差法得到的結(jié)果進(jìn)行對(duì)比分析,證明這種算法在較強(qiáng)噪聲干擾的情況下也能較為準(zhǔn)確的檢測(cè)到語(yǔ)音的端點(diǎn),此算法對(duì)河南方言語(yǔ)音端點(diǎn)檢測(cè)具有一定意義.

    1 多窗譜改進(jìn)譜減法

    語(yǔ)音增強(qiáng)的方法有很多種,包括譜減法[11,12],最小均方誤差估計(jì)(MMSE)法[13]和信號(hào)子空間法[14]等語(yǔ)音增強(qiáng)方法.其中,譜減法語(yǔ)音增強(qiáng)方法因?yàn)樗惴ê?jiǎn)單、易于理解、便于計(jì)算,從而被廣泛使用,是最有效的語(yǔ)音增強(qiáng)方法[15-16].基本譜減法的原理是假設(shè)語(yǔ)音信號(hào)為x(n),對(duì)x(n)進(jìn)行加窗分幀處理,得到第i幀語(yǔ)音信號(hào)xi(m),對(duì)每一幀語(yǔ)音信號(hào)xi(m)進(jìn)行離散傅里葉變換(Discrete Fourier Transform,DFT)后得到

    (1)

    其中xi(m)為語(yǔ)音信號(hào)x(n)加窗分幀后第i幀語(yǔ)音信號(hào),每幀幀長(zhǎng)為N.

    譜減算法為

    (2)

    多窗譜估計(jì)是用多個(gè)正交的數(shù)據(jù)窗對(duì)同一數(shù)據(jù)序列分別求直接譜,然后取平均值,可以得到一個(gè)更小的估計(jì)方差[4,10].利用多窗譜估計(jì)實(shí)現(xiàn)譜減語(yǔ)音增強(qiáng)運(yùn)算的步驟為:

    1)帶噪語(yǔ)音為x(n),加窗分幀后xi(m),相鄰幀之間有重疊;

    3)對(duì)分幀后的信號(hào)xi(m)進(jìn)行多窗譜估計(jì),得到多窗譜功率譜密度P(k,i)=PMTM[xi(m)];

    6)利用譜減關(guān)系計(jì)算增益因子.公式為

    (4)

    2 子帶頻帶方差法

    語(yǔ)音和噪聲在頻譜域中的特性差異比較大,一般有話段的能量會(huì)隨著頻帶有較大的變化,在共振峰處有較大的峰值,而噪聲段能量數(shù)值相對(duì)較小,且在頻帶內(nèi)較為均勻分布,頻帶方差基于這個(gè)特性進(jìn)行端點(diǎn)檢測(cè).在頻帶方差中,每幀數(shù)據(jù)長(zhǎng)N,F(xiàn)FT以后在正頻率域內(nèi)有(N/2+1)條譜線.基于均勻子帶分離的頻帶方差算法將(N/2+1)條DFT后幅值譜線Xi={Xi(1),Xi(2),…,Xi(N/2+1)}分割成q個(gè)子帶,即每個(gè)子帶含有p=fix[(N/2+1)/q]條譜線,構(gòu)成子帶

    (5)

    其中XXi={XXi(1),XXi(2),…,XXi(q)},則

    (6)

    方差為

    (7)

    已知前導(dǎo)無(wú)話段的幀數(shù),求出相應(yīng)閾值,利用雙門(mén)限判決的方法確定語(yǔ)音端點(diǎn)位置.

    3 算法原理

    本文提出的算法思想是先對(duì)語(yǔ)音信號(hào)求頻譜,用多窗譜的改進(jìn)譜減法對(duì)語(yǔ)音信號(hào)進(jìn)行減噪處理,然后計(jì)算處理后信號(hào)的子帶頻帶方差,進(jìn)行端點(diǎn)檢測(cè),算法流程見(jiàn)圖1.

    圖1 算法原理框圖

    4 實(shí)驗(yàn)仿真

    4.1仿真結(jié)果

    在Matlab下對(duì)算法性能進(jìn)行仿真實(shí)驗(yàn).仿真中用到的純凈語(yǔ)音是在實(shí)驗(yàn)室安靜環(huán)境下錄制的,采樣頻率8 kHz,16比特量化編碼wav語(yǔ)音格式,采用漢明窗進(jìn)行分幀,取幀長(zhǎng)200點(diǎn),幀移80點(diǎn).

    實(shí)驗(yàn)語(yǔ)音源選取3組詞匯,河南新鄉(xiāng)和信陽(yáng)2個(gè)地區(qū),每個(gè)地區(qū)選取10人,每組詞匯每人讀2次,共120組數(shù)據(jù),選取人員年齡均小于25歲,其中語(yǔ)音詞匯組分別為“日頭、蟬、蜻蜓、凍冰、天兒、懶蛤蟆”;“藍(lán)天、白云、碧綠的大?!保弧拔魑?、衣裳、碾場(chǎng)、堂屋、抽屜”共3組.

    為了驗(yàn)證所提方法的抗噪能力,在實(shí)驗(yàn)中以一段純凈的男音(藍(lán)天、白云、碧綠的大海)為例,分別加入信噪比為10,0,-5 dB,采用多窗譜估計(jì)改進(jìn)譜減法對(duì)語(yǔ)音信號(hào)進(jìn)行減噪處理,在不同信噪比(-5,0,10 dB)下,采用子帶頻帶方差法與本文提出的算法進(jìn)行比對(duì)實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果見(jiàn)圖2~4.

    圖2為信噪比SNR=0 dB下,原始信號(hào)圖、帶噪波形圖、子帶頻帶方差波形圖和本文提出算法波形圖.由圖可見(jiàn)用子帶頻帶方差法進(jìn)行端點(diǎn)檢測(cè),“?!弊譀](méi)有被檢出,而用本文算法能準(zhǔn)確提??;從圖4也能明顯看出在信噪比較高的情況下,針對(duì)河南方言,兩種算法都能正常提取語(yǔ)音端點(diǎn);從圖3可以看出在信噪比SNR=-5 dB的情況下,本文算法仍能較好的提取語(yǔ)音端點(diǎn).從圖2~4也可以看出通過(guò)多窗口估計(jì)改進(jìn)譜減法能明顯提高信噪比,當(dāng)初始信噪比為0 dB時(shí),減噪后信噪比提高了9.47 dB,有利于語(yǔ)音信號(hào)端點(diǎn)的檢測(cè).

    圖2 波形對(duì)比圖(SNR=0 dB)

    4.2實(shí)驗(yàn)結(jié)果分析

    語(yǔ)音樣本,加入信噪比為0 dB的隨機(jī)噪聲,將本文提出的方法與子帶頻帶方差法、文獻(xiàn)[8]提出的雙門(mén)限法、文獻(xiàn)[9]提出的倒譜法和文獻(xiàn)[10]提出的能熵比法對(duì)它們的檢測(cè)性能和平均耗時(shí)進(jìn)行對(duì)比分析.實(shí)驗(yàn)中檢測(cè)性能的好壞用端點(diǎn)檢測(cè)的準(zhǔn)確率來(lái)衡量,首先對(duì)語(yǔ)音樣本進(jìn)行人工標(biāo)注,以人工標(biāo)注端點(diǎn)為標(biāo)準(zhǔn),如果端點(diǎn)檢測(cè)的前后端點(diǎn)和人工標(biāo)準(zhǔn)的前后端點(diǎn)差別都在10幀之內(nèi),則認(rèn)為端點(diǎn)檢測(cè)的結(jié)果是正確的,結(jié)果列于表1.準(zhǔn)確率公式為:

    圖3 波形對(duì)比圖(SNR=-5 dB)

    圖4 波形對(duì)比圖(SNR=10 dB)

    (8)

    表1 檢測(cè)準(zhǔn)確率及平均耗時(shí)(SNR=0 dB)

    從表1可以看出,當(dāng)信噪比SNR=0 dB時(shí),本文算法有較好的表現(xiàn),準(zhǔn)確率高于90%.由于采用多窗口估計(jì)改進(jìn)譜減法有效地提高了信噪比,抑制了噪聲對(duì)信號(hào)的影響,準(zhǔn)確率明顯高于子帶頻帶方差法和文獻(xiàn)[8~10]中所提到的算法,但是平均耗時(shí)也隨之增大.

    為了能更好的說(shuō)明問(wèn)題,統(tǒng)計(jì)了當(dāng)信噪比分別為-5,0,5,10,15 dB時(shí),上述5種語(yǔ)音端點(diǎn)檢測(cè)方法的檢測(cè)準(zhǔn)確率的平均值,結(jié)果見(jiàn)圖5.

    圖5 不同檢測(cè)方法對(duì)比

    從圖5可以看出,在高信噪比條件下(SNR=15 dB以上),采用本文方法或者其他算法基本都可達(dá)到100%檢測(cè)率;在低信噪比條件下(SNR=-5 dB),本文算法的準(zhǔn)確率可達(dá)到84%,明顯優(yōu)于頻帶方差法和文獻(xiàn)[10]提到的能熵比法,在此條件下文獻(xiàn)[8]提到的雙門(mén)限法基本失效;在0 dB條件下本文算法達(dá)到的準(zhǔn)確率高于90%,而頻帶方差和文獻(xiàn)[10]提到的算法在5 dB時(shí)才能達(dá)到檢測(cè)率90%以上,本文算法對(duì)語(yǔ)音信號(hào)端點(diǎn)檢測(cè)的準(zhǔn)確率明顯高于頻帶方差法及文獻(xiàn)[8-10]提到的算法.

    5 結(jié)論

    利用多窗譜方差小的特點(diǎn),對(duì)功率譜進(jìn)行估計(jì),接著對(duì)語(yǔ)音信號(hào)進(jìn)行譜減法語(yǔ)音增強(qiáng),然后計(jì)算處理后信號(hào)的子帶頻帶方差,進(jìn)行端點(diǎn)檢測(cè).該方法在低信噪比環(huán)境下能很好地檢測(cè)出河南方言語(yǔ)音的端點(diǎn),在河南方言語(yǔ)音處理過(guò)程中,提高了語(yǔ)音處理質(zhì)量,對(duì)河南方言語(yǔ)音識(shí)別中特征參數(shù)的提取提供了條件,但是本文算法提取端點(diǎn)時(shí)間增長(zhǎng),因此在端點(diǎn)檢測(cè)方面需要一個(gè)良好的折中方案,這也是下一步研究的重點(diǎn).

    [1]聶惠娟,段世政.語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方法研究[J].新鄉(xiāng)師范高等??茖W(xué)校學(xué)報(bào),2007,21(2):35.

    [2]卓嘎,邊巴旺堆.基于Matlab的藏語(yǔ)語(yǔ)音基音檢測(cè)算法研究[J].現(xiàn)代電子技術(shù),2015,38(10):20.

    [3]周曉海,王民,毛力.一種低信噪比環(huán)境下的語(yǔ)音端點(diǎn)檢測(cè)方法研究[J].現(xiàn)代電子技術(shù),2009(10):119.

    [4]劉悅,王曉婷.短時(shí)頻域分形端點(diǎn)檢測(cè)算法[J].微電子學(xué)與計(jì)算機(jī),2015,32(9):81.

    [5]SUH Y,KIM H.Multiple acoustic model-based discriminative likelihood ratio weigh-ting for voice activity detection[J].IEEESignalProcessingLetters,2012,19(8):507.

    [6]YANG Xiao-ling,TAN Bao-hua.Comparative study on voice activity detection algorithm[C]//IEEEIntemationalConferenceonElectricalandControlEngineering,Wuhan:ZEEE Explor,2010.

    [7]ZEDDELMANN D.A feature-based approach to noise robust speech detection[C]//ITG-Fachbericht236:Sprachkommunikation.Berlin:VDE Verlag Gmbh,2012:1.

    [8]路青起,白燕燕.基于雙門(mén)限兩級(jí)判決的語(yǔ)音端點(diǎn)檢測(cè)方法[J].電子科技,2012,25(1):13.

    [9]BOU-GHAZALE S E,ASSALE H.A robust end-point detection of speech for noisy environments with application to automatic speech recognition[C]//IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing(ICASSP).Wiley:IEEE Press,2002:3808.

    [10]李如瑋,鮑長(zhǎng)春.一種基于分帶譜熵和譜能量的語(yǔ)音端點(diǎn)檢測(cè)算法[J].北京工業(yè)大學(xué)學(xué)報(bào),2007,33(9):920.

    [11]BOLL S F.Suppression of acoustic noise in speech using spectral subtraction[J].IEEETransonAcoustics,Speech,andSignalProcessing,1979,27(2):113.

    [12]BEROUTI M,SCHEARTZ R,MAKHOUL J.Enhancement of speech corrupted by acoustic noise[J].IEEETransonAcoustics,Speech,andSignalProcessing,1979,4:208.

    [13]EPHRAIM Y,MALAN D.Speech enhancement using a mini-mum mean-square erro short-time spectral amplitude esti-mator[J].IEEETransonAcoustics,Speech,andSignalProcessing,1984,32:1109.

    [14]EPHRAIM Y,VVAN TREES H L.A signal subspace approachfor speech enhancement[J].IEEETransSpeechAudioProcessing,1995,3:251.

    [15]武鵬鵬,趙剛,鄒明.基于多窗譜估計(jì)的改進(jìn)譜減法[J].現(xiàn)代電子技術(shù),2008(12):150.

    [16]王路露,夏旭,馮璐等.基于頻譜方差和譜減法的語(yǔ)音端點(diǎn)檢測(cè)新算法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(8):194.

    (責(zé)任編輯孫對(duì)兄)

    Study of endpoint detection algorithm in low SNR

    HAN Fang,JIN Zong-xin

    (School of Information Engineering,Huanghe Science and Technology College,Zhengzhou 450063,Henan,China)

    Speech endpoint detection is important part of speech processing.In order to improve correctness of endpoint detection method based on spectrum variance in the case of low signal to noise ratio(SNR),this paper proposes a new speech endpoint detection algorithm based on combination subband variance with spectral subtraction,it reduces Henan dialect speech signal noise by using modified spectral subtraction for multi window spectral estimation and calculates its subband variance in endpoint detection.Matlab software is used to verify the accuracy of this method in the endpoint detection,the simulation results show that this algorithm can reduce the time of Henan dialect speech processing,and provide certain conditions for further extraction of Henan dialect speech recognition feature parameters.

    speech endpoint detection;multitaper method;band variance;spectral subtraction

    10.16783/j.cnki.nwnuz.2016.05.013

    2015-12-09;修改稿收到日期:2016-01-07

    國(guó)家自然科學(xué)基金資助項(xiàng)目(61101232);鄭州市科技局科技發(fā)展計(jì)劃項(xiàng)目(20140663);鄭州市嵌入式系統(tǒng)應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室建設(shè)項(xiàng)目(121PYFZX177);鄭州市教學(xué)質(zhì)量工程資助項(xiàng)目(22LG201608)

    韓芳(1981—),女,河南新鄉(xiāng)人,副教授,碩士.主要研究方向?yàn)檎Z(yǔ)音信號(hào)處理和計(jì)算機(jī)網(wǎng)絡(luò).

    E-mail:58219506@qq.com

    TN 912.3

    A

    1001-988Ⅹ(2016)05-0055-05

    猜你喜歡
    子帶頻帶端點(diǎn)
    非特征端點(diǎn)條件下PM函數(shù)的迭代根
    一種基于奇偶判斷WPT的多音干擾抑制方法*
    Wi-Fi網(wǎng)絡(luò)中5G和2.4G是什么?有何區(qū)別?
    子帶編碼在圖像壓縮編碼中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:24
    不等式求解過(guò)程中端點(diǎn)的確定
    單音及部分頻帶干擾下DSSS系統(tǒng)性能分析
    雙頻帶隔板極化器
    參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
    基于虛擬孔徑擴(kuò)展的子帶信息融合寬帶DOA估計(jì)
    基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
    山东省| 广灵县| 英吉沙县| 石城县| 喀什市| 仙桃市| 临沧市| 炎陵县| 石棉县| 府谷县| 浦北县| 万全县| 顺平县| 铜川市| 沙雅县| 乳山市| 安吉县| 垦利县| 青浦区| 芷江| 邻水| 天门市| 福鼎市| 盐山县| 建阳市| 渝中区| 望江县| 长治县| 昌吉市| 富阳市| 阳山县| 平顶山市| 宝丰县| 夹江县| 磐石市| 新竹市| 宜都市| 莎车县| 天津市| 永平县| 驻马店市|