• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于變窗長(zhǎng)搜索的改進(jìn)型噪聲估計(jì)算法①

      2018-09-17 08:49:14岸,高
      關(guān)鍵詞:話音計(jì)數(shù)器門限

      胡 岸,高 勇

      (四川大學(xué) 電子信息學(xué)院,成都 610065)

      1 引言

      單通道語(yǔ)音增強(qiáng)方法因其算法復(fù)雜度適中,算法的實(shí)現(xiàn)對(duì)硬件需求不大,而在很多領(lǐng)域受到廣泛的應(yīng)用.在單通道話音增強(qiáng)算法中,噪聲估計(jì)是至關(guān)重要的一環(huán).在這一環(huán)節(jié)中,主要任務(wù)就是對(duì)噪聲功率譜進(jìn)行準(zhǔn)確的估計(jì),這樣才能較好的抑制噪聲,同時(shí)保證較好的話音質(zhì)量,否則會(huì)產(chǎn)生過(guò)減或欠估計(jì)現(xiàn)象,前者會(huì)導(dǎo)致話音失真,影響語(yǔ)音可懂度,后者則會(huì)導(dǎo)致的噪聲殘留,影響聽覺(jué)體驗(yàn).

      全球很多學(xué)者提出了多種噪聲估計(jì)方法.在這些噪聲估計(jì)算法里面,最具代表性的有Martin在2001年提出的MS最小統(tǒng)計(jì)量噪聲估計(jì)算法[1],該算法在固定的搜索窗內(nèi)搜索含噪語(yǔ)音功率譜最小值.在2002年,Israel Cohen提出了MCRA(Minima Controlled Recursive Averaging)最小遞歸控制平均算法[2],該算法通過(guò)將當(dāng)前幀帶噪話音子頻帶局部功率譜與搜索窗內(nèi)對(duì)應(yīng)的最小功率譜比較,以此確定該頻帶是否含有話音成分.MCRA算法在話音噪聲譜增加緩慢(噪聲譜增加小于2 dB/s)的情況下[3],有良好的噪聲估計(jì)能力,能夠通過(guò)遞歸平均法準(zhǔn)確估計(jì)噪聲值.但該算法采用了固定搜索窗長(zhǎng)來(lái)更新最小功率譜值,當(dāng)話音出現(xiàn)噪聲譜陡增的情況時(shí),噪聲估計(jì)會(huì)出現(xiàn)延遲.延遲時(shí)間在L到2L幀之間,其中L為一個(gè)最小噪聲估計(jì)窗長(zhǎng),為了保證話音無(wú)失真,L時(shí)間長(zhǎng)度通常選為800 ms~1500 ms.

      為解決噪聲估計(jì)延遲,廣大學(xué)者也做了一些研究.2005年,Loizou提出在MCRA噪聲估計(jì)算法的基礎(chǔ)上引入連續(xù)平滑噪聲更新[4],改進(jìn)后的算法有效的縮短了噪聲估計(jì)延遲,但是該算法在低信噪比下存在噪聲過(guò)估計(jì)情況,導(dǎo)致話音失真.2009年,賀慧芳,馬建芳在MCRA算法的基礎(chǔ)上提出了一種基于語(yǔ)音幀檢測(cè)的算法[5]來(lái)加快噪聲估計(jì)速度,該算法在較高信噪比條件下可以有效的縮短噪聲估計(jì)延遲,在低信噪比下對(duì)噪聲估計(jì)延遲的改進(jìn)有限.2015年,熊晶,王旭貞等人在MCRA算法的基礎(chǔ)上提出了一種雙向噪聲估計(jì)算法[6,7],該算法可以較好的解決噪聲估計(jì)延遲以及過(guò)估計(jì)問(wèn)題,但是實(shí)現(xiàn)該算法需要在緩存一段話音數(shù)據(jù),不適合實(shí)時(shí)性要求較高的場(chǎng)合.

      本文在MCRA噪聲估計(jì)算法的基礎(chǔ)上,引入一種利用最大對(duì)數(shù)似然比結(jié)合能零比的VAD輔助算法,通過(guò)該輔助算法,可以動(dòng)態(tài)的選擇大小噪聲搜索估計(jì)窗中的最小功率譜值進(jìn)行后續(xù)計(jì)算,從而得到一種變窗長(zhǎng)搜索的改進(jìn)型噪聲估計(jì)算法.本文所提的改進(jìn)算法能有效縮短噪聲估計(jì)延遲,也能在低信噪比環(huán)境下運(yùn)行,并且不需要緩存數(shù)據(jù),可以用于實(shí)時(shí)性要求較高的場(chǎng)合.

      2 基于變窗長(zhǎng)的MCRA改進(jìn)算法

      本節(jié)先介紹MCRA算法[2]的基本原理,然后介紹本文提出的雙參數(shù)雙門限VAD算法以及雙窗并行搜索,最后講述本文算法如何進(jìn)行噪聲估計(jì)更新.

      2.1 MCRA算法基本原理

      當(dāng)前帶噪話音幀的功率譜為 |Y(k,l)|2,式中k表示子帶數(shù),表示幀數(shù),后文中k和l含義同此處相同.根據(jù)文獻(xiàn)[2],先對(duì)當(dāng)前幀功率譜做頻域上的平滑:

      其中,w(i)為一個(gè)長(zhǎng) 2N+1的窗函數(shù),文中算法取N=1.

      然后對(duì)當(dāng)前幀功率譜做時(shí)域上的平滑:

      2.2 雙參數(shù)雙門限VAD

      (1)基于能零比的VAD

      在文獻(xiàn)[8]中,Maragos提出了一種基于短時(shí)能零比的VAD算法,即短時(shí)平均過(guò)零率與短時(shí)能量相結(jié)合的VAD算法,該算法對(duì)噪聲譜變化不敏感,即噪聲譜的陡增不會(huì)影響算法性能,且能較好的區(qū)分濁音和非濁音,但在低信噪比下對(duì)清音和噪聲的區(qū)分效果不佳.

      短時(shí)平均過(guò)零率表示一幀語(yǔ)音中信號(hào)時(shí)域波形穿越橫軸的次數(shù).對(duì)于離散的信號(hào),如果相鄰的取樣值發(fā)生符號(hào)改變,則稱為過(guò)零.短時(shí)平均過(guò)零率就是樣本數(shù)值改變符號(hào)的次數(shù).

      高頻信號(hào)意味著較高的平均過(guò)零率,低頻意味著較低的平均過(guò)零率.通常情況下,話音中出現(xiàn)濁音時(shí),過(guò)零率較低,而出現(xiàn)清音以及白噪聲、超短波噪聲時(shí),過(guò)零率較高.

      過(guò)零率可以通過(guò)下面的公式求得:

      式中,l代表幀數(shù),n表示數(shù)據(jù)點(diǎn)數(shù),sgn[]為符號(hào)函數(shù),Zcr(l)為第l幀的過(guò)零率,yl(n)為輸入帶噪話音數(shù)據(jù)第l幀第n個(gè)數(shù)據(jù)點(diǎn).

      在話音中的有話區(qū)間能量要高于無(wú)話區(qū)間,過(guò)零率則相反,現(xiàn)在結(jié)合這兩種方法,即用能量值除以過(guò)零率的值,可以更突出有話區(qū)間的數(shù)值,而噪聲區(qū)間的數(shù)值則更小.第l幀的能量可以根據(jù)下面公式求得:

      這里引入對(duì)數(shù)能量計(jì)算公式:

      用對(duì)數(shù)表達(dá)式可以緩和能量幅度劇烈變換,參數(shù)a是一個(gè)經(jīng)驗(yàn)值,適當(dāng)?shù)恼{(diào)整好參數(shù)a的值,將有利于噪聲和清音的區(qū)分,在本文中將參數(shù)a設(shè)置為2.

      最后能零比通過(guò)以下公式求出:

      參數(shù)b是為了防止Zcr(l)為0時(shí)出現(xiàn)異常值現(xiàn)象,在本文中參數(shù)b設(shè)置為1.

      (2)基于最大對(duì)數(shù)似然比的VAD

      在文獻(xiàn)[9]中,J Chang等人提出了基于高斯統(tǒng)計(jì)模型與拉普拉斯統(tǒng)計(jì)模型的最大對(duì)數(shù)似然比,在文獻(xiàn)[10]中,夏丙寅等人基于上述模型提出了一種最大對(duì)數(shù)似然比VAD算法,可以較好的區(qū)分清音和噪聲.為了保護(hù)清音部分,本文選擇最大對(duì)數(shù)似然比作為VAD輔助算法中的另外一種參數(shù).

      對(duì)每一幀話音信號(hào),話音存在假設(shè)為H1,話音不存在假設(shè)為H0,基于高斯統(tǒng)計(jì)模型,可以求得帶噪話音信號(hào)傅里葉變換后每個(gè)頻點(diǎn)所對(duì)應(yīng)的似然度,可以表示為:

      Y(k,l)為第l幀帶噪話音信號(hào)的傅里葉變換的第k個(gè)子帶處的頻譜系數(shù).p(Y(k,l)|H1)是假設(shè)話音存在情況下的條件概率,p(Y(k,l)|H0)是假設(shè)話音不存在情況下的條件概率.ξ(k,l)和 γ(k,l)分別為第l幀話音信號(hào)的第k個(gè)頻點(diǎn)的的先驗(yàn)性噪比和后驗(yàn)信噪比.兩種信噪比分別可由DD判決法則[11]得到,分別表示為以下公式:

      式(6)和式(7)中的 λd(k,l)表示噪聲譜估計(jì)值.

      基于對(duì)數(shù)似然比LLR的判決規(guī)則可得:

      本文中將兩種VAD算法結(jié)合起來(lái),利用能零比VAD對(duì)噪聲功率譜變化不敏感,以及最大對(duì)數(shù)似然比VAD能在低信噪比情況下較好的區(qū)分清音和噪聲的特點(diǎn),提出一種雙門限雙參數(shù)的VAD算法,并將其作為MCRA噪聲估計(jì)算法的輔助算法.

      上述雙參數(shù)雙門限的VAD,即以最大對(duì)數(shù)似然比以及能零比作為參數(shù),采用二級(jí)門限,通過(guò)判決流程得到一個(gè)話音存在標(biāo)記值.具體的流程如圖1所示.

      狀態(tài)0為“非話音段”、狀態(tài)1位“疑似話音段”,狀態(tài) 2 為“話音段”,狀態(tài) 3 為“結(jié)束段”.為方便描述,此處用Ecr(l)表示第l幀的短時(shí)能零比值,用LLR(l)表示第l幀的對(duì)數(shù)似然比值,Ecr1、Ecr2分別表示二級(jí)能零比門限,LLR1、LLR2分別表示二級(jí)對(duì)數(shù)似然比門限.LLR1取3,LLR2取0.4,Ecr1取值為前五幀無(wú)話段的平均能零比值的1.3倍,Ecr2取值為前五幀無(wú)話段的平均能零比值的1.7倍.

      從狀態(tài)0開始執(zhí)行VAD算法.如果當(dāng)前狀態(tài)為0或者1,且Ecr(l)大于Ecr2且LLR(l)大于LLR1,就把該幀話音標(biāo)記為狀態(tài)2,并將無(wú)聲幀計(jì)數(shù)器置0,話音幀計(jì)數(shù)器加1.若不滿足該門限要求,但LLR(l)大于LLR2,則把該幀話音標(biāo)記為狀態(tài)1,話音幀計(jì)數(shù)器加1.如果上述兩級(jí)判決都不滿足則把該幀話音標(biāo)記為狀態(tài)0.

      如果當(dāng)前狀態(tài)為2,Ecr(l)大于Ecr1且LLR(l)大于LLR2,則維持當(dāng)前狀態(tài).不滿足上述要求,無(wú)聲幀計(jì)數(shù)器加1.若此時(shí)無(wú)聲幀計(jì)數(shù)器的數(shù)值小于最長(zhǎng)無(wú)聲長(zhǎng)度,則認(rèn)為當(dāng)前幀依舊處于話音段,話音幀計(jì)數(shù)器加1.若無(wú)聲幀計(jì)數(shù)器的數(shù)值大于最長(zhǎng)無(wú)聲長(zhǎng)度,且話音幀計(jì)數(shù)器的值小于最小話音長(zhǎng)度,則將該幀標(biāo)記為狀態(tài)0,話音幀計(jì)數(shù)器和無(wú)聲幀計(jì)數(shù)器置0,否則將當(dāng)前幀標(biāo)記為狀態(tài)3.

      最終根據(jù)話音幀所處的狀態(tài)做一個(gè)存在標(biāo)記,當(dāng)狀態(tài)為0時(shí),把當(dāng)前幀標(biāo)記為“語(yǔ)音不存在”,其他狀態(tài)則把當(dāng)前幀標(biāo)記為“語(yǔ)音存在”.

      2.3 雙窗法并行搜索

      原MCRA算法,噪聲搜索窗選用固定的窗長(zhǎng),而本文算法選用兩個(gè)大小不同的窗[12]同時(shí)搜索最小功率譜值,并根據(jù)式(3)和式(4)持續(xù)更新Smin(k,l)和Smin′(k,l)以及Stmp(k,l)和Stmp′(k,l).在噪聲估計(jì)更新中會(huì)根據(jù)上一節(jié)VAD算法所給出的話音存在標(biāo)記來(lái)選擇大窗或小窗下所搜索到的最小功率譜值,從而實(shí)現(xiàn)變窗長(zhǎng)搜索.本文算法大窗L長(zhǎng)度選用50幀、小窗L長(zhǎng)度選用8幀.

      2.4 噪聲估計(jì)更新

      若話音幀通過(guò)上述的雙參數(shù)雙門限VAD算法被標(biāo)記為“語(yǔ)音存在”,則根據(jù)式(5)計(jì)算當(dāng)前幀平滑功率譜S(k,l)與大窗下的最小功率譜值Smin(k,l)的比值Sr(k,l).若被標(biāo)記為“話音不存在”,則根據(jù)式(5)計(jì)算當(dāng)前幀平滑功率譜S(k,l)與小窗下的最小功率譜值Smin′(k,l)的比值Sr(k,l).將Sr(k,l)與經(jīng)驗(yàn)值 si gma 比較,確定I(k,l),最后根據(jù)式(6)和式(7)求得噪聲估計(jì)值 λd(k,l).

      由于小窗長(zhǎng)度較短,選用小窗下搜索到的最小功率譜值來(lái)進(jìn)行噪聲估計(jì)更新計(jì)算,會(huì)加快噪聲估計(jì)速度.

      圖1 輔助VAD算法流程框圖

      3 話音估計(jì)器

      本文采用Israel Cohen提到的OM-LSA話音估計(jì)器[13],結(jié)合本文的改進(jìn)型噪聲估計(jì)算法,實(shí)現(xiàn)整個(gè)語(yǔ)音增強(qiáng)算法,具體框圖如圖2所示.

      圖2中的y(n)為帶噪話音,加窗分幀后經(jīng)過(guò)FFT,求得帶噪話音的頻譜Y(k,l),幅度譜|Y(k,l)|2,并通過(guò)本文算法求得噪聲估計(jì)值 λd(k,l).實(shí)驗(yàn)中分幀長(zhǎng)度為32 ms,重疊幀長(zhǎng)度為16 ms.

      文獻(xiàn)[13]中指出:通過(guò)估計(jì)每一個(gè)頻率子帶話音存在概率,得到一個(gè)聯(lián)合時(shí)頻特性的增益函數(shù):

      其中 ξ(k,l)是第l幀第k個(gè)子頻帶的先驗(yàn)信噪比,p(k,l)是第l幀第k個(gè)子頻帶的話音存在概率,均根據(jù)噪聲估計(jì)得到的噪聲譜值來(lái)求解,具體求解方式參考文獻(xiàn)[13],此處不做詳細(xì)討論.

      圖2 語(yǔ)音增強(qiáng)框圖

      通過(guò)下式求得處理后的話音頻譜:

      4 實(shí)驗(yàn)仿真

      本節(jié)的實(shí)驗(yàn)仿真內(nèi)容主要為:將引入雙門限雙參數(shù)VAD輔助算法的變窗長(zhǎng)改進(jìn)算法與原MCRA算法[2]做對(duì)比,比較收斂時(shí)間長(zhǎng)短.實(shí)驗(yàn)中的噪聲類型采用選自Noisex中的高斯白噪聲,以及超短波噪聲,然后分別將高斯白噪聲、超短波噪聲與純凈語(yǔ)音疊加,生成幾段樣本用來(lái)測(cè)試.實(shí)驗(yàn)選取標(biāo)準(zhǔn)普通話測(cè)試話音17 s,采樣率8 KHz.

      4.1 實(shí)驗(yàn)設(shè)計(jì)

      實(shí)驗(yàn)一.選取上述純凈話音樣本,給樣本加上高斯白噪聲,帶噪話音8 s–11 s處信噪比由10 dB變?yōu)? dB,在語(yǔ)譜圖3(a)中用方框標(biāo)出,并用文字說(shuō)明.圖3(b)為原MCRA算法在噪聲譜陡增時(shí)的噪聲估計(jì)延遲,圖中用方框標(biāo)示,可以看到噪聲估計(jì)延遲較長(zhǎng),約為1.6 s;而圖3(c)為本文改進(jìn)算法的語(yǔ)譜圖,可看到噪聲譜陡增處,噪聲估計(jì)延遲縮短,約為0.4 s.

      圖3 高斯白噪聲環(huán)境下的算法對(duì)比

      實(shí)驗(yàn)二.選取上述純凈話音樣本,給樣本加上超短波噪聲,此環(huán)境下噪聲譜陡增段包含話音,在2.5 s–4 s處,信噪比由10 dB變?yōu)? dB,語(yǔ)譜圖4(a)中用方框標(biāo)出,并用文字說(shuō)明.圖4(b)中可以看到,噪聲估計(jì)延遲約為1.5 s;而圖4(c)為文中改進(jìn)算法的語(yǔ)譜圖,可以看到噪聲譜陡增處,噪聲估計(jì)延遲縮短,約為0.5 s.

      4.2 實(shí)驗(yàn)結(jié)果分析

      從圖3和圖4中,可以看出:無(wú)論是在高斯白噪聲還是超短波噪聲環(huán)境下,本文提出的改進(jìn)型算法,面對(duì)噪聲譜陡增,噪聲估計(jì)延遲都要比原MCRA算法短,即噪聲估計(jì)速度本文提出的算法要優(yōu)于原MCRA算法.

      5 總結(jié)

      本文利用了過(guò)零率對(duì)噪聲功率譜變化不敏感的性質(zhì),將能零比與最大對(duì)數(shù)似然比結(jié)合,作VAD輔助檢測(cè).聯(lián)合原有算法,采用大小窗同時(shí)搜索功率譜最小值,最終形成基于變窗長(zhǎng)搜索的改進(jìn)型噪聲估計(jì)算法.經(jīng)過(guò)實(shí)驗(yàn)證明,改進(jìn)的噪聲估計(jì)算法,在噪聲譜陡增時(shí),能夠有效的降低噪聲估計(jì)延遲.

      圖4 超短波噪聲環(huán)境下的算法對(duì)比

      猜你喜歡
      話音計(jì)數(shù)器門限
      煤氣與熱力(2022年2期)2022-03-09 06:29:30
      基于規(guī)則的HEV邏輯門限控制策略
      地方債對(duì)經(jīng)濟(jì)增長(zhǎng)的門限效應(yīng)及地區(qū)差異研究
      隨機(jī)失效門限下指數(shù)退化軌道模型的分析與應(yīng)用
      話音疊加中實(shí)時(shí)混音算法的FPGA實(shí)現(xiàn)
      計(jì)數(shù)器競(jìng)爭(zhēng)冒險(xiǎn)及其處理的仿真分析
      生產(chǎn)性服務(wù)業(yè)集聚與工業(yè)集聚的非線性效應(yīng)——基于門限回歸模型的分析
      湖湘論壇(2015年3期)2015-12-01 04:20:17
      IP語(yǔ)音報(bào)頭壓縮設(shè)計(jì)與實(shí)現(xiàn)
      任意N進(jìn)制計(jì)數(shù)器的設(shè)計(jì)方法
      河南科技(2014年10期)2014-02-27 14:09:30
      基于單片機(jī)的仰臥起坐計(jì)數(shù)器
      贺州市| 句容市| 留坝县| 磐石市| 枝江市| 肃宁县| 乐山市| 唐河县| 顺平县| 合江县| 大同市| 中方县| 塔河县| 德昌县| 萨嘎县| 富蕴县| 安庆市| 东阿县| 吕梁市| 霍林郭勒市| 长宁县| 泌阳县| 平罗县| 延川县| 逊克县| 黑河市| 河津市| 高密市| 镶黄旗| 郴州市| 云林县| 益阳市| 南投县| 嘉禾县| 怀集县| 资兴市| 马公市| 宜宾市| 乐安县| 泾源县| 福安市|