• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Hilbert-Huang變換提取語音信號共振峰方法研究

    2019-10-31 11:43:00李國一張正帥
    智能城市 2019年20期
    關(guān)鍵詞:聲道端點(diǎn)共振

    李國一 張正帥

    (山東省地震局,山東 濟(jì)南 250014)

    關(guān)鍵字:Hilbert-Huang變換;經(jīng)驗(yàn)?zāi)B(tài)分解;共振峰

    發(fā)音時(shí),把聲道看作諧振腔,氣流通過聲道,共振峰就是該腔體的諧振頻率[1-2]。通常,共振峰定義為聲道脈沖響應(yīng)的衰減正弦分量,在經(jīng)典的語音信號模型中,共振峰等效為聲道傳輸函數(shù)的復(fù)數(shù)極點(diǎn)對[3]。語音信號的共振峰參數(shù)是語音技術(shù)應(yīng)用領(lǐng)域的重要聲學(xué)特征參數(shù)之一[4],共振峰反映了聲道的響應(yīng),所以,準(zhǔn)確有效的共振峰提取算法對語音信號的分析、合成、編碼有著重要的意義。

    傳統(tǒng)的共振峰提取算法主要有離散傅立葉變換法(DFT),帶通濾波器組法,倒譜法,線性預(yù)測編碼法(LPC)等[5]。近些年來,也出現(xiàn)許多提取語音共振峰的新算法,如基于逆濾波器的共振峰提取方法[6],將語音信號分解為調(diào)制成分并采用頻域線性預(yù)測算法的共振峰估計(jì)方法[7],這些提取方法都是建立在發(fā)聲系統(tǒng)呈線性和語音信號短時(shí)平穩(wěn)的假設(shè)基礎(chǔ)上的。由于在發(fā)聲過程中聲門激勵(lì)與聲道相應(yīng)之間存在相互耦合的作用而呈現(xiàn)非線性的特性,對傳統(tǒng)的線性共振峰提取方法的準(zhǔn)確性產(chǎn)生影響[8-9]。另外,這些提取方法中參數(shù)的設(shè)定具有一定的主觀經(jīng)驗(yàn)性,造成人為的不確定性和數(shù)據(jù)的不穩(wěn)定性[4]。希爾伯特-黃變換(Hilbert-Huang Transform,HHT)是Huang N E提出的一種新的非平穩(wěn)、非線性信號分析方法,本文基于HHT的自適應(yīng)帶通濾波特性,有效地利用信號本身決定固有模態(tài)函數(shù)的中心頻率和帶寬的特點(diǎn),將該方法應(yīng)用到語音信號共振峰提取中去。

    1 希爾伯特-黃變換原理

    HHT被認(rèn)為是近年來對以傅立葉變換為基礎(chǔ)的線性和穩(wěn)態(tài)譜分析的一個(gè)重大突破,該方法是自適應(yīng)性的,既能對線性穩(wěn)態(tài)信號進(jìn)行分析,又能對非線性非穩(wěn)態(tài)信號進(jìn)行分析[10]。HHT包括經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)和希爾伯特變換(Hilbert Transformation,HT)兩部分。經(jīng)驗(yàn)?zāi)B(tài)分解方法假設(shè)各種復(fù)雜的信號都是由一些不同的固有模態(tài)函數(shù)組成,任何兩個(gè)模態(tài)之間是相互獨(dú)立的,每一個(gè)模態(tài)可以是線性的,非線性和非平穩(wěn)的,其局部極值點(diǎn)和過零點(diǎn)的數(shù)目相同,在相鄰的兩個(gè)零交叉點(diǎn)之間只有一個(gè)極值點(diǎn)。根據(jù)這一假設(shè),EMD分解可以將信號自適應(yīng)分解成一簇本征模式函數(shù)(Intrinsic Mode Function,IFM)[11],然后將每個(gè)IMF與它的Hilbert變換構(gòu)成一個(gè)復(fù)解析函數(shù),并由此導(dǎo)出作為時(shí)域信號的瞬時(shí)幅值和瞬時(shí)頻率。

    HHT變換步驟為:

    在EMD分解中,每個(gè)IMF需要多次“篩選”過程,而每一次篩選過程,需要根據(jù)上、下包絡(luò)計(jì)算出信號的局部平均值。上(下)包絡(luò)是由信號的局部極大(?。┲低ㄟ^樣條插值得到的。但信號的端點(diǎn)不可能同時(shí)處于極大值或極小值,因此,上、下包絡(luò)在數(shù)據(jù)序列兩端會發(fā)散,且這種發(fā)散會隨著運(yùn)算的進(jìn)行而逐漸向內(nèi),從而使得整個(gè)數(shù)據(jù)序列受到影響。EMD分解存在的端點(diǎn)效應(yīng),目前有端點(diǎn)鏡像方法、多項(xiàng)式擬合法、極值延拓法、平行延拓法等進(jìn)行改善[12],本文為了提高分解精度,更好地用于共振峰的提取,采用次端點(diǎn)鏡像延拓法抑制其邊緣效應(yīng)[13]。

    2 基于HHT的語音信號共振峰提取算法

    經(jīng)驗(yàn)?zāi)B(tài)分解相當(dāng)于將語音信號通過一個(gè)窄帶自適應(yīng)濾波器,經(jīng)過多次分解得到一系列從高頻到低頻,且不等帶寬的IMF分量,這些分量表示一些均值為零的窄帶調(diào)頻調(diào)幅信號,這正好與AM-FM模型所定義的單個(gè)共振峰輸出信號相吻合,能夠很好地表征共振峰的時(shí)變特性。

    共振峰提取之前要對語音信號進(jìn)行三部分預(yù)處理,第一是對語音信號進(jìn)行預(yù)加重。在語音信號處理之前通常通過插入一個(gè)一階高通濾波器進(jìn)行預(yù)加重[14],用來對語音信號提升高頻分量,同時(shí)降低基頻對共振峰檢測的干擾。第二是對共振峰預(yù)先進(jìn)行分離,通過對已加重的語音信號進(jìn)行傅立葉譜計(jì)算,粗略估算出共振峰頻率,以共振峰頻率作為FIR帶通濾波器的中心頻率進(jìn)行數(shù)字濾波,濾波器帶寬以共振峰頻率的最大變化范圍和充分抑制鄰近共振峰分量為原則[4]。第三是對語音信號分幀,進(jìn)行端點(diǎn)檢測的預(yù)處理。綜合來說,基于HHT提取語音信號共振峰的算法流程如圖1所示。主要分為5個(gè)步驟:

    第一,對語音信號進(jìn)行預(yù)加重和共振峰預(yù)分離計(jì)算,預(yù)加重。第二,分幀、端點(diǎn)檢測等預(yù)處理。第三,對每個(gè)共振峰設(shè)計(jì)FIR濾波器,進(jìn)行數(shù)字濾波。第四,根據(jù)能量最大原則,確定含有共振峰的某階IMF分量,求其固有模態(tài)函數(shù)的瞬時(shí)頻率和瞬時(shí)幅值。第五,提取含有共振峰的固有模態(tài)函數(shù),并求共振峰頻率。

    圖1 基于HHT提取語音信號共振峰的算法流程

    3 仿真實(shí)驗(yàn)與結(jié)果分析

    3.1 合成語音數(shù)據(jù)的共振峰提取

    通過AM-FM模型合成一段數(shù)據(jù)提取其共振峰,來驗(yàn)證上述方法的正確性。合成信號的3個(gè)共振峰分別為f1=600 Hz,f2=1 400 Hz,f3=1 700 Hz,帶寬分別為df1=30 Hz,df2=100 Hz,df3=200 Hz,合成信號的表達(dá)式為:

    HHT算法提取合成信號共振峰結(jié)果如圖2所示。從圖2中可以直觀地分辨出合成信號之前設(shè)定的三個(gè)共振峰的頻率,驗(yàn)證了該方法的準(zhǔn)確性。

    圖2 HHT算法提取合成信號共振峰結(jié)果

    3.2 實(shí)際語音信號的共振峰提取

    作為傳統(tǒng)共振峰提取方法,LPC法能夠有效地消除或減弱信號激勵(lì)分量對聲道的影響,但是隨著對音信號的深入研究,聲門與聲道之間的耦合存在非線性特性,所以LPC法可能無法真實(shí)準(zhǔn)確地反映共振峰頻率的變化[4],本實(shí)驗(yàn)對采用LPC法提取的共振峰頻率與采用HHT法提取的共振峰頻率進(jìn)行比較,說明HHT方法具有的優(yōu)越性。本實(shí)驗(yàn)實(shí)際語音信號選取元音[a][i][u]三個(gè)音標(biāo)的連續(xù)信號進(jìn)行分析,信號采樣率為8 kHz,幀長200點(diǎn),幀移80點(diǎn),音標(biāo)[a]存在三個(gè)共振峰,分別為800、1 200和3 000 Hz,音標(biāo)[i]存在三個(gè)共振峰,分別為300、2 300和3 000 Hz,音標(biāo)[u]存在三個(gè)共振峰,分別為350、650和2 200 Hz。LPC法在語譜圖上標(biāo)出共振峰頻率如圖3所示,HHT法在語譜圖疊加共振峰頻率如圖4所示。

    圖3 LPC法在語譜圖上標(biāo)出共振峰頻率

    圖4 HHT法在語譜圖疊加共振峰頻率

    為了衡量基于HHT方法提取的共振峰頻率的好壞,并與LPC方法進(jìn)行對比,兩種方法分別與理論上[a][i][u]音標(biāo)的理論均值相比,求得絕對誤差比的均值Δf和絕對誤差比的標(biāo)準(zhǔn)差sf進(jìn)行衡量。如表1所示。

    表1 兩種方法提取共振峰的絕對誤差比的均值Δf與標(biāo)準(zhǔn)差sf

    通過對實(shí)際語音信號進(jìn)行共振峰提取,并且得到了其誤差比的情況。絕對誤差比的均值反映了共振峰的頻率與正確結(jié)果的偏差,值越小表明越接近正確結(jié)果[14];從表1可以看出,HHT法的絕對誤差比的均值明顯小于LPC法,說明了結(jié)果的準(zhǔn)確性。而絕對誤差比的標(biāo)準(zhǔn)差反映的則是實(shí)際計(jì)算結(jié)果與正確結(jié)果的偏差分布情況,其值越小,表明實(shí)際結(jié)果與正確結(jié)果之間的偏差分布更均勻,實(shí)際計(jì)算的結(jié)果越可靠[15],從表1中也可以明顯地看出HHT方法好于LPC方法,證明了該方法的穩(wěn)定性。

    4 結(jié)語

    本文中所使用的基于HHT方法提取語音信號共振峰算法是針對語音信號的非平穩(wěn)、非線性特征所提出來的,在研究過程中可以得到以下結(jié)論:

    (1)算法中經(jīng)驗(yàn)?zāi)B(tài)分解相當(dāng)于將語音信號通過一個(gè)窄帶自適應(yīng)濾波器,實(shí)現(xiàn)信號中的頻率成分分離,并計(jì)算出各分量的瞬時(shí)頻率和瞬時(shí)幅值,以便追蹤共振峰的頻率變化。

    (2)基于HHT方法實(shí)現(xiàn)語音信號共振峰頻率的提取與經(jīng)典的LPC方法相比,兩者得出的結(jié)果總體上是一致的,說明了該方法的正確性。另外,通過對兩種方法的絕對誤差比的均值與標(biāo)準(zhǔn)差進(jìn)行計(jì)算,說明該方法在保證準(zhǔn)確性的情況下,具有更高的穩(wěn)定性。

    (3)HHT方法在進(jìn)行提取共振峰的過程中,不需要對信號進(jìn)行分幀處理,使得在時(shí)間分辨率上,HHT方法要更好一些。

    HHT是一種新興的信號處理方法,在理論和應(yīng)用上都存在許多問題,還需要逐步完善。比如,在進(jìn)行EMD分解過程中,算法復(fù)雜度比較高,影響了語音信號檢測的速度,限制了對信號的實(shí)時(shí)處理。另外,EMD分解得到的本征模式函數(shù)調(diào)幅部分在對計(jì)算瞬時(shí)頻率存在較大的影響等。

    猜你喜歡
    聲道端點(diǎn)共振
    非特征端點(diǎn)條件下PM函數(shù)的迭代根
    9.7.8聲道、造價(jià)250余萬 James極品影院賞析
    為發(fā)燒需求打造的11聲道后級 Orisun(傲力聲)OA-S11
    不等式求解過程中端點(diǎn)的確定
    安然 與時(shí)代同頻共振
    實(shí)現(xiàn)從7.2到11.2聲道的飛躍 Onkyo(安橋)TX-RZ830
    選硬人打硬仗——紫陽縣黨建與脫貧同頻共振
    參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
    CTA 中紡院+ 化纖聯(lián)盟 強(qiáng)強(qiáng)聯(lián)合 科技共振
    基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
    杂多县| 芒康县| 桦南县| 工布江达县| 水富县| 辽中县| 玉环县| 尼玛县| 贵港市| 桦南县| 娄烦县| 蓬莱市| 岗巴县| 大同市| 穆棱市| 新乡县| 始兴县| 噶尔县| 泰宁县| 元阳县| 青海省| 安塞县| 岚皋县| 称多县| 扬中市| 锡林郭勒盟| 林州市| 深圳市| 上杭县| 永安市| 勃利县| 耒阳市| 罗山县| 杨浦区| 正蓝旗| 青海省| 固原市| 盐边县| 兰溪市| 连南| 贺兰县|