• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    低信噪比環(huán)境下語(yǔ)音端點(diǎn)檢測(cè)技術(shù)

    2020-09-29 08:08:06韋莎麗曾慶寧鄭展恒
    關(guān)鍵詞:端點(diǎn)正確率信噪比

    韋莎麗,王 健,曾慶寧,鄭展恒

    (桂林電子科技大學(xué) 信息與通信學(xué)院,廣西 桂林 541004)

    0 引 言

    常用的端點(diǎn)檢測(cè)技術(shù)[1,2]有能零法、譜距離法[3]、經(jīng)驗(yàn)?zāi)J椒纸?empirical mode decomposition, EMD)法[4,5]、相關(guān)函數(shù)法、方差法、譜熵法[6]等。這些端點(diǎn)檢測(cè)方法在信噪比較高時(shí)檢測(cè)性能較好,但卻不大適用于低信噪比環(huán)境[7]。采用簡(jiǎn)單的去噪方法來(lái)增強(qiáng)語(yǔ)音是噪聲環(huán)境下提高端點(diǎn)檢測(cè)性能的一種解決方法。常用的減噪方法有維納濾波法、自適應(yīng)濾波器和譜減法[1]。近年來(lái),研究學(xué)者針對(duì)低信噪比下語(yǔ)音端點(diǎn)檢測(cè)正確率不高的問(wèn)題開(kāi)展了大量研究,由EMD分解和多窗譜估計(jì)對(duì)語(yǔ)音去噪,結(jié)合Teager能量算子和過(guò)零率進(jìn)行端點(diǎn)檢測(cè)[8]。結(jié)合譜減法的自適應(yīng)子帶選擇的頻帶方差進(jìn)行端點(diǎn)檢測(cè)[9]。把對(duì)數(shù)能量與自相關(guān)函數(shù)結(jié)合[10],將多窗譜估計(jì)和能熵比相結(jié)合的檢測(cè)算法[11],取得較好效果,但復(fù)雜度較高。

    為解決現(xiàn)有端點(diǎn)檢測(cè)算法在低信噪比環(huán)境下檢測(cè)正確率不高及穩(wěn)定性較差的問(wèn)題,本文先增強(qiáng)語(yǔ)音后結(jié)合EMD分解和改進(jìn)的自相關(guān)函數(shù)進(jìn)行雙參數(shù)雙門(mén)限端點(diǎn)檢測(cè)。仿真結(jié)果表明,在-10 dB-5 dB的不同噪聲環(huán)境下能較準(zhǔn)確地區(qū)分出語(yǔ)音信號(hào)的有話(huà)段和無(wú)話(huà)段。

    1 語(yǔ)音去噪增強(qiáng)

    1.1 調(diào)制域

    生活中接收到的語(yǔ)音信號(hào)幾乎都帶有噪聲。想要獲得清晰的語(yǔ)音信號(hào),就得對(duì)帶噪信號(hào)減噪。常用的譜減法、多窗譜估計(jì)法、對(duì)數(shù)最小均方誤差法、維納濾波法等在信噪比較高時(shí)去噪效果較好,但在低信噪比時(shí)去噪效果往往不太理想[12]。因此,需要找到一種適用于低信噪比環(huán)境下的去噪方法。常見(jiàn)的信號(hào)處理方法通常是在時(shí)域和頻域中進(jìn)行,而隨著頻率源的廣泛應(yīng)用和調(diào)頻技術(shù)的快速發(fā)展,調(diào)制域逐漸被應(yīng)用到語(yǔ)音信號(hào)處理中[13]。時(shí)域以時(shí)間和幅度軸為坐標(biāo),頻域以頻率和幅度為坐標(biāo),調(diào)制域則以頻率和時(shí)間軸為坐標(biāo),表示頻率隨時(shí)間的變化規(guī)律。三者的空間坐標(biāo)關(guān)系如圖1所示。

    圖1 空間坐標(biāo)

    設(shè)生活中接收到的信號(hào)由純凈語(yǔ)音和加性噪聲組成,則帶噪語(yǔ)音信號(hào)可以表示為

    x(n)=s(n)+d(n)

    (1)

    式中:x(n) 為帶噪語(yǔ)音信號(hào),s(n) 為純凈語(yǔ)音信號(hào),d(n) 為噪聲信號(hào)。帶噪信號(hào)分幀后,經(jīng)過(guò)短時(shí)傅里葉變換(short-time Fourier transform,STFT)得到以極坐標(biāo)表示的頻譜[14]

    X(k,ω)=|X(k,ω)|ej∠X(k,ω)

    (2)

    式中:k為幀數(shù),ω為離散頻率, |X(k,ω)|、 ∠X(k,ω) 分別表示信號(hào)的幅度譜和相位譜。對(duì)幅度譜 |X(k,ω)| 做STFT后得到調(diào)制域頻譜

    X(λ,ω,η)=|X(λ,ω,η)|ej∠X(λ,ω,η)

    (3)

    式中:λ為調(diào)制域的幀數(shù),ω為離散頻率,η為調(diào)制域的頻率, |X(λ,ω,η)| 表示調(diào)制域的幅度譜, ∠X(λ,ω,η) 為調(diào)制域的相位譜。對(duì)調(diào)制域幅度譜使用譜減法得到改進(jìn)的調(diào)制幅度譜,如下

    (4)

    式中:α代表的是過(guò)減因子(α≥1),β表示的是增益補(bǔ)償因子(0<β≤1), |Δ(λ,ω,η)| 表示的是調(diào)制域的噪聲幅度譜估計(jì),由式(5)更新噪聲

    |Δ(λ,ω,η)|2=ρ|Δ(λ-1,ω,η)|2+
    (1-ρ)|X(λ,ω,η)|2

    (5)

    式中:ρ表示遺忘因子,由噪聲的平穩(wěn)程度決定,當(dāng)信號(hào)處于噪聲段時(shí)根據(jù)式(5)更新噪聲譜。

    1.2 調(diào)制域相位補(bǔ)償

    目前很多改進(jìn)的譜減法大都忽略了含噪信號(hào)中相位的重要性,只對(duì)幅度做出相應(yīng)的調(diào)整。而相關(guān)研究表明,調(diào)制域相位能從語(yǔ)音信號(hào)中獲得更多有用信息,處理調(diào)制域相位可以進(jìn)一步抑制音樂(lè)噪聲,提高語(yǔ)音的質(zhì)量[14]。

    首先,通過(guò)噪聲的幅度譜估計(jì) |Δ(λ,ω,η)| 計(jì)算出相位補(bǔ)償度數(shù)

    Λ(λ,ω,η)=μφ(η)|Δ(λ,ω,η)|

    (6)

    式中:μ為常數(shù),φ(η) 為反對(duì)稱(chēng)函數(shù),φ(η) 可表示如下

    (7)

    (8)

    進(jìn)而得到調(diào)制域的相位補(bǔ)償公式如下

    (9)

    式中:ARG表示復(fù)數(shù)的幅角。

    (10)

    綜上可知調(diào)制域譜減法的原理如圖2所示。

    圖2 調(diào)制域譜減法原理

    1.3 去噪仿真實(shí)驗(yàn)

    為檢驗(yàn)調(diào)制域譜減法的去噪效果,將其與常見(jiàn)的基本譜減法和多帶譜減法進(jìn)行對(duì)比。仿真實(shí)驗(yàn)選用noisex-92噪聲庫(kù)中的高斯白噪聲、高速行駛的車(chē)內(nèi)噪聲(volvo)和戰(zhàn)斗機(jī)駕駛艙噪聲(f16)。噪聲采樣率為8 KHz,純凈語(yǔ)音的采樣率為16 KHz。實(shí)驗(yàn)所用信號(hào)的信噪比為-8 dB,分幀的幀長(zhǎng)設(shè)為32 ms,幀移設(shè)為8 ms。去噪效果如圖3~圖5 所示。

    圖3 高斯白噪聲下去噪效果

    圖4 volvo噪聲下去噪效果

    圖5 f16噪聲下去噪效果

    由圖3~圖5顯示的對(duì)比結(jié)果可知,多帶譜減法在3種噪聲條件下的去噪效果是三者中最差的,尤其是在高斯白噪聲條件下,減噪后語(yǔ)音信號(hào)依然被噪聲淹沒(méi),在volvo噪聲及f16噪聲下去噪后雖然語(yǔ)音沒(méi)完全被噪聲覆蓋,但信號(hào)中依舊存在大量噪聲。3種噪聲環(huán)境下多帶譜減法去噪后僅將信噪比提高了8 dB左右。基本譜減法在高斯白噪聲及volvo噪聲環(huán)境下去噪效果較為理想,比較適用于volvo噪聲,但去噪后的信號(hào)出現(xiàn)很多毛刺現(xiàn)象,在f16噪聲下效果較差,毛刺現(xiàn)象極為嚴(yán)重,語(yǔ)音嚴(yán)重失真。本文采用的調(diào)制域譜減法在3種噪聲環(huán)境下的去噪效果均優(yōu)于對(duì)比的基本譜減法和多帶譜減法,尤其適用于volvo噪聲環(huán)境,可將信噪比提高21 dB。去噪后的信號(hào)幾乎不存在毛刺現(xiàn)象,并且語(yǔ)音失真情況遠(yuǎn)遠(yuǎn)優(yōu)于基本譜減法和多帶譜減法,語(yǔ)音的保持度較好。由此可知,借助調(diào)制域譜減法在端點(diǎn)檢測(cè)的前端對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行消噪增強(qiáng),在語(yǔ)音失真度較小的前提下提高信噪比,從而可為后期的端點(diǎn)檢測(cè)提供良好的語(yǔ)音數(shù)據(jù),以望能提高檢測(cè)性能。

    2 語(yǔ)音端點(diǎn)檢測(cè)

    2.1 經(jīng)驗(yàn)?zāi)J椒纸舛它c(diǎn)檢測(cè)

    2.1.1 經(jīng)驗(yàn)?zāi)J椒纸?/p>

    本征模態(tài)函數(shù)(intrinsic mode function, imf)由Huang等于1998年提出,同時(shí)還提出經(jīng)驗(yàn)?zāi)J椒纸?empirical mode decom-position, EMD)。EMD的核心是把信號(hào)分解成不同的imf分量與一個(gè)余項(xiàng)的和,如式(11)所示

    (11)

    式中:i表示階數(shù),ci(t) 表示第i階模式分量,rn(t) 表示原始信號(hào)的余項(xiàng)。每個(gè)imf代表一個(gè)頻率成分,表示信號(hào)的主要特征,而剩余分量表示信號(hào)的緩慢變化[15,16]。我們可以通過(guò)分析imf掌握信號(hào)的動(dòng)態(tài)信息。部分imf的主要能量成分為噪聲分量,研究表明EMD分解的前兩階imf中含有白噪聲的75%分量,所以將含較多噪聲分量的前兩階imf去除,用余下的分量重新合成語(yǔ)音信號(hào),即可實(shí)現(xiàn)對(duì)含噪語(yǔ)音信號(hào)的初步去噪。EMD分解的主要目的是將復(fù)雜信號(hào)分解為簡(jiǎn)單的imf分量集,使得上下包絡(luò)線(xiàn)更加對(duì)稱(chēng)。imf分量要滿(mǎn)足的兩個(gè)條件如下:

    (1)在整個(gè)序列中,極值點(diǎn)與過(guò)零點(diǎn)的數(shù)量最多只能相差一個(gè);

    (2)在所有時(shí)間點(diǎn)上,信號(hào)局部極大值和局部極小值所確定的上下包絡(luò)線(xiàn)的均值必須處處為零[4]。

    EMD方法是依據(jù)原信號(hào)局域時(shí)間的某些特性,將信號(hào)分解為imf的集合,這些模態(tài)函數(shù)涵蓋了原信號(hào)所有不同的頻率成分,并隨著信號(hào)的變化而改變。因此,可從不同的imf分量中獲得語(yǔ)音特征信息。在EMD分解后進(jìn)行端點(diǎn)檢測(cè)的方法有很多,如EMD分解后計(jì)算各階imf的短時(shí)過(guò)零率法,EMD后計(jì)算imf分量的短時(shí)能量法,EMD分解后分別計(jì)算每個(gè)不同頻帶的高階統(tǒng)計(jì)量,然后根據(jù)系數(shù)的峭度變化進(jìn)行端點(diǎn)檢測(cè)的方法等。本文主要研究EMD分解后根據(jù)Teager能量算子(Teager energy operator, TEO)計(jì)算信號(hào)能量的端點(diǎn)檢測(cè)法。

    2.1.2 Teager能量算子

    Teager能量算子(Teager energy operator, TEO)是由Kaiser提出的一種可獲取信號(hào)“能量”的算子,具有非線(xiàn)性,可在增強(qiáng)穩(wěn)定及半穩(wěn)定信號(hào)的同時(shí)減弱不穩(wěn)定信號(hào)[16]。而語(yǔ)音信號(hào)中的有話(huà)部分是穩(wěn)定或半穩(wěn)定信號(hào),無(wú)話(huà)部分是不穩(wěn)定信號(hào)。Teager能量算子能在表征信號(hào)幅度變化的同時(shí)表征信號(hào)的頻率變化,對(duì)語(yǔ)音具有很好的適用性。

    離散時(shí)間序列的TEO定義如下

    T[xi(m)]=[xi(m)]2-xi(m+1)xi(m-1)

    (12)

    式中:xi(m) 為語(yǔ)音信號(hào)x(n) 加窗分幀后的第i幀信號(hào),N為幀長(zhǎng),m=1,2,…,N。

    2.2 自相關(guān)函數(shù)主副峰比值的端點(diǎn)檢測(cè)

    語(yǔ)音和噪聲的一個(gè)重大區(qū)別在于語(yǔ)音的濁音段呈周期性而大部分噪聲沒(méi)有周期性。信號(hào)的自相關(guān)函數(shù)的周期性通常與原信號(hào)相同,且周期也相同。根據(jù)這一性質(zhì),求取一段含噪語(yǔ)音信號(hào)的自相關(guān)函數(shù)可判別出語(yǔ)音信號(hào)和噪聲[10]。

    語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)的特性,對(duì)語(yǔ)音信號(hào)x(n) 分幀后的第i幀信號(hào)設(shè)為xi(m), 其幀長(zhǎng)設(shè)為N, 延時(shí)量為k, 則第i幀信號(hào)的短時(shí)自相關(guān)函數(shù)為

    (13)

    定義主峰與最大副峰比值為

    (14)

    式中:R(0) 為主峰幅值,Rm為最大副峰幅值。

    含噪語(yǔ)音信號(hào)的有話(huà)幀和噪聲幀歸一化后的自相關(guān)函數(shù)曲線(xiàn)如圖6所示。

    圖6 有話(huà)幀和噪聲幀短時(shí)自相關(guān)函數(shù)曲線(xiàn)

    由圖6可知有話(huà)幀和噪聲幀的最大幅度值為1,有話(huà)幀的最大副峰約為0.3,噪聲幀的最大副峰約為0.1,故有話(huà)幀的主副峰比值約為3.3,噪聲幀的主副峰比值約為10,兩者相差很大,可依此判別語(yǔ)音和噪音。

    然而,在現(xiàn)實(shí)環(huán)境中噪聲隨機(jī)性會(huì)比較大,含有的高頻成分可能比較多,尤其是在低信噪比環(huán)境下,自相關(guān)函數(shù)主副峰比值波形在噪聲段易出現(xiàn)起伏不定的情況,從而影響檢測(cè)結(jié)果。因此,僅依靠自相關(guān)函數(shù)主副峰值比進(jìn)行端點(diǎn)檢測(cè)并不可靠,需要做出改進(jìn)。

    2.3 改進(jìn)的自相關(guān)函數(shù)端點(diǎn)檢測(cè)

    漢語(yǔ)中含元音的韻母能量較大,而噪聲段的能量則很低,故可根據(jù)短時(shí)能量判別語(yǔ)音和噪音。短時(shí)能量由下式計(jì)算可得

    (15)

    則每幀信號(hào)的對(duì)數(shù)能量為

    LEi=lg(1+Ei/c)

    (16)

    式中:c為大于1的常數(shù),此處取c=2。 含噪語(yǔ)音的短時(shí)能量和對(duì)數(shù)能量的曲線(xiàn)如圖7所示。

    圖7 含噪語(yǔ)音的短時(shí)能量和對(duì)數(shù)能量曲線(xiàn)

    由圖7可知含噪信號(hào)的對(duì)數(shù)能量幅值沒(méi)有劇烈跳變,對(duì)短時(shí)能量曲線(xiàn)起一定的平滑作用,并在一定程度上提高及穩(wěn)定有話(huà)段能量的幅度。因此考慮將信號(hào)的對(duì)數(shù)能量運(yùn)用于端點(diǎn)檢測(cè)。

    一段語(yǔ)音的自相關(guān)函數(shù)主副峰比值和短時(shí)過(guò)零率如圖8所示。

    圖8 自相關(guān)函數(shù)主副峰值比和過(guò)零率曲線(xiàn)

    根據(jù)圖8可知自相關(guān)函數(shù)主副峰比值和短時(shí)過(guò)零率在噪聲段有較大的值,語(yǔ)音段有較小的值,且自相關(guān)函數(shù)主副峰比值曲線(xiàn)比過(guò)零率曲線(xiàn)更加平滑且穩(wěn)定。端點(diǎn)檢測(cè)常用的短時(shí)能量除以過(guò)零率法是根據(jù)語(yǔ)音段能量較大,而過(guò)零率較小,噪聲段則相反的原理用能量值除以過(guò)零率可拉大語(yǔ)音和噪聲的差距依次判斷語(yǔ)音和噪聲段。根據(jù)這一原理把對(duì)數(shù)能量除以自相關(guān)函數(shù)主副峰值比亦可判斷出語(yǔ)音和噪聲段。二者的曲線(xiàn)如圖9所示。

    圖9 含噪語(yǔ)音的短時(shí)能量和對(duì)數(shù)能量曲線(xiàn)

    根據(jù)圖9可知對(duì)數(shù)能量除以自相關(guān)函數(shù)主副峰比值在語(yǔ)音和噪聲交界處的曲線(xiàn)更加陡峭,并且幅值更高更穩(wěn)定,更易區(qū)分出語(yǔ)音和噪聲。

    2.4 TEO結(jié)合改進(jìn)自相關(guān)函數(shù)端點(diǎn)檢測(cè)

    對(duì)于低信噪比環(huán)境下檢測(cè)正確率不高及穩(wěn)定性較差的問(wèn)題,需要研究一種新的端點(diǎn)檢測(cè)方法,能在強(qiáng)噪聲的惡劣環(huán)境下改善端點(diǎn)檢測(cè)的性能,提高正確率。對(duì)此,本文提出了結(jié)合調(diào)制域譜減法的基于Teager能量算子和改進(jìn)自相關(guān)函數(shù)的端點(diǎn)檢測(cè)法,具體步驟如下:

    (1)對(duì)帶噪的語(yǔ)音信號(hào)通過(guò)調(diào)制域譜減法去除噪聲,提高含噪語(yǔ)音的信噪比。

    (2)對(duì)去噪后的語(yǔ)音信號(hào)進(jìn)行EMD分解,得到一系列imf分量,用除前2階外的其它階imf分量重構(gòu)語(yǔ)音信號(hào)。

    (3)對(duì)重構(gòu)后的語(yǔ)音信號(hào)進(jìn)行加窗分幀處理,并對(duì)每幀信號(hào)進(jìn)行二次EMD分解,得到一組新的imf分量,由式(14)計(jì)算imf分量Teager能量值的均值,根據(jù)每幀信號(hào)的Teager能量平均值設(shè)置端點(diǎn)檢測(cè)的相應(yīng)門(mén)限閾值。

    (4)對(duì)步驟(1)中調(diào)制域譜減去噪后的語(yǔ)音信號(hào)進(jìn)行加窗分幀處理。

    (5)求步驟(4)中每幀信號(hào)的對(duì)數(shù)能量、自相關(guān)函數(shù)及其主副峰比值,歸一化后用對(duì)數(shù)能量除以相關(guān)函數(shù)主副峰比值,并依此設(shè)置端點(diǎn)檢測(cè)的另一門(mén)限閾值。

    (6)依據(jù)雙參數(shù)雙門(mén)限法進(jìn)行端點(diǎn)檢測(cè)。

    3 實(shí)驗(yàn)結(jié)果及分析

    在仿真實(shí)驗(yàn)中,用M-AUDIO公司的M-TRACK EGIHT音頻采集器進(jìn)行數(shù)據(jù)采集,錄制背景為相對(duì)安靜的大小為8*5*3立方米的室內(nèi)環(huán)境。實(shí)驗(yàn)所用的語(yǔ)音內(nèi)容為“小白小白,打開(kāi)音箱”,采樣頻率為16 kHz。實(shí)驗(yàn)所用的噪聲采樣頻率都是8 kHz,采樣精度均為16 bit。對(duì)語(yǔ)音信號(hào)分幀,幀長(zhǎng)wlen=512個(gè)采樣點(diǎn)數(shù),幀移inc=128個(gè)采樣點(diǎn)數(shù)。實(shí)驗(yàn)平臺(tái)選擇MATLAB仿真工具。

    本文研究低信噪比環(huán)境下的語(yǔ)音端點(diǎn)檢測(cè)算法,針對(duì)實(shí)際環(huán)境中常見(jiàn)的高斯白噪聲、volvo車(chē)內(nèi)噪聲和f16噪聲3種噪聲環(huán)境進(jìn)行仿真。分別在5 dB、0 dB、-5 dB、-10 dB 信噪比環(huán)境下進(jìn)行實(shí)驗(yàn)。為驗(yàn)證本文算法的可行性,采用兩種經(jīng)典的算法以及兩個(gè)近兩年提出的改進(jìn)算法與本文的算法進(jìn)行對(duì)比,分別是:①多帶譜減法與短時(shí)能量-過(guò)零率結(jié)合法;②基本譜減法結(jié)合子帶分離頻帶方差法;③吳進(jìn)等提出的文獻(xiàn)[8]中的EMD和改進(jìn)譜減法結(jié)合的端點(diǎn)檢測(cè)算法;④陳澤偉等提出的文獻(xiàn)[10]的改進(jìn)自相關(guān)函數(shù)的端點(diǎn)檢測(cè)方法。以下所有圖中的豎實(shí)線(xiàn)的位置表示語(yǔ)音開(kāi)始點(diǎn),豎虛線(xiàn)代表結(jié)束點(diǎn)。

    為了研究不同噪聲環(huán)境下端點(diǎn)檢測(cè)的正確率,需要對(duì)純凈語(yǔ)音進(jìn)行檢測(cè)作為參考。圖10表示純凈語(yǔ)音的端點(diǎn)檢測(cè)結(jié)果。

    圖10 純凈語(yǔ)音端點(diǎn)檢測(cè)結(jié)果

    圖11是高斯白噪聲環(huán)境下信噪比為-10 dB的5種算法檢測(cè)結(jié)果。

    由以上5幅圖可知在高斯白噪聲-10 dB信噪比條件下,5種算法的檢測(cè)效果分析如下:

    對(duì)比算法1:結(jié)合多帶譜減的能量-過(guò)零率法在低信噪比下出現(xiàn)錯(cuò)檢和漏檢情況,去噪后的語(yǔ)音信號(hào)依然被噪聲淹沒(méi),“白”、“打”和“音”字被誤判為噪聲。由于語(yǔ)音信號(hào)被噪聲覆蓋,故短時(shí)平均能量和過(guò)零率曲線(xiàn)波動(dòng)平緩,參數(shù)的閾值門(mén)限不好設(shè)置,易出現(xiàn)誤判情況。

    對(duì)比算法2:結(jié)合基本譜減法的子帶分離頻帶方差法,端點(diǎn)檢測(cè)的結(jié)果也較好,但是“音”字被誤判為噪聲,段末的尾音均未被檢出。語(yǔ)音強(qiáng)度較弱的部分方差幅值較低且平緩,閾值門(mén)限設(shè)置困難。

    對(duì)比算法3:文獻(xiàn)[8]的多窗譜估計(jì)結(jié)合EMD和過(guò)零率法,語(yǔ)音基本上能被檢測(cè)出來(lái),但能量較小的“音”字沒(méi)完全檢出,依然存在語(yǔ)音漏檢情況。

    對(duì)比算法4:文獻(xiàn)[10]的改進(jìn)相關(guān)函數(shù)檢測(cè)法把“打”字判成了兩個(gè)音,而“音”字卻并未檢測(cè)出來(lái),連音部分被分開(kāi),且尾音部分被截掉。

    圖11 高斯白噪聲下-10 dB檢測(cè)結(jié)果

    本文算法在高斯白噪聲-10 dB信噪比條件下由于經(jīng)過(guò)調(diào)制域譜減法及EMD分解去噪,提高了信噪比,故端點(diǎn)檢測(cè)效果較好,只出現(xiàn)輕微的截?cái)辔惨衄F(xiàn)象,這是因?yàn)樵?-10 dB 信噪比下語(yǔ)音被噪聲淹沒(méi),尤其是輕音和尾音部分,在使用調(diào)制域譜減法對(duì)含噪語(yǔ)音進(jìn)行去噪時(shí)把尾音當(dāng)作噪聲也給去掉了。并且在連音部分并未出現(xiàn)間斷情況,有話(huà)幀在可接受的范圍內(nèi)算是完全被正確檢測(cè)出來(lái),而對(duì)比的4種算法都出現(xiàn)發(fā)音較輕的“音”字未被檢出。由此可見(jiàn)本文算法在高斯白噪聲-10 dB信噪比條件下抗噪性能好,檢測(cè)正確率高,魯棒性較好。

    本文共對(duì)3種噪聲環(huán)境下的4種信噪比情況進(jìn)行研究,作為參考對(duì)比的算法共有4個(gè),而由于空間版面有限,除高斯白噪聲環(huán)境下信噪比為-10 dB的5種算法檢測(cè)結(jié)果外,其它情況下檢測(cè)結(jié)果的正確率以折線(xiàn)圖的形式給出。圖12(a)~圖12(c)分別是在高斯白噪聲、volvo和f16噪聲環(huán)境下5種檢測(cè)算法的正確率折線(xiàn)圖。橫坐標(biāo)表示信噪比,縱坐標(biāo)表示端點(diǎn)檢測(cè)的正確率,其中正確率計(jì)算方式如下

    式中:誤判幀數(shù)包括噪聲幀檢測(cè)為語(yǔ)音幀和語(yǔ)音幀檢測(cè)為噪聲幀。

    圖12 不同噪聲環(huán)境下的檢測(cè)正確率

    從圖12可以看出,5種算法在不同噪聲環(huán)境下隨著信噪比的不斷提高,檢測(cè)正確率都呈現(xiàn)上升趨勢(shì)。結(jié)合多帶譜減的能量-過(guò)零率法及結(jié)合基本譜減法的子帶分離頻帶方差法在3種噪聲低信噪比環(huán)境下的端點(diǎn)檢測(cè)正確率均不理想,特別是結(jié)合多帶譜減的能-零法在高斯白噪聲和f16噪聲信噪比低于-5 dB區(qū)域的正確率嚴(yán)重下降。這是因?yàn)樵诘托旁氡认拢Z(yǔ)音中含有很多反復(fù)穿過(guò)坐標(biāo)軸的噪聲,產(chǎn)生了大量的虛假過(guò)零率,造成嚴(yán)重的端點(diǎn)誤判,導(dǎo)致檢測(cè)正確率極低。文獻(xiàn)[8]方法在volvo噪聲和高斯白噪聲條件下檢測(cè)正確率較高,尤其適用于volvo噪聲環(huán)境。但在f16噪聲下正確率較低,這說(shuō)明該方法的適用性不夠強(qiáng)。文獻(xiàn)[10]方法在高斯白噪聲和f16噪聲環(huán)境下檢測(cè)性能較好,在信噪比高于-5 dB區(qū)域檢測(cè)正確率較高,但在volvo噪聲環(huán)境下檢測(cè)性能呈直線(xiàn)下降趨勢(shì)。可見(jiàn)該方法不適用于volvo噪聲環(huán)境。本文提出的端點(diǎn)檢測(cè)算法在高斯白噪聲、volvo、f16這3種噪聲環(huán)境下,檢測(cè)的正確率明顯高于4種對(duì)比的算法。本文算法結(jié)合了文獻(xiàn)[8]和文獻(xiàn)[10]算法的優(yōu)點(diǎn),在高斯白噪聲和volvo噪聲環(huán)境下檢測(cè)的正確率都很高,在f16噪聲環(huán)境下雖然整體正確率低于另外兩種噪聲環(huán)境,但其依然明顯高于對(duì)比的4種算法,本文算法的檢測(cè)正確率隨著信噪比的減少稍有降低,而對(duì)比的4種算法的正確率卻大幅度下降。本文算法除了在f16噪聲信噪比低于-5 dB區(qū)域檢測(cè)正確率低于90%,其它情況下正確率均高于90%。這說(shuō)明本文算法在低信噪比環(huán)境下檢測(cè)效果優(yōu)于對(duì)比的兩種傳統(tǒng)方法和近兩年提出的兩種新端點(diǎn)檢測(cè)法,對(duì)噪聲環(huán)境的適應(yīng)性較強(qiáng),抗噪性能較好,并具有良好的魯棒性。

    4 結(jié)束語(yǔ)

    本文通過(guò)對(duì)Teager能量算子、對(duì)數(shù)能量和自相關(guān)函數(shù)的研究,提出了一種借助調(diào)制域譜減法去噪后進(jìn)行EMD分解并計(jì)算其TEO能量,再結(jié)合改進(jìn)自相關(guān)函數(shù)的端點(diǎn)檢測(cè)方法。該方法在端點(diǎn)檢測(cè)前端對(duì)帶噪信號(hào)進(jìn)行減噪,為后續(xù)的檢測(cè)創(chuàng)造良好的數(shù)據(jù)條件,以便能更加準(zhǔn)確地提取信號(hào)特征。最后結(jié)合TEO能量算子和改進(jìn)相關(guān)函數(shù)利用雙門(mén)限法對(duì)信號(hào)進(jìn)行端點(diǎn)檢測(cè)。實(shí)驗(yàn)結(jié)果證明,本文算法在不同類(lèi)型的低信噪比環(huán)境下能有效提高含噪語(yǔ)音端點(diǎn)檢測(cè)的質(zhì)量,降低誤識(shí)和漏識(shí)率,具有一定的抗噪性和穩(wěn)定性,適用范圍更廣。但是,由于本文算法加入調(diào)制域譜減算法,并進(jìn)行EMD分解重構(gòu)再結(jié)合改進(jìn)的相關(guān)函數(shù)法,增加了算法的計(jì)算復(fù)雜度,相較于單個(gè)算法運(yùn)行時(shí)間較久,并且在實(shí)際環(huán)境中背景噪聲的隨機(jī)性大,如何在保持算法的準(zhǔn)確度的前提下縮短運(yùn)行時(shí)間并使其能適應(yīng)混合復(fù)雜噪聲環(huán)境將是以后研究的重點(diǎn)。

    猜你喜歡
    端點(diǎn)正確率信噪比
    非特征端點(diǎn)條件下PM函數(shù)的迭代根
    門(mén)診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
    基于深度學(xué)習(xí)的無(wú)人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
    不等式求解過(guò)程中端點(diǎn)的確定
    低信噪比下LFMCW信號(hào)調(diào)頻參數(shù)估計(jì)
    低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
    參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
    生意
    品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
    生意
    曲周县| 东兰县| 河北区| 黄冈市| 密云县| 搜索| 临泽县| 文山县| 重庆市| 卢氏县| 庆云县| 鹤庆县| 察哈| 嘉禾县| 右玉县| 新营市| 栾城县| 桐柏县| 苏尼特左旗| 丰顺县| 三河市| 郁南县| 东丽区| 方山县| 红原县| 茌平县| 资阳市| 德江县| 南汇区| 固镇县| 海南省| 乌兰察布市| 刚察县| 罗源县| 胶州市| 库伦旗| 阳朔县| 盘锦市| 衡南县| 体育| 寿光市|