• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種改進的基于高階統(tǒng)計分析的語音激活檢測算法*

      2020-07-19 02:03:54孔德廷
      通信技術(shù) 2020年7期
      關(guān)鍵詞:高階高斯噪音

      孔德廷

      (中國西南電子技術(shù)研究所,四川 成都 610036)

      0 引言

      語音激活檢測(voice activity detection,VAD)算法[1]是指能夠有效的區(qū)分語音信號和背景噪音信號,是語音信號處理中一個重要的研究領域,也是語音通信設備中的一個重要組成部分。語音激活檢測算法旨在能夠準確的將一段語音信號中語音激活區(qū)域標識出來,為后續(xù)的語音自動增益控制、變速率語音編碼、語音識別等模塊提供處理依據(jù)。語音激活檢測算法在很多通信標準中都進行了描述,如ITU G729B[2]中采用的算法融合了能量差分、過零率和譜差分的檢測方法。

      傳統(tǒng)的語音激活檢測算法主要包括:基于短時能量[3]、過零率、周期測量、LPC 系數(shù)、倒譜特征[4]、譜熵和基于高階統(tǒng)計量[5]等語音特征參數(shù)的方法。近來,一些學者還研究了綜合上述方案中優(yōu)點,綜合多種判決規(guī)則,提高系統(tǒng)性能。目前的語音激活檢測算法通常只適用于平穩(wěn)的噪聲環(huán)境,在低信噪比已經(jīng)非平穩(wěn)噪聲環(huán)境中的效果并不理想。

      今年來,由于高階統(tǒng)計量能夠有效的抑制高斯噪聲,J.M.Gorrize 和J.Ramirez 提出利用語音輸入信號的雙頻譜的三階累積量進行語音激活檢測[6-7],獲得了較為健壯的語音判決準則。本文提出了一種健壯的語音檢測算法,基于語音信號的高階統(tǒng)計分析,本算法提出了幾種新的屬性量用于鑒別語音信號和背景噪音信號。

      1 正弦語音分析模型

      在語音信號分析過程中,正弦模型是最簡單且經(jīng)常應用最廣的,通常也稱為零相位諧波表示。該模型最大的優(yōu)點在于它對于濁音和非濁音使用了相同的表達式,因此,一幀語音信號中的兩種類型信號允許以軟判決的方式進行區(qū)分。短時窗內(nèi)的語音信號可以表示為:

      式中n0表示短時語音起始時間,M表示正弦波個數(shù),am表示相應正弦波幅度,ωm表示相應正弦波頻率。對于語音信號,上述模型等效為一組諧波之和,即ωm=M·ω0,其中ω0為基頻。

      上式中相位分量ψm跟截止頻率ωc和語音信號似然概率Pv相關(guān),表示為:

      上式中,如果正弦波分量的頻率大于語音信號的截止頻率,則該分量為噪音信號分量,其對應的相位分量ψm服從[-π,π]之間均勻分布。如果語音信號x(n)為純凈的無噪音語音信號,即語音信號似然概率Pv趨近于1,則所有正弦波分量的相位分量ψm為0。

      相位分量θm表示為第m個正弦分量的系統(tǒng)相位分量,為了簡化,通常假定該分量為0 或者隨分量頻率線性變化。

      2 高階統(tǒng)計分析語音激活算法

      2.1 LPC 殘差特性

      基于LPC 預測模型,LPC 殘差具有白化輸入信號的特性,基于上述正弦語音信號模型,語音信號經(jīng)過LPC 預測濾波器后,其殘差具有如下特性:

      (1)語音信號的殘差:可以表征為一組具有相同幅度的正弦波分量信號之和,正弦波分量信號的頻率與原輸入信號相等。如果輸入語音信號時平穩(wěn)的,則所有正弦波分量信號諧相關(guān);否則,可能不是諧相關(guān)的。

      (2)非語音信號的殘差:可以表征為一組具有隨機相位的正弦波分量信號之和,可以等效為非高斯-白噪音處理。

      (3)高斯噪音的殘差:可以等效為高斯-白噪音處理。

      2.2 高階屬性量

      對于離散語音信號x(n),n取值0,±1,±2,…,則其k階矩函數(shù)定義為:

      其相應的二、三、四階累積量可以表示為:

      則二、三、四階累積量在軸零點位置的取值分別表示為輸入信號的方差(Variance)、偏度(Skewness)和峰度(Kurtosis),歸一化后分別如下式所示:

      上述中歸一化的偏度γ3和峰度γ4可以用來作為判決當前語音信號的指示,當輸入信號為語音信號時,γ3和γ4均大于0,;當輸入信號為高斯噪音信號時,上述值小于等于0。然而,隨著SNR 的降低,γ3和γ4作為語音判決指示的可靠性降低,引入偏峰比(SKR)作為另一判決量,其定義如下:

      另外,為了估計當前輸入信號的信噪比,分別對輸入LPC 殘差信號以及LPC 殘差經(jīng)過低通濾波器后的信號依據(jù)下述公式計算得到兩個信噪比(TotalSNR、LpcLpSNR)估計值,下述公式中的SNR均為LpcLpSNR。

      式中vg為噪聲估計能量。

      假定離散語音信號x(n)的頻域表示為X(ω),則三階累積量的垂直分量C3[τ]≡C3(0,τ)的頻域可以表示為:

      則依據(jù)上述LPC 殘差特性,可以得到如下結(jié)果:

      (1)x(n)平穩(wěn)語音信號的殘差:

      X(ω) 在頻域為正負軸各包含M個等幅度的脈沖,頻率公式可表示為X(ω)=(a/2)ejkω,ω=±(ω0,2ω0,…,Mω0),式中k為一系統(tǒng)常數(shù),a為每個諧波分量的幅度。依據(jù)頻率卷積、點乘原理,可得到:

      式中c=23/2/8,Es=m2[0]=M·(a2/2)為信號能量。

      (2)x(n)高斯噪音信號的殘差:

      C3[τ]趨近于或者等于0。

      同上述推導過程,可以得到LPC 殘差的四階累積量的垂直分量C4[τ]≡C4(0,τ,τ)在τ=0 時有如下結(jié)果:

      (1)x(n)平穩(wěn)語音信號的殘差:

      (2)x(n)高斯噪音信號的殘差:

      C4[τ]趨近于或者等于0。

      假定一帶噪語音信號x(n)=s(n)+g(n),其中s(n)和g(n)相互獨立,則信號x(n)的能量等于語音信號s(n)的能量Es和噪音信號g(n)的能量En之和。假定噪音信號為高斯噪音,則依據(jù)上述結(jié)論,帶噪語音信號的高階統(tǒng)計量C3[0]和C4[0]與純凈語音信號s(n)的高階統(tǒng)計量相等。表示如下,式中SNR 為帶噪語音信號的信噪比:

      高斯噪音信號的偏度(Skewness)和峰度(Kurtosis)僅在統(tǒng)計平均下為0,在實際有限長的語音信號處理中,該值通常不能滿足上述假定。對于高斯噪音信號g(n),其k階矩為:

      根據(jù)文獻[8],高斯噪音信號的三階矩、四階矩計算量的均值和方差為:

      式中vg為噪音信號能力估計。根據(jù)中心極限定理[9],高斯噪音信號偏度、峰度的估計值可以表示為:

      基于文獻[10],對于一個給定語音信號為高斯噪音的概率估計值可以表示為:

      LPC 預測誤差定義為如下所示,該量表示為預測增益的取逆,通常當輸入信號為語音信號時,該值通常較小。故該量用于判決當前信號為語音信號的附加條件。

      一段語音信號分為兩種狀態(tài):語音信號和噪音信號,基于上述統(tǒng)計屬性量,兩種狀態(tài)之間的轉(zhuǎn)移狀態(tài)圖如圖1 所示。

      圖1 語音激活檢測判決狀態(tài)

      3 仿真分析

      文中提出的基于高階統(tǒng)計的改進型語音激活檢測算法相對于傳統(tǒng)的高階統(tǒng)計分析算法,提出了幾種新的分析度量。本節(jié)將在不同的背景噪音及不同的輸入信噪比下,仿真分析文中所提到的改進算法的檢測性能。

      仿真條件如下:帶噪語音信號采樣率為8KHz,噪音類型分別為高斯噪聲(Gaussian Noise)、類高斯噪音(Gaussian Like Noise),每幀的有效樣本點數(shù)為160,相鄰兩幀的重疊樣本數(shù)為80,輸入信號信噪比為-6 dB、0 dB、6 dB、12 dB。歸一化偏度閾值Thskewness設置為0.15,歸一化峰度閾值Thkurtosis設置為0.15,偏峰比閾值設置為1,噪音概率閾值ThPnoise設置為0.005,信噪比閾值ThSNR和ThTotalSNR分別設置為5 和10。

      給出了本文算法在0dB 汽車發(fā)動機噪音(類高斯噪音)條件下,與G729 語音激活檢測算法的檢測結(jié)果對比圖,圖中的順序依次為:原始語音信號、真實語音信號標志、基于G729 語音激活檢測算法的語音激活標志、基于本文算法的語音激活標志。由圖2 可知,本文算法相對于G729 語音激活檢測算法在類高斯噪音環(huán)境下,具有更好的檢測性能。

      最后,給出在汽車背景噪音和街道背景噪音下不同信噪比時正確檢測語音信號的概率(Ps)、正確檢測噪音信號的概率(Pn)、以及誤判概率(Pf)的對比分析表格。從表1 中可以看出本文算法在語音信號檢測正確率以及誤判概率等指標上都要優(yōu)于基于G729 語音激活檢測算法,特別在低信噪比條件下,準確識別概率性能的提升更加明顯。

      圖2 汽車噪音條件下的語音激活檢測性能對比

      表1 本文算法與G729 中語音激活檢測算法性能對比

      4 結(jié)語

      本文針對語音信號存在不同背景噪音條件下的語音激活區(qū)域檢測問題,基于高階統(tǒng)計理論,通過引入對語音信號LPC 殘差域的高階統(tǒng)計分析模型,提出了幾種高階統(tǒng)計屬性量用于語音、噪音信號的判決標準,進而形成一種改進的基于高階統(tǒng)計的語音檢測算法。仿真結(jié)果表明,本算法能夠有效的識別帶噪語音信號中的語音激活區(qū)域,且在低信噪比條件下,相對于傳統(tǒng)算法具有更好的識別性能。

      猜你喜歡
      高階高斯噪音
      小高斯的大發(fā)現(xiàn)
      有限圖上高階Yamabe型方程的非平凡解
      高階各向異性Cahn-Hilliard-Navier-Stokes系統(tǒng)的弱解
      滾動軸承壽命高階計算與應用
      哈爾濱軸承(2020年1期)2020-11-03 09:16:02
      噪音,總是有噪音!
      無法逃避的噪音
      天才數(shù)學家——高斯
      噪音的小把戲
      白噪音的三種用法
      Coco薇(2017年9期)2017-09-07 22:09:28
      基于Bernstein多項式的配點法解高階常微分方程
      兴化市| 本溪| 安徽省| 彭水| 宁城县| 宁津县| 莱芜市| 特克斯县| 呼图壁县| 乳山市| 卢湾区| 旺苍县| 固原市| 巴彦县| 漳浦县| 乐业县| 尼木县| 天津市| 青海省| 汉阴县| 友谊县| 宜阳县| 象州县| 永福县| 赤水市| 霍城县| 肥乡县| 平顺县| 松原市| 安泽县| 山阴县| 张家川| 宜兰县| 哈密市| 安多县| 龙门县| 平度市| 稷山县| 天等县| 盱眙县| 台湾省|