田英
一、語音分析方法
語音信號分析是語音信號處理的前提和基礎,只有分析出可表示語音信號本質(zhì)特性的參數(shù),才有可能利用這些參數(shù)進行高效的語音通信、語音合成和語音識別等處理。
(l)時域分析方法
語音信號的時域分析就是分析和提取語音信號的時域參數(shù),是一種比較直觀的分析方法。時域分析通常用于最基本的參數(shù)分析及應用,如語音的分割、預處理與分類等,其實現(xiàn)簡單、運算量也較小。
(2)頻域分析方法
從廣義上講,語音信號的頻域分析包括語音信號的頻譜、功率譜、倒頻譜、頻譜包絡分析等。常用的頻域分析方法包括傅立葉變換法等。因為語音信號是一個非平穩(wěn)過程,因此適用于周期、非瞬變或平穩(wěn)隨機信號的標準傅立葉變換不能用來直接分析,而應該用短時傅立葉變換進行頻譜分析,相應的頻譜稱為“短時譜”。
(3)同態(tài)分析
同態(tài)分析實現(xiàn)了將卷積關系變換為求和關系的分離處理,即解卷。對語音信號進行解卷,可將語音信號的聲門激勵信息及聲道響應信息分離開來,從而求得聲道共振特征和基音周期,用于語音編碼、合成與識別等。
(4)線性預測分析
線性預測分析的基本思想是:由于語音樣點之間存在相關性,所以可以用過去的樣點值來預測現(xiàn)在或未來的樣點值,即一個語音的抽樣能夠用過去若干個語音抽樣或它們的線性組合來逼近。通過使實際語音抽樣和線性預測抽樣之間的誤差在某個準則下達到最小值來決定唯一的一組預測系數(shù)?,F(xiàn)代語音編碼的聲道模型參數(shù)估計大多都基于線性預測分析方法。
二、語音預處理模塊分析
實用語音預處理系統(tǒng)主要包括噪聲消除系統(tǒng)、電平控制系統(tǒng)和回聲控制系統(tǒng)等。噪聲消除系統(tǒng)的作用是檢測并降低語音信號中的背景噪聲,提高語音的純凈度;電平控制系統(tǒng)則能穩(wěn)定信號傳輸電平,使雙端或多端語音的音強與音質(zhì)維持在一定的水平上;回聲控制系統(tǒng)則針對擴聲系統(tǒng)中回聲所引起的正反饋放大現(xiàn)象,采用自適應濾波等方法進行回聲對消,也起到提高語音純凈度的作用。
下面介紹語音預處理的幾個重要模塊。
2.1自動電平控制
對于經(jīng)過通信傳輸或者放大系統(tǒng)的語音信號幅度經(jīng)常發(fā)生很大波動這種現(xiàn)象,ALC系統(tǒng)通過實現(xiàn)一種優(yōu)化語音信號電平的方法,提高語音質(zhì)量。自動電平控制(Automatic Level Control,ALC)與自動增益控制都是為了把信號電平調(diào)整至最優(yōu)值,但前者主要用于語音信號處理上;傳統(tǒng)AGC則是連續(xù)地調(diào)整系統(tǒng)增益以控制傳輸信號幅度。
ALC系統(tǒng)是建立在語音激活檢測(VAD)基礎上的實時調(diào)整語音信號電平的技術。首先,根據(jù)語音信號的短時平穩(wěn)性,將語音信號分段處理。利用語音幀之間的相關性,計算出當前幀與相鄰幀的長時功率值,再與預設值作比較得到增益值,用這個值調(diào)整當前幀的電平。由于人的語音信號是不連續(xù)的,存在非語音幀的情況。如果不考慮語音幀和靜音幀的分類,直接計算增益值,就會將噪音信號幀作為參考計算進去。但背景噪音與語音信號間沒有必然的相關性,這樣直接計算反而會引起語音信號的不穩(wěn)定。
所以在自動增益控制之前加一個VAD檢測部分,先將語音信號分成兩類,語音幀和靜音幀。再以歸類為語音幀的信號作為參考計算長時功率值與一個標準值進行比較調(diào)整。如果遇到靜音幀則可忽略,利用其前一個語音幀作為下一個語音幀的調(diào)整參數(shù)。調(diào)整趨勢圖如圖1,結構圖如圖2。
參考文獻
[1] 王炳錫.變速率語音編碼.西安:西安電子科技大學出版社,2004.
[2] 陳克安,曾向陽,李海英編著.聲學測量.科學出版社,2005.
[3] 劉海濱.非平穩(wěn)環(huán)境下基于人耳聽覺掩蔽特性的語音增強,信號處理,vol.19,No.4,2003.
[4] 蔡凌云等.自動增益控制技術應用.電子工程師,2002,28(4):22-23,37
[5] 劉秀琴.非平穩(wěn)環(huán)境下的譜減法語音增強算法.吉林大學碩士學位論文.2005年