趙霞
摘要:隨著計(jì)算機(jī)技術(shù)的逐步發(fā)展,人與計(jì)算機(jī)之間的溝通方式有了更高的標(biāo)準(zhǔn),這也進(jìn)一步推動了語音識別這項(xiàng)技術(shù)的進(jìn)步和發(fā)展,使之成為語音處理范疇當(dāng)中的重要內(nèi)容。語音識別目前在無噪音干擾的情況下,具有非常高的識別率,但是如果環(huán)境當(dāng)中存在噪音,那么這種識別率就會大大降低,因?yàn)樵胍魰?dǎo)致訓(xùn)練模板和待識別模板無法進(jìn)行匹配。所以,對于語音識別技術(shù)來說,噪音是其發(fā)展過程中的重要阻礙,所以對于噪音環(huán)境下的語音識別算法進(jìn)行研究是非常有意義的。
關(guān)鍵詞:噪音環(huán)境;語音識別;功能分析
中圖分類號:TP393? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)28-0224-02
在人們的工作和生活中,需要利用語言來進(jìn)行溝通和交流,通過語言來傳播多種信息。相比于文字來說,語言的傳播效率更高。隨著信息技術(shù)的不斷發(fā)展,計(jì)算機(jī)已經(jīng)成了人們生活和工作當(dāng)中的不可或缺的部分。因此,人們除了相互之間的交流之外,也需要和計(jì)算機(jī)進(jìn)行頻繁的交流和溝通。在這樣的背景之下,使得人們能夠通過語言和計(jì)算機(jī)來進(jìn)行溝通和交流,成了計(jì)算機(jī)發(fā)展過程中非常重要的內(nèi)容,所以對于語音識別技術(shù)的研究和發(fā)展具有重要的意義。
1 語音識別功能分析
語音識別技術(shù)涉及的學(xué)科領(lǐng)域非常廣泛,包括信號處理、語言學(xué)以及模式識別等等。這項(xiàng)技術(shù)目前被應(yīng)用到了信息處理和計(jì)算機(jī)等領(lǐng)域當(dāng)中,其具備的功能主要包括以下幾個方面。首先是文本輸入功能,所謂文本輸入就是將人類語言轉(zhuǎn)化為文本,從而使得文本的輸入過程變得更加便捷。其次是語音控制功能,所謂語音控制就是通過語音來完成計(jì)算機(jī)的工作過程,從而有效提升人類的工作效率。最后是身份識別,這有點(diǎn)類似于指紋和人臉識別,是將語音來作為識別的對象。
2 噪聲分類
2.1乘性噪聲
具體來看,語音和噪聲之間的關(guān)系實(shí)際上是相乘的,信號經(jīng)過頻譜后會出現(xiàn)衰弱現(xiàn)象,采集聲音裝置當(dāng)中的和信號傳輸過程中的衰弱情況都屬于乘性噪聲。乘性噪聲可以在某種情況下轉(zhuǎn)化為加性噪聲,而加性噪聲則是平時的主要研究目標(biāo)。
2.2加性噪聲
在語音信號當(dāng)中,噪音實(shí)際上是處于疊加狀態(tài)中的,所以從語音信號的角度來看,這種噪聲應(yīng)該被稱為加性噪聲。加性噪聲具體包括汽車聲音、人們的說話聲音、家具的聲音以及風(fēng)扇的聲音等等。利用聲音采集裝置時,加性噪聲和收集的語音兩者之間屬于相加的關(guān)系。這種噪聲對于語音識別率的影響是最大的。
2.3平穩(wěn)噪聲
生活中的大部分噪聲都屬于非平穩(wěn)噪聲,但這種噪聲研究起來較為困難,所以通常情況下是研究平穩(wěn)噪聲,因?yàn)檫@種造成屬于非時變噪聲。
2.4沖擊噪聲
所謂沖擊噪聲,是指在較短的時間當(dāng)中出現(xiàn)劇烈變化的噪聲,例如槍聲,這種噪聲隨機(jī)程度較大,所以很難進(jìn)行分析和研究。
2.5緩變噪聲
緩變噪聲是指在相應(yīng)的時間當(dāng)中緩慢進(jìn)行變化的噪聲,例如人群形成的噪聲。
3 噪聲對語音識別的影響
語音識別率下降,是因?yàn)橛?xùn)練模板和識別模板之間的匹配過程受到了噪聲的影響,在平時的訓(xùn)練過程中,是處于安靜的環(huán)境當(dāng)中,且應(yīng)用的都是純凈語音。而在具體的應(yīng)用過程中,是一定的會存在噪音的。當(dāng)處于噪聲環(huán)境下時,語音信號的參數(shù)會出現(xiàn)變化。而對于語音進(jìn)行識別的過程中,會發(fā)現(xiàn)其參數(shù)與數(shù)據(jù)庫中的內(nèi)容無法形成匹配,從而導(dǎo)致識別率下降。為了解決這個問題,就必須去消除噪聲對于語音參數(shù)的影響。
4 噪聲環(huán)境下的語音識別算法研究
經(jīng)過了近些年來的研發(fā)過程,使得語音識別技術(shù)得到了迅速的發(fā)展,但是在具體的應(yīng)用過程中仍然存在一些問題,例如在噪聲影響的情況下,語音識別率降低,因此對于噪聲環(huán)境下的語音識別進(jìn)行研究是非常重要的?,F(xiàn)實(shí)環(huán)境中的大部分噪聲都屬于加性噪聲,因此下面將會把加性噪聲作為主要的研究內(nèi)容。通常來看,噪聲都是處于非平穩(wěn)狀態(tài)下的,通過增強(qiáng)語音信號來消除掉信號中的噪聲從而獲得了增強(qiáng)語音的效果。而在這個過程中,實(shí)際上增強(qiáng)語音的主要目的就是提升語音信號信噪比,從而提升聲音的清晰程度。增強(qiáng)語音和加強(qiáng)噪聲環(huán)境中的語音識別率是相同的。通常情況下,在系統(tǒng)前端來完成語音增強(qiáng),消除冗余噪聲,從而避免因?yàn)樵肼暤某霈F(xiàn)而使得訓(xùn)練和識別模板無法匹配。從目前的情況來看,語音增強(qiáng)算法的應(yīng)用已經(jīng)變得非常廣泛,且應(yīng)用的方式都十分系統(tǒng)。噪聲的出處十分廣泛,處于不同場合的情況下所面臨的噪聲也各有不同,根據(jù)噪聲的不同,需要采取相對應(yīng)的語音增強(qiáng)方式。具體來看,語音增強(qiáng)算法具體包括了噪音對消算法、諧波增強(qiáng)算法、語音短時譜估計(jì)增強(qiáng)算法、小波分析語音增強(qiáng)算法等等。
4.1噪音對消算法
噪音對消算法屬于眾多算法當(dāng)中最為基本的算法之一,其原理是將噪聲語音中的噪聲直接去除掉,通常是采用雙麥克風(fēng)的方式來對信號進(jìn)行采集,兩個麥克風(fēng)一個用來采集噪聲語音,另一個用來采集噪聲,并將這兩個麥克風(fēng)采集到的頻譜分量相減,最后得到語音信號增強(qiáng)的效果。在這個過程中需要注意的是,保持好雙麥克風(fēng)的距離,避免相互之間形成干擾。當(dāng)噪聲背景較強(qiáng)時,較為適宜采用這種方式來消除噪聲。另外一方面,在采集信號時,可以安裝自適應(yīng)濾波裝置來提升采集效果。
4.2小波分析語音增強(qiáng)算法
通過小波分析語音增強(qiáng)算法,能夠?qū)τ谛〔ㄟM(jìn)行分解,從而完成信號的多分辨率分析。這種算法具有多種不同的特性,所以目前應(yīng)用的較為廣泛。小波分解后獲得的各層系數(shù)表現(xiàn)出了不同分辨率當(dāng)中信號的信息。由于語音和招生在各層系數(shù)當(dāng)中有著不同的特性,所以可以利用這種特點(diǎn)來實(shí)現(xiàn)噪聲去除。目前來看,最為常用的噪聲去除方法包括相關(guān)性噪聲消除法、模極大值噪聲消除法等等。首先是模極大值噪聲消除法,這種方法的原理是在各層小波系數(shù)中,語音信號和噪聲的模極大值所呈現(xiàn)出的規(guī)律各不相同,根據(jù)這一特點(diǎn)而提出的這種噪聲消除方法。當(dāng)脈沖噪聲點(diǎn)非常多或者信噪比較低的時候,這種消除方法是非常適用的。模極大值噪聲消除方法主要應(yīng)用于對高斯白噪聲的消除,通過這種方式去除噪聲會避免信號的震蕩,從而保持語音質(zhì)量的完好。但這種噪聲消除方法的缺點(diǎn)在于計(jì)算速度非常緩慢。其次是相關(guān)性噪聲消除方法,這種噪聲消除法主要是利用小波系數(shù)之間的相關(guān)特性。對于噪聲進(jìn)行分解之后,所獲得的小波系數(shù)之間不含有相關(guān)性,而這種造成消除方法正式基于這一特點(diǎn)而被研發(fā)的。噪聲所產(chǎn)生的能量基本上在小尺度上進(jìn)行分布,所以尺度逐漸變化后噪聲的強(qiáng)度會降低,從而對噪聲進(jìn)行有效的濾除,進(jìn)而將信號中的有用部分進(jìn)行保留。
5 結(jié)束語
隨著語音識別技術(shù)的高速進(jìn)步和發(fā)展,當(dāng)處于實(shí)踐環(huán)境當(dāng)中時,這種技術(shù)的識別功能非常好,但是想要讓這種技術(shù)的實(shí)用性更強(qiáng),就必須解決噪聲的影響問題,因?yàn)樵趯?shí)際的應(yīng)用過程中是不可能徹底避免噪聲干擾的,因此,對于語音識別系統(tǒng)進(jìn)行應(yīng)用的關(guān)鍵在于該系統(tǒng)在噪聲環(huán)境下所具備的性能。當(dāng)處于噪聲環(huán)境中時,本文提出的幾種語音識別算法都能夠有效的消除噪聲,但是在其中仍然存在著一些不足,需要今后去不斷的探索和完善。
參考文獻(xiàn):
[1] 曹晶晶,許潔萍,邵聖淇.多噪聲環(huán)境下的層級語音識別模型[J].計(jì)算機(jī)應(yīng)用,2018,38(6):1790-1794.
[2] 劉晶.基于盲源分離和噪聲抑制的語音信號識別[J].計(jì)算機(jī)測量與控制,2018,26(12):140-144.
[3] 婁英丹,徐靜林,黃麗霞, 等.MLLR和MAP在遠(yuǎn)場噪聲混響下的語音識別研究[J].計(jì)算機(jī)工程與應(yīng)用,2019.
【通聯(lián)編輯:光文玲】