基于多波段譜減法的非空氣傳導(dǎo)語(yǔ)音增強(qiáng)

2018-05-09 02:52:14張緩緩王賢波

無(wú)線互聯(lián)科技 2018年9期

張緩緩，李盛，王賢波

（西京學(xué)院，陜西西安 710123）

眾所周知，人類的言語(yǔ)器官[1-2]產(chǎn)生的語(yǔ)音可以通過(guò)空氣傳播和感知，并可以通過(guò)聲音傳感器進(jìn)行檢測(cè)和記錄。然而，空氣并不是唯一可以傳播并用來(lái)探測(cè)語(yǔ)音的媒介。例如，語(yǔ)音內(nèi)容可以通過(guò)骨骼振動(dòng)傳輸。因此，這種振動(dòng)可以用特殊位置的骨傳導(dǎo)傳感器拾取[3]。

1 方法

1.1 系統(tǒng)描述

采用相位振蕩器來(lái)產(chǎn)生非常穩(wěn)定的電磁波。放大器的輸出通過(guò)定向耦合器、可變衰減器、環(huán)行器，然后到平板天線饋電。平板天線發(fā)射一個(gè)微波光束，對(duì)準(zhǔn)正對(duì)著或直接坐在天線前面的人?；芈曅盘?hào)是由同一天線接收的，該天線由語(yǔ)音調(diào)制，由相對(duì)人類受試者的喉部產(chǎn)生。在雙平衡混頻器中，該信號(hào)與參考信號(hào)混合。因此，這種混合產(chǎn)生低頻信號(hào)，并由信號(hào)處理器進(jìn)行放大，然后通過(guò)A/D轉(zhuǎn)換器到達(dá)計(jì)算機(jī)以獲得進(jìn)一步的處理器。

1.2 多波段譜相減法

多頻帶是假設(shè)附加噪聲是平穩(wěn)的，與干凈的語(yǔ)音信號(hào)不相關(guān)。如果y(n)，含噪語(yǔ)音是由干凈的語(yǔ)音信號(hào)s(n)和不相關(guān)的加性噪聲信號(hào)d(n)組成的，那么：

腐蝕語(yǔ)音的功率譜可以近似地估計(jì)為：

大多數(shù)減法類型算法具有不同的變化，允許在譜減法的變化中具有靈活性。Berouti等提出了廣義譜減法方案如下：

其中α(α＞1)是過(guò)減法因子，它是節(jié)段信噪比的函數(shù)。β(0≤β≤1)是譜層，γ是決定躍遷銳度的指數(shù)。這里我們?cè)O(shè)置γ=2，β=0.002。

這個(gè)實(shí)現(xiàn)假定噪聲影響語(yǔ)音頻譜的均勻，過(guò)減因子α。然而，毫米波雷達(dá)產(chǎn)生的非導(dǎo)通語(yǔ)音中的噪聲可能是有色的，并不影響整個(gè)頻譜上的語(yǔ)音信號(hào)。估計(jì)的分段信噪比的五頻段（60～300 Hz，300～1 000 Hz，1～2 kHz，2～3 kHz，3～5 kHz）雷達(dá)語(yǔ)音雷達(dá)噪聲如圖1所示。從圖1可以看出，低頻帶的信噪比（頻帶1，2）明顯高于高頻帶的信噪比（頻帶3-5）。信噪比最大的差值大于30分貝，相差很大。這種現(xiàn)象表明，噪聲信號(hào)不影響整個(gè)頻譜上的語(yǔ)音信號(hào)，因此，在整個(gè)頻譜中減去噪聲譜的常數(shù)因子也可以消除語(yǔ)音。

圖1 對(duì)于電磁波雷達(dá)語(yǔ)音五頻段的分段信噪比

為了考慮有色噪聲在不同頻率下對(duì)語(yǔ)音頻譜的影響不同，估計(jì)一個(gè)合適的因子將從每個(gè)頻率子帶減去必要量的噪聲譜就變得非常重要。在這項(xiàng)研究中，語(yǔ)音頻譜被劃分為N（N＝5）非重疊頻帶，并且譜減法在每個(gè)頻帶中獨(dú)立執(zhí)行。因此，在第i波段得到了干凈的語(yǔ)音頻譜的估計(jì)：

αi是在第i個(gè)頻段減因子，和δi是一個(gè)調(diào)整因子，可以單獨(dú)設(shè)置每個(gè)頻段定制噪聲去除性能。bi和ei是第i頻帶的開始和結(jié)束頻率。因此，整個(gè)算法如圖2所示。

圖2 提出的語(yǔ)音增強(qiáng)方案

帶特異性過(guò)減因子αi是計(jì)算第i頻帶的分段噪聲信噪比的函數(shù)：

根據(jù)信噪比計(jì)算公式(5)，α減因子計(jì)算為：

使用這種超減因子αi可以對(duì)每個(gè)頻帶中的噪聲相減級(jí)別進(jìn)行一定程度的控制。另一個(gè)因素δi，這表現(xiàn)在式（4）可以在每個(gè)頻帶提供一個(gè)額外的控制程度，因?yàn)榇蟛糠值恼Z(yǔ)音能量是在較低的頻率，較小的δi值用于低頻帶，為了最大限度地減少語(yǔ)音失真。δi的值由經(jīng)驗(yàn)確定并設(shè)置為：

這兩個(gè)因素，αi和βi可以調(diào)整每個(gè)波段的不同語(yǔ)音條件，獲得更好的語(yǔ)音質(zhì)量。

2 實(shí)驗(yàn)

10名健康志愿者參加了雷達(dá)語(yǔ)音實(shí)驗(yàn)，其中男性6人，女性4人。所有受試者都是以普通話為母語(yǔ)的人，年齡20—35歲不等，平均年齡為28.1歲（SD＝12.05）。所有的實(shí)驗(yàn)都是在同意書上簽署了由志愿者根據(jù)赫爾辛基宣言的條款（BMJ 1991；302：1194）。

雷達(dá)天線，從2～8 m的人的主體范圍之間的距離，和一句漢語(yǔ)“第四軍醫(yī)大學(xué)”（其他的句子也被使用，但他們并不代表）通過(guò)志愿者的揚(yáng)聲器發(fā)出的用于評(píng)價(jià)所提出的多頻帶譜減法的方法。

3 結(jié)果

為了分析原產(chǎn)地雷達(dá)語(yǔ)音信號(hào)的時(shí)頻分布和增強(qiáng)的語(yǔ)音，語(yǔ)音的頻譜圖進(jìn)行了準(zhǔn)確信息的殘留噪聲和語(yǔ)音失真。為便于比較，傳統(tǒng)的功率譜減法的效果通過(guò)Berrouti等實(shí)現(xiàn)。

非正式的聽力測(cè)試還表明，多波段的方法產(chǎn)生了非常好的語(yǔ)音質(zhì)量，很少有音樂(lè)噪音的痕跡，而且，有最小的語(yǔ)音失真。

此外，多帶譜相減的方法具有很強(qiáng)的靈活性，以適應(yīng)復(fù)雜的語(yǔ)音環(huán)境中通過(guò)調(diào)整兩個(gè)參數(shù)αi和δi容易。另外，當(dāng)帶總個(gè)數(shù)為1時(shí)，多波段譜相減算法降低了傳統(tǒng)的功率譜相減方法。

4 結(jié)語(yǔ)

作為非導(dǎo)通語(yǔ)音，雷達(dá)語(yǔ)音電磁波具有更大的優(yōu)勢(shì)，可能更廣泛地應(yīng)用于導(dǎo)通語(yǔ)音。然而，在雷達(dá)語(yǔ)音中加入的復(fù)雜噪聲在很大程度上降低了語(yǔ)音質(zhì)量。因此，本文采用了一種改進(jìn)的譜相減方法、多波段譜相減算法，以考慮有色噪聲對(duì)雷達(dá)語(yǔ)音頻譜的非均勻影響。仿真和評(píng)價(jià)結(jié)果表明，該方法能較好地降低整個(gè)頻率噪聲、音樂(lè)噪聲，并產(chǎn)生良好的語(yǔ)音效果。

[參考文獻(xiàn)]

[1]朱小紅，藺素珍，張商珉，等.多波段紅外圖像的差異紋理特征選擇[J].光電工程，2016（4）：66-72.

[2]李英杰，張俊舉，常本康，等.一種多波段紅外圖像聯(lián)合配準(zhǔn)和融合方法[J].電子與信息學(xué)報(bào)，2016（1）：8-14.

[3]朱小紅，藺素珍，王棟娟.多波段紅外點(diǎn)目標(biāo)的夜視成像差異分析[J].紅外技術(shù)，2015（4）：289-295.