張緩緩,李 盛,王賢波
(西京學(xué)院,陜西 西安 710123)
眾所周知,人類的言語(yǔ)器官[1-2]產(chǎn)生的語(yǔ)音可以通過(guò)空氣傳播和感知,并可以通過(guò)聲音傳感器進(jìn)行檢測(cè)和記錄。然而,空氣并不是唯一可以傳播并用來(lái)探測(cè)語(yǔ)音的媒介。例如,語(yǔ)音內(nèi)容可以通過(guò)骨骼振動(dòng)傳輸。因此,這種振動(dòng)可以用特殊位置的骨傳導(dǎo)傳感器拾取[3]。
采用相位振蕩器來(lái)產(chǎn)生非常穩(wěn)定的電磁波。放大器的輸出通過(guò)定向耦合器、可變衰減器、環(huán)行器,然后到平板天線饋電。平板天線發(fā)射一個(gè)微波光束,對(duì)準(zhǔn)正對(duì)著或直接坐在天線前面的人?;芈曅盘?hào)是由同一天線接收的,該天線由語(yǔ)音調(diào)制,由相對(duì)人類受試者的喉部產(chǎn)生。在雙平衡混頻器中,該信號(hào)與參考信號(hào)混合。因此,這種混合產(chǎn)生低頻信號(hào),并由信號(hào)處理器進(jìn)行放大,然后通過(guò)A/D轉(zhuǎn)換器到達(dá)計(jì)算機(jī)以獲得進(jìn)一步的處理器。
多頻帶是假設(shè)附加噪聲是平穩(wěn)的,與干凈的語(yǔ)音信號(hào)不相關(guān)。如果y(n),含噪語(yǔ)音是由干凈的語(yǔ)音信號(hào)s(n)和不相關(guān)的加性噪聲信號(hào)d(n)組成的,那么:
腐蝕語(yǔ)音的功率譜可以近似地估計(jì)為:
大多數(shù)減法類型算法具有不同的變化,允許在譜減法的變化中具有靈活性。Berouti等提出了廣義譜減法方案如下:
其中α(α>1)是過(guò)減法因子,它是節(jié)段信噪比的函數(shù)。β(0≤β≤1)是譜層,γ是決定躍遷銳度的指數(shù)。這里我們?cè)O(shè)置γ=2,β=0.002。
這個(gè)實(shí)現(xiàn)假定噪聲影響語(yǔ)音頻譜的均勻,過(guò)減因子α。然而,毫米波雷達(dá)產(chǎn)生的非導(dǎo)通語(yǔ)音中的噪聲可能是有色的,并不影響整個(gè)頻譜上的語(yǔ)音信號(hào)。估計(jì)的分段信噪比的五頻段(60~300 Hz,300~1 000 Hz,1~2 kHz,2~3 kHz,3~5 kHz)雷達(dá)語(yǔ)音雷達(dá)噪聲如圖1所示。從圖1可以看出,低頻帶的信噪比(頻帶1,2)明顯高于高頻帶的信噪比(頻帶3-5)。信噪比最大的差值大于30分貝,相差很大。這種現(xiàn)象表明,噪聲信號(hào)不影響整個(gè)頻譜上的語(yǔ)音信號(hào),因此,在整個(gè)頻譜中減去噪聲譜的常數(shù)因子也可以消除語(yǔ)音。
圖1 對(duì)于電磁波雷達(dá)語(yǔ)音五頻段的分段信噪比
為了考慮有色噪聲在不同頻率下對(duì)語(yǔ)音頻譜的影響不同,估計(jì)一個(gè)合適的因子將從每個(gè)頻率子帶減去必要量的噪聲譜就變得非常重要。在這項(xiàng)研究中,語(yǔ)音頻譜被劃分為N(N=5)非重疊頻帶,并且譜減法在每個(gè)頻帶中獨(dú)立執(zhí)行。因此,在第i波段得到了干凈的語(yǔ)音頻譜的估計(jì):
αi是在第i個(gè)頻段減因子,和δi是一個(gè)調(diào)整因子,可以單獨(dú)設(shè)置每個(gè)頻段定制噪聲去除性能。bi和ei是第i頻帶的開始和結(jié)束頻率。因此,整個(gè)算法如圖2所示。
圖2 提出的語(yǔ)音增強(qiáng)方案
帶特異性過(guò)減因子αi是計(jì)算第i頻帶的分段噪聲信噪比的函數(shù):
根據(jù)信噪比計(jì)算公式(5),α減因子計(jì)算為:
使用這種超減因子αi可以對(duì)每個(gè)頻帶中的噪聲相減級(jí)別進(jìn)行一定程度的控制。另一個(gè)因素δi,這表現(xiàn)在式(4)可以在每個(gè)頻帶提供一個(gè)額外的控制程度,因?yàn)榇蟛糠值恼Z(yǔ)音能量是在較低的頻率,較小的δi值用于低頻帶,為了最大限度地減少語(yǔ)音失真。δi的值由經(jīng)驗(yàn)確定并設(shè)置為:
這兩個(gè)因素,αi和βi可以調(diào)整每個(gè)波段的不同語(yǔ)音條件,獲得更好的語(yǔ)音質(zhì)量。
10名健康志愿者參加了雷達(dá)語(yǔ)音實(shí)驗(yàn),其中男性6人,女性4人。所有受試者都是以普通話為母語(yǔ)的人,年齡20—35歲不等,平均年齡為28.1歲(SD=12.05)。所有的實(shí)驗(yàn)都是在同意書上簽署了由志愿者根據(jù)赫爾辛基宣言的條款(BMJ 1991;302:1194)。
雷達(dá)天線,從2~8 m的人的主體范圍之間的距離,和一句漢語(yǔ)“第四軍醫(yī)大學(xué)”(其他的句子也被使用,但他們并不代表)通過(guò)志愿者的揚(yáng)聲器發(fā)出的用于評(píng)價(jià)所提出的多頻帶譜減法的方法。
為了分析原產(chǎn)地雷達(dá)語(yǔ)音信號(hào)的時(shí)頻分布和增強(qiáng)的語(yǔ)音,語(yǔ)音的頻譜圖進(jìn)行了準(zhǔn)確信息的殘留噪聲和語(yǔ)音失真。為便于比較,傳統(tǒng)的功率譜減法的效果通過(guò)Berrouti等實(shí)現(xiàn)。
非正式的聽力測(cè)試還表明,多波段的方法產(chǎn)生了非常好的語(yǔ)音質(zhì)量,很少有音樂(lè)噪音的痕跡,而且,有最小的語(yǔ)音失真。
此外,多帶譜相減的方法具有很強(qiáng)的靈活性,以適應(yīng)復(fù)雜的語(yǔ)音環(huán)境中通過(guò)調(diào)整兩個(gè)參數(shù)αi和δi容易。另外,當(dāng)帶總個(gè)數(shù)為1時(shí),多波段譜相減算法降低了傳統(tǒng)的功率譜相減方法。
作為非導(dǎo)通語(yǔ)音,雷達(dá)語(yǔ)音電磁波具有更大的優(yōu)勢(shì),可能更廣泛地應(yīng)用于導(dǎo)通語(yǔ)音。然而,在雷達(dá)語(yǔ)音中加入的復(fù)雜噪聲在很大程度上降低了語(yǔ)音質(zhì)量。因此,本文采用了一種改進(jìn)的譜相減方法、多波段譜相減算法,以考慮有色噪聲對(duì)雷達(dá)語(yǔ)音頻譜的非均勻影響。仿真和評(píng)價(jià)結(jié)果表明,該方法能較好地降低整個(gè)頻率噪聲、音樂(lè)噪聲,并產(chǎn)生良好的語(yǔ)音效果。
[參考文獻(xiàn)]
[1]朱小紅,藺素珍,張商珉,等.多波段紅外圖像的差異紋理特征選擇[J].光電工程,2016(4):66-72.
[2]李英杰,張俊舉,常本康,等.一種多波段紅外圖像聯(lián)合配準(zhǔn)和融合方法[J].電子與信息學(xué)報(bào),2016(1):8-14.
[3]朱小紅,藺素珍,王棟娟.多波段紅外點(diǎn)目標(biāo)的夜視成像差異分析[J].紅外技術(shù),2015(4):289-295.