張犇 李日興 高培喆 李爭(zhēng)琦
摘要:在司法語音檢驗(yàn)過程中,由于檢材與樣本在錄制時(shí),各自所選取的信道不同,促使語音在聽覺上產(chǎn)生差異,由于信道因素可能會(huì)導(dǎo)致素材的客觀真實(shí)性受損,以至于影響我們的語音司法檢驗(yàn)。本文重點(diǎn)針對(duì)手機(jī)內(nèi)部錄音,結(jié)合語音鑒定技術(shù)對(duì)其進(jìn)行具體參數(shù)分析和圖譜比對(duì),最終得出有針對(duì)性、實(shí)用性強(qiáng)的明確結(jié)論,對(duì)語音鑒定工作有較強(qiáng)的指導(dǎo)意義。
關(guān)鍵詞:語音;信道;手機(jī)錄音;圖譜
1.引言
隨著科學(xué)技術(shù)的發(fā)展和法制建設(shè)的完善,以諸多現(xiàn)代科學(xué)技術(shù)為基礎(chǔ)的視聽資料被刑事訴訟法規(guī)定為訴訟證據(jù),司法語音檢驗(yàn)是視聽資料作為證據(jù)進(jìn)行檢驗(yàn)的一個(gè)重要組成部分。語音檢驗(yàn)技術(shù)方法日趨成熟的同時(shí),檢驗(yàn)鑒定人員開始更多地關(guān)注語料的獲取方式,由于硬件條件和采集環(huán)境所限制,在案件語音檢驗(yàn)鑒定過程中,很難保證檢材和樣本獲取方式和途徑是一致的。其中,由于檢材與樣本在錄制時(shí),信道的差異促使語音在聽覺上發(fā)生畸變。因此,我們?cè)诒葘?duì)過程中就必須考慮這種差異帶來的影響。
本文將通過理論分析、實(shí)驗(yàn)比對(duì)和數(shù)據(jù)統(tǒng)計(jì)分析等方式,對(duì)上述影響進(jìn)行具體研究并得出相關(guān)結(jié)論,以期對(duì)司法語音檢驗(yàn)工作提供有力補(bǔ)充。
2.語音信道及其影響
語音信道是指語音信號(hào)傳輸?shù)耐緩?,它以傳輸語音的媒體和中繼通信設(shè)施為基礎(chǔ),可分為有線信道和無線信道兩類。由于各種實(shí)際因素,信道所提供的頻帶總是有限的,信道特性也總是存在著不完善性。因此語音信號(hào)通過信道時(shí),往往會(huì)或多或少地發(fā)生幅度和相位失真,從而產(chǎn)生波形失真,這就為語音傳輸信道差異分析奠定了基礎(chǔ)。在話音信號(hào)通過傳輸通路后,一般會(huì)受到如下幾種影響:
2.1總衰減
總衰減是指話路的輸入信號(hào)電平和輸出信號(hào)電平之差,它表示信號(hào)在整個(gè)話路傳輸后的減弱程度,也即總的傳輸損耗??偹p越大,話路輸出的信號(hào)功率就越小,信噪比降低,通話的清晰度就越差。
2.2衰減頻率失真
衰減頻率失真是指信號(hào)通過信道時(shí),不僅幅度被衰減,而且波形也可能發(fā)生畸變。由于話音信號(hào)占有一定的頻帶,因此經(jīng)過話路傳輸后,如果在傳輸頻帶內(nèi)各頻率成分的衰減不等,將會(huì)使接收到的信號(hào)波形失真。這種失真主要來源于傳輸系統(tǒng)的濾波器。
2.3噪聲
可分為熱噪聲、互調(diào)噪聲、串音和脈沖噪聲等。他們對(duì)傳真信號(hào)的影響是降低了信噪比S/N,最終使接收到的信號(hào)出現(xiàn)差錯(cuò)或使傳輸速率下降,其中以串音和脈沖噪聲猶為常見。串音是指相鄰信道傳輸信號(hào)的相互干擾。脈沖噪聲一般是指持續(xù)時(shí)間小于1ms的電平突然變化,它具有突發(fā)性和較大的強(qiáng)度,雖然對(duì)話音信號(hào)影響不大,但對(duì)于頻譜的低頻區(qū)域也會(huì)產(chǎn)生一定的干擾。
2.4頻率偏差和諧波失真
頻率偏差是由于多路載波系統(tǒng)中調(diào)制與解調(diào)過程所用的載波供給系統(tǒng)的頻率不一致造成的。諧波失真是由于話路中存在非線性部件所引起的,系統(tǒng)中某不見因過載而進(jìn)入非線性工作區(qū)域時(shí),將會(huì)使信號(hào)產(chǎn)生諧波和各頻率成分的交互調(diào)制,造成附加的噪聲而導(dǎo)致信噪比的降低。
3.手機(jī)內(nèi)部錄音
電話數(shù)字錄音的核心部件為數(shù)字錄音芯片,根據(jù)質(zhì)量優(yōu)劣,其錄音效果也分不同等級(jí),普通的手機(jī)錄音芯片一般支持采樣率8000Hz,16位量化。通話錄音的基本原理是——語音信號(hào)經(jīng)過濾波和放大后送入A/D轉(zhuǎn)換器,采樣量化后形成數(shù)字信號(hào),再經(jīng)過錄音軟件壓縮編碼而形成特定的語音文件格式。
語音從口中發(fā)出后,經(jīng)過電話信道傳輸,受到電話受話器、編碼器、中轉(zhuǎn)系統(tǒng)、解碼器、和電話揚(yáng)聲器等信道模塊的干擾,在信號(hào)頻率成分、功率分布等方面勢(shì)必會(huì)受到影響,影響程度可以通過后期的圖譜比對(duì)和數(shù)據(jù)分析來加以研究。手機(jī)受話器的頻率響應(yīng)性能如圖1所示。
4.實(shí)驗(yàn)及其分析
4.1實(shí)驗(yàn)條件及方法
語料包括國際音標(biāo)中的5個(gè)元音、10個(gè)數(shù)字、10個(gè)詞語和5個(gè)短句。
話者根據(jù)語料標(biāo)準(zhǔn)發(fā)音,使用手機(jī)——手機(jī)通話并在接收端開啟內(nèi)部錄音功能,同時(shí)使用高質(zhì)量麥克直接拾取語音輸入計(jì)算機(jī),之后通過專用數(shù)據(jù)線和提取軟件把手機(jī)內(nèi)部錄音輸入計(jì)算機(jī),分別形成語音文件。
4.2實(shí)驗(yàn)結(jié)果分析
4.2.1聽覺分析
通過手機(jī)信道錄入的語音(下稱X2)與麥克直錄語音(下稱X1)相比較存在明顯的區(qū)別。在音色上,麥克直錄語音聽起來非常接近話者真實(shí)發(fā)音,內(nèi)容清晰、干凈,聽不出話語失真。而手機(jī)信道錄音存在著信號(hào)失真,音色感覺頻率成分有較大缺失;個(gè)別音節(jié)發(fā)音不清,有嗡聲存在,在內(nèi)容識(shí)別上產(chǎn)生渾濁感;在整體聽覺上聲音較悶,聲音強(qiáng)度有一定增強(qiáng)。
4.2.2共振峰圖譜分析
檢材X2相對(duì)于樣本X1,各共振峰位置和形狀未發(fā)現(xiàn)明顯變化,但中高頻共振峰(F2、F3)相對(duì)于低頻共振峰(F1)出現(xiàn)明顯的能量增強(qiáng)現(xiàn)象,高頻共振峰(F4)能量有所衰減或者消失;輔音圖譜中頻區(qū)能量增強(qiáng),低頻區(qū)(具體為1500Hz以下)能量有所減弱。如圖2,圖3所示。
4.2.3振幅曲線分析
通過觀察比對(duì)分析兩組音節(jié)的強(qiáng)度曲線,韻母部分走勢(shì)和強(qiáng)度基本不變(考慮兩種錄音方式的輸入輸出電平差異);聲母如果是送氣塞擦音,則強(qiáng)度有明顯提升,如果是爆破音,則強(qiáng)度也有一定提升,但效果不明顯。頻譜和共振峰分析結(jié)論中,X2效果語音中高頻區(qū)域能量得到加強(qiáng),而絕大部分輔音的主要能量集中區(qū)就處于音節(jié)的中高頻區(qū)域,因此,含有輔音聲母音節(jié)的強(qiáng)度曲線變化會(huì)出現(xiàn)上述變化。
4.2.4基頻曲線分析
通過觀察分析兩組基頻曲線圖發(fā)現(xiàn),部分音節(jié)基頻曲線出現(xiàn)畸變現(xiàn)象,具體為曲線斷裂、起始部位提升、尾部快速提升、部分曲線消失等現(xiàn)象。通過統(tǒng)計(jì)觀察,兩個(gè)以上元音組合發(fā)音時(shí),發(fā)生上述畸變的現(xiàn)象較普遍;發(fā)送氣擦音[s]和[sh]時(shí),經(jīng)常會(huì)出現(xiàn)基頻曲線起始端畸變。
4.2.5共振峰數(shù)據(jù)分析
選取15個(gè)音節(jié)兩種信道下的共振峰一峰、二峰、三峰和基頻數(shù)據(jù),應(yīng)用數(shù)理統(tǒng)計(jì)的方法進(jìn)行分析。表1給出兩組所選音節(jié)的F1、F2、F3的成對(duì)t檢驗(yàn)和相關(guān)回歸分析結(jié)果,表中t值和p值分別表明兩種信道的各音節(jié)前三共振峰差異較顯著;在對(duì)應(yīng)共振峰之間做相關(guān)回歸分析,得出相關(guān)系數(shù)處于0.82∽0.98之間。
由此。推出回歸方程并得到R2分別為0.95、0.98、0.96,說明利用回歸方程推算出的頻率值有較高的利用價(jià)值。
4.2.6基頻數(shù)據(jù)分析
對(duì)基頻曲線發(fā)生畸變的音節(jié),測(cè)量其基頻平均值已經(jīng)沒有統(tǒng)計(jì)價(jià)值,因此在四種調(diào)形音節(jié)中,選擇沒有發(fā)生畸變的音節(jié)測(cè)量,然后做成對(duì)雙樣本均值t檢驗(yàn)和相關(guān)回歸分析,以研究其變化情況,結(jié)果見表2。
數(shù)據(jù)表明:兩種信道的四類調(diào)形基頻沒有顯著差異,但陰、陽調(diào)形的基頻均差明顯小于另外兩種,說明后者要比前者受信道變化的影響大,這與前面圖譜分析的結(jié)論相符。
4.2.7語音自動(dòng)識(shí)別分析
把麥克直錄語音文件作為樣本輸入自動(dòng)識(shí)別系統(tǒng),庫容量為10000人,然后把手機(jī)內(nèi)錄語音文件作檢材進(jìn)行訓(xùn)練比對(duì),輸出的識(shí)別分?jǐn)?shù)為0.057,識(shí)別結(jié)果為接受。該系統(tǒng)為中國刑警學(xué)院與清華大學(xué)合作開發(fā)的司法語音識(shí)別系統(tǒng),目前,已經(jīng)通過鑒定并進(jìn)行行業(yè)推廣。
5.結(jié)論
語音經(jīng)受信道干擾后,在聽覺上產(chǎn)生失真,有頻率成分缺失現(xiàn)象。圖譜比對(duì)發(fā)現(xiàn)各共振峰位置和走勢(shì)未發(fā)生明顯變化,但中高頻區(qū)峰的能量明顯增強(qiáng),而低頻峰的能量明顯減弱。
數(shù)據(jù)分析的結(jié)果表明:各音節(jié)共振峰受信道影響在數(shù)值上發(fā)生較明顯變化,分析這種變化是由于語音受信道影響后,除頻率分布變化外,常規(guī)測(cè)量各共振峰均值的方法會(huì)帶來較大誤差所造成的。
通過觀察比對(duì)兩組音節(jié)的強(qiáng)度曲線,輔音所產(chǎn)生亂紋沖直條的能量也有所增強(qiáng),尤其是送氣塞擦音;韻母部分走勢(shì)和強(qiáng)度基本不變(考慮兩種錄音方式的輸入輸出電平差異);后期通過頻譜曲線走勢(shì)變化情況可以印證上述結(jié)論。
對(duì)四種基音調(diào)形音節(jié)的基頻數(shù)值進(jìn)行檢驗(yàn)未發(fā)現(xiàn)顯著變化,但可以得出上、去調(diào)形比陰、陽調(diào)形更易受信道影響。提取基頻曲線時(shí)發(fā)現(xiàn),部分音節(jié)的基頻曲線發(fā)生畸變,分析推測(cè)此類現(xiàn)象是由于設(shè)備因素造成的特殊現(xiàn)象。
自動(dòng)識(shí)別結(jié)果發(fā)現(xiàn)信道差異被系統(tǒng)接受,但被識(shí)別的相似度得分普遍較低。
參考文獻(xiàn):
[1] 岳俊發(fā)、王英利(1996)《聲紋鑒定》。北京:警官教育出版社。
[2] 侯風(fēng)雷、張萬軍、王炳錫(2002)電話信道對(duì)語音信號(hào)參數(shù)影響的研究[J]。信息工程大學(xué)學(xué)報(bào)。
[3] 周靜芳、陳一寧、劉加、劉潤生(2004)說話人識(shí)別信道補(bǔ)償技術(shù)HNSSM[J]。清華大學(xué)學(xué)報(bào)。
[4] 王煒、王炳錫、王波(2004)信道補(bǔ)償技術(shù)的發(fā)展及其在說話人識(shí)別上的應(yīng)用[J]。語音技術(shù)。
[5] 張輝、曹麗娜《現(xiàn)代通信原理與技術(shù)》。西安:西安電子科技大學(xué)出版社。