劉世杰,王 虹
(中國(guó)刑事警察學(xué)院,遼寧 沈陽(yáng) 110000)
聲紋,原指通過(guò)聲譜儀顯示的作為訴訟證據(jù)的聲音圖譜,現(xiàn)指作為訴訟證據(jù)的聲音特征的集合。在國(guó)際上稱其“Voiceprint”,在我國(guó)刑事技術(shù)領(lǐng)域則比照指紋,形象的將其稱為聲紋。從另一方面來(lái)說(shuō),聲音是由人的發(fā)聲器官在大腦語(yǔ)言中樞的指揮下發(fā)出的,成年人的聲紋同指紋、足跡等其他生物特征一樣,具有人各不同的特定性和相對(duì)穩(wěn)定性,故亦可將其歸為人體痕跡的一種,稱之為“聲痕”。
聲紋檢驗(yàn),泛指有關(guān)聲音的所有檢驗(yàn)鑒定技術(shù)。具體包括語(yǔ)音真實(shí)性(完整性)檢驗(yàn)、言語(yǔ)內(nèi)容聽辨、語(yǔ)音信號(hào)增強(qiáng)、降噪處理、語(yǔ)音人身分析、說(shuō)話人鑒定等[1]。
未見其人,先聞其聲。這是我國(guó)文學(xué)四大名著《紅樓夢(mèng)》里的一句描述,可見,用聲音來(lái)判斷人的身份這種做法古已有之。正常人成年之后,其聲音便會(huì)長(zhǎng)期穩(wěn)定,基本不變,同其他生物特征一樣具有相對(duì)穩(wěn)定性和特定性,可以用以個(gè)體識(shí)別。語(yǔ)音鑒別技術(shù)的應(yīng)用歷史悠久,可以追溯到十五世紀(jì),但現(xiàn)代聲紋檢驗(yàn)技術(shù)的發(fā)展則開始于聲譜儀(能夠?qū)⒙曇艮D(zhuǎn)化為可視圖像的儀器)發(fā)明之后。
雖利用聲音來(lái)進(jìn)行個(gè)體識(shí)別古已有之,但那多停留在個(gè)人主觀聽覺(jué)上的辨認(rèn),在注重客觀證據(jù)的現(xiàn)代社會(huì),個(gè)人主觀感受在審判過(guò)程中很難作為證據(jù),這使得聲音這一生物特征很難在審判中發(fā)揮其應(yīng)有的作用。
二戰(zhàn)期間,為滿足戰(zhàn)爭(zhēng)的需要,美國(guó)貝爾實(shí)驗(yàn)室(Alcatel-Lucent Bell Labs)接受政府委托,在L.G Kersta的主持下率先展開了對(duì)聲紋的研究,并有了早期的動(dòng)態(tài)聲波分析儀,即我們現(xiàn)在所稱的聲譜儀(或稱語(yǔ)圖儀)。20世紀(jì)50年代后期,戰(zhàn)后美國(guó)經(jīng)濟(jì)迅猛發(fā)展,通信技術(shù)進(jìn)展迅速,電話這一現(xiàn)代通訊工具進(jìn)入了尋常百姓家,給生活帶來(lái)方便的同時(shí),利用電話進(jìn)行犯罪的案件也越來(lái)越多。此類案件不同于其他案件,缺少常規(guī)的犯罪現(xiàn)場(chǎng),留給警方的線索也只有電話錄音,這讓美國(guó)警方大感頭痛。而警方則轉(zhuǎn)向求助于貝爾實(shí)驗(yàn)室,希望能提供說(shuō)話人識(shí)別方面的支持,因此,戰(zhàn)后擱置的聲紋研究作為司法鑒定領(lǐng)域的一項(xiàng)專業(yè)技術(shù)重新登上了歷史舞臺(tái)。
1963年,日本警察研究所開始研究聲紋檢驗(yàn),并成功地利用聲紋相關(guān)知識(shí)協(xié)助了幼童吉展被拐騙案的偵破。1966年,Kersta利用聲譜儀成功地完成了一樁懸案的聲紋檢驗(yàn)。1976年,美國(guó)國(guó)家科學(xué)院聲譜委員會(huì)發(fā)表了《嗓音鑒別的理論與實(shí)踐》報(bào)告,表明了“嗓音鑒別”的精度極高,誤差僅為1%~2%,可作為一項(xiàng)科學(xué)的成熟技術(shù)。隨后世界各國(guó)相繼展開了聲紋檢驗(yàn)的研究工作,并越來(lái)越多的將其作為證據(jù)在法庭上被采信。其中最著名的案件當(dāng)屬菲律賓前反對(duì)黨領(lǐng)袖阿基諾被殺案[2]。
我國(guó)的聲紋檢驗(yàn)研究工作起步相對(duì)較晚,這是與我國(guó)社會(huì)生產(chǎn)力發(fā)展?fàn)顩r緊密相關(guān)的。建國(guó)初期,我國(guó)社會(huì)生產(chǎn)力水平相對(duì)低下,通信事業(yè)欠發(fā)達(dá),通訊設(shè)備架設(shè)不完善,給犯罪分子加以利用的機(jī)會(huì)也相對(duì)較少。1978年底,我國(guó)實(shí)施了改革開放,引進(jìn)了大量先進(jìn)技術(shù),極大地解放了社會(huì)生產(chǎn)力。80年代后期,社會(huì)生產(chǎn)力的解放帶來(lái)了經(jīng)濟(jì)的騰飛,通訊事業(yè)隨之蓬勃發(fā)展,而移動(dòng)通信也乘著改革開放的浪潮迅速崛起。國(guó)民生活水平提高,各式各樣的公用或私人電話迅速普及,這為生活帶來(lái)便利的同時(shí)也給了犯罪分子以可乘之機(jī)。
1986年,中國(guó)刑事警察學(xué)院收到了沈陽(yáng)市有關(guān)部門一項(xiàng)關(guān)于說(shuō)話人鑒定的委托,這時(shí)國(guó)內(nèi)在聲紋檢驗(yàn)這一領(lǐng)域還未有人涉足,中國(guó)刑警學(xué)院也沒(méi)有相關(guān)技術(shù),因而無(wú)法接受這項(xiàng)委托[3]。這件事給了公安部門及相關(guān)領(lǐng)域?qū)W者敲響了警鐘:國(guó)內(nèi)社會(huì)現(xiàn)狀與公安工作實(shí)踐急需這方面的理論和技術(shù)支持,聲紋檢驗(yàn)技術(shù)的相關(guān)研究必須馬上展開,填補(bǔ)國(guó)內(nèi)該領(lǐng)域的空白。
1988年,中國(guó)刑事警察學(xué)院文件檢驗(yàn)技術(shù)系從美國(guó)KAY公司引進(jìn)了KAY-7800型數(shù)字語(yǔ)圖儀,成立了以岳俊發(fā)、王英利、金陽(yáng)天、陳祥民為成員的課題小組,建立起了國(guó)內(nèi)第一個(gè)聲紋檢驗(yàn)實(shí)驗(yàn)室,率先展開了聲紋檢驗(yàn)技術(shù)相關(guān)的研究工作。一年后,公安部第二研究所(公安部物證鑒定中心)引進(jìn)了KAY Sona Graph 5500型聲譜儀,成立了以崔效義、李敬陽(yáng)、王莉、馮祖祎等人為成員的課題組,同樣展開了聲紋檢驗(yàn)相關(guān)研究。1989年12月,中國(guó)刑警學(xué)院成功地針對(duì)沈陽(yáng)軍區(qū)與閩遼公司的一起財(cái)務(wù)糾紛案中涉及的音頻資料進(jìn)行了聲紋檢驗(yàn),且該鑒定意見被法庭采信作為證據(jù),這是我國(guó)第一起聲紋檢驗(yàn)意見被法庭采信的案例。
隨著30年的發(fā)展,我國(guó)的聲紋檢驗(yàn)技術(shù)從無(wú)到有,從有到精,在幾代人的努力下,逐步建立起一套針對(duì)漢語(yǔ)特點(diǎn)的科學(xué)、完善的聲紋檢驗(yàn)體系。聲紋技術(shù)在各個(gè)領(lǐng)域大放異彩,被廣泛應(yīng)用,而聲紋檢驗(yàn)技術(shù)則成功地為大量案件在偵查及訴訟階段提供了有力的幫助,成為公安機(jī)關(guān)打擊犯罪的又一利劍。
聲紋檢驗(yàn)針對(duì)的對(duì)象是指案件中發(fā)現(xiàn)的能夠證明案件事實(shí)或與案件有關(guān)的一切音頻資料(包括各類錄音設(shè)備或存儲(chǔ)設(shè)備中存儲(chǔ)的音頻資料以及視頻錄像中的音頻)。自1989年起,我國(guó)就將“視聽資料”作為證據(jù)寫入《中華人民共和國(guó)刑事訴訟法》,這從法律上規(guī)定了聲紋檢驗(yàn)的客體--音頻資料(屬視聽資料的一種)作為證據(jù)的合法性。
在視聽資料作為證據(jù)使用有爭(zhēng)議時(shí),當(dāng)進(jìn)行鑒定。偵查過(guò)程中缺少線索,只有有限的音頻資料時(shí) ,應(yīng)進(jìn)行鑒定以獲取線索。聲紋檢驗(yàn)在偵察和訴訟階段均扮演著重要的角色,那么聲紋檢驗(yàn)包含哪些內(nèi)容呢?
3.2.1 錄音真實(shí)性(完整性)鑒定
錄音的真實(shí)性(完整性)鑒定,又稱錄音資料剪輯鑒定,指通過(guò)聽覺(jué)感知、聲譜分析、元數(shù)據(jù)分析、數(shù)字信號(hào)分析等技術(shù)手段,對(duì)錄音資料的原始性、連續(xù)性和完整性所進(jìn)行的科學(xué)判斷,以確定其是否經(jīng)過(guò)后期加工處理。
3.2.2 降噪和語(yǔ)音增強(qiáng)
降噪分為可視降噪和自適應(yīng)降噪??梢暯翟胧侵高x擇噪聲譜,對(duì)檢材部分或全部進(jìn)行降噪處理。自適應(yīng)降噪是指選擇適當(dāng)?shù)淖赃m應(yīng)參數(shù),對(duì)檢材內(nèi)的噪聲在頻域和時(shí)域進(jìn)行降噪處理。
語(yǔ)音增強(qiáng)是指使用語(yǔ)音增強(qiáng)技術(shù),對(duì)檢材語(yǔ)音過(guò)弱的部分或全部進(jìn)行語(yǔ)音增強(qiáng)處理,提高信噪比。
3.2.3 語(yǔ)音內(nèi)容辨識(shí)
對(duì)音頻資料里的語(yǔ)音內(nèi)容進(jìn)行審聽辨識(shí)。
3.2.4 環(huán)境噪聲分析
對(duì)音頻里的環(huán)境噪聲進(jìn)行審聽,根據(jù)其中一些特定的聲音來(lái)推斷錄音時(shí)所處的環(huán)境,為偵查提供線索。
3.2.5 說(shuō)話人語(yǔ)音分析
從語(yǔ)音、語(yǔ)調(diào)、發(fā)音習(xí)慣、詞匯和語(yǔ)法習(xí)慣等方面進(jìn)行綜合分析,對(duì)說(shuō)話人的方言、口音、年齡、文化程度、職業(yè)等特征進(jìn)行分析刻畫。
3.2.6 說(shuō)話人鑒定
這是聲紋檢驗(yàn)的主要內(nèi)容,是指通過(guò)對(duì)不同的音頻資料中特定說(shuō)話人的語(yǔ)音聲學(xué)特征與進(jìn)行分析檢測(cè)和綜合比對(duì),做出兩者是否為同一人的結(jié)論。
3.2.7 音源同一鑒定
指通過(guò)對(duì)影音制品中音頻信號(hào)的聲學(xué)特征進(jìn)行綜合分析,做出檢材與樣本的音源是否同一的鑒定過(guò)程。
聲紋檢驗(yàn)發(fā)展初期,音頻的載體多是模擬信號(hào)的磁帶,想對(duì)這樣的音頻文件做修改,必須對(duì)磁帶動(dòng)手,難免會(huì)在磁帶上留下修補(bǔ)痕跡,篡改人的水平不同,痕跡的明顯程度不同,即使利用空磁帶對(duì)修改后的磁帶進(jìn)行翻錄,也會(huì)在新的磁帶上記錄下非正常的脈沖條紋(多為多次按壓“暫停/播放”按鈕所致)。但隨著數(shù)碼時(shí)代的到來(lái),各種便攜的數(shù)碼設(shè)備都具有了錄音功能,現(xiàn)在案件中遇到的音頻資料多為數(shù)字化的資料。網(wǎng)絡(luò)上也有各種各樣的音頻編輯工具(如:CoolEdit、Adobe Audition、WaveCN……),而且有免費(fèi)的使用教程,對(duì)于別有用心的人來(lái)說(shuō),大大降低了犯罪成本。利用這些編輯軟件犯罪分子可以很容易的對(duì)錄音內(nèi)容進(jìn)行刪減或添加,經(jīng)過(guò)軟件的優(yōu)化處理,一般偵查人員很難分辨出涉案錄音的真實(shí)與否。
錄音真實(shí)性檢驗(yàn)是聲紋檢驗(yàn)中十分重要的一環(huán),因?yàn)橐环菀纛l資料能否作為證據(jù)在訴訟中使用,最重要的是該音頻資料應(yīng)為真實(shí)有效且未經(jīng)修改的。同時(shí),錄音真實(shí)性檢驗(yàn)又是法庭科學(xué)中的一項(xiàng)技術(shù)難題,尤其是數(shù)字錄音。對(duì)于數(shù)字錄音文件來(lái)說(shuō),首要的一項(xiàng)檢驗(yàn)就是錄音參數(shù)檢驗(yàn)。數(shù)字錄音文件是由與之對(duì)應(yīng)的數(shù)字錄音設(shè)備所錄制的,因此,錄音文件的各項(xiàng)參數(shù)特征必然與該設(shè)備相符。更有“amr編碼檢驗(yàn)”、“波形圖檢驗(yàn)”、“電網(wǎng)頻率檢驗(yàn)”、“頻譜檢驗(yàn)”等多種不同的方法,針對(duì)不同類型的錄音進(jìn)行真實(shí)性檢驗(yàn)。在錄音真實(shí)性檢驗(yàn)中, “重翻錄”錄音材料的檢驗(yàn)更是難上加難,但重翻錄操作不僅能做到偽造錄音場(chǎng)景,還能攻擊基于語(yǔ)音特征的安全系統(tǒng),因而針對(duì)重翻錄錄音材料檢驗(yàn)的研究極有必有。目前有研究人員從數(shù)據(jù)統(tǒng)計(jì)分析的角度,利用幅度共生向量特征來(lái)對(duì)重翻錄語(yǔ)音和原始語(yǔ)音進(jìn)行分析。雖然有了成果,但其實(shí)用性,以及在實(shí)戰(zhàn)中的準(zhǔn)確率有待考量,需要進(jìn)一步優(yōu)化與實(shí)踐[4-6]。
語(yǔ)音識(shí)別技術(shù)起始于20世紀(jì)50年代,經(jīng)過(guò)半個(gè)世紀(jì)的發(fā)展,在20世紀(jì)末,語(yǔ)音識(shí)別系統(tǒng)走向了實(shí)用化,各種模型和算法極大地提高了識(shí)別準(zhǔn)確率[7]。
在聲紋檢驗(yàn)的前期準(zhǔn)備工作中,需要對(duì)檢材、樣本語(yǔ)音進(jìn)行轉(zhuǎn)寫,對(duì)檢材、樣本語(yǔ)音中的相同詞進(jìn)行標(biāo)注,人工進(jìn)行往往會(huì)消耗大量時(shí)間,降低效率。加入語(yǔ)音識(shí)別系統(tǒng)后,可對(duì)檢材、樣本進(jìn)行自動(dòng)的轉(zhuǎn)寫和標(biāo)注,但目前的系統(tǒng)在識(shí)別方面精度并不高,無(wú)法達(dá)到檢驗(yàn)需要的標(biāo)準(zhǔn),仍需人工進(jìn)行核對(duì)。目前有不少的研究人員在更新算法、優(yōu)化程序代碼,甚至在嘗試著加入機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí),以期提高語(yǔ)音識(shí)別的準(zhǔn)確率。
聲紋檢驗(yàn)技術(shù)在我國(guó)起步較晚,但在幾代人的努力下,迎頭趕上,取得了不俗的成果,為以后的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。隨著科技的進(jìn)步,社會(huì)的發(fā)展,各種專業(yè)知識(shí)的學(xué)習(xí)成本在信息化時(shí)代都越來(lái)越低,犯罪分子的作案手段因而越來(lái)越先進(jìn),為了在這正與邪的對(duì)抗中不落下風(fēng),我們應(yīng)以開放的心態(tài),以兼容并包之勢(shì),吸收各個(gè)領(lǐng)域的前沿知識(shí),先進(jìn)技術(shù),將其應(yīng)用于聲紋檢驗(yàn)中來(lái),在前輩的基礎(chǔ)之上,進(jìn)行創(chuàng)新,探索更廣闊的的發(fā)展空間。