• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      變聲語音與正常語音聲紋特征變化規(guī)律研究

      2022-08-17 06:13:54彭菀王虹中國刑事警察學院
      警察技術(shù) 2022年4期
      關(guān)鍵詞:變聲音素基頻

      彭菀 王虹 中國刑事警察學院

      引言

      語音同一認定是指通過對不同的音頻資料中特定說話人的語音進行鑒定,判斷兩者是否為同一人語音[1]。我國聲紋鑒定技術(shù)于上世紀80年代末起步,中國刑事警察學院文檢系和公安部物證鑒定中心分別引入美國KAY Sona Graph 7800型數(shù)字聲譜儀和DSP 5500型數(shù)字語圖儀,建立聲紋鑒定實驗室,進行聲紋鑒定技術(shù)研究[2]。

      隨著高科技犯罪所占比率日益增大,犯罪分子逐漸意識到聲音偽裝的重要性。他們利用變聲器改變聲音,以達到逃避打擊的目的。本文針對正常語音與變聲語音聲紋特征的變化規(guī)律展開研究,希望可以為其語音的同一認定提供幫助。

      一、變聲器原理簡述

      變聲器所運用的語音變調(diào)技術(shù)主要可分為基于重采樣的調(diào)整方法和基于模型法的語音變調(diào)算法。重采樣方法從整體上處理語音信號,從時頻映射的角度實現(xiàn)語音基頻的轉(zhuǎn)換,效果較好,但需要引入時長規(guī)整算法保證語音信號的變調(diào)不變速,因此算法復雜度較高[3]?;谀P头ǖ淖冋{(diào)算法把語音信號模擬成特定的語音模型,其合成自然度較低,但硬件實現(xiàn)較簡單。經(jīng)過變聲器的聲音,不僅聽覺上發(fā)生了改變,其語音圖譜和特征中量化的數(shù)據(jù)都發(fā)生了變化。所以,人類在熟悉說話人的情況下對說話人的語聲進行識別表現(xiàn)的相當可靠,但是很難識別變聲條件下的說話人語聲[4]。目前常用的商業(yè)變聲器的算法多為時域重采樣算法[5]。

      二、實驗設(shè)計

      (一)錄音合作人

      本實驗從在校大學生中隨機選取5男5女為發(fā)音對象,并對他們分別進行同語段錄音。

      (二)錄音環(huán)境

      實驗場所為專業(yè)錄音室,封閉性好,可有效隔絕外部噪音,消除回音。

      (三)錄音器材

      錄音所用麥克風為森海塞爾MK4,錄音軟件為Audacity,電腦型號為聯(lián)想r9000p,手機型號為華為榮耀7X。

      (四)錄音樣本

      為充分觀察分析變聲語音與正常語音的各類聲紋特征變化情況,我們采用如下錄音樣本:

      (1)拼音:ā、ō、ē、ī、ū、ǖ……

      (2)單字:啊、達、法、媽、那……

      (3)詞語:會員、基本、最后……

      (4)長篇閱讀:《北風與太陽》

      (五)變聲器的選擇

      從嗶哩嗶哩、知乎、百度等熱門網(wǎng)絡(luò)平臺中,按瀏覽量、下載量及評論情況,選取“MorphVOX Pro變聲器”作為電腦變聲實驗工具。

      按應(yīng)用市場下載排行,選出“專業(yè)變聲器”作為手機變聲實驗工具。

      二者變聲原理均為時域重采樣算法。

      (六)變聲處理

      將發(fā)音人錄音后的正常語音保存到裝有變聲軟件的電腦和手機中。經(jīng)過電信詐騙案件篩選出兩種常用語音包,用男變女語音包對男性發(fā)音人的聲音進行處理,使其變?yōu)榕月曇?;反之,使女性發(fā)音人聲音變?yōu)槟行月曇簟?/p>

      (七)語音分析軟件

      本文使用的語音分析軟件為Praat6.2.10。

      三、實驗結(jié)果與分析

      (一)聽覺檢驗

      人的聽覺的一個特點是它能感受到動態(tài)范圍極寬的聲音[6]。并且,人耳對聲音具有較強的解析和分辨能力。因此,對變聲語音做聽覺檢驗具有必要性。

      1.檢驗方法

      本文根據(jù)變聲器的基本原理,從聽覺特征中選取14個特征制作聽覺比對檢驗表。每個特征按正常語音與變聲語音的符合程度劃分為5個等級,將每個等級用分數(shù)表示。選取5位具有語音學基礎(chǔ)的聽音人對特征進行打分。

      2.評價方式

      依照表1,讓5位聽音人對聽覺特征進行打分。對不同變聲器中不同變聲方式的所有特征得分,利用MOS(Mean Opinion Score)值進行打分評測。

      3.檢驗結(jié)果

      將5位聽音人對每種聽覺特征給出分數(shù)的平均值繪制成柱狀統(tǒng)計圖,如圖1、圖2所示。

      據(jù)統(tǒng)計結(jié)果:兩種變聲語音與正常語音在變調(diào)、流暢度、兒化音、音節(jié)完整性和輕、重音這些聽覺特征上有較高的一致性。電腦變聲語音在嗓音純度和平均音高上一致性較低,手機變聲僅在平均音高上一致性較低。

      (二)頻譜分析

      1.能量曲線形態(tài)特征

      聲音的能量反應(yīng)了說話人聲音的聲強,即聲波中振幅的大小。以《北風和太陽》中的“這下北風只好承認,他們倆當中還是太陽的本事大”作為研究對象,對10位發(fā)音人語音的能量曲線形態(tài)進行測繪,然后分別對每一個人變聲前后語音的能量曲線形態(tài)進行比對,觀察能量曲線的分布特征,圖中黑線為正常語音曲線,綠線為變聲語音曲線,如圖3所示。

      從圖3中可知,兩種變聲與正常語音的聲音能量曲線形態(tài)符合度都較高,曲線的斜率與曲率高度接近,其中電腦變聲后的能量曲線形態(tài)符合度要高于手機變聲。兩種聲音的能量整體高低有區(qū)別是變音軟件對聲音能量進行增強所致,而有的相同音素能量大小不同原因可能是變聲器改變聲強所致,故變聲器對該特征的影響較為微弱。

      2.基頻走向形態(tài)

      基頻是指基音的頻率[1]?;l的走向能夠反映一段時間內(nèi)基頻的變化。根據(jù)聲調(diào)變化的多樣性,選用語料《北風和太陽》中的“爭來爭去就是分不出高低來”作為研究對象,對10位發(fā)音人的兩種語音基頻進行測量,然后對形成的基頻曲線進行比對分析,觀察曲線的分布狀態(tài)。圖中黑線為正常語音曲線,綠線為變聲語音曲線,如圖4所示。

      由圖可見,男性手機變聲語音的基頻走向符合度高于電腦變聲語音,女性兩種變聲語音的基頻走向符合度基本相同,符合度都較高。同一個人在進行變聲時,基頻曲線會發(fā)生整體升高或降低的趨勢,部分連續(xù)性較好的基頻曲線曲率會發(fā)生變化,曲線拐點與極值點的位置大體不變,曲線的單調(diào)區(qū)間基本趨于一致。因此,變聲器對基頻曲線的走向特征影響較小,不同人相關(guān)文本的語音樣本時長較長時,基頻走向特征相對于變聲條件表現(xiàn)出較為明顯的差異。此外,若變聲器將基頻提高到300HZ以上,基頻走向曲線出現(xiàn)被縱向拉伸變形的情況,而300HZ以下縱向變形程度較小。

      3.共振峰走向特征

      共振峰走向特征是指共振峰中心線在頻率和時間平面上的曲線形態(tài),它能反映語音及其共振峰的動態(tài)形態(tài)[7]。選取10位發(fā)音人兩種語音中“累”“藥”“回”三個音節(jié)中的復合元音[ei]、[iɑu]、[uei]作為研究對象,觀察同一人在正常語音和變聲語音中這些復合元音的共振峰走向特征是否存在變化。

      從表2可見,手機變聲語音的共振峰走向符合度高于電腦變聲語音,且低次共振峰走向穩(wěn)定性較高。此外,在男性語音變女聲時,共振峰頻率顯著提高,但走向較為模糊,如圖5所示。在女性語音變男聲時,共振峰頻率顯著降低,如圖6所示。因此,對于男性語音變女聲,低次共振峰走向特征具有較強的穩(wěn)定性,高次共振峰走向特征容易產(chǎn)生變化;對于女性語音變男聲,高次共振峰和低次共振峰都具有較強的穩(wěn)定性。

      4.音節(jié)間過渡音征

      音節(jié)間過渡音征是指自然發(fā)音的節(jié)奏單元內(nèi)音節(jié)之間的相鄰音素之間發(fā)生協(xié)同發(fā)音并形成有機過渡段走向形態(tài)和過渡方式[8]。選取發(fā)音人兩種語音中“約會”、“北風”兩詞語中第一個音節(jié)的元音[ε]、[i]到第二個音節(jié)的[x]、[f]的過渡段作為實驗對象。根據(jù)過渡段的走向和過渡方式來判斷相同發(fā)音人在變聲后音節(jié)間過渡音征是否出現(xiàn)明顯差異,結(jié)果如表3。

      上表中對比可得:兩種變聲器的音節(jié)間過渡音征走向和過渡方式符合度較高,只有個別存在差異,例如:發(fā)音人W2發(fā)“北風”時的F2,正常語音音節(jié)間過渡音征走向為降渡,而兩種變聲都為平渡。因此,同一人發(fā)音時,音節(jié)間元音到輔音的過渡音征具有較強的穩(wěn)定性,不易受到變聲器的干擾。

      5.音節(jié)內(nèi)過渡音征

      音節(jié)內(nèi)過度音征指自然發(fā)音的單音節(jié)內(nèi)部的相鄰音素之間發(fā)生協(xié)同發(fā)音并形成一個有機過渡段走向形態(tài)和過渡方式[8]。選取“習”為例,分析音節(jié)內(nèi)輔音到元音[i]之間過渡段的走向和過渡方式來判斷相同發(fā)音人在變聲后音節(jié)內(nèi)過渡音征是否發(fā)生變化,結(jié)果見表4。

      表中可見:兩種變聲語音的音節(jié)內(nèi)過渡方式符合度在本次測量中都達到100%,音節(jié)內(nèi)音渡音征的走向能達到95%和90%的符合度,只有個別存在差異。因此,正常語音在進行變聲后,過渡方式相同,雖然個別發(fā)音人的音節(jié)內(nèi)前音渡音征走向有差異,但總體穩(wěn)定性較強,受變聲器干擾較弱。

      (三)聲紋參數(shù)測量分析

      1.速度變化特征

      受語音時長規(guī)整技術(shù)的影響,測量速度變化特征有必要性。通過測量發(fā)音人兩種語音中單獨音節(jié)及其聲母與韻母的時長,來對比變聲后發(fā)音人的聲音速度是否產(chǎn)生變化。選取語音中的“徐”“時”“考”作為研究對象,對10位發(fā)音人的兩種語音進行測量,觀察時長是否存在差異,結(jié)果見表5~6,其中時長差距小于0.01秒認為基本不變。

      經(jīng)分析,男性發(fā)音人變聲后聲母和韻母的時長普遍下降,且聲母的時長下降程度要大于韻母,音節(jié)的時長隨之降低。女性發(fā)音人變聲后聲母的時長會有細微降低,有的無變化,韻母的時長會有一定程度的增加,整個音節(jié)的時長無明顯變化??梢?,語音的速度在變聲后產(chǎn)生了微弱變化且具一定規(guī)律。所以,速度變化特征具有一定的研究和應(yīng)用價值。

      2.基頻測量

      選取10位發(fā)音人語音中的[a]、[i]、[u]、[y]為研究對象,測量它們正常語音和變聲語音的基頻平均數(shù)值。為探尋基頻平均數(shù)值是否具有顯著差異,對男性和女性統(tǒng)計以上四種音素的基頻平均數(shù)值首先進行單樣本Kolmogorov-Smirnov檢驗,觀察是否符合正態(tài)分布,經(jīng)檢驗顯著性P值均為0.2,即P>0.05服從正態(tài)分布,然后進行T-檢驗,檢驗它們之間是否存在顯著差異,結(jié)果見表7。

      結(jié)果顯示,在T-檢驗結(jié)果中所有被檢驗組別的顯著性P<0.05,因此兩種語音的平均基頻數(shù)值具有顯著差異。為觀察它們之間是否具有相關(guān)性,做出兩類數(shù)據(jù)的散點圖7~10,發(fā)現(xiàn)可能存在線性相關(guān)的關(guān)系。因此,對兩類數(shù)據(jù)進行Pearson相關(guān)性檢驗,結(jié)果男性的配對樣本相關(guān)性中的顯著性P<0.05,相關(guān)性為0.987和0.993;女性的配對樣本相關(guān)性中的顯著性P<0.05,相關(guān)性為0.992和0.990。可見男女變聲后的基頻平均數(shù)值和正常語音的基頻平均數(shù)值具線性相關(guān)的關(guān)系。

      3.第一共振峰

      不同人共振峰頻率的差異是進行語音同一認定的重要音素。對10位發(fā)音人正常語音與變聲語音中[a]、[i]、[u]的第一共振峰進行測量,繪制出以下統(tǒng)計圖,并對它們進行分析。(后文中共振峰測量用相同實驗條件和對象)具體變化量如圖11所示。

      經(jīng)分析:男性在變女聲時F1的頻率總體都發(fā)生了上升的情況,女性在變男聲時F1的頻率總體都發(fā)生了下降的情況。其中,手機變聲后[a]的下降幅度稍大于[i]和[u]的下降幅度。將同一人不同音素和不同人相同音素比對后發(fā)現(xiàn),正常語音F1在變聲后上升和下降的范圍規(guī)律較為模糊,研究人未發(fā)現(xiàn)其中存在明顯規(guī)律性。

      4.第二共振峰

      對第二共振峰進行測量并繪制成統(tǒng)計圖,觀察比對變聲前后第二共振峰出現(xiàn)的差異。具體變化量如圖12所示。

      比對可見:5位男性發(fā)音人在變女聲時,F(xiàn)2普遍升高;[i]的F2上升幅度穩(wěn)定在1000HZ左右;[u]的F2上升幅度差別較大,各不相同。5位女性發(fā)音人在變男聲時,F(xiàn)2普遍下降,3種音素F2的下降幅度差異較大,無明顯規(guī)律性。同一人不同音素之間具有差異,F(xiàn)2上升或下降的幅度各不相同,不具有明顯的符合性。

      5.第三共振峰

      由于同性別不同人的第一、二共振峰之間差異較小,一般高次共振峰會有明顯差異,故有必要對第三、四共振峰進行測量,并觀察變聲之后的頻率變化。其中,第三共振峰升降變化結(jié)果如圖13所示。

      經(jīng)統(tǒng)計,男性變聲后F3普遍上升,音素[a]的F3普遍上升了1000HZ左右,音素[i]的F3除了M1 的上升幅度較小,其余的普遍上升了1200HZ左右,音素[u]上升幅度差別較大。女性變聲后F3普遍降低,音素[a]電腦變聲器變聲后除了W5下降幅度較大外,剩下的普遍下降650HZ左右,手機變聲器則下降更多一些,音素[i]普遍下降1100HZ左右,音素[u]普遍下降1000HZ左右。此外,同一人在不同音素中F3上升或下降的幅度并不相符。

      6.第四共振峰

      對第四共振峰進行測量,并制成條形統(tǒng)計圖,然后觀察比對變聲給F4帶來的影響,結(jié)果如圖14所示。

      如圖,男性變女聲時F4普遍升高,女性變男聲時F4普遍降低。男性F4上升的幅度范圍較為模糊,女性F4下降幅度大約為1100HZ左右。同一人不同音素時F4的上升或下降的幅度范圍無明顯相關(guān)性。

      四、討論與總結(jié)

      從實驗結(jié)果可以看出變聲器可以改變發(fā)音人的大部分聲學特征,這些變化中部分擁有一定的規(guī)律。在聽覺特征中變調(diào)、流暢度、兒化音、音節(jié)完整性和輕、重音這些特征較為穩(wěn)定,變化程度小。在聲學頻譜特征中能量曲線形態(tài)特征、共振峰走向特征、音節(jié)間過渡音征和音節(jié)內(nèi)過渡音征具有較強穩(wěn)定性。變聲語音的基頻走向特征具有一定的變化規(guī)律,即隨著變聲后頻率的增高,基頻走向曲線被縱向拉伸的程度會逐漸加大。變聲器對發(fā)音人語音的速度產(chǎn)生了一定的影響,它使男性變女聲的音節(jié)時長明顯降低,但女性變男聲的音節(jié)時長無顯著變化。后續(xù),可對速度的變化進一步研究,尋找速度變化的一般規(guī)律。

      在對基頻和前四個共振峰的測量結(jié)果中發(fā)現(xiàn):基頻的變化規(guī)律比較明顯,同一種變聲器正常語音基頻與變聲基頻之間線性相關(guān)。從前四個共振峰的測量結(jié)果來看,不同人或不同音素間少數(shù)發(fā)音人有一定程度上的符合,但大多數(shù)差異比較明顯,不具有特定的規(guī)律,且低次共振峰的變化程度要小于高次共振峰的變化程度。后續(xù),我們將繼續(xù)對同一人的共振峰變化程度大小的規(guī)律性進行研究。

      此外,當變聲器在頻域和時域上參數(shù)的設(shè)置都發(fā)生很大的變化,使變聲語音從聽覺到圖譜不再穩(wěn)定的表現(xiàn)個人習慣,這種語音就不再具備鑒定價值。本文實驗使用的變聲器較為初級,無法進行特征參數(shù)調(diào)節(jié),在未來的研究中會采用專業(yè)變聲器,對可鑒定的變聲程度及不同語速和語調(diào)的變聲情形進行進一步的研究。

      猜你喜歡
      變聲音素基頻
      新目標英語七年級(上)Starter Units 1-3 STEP BY STEP 隨堂通
      融合CNN和Transformer編碼器的變聲語音鑒別與還原
      語音同一認定中音段長度對基頻分析的影響
      基于時域的基頻感知語音分離方法?
      依托繪本課程,培養(yǎng)學生英語音素意識
      橋面鋪裝層對中小跨徑橋梁基頻影響分析
      木星地
      江南詩(2020年3期)2020-06-08 10:20:40
      小學英語課堂中音素意識與自然拼讀整合訓練的探索
      基于深度學習算法的真人變聲設(shè)備的設(shè)計與實現(xiàn)
      電子制作(2019年15期)2019-08-27 01:11:58
      ?不定冠詞a與an
      大同市| 德州市| 沙湾县| 南开区| 海城市| 黄龙县| 丽江市| 苍南县| 郁南县| 沽源县| 明光市| 桓台县| 辽阳市| 莱芜市| 南木林县| 铜梁县| 河间市| 广南县| 长治县| 莒南县| 丰顺县| 延长县| 通辽市| 漳浦县| 永福县| 海宁市| 桃源县| 内江市| 桐柏县| 南漳县| 岳阳县| 白山市| 绥德县| 房山区| 福清市| 开阳县| 巴里| 上饶县| 金堂县| 开原市| 富川|