劉猛,潘洋緒
(河海大學(xué) 計(jì)算機(jī)與信息學(xué)院,江蘇 南京 210098)
基于RFC模型的英語(yǔ)語(yǔ)調(diào)差異性研究
劉猛,潘洋緒
(河海大學(xué) 計(jì)算機(jī)與信息學(xué)院,江蘇 南京210098)
本文主要對(duì)英語(yǔ)語(yǔ)調(diào)差異性進(jìn)行研究,分析中國(guó)英語(yǔ)語(yǔ)者與英語(yǔ)母語(yǔ)者語(yǔ)調(diào)差異性。對(duì)實(shí)驗(yàn)數(shù)據(jù)語(yǔ)音文件利用已建立的實(shí)驗(yàn)包通過(guò)MATLAB軟件提取基頻,基于提取的基頻生成基頻曲線。對(duì)得出的基頻曲線基于上升/下降/連接模型(RFC模型)[]在起始位置斜度,結(jié)束位置斜度,基音頻率均值,頻域范圍,語(yǔ)速五個(gè)方面參數(shù)方面進(jìn)行研究。分別對(duì)中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者就上述五個(gè)參數(shù)進(jìn)行分析。實(shí)驗(yàn)數(shù)據(jù)表明基于RFC模型的語(yǔ)調(diào)差異性研究可行,中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者在分析的5個(gè)參數(shù)上都有明顯的差異。
語(yǔ)調(diào);MATLAB;基頻;RFC模型
語(yǔ)調(diào)通常指的是語(yǔ)音語(yǔ)句基頻的變化,基頻承載了大量的語(yǔ)調(diào)信息。語(yǔ)調(diào)是目前語(yǔ)音分析,語(yǔ)音合成等領(lǐng)域都比較關(guān)注的重要課題。目前,現(xiàn)代英語(yǔ)語(yǔ)調(diào)研究大體可分為三大流派[2],偏重于語(yǔ)音層面的構(gòu)形方法研究;偏重音位層面的音高音位方式研究;試圖在音系和語(yǔ)音層面建立聯(lián)系的自主音段-節(jié)奏方式研究。國(guó)外的英語(yǔ)語(yǔ)調(diào)習(xí)得研究主要是對(duì)不同母語(yǔ)學(xué)習(xí)者的語(yǔ)調(diào)的習(xí)得過(guò)程、語(yǔ)調(diào)特征和口語(yǔ)發(fā)聲時(shí)定的描述性研究[3]。在語(yǔ)調(diào)模型研究方面,F(xiàn)ujisaki提出重音和短語(yǔ)以對(duì)數(shù)形式相加的語(yǔ)調(diào)模型[4]。國(guó)內(nèi)對(duì)中國(guó)英語(yǔ)語(yǔ)者的語(yǔ)調(diào)研究起步于理論研究,主要通過(guò)對(duì)比分析英漢兩種語(yǔ)言在語(yǔ)調(diào)上的差異,解釋中國(guó)學(xué)習(xí)者這語(yǔ)調(diào)習(xí)得中存在的問題[5]。
也有研究學(xué)者通過(guò)實(shí)證研究,借助語(yǔ)音實(shí)驗(yàn)研究軟件分析頻譜語(yǔ)圖來(lái)揭示中國(guó)英語(yǔ)語(yǔ)者的語(yǔ)調(diào)特征[6]。該類研究多是從語(yǔ)言學(xué)的角度去分析中國(guó)學(xué)習(xí)者的口語(yǔ)語(yǔ)調(diào)特征,缺乏對(duì)中國(guó)英語(yǔ)語(yǔ)者語(yǔ)調(diào)模式的概括。本文根據(jù)語(yǔ)音合成中用來(lái)描述語(yǔ)調(diào)的RFC模型 ,利用能夠很好反映出中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者的語(yǔ)調(diào)差異方面的特征參數(shù)。通過(guò)實(shí)驗(yàn)對(duì)比計(jì)算特征參數(shù)間的差異,得出結(jié)論。
本文的目標(biāo)是基于RFC模型分析中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者語(yǔ)調(diào)的差異性。通過(guò)利用RFC模型原理建立基頻語(yǔ)調(diào)模型分析參數(shù)差異性,從而得出語(yǔ)調(diào)的差異性大小是否明顯??傮w的流程圖如圖1所示。
圖1 總體設(shè)計(jì)流程圖Fig.1 The overall design flow chart
步驟一:實(shí)驗(yàn)數(shù)據(jù)集的得到,文中用 COOLEDIT軟件錄制語(yǔ)音文件,生成原始語(yǔ)音材料;步驟二:對(duì)得到的原始語(yǔ)音材料進(jìn)行預(yù)處理,包括重采樣改變文件的格式,采樣率等便于后面利用軟件包提取基頻;步驟三:利用實(shí)驗(yàn)室前期建立的實(shí)驗(yàn)包以及MATLAB軟件提取基,生成基頻曲線;步驟四:對(duì)得到的基頻曲線通過(guò)分析起始位置斜度、結(jié)束位置斜度、基音頻率均值,基音頻率范圍、語(yǔ)速5個(gè)參數(shù),得出中國(guó)英語(yǔ)學(xué)習(xí)者和英語(yǔ)母語(yǔ)者語(yǔ)調(diào)在這5個(gè)參數(shù)上的差異性。
s為一句語(yǔ)音的單詞數(shù),采樣頻率fs=16 000,t1和t4分別為起始位置采樣點(diǎn)數(shù)和結(jié)束位置采樣點(diǎn)數(shù)。由于采樣率fs為16 000 Hz,即每秒有16 000個(gè)采樣點(diǎn),因此在計(jì)算時(shí)乘以采樣率得到語(yǔ)速單位為單詞數(shù)/秒。
起始位置斜度,用δ1表示,定義為
大部分的語(yǔ)調(diào)信息主要隱含在基頻中,因此分析基頻中可以很好的得到語(yǔ)調(diào)的差異。Cruttenden研究中指出起始位置和結(jié)束位置的上升或下降是反映不同的口音類型語(yǔ)調(diào)的一個(gè)重要指標(biāo)[7]。上升/下降/連接模型是用來(lái)描述在音調(diào)輪廓的差異。通過(guò)提取的基頻生成基頻曲線,利用RFC模型原理建立基頻語(yǔ)調(diào)模型[8-9]。本文就是通過(guò)此模型分析起始位置斜度、結(jié)束位置斜度,基音頻率范圍,基音頻率均值,語(yǔ)速五個(gè)參數(shù)分析差異性。圖2是一個(gè)反映語(yǔ)調(diào)的基頻曲線圖模型,其中實(shí)黑線是基頻曲線。橫坐標(biāo)是采樣點(diǎn)數(shù),用表示,縱坐標(biāo)是頻率,用表示。
這里對(duì)需要分析的5個(gè)參數(shù)進(jìn)行定義:
語(yǔ)速,用表示,則語(yǔ)速定義為
即從起始采樣點(diǎn)處到基頻曲線第一個(gè)上升段和下降段結(jié)合點(diǎn)處的相對(duì)斜度,可直觀的顯示出語(yǔ)音語(yǔ)句開始時(shí)的起伏程度。
結(jié)束位置斜度,用δ2表示,定義為
即基頻曲線最后一段曲線的起伏程度,基頻曲線最后采樣點(diǎn)處到最后一段曲線下降時(shí)最高點(diǎn)處的相對(duì)斜度,可直觀的顯示出語(yǔ)音語(yǔ)句結(jié)束時(shí)語(yǔ)調(diào)。
基音頻率均值,用fθ表示,定義為
即基音頻率均值是所有采樣點(diǎn)出頻率的均值。
基音頻率范圍,用λ表示,定義為
即基音頻率范圍是基頻曲線中最大值與最小值的差值,反映出說(shuō)話人音域范圍的寬窄度。
3.1實(shí)驗(yàn)數(shù)據(jù)集
來(lái)自WSJCAM0數(shù)據(jù)庫(kù)和英國(guó)學(xué)術(shù)口語(yǔ)語(yǔ)料庫(kù)BASE的包含多種句型的語(yǔ)篇。隨機(jī)找尋中國(guó)英語(yǔ)學(xué)習(xí)者和英語(yǔ)母語(yǔ)者(男女比例大致相當(dāng))在噪音小的環(huán)境下朗讀語(yǔ)料,利用COOLEDIT進(jìn)行錄音,采樣率為16 kHz,格式為PCM的語(yǔ)音。對(duì)錄制的語(yǔ)音材料進(jìn)行處理,利用COOLEDIT將每個(gè)錄音中的每個(gè)語(yǔ)句切分出來(lái),形成實(shí)驗(yàn)數(shù)據(jù)集,分別包含108句中國(guó)英語(yǔ)語(yǔ)者句子(男性、女性各54句)和80句英語(yǔ)母語(yǔ)者句子(男性、女性各40句)。
圖2 反映語(yǔ)調(diào)的基頻曲線圖模型Fig.2 Reflect the intonation of the fundamental frequency graph model
3.2提取基頻曲線
對(duì)語(yǔ)句進(jìn)行處理得到基頻曲線,包括以下實(shí)驗(yàn)步驟:
1)對(duì)得到的語(yǔ)音語(yǔ)句用COOLEDIT軟件進(jìn)行轉(zhuǎn)化格式,轉(zhuǎn)為格式為采樣率為每秒16000,單聲道的WAV格式。轉(zhuǎn)化后的格式便于語(yǔ)音在MATLAB中進(jìn)行進(jìn)一步的處理。利用實(shí)驗(yàn)室前期建立的實(shí)驗(yàn)包對(duì)WAV格式語(yǔ)音文件進(jìn)一步處理,生成pmk格式文件,文件中是初步提取的基頻信息。
2)對(duì)生成pmk文件在MATLAB中打開,方式示例為fid= fopen(‘語(yǔ)音2.pmk’,‘r’);output=fread(fid,inf,‘uint16’);fclose(fid)。這里output是矩陣,矩陣中數(shù)值為每個(gè)采樣點(diǎn)是頻率值。由于提取時(shí)會(huì)出現(xiàn)提取的頻率值是基頻的一半(半頻)或是基頻的二倍(倍頻)的錯(cuò)誤,需進(jìn)一步對(duì)半頻和倍頻處進(jìn)行處理,設(shè)定一個(gè)閥值(本文中設(shè)定閥值為基頻頻率均值),將頻率值中小于的值乘以2β,大于的值除以2β,消除半頻和倍頻。然后對(duì)其分別進(jìn)行一次5點(diǎn)中值平滑和7點(diǎn)中值平滑消除奇點(diǎn)和部分未處理到半頻以及倍頻。再經(jīng)過(guò)修正,去掉沒有基頻地方的頻率值,將得到的離散的采樣點(diǎn)值利用插值函數(shù)生成基頻曲線。利用MATLAB中軟件處理的語(yǔ)音波形及提取的基頻曲線如圖3所示。圖3中最上面部分是原始語(yǔ)音波形圖;中間圖是沒有經(jīng)過(guò)半頻、倍頻處理以及中間平滑處理的各離散采樣點(diǎn)處的頻率值;下面圖是經(jīng)過(guò)平滑處理和半頻、倍頻處理后,將各離散采樣點(diǎn)處的值經(jīng)過(guò)插值處理后生成的基頻曲線圖。
3.3實(shí)驗(yàn)參數(shù)分析
對(duì)提取的基頻曲線用本論文上面描述的反映語(yǔ)調(diào)的基頻曲線圖模型的參數(shù)分析進(jìn)行處理,分別就語(yǔ)速,起始位置斜度,結(jié)束位置斜度,基音頻率均值,頻域范圍五方面進(jìn)行分析。這里在分析時(shí),對(duì)男性和女性分開進(jìn)行分析處理。我們將中國(guó)男性語(yǔ)者、中國(guó)女性語(yǔ)者、英語(yǔ)母語(yǔ)男性語(yǔ)者、英語(yǔ)母語(yǔ)女性語(yǔ)者的語(yǔ)速按照柱狀圖進(jìn)行統(tǒng)計(jì)。圖4、5、6、7分別為中國(guó)女性語(yǔ)者語(yǔ)速分布圖、中國(guó)男性的語(yǔ)速分布圖、英語(yǔ)母語(yǔ)者男性語(yǔ)速分布圖以及英語(yǔ)母語(yǔ)者女性語(yǔ)速分布圖,可以看出均呈現(xiàn)高斯分布。從而語(yǔ)速的均值能夠很好的體現(xiàn)中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者整體語(yǔ)速的特征。因此計(jì)算語(yǔ)速的均值和方差。表1數(shù)據(jù)為中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者語(yǔ)速均值和方差。
圖3 原始語(yǔ)音波形、離散采樣的頻率值以及經(jīng)過(guò)處理后生成的基頻曲線Fig.3 The original voice waveform,frequency value of discrete sampling points and processed pitch contour
圖4 中國(guó)男性語(yǔ)者語(yǔ)速分布Fig.4 Chinese male speaker Speed Distribution
圖5 中國(guó)女性語(yǔ)者語(yǔ)速分布Fig.5 Chinese female speaker Speed Distribution
對(duì)比來(lái)看,英語(yǔ)母語(yǔ)者男性語(yǔ)速高于中國(guó)英語(yǔ)者男性達(dá)到27.52%,英語(yǔ)母語(yǔ)者女性語(yǔ)速高于中國(guó)英語(yǔ)者女性達(dá)到42.37%。兩者存在著明顯的差異,從中可看出外教的語(yǔ)速明顯高于中國(guó)學(xué)習(xí)者的語(yǔ)速。對(duì)另外4個(gè)參數(shù)按照語(yǔ)速分析的方法進(jìn)行分析,得出均值和方差,如表2和表3所示。
從表格中數(shù)據(jù)均值的對(duì)比來(lái)看,可以看出中國(guó)英語(yǔ)者男
圖6 英語(yǔ)母語(yǔ)者男性語(yǔ)速分布Fig.6 Speed distribution of male native English speakers
圖7 英語(yǔ)母語(yǔ)者女性語(yǔ)速分布Fig.7 Speed distribution of female native English speakers
表1 中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者語(yǔ)速的均值和方差Tab.1 The mean and variance of Chinese English speaker speed and English native speakers speed
表2 音域頻率范圍和基音頻率均值的均值和方差Tab.2 The mean and variance of Frequency range and the pitch frequency mean
表3 起始位置斜度和結(jié)束位置斜度的均值和方差Tab.3 The mean and variance of start position and end position slope
性和中國(guó)英語(yǔ)者女性的音域頻率范圍比相對(duì)應(yīng)的英語(yǔ)母語(yǔ)者男性和英語(yǔ)母語(yǔ)者女性要高,其中中國(guó)英語(yǔ)者男性音域范圍均值比英語(yǔ)母語(yǔ)者男性高出53.82%,中國(guó)英語(yǔ)者女性音域范圍均值比英語(yǔ)母語(yǔ)者女性高出10.81%。中國(guó)英語(yǔ)者男性和中國(guó)英語(yǔ)者女性的基音頻率均值比相對(duì)應(yīng)的英語(yǔ)母語(yǔ)者男性和英語(yǔ)母語(yǔ)者女性要高,其中中國(guó)英語(yǔ)者男性基音頻率均值比英語(yǔ)母語(yǔ)者男性高出18.45%,中國(guó)英語(yǔ)者女性基音頻率均值比英語(yǔ)母語(yǔ)者女性高出8.62%。
對(duì)比起始位置斜率,中國(guó)英語(yǔ)者男性和中國(guó)英語(yǔ)者女性比相對(duì)應(yīng)的英語(yǔ)母語(yǔ)者男性和英語(yǔ)母語(yǔ)者女性要高,其中中國(guó)英語(yǔ)者男性起始位置斜度均值比英語(yǔ)母語(yǔ)者男性高出41.13%,中國(guó)英語(yǔ)者女性起始位置斜度均值比英語(yǔ)母語(yǔ)者女性高出19.67%。對(duì)比結(jié)束位置斜度,中國(guó)英語(yǔ)者男性結(jié)束位置斜度均值比英語(yǔ)母語(yǔ)者男性高出58.24%,中國(guó)英語(yǔ)者女性結(jié)束位置斜率均值比英語(yǔ)母語(yǔ)者女性高出36.87%。
基于RFC模型的語(yǔ)調(diào)差異性研究為語(yǔ)音識(shí)別,說(shuō)話人識(shí)別等方面研究提供了語(yǔ)調(diào)方面的理論方法。本文正是基于該模型的分析,研究了中國(guó)英語(yǔ)語(yǔ)者和英語(yǔ)母語(yǔ)者語(yǔ)調(diào)的差異性。通過(guò)實(shí)驗(yàn)分析了起始位置斜度,結(jié)束位置斜度,基音頻率均值,基音頻域范圍,語(yǔ)速五個(gè)參數(shù)。可以看出中國(guó)英語(yǔ)語(yǔ)者與英語(yǔ)母語(yǔ)者在這五個(gè)參數(shù)方面都有明顯的差異。相對(duì)于英語(yǔ)母語(yǔ)者,中國(guó)英語(yǔ)語(yǔ)者的語(yǔ)速相對(duì)較慢,基音頻率均值相對(duì)較大,同時(shí)頻率范圍也相對(duì)較大。在起始位置斜度和結(jié)束位置斜度上,中國(guó)英語(yǔ)語(yǔ)者相對(duì)于英語(yǔ)母語(yǔ)者都相對(duì)較大,即語(yǔ)句開始和結(jié)束時(shí)的起伏度大。
[1]Paul Taylor.The rise/fall/connection model of intonation[J]. Speech Communication,1994,15(94):169-186.
[2]Ladd D R.Intonational Phonology[M].Cambridge University Press,1996.
[3]Wenk B J.Speech Rhythms in Second Language Acquisition [J].Language and Speech,1985(2):157-175.
[4]Fujisaki H,Wang C,Ohno S,et al.Analysis and synthesis of fundamental frequency contours of Standard Chinese using the commend-response model[J].Speech Communication,2005,47(1/2):59-70.
[5]陳樺.中國(guó)學(xué)生英語(yǔ)語(yǔ)調(diào)模式研究[M].上海:上海外語(yǔ)教育出版社,2008.
[6]Setter J.Speech rhythm in world Englishes:The case of Hong Kong[J].TESOL Quarterly,2006,(4):763-782.
[7]Cruttenden A.Intonation[M].Cambridge University Press,1997.
[8]Yan Q,Vaseghi S.Modeling and synthesis of English regional accents with pitch and duration correlates[J]. Computer Speech and Language,2010,24:711-725.
[9]Yan Q,Vaseghi S,Rentzos D,et al.Analysis of acoustic correlates of British,Australian and American accents[J].Proc. IEEE Automatic Speech Recognition and Understanding Workshop,2003,3(39):345-350.
Study of English intonation difference based on RFC model
LIU Meng,PAN Yang-xu
(College of Computer and Information of HoHai University,Nanjing 210098,China)
The paper mainly researches on English intonation difference and analyzes the difference between English speakers in China and English-as-mothertongue speakers.Pitch is extracted from the experimental data in speech file on MATLAB and then pitch curve is generated based on the extracted pitch.Besides,the pitch curve is discussed based on raising/falling/ connection(RFC model)from five parameters as starting slope,ending slope,average pitch,pitch range and speech speed. Also,the above mentioned parameters are analyzed for English speakers in China and English-as-mothertongue speakers. Experimental data show that the study of English intonation difference based on RFC model is feasible and there is great difference between English speakers in China and English-as-mothertongue speakers in the above parameters.
intonation;MATLAB;pitch;RFC model
TN912.3
A
1674-6236(2016)03-0152-04
2015-05-19稿件編號(hào):201505163
劉 猛(1990—),男,安徽合肥人,碩士。研究方向:信號(hào)與信息處理、語(yǔ)音處理與識(shí)別。