盧 琰
(西安外國語大學(xué)歐洲學(xué)院, 西安 710128)
聲音是人類在交際過程中傳遞情感信息的重要載體,話語語音的韻律特征往往能真實(shí)地反映說話人的心理和情感狀態(tài)。情緒與態(tài)度(或社會(huì)情感)同屬人類的情感,卻在產(chǎn)生和發(fā)展的認(rèn)知過程上表現(xiàn)的不盡相同。與情緒相比,態(tài)度在人與人的交際過程中往往能反映說話人的意圖,體現(xiàn)對話雙方的社會(huì)關(guān)系,從而對雙方的交際互動(dòng)產(chǎn)生影響(Scherer 1993:316-336)。沒有被正確識(shí)別的態(tài)度語音往往會(huì)產(chǎn)生交際隔閡,甚至造成交際失敗。因而學(xué)習(xí)者如果能掌握一些目標(biāo)語常用態(tài)度的韻律表達(dá)方法,這將對提高其跨文化交際能力大有裨益。此外,在人工智能領(lǐng)域,態(tài)度語音韻律特征的分析與提取對于實(shí)現(xiàn)和諧、自然的智能人機(jī)交互,對于提高合成語音的自然度和真實(shí)度,以及智能語音識(shí)別的質(zhì)量都有著至關(guān)重要的現(xiàn)實(shí)意義。
目前國內(nèi)外對于態(tài)度語音研究方向主要集中在態(tài)度語音的聲學(xué)表現(xiàn)(如:Martins-Baltar 1977; Fujisaki & Hirose 1993;Gu et al 2011)、跨語言跨文化感知(如:Shochi et al 2009;Mac 2010;Lu et al 2012)和第二語言態(tài)度語音韻律的教學(xué)(如:Mejvaldová 2000; Shochi et al 2010;Pettorino et al 2012)。在充分考慮到態(tài)度語音在交際中,尤其是跨文化交際中的必要性的基礎(chǔ)上,筆者將從語言研究的視角出發(fā),對19種普通話交際態(tài)度語音的韻律特征進(jìn)行研究,并嘗試通過統(tǒng)計(jì)方法按照態(tài)度語音在基頻、強(qiáng)度和時(shí)長上的表現(xiàn)對其分類,考察不同類別的態(tài)度語音在韻律上的特點(diǎn)。
本文選取了19種漢語常見態(tài)度表達(dá)作為研究對象。為避免由不同說話人對態(tài)度概念的理解和表現(xiàn)的差異而造成的韻律參數(shù)取值的不同,以及后期統(tǒng)計(jì)計(jì)算中由此產(chǎn)生的偏差,本文態(tài)度語音的錄制由一名女性指定說話人完成。說話人在錄音前對所有態(tài)度概念和使用情境進(jìn)行理解和記憶,并對指定文本進(jìn)行多次模仿訓(xùn)練,以保證在錄音時(shí)對指定的發(fā)音樣本能夠準(zhǔn)確熟練地表達(dá)各種態(tài)度類型。錄音在實(shí)驗(yàn)室環(huán)境下進(jìn)行,所選用的文本按照其長度分為四種類型:單音節(jié)詞、雙音節(jié)詞、四音節(jié)詞組和九音節(jié)單句。所有文本均不含有暗示任何情感和態(tài)度的字詞,并在各種態(tài)度狀態(tài)下表達(dá)不會(huì)產(chǎn)生歧義。
表1 文本語料和態(tài)度名稱及其英文縮寫
Lin & Fon (2012) 和 Li et al (2011) 在各自的研究中證實(shí)言語的情感表現(xiàn)功能主要通過全句語調(diào)的基頻曲拱變化來體現(xiàn)。另外,Mac (2012) 在其博士論文中提到句首和句末音節(jié)的基頻特征相比句中音節(jié)在越南語態(tài)度語音表現(xiàn)上的標(biāo)記性更強(qiáng)。在參考上述研究成果的基礎(chǔ)上,本文將從全句和句子首、尾音節(jié)兩個(gè)層面考察19種普通話態(tài)度語音的韻律特征,具體分析在不同態(tài)度下語音樣本在基頻、音節(jié)時(shí)長和強(qiáng)度方面的表現(xiàn)(Scherer & Ellgring 2007;Ohala,1994;Di Cristo 2013:89)。
在提取聲學(xué)參數(shù)之前,每一條語音刺激均由研究人員在音段層面進(jìn)行手動(dòng)標(biāo)注之后,運(yùn)行Praat軟件完成大部分韻律參數(shù)的自動(dòng)提取。提取的語音樣本韻律參數(shù)包括:全句基頻均值(基頻域)、基頻標(biāo)準(zhǔn)差、強(qiáng)度均值和全句時(shí)長;句子最高和最低基頻值(用于計(jì)算基頻范圍);句子首尾音節(jié)的基頻均值(首尾音節(jié)基頻域)和時(shí)長。所有基頻值被轉(zhuǎn)化成半音(semitone),強(qiáng)度以分貝為單位(dB),時(shí)長(毫秒)取其對數(shù)值(Ross et al 1986)。
此外,還有兩個(gè)參數(shù)的值是在已提取數(shù)值的基礎(chǔ)上計(jì)算而來:基頻范圍(半音),即句子的最大基頻值與最小基頻值的差(Lin & Fon 2012);基頻斜率(半音/秒),表示基頻變化的方向和斜率,是末尾音節(jié)基頻均值與句首音節(jié)基頻均值的差除以全句時(shí)長的商(Ross et al 1986)。表2列出了語音分析中各韻律參數(shù)的名稱、英文縮寫及單位。
表2 用于態(tài)度語音聲學(xué)特征分析的韻律參數(shù)列表
隨后,在Excel表格中計(jì)算出19種態(tài)度的各韻律參數(shù)平均值,并運(yùn)用于后面的統(tǒng)計(jì)分析,以考察各交際態(tài)度的韻律特征。
將主成分分析(principle component analysis,簡稱PCA)與自下而上的層次聚類分析(agglomerative hierarchical cluster analysis)結(jié)合,能夠在對個(gè)體分類的過程中減少噪聲干擾(Husson et al 2010),因此,本文將PCA作為聚類分析的預(yù)處理步驟,即首先對19種態(tài)度的10個(gè)韻律參數(shù)平均值運(yùn)行PCA,繼而在此結(jié)果上進(jìn)行層次聚類分析。整個(gè)分析由SPSS軟件對標(biāo)準(zhǔn)化后的樣本數(shù)據(jù)進(jìn)行自動(dòng)運(yùn)算完成。
抽取出的兩個(gè)主成分的累計(jì)方差貢獻(xiàn)率為81.96%。 經(jīng)旋轉(zhuǎn)處理后(此處為最大方差的正交旋轉(zhuǎn)法),第一主成分的主要貢獻(xiàn)者是除基頻斜率之外的基頻參數(shù),以及全句強(qiáng)度域和末尾音節(jié)時(shí)長;第二主成分的貢獻(xiàn)者是全句時(shí)長、首音節(jié)時(shí)長和基頻斜率。
隨后,本文以19種態(tài)度語音分別在第一、二主成分上的因子得分為變量用SPSS軟件對數(shù)據(jù)進(jìn)行了層次聚類分析,用Ward離差平方和法計(jì)算類別之間的距離,歐氏平方距離為組內(nèi)個(gè)體之間的距離。最終,19種態(tài)度語音被分成五個(gè)類別。
為了更直觀的觀察五個(gè)態(tài)度類別與兩個(gè)主成分的關(guān)系,以及19種態(tài)度語音在這兩個(gè)維度上的分布,本文將聚類分析的結(jié)果繪制成圖1。圖中菱形圖標(biāo)代表19種態(tài)度;態(tài)度英文標(biāo)簽下方的數(shù)字表示態(tài)度所屬的組別;維度1(橫軸)和維度2(縱軸)分表代表PCA中的前兩個(gè)主成分。
圖1 19種態(tài)度語音在PCA前兩個(gè)主成分上的分布
由圖1可知,大部分態(tài)度標(biāo)簽沿橫軸分布,跨度較大。其中“驚喜”(POS-S)、“驚愕”(NEG-S)和“吃驚”(NEU-S)位于橫軸的最右端,因此在第一主成分上擁有最大值。與此相反,“妥協(xié)”(RESI)、“失望”(DISA)和“自信”(CONF)則具有最小值?!皟合颉?IDS)位于縱軸的最上端,在第二主成分上有最大值,“親密”(INTI)位于縱軸最下端,因此具有最小值。個(gè)別態(tài)度標(biāo)簽在圖中位置幾乎重合,如:“驚喜”(POS-S)與“驚愕”(NEG-S),“妥協(xié)”(RESI)與“失望”(DISA),“引誘”(SEDU)與“禮貌”(POLI),“權(quán)威”(AUTH)與“陳述”(DECL)。這說明這些態(tài)度語音相互間在韻律特征方面有很強(qiáng)的相似性,這一結(jié)果在一定程度上解釋了這幾對態(tài)度語音在感知實(shí)驗(yàn)中出現(xiàn)的混淆關(guān)系。
此外,5組態(tài)度語音在圖中沿橫軸和縱軸分布,這也反映了它們在基頻、強(qiáng)度和時(shí)長方面的主要特征。
1)第一組:“欣賞”(ADMI)“兒向”(IDS)“蔑視”(CONT)和“懷疑”(DOUB)在基頻、強(qiáng)度和時(shí)長方面均具有較高值;
2)第二組:“權(quán)威”(AUTH)“陳述”(DECL)“妥協(xié)”(RESI)和“失望”(DISA)在基頻、強(qiáng)度和時(shí)長方面均具有較小值;
3)第三組:“確信”(OBVI)“引誘”(SEDU)“禮貌”(POLI)和“自信”(CONF)在基頻和強(qiáng)度方面的特征與第二組相似,但在時(shí)長方面與之有明顯差異,總體時(shí)長較長;
4)第四組:“諷刺”(IRON)和“親密”(INTI)與其他態(tài)度語音相比時(shí)長最短;
5)第五組:“驚喜”(POS-S)“驚愕”(NEG-S)、“吃驚”(NEU-S)“詢問”(QUES)和“發(fā)怒”(IRRI)在基頻和強(qiáng)度方面表現(xiàn)突出,擁有最大值,與第一組較為相似,卻在時(shí)長上數(shù)值較小。
接下來,本文對比各態(tài)度語音類別在各韻律參數(shù)上的平均值來具體觀察五個(gè)類別的主要韻律特征及各類別之間的異同。對比分析結(jié)果如圖2所示。
1.各態(tài)度語音類別的基頻特征
首先,第一組(“欣賞”“兒向”“蔑視”和“懷疑”)和第五組(“驚喜”“驚愕”“吃驚”“詢問”和“發(fā)怒”)在基頻特征方面均有較高基頻值,其中第五組各態(tài)度語音的基頻范圍、全句基頻域、首尾音節(jié)的基頻均值均高于其他四個(gè)小組,說明該類別的態(tài)度語音不但整體調(diào)域較高,而且語調(diào)幅距較大;第一組態(tài)度語音的基頻標(biāo)準(zhǔn)差相比其他組數(shù)值較大,說明該組態(tài)度語音的基頻變化差異明顯。與第一和第五組相反,第二組(“權(quán)威”“陳述”“妥協(xié)”和“失望”)和第三組(“確信”“引誘”“禮貌”和“自信”)的態(tài)度語音在除基頻斜率之外的所有基頻變量上的取值均小于其他三組。
其次,各組基頻斜率均為負(fù)值說明各態(tài)度語音句首基頻值高于句末,全句語調(diào)整體成下降趨勢。第四組態(tài)度語音(“諷刺”和“親密”)的基頻斜率最大,這主要是因?yàn)檫@兩種態(tài)度語音在時(shí)間上用時(shí)最短(見圖2)。
圖2 五個(gè)態(tài)度語音類別在10個(gè)韻律參數(shù)上的平均值。每個(gè)條柱下方的數(shù)字為組別編號;上方的數(shù)字為該類別的平均值。
2.各態(tài)度語音類別的時(shí)長特征
總體來看,第一組態(tài)度語音無論在全句時(shí)長還是首尾音節(jié)時(shí)長均為小組中最大值,雖然與第五組的基頻特征相似,但是在全句時(shí)長和句首時(shí)長特征上與第五組形成差異。第二組和第四組的態(tài)度語音表達(dá)整體上用時(shí)最短,二者的區(qū)分主要體現(xiàn)在基頻特征上。第三組和第五組在時(shí)長上的取值居中,但第五組態(tài)度語音在各基頻變量上的數(shù)值均大于第三組。
3.各態(tài)度語音類別的強(qiáng)度特征
經(jīng)過對比發(fā)現(xiàn),各態(tài)度語音類別在音強(qiáng)表現(xiàn) 無明顯差異。
本文對指定說話人、指定文本的普通話樣本在19種不同態(tài)度下的基頻、時(shí)間、能量特征參數(shù)進(jìn)行了統(tǒng)計(jì)分析,目的在于將19種態(tài)度語音分類并找出各個(gè)類別的主要韻律特征以及不同類別之間的區(qū)別。
以主成分分析為基礎(chǔ)的層次聚類分析將19種態(tài)度語音聚類為五組,但這五個(gè)組從根本上來自兩大主類(圖1),其區(qū)分的主要依據(jù)是態(tài)度語音的基頻特征(圖2)。第一主類的態(tài)度語音具有較高的音高水平(如“驚喜”“欣賞”)、較大的音高跨度(如“驚愕”“懷疑”)以及明顯的音高變化(如“驚訝”“蔑視”);而第二主類的態(tài)度語音的音高水平和跨度以及音高變化則相對較小(如“陳述”“禮貌”“失望”“妥協(xié)”“權(quán)威”)。這一發(fā)現(xiàn)驗(yàn)證了有關(guān)情感韻律與基頻之間的密切關(guān)聯(lián)的猜想(Bolinger 1964、1978; Ohala 1983)。根據(jù)這一猜想,那些表現(xiàn)支配、權(quán)威、信任、攻擊、保護(hù)和斷言的語音往往基頻較低,而表現(xiàn)不屑、友好、不信任、不確定和無禮的語音往往基頻較高。這一猜想后來得到一些學(xué)者的進(jìn)一步印證,如Caelen-Haumont (1991)和Kehrein (2002)在各自的研究中證實(shí):基頻值越高,說話人表達(dá)的“意外”之意越是明顯。此外,態(tài)度語音在聲學(xué)上依據(jù)基頻特征的兩分法分類與感知實(shí)驗(yàn)中態(tài)度語音在聽感上的分類極為相似(盧琰,等,2013),從而體現(xiàn)了基頻特征對于態(tài)度語音解碼的重要性,同時(shí)也解釋了部分態(tài)度語音在聽感上的混淆,如“禮貌”“明確”“自信”與“陳述”,“失望”與“妥協(xié)”,以及“驚喜”“驚愕”“驚訝”“懷疑”和“提問”之間的混淆。
總體上,我們可將五個(gè)態(tài)度類別的韻律特征尤其是在基頻和時(shí)長上的特征做如下概括:
“欣賞”“兒向”“蔑視”和“懷疑”的韻律特征表現(xiàn)在全句和首尾音節(jié)時(shí)間上的延長,并在所有基頻參數(shù)上均具有較大值。
“權(quán)威”“陳述”“妥協(xié)”和“失望”的韻律特征主要是時(shí)長小,基頻值較小。
“確信”“引誘”“禮貌”和“自信”在基頻特征方面整體上與上一組相似,但語速更慢。
“諷刺”和“親密”最明顯的特征是時(shí)長小,語速快,因而整句基頻斜率大。
“驚喜”“驚愕”“吃驚”“詢問”和“發(fā)怒”在韻律上最顯著的表現(xiàn)是全句語調(diào)幅距大,句子和首尾音節(jié)調(diào)域高,末尾音節(jié)時(shí)延長。
同時(shí),在態(tài)度類別內(nèi)部,個(gè)別態(tài)度語音在基頻和時(shí)長上具有明顯區(qū)別性特征:“兒向”語速最慢(Fernald & Mazzie 1991),“親密”用時(shí)最短;“驚喜”“吃驚”和“驚愕”憑借其較高的基頻值與其他態(tài)度區(qū)分開(Caelen-Haumont 1991; Kehrein 2002),而“失望”和“妥協(xié)”則在所有態(tài)度語音中基頻值最??;“自信”與同組(第三組)其他態(tài)度語音相比基頻值較小且時(shí)長更長。