• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    正式性的測量方法和描寫路徑*

    2022-05-31 03:22:12黃勁怡彭宣維
    外語研究 2022年2期
    關(guān)鍵詞:詞項庫中語域

    黃勁怡 彭宣維

    (1.云南師范大學外國語學院,云南 昆明 650500;2.深圳大學外國語學院,廣東 深圳 518060)

    0.引言

    語言的“正式性”(formality)指社交情景的正式程度在語言使用中的體現(xiàn)。(Irvine 1979:773-776;Matthews 1997:133)正式語境(如學術(shù)論文、新聞報道等)中的高頻詞屬于謹慎體(careful style);非正式語境(如日常會話等)下的高頻詞則劃歸到隨意體(casual style);(Richards&Schmidt 2002:209,503,522)兩者之間是一條從(超)正式到(超)非正式的連續(xù)統(tǒng)(Joos 1961;Labov 2006;侯維瑞1988)。然而,正式性層次(level of formality)與語言形式(如詞匯選擇)的對應關(guān)系具有模糊性(Irvine 1979:786;彭宣維2021:24-25),如何用理性、實證的方法把詞項(lexical item)歸入各正式性層次(Rickford&McNair-Knox 1995:265),進而指導語篇正式性的功能描寫成為一個難題(Heylighen&Dewaele 1999;Li et al.2016)。

    第一,如何用客觀數(shù)據(jù)和主觀直覺相平衡的方法(Halliday 2004:23-24;Sinclair 2004),把詞項歸入各正式性層次,進而評測語篇正式度?從研究現(xiàn)狀看,直覺和數(shù)據(jù)兩種取向各自為政。前者多從研究者的語感出發(fā)來確定詞項的正式性(如Joos 1961;程雨民2004等),結(jié)果使語篇標注缺乏可驗證性;后者主要采用F-Score(Heylighen&Dewaele 1999)和ADFScore(Fang&Cao 2009)等測量公式,但它們僅以詞類的數(shù)據(jù)多寡為標準來判斷語篇的正式性,這在多大程度上符合母語者的使用習慣有待明確(Li et al.2016)。

    第二,如何把用詞正式程度和語篇功能描寫結(jié)合起來?先前客觀數(shù)據(jù)和主觀直覺之間的失衡可能導致語篇描寫走向兩種極端:過于強調(diào)研究者的主觀直覺,會導致分析模型的確立缺乏數(shù)據(jù)支持和可驗證性,(Tognini-Bonelli 2001:63-68;McEnery&Hardie 2012:147-162)以此標注并導出的結(jié)果有淪為“直覺式數(shù)據(jù)(intuitive data)”(Sinclair 2004:39-41)的可能;反之,單純倚重現(xiàn)成的語料庫數(shù)據(jù),又容易弱化功能語篇描寫中“理論驅(qū)動式(theory-driven)”理念(Matthiessen&Nesbitt 1996)的優(yōu)勢,難以充分發(fā)揮理論范疇對語篇的解釋力。

    為此,本文從“詞匯選擇體現(xiàn)語篇特征”的角度(Halliday&Hasan 1976:274-292,318-329;Leckie-Tarry 1995:107-131),嘗試構(gòu)擬一套語料庫數(shù)據(jù)驅(qū)動的詞項正式度測量方法,說明設計步驟,對正式、中性和非正式性三個典型范疇予以數(shù)據(jù)支持。這樣的方法能讓大規(guī)模數(shù)據(jù)更多地替代人的語感來為理論范疇提供證據(jù)。(施春宏2017:55)此外,基于小型語料的定性描寫又是理論走向?qū)嵺`的必經(jīng)之路(Martin 2004:341-342),所以我們進一步在兩個語篇案例中演示標注和描寫程序,并在系統(tǒng)功能語言學(SFL)“權(quán)勢↘語體”(POWER↘STYLE)模型的指導下考察語篇中的詞項正式性如何體現(xiàn)交際者之間的權(quán)勢關(guān)系。

    1.測量方法

    一套實證性的詞項正式度測量方法必須具備詳盡的設計步驟及解說。(Heylighen&Dewaele 1999)回顧學界對詞項正式性的測量研究,其判斷依據(jù)已從早期的主觀識別發(fā)展到現(xiàn)今的詞項跨語域分布數(shù)據(jù)(彭宣維2011:145;Liu 2010:77-78)。數(shù)據(jù)驅(qū)動(data-driven)的詞項正式性識別具有實證意義,其內(nèi)核是:詞項之間的正式性差異一直較為模糊,但語域之間的正式性相對容易察覺,所以查看詞項是哪個/些語域的高頻詞可以為其正式度的判斷提供數(shù)據(jù)支持。不過,該方法也有待完善:首先,既然是用語料庫數(shù)據(jù)判定詞項正式性,那么怎樣的語料庫可以保障判定的效度?其次,怎樣的證據(jù)能證明庫中語域之間存在正式度差異?第三,以什么標準檢驗詞項在跨語域分布中的數(shù)據(jù)顯著性,從而使各語域正式度和它的高頻詞匯相聯(lián)系?最后,用何種規(guī)則把數(shù)據(jù)分布規(guī)律轉(zhuǎn)化為抽象范疇,以順應理論驅(qū)動下的語料標注原則?為回答以上疑問,本文吸收Liu(2010)和Davies&Gardner(2010)的有關(guān)經(jīng)驗,探索一套數(shù)據(jù)驅(qū)動的詞項正式性測量方法,把相關(guān)詞項分別歸入正式、中性和非正式范疇下。下文將按該方法的實施步驟逐步給出具體解說。

    1.1 步驟一:選取大規(guī)模的多語域、平衡語料庫為數(shù)據(jù)庫

    數(shù)據(jù)庫的選取需符合如下要求:語域多,則便于提取詞項的語域分布數(shù)據(jù);語域庫的容量和時效平衡,可保障語域分布數(shù)據(jù)之間的可比性;規(guī)模大,才能保證正式性判定結(jié)果的有效性。經(jīng)考察,Corpus of Contemporary American English(COCA)(Davies2008a)能同時滿足以上要求,因此我們選擇它最大庫容的本地詞表作為數(shù)據(jù)來源,即The COCA 100,000 Word List(簡稱“詞表”)(Davies 2008b)。它對應大約4.5億詞的語料,包括10萬個常用詞項在6個不同正式度的語域庫中的標準化頻率(normalized frequency):臺詞對白(SOAP)①、口頭訪談(Spoken_COCA)、虛構(gòu)文學(Fiction_COCA)、流行雜志(Magazine_COCA)、新聞報道(News_COCA)和學術(shù)論文(Academic_COCA)。

    1.2 步驟二:用F-Score對各語域進行正式度測評

    用跨語域數(shù)據(jù)分布判定詞項正式性的前提是語域之間的正式性梯度,即6個語域庫的正式度。為此,我們用F-Score進行計算:

    F-Score=(名詞詞頻+形容詞詞頻+介詞詞頻+冠詞詞頻-代詞詞頻-動詞詞頻-副詞詞頻-感嘆詞詞頻+100)÷2

    下面按具體步驟,說明測算流程。

    首先,在6個語域庫中檢索所需詞類的標準化頻率。如前文所述,F(xiàn)-Score以各詞類的出現(xiàn)頻率來測定語料的正式性,因此我們分別去COCA和SOAP的在線數(shù)據(jù)庫中獲取所需數(shù)據(jù)信息(見表1)。

    然后,我們把各詞類的標準化頻率代入公式,從而獲得6個語域的正式性分值及其間的梯度特征:學術(shù)論文(90.94)>新聞報道(81.46)>流行雜志(79.52)>虛構(gòu)文學(60.54)>口頭訪談(55.25)>臺詞對白(22.27)。這一結(jié)果不僅印證了我們的主觀直覺,也符合學界對語域之間正式性差異的一般認識(侯維瑞1988;Davies 2020等)。

    表1:各詞類在6個語域中的標準化頻率

    1.3 步驟三:按照正式性梯度為語域賦值

    獲得語域正式性的梯度后,我們需要把它轉(zhuǎn)化為抽象數(shù)值,以便后續(xù)詞項正式性的判斷。根據(jù)程雨民(2004:61-67),中性內(nèi)容對應零值,正式對應正值,非正式對應負值;其中正/負值的大小表示正式/非正式程度。我們把65—70的F-Score分值區(qū)間設置為程雨民(同上:47-48)所說的“語域中性區(qū)”,即每個語域之間的共同范圍,它們對詞匯正式性的劃分無顯著影響②;高于該區(qū)間即為正式區(qū):學術(shù)論文(90.94)、新聞報道(81.46)和流行雜志(79.52)賦碼為正數(shù);低于這個區(qū)間則為非正式區(qū):虛構(gòu)文學(60.54)、口頭訪談(55.25)和臺詞對白(22.27)。根據(jù)F-Score的分值梯度,我們可以為它們逐一賦值③:學術(shù)論文(+4)>新聞報道(+3)>流行雜志(+2)>虛構(gòu)文學(-2)>口頭訪談(-3)>臺詞對白(-4)。

    1.4 步驟四:按既定規(guī)則查看詞項在各語域中的分布情況

    當語域之間存在正式性梯度時,各語域中的高頻詞會帶上相應的正式性梯級特征。這符合SFL實例化漸變階(instantiation cline)中概率的實例化原則(Matthiessen 1993)。前文所述的語域正式性賦值,相當于語域/語篇類型的累積概率,為詞項的正式性提供相對頻率。兩者相輔相成:前者是后者的整體引導,后者是前者的具體體現(xiàn)。因此,明確了詞項在某個/些語域中的數(shù)據(jù)顯著性,就可以判定該詞帶有這個/些語域的正式性特征。那么,如何為“數(shù)據(jù)顯著性”提供證據(jù)?這里,我們參照Davies&Gardner(2010:3-7)的做法:如果一個詞項在某語域中的標準化頻率大于或等于它在其他所有語域中頻率之和的兩倍,且有顯著性差異(p<0.05),則可以為該詞賦上該語域的正式性分值。不過,詞項的跨語域分布情況復雜,所以需要細化賦碼規(guī)則,以保證它能把所有情況轉(zhuǎn)化為相應的范疇化數(shù)值。

    1.5 步驟五:根據(jù)詞項的跨語域分布數(shù)據(jù)確立其正式度分值

    首先,要判定詞項是正式、非正式還是中性,就要對比詞項在正式性和非正式性區(qū)域的頻率。當正式區(qū)域的頻率之和大于或等于非正式區(qū)域頻率的兩倍時,詞項就是正式性的,標為“+”,如:

    即:theory這一詞項的跨語域分布狀況為(學術(shù)論文+新聞報道+流行雜志)>(虛構(gòu)文學+口頭訪談+臺詞對白)×2。

    反之,當非正式區(qū)域的頻率之和大于或等于正式區(qū)域的兩倍時,詞項就是非正式性的,標為‘-’,如:

    即:kiddo這一詞項的跨語域分布狀況為(虛構(gòu)文學+頭口訪談+臺詞對白)>(學術(shù)論文+新聞報道+流行雜志)×2。

    如果以上兩種情況都不滿足,則判定為中性,賦碼為0,如:

    即:beautifully這一詞項的跨語域分布狀況為(學術(shù)論文+新聞報道+流行雜志)≯(虛構(gòu)文學+口頭訪談+臺詞對白)×2,且(虛構(gòu)文學+頭口訪談+臺詞對白)≯(學術(shù)論文+新聞報道+流行雜志)×2。

    然后,要為正式和非正式詞項確定刻度。在非正式詞項的數(shù)據(jù)組里,我們對比三組非正式庫的數(shù)據(jù)差異及其顯著性。當詞項在臺詞對白(-4)中的頻次最高且大于等于它在其他非正式庫中總頻率的兩倍時,計為-4,如:

    即:kiddo這一詞項在三個非正式庫中的分布狀況為臺詞對白>(口頭訪談+虛構(gòu)文學)×2。

    如果詞項在口頭訪談(-3)中的頻次最高,且大于或等于它在其他非正式庫中總頻次的兩倍,則計為-3,如:

    即:cop-killer在三個非正式庫中的分布狀況為口頭訪談>(臺詞對白+虛構(gòu)文學)×2。

    當詞項在虛構(gòu)文學(-2)中的頻次最高且大于或等于它在其他非正式庫中總頻次的兩倍時,計為-2,如:

    即:fifity-cent在三個非正式庫中的分布狀況為虛構(gòu)文學>(臺詞對白+口頭訪談)×2。

    如果不屬于以上三種情況,則計為-1,如:

    即:pushy在三個非正式庫中的分布狀況為臺詞對白≯(口頭訪談+虛構(gòu)文學)×2。

    同理,在正式詞項數(shù)據(jù)組里,也對比三組正式語域的數(shù)據(jù)差異:

    如果三組數(shù)據(jù)中沒有出現(xiàn)最大值大于或等于其他兩組數(shù)據(jù)之和的兩倍,則計為+1,如:

    即:proximity在三個正式庫中的分布狀況為學術(shù)論文≯(流行雜志+新聞報道)×2。

    如果詞項在流行雜志(+2)中頻次最高、且大于或等于它在其他正式語域中總頻次的兩倍,計為+2,如:

    即:rewarm在三個正式庫中的分布狀況為流行雜志>(新聞報道+學術(shù)論文)×2。

    當詞項在新聞報道(+3)中頻次最高,且大于或等于該詞在其他正式語域中總頻次的兩倍時,則計為+3,如:

    即:bullishness在三個正式庫中的分布狀況為新聞報道>(流行雜志+學術(shù)論文)×2。

    如果詞項在學術(shù)論文(+4)中高頻出現(xiàn),且大于或等于它在其他正式庫中總頻次的兩倍,計為+4,如:

    即:theory在三個正式庫中的分布狀況為學術(shù)論文>(流行雜志+新聞報道)×2。

    以上述標準,可以從詞項的跨語域分布數(shù)據(jù)推出詞項的正式性,并確立詞匯正式性的連續(xù)統(tǒng)。

    1.6 步驟六:實現(xiàn)詞項正式性的自動測算及其在語料中的半自動標注

    上述方法是在大型語料庫的事實標準(de facto standard)(Leech 2017:1-4)中找到理論范疇的存在依據(jù)(Matthiessen&Nesbitt 1996:46-49,72-80),但范疇的應用還涉及語篇標注的操作細則。為此,我們需要對語料標注的準備工作做一些必要說明。

    首先,利用Visual Basic語言,對前文所述的判定規(guī)則進行編程,批量測算“詞表”中所有詞項的正式度。就語篇中詞項正式性的標注而言,獲取帶有正式性賦碼的“詞表”相當于獲得了一套語料賦碼集(tagset)。

    其次,把語料中的詞項與“詞表”中的詞項進行匹配,并把后者的正式性賦予前者。編程會幫助我們把已經(jīng)完成正式性測算的“詞表”導入已完成詞性標注④的語料,進而把語料中的詞項放入“詞表”中進行自動檢索。當語料中某詞項的形符及其詞類匹配到“詞表”中的某一詞條時,該詞項即被賦上“詞表”詞條所屬的正式性。經(jīng)過試驗,以上路徑能標注出語篇中大多數(shù)詞項的正式度。

    第三,限定語篇標注的范圍,必要時進行人工手動測算和標注。由于我們的方法是通過把新語料放在“詞表”中進行檢索來實現(xiàn)的,所以“詞表”的容量關(guān)乎語料標注的范圍。目前“詞表”只有詞匯級,不涉及搭配帶來的詞組/短語、小句級的正式性,所以標注對象暫時停留在Matthiessen(1991:265-271;1995:110-119)所說的“詞項選擇正式性”上。對于那些語料中包含但不在“詞表”中的詞項,我們在COCA和SOAP在線數(shù)據(jù)庫中手動檢索,并把它們的跨語域數(shù)據(jù)分布情況輸入程序,或做手動計算,保證“詞表”容量覆蓋分析者的所需范圍。

    第四,我們需要標明語篇中詞項標注的范圍及其理據(jù)。根據(jù)Tucker(1998:7-8)和Biber et al.(1999:62)等人的觀點,語篇中實詞的選取是語義驅(qū)動的,而虛詞主要是語法要求的。因此,我們只選擇語篇中的實詞詞項:名詞、動詞、實義形容詞和實義副詞。相應地,本文的探討對象鎖定在語篇中的詞項上,in addition、in turn、right now、go on等固定搭配則暫不予考慮。

    按照以上規(guī)程,我們接下來對兩個語篇中的詞項正式度進行標注,并從相應的理論視角對標注結(jié)果進行人際功能描寫。

    2.描寫路徑

    詞項正式性具有人際范疇的韻律特征(Halliday 1979/2002:205-206),因此以它為對象的語篇描寫需要在一定理論框架和操作規(guī)程的引導下,識別不同正式度的詞項在語篇中所凸顯的形式特征,從中提取規(guī)律并探求其語義體現(xiàn)(Halliday 1971/2002:89-107),最終建構(gòu)語言事實(施春宏2010:3-5;2017:30-43)。

    2.1 理論框架

    “權(quán)勢↘語體”系統(tǒng)(彭宣維2000:154-192;2003:97-100;2011:144-176)是本文賴以提取語篇特征的分析工具。它是SFL人際相度中語言正式性的理論范疇化:語體系統(tǒng)關(guān)注正式性的詞匯語法,權(quán)勢系統(tǒng)關(guān)注相應的語義范疇,語體體現(xiàn)權(quán)勢。權(quán)勢語義包括三個并行的方面:(1)等級性(HIERARCHY),即說話人在話語社團里等級序列上的位置,包括高位(正式)、中位(中性)和低位(非正式)連續(xù)統(tǒng),以及與受話人之間的相互關(guān)系,包括:平等、不平等的“上對下”和“下對上”關(guān)系;(2)莊重性(SOLEMNITY),即說話人的話語在公共(正式)到私下(非正式)、專業(yè)(正式)到俗常(非正式)階列中的位置;(3)親疏性(INTIMACY),即交際者之間的社交心理距離,由疏遠(正式)到親近(非正式),以及這兩極之間的中間范圍,包括對立、中和非對立和投合非對立(同上;黃勁怡2021:88-134)。

    2.2 標注結(jié)果

    詞項的正式性標注能讓我們了解語篇中正式度成分的量化特征;為此,我們以語場相同而語旨、語式相異的兩個語篇⑤為個案進行標注,從中獲取原始數(shù)據(jù)。語篇一總共3,185詞,其中標注詞項為1,769詞;語篇二共4,176詞,標注詞項有1,670詞。文內(nèi)的詞項正式性識別情況見表2。

    表2:兩個語篇中詞項正式性的識別情況:原始數(shù)據(jù)⑥

    為避免兩個語篇的詞數(shù)差異對數(shù)據(jù)可比性可能造成的影響,下面分別從三個方面對原始數(shù)據(jù)加以處理:分布模式(distribution pattern)、語體豐滿度(stylistic fullness)和語體密度(stylistic density)。我們將對比以上三個指標的數(shù)據(jù)結(jié)果,進而總結(jié)它們的共同特征。

    2.2.1 分布模式

    “分布模式”是基于每100詞中各正式度詞項的出現(xiàn)頻率,對不同語篇中的語體詞項分布狀況所做的調(diào)查(見表3)。

    表3:兩個語篇中詞項選擇正式性的分布模式對比⑦

    表3所示,在正式詞項的選擇上,語篇一大于語篇二;就非正式資源看,語篇一小于語篇二;從中性角度說,語篇一小于語篇二。

    2.2.2 語體豐滿度

    “語體豐滿度”是基于語篇中正式性和非正式性詞項選擇的原始數(shù)據(jù),對語體變異的幅度范圍進行測算,從而凸顯語篇之間的語體差異。(程雨民2004)我們這里按先前構(gòu)擬的測算公式(彭宣維2003:244-245)進行:語體正/負豐滿度=(正式/非正式詞項的分值×出現(xiàn)次數(shù))÷語篇總詞數(shù)×100。通過把有關(guān)數(shù)據(jù)代入公式,其語體豐滿度的異同見表4:

    表4:兩個語篇中詞項正式性的語體豐滿度對比

    可見,語篇一的語體幅度是(+75.35,-0.75),而語篇二是(+8.90,-20.34)。前者正式詞項偏高,后者非正式詞項偏高。

    2.2.3 語體密度

    “語體密度”的計算跟“詞項密度”(lexical density)有關(guān)。詞項密度是通過查看實詞在整個句子總詞數(shù)中的占比來測算語篇中每個句子的信息“打包”程度,(Halliday 1985:63-67)而語體密度是進一步考察正式、中性和非正式詞項在詞項密度中的占比,從而說明語體成分在詞項密度中的角色權(quán)重。在獲得兩個語篇詞項密度的前提下⑧,我們從標注結(jié)果中獲取正式、中性和非正式的實詞數(shù)量,然后將上述數(shù)據(jù)代入測算公式:語體密度=(正式/中性/非正式詞項的頻次)÷語篇中句子的數(shù)量÷每句的詞項密度,并導出結(jié)果(見表5)。

    表5:兩個語篇中詞項的語體密度對比

    可見,語篇一的正式、中性和非正式詞項分別占了詞項密度的61.43%、25.40%和0.94%;語篇二中的占比則為18.02%、47.03%和32.03%。

    綜合以上三種計量指標,我們歸納出它們的共同特征:語篇一側(cè)重正式詞項的選用,語篇二更關(guān)注非正式詞項;語篇二比語篇一更注重中性詞項的使用。

    2.3 人際描寫

    根據(jù)統(tǒng)計結(jié)果,高正式性是語篇一最突出的詞匯特征,權(quán)勢語義就存在于作者與“潛在讀者”(putative reader)(巴赫金2009:439-452)的人際關(guān)系之中。

    第一,從等級性看,作者不斷占據(jù)話語權(quán)而讀者無法即刻反饋,以科學研究者的口吻行文,對非專業(yè)背景的受眾設置門檻⑨,從而在語篇中與潛在讀者地位有別,形成不平等的人際關(guān)系。作者謀求居高臨下的權(quán)勢效應(Halliday 1978:154-163)。面對這樣的語體風格,非專業(yè)或教育背景局限的讀者可能無法準確理解專業(yè)語境下的語篇語義(Halliday 1988/2004:158;1989/2004:159-180),從而在作者—讀者關(guān)系中被放在下對上的弱勢地位。

    第二,從莊重性看,語篇涉及了技術(shù)性話題、探索性活動及高分類性語場⑩,所以潛在讀者識讀專業(yè)性語體的能力高低決定了語篇權(quán)勢效用的強弱。作者不斷利用正式性話語向潛在讀者強調(diào)自己的體制性和專業(yè)性,把語篇內(nèi)容建構(gòu)為嚴肅和莊重的議題。對讀者來說,不熟悉該研究領域的人難以理解高正式性措辭背后的相應語義,降低了讀者與作者有效互動的可能性。

    第三,從親疏性看,語篇一屬于技術(shù)性語域、讀者反饋空間不足及話輪轉(zhuǎn)換的缺失都會對潛在讀者造成疏遠的社交心理距離。正式詞項的高頻使用反映了科學語式的典型特征:寫作者自我意識明確,組織計劃性強,話輪由作者一方掌控,不與讀者發(fā)生直接的視聽接觸,總是延遲回復(Martin 1992:528-532;Leckie-Tarry 1995:44-51)。正式語體很容易給讀者帶來疏離感(Halliday 1989/2004):交際雙方的共鳴度弱,從而拉遠了人際距離。

    與此相對,語篇二是選擇非正式詞項更突出的一方,彰顯了口頭對話的固有特性。它涉及四位參與者:一位主持人和三位嘉賓。嘉賓3在每100詞里使用非正式詞項的概率為16.38,占所用實詞的40.6%;嘉賓1的頻率為12.31,占32.4%;嘉賓2為11.56,占28.11%;主持人為9.89,占25.41%。可見,四人都使用了一定量的非正式詞項,由此確立的權(quán)勢語義也有趨同:

    第一,從等級性看,會話人之間是平等的同盟關(guān)系。他們首先通過選用非正式詞項放低自己的角色地位,然后與交際者進行相同語體的交換,實現(xiàn)多方(主持人和嘉賓、說話人和觀/聽眾)的低位結(jié)盟。

    第二,從莊重性看,會話人彼此弱化交際的體制性和專業(yè)性。大量非正式詞項的使用,向受眾傳達了私下和俗常的非莊重性交際意圖,盡可能把議題內(nèi)容表述得讓所有在場者或觀/聽眾易于接受,使所有人能輕松理解語篇語義。

    第三,從親疏性看,會話人彼此結(jié)盟,營造非對立的融洽性。語篇二的語式是說話人視聽接觸頻繁、反饋直接且話輪均分(Martin 1992:508-523),那么非正式詞項的相互交換能拉近人際距離,建立親和的同盟關(guān)系,同時使會話人有效排除語義理解障礙,規(guī)避曲解。

    3.結(jié)語

    本文從正式性層級和詞項之間的模糊性難題入手,一方面提出大型語料庫數(shù)據(jù)驅(qū)動的詞項正式性測量方法,用實證的手段把詞匯資源歸入各正式度范疇,彌補了先前研究中直覺和數(shù)據(jù)失衡所產(chǎn)生的強主觀性和非可驗證性;另一方面把此方法運用到語篇中詞項正式性的標注和計量,并在“權(quán)勢↘語體”模型的指導下描寫語篇的人際意義,顯示了詞項正式性的測量和語篇描寫之間的互補性。在某種意義上,這一嘗試也回應了對SFL的某些詬病,如:理論范疇是直覺屬性的,而非來自數(shù)據(jù)證據(jù)(Tognini-Bonelli 2001:63-66,74);理論范疇的可驗證性有待加強(Butler 1985:92-93)等。大型語料庫數(shù)據(jù)驅(qū)動的測量方法和SFL理論驅(qū)動式描寫路徑之間的界面研究,符合數(shù)據(jù)時代下語言“特征化”刻畫的需求(陸儉明2021)。新方法和經(jīng)典路徑的有機結(jié)合,將更加有益于“語言事實”的挖掘及“語言學事實”的建構(gòu)。

    注釋:

    ①SOAP的語料為美國肥皂劇中的臺詞對白轉(zhuǎn)寫而成,語料產(chǎn)生時間為2001到2012年間,庫容為100,783,900詞,是“極端非正式語言的重要材料”(Davies 2008c)。它為COCA自帶的五個語域庫補足了超非正式端。

    ②程雨民(2004:47-48)把各語域的集合看作連續(xù)統(tǒng),而“中性區(qū)”指這個連續(xù)統(tǒng)的中間階段。根據(jù)我們的F-Score測算結(jié)果,它的區(qū)間應小于正數(shù)區(qū)的最小值(79.52)而大于負數(shù)區(qū)的最大值(60.54)。

    ③這里,語域正式性的賦值梯度是為后續(xù)的詞項正式度賦值做準備。筆者經(jīng)過多次試驗,證明這樣的賦值既符合語域正式性的差異,也便于以此測算詞匯正式度。

    ④我們的數(shù)據(jù)來源COCA和SOAP都采用由蘭卡斯特大學開發(fā)研制的UCREL Claws 7 Tagset進行詞性標注,所以“詞表”也沿用了這一詞性賦碼集。為了使語料中的詞項和“詞表”中的詞項更易于匹配,我們用同樣的賦碼集對語料進行詞性賦碼。

    ⑤兩個語篇的語場都是抗議美國說唱音樂中的厭女觀(misogyny)。其中,語篇一是“Theinfluenceof rap/hip-hop music:amixed-method analysis on audience perceptions of misogynistic lyrics and the issue of domestic violence”,屬于學術(shù)論文語域,其語旨在科研領域內(nèi)的相關(guān)人士之間,語式是書面媒介;語篇二為美國Fox5NY頻道旗下電臺節(jié)目Street Soldiers的其中一期,主題為“Hip-hop and women:has the disrespect gone too far?”,其語域?qū)儆陔娕_訪談,語旨在主持人和三位受訪者(一位說唱歌手、一位唱片打碟師、一位青少年心理疏導從業(yè)者)之間,語式是口頭媒介。綜上,兩個語篇的語場相同而語旨、語式相異。

    ⑥在第二節(jié)的所有數(shù)據(jù)表中,斜體加粗的數(shù)值為所在數(shù)據(jù)組中的最大值;加粗的為數(shù)據(jù)組中的次大值。

    ⑦在第二節(jié)的所有數(shù)據(jù)表中,“刻度”指正式性連續(xù)統(tǒng)中的九個層次,即+4、+3、+2、+1、0、-1、-2、-3、-4;“范疇”指該連續(xù)統(tǒng)中的三個典型范疇,即正式(+4、+3、+2和+1四個刻度的數(shù)據(jù)總和)、中性(0值的數(shù)據(jù))和非正式(-1、-2、-3和-4四個刻度的數(shù)據(jù)總和)。

    ⑧把待考察的兩個語篇導入UAMCorpus Tool 3.3(O’Donnell 2013),提取文本基礎信息:語篇一的句子數(shù)為155,詞項密度為13.0;語篇二有273句,詞項密度為6.3。

    ⑨這三個特征依次表明了語篇一在情景語境層語旨(tenor)三變量中的取向(Halliday&Matthiessen 2014:37-38),即:接觸角色(contact role)、機構(gòu)角色(institutional role)和地位角色(status role)。

    ⑩三個特征依次表明了語篇一在情景語境層語場(field)三變量中的取向(Martin 1992:537-539;Halliday&Matthiessen 2014:35-37),即:活動序列(activity sequence)、活動場(field of activity)和語場可分性(field taxonomy)。

    猜你喜歡
    詞項庫中語域
    動物城堡
    動物城堡
    自然種類詞項二難、卡茨解決與二維框架
    哲學評論(2018年1期)2018-09-14 02:34:18
    智能盤庫在自動化立體庫中的探索和應用
    意義隱喻與語域的關(guān)系——基于自建英語新聞語料庫的研究
    ID3算法在構(gòu)件庫中的應用
    河南科技(2014年10期)2014-02-27 14:09:02
    淺析語域的特性及教學模式探討
    科技視界(2013年23期)2013-08-15 00:54:11
    英語詞項搭配范圍及可預見度
    依據(jù)語篇中多層次信息的句法分析方法
    大家(2011年9期)2011-08-15 00:45:37
    語域語塊與外貿(mào)英語教學
    奉新县| 宾川县| 太原市| 调兵山市| 桦川县| 和政县| 榆中县| 峡江县| 潞西市| 五指山市| 贵港市| 莎车县| 通辽市| 青冈县| 宁明县| 贺兰县| 五大连池市| 澄迈县| 马尔康县| 麟游县| 海兴县| 娱乐| 开远市| 长白| 平山县| 晋宁县| 丽江市| 石嘴山市| 祁东县| 连城县| 商河县| 靖宇县| 资阳市| 北海市| 莆田市| 临泉县| 盘山县| 浠水县| 大同县| 罗山县| 涞水县|