麥春萍 張曉鵬
(北方民族大學(xué)外國語學(xué)院 寧夏·銀川 750021)
在過去二十年中,學(xué)界對第二語言學(xué)術(shù)寫作質(zhì)量與句法復(fù)雜性之間的關(guān)系進行大量深入的研究,發(fā)現(xiàn)句法復(fù)雜性與二語寫作質(zhì)量密切相關(guān)(Crossley et al.,2016ab,Cumming et al.,2005,2006;Grant&Ginther 2000;Kim&Crossley,2016,2018;Schoonen et al.2011;V gelin et al.2019)。隨著語料庫語言學(xué)的不斷發(fā)展,語言學(xué)家指出,語言主要由語法化的詞匯組成(Lewis,1993)。按習(xí)語原則,語言使用者傾向查出大量預(yù)制短語或固定搭配,這些短語和搭配構(gòu)成了語言產(chǎn)出中的單一選擇。換言之,無論是口語還是書面語,人們的語言使用包含了大量的N元詞組短語,例如習(xí)語、搭配、預(yù)制詞組等。考察N元詞組短語在語言發(fā)展中的作用,尤其是對第二語言寫作質(zhì)量的影響具有重要的意義。Coxhead&Byrd(2007)建議,在二語學(xué)術(shù)寫作教學(xué)需要重點關(guān)注N元詞組短語的使用上,并進一步指出二語學(xué)習(xí)者使用N元詞組短語是提高語言產(chǎn)出流利的主要因素。然而,少有研究考察N元詞組短語如何影響二語寫作質(zhì)量,目前僅有Garner et al.(2019)考察了N元詞組短語的頻率和連接強度對韓國英語學(xué)習(xí)者英語議論文寫作質(zhì)量的影響,發(fā)現(xiàn)關(guān)于N元詞組頻率和連接強度可有效預(yù)測二語寫作質(zhì)量。鑒于此,本研究試圖考察N元詞組短語與中國英語學(xué)習(xí)者英語實用文體寫作質(zhì)量之間的關(guān)系。
N元詞組包括詞塊、搭配、預(yù)制詞組等?;谑褂玫恼Z言學(xué)習(xí)理論認(rèn)為,N元詞組的使用頻率和其構(gòu)成詞之間的關(guān)聯(lián)強度是語言使用是否地道的兩個計量指標(biāo)。日常使用的較高頻率的N元詞組更有可能被存整體儲存,在語言產(chǎn)出中會降低提取難度。N元詞組的連接強度是其組成成分之間共現(xiàn)概率的量化,可反映語言使用自然地道的程度。學(xué)界常采用互信息(MI值)和t值量化N元詞組的連接強度(Ellis,Simpson-Vlach,&Maynard,2008;Ellis&Simpson-Vlach,2009;Evert,2004,2009)。MI可有效衡量由低頻詞組成的N元詞組的連接強度,而t值可有效衡量由高頻詞組成的N元詞組。Hsu(2007)發(fā)現(xiàn)中國英語學(xué)習(xí)者議論文寫作質(zhì)量與N元詞組頻率呈正相關(guān)。Granger&Bestgen(2014)發(fā)現(xiàn)中級二語言學(xué)習(xí)者傾向于使用t值較高的N元詞組,而高級二語學(xué)習(xí)者傾向于使用MI值高的N元詞組,他們還發(fā)現(xiàn)二元組的MI值與二語寫作質(zhì)量之間呈正相關(guān)。Garneretal.(2019)也指出,N元詞組的使用頻率和關(guān)聯(lián)強度可有效預(yù)測韓語英語學(xué)習(xí)者議論文的寫作質(zhì)量,即得分較高的論文包含了更多連接強度更高的二元組和三元組。盡管現(xiàn)有的研究很大程度上提升了我們對N元詞組與語言使用關(guān)系的認(rèn)識,尤其是對書面語產(chǎn)出的影響,但此類研究數(shù)量有限,并且主要囿于對二語議論文寫作質(zhì)量的考察。到目前為止,鮮有研究考察N元詞組的頻率和聯(lián)想強度測度與其他文體寫作質(zhì)量的關(guān)系。不同體裁的文本語言特征不同,因此很有必要分析其他文體中N元詞組的使用與寫作質(zhì)量有何關(guān)系。
本研究回答以下兩個研究問題:N元詞組使用頻率在多大程度上可預(yù)測二語實用文體的寫作質(zhì)量?N元詞組關(guān)聯(lián)強度在多大程度上可預(yù)測二語實用文體的寫作質(zhì)量?
本研究抽取中國大學(xué)二年級、三年級學(xué)生限時作文50篇(見表1),文本為求職信,是一種常用的實用文體。被試用300單詞完成寫作任務(wù)。所有文本由研究者進行評分,總分10制,其中內(nèi)容占60%,語言使用占40%。
表1:二語實用文體寫作文本描述性統(tǒng)計
研究采用自然語言處理軟件TAALES 2.0來分析目標(biāo)文本(Kyle&Crossley,2015)。提取了每篇文本中所有N元詞組的使用頻率和聯(lián)系強度。所有頻率和連接強度指標(biāo)值來自英語本族語COCA語料庫(Davies,2009)。使用目標(biāo)語N元詞組使用參數(shù)可有效檢測二語文本中N元詞組使用特征。
本研究采用COCA學(xué)術(shù)子庫中出現(xiàn)的二元組和三元組的原始頻率和對數(shù)頻率。以往研究顯示,高水平的二語寫作者傾向于使用頻率較低的單詞和N元詞組,N元詞組頻率與二語詞匯水平顯著相關(guān)(Garner et al.,2019)。
本研究采用COCA學(xué)術(shù)子庫中出現(xiàn)的二元組和三元組的t值、MI值和P值。前兩者是對N元詞組中單詞之間雙向關(guān)聯(lián)關(guān)系的度量指標(biāo),后者是對N元詞組中單詞之間單向關(guān)聯(lián)關(guān)系(右向)的度量指標(biāo)。此三類指標(biāo)衡量第一個詞和后兩個詞的連接強度。以往研究顯示,此兩類指標(biāo)與二語詞匯水平顯著相關(guān)(Granger&Bestgen,2014)。
首先,研究對N元詞組頻率和連接強度指標(biāo)與使用文體寫作質(zhì)量進行Pearson相關(guān)分析,檢驗此類指標(biāo)是否與文本寫作質(zhì)量顯著相關(guān)。其次,使用逐步回歸模型分析N元詞組頻率和連接強度指標(biāo)對文本寫作質(zhì)量的預(yù)測效應(yīng),然后使用5折驗證檢驗回歸模型的可靠程度。
在4個頻率指標(biāo)與實用文體寫作得分顯著相關(guān)(見表2),說明寫作質(zhì)量較高的文本包含更多實用頻率更低的 N元詞組。由于二元組和三元組對數(shù)頻率和原始頻率存在貢獻文體,逐步回歸分析中只包含與寫作質(zhì)量相關(guān)系數(shù)最高的兩類對數(shù)指標(biāo)。逐步回歸結(jié)果顯示,二元組和三元組頻率對數(shù)可有效預(yù)測應(yīng)用文寫作質(zhì)量差異的14%(r=.37,R2=.137)(見表3)。5折驗證結(jié)果顯示,該模型可以解釋應(yīng)用文寫作質(zhì)量差異的13.4%差異(r=.366,R2=.134),說明此模型可靠。
表2:N元詞組頻率與寫作質(zhì)量相關(guān)系數(shù)
表3:N元詞組頻率與寫作質(zhì)量相關(guān)系數(shù)
在4個N元詞組關(guān)聯(lián)強度指標(biāo)中,二元組連接強度(MI值)、三元組連接強度(MI值)和三元組連接強度(t值)與使用文體寫作得分顯著相關(guān)(見表3),說明寫作質(zhì)量較高的文本傾向于包含更多由低頻率詞構(gòu)成的 N元詞組和右向關(guān)聯(lián)度高的 N元詞組。這5類與寫作質(zhì)量顯著相關(guān)的指標(biāo)不存在共線關(guān)系,因此均參與到逐步回歸分析,結(jié)果顯示二元組連接強度(MI值)和三元組連接強度(t值)可有效解釋約8%的寫作質(zhì)量差異(r=.276,R2=.09)。5折驗證結(jié)果顯示,該模型可以解釋應(yīng)用文寫作質(zhì)量差異的9%差異(r=.30,R2=.09),說明此模型可靠。
本研究初步考察了N元詞組與中國大學(xué)生英語實用文體寫作質(zhì)量的關(guān)系。結(jié)果如下:第一,二元組和三元組對數(shù)頻率和原始頻率與寫作質(zhì)量顯著負(fù)相關(guān),二元組和三元組頻率對數(shù)可預(yù)測應(yīng)用文寫作質(zhì)量差異的14%;第二,二元組MI值、三元組MI值、三元t值與使用文體寫作得分顯著相關(guān),二元組MI值和三元組t值可解釋8%的寫作得分差異量。
第一個研究問題考察N元詞組頻率在多大程度上可以預(yù)測二語應(yīng)用文寫作質(zhì)量。研究發(fā)現(xiàn),二元組和三元組原始頻率和對數(shù)頻率與寫作質(zhì)量呈負(fù)相關(guān)。該結(jié)果與已有發(fā)現(xiàn)相同,N元詞組頻率反映了其在日常語言產(chǎn)出中使用的多寡,使用頻率高的N元詞組頻率容易接受,難度相對較低,反之使用頻率低的N元詞組頻率,難度較大,容易被用在學(xué)術(shù)語篇,適合比較正式的體裁(Bestgen&Granger,2014;Durrant&Schmitt,2009;Groom,2009)。本研究中寫作任務(wù)需要學(xué)習(xí)者描述求職的緣由,自己的條件、特長、求職目標(biāo)。將自己的基本信息、教育背景和工作經(jīng)歷做一個簡單的介紹,描述自己的求職目標(biāo),職業(yè)發(fā)展等。文本所需較多的學(xué)術(shù)詞匯才能達成交際意愿。因此,評分員對文本質(zhì)量的考察較多關(guān)注詞匯使用是否適合目標(biāo)文體。頻率較低的N元詞組正好偏向?qū)W術(shù)化語言,適合應(yīng)用文的學(xué)術(shù)文體。回歸分析顯示,二元組和三元組頻率對數(shù)可有效預(yù)測應(yīng)用文寫作質(zhì)量差異的14%,就詞匯和短語層面,N元詞組頻率是影響應(yīng)用文寫作質(zhì)量的首要因素。
第二個研究問題考察N元詞組連接強度與二語應(yīng)用文寫作質(zhì)量的關(guān)系。研究發(fā)現(xiàn),二元組MI值、三元組MI值、三元組t值與使用文體寫作得分顯著正相關(guān),說明得分較高的文本傾向于包含由低頻詞構(gòu)成的二元組和三元組,包含較多右向關(guān)聯(lián)度高的二元組和三元組。關(guān)聯(lián)強度越高說明詞匯共現(xiàn)的概率越大,常被作為固定詞塊使用的機會就越高,可反應(yīng)語言使用的地道程度。該發(fā)現(xiàn)與上述N元詞組頻率的作用一致,MI值較高的N元詞組傾向于包含頻率較高的詞匯(Gablasova,Brezina,&McEnery,2017;Garner,Crossley,&Kyle,2018)。多元回歸結(jié)果顯示,二元組連接強度(MI值)和三元組連接強度(t值)可有效解釋9%的寫作得分差異量,說明評分員對文本質(zhì)量的考察較多關(guān)注N元詞組中詞匯共現(xiàn)概率的高低,使用的地道性是對寫作質(zhì)量影響的重要標(biāo)準(zhǔn),這與Garneretal.(2019)的發(fā)現(xiàn)基本一致,得分較高的文本中N元詞組的MI值較高,含更高級的詞匯。本研究含發(fā)現(xiàn),三元組t值與寫作質(zhì)量存在正相關(guān)關(guān)系,有效預(yù)測寫作得分2%的差異量,說明寫作得分較高的文本傾向于包含較多的由高頻詞構(gòu)成的三元組。綜合回歸分析顯示,就頻率和關(guān)聯(lián)強度對寫作質(zhì)量的預(yù)測而言,評分員主要關(guān)注的是頻率作用,因為頻率可直接反應(yīng)N元詞組使用的多寡,是否適合目標(biāo)文本文體的語言要求。
本研究考察了N元詞組與二語應(yīng)用文寫作質(zhì)量之間的關(guān)系。結(jié)果表明,二元組和三元組對數(shù)頻率和原始頻率與寫作質(zhì)量顯著負(fù)相關(guān),可有效預(yù)測應(yīng)用文寫作質(zhì)量差異的14%;二元組MI值、三元組MI值三元組t值與使用文體寫作得分顯著相關(guān),可有效解釋9%的寫作得分差異量。上述結(jié)果顯示,N元詞組頻率和關(guān)聯(lián)強度是影響二語應(yīng)用文寫作質(zhì)量的重要指標(biāo)。今后的研究還可以考察N元詞組使用與其他變量(如句法復(fù)雜性等)對其他不同文體(如記敘文等)寫作質(zhì)量的影響,借此全面評估N元詞組對語言產(chǎn)出的影響效應(yīng)。