楊 柳
(浙江理工大學(xué) 外國(guó)語(yǔ)學(xué)院,杭州 310018)
寫(xiě)作,作為外語(yǔ)學(xué)習(xí)五大基本技能之一,是考察二語(yǔ)學(xué)習(xí)者中介語(yǔ)發(fā)展的重要方面。Connor(1984)[1]提出詞匯特征更能反映母語(yǔ)和二語(yǔ)寫(xiě)作的差異。Read(2000)[2]曾詳細(xì)探討一篇好的作文應(yīng)當(dāng)具備的詞匯特征。我國(guó)對(duì)二語(yǔ)寫(xiě)作詞匯的探索與中介語(yǔ)研究的發(fā)展相一致。中介語(yǔ)假說(shuō)(Interlanguage Hypothesis)[3]在中國(guó)自1992年開(kāi)始成為學(xué)者研究和討論的中心議題之一[4]。目前的研究更趨于跨學(xué)科、應(yīng)用語(yǔ)料庫(kù)等新工具、注 重實(shí)證[5,6,7]。但仍比較缺少縱向研究(Longitudinal study)。王海華等指出“近幾十年來(lái),對(duì)二語(yǔ)寫(xiě)作中詞匯使用特點(diǎn)的研究引起了越來(lái)越多研究者的興趣。然而針對(duì)詞匯豐富性在中國(guó)英語(yǔ)學(xué)習(xí)者寫(xiě)作中的歷時(shí)研究尚未存在。”[8]“歷時(shí)研究”即中介語(yǔ)領(lǐng)域中的“縱向研究”(1),此類(lèi)研究中,語(yǔ)料積累是難點(diǎn)。在計(jì)算機(jī)技術(shù)被引入語(yǔ)言研究之前,很多學(xué)者嘗試用人工記錄的方法積累語(yǔ)料。20世紀(jì)90年代初期,國(guó)際英語(yǔ)學(xué)習(xí) 者 語(yǔ) 料 庫(kù) (International Corpus of Learner English)開(kāi)始籌建,自此國(guó)內(nèi)外已建成了一批頗有影響的學(xué)習(xí)者語(yǔ)料庫(kù)[9]。本文嘗試以非英語(yǔ)專(zhuān)業(yè)學(xué)生為對(duì)象,基于自建語(yǔ)料庫(kù)和其它學(xué)習(xí)者語(yǔ)料庫(kù)及本族語(yǔ)語(yǔ)料庫(kù),進(jìn)行縱橫兩個(gè)角度的對(duì)比分析,追蹤學(xué)習(xí)者中介語(yǔ)寫(xiě)作中詞匯特征的變化發(fā)展。
中介語(yǔ)的特性之一就是母語(yǔ)的詞條、規(guī)則和次系統(tǒng)傾向保留在與目的語(yǔ)相關(guān)的中介語(yǔ)中,不管學(xué)習(xí)者的年齡有多大,也不管學(xué)習(xí)者接受的解釋和指導(dǎo)有多少,這種傾向都不會(huì)改變,這就是中介語(yǔ)的石化[10]。石化現(xiàn)象按其性質(zhì)可分為暫時(shí)穩(wěn)定化和永久性石化兩種。實(shí)際上不能稱(chēng)暫時(shí)穩(wěn)定化為石化,它是產(chǎn)生石化的預(yù)兆。對(duì)于中等水平的二語(yǔ)學(xué)習(xí)者而言,談到石化似乎言之尚早,與之更為密切相關(guān)的是穩(wěn)定化。通過(guò)對(duì)非英語(yǔ)專(zhuān)業(yè)學(xué)生寫(xiě)作詞匯的穩(wěn)定化趨勢(shì)進(jìn)行追蹤、分析,可以發(fā)現(xiàn)中介語(yǔ)發(fā)展的特點(diǎn),從而提出相應(yīng)的對(duì)策。
具體說(shuō)來(lái),本文在以往同類(lèi)研究的基礎(chǔ)上更進(jìn)一步,嘗試?yán)枚鄠€(gè)語(yǔ)料庫(kù)進(jìn)行縱橫兩個(gè)維度的探索。橫向上,以三個(gè)涵蓋不同時(shí)期語(yǔ)料的學(xué)習(xí)者語(yǔ)料庫(kù)與本族語(yǔ)語(yǔ)料庫(kù)作對(duì)比,從中發(fā)現(xiàn)中國(guó)學(xué)習(xí)者寫(xiě)作詞匯的特點(diǎn)及和本族語(yǔ)的差距。三個(gè)學(xué)習(xí)者語(yǔ)料庫(kù)的語(yǔ)料具有互補(bǔ)性,從而可以預(yù)期綜合得出的代表中介語(yǔ)的數(shù)據(jù)更加客觀,結(jié)論更有說(shuō)服力??v向上,三個(gè)學(xué)習(xí)者語(yǔ)料庫(kù)彼此進(jìn)行比較,由于三個(gè)語(yǔ)料庫(kù)收集的是不同時(shí)期的語(yǔ)料,它們之間的對(duì)比就可以勾勒出我國(guó)英語(yǔ)學(xué)習(xí)者寫(xiě)作詞匯發(fā)展的一幅宏觀圖景,反映整體英語(yǔ)水平的變遷以及英語(yǔ)教學(xué)的成效。
本文所使用的語(yǔ)料庫(kù)為自建非英語(yǔ)專(zhuān)業(yè)學(xué)生寫(xiě)作語(yǔ)料庫(kù)(Written English Corpus of Non-English Majors)、中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)(Chinese Learner English Corpus)、中國(guó)學(xué)生英語(yǔ)口筆語(yǔ)語(yǔ)料庫(kù)(Spoken and Written English Corpus of Chinese Learners),和 NESSIE Corpus Version 1(Native English Speakers’Similarly- and Identicallyprompted Essays)。其中前三個(gè)為中介語(yǔ)語(yǔ)料庫(kù),第四個(gè)為代表本族語(yǔ)的參照庫(kù)。
自建非英語(yǔ)專(zhuān)業(yè)學(xué)生寫(xiě)作語(yǔ)料庫(kù)(WECNEM)為2011年教育部人文社科青年項(xiàng)目成果之一,容量約為50萬(wàn)詞,全部進(jìn)行了詞性標(biāo)注,主要包括兩個(gè)子庫(kù),2009級(jí)學(xué)生作文庫(kù)和2011級(jí)學(xué)生作文庫(kù)。作文均為課后作業(yè),不限完成時(shí)間,所有語(yǔ)料產(chǎn)出時(shí)間為2009年至2012年。該庫(kù)的特點(diǎn)是規(guī)模相對(duì)較小,但優(yōu)勢(shì)是語(yǔ)料新鮮,并且兩個(gè)子庫(kù)分別對(duì)同一批受試在大學(xué)一二年級(jí)產(chǎn)出的作文進(jìn)行了為期兩年的積累,適合進(jìn)行縱向研究。
中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)(CLEC)是國(guó)家社科基金“九五”歸化項(xiàng)目的成果,從1996年開(kāi)始籌集,至2003年正式出版,其中包括大學(xué)一、二年級(jí)非英語(yǔ)專(zhuān)業(yè)學(xué)生的作業(yè)209,043詞次,是我國(guó)最早一批中介語(yǔ)語(yǔ)料庫(kù),產(chǎn)出了大量成果。受試對(duì)象水平與自建語(yǔ)料庫(kù)(WECNEM)相當(dāng),適合縱向比較不同歷史時(shí)期同一水平二語(yǔ)學(xué)習(xí)者的語(yǔ)言發(fā)展特點(diǎn)。此次作為對(duì)比的數(shù)據(jù)主要來(lái)自CLEC中的子庫(kù)ST3和ST4,分別代表四級(jí)和六級(jí)水平的非英語(yǔ)專(zhuān)業(yè)學(xué)生。
中國(guó)學(xué)生英語(yǔ)口筆語(yǔ)語(yǔ)料庫(kù)(WECCL)系南京大學(xué)“211工程”二期子項(xiàng)目,其書(shū)面語(yǔ)料主要從國(guó)內(nèi)9所不同層次的高校英語(yǔ)專(zhuān)業(yè)1~4年級(jí)的學(xué)生中采集。[11]該庫(kù)代表了較高水平的二語(yǔ)學(xué)習(xí)者,與WECNEM和CLEC的語(yǔ)料對(duì)比,可通過(guò)觀察中級(jí)水平和高級(jí)水平學(xué)生的不同表現(xiàn),探索中介語(yǔ)在不同階段的發(fā)展情況。
NESSIE corpus 1.0版是一個(gè)約18萬(wàn)詞次規(guī)模的英美本族語(yǔ)者英語(yǔ)作文語(yǔ)料庫(kù)。其中所收文本主要是英美本族語(yǔ)者依照中國(guó)四六級(jí)、四八級(jí)作文題所撰寫(xiě)的英語(yǔ)作文。也有部分語(yǔ)料文本取自BAWE、MICSUP等英美大學(xué)生語(yǔ)料庫(kù)中話(huà)題近似的文本(2)。該庫(kù)的優(yōu)勢(shì)是作為對(duì)照庫(kù),其語(yǔ)料的主題與我國(guó)的學(xué)習(xí)者語(yǔ)料庫(kù)較為接近,這一點(diǎn)十分難得,可使對(duì)照結(jié)果更為準(zhǔn)確。
1.標(biāo)準(zhǔn)化型次比、平均詞長(zhǎng)和句長(zhǎng)標(biāo)準(zhǔn)差
我們使用 Wordsmith 3.0對(duì) WECNEM 的語(yǔ)料的基本信息進(jìn)行統(tǒng)計(jì),其中包括類(lèi)符/形符比(Type/Token ratio,簡(jiǎn)稱(chēng) TTR,中文亦稱(chēng)型次比),標(biāo)準(zhǔn)化類(lèi)符/型符比(Standard type/Token ratio,簡(jiǎn)稱(chēng)STTR)(3),平均詞長(zhǎng)(Average word length),以及句長(zhǎng)標(biāo)準(zhǔn)差(Standard sentence length)。繼而與三個(gè)對(duì)照庫(kù)進(jìn)行對(duì)比。值得一提的是,CLEC、WECCL和WECNEM的語(yǔ)料分別屬于2002年之前,2005年之前和2009至2012年之間。在時(shí)間上,三個(gè)語(yǔ)料庫(kù)形成了一個(gè)縱向?qū)Ρ?,為研究中?guó)學(xué)習(xí)者中介語(yǔ)的發(fā)展提供了較長(zhǎng)時(shí)間跨度的參考數(shù)據(jù)。
2.常用詞分布模型
建立WECNEM的常用詞分布模型,與對(duì)照庫(kù)進(jìn)行比較。這一目標(biāo),可以通過(guò)詞表分析(Word list)來(lái)實(shí)現(xiàn)。在對(duì)語(yǔ)料庫(kù)文本進(jìn)行的統(tǒng)計(jì)分析中,詞表功能和語(yǔ)篇統(tǒng)計(jì)功能把語(yǔ)料庫(kù)中出現(xiàn)的所有“類(lèi)符”(4)統(tǒng)計(jì)列表。通常可以直觀地提供三種信息:類(lèi)符總數(shù),每個(gè)類(lèi)符的頻數(shù),每個(gè)類(lèi)符的頻率[12]。結(jié)合第一步中統(tǒng)計(jì)的其他基本信息,就能夠得到語(yǔ)料庫(kù)的詞頻分布圖,繪制常用詞分布模型,借助它來(lái)了解二語(yǔ)學(xué)習(xí)者中介語(yǔ)詞語(yǔ)的使用情況。
首先,根據(jù)檢索方案,運(yùn)用 WordSmith Tools 3.0、AntConc3.2等語(yǔ)料庫(kù)檢索軟件對(duì) WECNEM進(jìn)行分析,得到數(shù)據(jù)如下(參見(jiàn)圖1)。
繼而,我們把自建庫(kù)和其他對(duì)比庫(kù)的主要數(shù)據(jù)列表對(duì)比,結(jié)果見(jiàn)表1。
圖1 WECNEM基本數(shù)據(jù)
表1 四語(yǔ)料庫(kù)基本數(shù)據(jù)對(duì)比表
如表1所示,就標(biāo)準(zhǔn)型次比而言,本族語(yǔ)語(yǔ)料庫(kù)最高,英語(yǔ)專(zhuān)業(yè)的學(xué)生次之,自建庫(kù)與CLEC中的ST4,即六級(jí)水平學(xué)生相仿,但高于該庫(kù)中的四級(jí)學(xué)生。至于平均詞長(zhǎng)和句長(zhǎng),本族語(yǔ)都明顯高于學(xué)習(xí)者語(yǔ)料庫(kù)。就三個(gè)學(xué)習(xí)者語(yǔ)料庫(kù)之間進(jìn)行對(duì)比,則發(fā)現(xiàn)自建庫(kù)中的學(xué)生和CLEC中的六級(jí)水平學(xué)生(ST4)更傾向于使用長(zhǎng)句,甚至高于專(zhuān)業(yè)學(xué)生(WECCL),CLEC中的四級(jí)學(xué)生(ST3)的平均句長(zhǎng)最短;至于平均詞長(zhǎng),除本族語(yǔ)使用者外,專(zhuān)業(yè)學(xué)生的數(shù)據(jù)最高,繼而是自建庫(kù),CLEC中的四、六級(jí)學(xué)生相仿,并無(wú)明顯差異。
由于語(yǔ)料庫(kù)代表的是宏觀數(shù)據(jù),因此我們可以從這些基本信息中看到每個(gè)庫(kù)所代表的群體寫(xiě)作的一些整體趨勢(shì)和相互之間的差異。首先,除英語(yǔ)專(zhuān)業(yè)的平均詞長(zhǎng)與本族語(yǔ)接近外,三個(gè)學(xué)習(xí)者庫(kù)的數(shù)據(jù)說(shuō)明了大學(xué)生群體使用的中介語(yǔ)具有一些共性——在詞匯豐富度、平均詞長(zhǎng)和句長(zhǎng)上均低于本族語(yǔ)。
此外,自建庫(kù)的三個(gè)指標(biāo)均明顯高于CLEC中四級(jí)和六級(jí)水平的非英語(yǔ)專(zhuān)業(yè)學(xué)生,標(biāo)準(zhǔn)型次比和平均句長(zhǎng)也高于專(zhuān)業(yè)學(xué)生??紤]到自建庫(kù)與CLEC和WECCL的兩個(gè)明顯差異,即語(yǔ)料覆蓋面和語(yǔ)料產(chǎn)出的時(shí)間,我們做兩點(diǎn)說(shuō)明:第一,自建庫(kù)只包含一所工科院校非英語(yǔ)專(zhuān)業(yè)學(xué)生的語(yǔ)料,因此只能說(shuō)明這所院校學(xué)生的三個(gè)指標(biāo)高于CLEC與WECCL所代表的平均水平;第二,自建庫(kù)包含的語(yǔ)料產(chǎn)出時(shí)間段主要集中在2010年至2012年,而CLEC的語(yǔ)料則屬于1996年至2002年,之間存在十年左右的跨度。由此可以推斷,經(jīng)過(guò)這十年的英語(yǔ)教學(xué)探索與改革和學(xué)生學(xué)習(xí)方式改變,目前學(xué)生寫(xiě)作使用的中介語(yǔ)詞匯更接近本族語(yǔ)。
根據(jù)詞表(Wordlist),我們分別計(jì)算出三個(gè)學(xué)習(xí)者語(yǔ)料庫(kù)和一個(gè)本族語(yǔ)語(yǔ)料庫(kù)使用的前100、500、1000、3000和5000的詞型和詞次比例,得到其在整個(gè)庫(kù)中的分布(6),據(jù)此我們做出四個(gè)語(yǔ)料庫(kù)的詞匯分布對(duì)比圖。為了便于說(shuō)明,我們?nèi)匀话袰LEC中代表四級(jí)和六級(jí)水平的ST3、ST4分開(kāi)計(jì)算,具體結(jié)果參見(jiàn)圖2。
圖2 常用詞分布對(duì)比圖
從圖2可以看出,自建庫(kù)和代表專(zhuān)業(yè)學(xué)生的WECCL兩條曲線(xiàn)數(shù)值相近;CLEC中四級(jí)和六級(jí)水平學(xué)生的兩條曲線(xiàn)數(shù)值相近;并且這四條線(xiàn)的發(fā)展趨勢(shì)(斜率變化)十分相似。代表本族語(yǔ)的淺色線(xiàn)條的發(fā)展趨勢(shì)(斜率變化)則與它們明顯不同。
在桂詩(shī)春、楊惠中的研究[11]中,他們發(fā)現(xiàn),對(duì)本族語(yǔ)語(yǔ)料庫(kù)BROWN和LOB等而言,最常用的5000詞的使用頻次占整個(gè)庫(kù)的90%以下,相反“CLEC有一個(gè)鮮明的特點(diǎn),即積累詞型頻數(shù)的百分比比較大,而占的積累詞次數(shù)也大”(97.6%)。他們對(duì)此現(xiàn)象的解讀是,“這更進(jìn)一步說(shuō)明中國(guó)學(xué)習(xí)者詞匯量有限,他們掌握的詞匯量比較少,而使用面卻比較寬”,“很多詞都在超量使用”。在本文的研究中,我們對(duì)三個(gè)中介語(yǔ)和一個(gè)本族語(yǔ)語(yǔ)料庫(kù)的比較,卻似乎得出一些不同的結(jié)論:
第一,本族語(yǔ)語(yǔ)料庫(kù)NESSIE中的累計(jì)詞頻數(shù)在四個(gè)庫(kù)中居中,并不像BROWN、LOB等低于所有學(xué)習(xí)者語(yǔ)料庫(kù)。對(duì)此,筆者認(rèn)為,NESSIE、BROWN與LOB等語(yǔ)料庫(kù)并不同質(zhì)。布朗語(yǔ)料庫(kù)(Brown Corpus)包括500個(gè)美語(yǔ)樣本,每個(gè)樣本約2000字,涵蓋報(bào)道、社論、傳記等15個(gè)類(lèi)別,庫(kù)容100萬(wàn)詞(7)。作為BROWN的對(duì)照庫(kù)的LOB(Lancaster-Oslo/Bergen)完全遵循BROWN的標(biāo)準(zhǔn),樣本選自英國(guó)英語(yǔ)文本(8)。而NESSIE,如前文介紹,是英美本族語(yǔ)者,主要為大學(xué)生的英語(yǔ)作文語(yǔ)料庫(kù),以議論文為主,庫(kù)容只有18萬(wàn)。因此不難理解BROWN和LOB累計(jì)詞頻數(shù)為什么相對(duì)較低,其原因是因?yàn)槠鋷?kù)容大、題材多。相反,NESSIE的檢測(cè)結(jié)果說(shuō)明,就議論文寫(xiě)作而言,本族語(yǔ)大學(xué)生作者使用的詞匯主要就是最常用的5000詞(94.40%)。
第二,代表英語(yǔ)專(zhuān)業(yè)的 WECCL和自建庫(kù)WECNEM的常用詞覆蓋率最高,分別為97.6%和97.9%,與本族語(yǔ)大學(xué)生寫(xiě)作者(NESSIE)相對(duì)接近。
第三,CLEC中的ST3和ST4二者的常用詞覆蓋率相似,約為87%,反而是四個(gè)庫(kù)中中最低的,這似乎與之前的中國(guó)學(xué)習(xí)者超量使用常用詞的說(shuō)法不符。
針對(duì)以上第二條、第三條兩個(gè)發(fā)現(xiàn),我們需要做更詳盡的分析。首先,前5000常用詞累計(jì)頻次高本身并不能說(shuō)明這5000個(gè)詞被過(guò)度使用。詞頻分布曲線(xiàn)的變化可以揭示出其中規(guī)律。從圖2可以觀察到,代表中介語(yǔ)的四條曲線(xiàn)盡管數(shù)值不同,但變化趨勢(shì)幾乎完全一致,前500詞的斜率最大,之后越來(lái)越小,也就是說(shuō),前500詞的使用次數(shù)最多,覆蓋面最大,之后排位的詞在總詞量里面所占比重很小。而本族語(yǔ)曲線(xiàn)的斜率在500詞之后明顯大于中介語(yǔ)曲線(xiàn),這意味著對(duì)本族語(yǔ)庫(kù)而言,常用詞分布相對(duì)平均,除了最常用的500詞外,詞表中的500至5000詞也占有相應(yīng)比例(29.8%)。因此,中介語(yǔ)使用者存在著高頻使用前500詞的現(xiàn)象,這與“中國(guó)學(xué)習(xí)者超量使用常用詞”的說(shuō)法不矛盾,只是更加細(xì)化。
此外,分別代表四、六級(jí)英語(yǔ)水平的ST3和ST4的前5000詞覆蓋率最低,約為87%。從絕對(duì)值上看,ST3和ST4使用了更多的前5000詞以外的詞匯,但這并不代表這兩個(gè)庫(kù)的學(xué)生使用詞匯的豐富度高于專(zhuān)業(yè)庫(kù)和自建庫(kù)中的非英語(yǔ)專(zhuān)業(yè)學(xué)生。查閱ST3和ST4兩庫(kù)的詞表,可以看到其使用的前5000詞后出現(xiàn)了error,energy,cancel,cast等常用詞,這說(shuō)明ST3和ST4兩庫(kù)的學(xué)生除過(guò)量使用某些常用詞外,可能還存在對(duì)某些常用詞使用不足的問(wèn)題。這與現(xiàn)實(shí)中非英語(yǔ)專(zhuān)學(xué)生大量背單詞但語(yǔ)用能力較低、作文使用生僻詞、出現(xiàn)錯(cuò)誤搭配等現(xiàn)象相一致。
我們進(jìn)一步列出圖2中每個(gè)詞匯標(biāo)志量覆蓋率增加的百分比,就會(huì)更加清晰地看到中介語(yǔ)庫(kù)和本族語(yǔ)庫(kù)的差距。
表2 詞匯覆蓋率增加比
從表2可以看出,中介語(yǔ)詞匯覆蓋率的增幅持續(xù)遞減,本族語(yǔ)詞匯覆蓋率的增幅也在減少,但是幅度小于中介語(yǔ),并且至第3000詞時(shí),其覆蓋率增幅大于前1000詞,說(shuō)明對(duì)本族語(yǔ)使用者而言,前3000詞的使用都較為均衡。換言之,我國(guó)大學(xué)生在寫(xiě)作時(shí)與本族語(yǔ)的差距之一就體現(xiàn)在常用詞第1000至第3000詞的使用上。
本研究主要有三點(diǎn)結(jié)論:首先,盡管水平不同,語(yǔ)料產(chǎn)出時(shí)間不同,但我國(guó)大學(xué)生進(jìn)行英文寫(xiě)作使用的詞匯存在一些中介語(yǔ)的共性特征,如在詞匯豐富度、平均詞長(zhǎng)和句長(zhǎng)上均低于本族語(yǔ);其次,2009年至2012年產(chǎn)生的語(yǔ)料比1996年至2002年產(chǎn)生的語(yǔ)料在上述三個(gè)方面以及常用詞分布上更接近于本族語(yǔ),說(shuō)明目前大學(xué)生的寫(xiě)作詞匯在中介語(yǔ)持續(xù)體上向目標(biāo)語(yǔ)更加靠近;最后,CLEC中的六級(jí)水平學(xué)生的詞匯使用數(shù)據(jù)并沒(méi)有比四級(jí)水平的學(xué)生有明顯提高,自建庫(kù)中的三個(gè)子庫(kù)的數(shù)據(jù)也無(wú)明顯變化,說(shuō)明大學(xué)生在英文寫(xiě)作中,其詞匯運(yùn)用確實(shí)存在穩(wěn)定化的趨勢(shì),是石化的前兆。
綜上,本文對(duì)于英語(yǔ)教學(xué)及研究主要有三點(diǎn)建議:
第一,我國(guó)的英語(yǔ)教學(xué)長(zhǎng)期以來(lái)受到“耗時(shí)低效”的批評(píng),但本文以數(shù)據(jù)為根據(jù)說(shuō)明與十年前相比,當(dāng)前的大學(xué)生英語(yǔ)詞匯習(xí)得能力確有顯著提高,因此建議進(jìn)行更加細(xì)致深入的研究,總結(jié)我國(guó)近年英語(yǔ)教學(xué)中的積極因素,而非一味否定。第二,要正視中介語(yǔ)石化現(xiàn)象,重視穩(wěn)定化階段。根據(jù)Selinker的觀點(diǎn),中介語(yǔ)石化不可避免。本文印證了詞匯習(xí)得的穩(wěn)定化趨勢(shì),在英語(yǔ)教學(xué)及研究中如何推遲穩(wěn)定化比如何避免石化更具有現(xiàn)實(shí)意義。第三,微觀上,本文發(fā)現(xiàn)常用詞第1000至3000詞可能是學(xué)生習(xí)得寫(xiě)作詞匯的關(guān)鍵點(diǎn),可以預(yù)期從此點(diǎn)著手對(duì)延緩詞匯石化會(huì)有顯著效果??梢?jiàn),與傳統(tǒng)方法相比,基于語(yǔ)料庫(kù)的研究變抽象為具體,在英語(yǔ)教學(xué)與研究中有廣闊的應(yīng)用前景,將產(chǎn)生重大的影響。
注釋?zhuān)?/p>
(1)“縱向研究”是指在一段相對(duì)長(zhǎng)的時(shí)間內(nèi)對(duì)同一個(gè)或同一批被試進(jìn)行重復(fù)的研究,定義引自http://baike.baidu.com/view/1351133.htm.
(2)引自許家金博士在語(yǔ)料庫(kù)語(yǔ)言學(xué)在線(xiàn)上的介紹(參見(jiàn)http://www.corpus4u.org/forum/showthread.php?t=8507介紹)
(3)每一個(gè)在語(yǔ)料庫(kù)中首次單獨(dú)出現(xiàn)的詞形稱(chēng)為類(lèi)符(type),而同一個(gè)詞在語(yǔ)料庫(kù)中出現(xiàn)的次數(shù)稱(chēng)為該詞的頻數(shù),又稱(chēng)為該詞的形符(token)。類(lèi)符和形符二者的比率在一定程度上反映了語(yǔ)料庫(kù)詞匯的豐富度。STTR,即每千字的類(lèi)符/型符比則可在每個(gè)語(yǔ)料庫(kù)的容量相差巨大時(shí)做出標(biāo)準(zhǔn)化的比較。
(4)“類(lèi)符”,即“詞型”,是type的不同譯法;“形符”,即“詞次”,是token的不同譯法。
(5)由于NESSIE語(yǔ)料庫(kù)目前由于版權(quán)問(wèn)題尚無(wú)法下載文本,這里取同質(zhì)語(yǔ)料庫(kù)LOCNESS的數(shù)據(jù)替代。
(6)具體計(jì)算方法參見(jiàn)桂詩(shī)春、楊惠中的《中國(guó)學(xué)習(xí)者英語(yǔ)語(yǔ)料庫(kù)》,上海外語(yǔ)教育出版社,2004.
(7)BROWN 語(yǔ)料庫(kù)簡(jiǎn)介參見(jiàn) http://bulba.sdsu.edu/docwiki/BrownCorpus.
(8)LOB 語(yǔ)料庫(kù)簡(jiǎn)介 參見(jiàn) http://en.wikipedia.org/wiki/Lancaster-Oslo-Bergen_Corpus.
成都理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2013年6期