王 帥
(湖南農(nóng)業(yè)大學(xué) 東方科技學(xué)院,湖南 長(zhǎng)沙 410128)
詞匯是英語(yǔ)學(xué)習(xí)的基礎(chǔ),各級(jí)教學(xué)大綱和各類大型考試,對(duì)英語(yǔ)詞匯量均有一定要求。詞匯量評(píng)估具有檢測(cè)和促進(jìn)學(xué)生英語(yǔ)學(xué)習(xí)的作用。桂詩(shī)春(1985:1)提出,對(duì)一個(gè)學(xué)生的英語(yǔ)詞匯量的統(tǒng)計(jì)尚沒(méi)有科學(xué)的可行方法,除非被試的詞匯量很有限,但對(duì)某一群體的詞匯量作粗略的統(tǒng)計(jì)確是可行的。以往研究將詞匯量測(cè)試分為“廣度測(cè)試”和“深度測(cè)試”兩大類,分別考查學(xué)生的“獲得性(receptive)詞匯量”和“產(chǎn)出性(productive)詞匯量”。因“廣度測(cè)試”具有較強(qiáng)的操作性,以往的幾次大規(guī)模詞匯量調(diào)查都是采用“廣度測(cè)試”。
國(guó)內(nèi)外詞匯量廣度調(diào)查的方法主要分為兩大類:一類是采用Nation于1983年建立,在1993年進(jìn)行了改良的“英語(yǔ)水平測(cè)試題”(Vocabulary Levels Test,以下簡(jiǎn)稱VLT),例如,Read(1988),Warning(1997),Laufer(1998)。另一類是分層隨機(jī)抽樣法,例如:桂詩(shī)春(1983),解放軍外國(guó)語(yǔ)學(xué)院英語(yǔ)測(cè)試中心(1986),邵華(2002),楊端和(2010)。比較兩類方法,共同點(diǎn)都是根據(jù)詞頻,建立分級(jí)詞庫(kù),然后從中抽樣測(cè)試,進(jìn)而預(yù)測(cè)受試者詞匯量;不同之處在于前者采用的是已被驗(yàn)證信度較高的固定樣題作為測(cè)試手段,后者采用隨機(jī)抽樣進(jìn)行測(cè)試。采用分層隨機(jī)抽樣法,優(yōu)勢(shì)非常明顯,有利于對(duì)受試者進(jìn)行歷時(shí)研究,也有利于同一受試者多次測(cè)驗(yàn),利用計(jì)算機(jī)技術(shù)的分層隨機(jī)抽樣法是目前研究趨勢(shì)。
詞匯量的計(jì)算公式通常為(正確題目數(shù)量/總題目數(shù)量)×詞庫(kù)詞匯總量,由此可見,詞庫(kù)的詞匯總量,對(duì)結(jié)果影響較大。以往研究中,不僅詞匯量測(cè)試結(jié)果數(shù)值差異較大,對(duì)結(jié)果的限定也不明確:利用Nation 等人建立的VLT 進(jìn)行測(cè)試的研究結(jié)果限定為若干“詞族”(word family),其他的未給出明確限定(或應(yīng)理解為“常用詞”)。
本文綜合以往研究,結(jié)合中國(guó)學(xué)生英語(yǔ)詞匯學(xué)習(xí)特點(diǎn),討論如何構(gòu)建適合中國(guó)英語(yǔ)學(xué)習(xí)者詞匯量測(cè)試的詞庫(kù)。
母語(yǔ)為英語(yǔ)的大學(xué)畢業(yè)生的詞匯量約為20000 詞族(Nation 2001:9;Schmitt 2007:828),如果將此作為我國(guó)英語(yǔ)學(xué)習(xí)者的目標(biāo),恐怕遙不可及,顯然,學(xué)習(xí)的重點(diǎn)應(yīng)該是英語(yǔ)中的常用詞。為此,人們一直在編制常用詞表(McCarthy 1999;Reda 2003)。同時(shí),為了提高常用詞表的可靠性,詞頻統(tǒng)計(jì)被廣泛研究與應(yīng)用。從上世紀(jì)60 年代的人工統(tǒng)計(jì),到如今的計(jì)算機(jī)語(yǔ)料庫(kù)統(tǒng)計(jì),使高頻詞(普遍把高頻詞視為常用詞)表的準(zhǔn)確性得到保證。
測(cè)試用的詞庫(kù)中,詞目類型應(yīng)為詞族還是常用詞呢?王文斌(2002)對(duì)英語(yǔ)詞匯中的屈折詞和派生詞進(jìn)行了詳盡的分類和定義,指出“屈折詞屬于語(yǔ)法變化系列,而派生詞則屬于新詞構(gòu)建系列”。理想的詞族分類是將某一基礎(chǔ)詞及其各種屈折詞和派生詞歸為一個(gè)詞族。Laurie Bauer等(1993)提出了根據(jù)不同類型和難度,將詞族分為七個(gè)等級(jí),其中,屈折變化屬于第2等級(jí),其余5個(gè)等級(jí)均為不同類型的派生變化。顯然,如果只選用某一詞族的基礎(chǔ)詞來(lái)測(cè)試英語(yǔ)學(xué)習(xí)者,無(wú)法判斷其對(duì)該詞族中各個(gè)派生詞的掌握程度,因而無(wú)法判斷是否掌握了該詞族。另一方面,如果將某一詞族中所有屈折詞和派生詞列舉出來(lái),進(jìn)行測(cè)試,其結(jié)果很可能是掌握了其中的一部分,只能判斷對(duì)該詞族的掌握程度,但不能給出“掌握”還是“沒(méi)掌握”這樣的絕對(duì)判斷。況且,詞匯量測(cè)試只能采取有限抽樣的方法,不可能枚舉每個(gè)詞族的所有屈折詞和派生詞,因此將詞族作為測(cè)試目標(biāo)和結(jié)果是不具有操作性的。此外,每個(gè)詞族的基礎(chǔ)詞在詞頻上不一定高于它的屈折詞或派生詞,如“teach”的詞頻,低于“teacher”,也低于“teaching”,說(shuō)明在實(shí)際的詞匯學(xué)習(xí)中,學(xué)習(xí)者先掌握的不一定是各個(gè)基礎(chǔ)詞,很可能是其屈折詞或派生詞??紤]到中國(guó)學(xué)生在初中階段已經(jīng)掌握了全部的屈折變化規(guī)律,詞目的選取應(yīng)該將某一詞族的基礎(chǔ)詞和其派生詞視為不同的詞條,以這樣的詞目作為測(cè)試,測(cè)試結(jié)果也更符合“詞匯量”的概念。
Nation(2005),Pearson(2003)等人的研究表明,認(rèn)識(shí)詞頻最高的100 個(gè)詞,就能識(shí)別一個(gè)英語(yǔ)語(yǔ)篇中總詞數(shù)的一半,詞頻最高的3000 詞占到該語(yǔ)料庫(kù)的86%的詞次。Nation(2001)將英語(yǔ)詞匯分為四個(gè)等級(jí):高頻詞(即Michael West 英語(yǔ)通用詞表中的2000 詞族)、學(xué)術(shù)詞匯(即Coxhead 的570 個(gè)詞族的學(xué)術(shù)詞匯)、專業(yè)技術(shù)詞匯和低頻詞匯。其中高頻詞匯加上學(xué)術(shù)詞匯,共2256 個(gè)詞族,在學(xué)術(shù)文中可達(dá)到85%以上的覆蓋率,非學(xué)術(shù)文本可達(dá)90%左右。英語(yǔ)詞匯的總體分布特點(diǎn)為:詞頻越高的詞數(shù)量越少,詞頻越低的詞數(shù)量越多。如果單從詞頻角度劃分常用詞,劃分方法決定了常用詞詞表中的詞目數(shù)量??梢姡S迷~的范圍應(yīng)該是一個(gè)相對(duì)、動(dòng)態(tài)的概念,應(yīng)根據(jù)不同的學(xué)習(xí)者和不同的學(xué)習(xí)階段而定。初、中、高級(jí)學(xué)習(xí)者的常用詞范圍不同,聽說(shuō)和讀寫的常用詞范圍也有很大差異。因此,為保證詞匯量測(cè)試的合理性,首先要確定適合受試者群體的詞庫(kù)范圍。
以往有研究者將受試者詞匯量與詞頻量直接進(jìn)行比較,例如,楊端和等結(jié)合一些國(guó)家和地區(qū)英語(yǔ)教學(xué),大綱對(duì)詞匯的要求以及我國(guó)大學(xué)、中學(xué)英語(yǔ)教學(xué)大綱對(duì)詞匯量的要求,推算我國(guó)高級(jí)英語(yǔ)學(xué)習(xí)者所掌握的英語(yǔ)詞匯大致在10000~13000個(gè)左右,以此推斷為基礎(chǔ),將測(cè)試的上限定為15000詞(胡加圣,2010)。這樣確定總體大小缺乏說(shuō)服力,因?yàn)榫邆淠骋辉~匯量的學(xué)習(xí)者,其掌握的詞匯詞頻上的分布要廣泛得多,如:鄧昭春(2001)提出“掌握2400詞匯的新生,在入學(xué)時(shí)已經(jīng)掌握了一些詞頻級(jí)在3000至5000的詞匯”。但楊端和對(duì)詞庫(kù)的處理方法值得借鑒。他從Wordsmith語(yǔ)料庫(kù)中提取出現(xiàn)頻數(shù)最高的20000詞的詞頻表作為選詞和設(shè)計(jì)試題的原始詞匯。然后對(duì)該詞表進(jìn)行了處理,如:排除所有的人名、地名;排除所有的功能-語(yǔ)法詞;排除所有內(nèi)容-實(shí)義詞的同源詞;排除單數(shù)-復(fù)數(shù)形式同時(shí)出現(xiàn)時(shí)的復(fù)數(shù)名詞;動(dòng)詞一名詞同時(shí)出現(xiàn)在詞頻表中,排除所有名詞形式;某個(gè)詞的形容詞一副詞形式同時(shí)出現(xiàn)在詞頻表中,排除所有的副詞形式;同時(shí)還排除了所有非詞符號(hào),如“#”,“@”及“&”等。篩選后的詞表,作為設(shè)計(jì)詞匯量測(cè)量的詞庫(kù)。
解放軍外國(guó)語(yǔ)學(xué)院英語(yǔ)測(cè)試中心(1986)采用的是Edward L.Thorndike and Irving Lorge 所著的The teacher's word book of 30000 words。黃建濱等2004 年使用了J.Sinclair 的Collins COBUILD English Dictionary 中所列的14585 個(gè)帶星號(hào)的高頻詞,對(duì)其進(jìn)行隨機(jī)抽樣。
綜上,無(wú)論詞庫(kù)的語(yǔ)料取材源自何處,詞匯測(cè)試設(shè)計(jì)者的選詞原則基本相同,即:1.詞匯的選取要考慮詞頻因素。2.詞庫(kù)中的詞目應(yīng)避免重復(fù)和屈折詞。3.詞庫(kù)的上限應(yīng)能夠充分覆蓋高級(jí)學(xué)習(xí)者的詞匯量。
喻愛菊(1991)采用《大學(xué)英語(yǔ)教學(xué)大綱》詞匯表進(jìn)行了測(cè)試。此類采用教學(xué)大綱或考試大綱作為詞庫(kù)的測(cè)試方法,應(yīng)該說(shuō),是符合中國(guó)學(xué)生英語(yǔ)學(xué)習(xí)以課堂為主,以考試為導(dǎo)向的特點(diǎn)的,該詞庫(kù)范圍能夠覆蓋受試者已學(xué)和面臨的考試所需的詞匯,更有利于給出精確的測(cè)試結(jié)果和檢驗(yàn)學(xué)習(xí)效果。而且分析以往國(guó)內(nèi)詞匯量測(cè)試研究的結(jié)果,如1982、1983 年,《大學(xué)英語(yǔ)教學(xué)大綱》設(shè)計(jì)組,進(jìn)行了全國(guó)范圍的大學(xué)新生詞匯量調(diào)查,確定了當(dāng)時(shí)大學(xué)新生詞匯量為1600 詞。如,解放軍外國(guó)語(yǔ)學(xué)院英語(yǔ)測(cè)試中心1986,四川調(diào)查工作組1987。1996、1997 年,《大綱》項(xiàng)目組對(duì)各地大學(xué)新生詞匯量進(jìn)行了大規(guī)模調(diào)查,得出了“大學(xué)新生的入學(xué)詞匯量平均達(dá)1800 詞”的結(jié)論。以往針對(duì)非英語(yǔ)專業(yè)學(xué)生所作的調(diào)查結(jié)果,鄧昭春的結(jié)果為3500、周大軍等為2404、邵華為2574,國(guó)家教委的一個(gè)項(xiàng)目組對(duì)國(guó)內(nèi)12 所重點(diǎn)大學(xué)新生的調(diào)查結(jié)果為2006。本文發(fā)現(xiàn),以往對(duì)大學(xué)新生的詞匯量測(cè)試結(jié)果,大部分都明顯小于高中大綱詞匯中3000 左右的詞匯數(shù)量,對(duì)大學(xué)生的測(cè)試結(jié)果小于大學(xué)英語(yǔ)四級(jí)考試大綱中約4500 的詞匯量。因此,從“充分覆蓋”和“符合學(xué)習(xí)規(guī)律”角度來(lái)講,采用大綱詞匯作為詞庫(kù)有其合理性和實(shí)用性。
那么國(guó)內(nèi)各類大綱詞匯表在詞頻上的分布規(guī)律如何?能否滿足“高頻詞”原則呢?本文搜集了國(guó)內(nèi)最新初中英語(yǔ)大綱詞匯表(1593 詞)、高中英語(yǔ)大綱詞匯表(2893 詞)、大學(xué)英語(yǔ)四級(jí)大綱詞匯表(4580 詞)以及GRE 詞匯表(7295 詞),并利用計(jì)算機(jī)編程對(duì)它們?cè)谠~頻上的數(shù)量分布情況作了統(tǒng)計(jì),結(jié)果見圖1.
圖1
本文采用的詞頻數(shù)據(jù)源自Mark Davies 等(2010)基于收錄了4 億詞的當(dāng)代美語(yǔ)語(yǔ)料庫(kù)(Corpus of Contemporary American English,COCA),整理的五百萬(wàn)個(gè)詞條的美語(yǔ)詞頻表(Word frequency list of American English)。
圖1表明,初、高中英語(yǔ)及CET4大綱詞匯在詞頻上分布規(guī)律相似,在詞頻最高的前1千詞中分布的數(shù)量最多,之后開始急劇衰減,到3萬(wàn)詞頻之后,罕有分布。而GRE詞匯的分布較為平均,在1萬(wàn)詞頻左右之前緩慢上升,隨后逐漸下降,并未出現(xiàn)國(guó)內(nèi)大綱詞匯的分布規(guī)律,說(shuō)明GRE詞匯表已經(jīng)剔除了大部分高頻詞。圖1也表明了我國(guó)各級(jí)大綱詞匯的制定在詞頻分布角度看非常合理,集中在高頻詞階段。
同時(shí),圖1也反映出兩個(gè)問(wèn)題:1.國(guó)內(nèi)高一級(jí)的考試大綱詞匯表剔除了低一級(jí)詞匯表中的部分高頻詞,因此將各級(jí)詞匯表合成一個(gè)詞表(以下簡(jiǎn)稱“合成詞匯表”)應(yīng)該更加有效。2.即便是4千左右詞匯量的學(xué)習(xí)者,其掌握的詞匯在1萬(wàn)-2萬(wàn)詞頻上還有較多分布,說(shuō)明只采用合成詞匯表作為測(cè)試詞表,很難反映出課堂以外的詞匯學(xué)習(xí)情況,不利于高級(jí)英語(yǔ)學(xué)習(xí)者進(jìn)行測(cè)試。
為此,本文首先對(duì)合成詞匯表(5021詞)在詞頻上的分布進(jìn)行了分析比較,結(jié)果見圖2.
圖2
圖2 表明,合成詞匯表的分布規(guī)律與CET4詞匯表極為相似,說(shuō)明我國(guó)各級(jí)考試大綱詞匯充分包含了低一級(jí)的大綱詞匯。
接下來(lái),本文為了驗(yàn)證用合成詞匯表作為詞庫(kù)的不足,將國(guó)內(nèi)外普遍采用的兩個(gè)版本的Paul Nation測(cè)試題與合成詞匯表進(jìn)行對(duì)比分析。
(一)采用Batia Laufer和Paul Nation與1999年改良的測(cè)試表,該表分為2000詞級(jí)、3000詞級(jí)、5000詞級(jí)、大學(xué)詞匯及10000詞級(jí)。該表的作者提出,如果每級(jí)測(cè)試的結(jié)果高于83%,則說(shuō)明受試者的詞匯量處于或高于該詞級(jí)。本文對(duì)比分析的內(nèi)容為該表2000、3000及5000詞級(jí)中的題目詞匯在合成詞匯表中的存在比例,結(jié)果見表1。
表1
其次,采用的是Paul Nation(2007)發(fā)布的,1000至14000詞級(jí)的測(cè)試表。該表每1000詞級(jí)為一組,每組10個(gè)選擇題目。該表作者提出,受試者的詞匯量為正確題目數(shù)量乘以100,即為該受試者的詞匯量。本文對(duì)比分析的內(nèi)容為該表1000至5000詞級(jí)題目詞匯在合成詞匯表中的存在比例,結(jié)果見表2。
?
表2
上述對(duì)比分析表明,利用國(guó)內(nèi)英語(yǔ)教學(xué)大綱詞匯合成的詞匯表,對(duì)2000以內(nèi)的常用詞(高頻詞)的測(cè)試能力強(qiáng),并且能夠得出與當(dāng)前國(guó)際流行的測(cè)試方法相近的結(jié)果。但從3000詞級(jí)開始,測(cè)試差異將逐漸明顯,達(dá)到5000詞級(jí)以后,差異將非常顯著,這也反映出我國(guó)英語(yǔ)學(xué)習(xí)者的詞匯學(xué)習(xí)特點(diǎn),與英語(yǔ)為母語(yǔ)或?yàn)榈诙Z(yǔ)言的學(xué)習(xí)者之間所掌握詞匯的差異。同時(shí)也表明,本文提出的合成詞匯表,對(duì)于初、中級(jí)學(xué)習(xí)者的詞匯量測(cè)試來(lái)說(shuō)有效,但對(duì)于高級(jí)學(xué)習(xí)者則不適用。
針對(duì)高級(jí)英語(yǔ)學(xué)習(xí)者,理想的測(cè)試詞庫(kù)應(yīng)是處理、篩選后的基于語(yǔ)料庫(kù)的詞頻表,比較當(dāng)前國(guó)際最權(quán)威的兩個(gè)語(yǔ)料庫(kù),英國(guó)國(guó)家語(yǔ)料庫(kù)(British National Corpus,BNC)和當(dāng)代美語(yǔ)語(yǔ)料庫(kù)(Corpus of Contemporary American English,COCA),COCA更新(更新到2012年夏季),涵蓋的素材種類更廣泛(包括口語(yǔ)、小說(shuō)、報(bào)紙、雜志、學(xué)術(shù)文章等)??傮w來(lái)說(shuō),在前5000高頻詞中,COCA和BNC兩者間有10%的差異,在更低的詞頻中,差異有30%-35%(http://www.wordfrequency.info/)。因此,選用不同的語(yǔ)料庫(kù),對(duì)于高級(jí)英語(yǔ)學(xué)習(xí)者的測(cè)試結(jié)果會(huì)有一定影響,但對(duì)初、中級(jí)學(xué)習(xí)者的測(cè)試結(jié)果影響不大。
本文指出詞匯廣度測(cè)試中,詞庫(kù)的選取非常重要,對(duì)測(cè)試結(jié)果有直接影響,但并不存在絕對(duì)標(biāo)準(zhǔn),需根據(jù)受試者實(shí)際情況選取最為合適的詞表作為詞庫(kù)。對(duì)于詞匯量較低的(3000以下)中國(guó)英語(yǔ)學(xué)習(xí)者,合成大綱詞匯表是比較理想的測(cè)試詞庫(kù);對(duì)于高級(jí)學(xué)習(xí)者,利用COCA中的詞頻表,運(yùn)用楊端和等的篩選方法,組建測(cè)試詞庫(kù)是比較理想的選擇。對(duì)于測(cè)試的詞目和結(jié)果,本文認(rèn)為應(yīng)該將某一詞族的基礎(chǔ)詞和其派生詞列為不同的詞條,以這樣的詞目作為測(cè)試,測(cè)試結(jié)果更符合“詞匯量”的概念。本文討論了詞匯量廣度測(cè)試中的一個(gè)要素—詞表的構(gòu)建,提出了詞目和詞庫(kù)的確定原則,并進(jìn)行了相關(guān)實(shí)驗(yàn)檢測(cè),為基于計(jì)算機(jī)和網(wǎng)絡(luò)的詞匯量測(cè)試研究奠定了一定基礎(chǔ)。
[1]Bauer,L.& P.Nation.Word families[J].International Journal of Lexicography,1993,6/3:253-279.
[2]Meara P.The dimensions of lexlcal competence[C].Competence and Performance in Language Learlng.Cambridge:Cambridge University Press,1996:35-53.
[3]Nation,P.Using dictionaries to estimate vocabulary size:Essential but rarely followed procedures[J].Language Testing,1993,10/1:27-40.
[4]Nation,I.S.P.& Beglar,D.A vocabulary size test[J].The Language Teacher,31(7),9-13.
[5]Nation,I.S.P.Teaching and learning vocabulary[M].New York:Newbury House,2007.
[6]Nation,I.S.P.Learning vocabulary in another language.English Language Institute Occasional Publication No.19[M].Wellington,NZ:Victoria University of Wellington,1999.
[7]大學(xué)英語(yǔ)四級(jí)考試大綱[Z].上海:上海外語(yǔ)教育出版社,2006.
[8]鄧昭春.英語(yǔ)詞匯量調(diào)查問(wèn)題探討:兼評(píng)一份全國(guó)詞匯量調(diào)查表[J],外語(yǔ)教學(xué)與研究,2001(1):57-62.
[9]鄧昭春,曾中平.本科生英語(yǔ)詞匯量調(diào)查與教學(xué)思考[J].外語(yǔ)與外語(yǔ)教學(xué),1998,(10).
[10]桂詩(shī)春.中國(guó)學(xué)生英語(yǔ)詞匯量調(diào)查[A].公共外語(yǔ)教學(xué)研究文集[C].上海:上海外語(yǔ)教育出版社,1983.
[11]桂詩(shī)春.我國(guó)英語(yǔ)專業(yè)學(xué)生詞匯量的調(diào)查與分析[J].現(xiàn)代外語(yǔ),1985,(1).
[12]桂詩(shī)春.詞匯測(cè)試中猜測(cè)問(wèn)題新探[A].陸國(guó)強(qiáng).現(xiàn)代英語(yǔ)研究[C].上海:復(fù)旦大學(xué)出版社,1997.
[13]解放軍外國(guó)語(yǔ)學(xué)院英語(yǔ)測(cè)試中心.建立分級(jí)詞匯,調(diào)查學(xué)生詞匯量[J].外語(yǔ)教學(xué)與研究,1986,(3).
[14]邵華.普通高師院校學(xué)生大學(xué)英語(yǔ)四級(jí)階段詞匯水平實(shí)證研究[J].外語(yǔ)教學(xué)與研究,2002,(6).
[15]四川省調(diào)查工作組.中學(xué)英語(yǔ)教學(xué)的現(xiàn)狀:四川省調(diào)查報(bào)告摘要[J].外語(yǔ)教學(xué)與研究,1987,(4).
[16]汪慶華.關(guān)于我國(guó)大學(xué)生英語(yǔ)詞匯量的初步探討[J].外語(yǔ)界,1998,(2).
[17]吳始年.數(shù)量分析在測(cè)試及應(yīng)用語(yǔ)言學(xué)中的局限性[J].外語(yǔ)教學(xué)與研究,1997,(4).
[18]周大軍,等.大學(xué)英語(yǔ)學(xué)生4 級(jí)階段詞匯量狀況調(diào)查[J].外語(yǔ)與外語(yǔ)教學(xué),1999,(12).
[19]周大軍,文渤燕.理工科學(xué)生英語(yǔ)詞匯量狀況全程調(diào)查[J].外語(yǔ)教學(xué)與研究,2000,(5).