徐 海
(廣東外語外貿(mào)大學(xué)外國語言學(xué)及應(yīng)用語言學(xué)研究中心 廣州 510420)
對外語學(xué)習(xí)者產(chǎn)出的語言錯誤進行診斷、分類和系統(tǒng)解釋,并不是一種新的研究手段。Corder于上世紀(jì)六七十年代就提出錯誤分析(error analysis)這一概念,指出可通過調(diào)查語言錯誤了解中介語的發(fā)展過程。學(xué)習(xí)者語料庫(learner corpus)的誕生,為大規(guī)模、系統(tǒng)的錯誤分析注入了新的活力,為新一代學(xué)習(xí)型詞典編纂奠定了基礎(chǔ)?!把芯繉W(xué)習(xí)者語料庫,即研究大多數(shù)學(xué)習(xí)者易犯的各種錯誤類型,所得到的結(jié)果對ESL詞典編纂確實產(chǎn)生了很大的影響?!盵1]
學(xué)習(xí)者語料庫由外語學(xué)習(xí)者產(chǎn)出的書面語和口語語料構(gòu)成,語料通常來源于非本族語學(xué)生的作業(yè)或考試答卷,其建立是為了揭示外語學(xué)習(xí)者與本族語者之間的語言差異以及第二語言的發(fā)展規(guī)律。在建設(shè)學(xué)習(xí)者語料庫時,應(yīng)當(dāng)考慮學(xué)習(xí)者因素和任務(wù)因素的影響。[2]學(xué)習(xí)者因素包括其年齡、二語水平、母語背景等;任務(wù)因素含語料的類型(作文、信函、考試答卷等)、語料的文體風(fēng)格、語料覆蓋的話題等。國際上比較著名的英語學(xué)習(xí)者語料庫包括1200萬詞次的朗文學(xué)習(xí)者語料庫(Longman Learners'Corpus,LLC)[3]、3500萬詞次的劍橋?qū)W習(xí)者語料庫(Cambridge Learner Corpus,CLC)[4]和約400萬詞次的國際學(xué)習(xí)者英語語料庫(International Corpus of Learner English,ICLE)[5]。我國也于上世紀(jì)90年代開始重視學(xué)習(xí)者語料庫的開發(fā),比較著名的有廣東外語外貿(mào)大學(xué)和上海交通大學(xué)聯(lián)合開發(fā)的100萬詞次的中國學(xué)習(xí)者英語語料庫(Chinese Learner English Corpus,CLEC)及北京外國語大學(xué)文秋芳、梁茂成等開發(fā)的中國學(xué)生英語口筆語語料庫(Spoken and Written English Corpus of Chinese Learners,SWECCL)[6]。
學(xué)習(xí)者語料庫在以下幾個方面有助于學(xué)習(xí)型詞典的編纂:
首先,學(xué)習(xí)者語料庫有助于選詞立目。研究發(fā)現(xiàn),最常用的2000詞覆蓋80%以上的口語或書面語語篇。[7]這些高頻詞必然要收錄進詞典。2000詞以外的詞目詞如何確定?Tono認為可通過對比本族語語料庫與學(xué)習(xí)者語料庫,了解英語學(xué)習(xí)者更常用哪些詞,而這些詞正是他們英語表達時想要的,應(yīng)當(dāng)立目詳解,滿足其交際需求。[8]
學(xué)習(xí)者語料庫與本族語語料庫對比亦能揭示在外語學(xué)習(xí)的某一階段哪些詞泛用或少用??梢岳?WordSmith Tools、AntConc等語料庫檢索工具中的word list功能,分別生成本族語語料庫詞表和學(xué)習(xí)者語料庫詞表。再通過keywords功能了解外語學(xué)習(xí)者泛用和少用的詞。例如,CLEC與FLOB(Freiburg-LOB Corpus of British English)語料庫對比發(fā)現(xiàn),中國學(xué)習(xí)者比本族語者過度使用we,people,I,can,water,job,my,is,do,our等詞,而較少使用 let's,legalize,government,faster,clean,agony,honor,province,examination,furthermore等詞。詞典在立目時可通過適當(dāng)?shù)臉?biāo)記符號提醒學(xué)習(xí)者避免泛用或少用被過度使用的這些詞。另外,學(xué)習(xí)者語料庫中易拼寫錯誤的詞,例如在CLEC中,survey錯寫成servey、convenient錯寫成 convinient等,也應(yīng)當(dāng)在學(xué)習(xí)型詞典中予以警示。
學(xué)習(xí)者語料庫還能顯示各個階段二語詞匯的發(fā)展。外語學(xué)習(xí)中一個值得注意的現(xiàn)象是泛用nice、happy之類的普通形容詞。表1顯示CLEC各子語料庫[9]中這兩個形容詞的使用狀況。顯然,初學(xué)者最易過多使用這些形容詞,而高階學(xué)習(xí)者開始注意用更準(zhǔn)確的詞來替換泛用的形容詞。學(xué)習(xí)者語料庫所提供的相關(guān)信息將有助于詞典編纂者針對不同水平的學(xué)習(xí)者的需求確定詞目詞的詳解程度。
表1 形容詞nice和happy在CLEC各子語料庫中的詞頻
其次,學(xué)習(xí)者語料庫有助于詞典編纂者針對特定學(xué)習(xí)者的常見錯誤進行判斷和歸類,更有效地設(shè)置用法說明等。學(xué)習(xí)型詞典有設(shè)置錯誤警示的傳統(tǒng),例如,《劍橋高階英語學(xué)習(xí)詞典》(2003)中對“pay for”的用法設(shè)有如下說明:
pay for
Remember that payis always followed by the preposition`for'if there is a direct object,except in certain phrases such as`pay a bill/fine,etc.'You have topayfor the tickets in advance,I'm afraid.You have to pay the tickets in advance,I'm a fraid.
該用法說明提醒英語學(xué)習(xí)者注意正確使用pay后面的介詞for。英語學(xué)習(xí)型詞典所囊括的錯誤警示大致為五類:(1)詞匯選擇錯誤(例如,說 damage someone's health而不說 injure someone's health);(2)動詞的語法形式錯誤(例如,have problems to do something是錯誤說法,應(yīng)為have problems doing something);(3)動詞句型錯誤(例如,可以說He proposed a possible solution to me.,但不說He proposed me a possible solution.);(4)詞在句中位置錯誤(例如,especially不出現(xiàn)在句首);(5)語法或詞匯搭配錯誤(例如,I have to do a speech.是錯誤的,可改為I have to make a speech.)。[10]
盡管現(xiàn)行英語學(xué)習(xí)型詞典中列舉的這些錯誤信息很有價值,但也存在不足:詞典中所提供的錯誤有時缺少事實依據(jù),很多為編纂者預(yù)測外語學(xué)習(xí)者可能會犯的錯誤,因而未能針對學(xué)習(xí)者的特定外語水平設(shè)置錯誤警示。例如,《劍橋高階英語詞典》在詞條“talk”中設(shè)的一個錯誤警示“She talks excellent French.” ,顯然低估了那些會查閱高階詞典的學(xué)習(xí)者的語言水平。
另一方面,英美國家出版的學(xué)習(xí)型詞典因服務(wù)于世界各地學(xué)習(xí)者,難以完全針對中國英語學(xué)習(xí)者所犯的語言錯誤而設(shè)置相關(guān)的用法說明。以單詞knowledge為例,檢索CLEC不難發(fā)現(xiàn),可能受漢語影響,中國學(xué)生傾向于使用短語learn knowledge:在CLEC出現(xiàn)的921例knowledge中,有124例與learn連用,為出現(xiàn)頻率最高的短語。然而,檢索英國國家語料庫(BNC)發(fā)現(xiàn),經(jīng)常與knowledge搭配的動詞依次是acquire,gain,require,deny,possess,impart,lack,share,use,test,extend,pool,glean,accumulate,disseminate,develop,update,increase,apply等,而未見一例learn knowledge。在五大學(xué)習(xí)型詞典中,僅有兩部最新版的詞典在knowledge條設(shè)有用法說明?!尔溈嗣讉悺?第2版,2007)在詞條knowledge中設(shè)的“Get it Right”(糾錯欄)中指出該詞為不可數(shù)名詞,后接的介詞不能為in或on。而《朗文》(第5版,2009)則設(shè)了三個欄目說明其用法:“Register”(語體欄)指出在日常英語中,人們常說know about而不是have knowledge of/about something;“Grammar”(語法欄)中介紹 knowledge為不可數(shù)名詞;“Common Errors”(常見錯誤欄)則精當(dāng)?shù)刂赋鰧W(xué)習(xí)者易犯的搭配錯誤:“Do not say`learn knowledge'.Say gain knowledge or acquire knowledge.”
隨著學(xué)習(xí)者語料庫的規(guī)模不斷擴大以及語料分析越來越精細,會有越來越多的英語學(xué)習(xí)型詞典有針對性地警示學(xué)習(xí)者,設(shè)置更多用法欄目。
第三,學(xué)習(xí)者語料庫有助于發(fā)現(xiàn)英語學(xué)習(xí)者與本族語者之間深層次的語言差距,發(fā)掘英語學(xué)習(xí)者隱性的語言錯誤,從而在學(xué)習(xí)型詞典中設(shè)置新的專欄,更好地發(fā)揮詞典的編碼功能。與本族語者相比,外語學(xué)習(xí)者語言的一個比較大的問題是詞匯和語法搭配的使用。外語學(xué)習(xí)者常較少使用甚至回避一些語詞搭配。下面我們在T ono[11]研究的基礎(chǔ)上,通過比較BNC、日本英語學(xué)習(xí)者語料庫(Japanese EFL Learner Corpus,JEFLL[12])和CLEC的相關(guān)數(shù)據(jù),考察中國英語學(xué)習(xí)者在使用動詞make時可能少用及不用的搭配。表2數(shù)據(jù)顯示,日本英語學(xué)習(xí)者常用money,food,breakfast,friends等具體的名詞與make搭配,而本族語者在使用make時,常用抽象名詞與之搭配,如sense,way,use,decision等。與之相比,中國英語學(xué)習(xí)者使用的make搭配詞有自身的特點:make haste、make practice等雖系make與表抽象意義的名詞搭配,然而英美人卻不習(xí)慣這樣搭配;make water則是不地道的表達法。因此,為中國學(xué)生編纂的詞典除應(yīng)多列舉一些常出現(xiàn)的高頻搭配,還應(yīng)當(dāng)考慮學(xué)習(xí)者的需求。具體而言,初級英語詞典可多花些篇幅描述make的核心意義(即“做、制造”等義)的搭配,而高階學(xué)習(xí)型詞典應(yīng)花更多篇幅列舉可與make搭配的表抽象義的搭配詞。
表2 動詞“make”在BNC、JEFLL和CLEC中與名詞的搭配
與本族語者相比,外國學(xué)生另外一個常見錯誤是用詞與當(dāng)前文體風(fēng)格不符。學(xué)習(xí)者語料庫顯示,學(xué)生在學(xué)術(shù)英語中常誤用諸如“maybe” 、“as far as I am concerned”、“I would like to talk about”等出現(xiàn)在口語中的詞語和句式。這些用詞雖沒有語法錯誤,但不合文體要求。為幫助學(xué)習(xí)者減少學(xué)術(shù)寫作中的表達問題,麥克米倫出版公司與比利時魯汶大學(xué)語料庫語言學(xué)中心合作,對國際學(xué)習(xí)者英語語料庫(ICLE)進行大規(guī)模的語料分析,并與BNC中的學(xué)術(shù)英語子語料庫對比,獲得第一手的寶貴數(shù)據(jù)[13][14],首次在《麥克米倫高階英語詞典》(2007)中設(shè)置“IMPROVE YOUR WRITING SKILLS”(改進你的寫作技能)專欄,集中介紹“添加信息”、“對比與比較:描述相似性與差異”、“舉例”等12項學(xué)術(shù)寫作功能以及“冠詞”、“補足語:動詞、名詞與形容詞使用句型”、“名詞的可數(shù)與不可數(shù)”等6類語法要點。該欄目“應(yīng)用語料庫數(shù)據(jù)顯性地表現(xiàn)出了學(xué)習(xí)者在實現(xiàn)某一寫作功能時經(jīng)常遇到的困難,以便詞典使用者能掌握更適當(dāng)?shù)膶懽鞑呗浴?。[15]例如,圖1直觀顯示besides在本族語者的學(xué)術(shù)英語中很少出現(xiàn),而英語學(xué)習(xí)者卻經(jīng)常在學(xué)術(shù)寫作中使用該詞。同時,詞典用“BE CAREFUL!”警示學(xué)習(xí)者該詞主要用于口語和非正式文體中。圖2則對比了“similarly/in the same way/likewise”三詞在學(xué)術(shù)英語中的出現(xiàn)頻率,表明“similarly”比“in the same way”和“l(fā)ikewise”常用。這些基于語料庫的直觀信息對于改善學(xué)生的學(xué)術(shù)寫作能力大有裨益。
圖1 《麥克米倫高階英語詞典》對副詞“besides”在學(xué)術(shù)英語中用法的提示
圖2 《麥克米倫高階英語詞典》對比“similarly/in the same way/likewise”在學(xué)術(shù)英語中的出現(xiàn)頻率
總之,對學(xué)習(xí)者語料庫數(shù)據(jù)深入挖掘與應(yīng)用,將有助于學(xué)習(xí)型詞典開發(fā)新的專欄,防止語言錯誤出現(xiàn),更大程度發(fā)揮其編碼功能。
學(xué)習(xí)者語料庫將在英語學(xué)習(xí)詞典編纂中發(fā)揮重要作用。借助語料庫檢索工具,分析學(xué)習(xí)者語料庫中所包含的語言錯誤信息,將有助于了解各個階段、各種母語背景的學(xué)習(xí)者的中介語特點,從而有助于英語學(xué)習(xí)型詞典選詞立目,有助于設(shè)置用法說明、錯誤警示、圖表對比等相關(guān)欄目。
要充分利用學(xué)習(xí)者語料庫,還需要進一步解決相關(guān)理論和實踐問題。學(xué)習(xí)者語料庫是以錯誤分析理論為基礎(chǔ)的,然而該理論從上世紀(jì)中期提出以來一直沒有大的發(fā)展。實際操作方面,與本族語語料庫相比,學(xué)習(xí)者語料庫無論在規(guī)模、語料的代表性還是檢索工具的開發(fā)等方面,依然相對落后。當(dāng)今的學(xué)習(xí)者語料庫規(guī)模偏小,還未有一個學(xué)習(xí)者語料庫詞次上億;選取的語料缺少代表性和典型性;語料檢索工具仍主要服務(wù)于本族語語料庫,對學(xué)習(xí)者的詞匯、句法、語用等錯誤不敏感。這些問題都限制了學(xué)習(xí)者語料庫在學(xué)習(xí)型詞典編纂中的應(yīng)用。同時,詞典編纂者也需要加強語料庫相關(guān)知識與操作的培訓(xùn),從而在編纂過程中更好地運用學(xué)習(xí)者語料庫。
附 注
[1]Landau S I.Dictionaries:The Art and Cra ft of Lex icography.Cambridge:Cambridge University P ress,2001:293.
[2][13]Gilquin G,Granger S,Paquot M.Learner Co rpora:The Missing Link in EAP Pedagogy.Journal of English f or Academic Purposes,2007(4):319-335.
[3]與朗文蘭開斯特英語語料庫(Longman Lancaster English Corpus)和朗文口語語料庫(Longman Spoken Corpus)共同構(gòu)建成3.3億詞次的朗文語料庫網(wǎng)絡(luò)(Longman Corpus Network),參見 http:∥www.pearsonlongman.com/dictionaries/corpus/。
[4]為5億詞次的劍橋國際語料庫的一部分,參見http:∥cambridge.org/elt/corpus/international-corpus.htm。
[5] 現(xiàn)包括21種母語背景的學(xué)習(xí)者產(chǎn)出的英語語料,參見http:∥cecl.fltr.ucl.ac.be/Cecl-Projects/Icle/icle.htm。
[6]收集的語料為全國英語專業(yè)四、八級口試語料(100萬余詞)與英語專業(yè)學(xué)生的議論文和說明文語料(約120萬詞)。
[7]Nation I S P.Learning Vocabulary in Another Language.Cambridge:Cambridge University Press,2001:13-17.
[8][10][11]T ono Y.The Potential of Learner Corpora for Pedagogical Lexicography.∥Ooi V B Y,Pakir A,Talib I S,Tan P K W.(eds.)Perspectives in Lexicography:Asia and Beyond.Tel Aviv:K.Dictionaries Ltd.,2009:105-116.
[9]五個子語料庫收詞相當(dāng),分別為20萬詞次左右。
[12] 參見http:∥jefll.corpuscobo.net/。
[14][15]Rundell M.語料庫詞典學(xué)的最新發(fā)展和未來趨勢(下).辭書研究,2009(4).