李翠
摘要:語言學(xué)家從不同的角度對詞塊的概念和內(nèi)涵進(jìn)行了研究、探討和界定,對詞塊的分類也各有側(cè)重,但大多數(shù)學(xué)者都從結(jié)構(gòu)和功能角度將詞塊進(jìn)行分類,本文列舉了比較具有代表性的詞塊分類并對詞塊的識別技術(shù)及識別的定性標(biāo)準(zhǔn)有所闡述。對國外英語詞塊研究的相關(guān)知識進(jìn)行梳理,包括詞塊研究的背景,詞塊的定義,分類以及詞塊的識別等。
關(guān)鍵詞:詞塊 詞塊分類 詞塊識別
中圖分類號:G633.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-5349(2016)15-0068-02
一、英語詞塊的定義及名稱
詞塊最初源于心理學(xué)概念——組塊(chunking)。美國心理學(xué)家George Miller(1956:81-97)首次提出組塊理論。短時(shí)記憶的信息是有限和相對固定的,平均廣度是7+2個(gè)單位,此單位被其稱為組塊。語言學(xué)中的“詞塊”概念就是來源于心理學(xué)的“組塊”概念。到了20世紀(jì)70年代初期,詞塊研究真正成為應(yīng)用語言學(xué)研究的熱點(diǎn)。對詞塊有深入研究的語言學(xué)家Becker(1975)最早提出了“預(yù)制詞塊”(prefabricated chunks)的概念,指英語中的多詞詞匯現(xiàn)象。他認(rèn)為人們語言交際中的最小單位即是那些固定和半固定的模式化了的板塊結(jié)構(gòu)。Pawley and Syder(1983)把詞塊定義為詞匯化句干(lexicalized sentence stems)。James R.Nattinger and Jeanette S.DeCarrico(1992)也認(rèn)為詞塊是多次詞匯現(xiàn)象,它介于傳統(tǒng)的詞匯與句法之間,具有使用頻繁,意義固定的特點(diǎn),集功能與形式于一體。最終為詞塊奠定理論基礎(chǔ)的是Lewis(1993)出版的The Lexical Approach 這本著作。Lewis(1997)指出語言中存在大量的固定或半固定的結(jié)構(gòu),兼有句法和詞匯特征。Wray(1999)認(rèn)為詞塊是“一個(gè)具有一定結(jié)構(gòu)、表達(dá)一定意義的預(yù)制的多詞單位,它以整體形式被記憶存儲,并在及時(shí)交際時(shí)被整體提取,而不需要使用語法規(guī)則來加工分析的連續(xù)或非連續(xù)的由詞匯構(gòu)成的語串”。關(guān)于詞塊,語言學(xué)界有50多種名稱,比較常見的學(xué)術(shù)用語如詞匯組塊(lexical chunks)、程式語(formulas, formulaic language)、詞匯短語(lexical phrases)、預(yù)制件(prefabs)、短語單位(phraseological units)、詞匯包(lexical bundles)、固定表達(dá)式(fixed expressions)、詞匯化句干(lexicalized sentence stems)、預(yù)制語言表達(dá)(prefabricated language expressions)等。在如此眾多的術(shù)語中能否找出一個(gè)代表,作為統(tǒng)領(lǐng)?多數(shù)情況下,這些術(shù)語都可以相互替代使用(如Weinert,1995)。
二、詞塊的分類
國外學(xué)界對英語詞塊的分類研究可以追溯到20世紀(jì)70年代。由于對詞塊的定義和名稱表述不一,所以詞塊分類也各有不同與側(cè)重。到了20世紀(jì)80年代,學(xué)者們對于詞塊的分類更加細(xì)化和科學(xué),并且日漸成熟。比較具有代表性的分類如下:
Pawley&Syder(1983)依據(jù)詞在語篇中的銜接功能將詞塊劃分為4類:1)多詞詞匯(poly-words);2)慣用表達(dá)式(institutionalized expressions),包括諺語、警句、交際套語等可用來整體存儲的語言構(gòu)塊;3)短語限制語(phrasal constraints),一般指可以填空的不是很長的詞塊;4)句型框架(sentence frames),為表達(dá)某個(gè)概念允許內(nèi)容有一定的變化的句子框架。這個(gè)分類沒有包括單詞、搭配和固定形式。
Lewis(1997)根據(jù)詞匯內(nèi)部的語義聯(lián)系和句法功能將詞塊分成4類:1)復(fù)合詞和聚合詞(complex word and poly-word),指由一個(gè)以上的單詞組成的固定短語,如by the way,back and forth等;2)習(xí)慣搭配詞(frequent collocation),“搭配”就是自然語言中高頻的詞匯組合,如have a walk, take part in,suicide經(jīng)常與commit搭配等。想自然準(zhǔn)確的表達(dá)思想,如操本族語者一樣,就必須多了解這些搭配。3)慣用話語(institutionalized utterance),指具有語用功能的形式固定或半固定的單詞組合??蔀橥暾木渥樱鏗ow are you doing? 也可以是固定的句子開頭,如Can you tell me the way to…? 等;4) 句子框架及引語(sentence frame and head),用于篇章銜接的關(guān)聯(lián)詞。如:on the one hand…on the other hand…; firstly, secondly, finally。
James R.Nattinger and Jeanette S.DeCarrico(1992)從語言教學(xué)角度出發(fā),將詞塊分為4類(形式和功能):1)聚合詞(polywords):指具有單個(gè)詞的功能的短語,是形式不可變的連續(xù)體,分規(guī)范類(如: for the most part, by the way, at any rate, so long, for that matter, you know等)和非規(guī)范類(如: as it were, in essence, nevertheless, by and large, all in all, so far so good);2)慣常的表達(dá)形式(institutionalized expressions):一般作為獨(dú)立的話語,相當(dāng)于句子長度,絕大多數(shù)是規(guī)范類的不可改變形式的連續(xù)的諺語、格言和社交公式話語(如: a watched pot never boils, nice meeting you, once upon a time…and they lived happily ever after, there you go, give me a break),也有少數(shù)的不規(guī)范類(如: what, me worry? be that as it may, long time no see);3)短語限制結(jié)構(gòu)(phrasal constraints):這類詞匯短語長度由短到中等長度,允許有詞及詞組范疇的變化,是指由某些固定結(jié)構(gòu)形成的框架式短語,人們可根據(jù)需要替換相應(yīng)的詞,大多數(shù)是連續(xù)的,也有規(guī)范類(如: a ____ ago, variations: a day ago, a year ago, a very long time ago; as far as I ___, variations: as far as I know, as far as I can tell; _____as well as____, variations: this one as well as that one, linguists as well as sociologists; to make a (very) long story (relatively) short等)和非規(guī)范類(如:the__er the___er, variations: the more the better; for better or (for) worse, variations: for better or worse, for better or for worse; for ____, variations: for instance, for example等)兩種形式;4)句子構(gòu)造成分(sentence builders):為整個(gè)句子提供框架,根據(jù)所要表達(dá)的意思填入形式可變的短語和從句成分,可以是連續(xù)的,也可以是不連續(xù)的,分規(guī)范類(如: not only X, but also Y: e.g.not only had the poor man been fined, but also he had been sent to prison; that reminds me of X: e.g.that reminds me of the place we went to in Chicago,等)和非規(guī)范類(如: the _____er X, the _______er Y: e.g.the more careful you are, the less mistake you will make; the more money you make, the more you spend)。
Howarth(1998)綜合多種觀點(diǎn),提出了兩個(gè)維度的分類:1)從語篇角度和句子角度,詞塊分為功能表達(dá)式(語篇層面)和語法合成語、實(shí)詞合成語(句子層面)。有些語句在語篇或話語中起到一定的功能,如諺語、套話、銜接短語、口號等被稱為功能表達(dá)式。以虛詞開頭或結(jié)尾的短語,常見的有“介詞+名詞”如:under the table、“動詞+小品詞”如:depend on等被稱為語法合成語;2)根據(jù)詞塊中的詞語的搭配強(qiáng)度,分為四種情況,形成一個(gè)連續(xù)體:自由組合(free combinations)、有限搭配(restricted collocations)、修辭性成語(figurative idioms)和純成語(pure idioms)。
Biber等(2004)針對大學(xué)書面語列了一個(gè)詞匯包清單(共69個(gè)),分為三大類:1)情態(tài)表達(dá)式(stance expressions),如you are expected to, it is important to, will be based on等共22個(gè);2)語篇組織器(discourse organizer),如is designed to provide,at the same time,one of the most,if you are a等共16個(gè);3)參照性表達(dá)(referential expressions),如 a wide range of,a description of the,the nature of the,on the basis of,at the time of,the end of the等,共31個(gè)。
三、詞塊的識別與檢索技術(shù)
計(jì)算機(jī)沒發(fā)明之前,詞頻和詞組搭配的統(tǒng)計(jì)只能通過手工計(jì)算,即人工識別法,此種方法主觀性強(qiáng),速度太慢。計(jì)算機(jī)誕生后,它在語言研究領(lǐng)域運(yùn)用越來越多。借助計(jì)算機(jī)強(qiáng)大的處理功能,可以實(shí)現(xiàn)詞塊的自動識別和抽取。人們可利用的有代表性的英語詞塊識別與檢索的技術(shù)列舉如下:1)運(yùn)用WS Concord詞叢功能,WS WordList詞表功能和N-gram多元結(jié)構(gòu)來檢索連續(xù)的詞塊;2)運(yùn)用Context Word語境詞和ConcGram軟件來檢索非連續(xù)的詞塊。隨著計(jì)算機(jī)檢索技術(shù)和軟件的發(fā)展,自動地大規(guī)模地檢索詞串已不成問題。然而,雖然很多詞串出現(xiàn)的頻率較高,但不能直接運(yùn)用,因其不具有心理現(xiàn)實(shí)性。所以,要做到提高詞塊識別及提取的準(zhǔn)確性,需將自動識別與人工識別結(jié)合起來。通過計(jì)算機(jī)提取出詞塊之后,人工依據(jù)某種標(biāo)準(zhǔn)來進(jìn)行篩選。這就涉及到詞塊的定性標(biāo)準(zhǔn)。
四、詞塊識別的定性標(biāo)準(zhǔn)
Howarth(1998)的詞塊標(biāo)準(zhǔn)體現(xiàn)為四個(gè)方面的特征:1)慣用程度(熟悉度)institutionalization(familiarity):詞匯化指一個(gè)語言形式獲得詞項(xiàng)或詞匯單位地位的現(xiàn)象和過程;詞匯化了的語言形式可能被列入一般詞典當(dāng)中,有其特定的意義和用法。一個(gè)形式要詞匯化,重要的條件之一是在交際活動中被高頻地用于表達(dá)某個(gè)意義。Moon(1998)認(rèn)為,量化的頻數(shù)標(biāo)準(zhǔn)、詞匯-語法形式的固定標(biāo)準(zhǔn)以及意義的非合成性標(biāo)準(zhǔn)這三方面決定了一個(gè)語言形式是否詞匯化。而一個(gè)語言形式的頻數(shù)是重要的標(biāo)準(zhǔn)。一個(gè)語言的形式要成為一個(gè)多詞單位,成為慣用話語的一個(gè)必要條件是其被語言社團(tuán)高頻使用。而且從理論上講,語言形式要實(shí)現(xiàn)詞匯化,除了具有高頻使用這個(gè)條件外,還應(yīng)滿足詞匯-語法形式上固定且意義為非合成這兩個(gè)條件。衛(wèi)乃興(2011)研究表明,只有少數(shù)的高頻使用的詞語序列實(shí)現(xiàn)了完全詞匯化,大部分只是部分的詞匯化。2)制約性(可變性的限制)restrictedness(limited variability):制約性是針對詞串的結(jié)構(gòu)而言的。詞串結(jié)構(gòu)可變性弱,相對穩(wěn)定。但這種固定性和可變性沒有絕對標(biāo)準(zhǔn)。有些詞塊沒有可變性,內(nèi)部結(jié)構(gòu)非常穩(wěn)定;有些詞塊可以拆分、添加詞語、變換詞序等,可變性比較強(qiáng)。3)記憶(存儲)memorization(storage)4)語義透明度(可分析性)semanticopacity(partial analysability):指詞塊的整體意義與其字面意義是否相符,也可以稱作語義的(非)組構(gòu)性。字面意義一般為各成分單位的意義之和。那些整體意義與各成分的意義關(guān)聯(lián)性越強(qiáng)的詞塊其組構(gòu)性越高,語義透明度就越高如: for example。一般情況下,詞塊具有非組構(gòu)性,語義透明度低,尤其是像“拋磚引玉”:take the bull by the horn;“憤怒”:blow your stack等這些習(xí)語。
五、結(jié)語
國外的一些專家和學(xué)者從不同的角度給英語詞塊下了定義并進(jìn)行了分類,筆者對其進(jìn)行歸納和梳理。在接下來的系列論文中,筆者將會對國內(nèi)學(xué)者對于英語詞塊的研究尤其是分類方面的研究做以梳理和分析,試圖總結(jié)出適合運(yùn)用于閱讀語篇的詞塊分類方法。通過對詞塊識別技術(shù)和識別的定性標(biāo)準(zhǔn)的分析,為今后在閱讀語篇中提取詞塊提供理論依據(jù)。
參考文獻(xiàn):
[1]Alison Wray.Formulaic Language: Pushing the Boundaries( 公式化語言:探索研究) [M]上海:上海外語教育出版社,2012.
[2]James R.Nattinger & Jeanette S.DeCarrico.Lexical Phrases and Language Teaching(詞匯短語與語言教學(xué)) [M].上海:上海外語教育出版社,2000.
[3]Moon, R.Fixed Expressions and Idioms in English: A Corpus-Based Approach [M].Oxford: Oxford University Press, 1998.
[4]Weinert, R.The role of formulaic language in second language acquisition: A review[J].Applied Linguistics, 1995,16(2):180-205.
[5]劉凌,葉朝成.再議詞塊分類[J].湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào),2009, 6(7):130-132.
[6]薛旭輝.英語語塊的概念表征與認(rèn)知界定研究綜述[J].西安外國語大學(xué)學(xué)報(bào),2013,21(2):23-28.
[7]詹宏偉.語塊的認(rèn)知加工與英語學(xué)習(xí)(Cognitive Processing of Phraseologisms and English Learning)[M].杭州:浙江大學(xué)出版社,2013.
[8]趙蘊(yùn)萱.詞塊的分類探究極其相關(guān)問題 [J].外語教學(xué)與研究,2007,(45):54-55.
[9]周正鐘.語塊教學(xué)法新探——理論、實(shí)證與教學(xué)延伸 [M]蘇州:蘇州大學(xué)出版社,2014.
責(zé)任編輯:孫 瑤