李雪萍
摘要:本文用了大篇幅的內(nèi)容重點(diǎn)闡述了語(yǔ)言文本的重要性及其理論來(lái)源,立足于把語(yǔ)料庫(kù)作為一門獨(dú)立的學(xué)科進(jìn)行研究(即Corpus driven linguistics),主要介紹了許多有關(guān)語(yǔ)料庫(kù)語(yǔ)言學(xué)的理論觀點(diǎn)和相關(guān)研究。雖然這些觀點(diǎn)都是上個(gè)世紀(jì)六十年代至九十年代的研究成果,但是對(duì)于目前的語(yǔ)料庫(kù)語(yǔ)言學(xué)研究仍具有一定的影響力,比如可應(yīng)用于教材,詞典和語(yǔ)法等書(shū)籍的編寫以及文學(xué)鑒賞和話語(yǔ)分析等等領(lǐng)域。因此,本文首先對(duì)該書(shū)的主要內(nèi)容一一作簡(jiǎn)要介紹,隨后對(duì)其予以相應(yīng)的分析和評(píng)價(jià)。
關(guān)鍵詞:文本;語(yǔ)料庫(kù);話語(yǔ)分析;John Sinclair
1.引言
自第一個(gè)計(jì)算機(jī)語(yǔ)料庫(kù)Brown語(yǔ)料庫(kù)問(wèn)世以來(lái),語(yǔ)料庫(kù)語(yǔ)言學(xué)已走過(guò)五十多年的歷程。在這五十年時(shí)間里,由于在語(yǔ)料編輯與加工、研究工具和分析技術(shù)上的長(zhǎng)足進(jìn)步,語(yǔ)料庫(kù)語(yǔ)言學(xué)的版圖不斷擴(kuò)大,幾乎觸及到了語(yǔ)言研究的各個(gè)分支領(lǐng)域,并呈現(xiàn)出蓬勃發(fā)展之態(tài)。Ronald Carter主編的 “Trust Text:Language, Corpus, Discourse”這本書(shū)中主要收錄了John Sinlair在二十世紀(jì)六十年代以來(lái)所發(fā)表的關(guān)于語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的所有論文集,主要介紹了有關(guān)自然語(yǔ)言處理的關(guān)鍵問(wèn)題和語(yǔ)料庫(kù)語(yǔ)言學(xué)理論與實(shí)踐的具體研究案例。
John Sinclair所研究的語(yǔ)料庫(kù)的語(yǔ)言學(xué)理論傳統(tǒng)來(lái)源于J.R. Firth 和Michael Halliday。Sinclair認(rèn)為應(yīng)該對(duì)真實(shí)的語(yǔ)境中自然發(fā)生的語(yǔ)言進(jìn)行研究,并對(duì)可擴(kuò)展性的例子(這里主要指的是完整的文本)的意義進(jìn)行分析。這與當(dāng)時(shí)五六十年代盛行的Chomsky的理論傳統(tǒng)不同,Chomsky認(rèn)為語(yǔ)言是認(rèn)知和生物本能的現(xiàn)象,研究方法更側(cè)重于關(guān)注研究人員的直觀感受和反映,并認(rèn)為這種直覺(jué)體現(xiàn)了語(yǔ)言使用者的語(yǔ)言能力。同時(shí)不太關(guān)注真實(shí)語(yǔ)境中的所產(chǎn)生的語(yǔ)言現(xiàn)象,更多側(cè)重于那些被人為創(chuàng)造出來(lái)符合研究目的語(yǔ)言(主要運(yùn)用于對(duì)比研究),這些句子有些符合語(yǔ)法的要求,而有些則不合法。后來(lái)在20世紀(jì)60年代,Sinclair提出了語(yǔ)言詞匯集中性的問(wèn)題,而相對(duì)而言忽略語(yǔ)法和語(yǔ)音上的分析,因此,這樣的研究則需要收集大量的語(yǔ)料。早在1991年,Sinclair所發(fā)表的 “Corpus, Concordance and Collocation”一文中就反映了其對(duì)語(yǔ)料庫(kù)初步處理的思想和方法(主要體現(xiàn)在對(duì)詞匯的研究上)。
2.內(nèi)容簡(jiǎn)介
“Trust Text:Language, Corpus, Discourse”該書(shū)一共由引言和三個(gè)章節(jié)等四個(gè)部分組成,第一章基礎(chǔ),一共有兩個(gè)小節(jié),即文本可信度和意義單位的擴(kuò)展,前者主要介紹了基于尊重和信任文本的整合原則,對(duì)語(yǔ)言進(jìn)行分析描述以及理論構(gòu)建,后者介紹了詞匯組織方式和模式變化的主要理論,該章節(jié)是后兩個(gè)章節(jié)語(yǔ)料庫(kù)語(yǔ)言學(xué)研究與實(shí)踐的理論基礎(chǔ);第二章文本的組織,一共有五個(gè)小節(jié),在這一部分內(nèi)容中,作者深入分析了隨著文本類型的變化,文本結(jié)構(gòu)與交互式對(duì)話之間的關(guān)系的轉(zhuǎn)變。前兩小節(jié)(即話語(yǔ)平面,語(yǔ)言描述的整合)的內(nèi)容為所有情景交際語(yǔ)言分析提供了研究框架和思路,對(duì)口語(yǔ)和書(shū)面語(yǔ)之間的整合做了詳細(xì)分析和介紹;第三章詞匯和語(yǔ)法,詳細(xì)介紹了對(duì)詞匯的描述,以及與語(yǔ)法和語(yǔ)料庫(kù)分析之間的關(guān)系。
第一部分,引言介紹了John Sinclair的個(gè)人經(jīng)歷和研究成果,然后簡(jiǎn)述了這本書(shū)的理論和主要思想,最后就是對(duì)該書(shū)的主要內(nèi)容進(jìn)行了粗略的梳理和總結(jié)。
第一章(1-2節(jié))首先介紹了作者的兩個(gè)觀點(diǎn),第一猜想和事實(shí)之間的關(guān)系(假設(shè)被有限數(shù)據(jù)驗(yàn)證的過(guò)程),即話語(yǔ)分析研究;第二關(guān)于可供觀察研究的數(shù)據(jù)的語(yǔ)言意義探究和充分利用,即語(yǔ)料庫(kù)的研究。對(duì)于話語(yǔ)分析研究而言,通過(guò)建立話語(yǔ)模型探索交際語(yǔ)言的組織方式和結(jié)構(gòu)特征。在這一過(guò)程中需要選擇合適的工具和軟件,這就要求電腦技術(shù)的靈活運(yùn)用以反映話語(yǔ)顯著特征。Sinclair認(rèn)為這種具有一定規(guī)模且分類別的投射嘗試展示口語(yǔ)交際內(nèi)在結(jié)構(gòu)的組成方式。Louis Ravelli(1991)的動(dòng)態(tài)語(yǔ)法研究嘗試對(duì)熟悉領(lǐng)域進(jìn)行理論研究的創(chuàng)新,如話語(yǔ)的研究向語(yǔ)言形式方面的轉(zhuǎn)化。同時(shí)作者提出口語(yǔ)與書(shū)面語(yǔ)之間的差異,前者假設(shè)驗(yàn)證的過(guò)程(即話語(yǔ)暗示和意圖,語(yǔ)言功能研究),后者可通過(guò)眼動(dòng)研究、查找、分析文本,該研究方法更容易尋找書(shū)面語(yǔ)文本的規(guī)律,如連貫性,重復(fù),指稱,替代等方面指標(biāo)。書(shū)面語(yǔ)尤其側(cè)重對(duì)文本的處理和分析,Emmott(1997)提出的“圖層框架(primed frames)”準(zhǔn)則十分具有前瞻性。他認(rèn)為文本心理表征的形式和文本內(nèi)容就存在于在一個(gè)具備基本理解能力的讀者頭腦之中,同時(shí)也具有一定能力將文本所體現(xiàn)的意義進(jìn)行有效的解釋。另外Sinclair還區(qū)分了句子與文本的關(guān)系,前面的句子對(duì)后面的內(nèi)容起到鋪墊作用,后面的句子補(bǔ)充前面的內(nèi)容,所有的句子構(gòu)成一個(gè)文本。還有就是從詞匯層面來(lái)看,第一,詞根化(lemmatization)就是同一詞根進(jìn)行曲折變化后形成各個(gè)不同形式的單詞,如move,moving,moved等;第二,同一個(gè)單詞屬于不同詞類但意義與其所屬詞類相關(guān),例如combat既可作動(dòng)詞有可作名詞;第三,詞語(yǔ)共現(xiàn),詞語(yǔ)組成短語(yǔ)并多次共現(xiàn)于句子和文章當(dāng)中,如名詞作為介詞的賓語(yǔ)共現(xiàn),這一類詞匯的共現(xiàn)與配價(jià)研究息息相關(guān);第四,傳統(tǒng)詞類受到?jīng)_擊,例如與傳統(tǒng)概念不一樣,of不以介詞的身份出現(xiàn)在句子當(dāng)中;第五,詞型的出現(xiàn)與語(yǔ)境密切相關(guān),如在詞庫(kù)中檢索happen后,所出現(xiàn)的索引行當(dāng)中大部分都是發(fā)生不詳?shù)氖虑椋╪asty things),從而判斷這個(gè)詞的使用情況;第六,短語(yǔ)與詞的意義共享,即搭配意義(collocation)。在第二節(jié)意義擴(kuò)展的例子中,作者介紹了三種最小意義單位模型,即Item and Arrangement Model(IA),Item and Process(IP)和Word and Paradigm(WP)。在組織和收集語(yǔ)料這一方面,更加注重詞匯的重復(fù)頻率。Clear(1993, pp. 271–292)認(rèn)為目前有關(guān)詞匯重要性的測(cè)試最有成效的是語(yǔ)言事件的重復(fù),通過(guò)頻率比較探索句子詞匯之間的組織方式和內(nèi)部結(jié)構(gòu)特征。另外作者通過(guò)檢索the naked eyes, true feeling和brook等三個(gè)例子進(jìn)一步說(shuō)明詞頻,詞之間的搭配關(guān)系,語(yǔ)義韻和類連接的分析和應(yīng)用。
第二章(3-7節(jié))文本的組織,這一部分主要闡述了語(yǔ)言與文學(xué)之間的關(guān)系,而文體學(xué)則是以語(yǔ)言學(xué)的視角分析文學(xué)。第三節(jié)話語(yǔ)平面,詳細(xì)介紹了語(yǔ)言使用的兩個(gè)方面,第一,參與者之間連續(xù)的交流和對(duì)話;交流談判方面強(qiáng)調(diào)互動(dòng),稱之為話語(yǔ)的互動(dòng)平面;第二,不斷發(fā)展變化的經(jīng)驗(yàn)的記錄和保存,也就是,話語(yǔ)從互動(dòng)平面向自主平面的轉(zhuǎn)化而完成平面改變。作者以“How Far can you go”的小說(shuō)為例詳細(xì)解釋了話語(yǔ)平面的交互性和自主性的特點(diǎn)。第四節(jié)語(yǔ)言描述的整合,介紹了在文本與話語(yǔ)中,揭示其結(jié)構(gòu)相似性的描述系統(tǒng),而這個(gè)系統(tǒng)是一個(gè)動(dòng)態(tài)話語(yǔ)模型,這與傳統(tǒng)的靜態(tài)模型有區(qū)別:第一,動(dòng)態(tài)話語(yǔ)模型展示的是話語(yǔ)如何從上一個(gè)話題切換到下一個(gè),如何進(jìn)行自然地過(guò)渡;第二,動(dòng)態(tài)話語(yǔ)模型如何展示某個(gè)部分話語(yǔ)在實(shí)現(xiàn)交流目的過(guò)程中所扮演的角色。在語(yǔ)境中,時(shí)間是一個(gè)很重要的特征,保證對(duì)話的進(jìn)行和促進(jìn)參與者的理解,同時(shí)簡(jiǎn)述了口語(yǔ)與書(shū)面語(yǔ)文本結(jié)構(gòu)的特征和差異。將其相異行為描述的基本內(nèi)容進(jìn)行整合,隨后在此基礎(chǔ)上需要將其抽象化,并通過(guò)這樣的整合工作了解和區(qū)分口語(yǔ)與書(shū)面之間的顯著差異。接下里詳細(xì)介紹了Dijk為代表的學(xué)者所提出來(lái)的話語(yǔ)動(dòng)態(tài)模型以及應(yīng)用。Dijk(1985)從五個(gè)步驟詳細(xì)介紹了話語(yǔ)動(dòng)態(tài)模型的應(yīng)用情況:互動(dòng)標(biāo)示,參考文本中作者的態(tài)度,敘述者的屬性,論述標(biāo)示,自我參照標(biāo)示,支配動(dòng)詞形式。第五節(jié)書(shū)面語(yǔ)結(jié)構(gòu),論述了單個(gè)句子對(duì)文本的解釋,并通過(guò)邏輯連接詞(logical operator,如so,therefore)和互動(dòng)信號(hào)(interactive signals,如well,ah,anyway)展示相同的話語(yǔ)功能。第六節(jié)對(duì)話的內(nèi)化,交際互動(dòng)特征的內(nèi)化可以用以解釋句子語(yǔ)法的復(fù)雜程度,從最大的語(yǔ)法單元(即句子)到最小的單元(即詞)逐步說(shuō)明其內(nèi)化過(guò)程,如分析小說(shuō)中的第一人稱敘事者的人物變化。第七節(jié)文本解釋的工具介紹,回顧了有關(guān)文本的交際影響的描述規(guī)則,并從大型的文本語(yǔ)料庫(kù)中查找數(shù)據(jù)并對(duì)其進(jìn)行分析證明。
第三章(8-12節(jié))詞匯與語(yǔ)法,收錄了五篇關(guān)于詞匯與語(yǔ)法相關(guān)研究的論文,并在第二章有關(guān)詞匯研究的基礎(chǔ)上進(jìn)一步介紹了利用現(xiàn)代電腦技術(shù)手段(也就是語(yǔ)料庫(kù)的創(chuàng)建)的詞匯與語(yǔ)法及其之間關(guān)系的研究。首先介紹了詞匯該如何進(jìn)入適合的結(jié)構(gòu)模型,列舉了一系列詞典編撰的理論和原則加以說(shuō)明,如《柯林斯英語(yǔ)詞典》以及影響詞匯意義的因素,如詞語(yǔ)組合方式和語(yǔ)境變化等等。對(duì)于從詞匯與語(yǔ)法的關(guān)系層面上來(lái)看,詞匯和語(yǔ)法這兩種模式的關(guān)系被認(rèn)為是語(yǔ)言創(chuàng)造意義的手段,分別從句法意義,跨語(yǔ)法類別,語(yǔ)義韻,詞類和詞法結(jié)構(gòu)等方面展開(kāi)論述。短語(yǔ)學(xué)介紹了在不同國(guó)家表示相同意思卻用不同的介詞來(lái)表達(dá),比如用于中的“of”,德語(yǔ)用“für”,法語(yǔ)用“de”,但是由于句法的要求會(huì)使用“for”來(lái)替代“of”,文章當(dāng)中同時(shí)也通過(guò)語(yǔ)料庫(kù)(The bank of English)對(duì)這些介詞的使用進(jìn)行檢驗(yàn)。最后對(duì)語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的現(xiàn)狀也做了一定的介紹,例如自然語(yǔ)言的處理,詞語(yǔ)之間的搭配,次語(yǔ)言的消亡,同時(shí)也提出了目前語(yǔ)料庫(kù)語(yǔ)言學(xué)研究出現(xiàn)的一系列問(wèn)題,如語(yǔ)料庫(kù)規(guī)模大小,語(yǔ)料庫(kù)的標(biāo)記等。尤其強(qiáng)調(diào)了語(yǔ)言分析的兩種觀點(diǎn),即第一,語(yǔ)言是信息的載體;第二,語(yǔ)言文本具有“解碼”意義的特征,即意義具有文本的部分語(yǔ)義,與“從文本到意義”過(guò)程是“從意義到文本”過(guò)程的反向推導(dǎo)過(guò)程。
3.簡(jiǎn)要評(píng)價(jià)
作為語(yǔ)料庫(kù)語(yǔ)言學(xué)方面研究的早期著作,本書(shū)從理論的角度對(duì)語(yǔ)料庫(kù)語(yǔ)言學(xué)中的理論現(xiàn)象進(jìn)行了較為系統(tǒng)的介紹,本書(shū)特色突出表現(xiàn)在以下三點(diǎn):
議題豐富,拓展了語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的理論范疇。綜合全書(shū)來(lái)看,一共收錄了十二篇論文或者研究會(huì)議記錄文章,主要論述了以功能語(yǔ)言學(xué)為理論基礎(chǔ),探討了話語(yǔ)分析及所涉及到的描述模型,文本到句子再到詞之間的理論研究。本書(shū)最大的亮點(diǎn)在于運(yùn)用具體的例子來(lái)闡述對(duì)理論的實(shí)際應(yīng)用,主要以語(yǔ)料庫(kù)數(shù)據(jù)的收集和檢索為主。比如在第二章的內(nèi)容中探討語(yǔ)言學(xué)和文學(xué)之間的關(guān)系,并提出了新的跨學(xué)科方向,即文體學(xué)(stylistics),文中就以“How Far can you go”的小說(shuō)為例詳細(xì)解釋了話語(yǔ)平面的交互性和自主性的特點(diǎn)。
理論具有一定的權(quán)威性,對(duì)本領(lǐng)域的研究仍然具有一定的參考價(jià)值。就目前而言,關(guān)于語(yǔ)料庫(kù)方面的研究,國(guó)內(nèi)外都已經(jīng)做出了相當(dāng)豐碩的成果,尤其是將語(yǔ)料庫(kù)作為一項(xiàng)語(yǔ)言研究方法來(lái)看,如語(yǔ)料庫(kù)與外語(yǔ)教學(xué)的研究,語(yǔ)料庫(kù)與計(jì)量語(yǔ)言學(xué)的研究,語(yǔ)料庫(kù)與翻譯方面的研究,語(yǔ)料庫(kù)與詞匯編撰的研究等等。相比之下,對(duì)于語(yǔ)料庫(kù)的理論建設(shè)方面則顯得頗有不足。因此,本書(shū)中所提及到的有關(guān)語(yǔ)料庫(kù)語(yǔ)言學(xué)的理論研究基本為學(xué)科建設(shè)起到了引領(lǐng)性作用,同時(shí)也受到了大家的普遍認(rèn)可,換句話說(shuō),算得上是目前語(yǔ)料庫(kù)方向研究的理論支撐,如本書(shū)中第一章對(duì)文本的研究,第二章當(dāng)中對(duì)動(dòng)態(tài)話語(yǔ)模型的介紹,以及第三章當(dāng)中對(duì)詞匯的詳細(xì)說(shuō)明和探究等。
視角多元化,注重多方觀點(diǎn)的互動(dòng)爭(zhēng)鳴。本書(shū)的觀點(diǎn)來(lái)自于世界的多個(gè)國(guó)家的學(xué)者,從各個(gè)不同的層面對(duì)文本到句再到詞分別進(jìn)行分析和研究。例如,在第一章當(dāng)中,有學(xué)者就提出話語(yǔ)的研究向語(yǔ)言形式方面的轉(zhuǎn)化。在第一章第二節(jié)中意義擴(kuò)展的例子中,Sinclair介紹了三種最小意義單位模型,即IA,IP和WP。不同的學(xué)者從不同的視角對(duì)詞和文本進(jìn)行了探索。
從本書(shū)可以看出,學(xué)者們?cè)诔跗谶€是對(duì)語(yǔ)料庫(kù)語(yǔ)言學(xué)的理論進(jìn)行了深入的討論和研究,具有一定的權(quán)威性,雖然語(yǔ)料庫(kù)語(yǔ)言學(xué)的研究與當(dāng)時(shí)所盛行的喬姆斯基理論相左,但是學(xué)者們通過(guò)努力依然找到了支撐其觀點(diǎn)的理論,并且使現(xiàn)在的語(yǔ)料庫(kù)應(yīng)用研究受到更多的關(guān)注,而運(yùn)用的領(lǐng)域也更加廣泛。
參考文獻(xiàn)
[1]Clear, J. H. (1993). “From Firth principles computational tools for the study of collocation” in Bakeretal.(eds). Text and Technology, pp. 271–292.
[2]Dijk, S. C. (1985). Functional Grammar (North-Holland Linguistic Seriesno.37), Amsterdam: North-Holland.
[3]Emmott , C. (1997). Narrative Comprehension: A Discourse Perspective. Oxford: Clarendon Press.
[4]Ravelli, L. J. (1991). “Language from a dynamic perspective: model singeneral and grammar in particular” . unpublished doctoral dissertation. thesis, School of English, Universityo Birmingham.
[5]Sinclair, J. M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.