• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    《詩經(jīng)》漢英平行歷時語料庫研制與應(yīng)用

    2020-05-05 03:10:12李廣偉
    關(guān)鍵詞:形符高頻詞歷時

    李廣偉, 岳 峰

    (1. 福建師范大學(xué) 外國語學(xué)院, 福建 福州 350007; 2. 南華大學(xué) 語言文學(xué)學(xué)院, 湖南 衡陽 421001)

    翻譯學(xué)研究領(lǐng)域于20世紀(jì)50年代盛行規(guī)范研究,80年代開始向描寫研究轉(zhuǎn)變。這種轉(zhuǎn)變與90年代譯學(xué)語料庫建設(shè)的興起共同促成了語料庫翻譯學(xué)的誕生[1]。在研究方法上,語料庫翻譯學(xué)以語言學(xué)理論為指導(dǎo),以概率和統(tǒng)計為手段,以真實語料為對象,對翻譯進(jìn)行歷時或共時研究,代表了一種新的研究范式[2]。而歷時語料庫可對各年代語言樣本進(jìn)行比較,發(fā)現(xiàn)語言運(yùn)用的歷時變化,進(jìn)而為翻譯研究、語言演化研究及翻譯語言與目標(biāo)語之間的互動研究提供數(shù)據(jù)支持[3]。

    《詩經(jīng)》是中國最經(jīng)典的詩體文學(xué)作品[4], 也是古代社會文化的重要載體[5]。自中西交流之始,《詩經(jīng)》便成為傳教士、漢學(xué)家、翻譯家和詩人的翻譯焦點(diǎn),呈現(xiàn)出復(fù)譯不斷、異彩紛呈的特點(diǎn)。據(jù)筆者統(tǒng)計,僅英語譯本就產(chǎn)生了26個(包含全譯本10個、選譯本16個),為增進(jìn)中西文化交流作出了重要貢獻(xiàn)。然而,《詩經(jīng)》翻譯研究仍然相當(dāng)薄弱,普遍缺乏科學(xué)的描述性研究。僅有吳曉龍、高博[6]等創(chuàng)建了理雅各韻文本、龐德譯本、許淵沖譯本和汪榕培譯本4個譯本的語料庫,不能客觀反映《詩經(jīng)》英譯的總體特征和歷時變化。

    本文擬對《詩經(jīng)》漢英雙語平行歷時語料庫的研制與應(yīng)用進(jìn)行研究,重點(diǎn)探討語料庫的設(shè)計、制作與基本應(yīng)用,以期對不同時期的譯本進(jìn)行數(shù)據(jù)化分析,揭示《詩經(jīng)》英譯的主要特點(diǎn)和整體風(fēng)貌,進(jìn)一步促進(jìn)《詩經(jīng)》在海外的傳播。

    一、研 制

    語料庫翻譯學(xué)的關(guān)鍵在于語料庫的研制,它是任何從事該領(lǐng)域研究的學(xué)者均無法回避的問題,也是至關(guān)重要的第一步[7]41。以下從語料庫的設(shè)計和制作兩個方面進(jìn)行探討。

    1. 語料庫的設(shè)計

    語料庫的設(shè)計是指語料庫的總體建設(shè)規(guī)劃[7]41,主要包括研制目的、歷時性和代表性3個方面。

    (1) 研制目的。建設(shè)語料庫的目的在很大程度上決定了語料庫的類型、庫容、屬性及其加工程度[7]41。本研究擬建設(shè)一個代表性較好又具有歷時性特征的漢英雙語平行語料庫,旨在探索《詩經(jīng)》漢英語言轉(zhuǎn)換規(guī)律和翻譯策略,考察翻譯文本的語言特征和譯者風(fēng)格,揭示潛藏于翻譯文本深處的帶有某種規(guī)律性的特征、用法和結(jié)構(gòu),從而為《詩經(jīng)》翻譯中特有的語言項在不同時期譯本中的歷時變化提供支撐。

    (2) 歷時性。歷時性是指所選語料在時間上要具有一定的跨度和連續(xù)性[8]。一般而言,歷時語料庫要有100年的時間跨度,也就是連續(xù)3代以上的語言使用者[3]。本研究根據(jù)查明建、謝天振《中國20世紀(jì)外國文學(xué)翻譯史》[9]的歷史分期與《詩經(jīng)》英譯本出版時間的先后順序,將《詩經(jīng)》英譯本分為19世紀(jì)70—90年代末期、20世紀(jì)初至新中國成立前、新中國成立后至改革開放前和改革開放后4個階段。研究收集的語料從理雅各1871年第一個全英譯本開始到安增才2000年全譯本結(jié)束,時間跨度達(dá)129年,充分保證了語料的連續(xù)性和歷時性。

    (3) 代表性。語料庫的代表性是指語料庫收錄的語料在多大程度上代表某一語言應(yīng)用的種類或文體[7]44。為了保證語料庫的權(quán)威性和代表性,《詩經(jīng)》源語文本選取了2012年上海古籍出版社出版的簡體中文版。該版本由中國第一代女教授、著名《詩經(jīng)》研究專家程俊英先生譯注。在英語譯本的選取方面,將10個英文全譯本全部收錄。選譯本主要選取不同時期、不同身份、有較大影響的譯者的文本,且選譯篇數(shù)不足20篇者不予收錄。所選譯本見表1。

    如表1所示, 4個階段共包含15個譯本, 譯者有傳教士、外交官、漢學(xué)家、詩人和大學(xué)教授,他們來自英國、美國、瑞典和中國4個國度。 對于影響較大的譯者,將其譯本全部收錄, 如理雅各,被稱為《詩經(jīng)》英譯的奠基人, 其1871年散體譯本、1876年韻文體譯本和1879年節(jié)選與宗教有關(guān)的選譯本均被收錄, 以便比較同一譯者對同一文本的不同處理方式和同一時代不同譯者對同一文本的處理方式, 以闡釋譯本的共時特征和歷時變化。

    2. 語料庫的制作

    語料庫的制作包含語料采集、語料加工、語料標(biāo)注、平行對齊4個方面,以下進(jìn)行簡要闡述。

    (1) 語料采集。語料采集是指將書面語料實現(xiàn)電子化,轉(zhuǎn)換為語料庫的指定格式。由于《詩經(jīng)》英譯本眾多,一些版本需要多方尋找獲得,如有從孔夫子舊書網(wǎng)購買的紙質(zhì)版本、有通過文獻(xiàn)傳遞的方式獲得的版本、有從網(wǎng)上下載的電子版本。對于紙質(zhì)版本,通常通過掃描的方式獲取PDF或圖片格式,然后采用QQ圖片文字提取功能提取所需文字,或采用“CS掃描全能王”實現(xiàn)文本電子化。對于下載的PDF版本,需要轉(zhuǎn)化成Word格式,然后中英文分別單獨(dú)保存為TXT文檔(Windows系統(tǒng)默認(rèn)編碼格式為ANSI),以便后期統(tǒng)一進(jìn)行加工處理。

    (2) 語料加工。語料加工是指將電子文本清潔去噪及進(jìn)行必要的標(biāo)注加工。掃描和網(wǎng)絡(luò)下載的電子文檔,都可能存在一些多余的空格、空行或亂碼,有必要對文本進(jìn)行清潔處理。目前,有多種工具可以實現(xiàn)文本清理功能,如“文本整理器”“TextForever”和“EmEditor”等軟件都可以對文本進(jìn)行批量清潔。在文本清潔后,還需要對漢語進(jìn)行分詞處理。漢語分詞一般采用中國科學(xué)院計算研究所張華平博士開發(fā)的漢語詞法分析軟件ICTCLAS 3.0進(jìn)行分詞處理。該軟件具有分詞和詞性標(biāo)注功能,針對現(xiàn)代漢語分詞準(zhǔn)確率高達(dá)97%[6]。但針對古代漢語準(zhǔn)確率卻不是很高,需要人工進(jìn)行后期檢查。完成分詞后,需要對中英文文本進(jìn)行句子切分,為在軟件中實現(xiàn)句對齊進(jìn)行預(yù)處理。研究以句號、分號、感嘆號、問號作為語句切分的標(biāo)記,句子切分在“EmEditor”軟件里批量完成。

    (3) 語料標(biāo)注。語料標(biāo)注是指對語料庫中的具體樣本的屬性或特征進(jìn)行描述[6]。常用的有COCOA參考系統(tǒng)模式。如CLEC( Chinese Learner English Corpus,中國學(xué)習(xí)者英語語料庫)的標(biāo)注方式,TEI(Text Encoding Initiative,文本編碼倡議)模式, BNC( British National Corpus,英國國家語料庫)的標(biāo)注方式。相比較而言,對于平行語料庫的標(biāo)注,使用TEI模式更為簡便,容易被用戶理解。根據(jù)TEI模式,本研究對語料進(jìn)行了篇頭信息標(biāo)注和篇體信息標(biāo)注。本語料庫的歷時信息主要在篇頭信息里進(jìn)行標(biāo)注,標(biāo)注符號見表2。

    表2 《詩經(jīng)》歷時語料庫篇頭信息標(biāo)注

    如表2所示,在篇頭信息標(biāo)注方面,共有序號、時間、譯者等8個標(biāo)注項目。主要采用了國際上通用的尖括號形式,其中〈〉為開始標(biāo)記,〈/〉為結(jié)束標(biāo)記。具體標(biāo)記內(nèi)容在尖括號內(nèi),全部用大寫字母進(jìn)行標(biāo)記,如譯者用TRANSLATOR標(biāo)記。篇體信息根據(jù)研究內(nèi)容進(jìn)行標(biāo)注,如詞性標(biāo)注,漢語采用ICTCLAS自帶的詞性標(biāo)注集,該軟件的最新版也可對英文詞性進(jìn)行標(biāo)注。

    (4) 平行對齊。平行對齊是指源語語料與目的語語料之間的翻譯關(guān)系或?qū)?yīng)關(guān)系,主要分為篇章、段落、語句和詞匯4個層面的對齊[7]49。對齊單位越小,對于翻譯研究越有價值,但難度也越高,目前還沒有專門實現(xiàn)漢英詞匯層面對齊的軟件。主要原因有二:一是漢語和英語差異的客觀存在,源語和目的語在詞語或語句層面并不都存在一一對應(yīng)關(guān)系;二是譯者主體性的存在,為了實現(xiàn)某種翻譯目的,如押韻,譯者會將一句源語譯作多個目的語語句,有時甚至?xí)霈F(xiàn)省譯的現(xiàn)象。因此,《詩經(jīng)》漢英平行語料庫在盡量實現(xiàn)句對齊的基礎(chǔ)上,以《詩經(jīng)》源語文本為基準(zhǔn),允許一對零、一對一、一對二或一對多等情況的存在,以方便多譯本平行檢索。雙語平行對齊可運(yùn)用新西蘭奧克蘭大學(xué)Michael Barlow教授開發(fā)的ParaConc軟件自動實現(xiàn),但仍需要人工進(jìn)行校對,該軟件可以對雙語文本進(jìn)行合并、分割、插入空行等操作。語料平行對齊后,需要保存平行語料。全譯本中英文同名存放,結(jié)尾以CH和EN進(jìn)行區(qū)分,不同版本英語EN后加序號。選譯本由于譯者選譯篇數(shù)不同,中英文放置同一文件夾,完成歷時語料庫的研制。

    二、 應(yīng) 用

    在《詩經(jīng)》漢英平行歷時語料庫研制基礎(chǔ)上,下文將對《詩經(jīng)》及其英譯的總體特征進(jìn)行考察,以揭示《詩經(jīng)》英譯的總體風(fēng)貌。為了便于比較,主要以不同時期的10個全譯本為例進(jìn)行闡釋。具體考察參數(shù)包括形符(tokens,語料庫中總詞數(shù))、類符(types,語料庫中不同單詞數(shù)量)、類符/形符(type/token ratio,TTR,類符和形符之間的比率)、平均詞長、句子總數(shù)、平均句長和高頻詞等。這些參數(shù)對展示翻譯文本的宏觀特征具有重要作用。以下將結(jié)合這些參數(shù)的統(tǒng)計數(shù)據(jù),從詞匯層面、句式層面和高頻詞的應(yīng)用3個方面逐一分析。研究運(yùn)用Wordsmith Tools 5.0對原文及譯文進(jìn)行了統(tǒng)計,具體數(shù)據(jù)見表3。

    表3 《詩經(jīng)》漢英平行歷時語料庫宏觀描述

    1. 詞匯層面

    在形符方面,表3顯示,《詩經(jīng)》原文形符數(shù)為23 362個,10個譯本形符的數(shù)量均明顯高于《詩經(jīng)》原文的形符數(shù),最高的是理雅各1876年譯本,達(dá)59 574個,是原文的2.55倍;最低的龐德譯本為38 029個,是原文的近1.63倍。這在某種程度上證明了目的語擴(kuò)張是翻譯顯化現(xiàn)象特征之一。Blum-Kulka認(rèn)為“翻譯過程會使譯文相對于原文更加冗長”[10],這可能是文學(xué)翻譯過程本身內(nèi)在的特征,與譯本的時代關(guān)系不大。

    在類符方面,從表3可以看出,原文類符數(shù)為5 946個。這一方面表明《詩經(jīng)》本身用詞特別豐富,傾向于變換詞匯來表達(dá)文本意義;另一方面,《詩經(jīng)》寫作時代單音詞較多,也會增加類符的數(shù)量。據(jù)考證,《詩經(jīng)》原文中疊音詞就達(dá)654個,草名有105個,馬名也有38個,而僅描寫手部動作的單音節(jié)動詞就有采、挹、投、搗、擊、攜等50多個。10個譯本中,類符數(shù)較高的詹寧斯譯本和龐德譯本,分別為6 630和6 141個。詹寧斯譯本類符數(shù)比原文多684個,這與其翻譯理念相吻合。詹寧斯主張翻譯應(yīng)該貼近原作。在其譯本序言中,詹寧斯寫道,“好的譯文應(yīng)該與原文在內(nèi)容和形式上一致”[11]21。當(dāng)時香港的一些著名漢學(xué)家也稱其譯本相當(dāng)接近原作[11]20。而龐德譯本形符最少,類符數(shù)僅次于詹寧斯。這與其意象派詩人的身份是相符的。意象派要求“詩歌要凝縮、簡練、含蓄, 突出意象美”[12]。為了突出意象美,作為意象派大師的龐德,可能創(chuàng)造了大量意象詞匯。而類符數(shù)最少的是許淵沖譯本,為4 329個。這可能是因為許淵沖為傳達(dá)《詩經(jīng)》的意美、音美和形美,有意識地降低了類符數(shù)量,以降低閱讀難度,使讀者“知之,好之,樂之”,最終使中國文化走向世界,使世界文化更加光輝燦爛[13]。

    在類符/形符方面,一般而言,類符和形符之間的比率是反映文本用詞豐富度的一個指標(biāo)。語料庫規(guī)模相同,類符/形符越大,說明用詞越豐富。但由于各譯本長度不一,為了便于比較,研究采用了標(biāo)準(zhǔn)化類符/形符(standardised TTR),也就是按照一定的長度(通常為1 000個形符) 分段計算文本的比值進(jìn)行比較。從表3可以看出,《詩經(jīng)》原文標(biāo)準(zhǔn)化類符/形符是48.27,說明在《詩經(jīng)》寫作時代古人就很重視用詞的豐富度了,這與類符呈現(xiàn)出的結(jié)果不謀而合。譯文文本位列第一的是龐德譯本,為49.61。這表明龐德十分注重用詞的豐富度,有很強(qiáng)的文學(xué)素養(yǎng),能夠創(chuàng)造大量詞匯傳達(dá)詩人情感[14]。而最低的是高本漢譯本,比值為36.96,這與高本漢翻譯《詩經(jīng)》的目的息息相關(guān)。高本漢在其譯本序言中說,“我的翻譯不彰顯文學(xué)性,而是盡可能采用直白的語言,為漢學(xué)專業(yè)的學(xué)生服務(wù),讓他們能夠熟悉這部在中國文學(xué)和文化史上具有重要地位的偉大作品”[15]。

    在平均詞長方面,10個譯本的平均詞長均在4.07到4.27之間變化,這和王克非教授統(tǒng)計的英語原創(chuàng)文學(xué)的平均詞長4.26相當(dāng)[16]58。同時,英語原創(chuàng)詩歌平均詞長在4.12上下浮動,也趨向于英語翻譯語料庫(TEC)小說子庫的平均詞長4.36[17]80,但卻遠(yuǎn)低于英語原創(chuàng)非文學(xué)的4.87,這可能表明英語的文學(xué)語言具有某種共性。詞長最短的是韋利譯本,為4.07。語料庫數(shù)據(jù)表明,韋利使用較短單詞(2、3、4個字母的單詞)的比例達(dá)到64.4%,明顯高于其他9個譯本,這些短詞多為虛詞和人稱代詞,說明其譯本口語化傾向明顯。

    2. 句子層面

    在句子總數(shù)方面,《詩經(jīng)》原文共有3 937句,7 284行。其中:4字組成的行數(shù)最多,達(dá)6 724處;5字次之,369處;3字158處:6字85處;7字19處;2字14處;1字7處;8字5處;最少的為9個字組成的句子,只有1處。這表明《詩經(jīng)》句式錯落有致,節(jié)奏感強(qiáng)。在10個譯本中,除了阿連壁、高本漢和龐德譯本句子總數(shù)較低外,其他譯本都與原文句子總數(shù)接近。最低的是高本漢譯本,只有1 565句,其原因在于,高本漢翻譯時基本上每節(jié)詩歌結(jié)束時才使用一個句號或感嘆號或問號,其余使用逗號或分號,而軟件在句子統(tǒng)計時默認(rèn)以句號、感嘆號或問號為一個句子結(jié)束。而阿連壁和龐德譯本句子總數(shù)少的原因在于二位譯者的創(chuàng)造性較強(qiáng)。比如,阿連壁有時為了傳達(dá)《詩經(jīng)》的意義,把整節(jié)詩翻譯為英語的一個復(fù)合句。這在某種程度上也是其翻譯思想的體現(xiàn)。阿連壁注重意義的傳達(dá),他在《關(guān)雎》譯文注釋中說,“本詩和其他大部分詩一樣,采用了意譯的方法,我無意遵循源語結(jié)構(gòu),但是希望能夠準(zhǔn)確地傳達(dá)原詩的意義”[18]。龐德是位創(chuàng)造性極強(qiáng)的詩人,通常運(yùn)用意象手法對《詩經(jīng)》進(jìn)行改造。這也是龐德翻譯觀的體現(xiàn),他認(rèn)為翻譯詩歌就如同創(chuàng)造新詩[19]。

    在平均句長方面,《詩經(jīng)》原文平均句長5.93,這是因為《詩經(jīng)》主要由四言句式構(gòu)成。10個譯本中,平均句長均高于《詩經(jīng)》原文的平均句長,但低于英語原創(chuàng)詩歌的平均句長24.14[14]。僅有龐德譯本21.88,接近原創(chuàng)詩歌,這可能是受《詩經(jīng)》原文句式影響造成的。

    3. 高頻詞應(yīng)用層面

    高頻詞是在一個文本里使用頻率特別高的詞語。一般以一個詞語在整個文本中占的百分比或者該詞語在整個詞頻中占的前后位置來決定該詞語是否為高頻詞[20]。

    研究仍然運(yùn)用Wordsmith Tools 5.0對各譯本中的前10個高頻詞進(jìn)行統(tǒng)計,基本數(shù)據(jù)見表4。

    表4 《詩經(jīng)》漢英平行歷時語料庫前10個高頻詞信息統(tǒng)計 %

    續(xù)表4

    文 本文 本12345678910汪榕培譯本(1995)the7.44and2.96in2.09to1.94a1.56of1.47is1.43I1.34my1.32are1.10安增才譯本(2000)the7.29and4.08of2.62to2.33is1.89in1.58are1.49a1.29I1.25with1.11

    從表4可以看出,《詩經(jīng)》源語文本高頻詞以助詞、代詞和介詞為主,這與王克非教授考察的漢語文學(xué)原創(chuàng)語料庫的高頻詞結(jié)果相符,其考察結(jié)果為:的、了、不、是、他、一、我、在、著、你[16]87-88。雖然《詩經(jīng)》文本體現(xiàn)了鮮明的古代漢語的特色,如之、兮、矣等詞,但這可能說明古代漢語的文學(xué)語言和現(xiàn)代漢語的文學(xué)語言在高頻詞使用上存在某些共性。而10個譯本排前10位的多為功能詞,如冠詞(the、a)、介詞(of、in、with)、代詞(I、my、our、you、he、his)、連詞(and、as、that)和系動詞(is、are)以及不定式符號或介詞(to)。這一結(jié)果與Olohan對TEC的考察結(jié)果基本一致[17]78, 也與BNC的統(tǒng)計相吻合,其位列前10位的詞為:the、of、and、to 、a、in、that、is、it、for。這表明英語文本無論是翻譯英語還是原創(chuàng)英語,排前10位的基本是無實際意義功能詞,這可能證明翻譯英語和英語本族語在高頻詞的使用上具有共性。值得注意的是,雖然譯本產(chǎn)生于不同時期,譯者身份迥異,但翻譯均受源語影響,譯本不可避免會呈現(xiàn)某些共性。表4顯示,10個譯本高頻詞的排序雖然略有差異,但是排前兩位的都是the和and,而且除了龐德譯本外,每個譯本均有人稱代詞I,而BNC排前10位的高頻詞卻并不包含I。

    三、 結(jié) 語

    以上分析表明,在《詩經(jīng)》英譯100多年的時間里,不同譯本在形符、類符、類符/形符、平均詞長、句子總數(shù)、平均句長和高頻詞使用方面都存在差異。這種差異產(chǎn)生的原因與譯者翻譯目的、翻譯理念和譯者身份息息相關(guān)。雖然譯者身份不同、時代不同、譯者主體性的發(fā)揮程度不同,但譯本的產(chǎn)生都深受源語文本的深刻影響。翻譯研究者不能脫離源語進(jìn)行所謂的翻譯研究,而應(yīng)把研究原文在不同譯文中的呈現(xiàn)方式與傳播效果相結(jié)合,這樣才可能對我國優(yōu)秀文化的對外傳播更有意義。有必要指出的是,本研究只是對《詩經(jīng)》英譯的總體狀況進(jìn)行了考察,具體譯本的特征及其形成原因有待深入探討。未來研究將在揭示不同時代的譯本特征、譯者風(fēng)格、譯者主體性發(fā)揮及形成原因等方面進(jìn)行繼續(xù)探索,以推動《詩經(jīng)》英譯研究不斷向前發(fā)展。

    猜你喜歡
    形符高頻詞歷時
    近二十年形聲字形符研究綜述
    從形符與字義的關(guān)系角度論《說文解字》中形聲字分類
    ——以“人”“彳”字部為例
    30份政府工作報告中的高頻詞
    小康(2022年7期)2022-03-10 11:15:54
    省級兩會上的高頻詞
    小康(2022年7期)2022-03-10 11:15:54
    量詞“只”的形成及其歷時演變
    常用詞“怠”“惰”“懶”的歷時演變
    28份政府工作報告中的高頻詞
    小康(2021年7期)2021-03-15 05:29:03
    省級兩會上的高頻詞
    小康(2021年7期)2021-03-15 05:29:03
    留學(xué)生形聲字教學(xué)實踐研究
    ——以滿洲里學(xué)院為例
    對《紅樓夢》中“不好死了”與“……好的”的歷時考察
    东宁县| 津市市| 光山县| 平顶山市| 沁源县| 阜阳市| 广河县| 华宁县| 衡东县| 黄骅市| 沂水县| 河北省| 惠水县| 澳门| 岐山县| 黄冈市| 广河县| 天等县| 灌阳县| 兴业县| 聂荣县| 凤山市| 乡宁县| 海盐县| 莱芜市| 凤台县| 东阳市| 宝山区| 石渠县| 武胜县| 青川县| 鄯善县| 盐津县| 博罗县| 余姚市| 江源县| 朝阳市| 山东| 商洛市| 巴塘县| 铁岭市|