李毅鵬
(東莞職業(yè)技術學院應用外語系 廣東東莞 523808)
語料庫翻譯學研究探索
李毅鵬
(東莞職業(yè)技術學院應用外語系 廣東東莞 523808)
語料庫翻譯學是基于語料庫語言學和計算機科學的發(fā)展而興起的一個全新的翻譯研究與實踐領域。語料庫翻譯學可以為翻譯研究和實踐提供大量實證數(shù)據(jù),不僅可以促進翻譯理論與實踐的發(fā)展,同時大大提高譯員的工作效率和計算機翻譯的準確性。通過對語料庫翻譯學的發(fā)展進行概述性介紹,希望能將一種新的研究思維和研究工具提供給廣大翻譯研究人員和翻譯工作者參考。
語料庫;翻譯學;計算機翻譯
語料庫翻譯學是翻譯研究與翻譯實踐的全新領域,它將各種具有不同特點的不同類型語料庫應用到傳統(tǒng)的翻譯研究和實踐當中,為廣大翻譯研究人員和翻譯工作者提供大量實證統(tǒng)計數(shù)據(jù)和巨量真實的翻譯參考實例,促進了翻譯理論研究的發(fā)展,并有效地提高了譯員的翻譯效率以及基于語料庫計算機翻譯系統(tǒng)的準確性。
語料是語言的記錄,是研究語言和翻譯的重要素材。按照一定的語言原則,運用隨機抽樣方法,收集自然出現(xiàn)的連續(xù)的語言、文本或話語片段而建成的具有一定容量的大型電子文本庫就是一個語料庫[1]。語料庫翻譯學就是以語料庫為基礎,通過定性和定量的分析方法對目標語和源語進行實證研究。運用語料庫研究翻譯的方法興起于20世紀50年代,受到當時眾多翻譯研究人員的關注;隨著語料庫規(guī)模不斷增大和計算機處理能力日益強大,自20世紀90年代至今,語料庫翻譯學已經成為翻譯研究中發(fā)展最快、成果最多的領域。語料庫的出現(xiàn)大大促進了語言學的發(fā)展,特別是對比語言學、語法學和詞典編撰學等領域,研究者們創(chuàng)建了許多國際性的大型語料庫,并通過這些語料庫挖掘出了大量珍貴的翻譯實證數(shù)據(jù),顯著推動了翻譯普遍性、翻譯規(guī)范和譯者風格的研究與探索。
眾所周知,翻譯學是一門經驗科學,主要是描述經驗世界所存在和發(fā)生的翻譯現(xiàn)象以及建立可以解釋和預測這些現(xiàn)象的普遍原則。語料庫語言學是一種基于語料庫的語言研究方法,以真實的語言數(shù)據(jù)為研究對象,對大量的語言事實進行有規(guī)律的分析,通過考察語言的實際運用來尋找語言使用的規(guī)律。翻譯學與語料庫語言學有許多的交集和相互可借鑒之處,在通過對語料庫的深入認識后,翻譯學家開始了借助語料庫研究翻譯。
英國著名翻譯家Mona Baker于1993年發(fā)表“Corpus Linguistics and Translation Studies:Implications and Application”一文,正式揭開了翻譯學和語料庫結合的序幕。自此以后,翻譯學家借助語料庫研究翻譯成為一種新趨勢。語料庫和翻譯研究的結合產生了一種連貫、綜合和豐富的研究范式,涉及翻譯理論、描寫和實踐等方面的諸多問題,已成為當代描述翻譯研究中的一種新范式[2]。
基于語料庫的翻譯研究方法將翻譯學家的研究重點從規(guī)定性轉移到描述性,補充完整了翻譯研究的范圍,使其涵蓋了從翻譯開始到翻譯完成的各種翻譯現(xiàn)象,包括共性、過程、轉換與規(guī)范、翻譯痕跡等。語料庫為整個翻譯領域提供了客觀真實的數(shù)據(jù)材料,有效地幫助研究者分析目標語文本和源語文本的普遍特征,驗證各種翻譯理論并預測翻譯發(fā)展的趨勢和潮流,其中語料庫對研究翻譯規(guī)范和翻譯普遍性所做的貢獻最大。
通過對海量的翻譯文本深入研究,翻譯學家發(fā)現(xiàn)了翻譯的規(guī)范性,探尋到翻譯文本都具有某些共同特征(普遍性),并將其歸納為翻譯的簡略化、明晰化、規(guī)范化和整齊化等。在規(guī)范性和普遍性研究中,可比語料庫貢獻最為突出??杀日Z料庫是以一種語言為基本語言、并收納此語言的原語文本和從其他語譯成該語言的文本的語料庫。盡管可比語料庫現(xiàn)在還處于初始階段,但可比語料庫相比平行語料庫和多語語料庫,其對翻譯研究意義最為深遠,通過可比語料庫里的文本分析,翻譯學家可探索和發(fā)現(xiàn)出翻譯活動的一些特殊規(guī)律[3]。
簡略化是指譯者無意識地簡化語言或信息,或兩者兼而有之[4],它有助于譯文更自然流暢和地道,讓目標語讀者更容易接受和讀懂譯文,一般表現(xiàn)在詞匯、句法和修飾手法上。貝克的弟子英國著名翻譯家Sara Leviosa通過自己所建的可比語料庫在研究了翻譯中詞匯、信息容載和句長的變化后發(fā)現(xiàn):①翻譯文本的詞匯范圍比非翻譯文本的詞匯范圍窄;②翻譯文本實詞與語法功能詞的比率低于非翻譯文本中實詞與連接詞的比率(即詞匯密度更低);③翻譯文本中的句子平均長度比非翻譯文本的要短[2]。而這些簡略化的現(xiàn)象基本與原語和目標語無關,幾乎存在于每一次的翻譯活動之中,特別是在幾種語言的相互翻譯活動中尤為顯現(xiàn)。
明晰化與可讀性有著明顯聯(lián)系,它指的是:在出現(xiàn)文化鴻溝時,譯者通過增加背景知識或信息的方法使譯文意義更加清楚和明晰,可讀性更強。它包括增補和具體化,增補是指譯者在譯文中增加一些語法功能詞和語法詞;具體化是指譯者對原文一些功能語法詞進行擴展和替代。明晰化表現(xiàn)在可選擇關聯(lián)詞、功能詞、連接詞、解釋性語句、修飾語、插入語、組織語的增減上。通過對可比語料庫的文本進行對比分析,翻譯學家發(fā)現(xiàn),組織語在譯文出現(xiàn)的概率要遠高于原文,可選擇性關聯(lián)詞也有類似的趨勢。目前,大量關于明晰化的研究仍然在進行當中。
規(guī)范化是指譯者通過各種方法使譯文更加貼近讀者的閱讀習慣。在語料庫出現(xiàn)之前,許多翻譯學者已對翻譯規(guī)范化展開了研究,但進展緩慢。語料庫的出現(xiàn)大大加快了研究速度。它包括將口語改成書面語,對專有名詞和帶有文化內涵的詞語進行歸化,改變時態(tài)加強譯文邏輯性,減少使用外來語,用簡單句替代原文奇特別扭的語句等。翻譯學家在對語料庫標點、措辭、句子結構和文本組織結構的研究中發(fā)現(xiàn),所有的譯者或多或少都對譯文進行了規(guī)范化,以靠近目標語讀者的閱讀習慣。
整齊化是語料庫翻譯學較新的研究成果,它是指譯文向連續(xù)體中心靠近的趨勢,減少和降低譯文文本的語言特征,使其變化小于非翻譯文本,讓不同的譯文文本在特定的語言學特征上傾向于彼此相似,使譯文具有更高的一致性。翻譯學家通過研究語料庫中的平均句長、詞匯密度、實詞與語法功能詞比率的統(tǒng)計數(shù)據(jù)得出了這一結論。
語料庫除了對翻譯普遍性研究產生了巨大推動作用外,對翻譯規(guī)范研究也做出了許多貢獻。由于翻譯活動是在特定的社會文化背景中進行的,翻譯策略和產品必然受到語言規(guī)范和社會規(guī)范的制約[5]。對于研究這些涉及不同歷史時期不同社會文化和意識形態(tài)的宏觀翻譯規(guī)范,需要巨量的資料收集和大量的統(tǒng)計分析,在語料庫出現(xiàn)之前其發(fā)展非常緩慢,在研究多語翻譯規(guī)范時尤為困難。語料庫特別是超大規(guī)模的可比語料庫和多語語料庫給翻譯學家?guī)順O大方便,能夠在相對較短的時間里為翻譯學家提供大量珍貴可靠的統(tǒng)計數(shù)據(jù)。通過對多語語料庫的研究發(fā)現(xiàn),在法語、阿拉伯語和日語三種文本翻譯中,日語文本對翻譯中外來詞的容忍度遠遠高于法語和阿拉伯語[6]。
語料庫在翻譯實踐中占有重要地位,在三種語料庫中,平行語料庫對翻譯實踐的貢獻最大,它能提高翻譯的效率、準確性和一致性。目前,大至跨國公司小至個人都開始自建平行語料庫,大多數(shù)翻譯企業(yè)和翻譯工作者都借助雙語平行語料庫開展工作。從事翻譯的企業(yè)進行大型翻譯項目時,通過語料庫來規(guī)定所有參與的翻譯人員對某些詞匯、短語和句子甚至段落的固定譯法;翻譯者個人進行翻譯時,能夠運用語料庫快速、準確地查詢到陌生原文所對應的譯文或近似的譯文,并在基于語料庫的計算機輔助翻譯軟件協(xié)助下,譯者直接復制和利用語料庫中跟原文完全匹配的譯文,這可大大提高重復率高原文的翻譯速度。據(jù)統(tǒng)計,利用語料庫開展工作可將重復率為30%的原文的翻譯速度提高5~7倍。
語料庫為計算機翻譯帶來了新希望。在語料庫出現(xiàn)之前,計算機翻譯只能依賴于詞匯轉換和語法規(guī)律進行翻譯,翻譯效果較差,對于簡單篇章準確率只有20%~30%,而對于較為復雜的文本一般只有10%左右,因此多被摒棄。自基于語料庫的翻譯系統(tǒng)出現(xiàn)后,譯員對計算機翻譯系統(tǒng)的態(tài)度大為改變,大部分的譯員都利用基于語料庫的翻譯平臺開展工作。目前,基于語料庫的計算機翻譯有基于統(tǒng)計和基于實例的兩種系統(tǒng),其中對翻譯準確率提高最為突出的是基于統(tǒng)計的計算機翻譯系統(tǒng)。這兩種方法的基礎都是巨型的雙語或多語平行語料庫。語料庫規(guī)模越大,文本對齊越整齊越精細,翻譯結果就越準確?,F(xiàn)在擁有世界最大語料庫的Google公司基于統(tǒng)計的計算機翻譯平臺,在某些專業(yè)領域的中英互譯準確率已經達到60%~75%,而在英語、法語、德語和西班牙語等歐洲語種間的某些專業(yè)領域互譯準確率可達90%以上,甚至某些語句的翻譯質量已高于人工翻譯?;谡Z料庫的計算機翻譯技術強化了計算機翻譯的自動處理能力,提高了翻譯工作效率。
基于語料庫的翻譯研究對過去的純翻譯研究提出的各種問題做出了回答,并在其他翻譯研究和實踐領域取得了豐碩成果。未來基于語料庫的翻譯研究將集中探討翻譯語言特征和翻譯風格的內在動因和機制,其優(yōu)勢將突出顯露在跨越國界和跨越學科的大型翻譯研究及翻譯實踐項目上,對研究準確率更高的基于語料庫的計算機翻譯系統(tǒng)必將產生積極深遠影響。
[1] 楊惠中.花語料庫語言學導論[M].上海:上海外語教育出版社,2002:33.
[2] Laviosa S.Corpus-based Translation Studies[M].Amsterdam&New York:Rodopi,1998:474.
[3] Mona,Baker.Corpora in translation studies:An overview and some suggestions for future research[J].Target,1995,7(2):223-243.
[4] Mona,Baker.Investigating the Language of Translation: A corpus-based Approach[A].in Fermandez,P.and J.M.Bravo(ed.).Pathways of Translation Studies[C].Valladolid:University of Valladolid,2001:47-56.
[5] Toury,Gideon.Descriptive Translation Studies and Beyond[M].Amsterdam and Philadelphia:John Benjamins,1995:167-268.
[6] Mona,Baker.Corpus Linguistics and Translation Studies:Implications and Applications[A].in M.Baker,G.Francis&E.Tognini Bonelli(eds).Text and Technology:In Honour of John Sinclair[C].Amsterdam and Philadelphia:John Benjamin,1993:233-250.
An Overview of Corpus-based Translation Studies
LI Yi-peng
(Department of Applied Foreign Languages,Dongguan Polytechnic,Dongguan 523808,China)
Focusing on the translation research and practice,corpus-based translation studies appeared along with the development of computer science and the corpus linguistics.It can provide great amounts of empirical data to translation studies and practice,which can not only promote the development of the theory and practice of translation,but also can improve the working efficiency of the translators and the accuracy of computer translation.The article is an overview of the corpus-based translation studies in the hope of providing a new thinking and tool for scholars and workers in the filed of translation.
corpus-based;translation studies;computer translation
book=68,ebook=68
H 059
A
1672-2434(2012)03-0071-03
2011-10-21
李毅鵬(1985-),男,講師,碩士,從事研究方向:語料庫翻譯學、計算機輔助翻譯