• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      國內(nèi)外翻譯語料庫漫談

      2012-08-15 00:45:05
      關(guān)鍵詞:漢英語料平行

      熊 杰

      國內(nèi)外翻譯語料庫漫談

      熊 杰

      語料庫翻譯研究興起于20世紀(jì)90年代,并在隨后的十年迅猛發(fā)展。經(jīng)過十幾年的發(fā)展,國內(nèi)外學(xué)者已開發(fā)和建立起了多種類型和用途的翻譯語料庫,并且有很多已被運(yùn)用到了翻譯的研究中,成為翻譯研究中的一種新范式。通過檢索CNKI和萬方數(shù)據(jù)庫,對零星地分散在學(xué)術(shù)期刊論文中的國內(nèi)外所建立的各種翻譯語料庫進(jìn)行了梳理和總結(jié),旨在為使用語料庫來研究翻譯的學(xué)者在語料庫的選擇上提供便利,同時(shí)對今后翻譯語料庫的建立和開發(fā)提出自己的建議和構(gòu)想。

      語料庫;翻譯研究;語言學(xué)

      語料庫語言學(xué)經(jīng)過30多年的發(fā)展,已成為了現(xiàn)代語言學(xué)的一個重要分支。語料庫作為語言學(xué)的實(shí)證研究手段,幾乎可以應(yīng)用于語言研究的所有領(lǐng)域,如詞匯、語法、語篇、語言變異、文體學(xué)、歷史語言學(xué)等?!罢Z料庫幾乎在語言學(xué)所有的領(lǐng)域引發(fā)了一場革命”。[1]語料庫翻譯研究興起于20世紀(jì)90年代。1993年,英國學(xué)者M(jìn)ona Baker發(fā)表了《語料庫語言學(xué)與翻譯研究:啟示與應(yīng)用》一文,她在文中提出:利用大型的原文加譯文的語料庫,加上語料庫研究方法的探討,將使翻譯研究者得以揭示翻譯文本作為溝通媒介的本質(zhì)[2]。翻譯語料庫的誕生拓寬了翻譯研究的新視野,現(xiàn)已成為當(dāng)今描述翻譯研究領(lǐng)域的一種新的研究范式。隨著研究范圍的發(fā)展和擴(kuò)大,國內(nèi)外學(xué)者已開發(fā)和建立起了多種類型和用途的翻譯語料庫,并且許多已被廣泛應(yīng)用于實(shí)際的翻譯研究中。Baker(1995)把為不同研究目的設(shè)計(jì)的翻譯語料庫分為三類:第一類是平行語料庫(parallel corpus)。它是收集某種語言的原創(chuàng)文本和相應(yīng)翻譯成另一種文字的文本。第二類是多語語料庫(multilingual corpus)。它按照類似設(shè)計(jì)標(biāo)準(zhǔn)建立兩個或多個不同語言單語種語料文本組成的復(fù)合語料庫。它完全是原文文本,沒有翻譯文本。第三類是可比語料庫(comparable corpus)。它收集某種語言如英語的原文文本,同時(shí)也收集從其它語言翻譯成英語的文本。

      一、研究目的

      本研究選取中國知網(wǎng)(cnki)的《中國期刊全文數(shù)據(jù)庫》和萬方數(shù)據(jù)的《數(shù)字化期刊全文庫》作為調(diào)查范圍,對分散在各學(xué)術(shù)期刊論文中的國內(nèi)外所建立的各種翻譯語料庫進(jìn)行梳理和詳盡介紹,旨在為使用語料庫來研究翻譯的學(xué)者在語料庫的選擇上提供便利,同時(shí)對今后翻譯語料庫的建立和開發(fā)提出可資借鑒的建議和構(gòu)想。

      二、國外翻譯語料庫

      語料庫翻譯研究的范式最早是在西方發(fā)展起來的。它的發(fā)展與描述性翻譯研究有著密不可分的關(guān)系,可為描述性的翻譯研究提供大規(guī)模真實(shí)的描述性語料,從而促進(jìn)描述翻譯研究的理論發(fā)展。因此,它已成為了描述性翻譯研究強(qiáng)有力的武器。目前,國外建立的比較有影響的翻譯語料庫主要有以下幾種。

      1.英國翻譯英語語料庫(Translational English Corpus)。這是世界上第一個可比語料庫。它是1995年以貝克(Baker)為首的英國曼徹斯特大學(xué)科技學(xué)院語言工程系的翻譯研究中心(Centre for Translation Studies,Department of Langua Engineering,UMIST)創(chuàng)建起來的。截至目前,它的庫容為1000萬詞次。語料來源于英美翻譯家從德語、法語、西班牙語(包括西班牙的國語、南美洲和中美洲的西班牙語)、葡萄牙語(包括葡萄牙本國和巴西的葡萄牙語)、意大利語、希伯來語、威爾士語等翻譯過來的英語文本。這些英語來源于傳記、小說、報(bào)紙和飛機(jī)上的休閑雜志(in-flight magazines)等。其中小說占了文本的80%以上,它同飛機(jī)上的休閑雜志總占95%。TEC文本譯者都是以英語為母語的人,譯者中男女都有,而且多數(shù)文本都是1983年以后翻譯的,代表了當(dāng)代英語譯文的一般特征。另外,這些翻譯文本還負(fù)載了許多超語言特征,包括原文作者、譯者以及譯本本身的一些相關(guān)信息等,如,姓名、性別、國籍、地點(diǎn)和年代,文本的類型和字?jǐn)?shù)、譯文的源語和出版社/商名等。

      2.加拿大議會會議錄英法平行語料庫(Hansard Canadian English-French Parallel Corpus)。該庫是世界上第一個,也是最有名氣的平行語料庫。它主要由幾個子庫組成:會議錄樹庫(Hansard Tree bank),會議錄LDC平行語料庫(Hansard LDC Parallel Corpus)和翻譯搜索會議錄語料庫(TransSearch Hansard)。它的語料主要來源于1973-1986年加拿大議會會議的官方記錄,庫容為5000萬字。它的主題并不僅限于法律方面,還包括即興討論、書面材料和預(yù)備講演稿等多種文體。

      3.ECI/MCI語料庫(European Corpus Initiative Multilingual Corpus)。該庫容量大,語言豐富,標(biāo)注完備。它的容量為9800萬字,涵蓋了27種語言(如西班牙語、挪威語、葡萄牙語、俄語、漢語、日語等),由46個子語料庫組成,并用SGML語言標(biāo)注。

      除去以上的翻譯語料庫之外,國外還開發(fā)建立了其它一些翻譯語料庫,如Lancaster大學(xué)開發(fā)的MILLE項(xiàng)目、日本建成的英日翻譯語料庫(English-Japanese Translation Corpus)、英語-意大利語雙語語料庫、伯明翰大學(xué)建立的漢英平行語料庫、Maryland大學(xué)的圣經(jīng)平行語料庫(Bible of University of Maryland Paralle-l Corpus)、奧斯陸大學(xué)的英語/挪威語平行語料庫(ENPC:English-Norwegian Parallel Corpus)等。

      三、國內(nèi)翻譯語料庫

      國內(nèi)的翻譯語料庫雖然發(fā)展較晚,卻取得了巨大的可喜的成績。迄今為止,國內(nèi)建立的并被廣泛運(yùn)用的翻譯語料庫有如下一些。

      1.面向新聞領(lǐng)域的漢英翻譯語料庫。該庫是由北京大學(xué)計(jì)算機(jī)語言研究所、清華大學(xué)智能技術(shù)國家重點(diǎn)實(shí)驗(yàn)室和中國科學(xué)計(jì)算技術(shù)研究所共同開發(fā)建立的,包括中文語料約2000萬字,英文語料約1000萬單詞,涵蓋了新聞、科技文獻(xiàn)、政府公文、學(xué)術(shù)論文等內(nèi)容。

      2.當(dāng)代漢語翻譯小說語料庫(CCTFC)。該庫是一個單一語種語料庫。它庫容量為130萬詞,收入54部長篇翻譯小說和2部短篇小說集。這些小說主要是由1980年至2000年間正規(guī)出版的長短篇小說集中挑選出來的,譯自英、美、法、俄、德、日等11個國家8種語言。

      3.漢英和漢日平行語料庫。本語料庫是由北京外國語大學(xué)中國外語教育中心建設(shè)的,包括3000萬字/詞的漢英平行語料庫和2000萬字漢日平行語料庫。漢日平行語料庫收錄范圍包括中日近現(xiàn)代各時(shí)期的小說、詩歌、散文、傳記、政論、法律法規(guī)、政府工作報(bào)告等,譯文主要來自國家圖書館及日本學(xué)研究中心圖書館等藏有的日譯本和漢譯本。為兼顧多種研究目的,收錄中日名作共80種。原文和譯本全文收錄,部分名著收錄了多個譯本。全部語料原文與譯文實(shí)現(xiàn)了段落層面的對齊。本語料庫具備字符串檢索、句型檢索、特定組合詞語檢索、正則表達(dá)式檢索等適應(yīng)各種語言研究和翻譯研究要求的檢索功能,能夠?qū)χ腥瘴倪M(jìn)行雙向檢索,并能提取檢索結(jié)果對應(yīng)的譯文語料,實(shí)現(xiàn)同平臺中日文的同屏顯示。

      4.漢英雙語語料庫。該庫由香港科技大學(xué)開發(fā)和建立,收集和加工了香港立法委員會1997年以來的漢英雙語法庭判決。這是最早的包含漢語的大型平行語料庫之一。該語料庫文本經(jīng)過了預(yù)處理、切分、雙語對齊和標(biāo)注。

      除了上述所提及的語料庫之外,國內(nèi)還有Sinorama漢英平行文本語料庫(Sinorama Chinese-English Parallel Text Corpus):較早的平行語料庫,由高照明收集臺灣Sinorama(光華)雜志雙語文章所建立的;蘭開斯特漢英平行語料庫(Chinese-English Parallel Corpus:CEPLC);Babel英漢平行語料庫(The Babel English-Chinese Parallel Corpus);漢外多語翻譯庫(Multiple-Translation Chinese Corpus);香港新聞平行文本語料庫(Hong Kong NewsParallel Text Corpus);漢英會議口譯平行語料庫(Chinese-English conference interpreting corpus)等。

      從以上所搜集到的語料庫來看,目前全世界的翻譯語料庫以平行語料庫居多,單一語種語料庫較少。然而,他們大多為印歐語系的語料庫,并且他們中可以真正用于研究的并不多。當(dāng)前,我們?nèi)狈Υ笠?guī)模的印歐語系與其它語系(特別是亞洲語系之間)以及亞洲語系之間的平行語料庫。這是因?yàn)檎Z系不同,開發(fā)和構(gòu)建平行語料庫所使用的工具及對齊技術(shù)也各異,且每種對齊技術(shù)各有優(yōu)缺點(diǎn),這就使大型平行語料庫的建設(shè)變得相當(dāng)困難。就中國國內(nèi)目前的翻譯語料庫來看,英漢的雙語平行語料庫居多,漢語與其他外語以及國內(nèi)少數(shù)民族語言的翻譯語料庫都還處于初創(chuàng)階段。另外,專門用途的翻譯語料庫所涉及的學(xué)科門類還有待拓展。因此,在未來翻譯語料庫的建設(shè)上還有極大的發(fā)展空間,我們應(yīng)當(dāng)將注意力集中放在漢語與其他外語以及國內(nèi)少數(shù)民族語言的翻譯語料庫的開發(fā)和建設(shè)上,同時(shí)加大對專門用途翻譯語料庫的開發(fā)。

      [1]McEnery,T.Xiao,R.and Tono,Y.Corpus-Based Language Studies——An advanced Resource Book,Routledge,2006,4.

      [2]黃俊紅,黃萍,范云.專門用途語類翻譯平行語料庫研究述評[J].重慶大學(xué)學(xué)報(bào)(社會科學(xué)版),2004,(6).

      責(zé)任編輯:郭一鶴

      H313

      A

      1671-6531(2012)04-0028-02

      猜你喜歡
      漢英語料平行
      向量的平行與垂直
      平行
      逃離平行世界
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      話題鏈在漢英篇章翻譯中的統(tǒng)攝作用
      從目的論看環(huán)保公示語的漢英翻譯
      再頂平行進(jìn)口
      汽車觀察(2016年3期)2016-02-28 13:16:36
      華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
      《苗防備覽》中的湘西語料
      漢英文字的幽默修辭功能淺探
      語言與翻譯(2014年1期)2014-07-10 13:06:14
      宜州市| 柳河县| 天门市| 雅江县| 沅陵县| 庄浪县| 湖口县| 南宫市| 黄梅县| 织金县| 驻马店市| 巴林左旗| 苍溪县| 堆龙德庆县| 沂南县| 开化县| 鸡泽县| 遂川县| 山阴县| 台中市| 泗阳县| 安图县| 庆元县| 故城县| 博乐市| 连城县| 万全县| 连南| 镇江市| 宜丰县| 台南县| 虞城县| 盈江县| 玉环县| 利川市| 龙川县| 庆安县| 彭山县| 高州市| 金坛市| 马关县|