• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      藏族文學(xué)典籍藏英漢語料庫多模態(tài)建設(shè)框架

      2017-06-10 20:02:01楊科王瀟
      電子技術(shù)與軟件工程 2017年11期
      關(guān)鍵詞:計算機輔助翻譯語料庫

      楊科++王瀟

      摘 要藏族文學(xué)典籍對外譯介如何取得更好的效果?借助計算機輔助翻譯軟件技術(shù)提高翻譯效率已成為高校和翻譯業(yè)界普遍探索的方向。本文梳理了目前計算機輔助翻譯技術(shù)在中文、英文和藏語翻譯中取得的成績,并提出了針對于藏英漢三語的計算機輔助翻譯系統(tǒng)和藏英漢平行語料庫的設(shè)計方案,重點圍繞在藏英漢平行語料庫設(shè)計中所涉及的藏民族文學(xué)典籍語料庫建設(shè)和維護(hù),以及藏英、藏漢雙語句段對齊等關(guān)鍵問題。

      【關(guān)鍵詞】語料庫 建設(shè)框架 藏族文學(xué)典籍 計算機輔助翻譯

      1 藏族典籍藏英漢語料庫的建設(shè)意義

      不同民族有不同的生產(chǎn)生活方式、文化傳統(tǒng)、風(fēng)俗人情等,由此形成了不同的文化資源,這些文化資源是中國少數(shù)民族文獻(xiàn)的重要組成部分。少數(shù)民族文獻(xiàn)是以語言為載體、能夠體現(xiàn)中國特色的文化要素。少數(shù)民族文化作為其不可或缺的重要組成部分,是我國各族人民共同擁有的寶貴精神財富和資源。而少數(shù)民族文獻(xiàn)是記錄有關(guān)少數(shù)民族在不同時期、不同地域、不同學(xué)科,以不同方式進(jìn)行社會實踐的知識和經(jīng)驗總結(jié)的所有載體。通過文字、圖像、音頻、視頻等多種途徑和媒介譯介少數(shù)民族文獻(xiàn),這對世界了解中國傳統(tǒng)文化精髓和少數(shù)民族的文化魅力,具有重要的現(xiàn)實意義。

      傳統(tǒng)的譯介載體主要是紙質(zhì)文件和口頭翻譯。不論是文學(xué)譯著,還是合同文書,都采用紙質(zhì)文件的形式保管和傳播??陬^翻譯傳統(tǒng)上包括同聲傳譯、交替翻譯和陪同翻譯。但多途徑譯介不僅包括傳統(tǒng)的紙質(zhì)和口頭形式,還應(yīng)充分利用當(dāng)前的多媒體手段,以便達(dá)到更好的保管和傳播效果。

      調(diào)查顯示,目前雙語語料庫有GCEPC ( General Chinese-English Parallel Corpus,北京外國語大學(xué)通用漢英對應(yīng)語料庫),ZCTC ( ZJU Corpus of Translational Chinese,浙江大學(xué)漢語譯文語料庫),ECCC ( English-Chinese Classics Corpus,英漢名著翻譯語料庫),ECPCSP( English-Chinese Parallel Corpus of Shakespeare's Plays,莎劇英漢平行語料庫),LPCC( Literature Parallel Corpus for Children,兒童文學(xué)平行語料庫) 以及各種多譯本語料庫。盡管這些語料庫的類型和目的各異,但針對少數(shù)民族語言并不多見。涉及少數(shù)民族語言與英語的雙語語料庫,更是少之又少;而考慮到翻譯成本、時間、精確度以及雙語翻譯人才的缺乏,建立一個這樣的雙語語料庫尤為顯得尤為重要。

      “英語翻譯語料庫大都是把真實的、已正式出版的譯文匯集起來,并可用計算機對其語言現(xiàn)象進(jìn)行統(tǒng)計、比較和分析”。語料庫有多種類型,確定類型的主要依據(jù)是它的研究目的和用途?!懊绹鴮W(xué)者馬克·本德爾認(rèn)為中國少數(shù)民族文獻(xiàn)翻譯主要有三種途徑:(一)基于第二種語言材料的翻譯;(二)同樣也是在第二語言的基礎(chǔ)上進(jìn)行的翻譯;(三)直接從語言A到語言B的翻譯”。第三種途徑可以減少兩次翻譯產(chǎn)生的“失真”,最大程度保留原文本的語言信息和文體風(fēng)格。但這種途徑對譯者提出很高要求,若是少數(shù)民族譯者,需精通英語并對其民族的文化有所感悟總結(jié),若是英語國家譯者,需要長期生活在少數(shù)民族地區(qū),深入了解至少一個少數(shù)民族的生活習(xí)慣、文化習(xí)俗、地理歷史。藏語民族典籍英譯雙語語料庫建設(shè)完成后,可以系統(tǒng)地為科研人員提供一個統(tǒng)一的規(guī)范的文獻(xiàn)翻譯來源,便于藏語語言學(xué)的研究和藏文信息處理等方面的科研的進(jìn)行。

      2 藏族文學(xué)典籍藏英漢語料庫多模態(tài)建設(shè)框架研究

      對于如何構(gòu)建語料庫主要總結(jié)幾個方面:

      (1)對于語素原料方面的收集,包括人名、醫(yī)藥名稱、重要歷史資料典故以及藏傳佛教專門術(shù)語等不常見的特殊名詞。

      (2)利用現(xiàn)代科技技術(shù)多媒體等方式用圖像手段進(jìn)行某些特定詞匯的錄入:比如“通過建立藏文人名構(gòu)成詞的成分屬性詞典,動態(tài)生成人名庫,利用傳統(tǒng)文法中人名上下文信息特征的文法規(guī)則建立藏文人名上下文指示詞庫對人名自動識別的方法?!?/p>

      (3)在文字語料庫建設(shè)的同時,需要針對藏族語言具體情況,積累語音、視頻、圖畫等多種形式的資料庫,為深入研究準(zhǔn)備。

      具體來講,根據(jù)做過的積累, 初步籌建:臧英民族事務(wù)語料庫;藏英文學(xué)典籍語料庫等具有特色和前期基礎(chǔ)的語料庫。

      3 具體實施策略

      3.1 創(chuàng)建過程中的難點及解決辦法

      創(chuàng)建語料庫的過程中,難點在于語料對齊。語料對齊有篇章、段落、句子、短語、詞語幾個截然不同的層次。如果用計算機程序做自動對齊,那不同的層次所要解決的問題也不同。如:

      段落對齊:每種語言的每個段落都有其獨特的標(biāo)志,所以段落對齊是最簡單的也是最容易實現(xiàn)的。

      句子對齊:在翻譯的過程中,語料大都來自人工翻譯, 句子之間并不都是一對一的翻譯模式, 還有一對多、多對多的翻譯模式;兩種語言中對應(yīng)譯文的句子長度不盡相等等原因?qū)е戮渥訉R難度不小。在這里,舉例“基于詞典的漢藏句子對齊,使用的是在動態(tài)規(guī)劃的框架下,尋找最優(yōu)對齊路徑的算法。

      3.2 語料庫建設(shè)過程

      3.2.1 語料選擇與收集

      在建設(shè)少數(shù)民族和英語雙語語料庫之前,為了讓翻譯者更好的通過觀察和描寫其翻譯語言,充分利用雙語平行對應(yīng)的語料,需要大量積累少數(shù)民族文獻(xiàn)典籍素材。其次,翻譯者需掌握少數(shù)民族語言與英語之間的轉(zhuǎn)換規(guī)律,為之后的翻譯研究、翻譯實踐等奠定堅實的基礎(chǔ)。具體有特點的有圖像與多媒體技術(shù)藏文人名自動識別研究。目前的藏文人名識別研究大多通過英語、漢語等語種的方法來研究藏文人名的識別,比如在《統(tǒng)計與規(guī)則相結(jié)合的藏文人名自動識別研究》一文中,“在處理漢族音譯人名情況時,采用姓氏驅(qū)動的方法,很好地解決了藏文文本中漢族人名的識別問題。實驗結(jié)果表明,該方法具有較高的準(zhǔn)確率和召回率?!?

      猜你喜歡
      計算機輔助翻譯語料庫
      《語料庫翻譯文體學(xué)》評介
      基于語料庫“隱秘”的詞類標(biāo)注初步探究
      把課文的優(yōu)美表達(dá)存進(jìn)語料庫
      CAT散文翻譯探析——以《我若為王》為例
      戲劇之家(2017年3期)2017-03-06 11:02:58
      新形式下計算機輔助翻譯實驗室建設(shè)探究
      亞太教育(2016年33期)2016-12-19 03:12:29
      計算機輔助翻譯系統(tǒng)在科技翻譯項目中的應(yīng)用
      論計算機輔助翻譯的智能化趨勢
      科技視界(2016年12期)2016-05-25 10:03:08
      計算機輔助翻譯環(huán)境下術(shù)語庫創(chuàng)建、應(yīng)用與術(shù)語管理
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      計算機輔助翻譯工具在WhenYouAreOld翻譯中的應(yīng)用
      胶州市| 前郭尔| 客服| 西充县| 新营市| 建水县| 高要市| 辽源市| 海盐县| 呼伦贝尔市| 五峰| 英德市| 陇川县| 罗平县| 武强县| 巫山县| 明星| 大名县| 交城县| 浦城县| 九江县| 常德市| 晋宁县| 左贡县| 略阳县| 皋兰县| 昂仁县| 靖州| 隆子县| 遵义县| 大悟县| 云和县| 山阴县| 安康市| 柳江县| 三门县| 泽州县| 彰武县| 合阳县| 福州市| 托里县|