• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      機器翻譯與基于大數(shù)據(jù)語言服務(wù)技術(shù)的創(chuàng)新

      2013-04-29 13:03:34鄒啟立
      西江月·中旬 2013年8期
      關(guān)鍵詞:譯文文本語言

      鄒啟立

      【摘 要】技術(shù)可以讓語言服務(wù)變得更加輕松,簡單。同時技術(shù)也改變了人類傳統(tǒng)的溝通形式,促進了人類的交流,特別跨語言文化的溝通?;诖髷?shù)據(jù)的機器翻譯將是未來語言服務(wù)的主要形式和語言服務(wù)。

      【關(guān)鍵詞】機器翻譯;語言服務(wù)創(chuàng)新

      一、機器翻譯的歷史與現(xiàn)狀

      機器翻譯(Machine Translation)就是利用計算機程序把一種語言的文本(可稱為源語言文本)翻譯成另外一種語言的文本(可稱為目標(biāo)語言文本)(常寶寶,張偉1998.)。按照馮志偉(1994 , 1996)的說法,到 1980 年代,機器翻譯研究經(jīng)歷了草創(chuàng)期 、蕭條期 、復(fù)蘇期 、繁榮期等幾個階段。草創(chuàng)期以 1954 年在美國喬治敦大學(xué)用 IBM 計算機進行的首次機器翻譯實驗為標(biāo)志,這時的機器翻譯方法還比較簡單 , 基本上采用的是單純的查詞典和詞頻統(tǒng)計等方法,筆者這里稱之為樸素的統(tǒng)計方法。而 1964 年的 AL PAC報告將全世界的機器翻譯熱潮打入了冷宮。在 1970 年代,隨著喬姆斯基語言學(xué)的興起和人工智能研究的發(fā)展,人們普遍認為要實現(xiàn)機器翻譯必須對語言進行理解,在這種背景下,基于規(guī)則的機器翻譯方法開始發(fā)展起來 。進入 1980 年代以后,機器翻譯進入繁榮期,基于規(guī)則的機器翻譯方法逐步成熟,市場上出現(xiàn)了很多機器翻譯系統(tǒng)。但這種繁榮并沒有持續(xù)下去。1980年代末期到 1990 年代,人們發(fā)現(xiàn)基于規(guī)則的機器翻譯系統(tǒng)性能很難進一步提高 , 面向社會生活中使用的真實語言的時候,機器翻譯系統(tǒng)幾乎無法給 出有用的譯文 。筆者把這個階段稱為平臺期。也正是這個階段 ,基于語料庫的機器翻譯方法 開始被提出來并取得了一些進展,這包括基于實例的方法和基于統(tǒng)計的方法 。

      自1954年起,世界各國許多大學(xué)已經(jīng)展開了對機器翻譯的研究,但機器翻譯仍然沒有在商業(yè)領(lǐng)域大規(guī)模應(yīng)用。然而,上世紀八十年代開始,一些翻譯服務(wù)公司開始使用一種非常原始的翻譯輔助工具,通常稱為翻譯記憶庫(TM)。TM工具將句子譯文存入數(shù)據(jù)庫,這樣一旦需要翻譯的文件重復(fù)出現(xiàn)同樣的句子,譯者就可以直接使用它們?;诖思夹g(shù)而形成的計算機輔助翻譯(CAT)便應(yīng)用而生。相較TM而言,機器翻譯則指完全自動化。理論上機器翻譯能夠讓譯者失業(yè)。然而,機器翻譯技術(shù)輸出的譯文質(zhì)量無法達到出版及終端用戶使用的要求。因此,專業(yè)的翻譯服務(wù)行業(yè)還將會繼續(xù)存在多年,一邊為機器翻譯改進技術(shù),一邊對機器翻譯的譯文進行后編輯。

      二、語言服務(wù)的創(chuàng)新

      信息技術(shù)的發(fā)展促進了人類社會和文明的發(fā)展,使得世界變得越來越小,溝通越來越頻繁,翻譯量也越來越大,速度要求越來越快,甚至要即時翻譯的需求,這就為創(chuàng)新者提供了大量機會。這給傳統(tǒng)的翻譯行業(yè)帶來了巨大的挑戰(zhàn)。

      基于大數(shù)據(jù)的移動互聯(lián)網(wǎng)以更大的規(guī)模,更廣泛的覆蓋,正在取代其他網(wǎng)絡(luò)。而和服務(wù)密切相關(guān)的技術(shù)有三種,通訊和媒體技術(shù),互聯(lián)網(wǎng)和云計算技術(shù),自然語言處理技術(shù)。云計算是互聯(lián)網(wǎng)技術(shù)發(fā)展的必然成果,在語言服務(wù)領(lǐng)域,整合呼叫中心,視頻會議等記錄,就形成了云語言服務(wù)中心。自然語言處理技術(shù),解決人聽說讀譯的問題。

      大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊(引自百度百科)。大數(shù)據(jù)對翻譯行業(yè)的重要性不可低估。大數(shù)據(jù)將推動自動翻譯向前發(fā)展。大數(shù)據(jù)將能夠應(yīng)對包括機器翻譯在內(nèi)的自然語言處理的不同領(lǐng)域的挑戰(zhàn)。計算機將能夠自動運行語義聚類和類型識別處理,這就意味著計算機可以識別行業(yè)領(lǐng)域(如醫(yī)學(xué)和放射學(xué))和內(nèi)容類型(如說明書或?qū)@暾垼?/p>

      大數(shù)據(jù)對機器翻譯技術(shù)的持續(xù)改進和定制化至關(guān)重要。由于現(xiàn)代機器翻譯系統(tǒng)需要越來越多的平行數(shù)據(jù),而這樣大量的數(shù)據(jù)最終要達到使用傳統(tǒng)數(shù)據(jù)管理技術(shù)無法處理的極限,因此大數(shù)據(jù)技術(shù)已經(jīng)成為決定因素。如果計算機獲得更多數(shù)據(jù),也能夠更好地進行術(shù)語挖掘。大數(shù)據(jù)可以識別同義詞、相關(guān)術(shù)語、新詞、行業(yè)用語,并運用平行處理工具自動生成句法分類。簡單的統(tǒng)計翻譯模型發(fā)展成為包含(基于句法或?qū)R的)層次樹結(jié)構(gòu)的混合模型,使得機器翻譯引擎能夠進行遠距離調(diào)序,產(chǎn)生更流暢、準(zhǔn)確的譯文,這對于結(jié)構(gòu)差異大的語言對更是如此。

      在這個融合時代,需要翻譯的內(nèi)容正進一步從文檔和軟件版本轉(zhuǎn)變成零散的文本、在多個屏幕上發(fā)布的音頻和視頻。終端用戶、大眾或病人會比現(xiàn)在擁有更大的控制權(quán),他們將推動持續(xù)的翻譯流應(yīng)用。這個翻譯流包含有公務(wù)類(公司、公眾、立法)、社會類、共享類、增值類以及私人類信息。

      翻譯記憶軟件非常適合出版商提供的靜態(tài)文件的更新,但在翻譯用戶提交的動態(tài)內(nèi)容時會顯得力不從心。機器翻譯技術(shù)將更快地走向成熟,并成為翻譯服務(wù)業(yè)采用的首選工具。機器翻譯平臺將增加新功能,使專業(yè)用戶能夠添加數(shù)據(jù)(針對特定客戶或特定產(chǎn)品的翻譯記憶庫、詞匯表和目標(biāo)語文本),這些數(shù)據(jù)幾乎可以實時訓(xùn)練和定制化翻譯引擎。

      三、結(jié)語

      信息技術(shù)對大型國際活動中語言服務(wù)的作用及創(chuàng)新,隨著改革開放,國際化的不斷深入,中國經(jīng)濟各個領(lǐng)域都向世界敞開了大門,中國將成為全球下一個經(jīng)濟中心。各種國際交流活動,在我國各大中心城市舉辦,如何讓全球各個國家,各種語言的世界組織和人民進行充分的交流和溝通,語言成為關(guān)鍵。機器翻譯可用于每一項工作,與我們過去進行的成本高、耗時長的針對通用語言對的機器翻譯開發(fā)對比而言,今后機器翻譯的個性化開發(fā)可謂是巨大的進步。它將推動翻譯記憶庫數(shù)據(jù)的不斷擴大。對于每一個新的作業(yè),譯者將尋找匹配的數(shù)據(jù)。因此,對于數(shù)據(jù)的需求將是永遠無法滿足的。

      【參考文獻】

      [1]常寶寶,張偉.機器翻譯研究的現(xiàn)狀與發(fā)展趨勢[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),1998(2). [2]馮志偉.機器翻譯研究[M].中國對外翻譯出版公司,2004.

      [3]百度百科,http://baike.baidu.com/view/6954399.htm

      [4]張政.計算語言學(xué)與機器翻譯導(dǎo)論[M].北京:外語教學(xué)與研究出版社,2010.

      猜你喜歡
      譯文文本語言
      Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
      語言是刀
      文苑(2020年4期)2020-05-30 12:35:30
      譯文摘要
      在808DA上文本顯示的改善
      基于doc2vec和TF-IDF的相似文本識別
      電子制作(2018年18期)2018-11-14 01:48:06
      讓語言描寫搖曳多姿
      I Like Thinking
      累積動態(tài)分析下的同聲傳譯語言壓縮
      文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
      我有我語言
      吉木萨尔县| 那坡县| 南部县| 苍山县| 潍坊市| 广安市| 榆中县| 黑水县| 金昌市| 招远市| 色达县| 西乌珠穆沁旗| 杭锦旗| 云林县| 惠安县| 金山区| 皋兰县| 莆田市| 获嘉县| 神池县| 阜南县| 都兰县| 舒兰市| 昌都县| 湘潭县| 长沙市| 清原| 杭锦后旗| 济宁市| 合山市| 无锡市| 武宁县| 贡觉县| 苏尼特右旗| 乐昌市| 台湾省| 雅江县| 惠州市| 呼图壁县| 凌海市| 卢湾区|