• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機器翻譯實踐報告的學生譯者工具子能力培養(yǎng)研究

      2019-07-16 03:14:59許春翎郭琦
      電腦知識與技術 2019年15期
      關鍵詞:機器翻譯

      許春翎 郭琦

      摘要:人工智能的迅猛發(fā)展帶動了機器翻譯的普及和興盛。各種免費的在線翻譯網(wǎng)站投入使用,為語言學習者特別是學生譯者帶來了便捷。本研究根據(jù)翻譯專業(yè)二年級學生譯者提交的機器翻譯實踐報告,分析以谷歌翻譯為代表的國內外六大免費在線翻譯網(wǎng)站在處理和生成非文學翻譯文本方便取得的進步以及存在的局限。本研究論證在學生譯者工具子能力培養(yǎng)方面,翻譯教學可以有效地引導學生譯者合理使用機器翻譯以實現(xiàn)人機翻譯的目的。

      關鍵詞: 機器翻譯;在線翻譯網(wǎng)站;工具子能力培養(yǎng);學生譯者

      中圖分類號:TP311 ? ? 文獻標識碼:A

      文章編號:1009-3044(2019)15-0212-03

      1 人工智能時代的機器翻譯

      機器翻譯自1946年開始產(chǎn)生,經(jīng)歷了五個時期,即萌芽期、創(chuàng)立期、冷凍期、興盛期復興期和興盛期。學者們普遍認同從90年代開始,機器翻譯從基于規(guī)則的方法向基于語料庫的方法發(fā)展?;谡Z料庫的方法包含實例和統(tǒng)計兩種形式,后者更趨主導。機器翻譯研發(fā)團隊將基于統(tǒng)計的方法作為核心規(guī)則。2006年谷歌公司推出的谷歌翻譯(Google Translate)在線翻譯網(wǎng)站,其免費的翻譯服務為眾多用戶帶來便捷。谷歌翻譯網(wǎng)站的運行標志著數(shù)據(jù)驅動的統(tǒng)計機器翻譯活動成為商務機器翻譯系統(tǒng)的主流(趙應吉,2019:113)。2016年以來,谷歌翻譯發(fā)布的新一代端對端神經(jīng)翻譯系統(tǒng)研究技術突飛猛進發(fā)展,成為行業(yè)標桿,其翻譯的準確性和高效性遠遠超過統(tǒng)計機器翻譯。國內的幾大商用在線機器翻譯網(wǎng)站緊跟時代潮流,以神經(jīng)機器翻譯為核心技術,研發(fā)出符合中國人使用習慣的在線翻譯網(wǎng)站,提供便捷的機器翻譯服務。國內較為知名并在業(yè)界占領重要地位的機器翻譯網(wǎng)站如百度翻譯、搜狗翻譯、360翻譯和有道翻譯等。國際上除了谷歌翻譯占據(jù)顯著的地位,微軟研發(fā)的必應翻譯也獲得較好的口碑。

      2 機器翻譯與學生譯者工具子能力培養(yǎng)的關聯(lián)研究

      國際上針對工具子能力培養(yǎng)研究較為突出的是西班牙PACTE研究小組的翻譯能力培養(yǎng)理論和奧地利學者提出的“翻譯能力發(fā)展”(TransComp)項目。PACTE小組有關于工具子能力的定義是如何使用一些翻譯資源更好地為翻譯服務的能力,包括查詢詞典和使用網(wǎng)絡搜索引擎等能力。TransComp項目總結為工具和研究能力,類似前者的工具子能力,是譯者使用紙質和電子參考工具的能力,但也注重譯者的研究能力的提升。(朱玉彬,2015:34)

      馬會娟(2013)提到翻譯能力培養(yǎng)中,工具能力培養(yǎng)特別是譯者工具查詢能力的培養(yǎng)尤為重要,針對職業(yè)譯者而言,學生譯者是區(qū)別于職業(yè)譯者的一類特殊人群,未來計劃從事具體的翻譯工作,比如口筆譯方向,活躍在文學或是非文學翻譯領域的翻譯。對于高校中翻譯專業(yè)、英語專業(yè)翻譯方向和翻譯碩士等群體都是學生譯者的培養(yǎng)群體。

      縱觀機器翻譯的發(fā)展,機器翻譯分為全自動機器翻譯、機助人譯或計算機輔助翻譯(Computer Aided Translation)、人助機譯三類。就國內本科階段和研究生階段,學生譯者培養(yǎng)過程中,翻譯能力培養(yǎng)的子策略之一——工具子能力的培養(yǎng)來看,國內大多數(shù)的院校開設了計算機輔助翻譯課程,簡稱CAT。學者對于機器翻譯和翻譯教學的研究多聚焦在CAT領域。所以機器翻譯在進入第五個翻譯階段即興盛期時,仍無法脫離人工翻譯的審核和糾正,完全實現(xiàn)自動化,并將人工翻譯取而代之。

      人工智能時代的到來,機器翻譯的發(fā)展越發(fā)成熟,作為學生譯者,特別是未來有志于從事翻譯職業(yè)化工作的學生來說,學習必要的機輔技術、翻譯工具,學會使用在線翻譯網(wǎng)站和相關翻譯軟件,尤為重要。

      3 翻譯專業(yè)學生機器翻譯體驗報告的生成及分析

      本研究以某高校翻譯專業(yè)二年級兩個班級共57位同學提交的機器翻譯實踐報告為材料,匯總、分析學生譯者體驗國內外六大在線翻譯網(wǎng)站的評價。學生譯者根據(jù)不同翻譯網(wǎng)站生成的譯本,并結合自己對語篇的理解和翻譯,探討在人工智能高速發(fā)展的今天,機器翻譯特別是免費的在線翻譯網(wǎng)站免費在譯文生成的時效、譯文質量以及譯文存在的不足等重要問題方面展開討論。

      根據(jù)紐馬克對文本類型的劃分,非文學作品屬于信息型文本(informative text)主要用于傳遞信息或者客觀描述事實,采取直接的表達方式而不通過具體描寫形容的方法來呈現(xiàn)風格問題,但往往有其固定表達方式,一般較少涉及審美的活動。本次提交的學生譯者機器翻譯實踐報告均選用非文學文本,可以是科技翻譯、新聞翻譯、法律翻譯、旅游翻譯和政宣翻譯等文本材料,不少于300字以英譯漢作為實踐形式。學生譯者可以使用由教師推薦的國內外六大在線翻譯網(wǎng)站,即谷歌翻譯、微軟必應翻譯、百度翻譯、搜狗翻譯、360翻譯、網(wǎng)易有道翻譯。均是國內外知名的、免費的在線翻譯網(wǎng)站。

      73%的同學選擇科技類文本進行機器翻譯實踐。翻譯科技類文章,需要先了解科技文體的類型和受眾群體。科技文體包括科技專著、科學論文、科普讀物等,涉及自然科學、生物、物理技術等專業(yè)題材。其中,以科學論文和科普讀物來說,科學論文要求專業(yè)、嚴謹和精確、科普讀物的主要目的在于向大眾讀者傳遞有效的科學信息,譯者以普及科學知識為目的,語言表達上盡可能化繁為簡,但又不能任意刪減,使信息缺失。一定要做到邏輯上嚴密,語言表述上精準。

      本次機器翻譯實踐報告共57位學生譯者參與體驗,男女生比例為9:48。教師建議學生譯者在實踐報告中加上自己的翻譯部分,加深對原作的理解,對照機器翻譯的幾個譯本。自我完成作品的時候可以使用相應的翻譯工具,比如英漢詞典。對于當代的語言學習者,對于紙質工具書的使用率呈下降趨勢,過分依賴網(wǎng)絡在線查詞或APP查詞軟件。紙質工具書查閱能力、在線查詞能力和APP詞典使用能力等都是工具子能力培養(yǎng)的范疇。有些學生譯者只是簡單尋求詞義,而非將詞匯、短語等表達帶入具體的語境中,進而研究詞或短語的具體含義。在網(wǎng)絡連接時,一些較好的在線詞典或者是查詞軟件還是具有強大的詞庫功能,提供的例句釋義非常適合翻譯專業(yè)學生學習,掌握具體的詞匯或是短語在句型中的表達含義。

      4 學生譯者工具子能力培養(yǎng)和機器翻譯使用反饋

      基于統(tǒng)計的機器翻譯以短語為翻譯的基本單位,神經(jīng)為基礎的機器翻譯則以句子為翻譯的基本單位,大大提高了翻譯的準確度,對于句子翻譯的整體把握比之前的機器翻譯躍升了一個新臺階。有研究表明,當句子中單詞超過40詞時,長句翻譯情況不容樂觀。主要原因之一在于翻譯模型在解碼時,搜索算法更傾向于選擇短句生成最終翻譯。

      句子為翻譯單位有其局限性,盡管當代翻譯學理論普遍認可句子作為翻譯活動的基本單位,但不少翻譯家提出了應當以語篇為翻譯的基本單位,保證上下文理解的合理性、完整性、準確性和流暢性。目前的機器翻譯技術達不到以語篇翻譯為基本單位的標準。在學生譯者提交的機器翻譯實踐報告中,85%的學生提到機器翻譯在長句翻譯方面問題將較為嚴重,主要體現(xiàn)在句型語義理解錯誤、語法結構失誤等。

      從提交的57份機器翻譯實踐報告中得到評價,就機器翻譯而言,反饋最好的幾點內容如下:

      1) 在線翻譯網(wǎng)站最便捷之處在于詞匯方面的完成情況,特別針對專業(yè)術語、專有名詞的處理非常迅速。

      2) 機器翻譯因其強大的數(shù)據(jù)庫和語料庫等檢索功能為支撐,能較好地完成翻譯的初稿。

      3) 機器翻譯速度非???,從文本復制進入對話框,到文本生成基本1-2秒瞬間完成。這是人工翻譯無法比擬的。

      4) 就非文學翻譯文本完成情況來看,總體正確率在70—80%左右。讀者滿意度較高。

      5)專有名詞的處理,大多數(shù)完成情況較好,省時省力。

      從提交的57份機器翻譯實踐報告中總結存在要存在的問題如下:

      1) 長句翻譯問題最大。如英文原文本中的定語從句和狀語從句,在翻譯過程中,機器翻譯處理得過于冗長,晦澀難懂,邏輯不清。

      2) 無法結合上下文語境,靈活地翻譯某些詞匯的意義。詞匯在語境中的意義發(fā)生轉移,沒有考慮語境意義,產(chǎn)生錯誤。大多數(shù)直接使用常用語義。忽略熟詞生義。

      3) 譯文缺少一些相關的連詞連接,特別是表示邏輯關聯(lián)的詞語缺失。導致可讀性差,也使讀者理解產(chǎn)生偏差。

      4) 遇到英文長難句的時候,沒有適當添加標點符號,讀者閱讀困難。機器翻譯并未關注標點符號等細節(jié)問題。

      5) 逐字逐句翻譯,主要采用直譯的方法,生硬刻板,語義不通或者不符合表達習慣。

      6) 漏譯、誤譯等問題比比皆是。

      7)文本中縮寫形式的處理,經(jīng)常漏譯,錯譯。相關科普類詞匯翻譯得牛頭不對馬嘴。

      4.1長句翻譯和機器翻譯的處理

      原文:Researchers have demonstrated the longest laser ever built, using an optical fiber that could stretch from Washington, DC, to Baltimore.

      這是一篇研究激光的科技類文章,第一句是長句,在線翻譯網(wǎng)站有兩種翻譯處理方法,第一是直接切分開,第二是置于句中做修飾語。

      有道翻譯的譯文:研究人員用一種可以從華盛頓特區(qū)延伸到巴爾的摩的光纖展示了有史以來最長的激光器。

      百度翻譯的譯文:研究人員用從華盛頓特區(qū)延伸到巴爾的摩的光纖展示了有史以來最長的激光器。

      這兩種方法都存在不足,直接切分開,會使原文的邏輯結構斷裂,而置于句中做修飾語,使得修飾語過長,不符合漢語的表達習慣,且閱讀起來有一定的困難。

      4.2 語境意義表達不足和機器翻譯的生搬硬套

      在一篇和經(jīng)濟類新聞報告相關的應用文本中,對于原句里兩次出現(xiàn)的斜體字Doing business表達,谷歌翻譯在譯文中兩次均處理為《營商環(huán)境報告》,這是準確的。其他的機器翻譯也基本做到了至少一次的正確。只有360翻譯,在語篇處理時,都翻譯為“做生意”。

      在另一篇學生譯者選擇的有關信號傳輸?shù)目萍碱愇恼轮?,出現(xiàn)了“during the trip”這一表達,由上下文可知,trip是指在信號傳輸?shù)倪^程,而大多數(shù)網(wǎng)站都直譯為“旅程”。同一文本另一處,“offer a huge improvement for voice and data transmissions over long distance”。多數(shù)機器翻譯處理為“該技術為遠距離語音和數(shù)據(jù)傳輸提供巨大的改進”。生搬硬套,譯文不符合中國讀者閱讀習慣。360翻譯譯為“該技術可以極大地改善語音和數(shù)據(jù)的遠距離傳輸”。處理得較為得當。

      PRL, 在某一科技類文章中,指的是《物理預告快報》(Physics Review letters)期刊,沒有一個翻譯網(wǎng)站處理得當,全部是直接寫出縮寫形式PRL。

      4.3 標點符號等細節(jié)問題在機器翻譯中“不受重視”

      原文:The biggest of these is located halfway between California and Hawaii----and so littered with flotsam that it has been nicknamed the Great Pacific Garbage Patch.

      百度翻譯的譯文:在加利福尼亞和夏威夷之間散落著漂浮著的飄飄綽號“太平洋大垃圾”補丁。

      有道翻譯的譯文:其中最大的一個位于加利福尼亞和夏威夷之間,到處都是漂浮物,被稱為太平洋大垃圾補丁。

      谷歌翻譯的譯文:其中最大的一個位于加利福尼亞和夏威夷之間——因此散落著漂浮物,它被稱為太平洋大垃圾補丁。

      搜狗翻譯的譯文:其中最大的位于中間加利福尼亞和夏威夷之間到處都是垃圾綽號“太平洋垃圾”補丁。

      360翻譯的譯文:其中最大的一個位于加利福尼亞和夏威夷之間一直都是垃圾綽號大太平洋垃圾補丁。

      五大網(wǎng)站的翻譯對于指示代詞these都沒有翻譯出來,可見以句子為翻譯單位的機器翻譯,無法聯(lián)系上下文,實現(xiàn)篇章的完整分析。五個在線翻譯網(wǎng)站對于該句中3個常見單詞的語境意義把握失誤,如patch都翻譯成“補丁”,明顯是錯誤的,應當理解為“piece or area of land”。另一處“nickname”直接翻譯為“綽號”,不夠準確,文中應理解為“be called被稱為”,有道翻譯的處理較好。

      原句只有一處標點符號,即破折號,一般是對上一句的進一步說明,五大商用在線翻譯網(wǎng)站處理不同,三個在線翻譯網(wǎng)站生成的譯本中沒有任何標點,只有有道翻譯劃分意群,加上三處標點。另一處保留破折號。

      古代文獻中多沒有標點符號,后人為了方便閱讀加上了標點符號。對于中國人閱讀來看,標點符號的加入至關重要,特別對于長句斷句、意群劃分、方便閱讀起到重要作用。以上的機器翻譯完成情況不夠理想。

      5 結束語

      人工智能翻譯還是比較難取代人工翻譯,特別在文學翻譯領域。有關藝術類,比如文學創(chuàng)作,繪畫,音樂等,很難被取代。文學作品講究真情實感,要求譯者了解時代背景,更貼合作者內心感受。但是翻譯人員可以充分利用AI技術的發(fā)展,提高自身的水平。

      機器翻譯可以取代一些重復煩瑣或科學性比較強的材料。谷歌翻譯等在線翻譯網(wǎng)站在翻譯單個句子的時候,處理得較好,但是在長句處理時仍需火候。在翻譯的工作中,起到的是“協(xié)助”的作用,而不能安全地取代人工翻譯。機器翻譯為譯者提供了一個大概的譯文框架,后期則需要譯者不斷地修訂、潤色以增加譯文的可讀性,促進信息的有效、正確傳遞。

      68%的學生譯者對機器翻譯的未來發(fā)展趨勢做出了預測:隨著科學技術的不斷進步,AI行業(yè)的前景勢必更加開闊。各類在線翻譯網(wǎng)站目前還處于研發(fā)的中期階段,相信未來幾年會更加完善。但盡管如此,AI并不能完全取代翻譯人員。

      82%的學生譯者在翻譯報告中,明確指明機器翻譯的研發(fā)和發(fā)展為人類的進步和文明做出極大貢獻,但無法代替人工翻譯。最佳的方式是人機互譯,機器翻譯為輔,人工翻譯為主。人工翻譯建立在機器翻譯完成初稿的基本上,在此版本上修訂。學生譯者在機器翻譯報告書寫時,保持清醒的頭腦,做出明確的判斷。這和機器翻譯的時代,所處在的階段是吻合的。

      參考文獻:

      [1] Kastberg,P.Machine Translation Tools: Tools of the Translators Trade[J].Communication Language at Work, 2012(1).

      [2] PACTE. Building a Translation Competence Model. In F. Alves (ed.)Triangulating Translation: Perspectives in Process Oriented Research[M]. Amsterdam/Philadelphia: John Benjamins,2003.

      [3] 馬會娟 漢譯英翻譯能力研究[M]. 北京:北京師范大學出版社,2013.

      [4] 宋仕振 試論機器翻譯與人工翻譯的未來關系[J].未來與發(fā)展,2019(2).

      [5] 王湘玲,莫嬌,梁萍. 電子翻譯工具與EFL學生翻譯工具能力之培養(yǎng)[J].外語與外語教學,2010(6).

      [6] 趙應吉,劉寅齊,陳思瑩. 機器翻譯研究進展對翻譯職業(yè)化的影響[J]. 外國語文,2019(1).

      [7] 朱玉彬.雙語對應語料庫和學生譯者翻譯能力研究[M]. 北京:科學出版社,2015.

      【通聯(lián)編輯:梁書】

      猜你喜歡
      機器翻譯
      海量數(shù)據(jù)機器單詞中關鍵語義篩選方法研究
      機器翻譯不可盲取
      青春歲月(2017年1期)2017-03-14 11:28:47
      信息時代下機器翻譯的“可譯”與“不可譯”
      互聯(lián)網(wǎng)+新時代下人機翻譯模式研究
      考試周刊(2017年2期)2017-01-19 09:13:50
      “語聯(lián)網(wǎng)+行業(yè)” 助力中國偉大復興
      考試周刊(2017年2期)2017-01-19 09:12:54
      大數(shù)據(jù)背景下石油科技翻譯
      智富時代(2016年12期)2016-12-01 17:03:10
      機器翻譯不可盲取
      基于免費在線翻譯工具的機器翻譯缺陷探討
      漢哈機器翻譯中的文字轉換技術研究
      機器翻譯句法錯誤分析
      临高县| 日喀则市| 昭觉县| 华阴市| 罗江县| 中阳县| 广丰县| 合川市| 惠东县| 颍上县| 桦川县| 内江市| 专栏| 洞头县| 大港区| 建德市| 阜平县| 甘肃省| 叙永县| 临清市| 疏勒县| 高邮市| 宁阳县| 望奎县| 通榆县| 金平| 都江堰市| 陇南市| 内黄县| 台州市| 法库县| 城固县| 福安市| 大理市| 仪征市| 万源市| 古交市| 台前县| 汾阳市| 南京市| 安新县|