[提要] 隨著深度學(xué)習(xí)等技術(shù)在人工智能的應(yīng)用,人工智能翻譯水平正在快速進步。人工智能翻譯具有快速、效率高、不會疲勞的優(yōu)點,也存在翻譯機械、生硬、整體匹配性差的問題,當(dāng)前的人工智能翻譯水平離人們的預(yù)期還有不少差距。在市場應(yīng)用方面,人工智能翻譯不斷推出在線翻譯服務(wù)、翻譯機等新產(chǎn)品。在市場應(yīng)用前景方面,人工智能翻譯市場潛力巨大。未來,人工智能翻譯將完全可以和人工翻譯媲美。
關(guān)鍵詞:人工智能;語言翻譯;應(yīng)用;前景
中圖分類號:F713.5 文獻標(biāo)識碼:A
語言是人們之間交流的工具,是人類發(fā)現(xiàn)世界、探索世界的重要手段,其重要性不言而喻。人類語言復(fù)雜多樣,不同語言之間無法直接溝通,需要翻譯轉(zhuǎn)換,由此便產(chǎn)生語言翻譯需求并逐步發(fā)展成為語言翻譯服務(wù)產(chǎn)業(yè)。隨著人們對更便捷、高效的語言轉(zhuǎn)換能力的追求,人工智能翻譯應(yīng)運而生,并伴隨著新技術(shù)的發(fā)展,逐步走進人們的生活。
(一)人工智能與人工智能翻譯。人工智能(AI),也稱機器智能,指由人類制造出來的機器所表現(xiàn)出來的智能,通過模擬人類的意識、思維,代替人類實現(xiàn)認(rèn)知、分析、決策等多種功能;亦指研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能翻譯又稱機器翻譯,指運用人工智能的方法和手段,通過計算機途徑而非人工的手段,將一種自然語言轉(zhuǎn)換成另外一種目標(biāo)自然語言的技術(shù),該技術(shù)融合了語言學(xué)、計算機科學(xué)、統(tǒng)計學(xué)、腦神經(jīng)學(xué)等多門學(xué)科知識。
(二)發(fā)展歷程。自1956年麥卡賽等人提出“人工智能”概念以來,經(jīng)過60多年的發(fā)展,人工智能科學(xué)取得了長足進步,其發(fā)展歷程大致可以歸納為三個階段:第一階段:20世紀(jì)50年代末至20世紀(jì)80年代初,人工智能誕生并快速發(fā)展階段。該階段人們能夠制作出具有初步智能的機器,可以實現(xiàn)簡單的人機對話,但技術(shù)瓶頸難以突破,智能水平較為低級;第二階段:20世紀(jì)80年代初至20世紀(jì)末,人工智能模型突破并帶動初步產(chǎn)業(yè)化階段。該階段內(nèi)出現(xiàn)了專家系統(tǒng),但推廣應(yīng)用存在成本障礙;第三階段:從2000年至今,信息時代新一代人工智能階段。隨著互聯(lián)網(wǎng)的普及和傳感器、大數(shù)據(jù)的廣泛應(yīng)用,在此基礎(chǔ)上,人們將類腦計算、深度學(xué)習(xí)、強化學(xué)習(xí)等新技術(shù)引入人工智能,使其發(fā)展進入新的階段,人工智能呈現(xiàn)出爆發(fā)式、快速發(fā)展,智能化程度越來越高,在多個領(lǐng)域逐步替代了人類,但其未來發(fā)展存在諸多隱憂。
而人工智能翻譯的發(fā)展歷史最早可追溯到20世紀(jì)30年代,法國科學(xué)家阿爾楚尼首次提出用機器進行翻譯的觀點。1933年,一種利用機械裝置進行簡單的詞匯翻譯轉(zhuǎn)換的裝置申請專利,可以說是最早的機器翻譯。1947年,隨著計算機的發(fā)明,Warren Weaverr提出將計算機應(yīng)用到翻譯工作中。此后,伴隨著計算機的大發(fā)展,人工智能翻譯一直是人工智能研究最重要的領(lǐng)域之一。這一方面是由于語言在人類社會發(fā)展中的重要作用,讓機器理解人類語言,將是改變?nèi)藱C交互方式的重大變革,這是科學(xué)家們夢寐以求的;另一方面不同語言的相互轉(zhuǎn)換,即翻譯,則可以不斷拓寬人類認(rèn)知的邊界。
進入新世紀(jì),互聯(lián)網(wǎng)迎來了蓬勃發(fā)展:微軟、雅虎、谷歌、百度、網(wǎng)易等知名網(wǎng)絡(luò)公司都先后推出了網(wǎng)頁在線翻譯工具,利用人工智能提供翻譯服務(wù)。2011年,IBM公司推出Watson系統(tǒng),該系統(tǒng)在處理和理解人類自然語言方面取得了巨大進步。
2018年3月,微軟公司在《機器翻譯:中英新聞翻譯方面達(dá)到與人類媲美的水平》論文中宣布,其亞洲研究院與雷德蒙研究院聯(lián)合研發(fā)的機器翻譯系統(tǒng)在通用新聞報道的中譯英測試集上,達(dá)到了人類專業(yè)譯者水平。
2018年5月8日,谷歌公司在其年度Google I/O大會上推出一款Google Assistant,其不僅能聽懂人的話,還可以無障礙和人溝通,可以幫人訂餐、訂旅行社等,AI在與真人的對話中沒有出現(xiàn)任何滯后和邏輯錯誤,完美通過圖靈測試。這表明人工智能語言機器能夠完全識別理解人的自然語言,代表著人類在人工智能語言領(lǐng)域的探索取得了新的突破。
近年來,國內(nèi)在人工智能翻譯方面取得不斷進步,諸多科研平臺相繼成立。2011年9月,由中國科技大學(xué)和科大訊飛合作共建的語音及語言信息處理國家工程實驗室宣布成立,意在構(gòu)建我國語音及語言戰(zhàn)略性新興產(chǎn)業(yè)研發(fā)平臺。同年11月,全國首個翻譯中心“多語信息產(chǎn)業(yè)園”在武漢揭牌。
近年來,隨著人工智能在語音工程(包括語音識別和語音合成)、自然語言處理等方面不斷取得新突破,人工智能在語言翻譯上也不斷取得新的進展,并得以更廣泛地應(yīng)用在諸多領(lǐng)域。
(一)技術(shù)發(fā)展水平。在語音技術(shù)上,近年來,隨著深度學(xué)習(xí)的廣泛應(yīng)用,人工智能在語音工程方面取得了較大突破,語音識別的準(zhǔn)確率大幅提升,如Siri、Voice Search和Echo等取得了較大的突破,能夠在一定程度上實現(xiàn)不同語言間的交流以及語音向另一種文字的轉(zhuǎn)化。2016年10月,微軟美國研究院發(fā)布的一款語音識別系統(tǒng)實現(xiàn)了錯誤率為5.9%的新突破,這是人工智能第一次取得跟人類相似的語音識別錯誤率。圖1展示了2010年來人工智能在語音識別上的表現(xiàn)。(圖1)
在自然語言處理上,人工智能也取得了很大進展,尤其是機器翻譯方面取得較大突破。2011年2月,IBM公司的“Watson”系統(tǒng)在一檔綜藝節(jié)目危險邊緣中,進行自然語言的問答,打敗了兩位人類冠軍,表明了計算機自然語言處理能力的顯著提高。Google公司應(yīng)用了神經(jīng)機器翻譯系統(tǒng)(GNMT)的Google Translation系統(tǒng),能夠?qū)崿F(xiàn)完整句子的翻譯,是人工智能在機器翻譯上的一個標(biāo)志性突破。國內(nèi)的科大訊飛、騰訊、網(wǎng)易、百度等公司也都在機器翻譯上推出了免費在線翻譯產(chǎn)品,在中英互譯上取得較大的進展。
圖2展示了人工智能在自然語言處理上的表現(xiàn)。(圖2)
圖3為人工智能在機器翻譯上的表現(xiàn)。(圖3)
圖2、圖3分別展示了人工智能在句子翻譯和新聞翻譯兩個方面的表現(xiàn)情況。從圖3可以看出,使用機器翻譯自動評測方法——BLEU,雙語互譯質(zhì)量評估輔助工具)值方法,人工智能在機器翻譯上的得分并不高,遠(yuǎn)遠(yuǎn)無法滿足人們對新聞精度的要求。
(二)商業(yè)應(yīng)用情況。國內(nèi)外各大互聯(lián)網(wǎng)巨頭都在不斷拓展人工智能翻譯的市場,開發(fā)人工智能翻譯商業(yè)應(yīng)用。尤其是各大公司提供的網(wǎng)頁在線翻譯工具市場應(yīng)用廣泛,語言翻譯服務(wù)市場發(fā)展前景如火如荼。由于市場需求量巨大,一些公司因此關(guān)停了人工智能翻譯引擎,轉(zhuǎn)而提供付費翻譯服務(wù)。
在智能手機普及的今天,各大互聯(lián)網(wǎng)公司相繼推出了自己的翻譯類軟件APP。比較流行的翻譯APP如谷歌翻譯、有道翻譯官、百度翻譯等軟件,能夠?qū)崿F(xiàn)拍照翻譯、實時翻譯、語音翻譯等諸多功能,而且針對專業(yè)客戶提供更高級的付費專業(yè)翻譯服務(wù)。
與此同時,AI翻譯機成為人工智能語言和翻譯的最熱門商業(yè)產(chǎn)品。繼微軟、谷歌陸續(xù)推出自己的翻譯機之后,國內(nèi)的網(wǎng)易、搜狗、騰訊、科大訊飛、分音塔科技等公司也逐步推出了自己的翻譯機。目前,AI翻譯機取得了不俗的銷售業(yè)績,市場前景看好,且功能強大,語言翻譯識別更加精準(zhǔn)智能。以科大訊飛公司為例,該公司推出的一款訊飛翻譯機2.0,不僅支持中文與英、日、韓等33種語言即時互譯,而且能夠支持粵語、四川話、河南話等方言翻譯和拍照翻譯,并具備4G、WIFI和離線翻譯模式,其英語翻譯水準(zhǔn)最高可達(dá)CET-6級水平。
相對于人工翻譯而言,機器翻譯有快速、效率高、不會疲勞等優(yōu)點。在特定的規(guī)則設(shè)定下,翻譯軟件根據(jù)語料庫進行語言轉(zhuǎn)換、自動工作,能夠在較短時間內(nèi)完成大量文本的翻譯,大大超越了人工翻譯的速度,有時機器翻譯的速度甚至可達(dá)人工翻譯的5~6倍。此外,人工智能翻譯不受時間、地點的約束,可隨時隨地不間斷的翻譯,永不疲倦,這就大大降低了人工投入的成本。相對人工翻譯來說,對于一些低難度的單句和詞組翻譯,機器翻譯不會出現(xiàn)拼寫錯誤等低級失誤。
雖然人工智能翻譯相較于人工翻譯具有以上的優(yōu)點,但限于科技水平的發(fā)展,其不足之處也是顯而易見:機器翻譯相對人工翻譯顯得機械、生硬,整句翻譯能力相對較差。尤其是翻譯失誤現(xiàn)象無可避免,更不要說高級翻譯要求的“信、達(dá)、雅”標(biāo)準(zhǔn),因而現(xiàn)在的人工智能翻譯還遠(yuǎn)遠(yuǎn)未達(dá)到人們所期望的狀態(tài)。
下面的測試展示更為直觀。表1展示了隨機抽查的5款市場上比較流行的翻譯機(科大訊飛曉譯、科大訊飛譯唄、網(wǎng)易有道翻譯蛋、搜狗旅行翻譯寶、分音塔科技準(zhǔn)兒)的實測評價。(表1)
從實測結(jié)果來看,幾款翻譯機翻譯雖然準(zhǔn)確度表現(xiàn)較好(最差也有3.5分),但還是避免不了一定程度的翻譯失誤率。
(一)人工智能翻譯技術(shù)前景展望。類似于集成電路的摩爾定律,人類在科技上的進步呈加速的態(tài)勢。在引入深度學(xué)習(xí)等技術(shù)之前,人工智能用了50年的時間,才讓機器有初步智能,而從2006年加拿大多倫多大學(xué)教授杰弗里·辛頓提出深度學(xué)習(xí)的概念,到應(yīng)用該技術(shù)使電腦識別貓,用了6年時間,同樣利用深度學(xué)習(xí)技術(shù)開發(fā)的圍棋軟件Alpha Go Zero,能夠通過自我學(xué)習(xí)來進化,僅用3天時間就達(dá)到職業(yè)棋手幾十年刻苦訓(xùn)練才能達(dá)到的水平。目前,深度學(xué)習(xí)等算法已經(jīng)廣泛應(yīng)用在自然語言處理、語音工程等領(lǐng)域,并取得了突破性進展。利用谷歌公司論文中的深度學(xué)習(xí)新算法,不到兩年時間,國內(nèi)外人工智能自然語言處理技術(shù)取得突破,微軟公司的機器翻譯達(dá)到專業(yè)譯者水平、科大訊飛的翻譯機達(dá)到CET-6級水平,并在不斷地進化著。
可以展望,隨著深度學(xué)習(xí)技術(shù)的應(yīng)用,以及算法模型的持續(xù)優(yōu)化,不久的將來,人工智能在自然語言方面可以與人類實現(xiàn)無障礙交流,在機器翻譯方面,將完全可以和人工翻譯媲美。
(二)人工智能翻譯市場應(yīng)用前景展望。隨著世界經(jīng)濟一體化的深化,不同語言人們之間的交流更加頻繁,語言翻譯市場前景廣闊。以我國為例,目前我國語言產(chǎn)業(yè)從業(yè)人員約120萬人,每年僅英語學(xué)習(xí)市場年產(chǎn)值就超過100億元,翻譯和本地化業(yè)務(wù)年產(chǎn)值約120億元。語音和文字識別、鍵盤輸入、電子排版、搜索引擎、語音服務(wù)等語言技術(shù)產(chǎn)品已經(jīng)成為人們?nèi)粘I?、工作中的重要輔助工具。根據(jù)中國翻譯協(xié)會在《中國語言服務(wù)業(yè)發(fā)展報告2012》的數(shù)據(jù),我國“語言服務(wù)的企業(yè)達(dá)37,000余家,語言服務(wù)業(yè)總產(chǎn)值為1,517億元人民幣?!币猿鼍陈糜螢槔?,2017年中國出境旅游人數(shù)突破1.3億人次,消費達(dá)1,152.9億美元,隨著有良好教育背景以及喜好自由年輕一代游客的增多,選擇自助游的年輕游客越來越多,比例逐年升高,他們通常利用在線翻譯以及翻譯機輔助等方式解決語言溝通問題,因此業(yè)界普遍認(rèn)為,AI翻譯機是最有前途和潛力的AI產(chǎn)品之一。
當(dāng)前,我國政府正實施“一帶一路”,努力打造人類命運共同體。積極參與“一帶一路”倡議,加強與世界各國的互聯(lián)互通,必須加強與各國語言的互聯(lián)互通,人工智能翻譯正當(dāng)其時,隨著人工智能語言翻譯大規(guī)模商業(yè)化應(yīng)用,不僅自身市場規(guī)模巨大(千億級別),而且以語言為紐帶,輻射廣泛,帶動經(jīng)濟、文化等全方面交流,將有力地支撐著“人類命運共同體”這個超級話題。
(三)對當(dāng)前人工語言翻譯市場的沖擊。隨著人工智能的快速發(fā)展,其應(yīng)用范圍不斷拓展,在給人們帶來諸多便利的同時,也給人們帶來巨大沖擊,如許多工作也將會消失、失業(yè)問題等。對語言服務(wù)業(yè)來說,人工智能帶來的沖擊也是巨大的:比如翻譯行業(yè),雖然現(xiàn)在谷歌、百度、有道的免費在線翻譯體驗不太完美,但其每年都不斷進步,沖擊著翻譯市場。以中譯英市場價格為例,2000年左右,市場價格一般是2000元/千字,2010年左右,市場價格只有500元/千字,而目前市場報價普通類中英互譯1,000字200元以內(nèi),專業(yè)類中英互譯也只有200元出頭而已,人工翻譯價格在機器翻譯的沖擊下步步退卻。可以預(yù)見,將來,除高級翻譯之外,人工翻譯可能很難找到工作了。當(dāng)然,從目前機器翻譯的表現(xiàn)來看,人工翻譯和機器翻譯可以進行更好的錯位發(fā)展,即:機器翻譯多用于網(wǎng)頁翻譯、輔助翻譯等場合,人工翻譯主要用于外事活動、商務(wù)談判等高端場合。因此,未來的翻譯將是人和機器之間的良性耦合與互動。
人工智能翻譯水平正在快速進步,其進步速度之快可能大大超出人們的預(yù)期,人工智能翻譯可以讓人們騰出更多的精力和時間去從事那些有創(chuàng)造性、有意義的活動。當(dāng)前的人工智能翻譯水平離人們的預(yù)期還有不少差距,存在翻譯機械、生硬、整體匹配性差等問題,機器僅能夠取代翻譯當(dāng)中句法和結(jié)構(gòu)比較簡單、人們對翻譯結(jié)果要求不高的部分。但相信在不久的將來,人工智能翻譯將完全可以和人工翻譯媲美。在市場應(yīng)用前景方面,人工智能翻譯市場潛力巨大。
主要參考文獻:
[1]趙鐵軍.機器翻譯原理[M].哈爾濱工業(yè)大學(xué)出版社,2000.
[2]http://finance.sina.com.cn/roll.2018.3.15.
[3]徐艷平.我國語言產(chǎn)業(yè)研究的現(xiàn)狀與前景[J].黃河科技大學(xué)學(xué)報,2014.16(6).
[4]斯坦?!叭斯ぶ悄馨倌辏ˋI100)”專家小組(非盈利性項目AI Index).人工智能指數(shù)2017年度報告(中文版).
[5]賀宏志.給語言產(chǎn)業(yè)發(fā)展添把力[N].經(jīng)濟日報,2013.5.24.