廉 勇
承德石油高等專科學(xué)校,河北 承德 067000
計算機輔助翻譯技術(shù)的發(fā)展趨勢與展望*
廉 勇*
承德石油高等??茖W(xué)校,河北 承德 067000
本文圍繞計算機輔助翻譯所遇到的矛盾,結(jié)合現(xiàn)代網(wǎng)絡(luò)與人工智能發(fā)展的最新成果,展望了計算機輔助翻譯技術(shù)的發(fā)展趨勢。
翻譯記憶技術(shù);大數(shù)據(jù);深層檢索;語音識別;云端;智能化;自適應(yīng)
翻譯記憶技術(shù)是計算機輔助翻譯的核心技術(shù),它在發(fā)展中遇到了該技術(shù)的發(fā)展因語言的重復(fù)而奏效與語言無限生成之間的矛盾,引用數(shù)據(jù)存儲模型和數(shù)據(jù)庫存儲模型雖然功能互補但卻無法完全兼容的矛盾以及記憶數(shù)據(jù)的僵硬死板與語言靈活多變之間的矛盾。這三種矛盾能否有效解決或緩解是構(gòu)成計算機輔助翻譯技術(shù)未來取得突破性進展的關(guān)鍵。
將翻譯記憶語料與術(shù)語語料等資源集中存儲在中央服務(wù)器的大數(shù)據(jù)中,擁有不同權(quán)限的工作站通過網(wǎng)絡(luò)連接到該服務(wù)器進行針對性檢索。語料資源的“中央”化,一方面可以使翻譯記憶匹配和詞語索引更全面、更新鮮、更可靠,檢索和維護也更便捷,另一方面通過資源集中也可實現(xiàn)對語料資源知識產(chǎn)權(quán)的有效保護,更能適應(yīng)信息情報安全維護的趨勢,有效防止類似美國“棱鏡”計劃的侵入。
從狹義上講,翻譯記憶資源就是對齊后的平行語料,而當(dāng)今翻譯記憶系統(tǒng)和技術(shù)的研發(fā)只是針對譯文的表層結(jié)構(gòu)。所以,當(dāng)前開發(fā)者們應(yīng)把目光投向如何結(jié)合語料庫的研究方法與開發(fā)技術(shù)并將翻譯記憶存儲的“數(shù)據(jù)模式”與“引用模式”有機結(jié)合起來揚長避短,使翻譯記憶庫針對已對齊的語料具有深層分析與檢索功能。
機器翻譯的發(fā)展與計算機輔助翻譯的發(fā)展即具有歷時性,同時又具有共時性,所以作為計算機輔助翻譯的核心技術(shù)領(lǐng)域“翻譯記憶”與機器翻譯的關(guān)系,也不例外。從機器翻譯與計算機輔助翻譯的歷時性看,后者是研究機器翻譯的過程中出現(xiàn)的一種折衷,并且日趨出現(xiàn)與前者共時性發(fā)展的前景。那么高質(zhì)量翻譯記憶語料素材自然也可運用在以統(tǒng)計和實例為基礎(chǔ)的機器翻譯系統(tǒng)中。
語音識別技術(shù)的發(fā)展是人工智能和云計算發(fā)展的結(jié)果,是翻譯記憶庫從筆譯服務(wù)走向口譯服務(wù)的關(guān)鍵。該自動語音識別技術(shù)的目標(biāo)是將人類的語音中的內(nèi)容轉(zhuǎn)化為計算機可識別的輸入內(nèi)容。自動語音識別發(fā)展至今,尤其是中小詞匯量非特定人語音識別系統(tǒng)識別精度已經(jīng)大于98%,對特定人語音識別系統(tǒng)的識別精度就更高。這些技術(shù)已經(jīng)能夠滿足通常應(yīng)用的要求。由于大規(guī)模集成電路技術(shù)的發(fā)展,這些復(fù)雜的語音識別系統(tǒng)也已經(jīng)完全可以制成專用芯片,大量生產(chǎn)??拼笥嶏w的語音引擎將文本文字轉(zhuǎn)成人聲語音朗讀的TTS語音庫,該引擎是目前世界上中文語音最好的、最逼真的。現(xiàn)在使用安卓手機也可以安裝訊飛語音庫,可以直接語音云轉(zhuǎn)換和識別,語音翻譯效果也很好。當(dāng)今手機市場的三大操作系統(tǒng)iOS,安卓和WP8所支持的三大語音助手Siri(蘋果S系列手機),Google Now和Cortana(微軟小娜),將人工智能語音服務(wù)推向了一個前所未有的高潮。
分布式技術(shù)與云計算技術(shù)的發(fā)展是分布式云端翻譯記憶庫和術(shù)語庫產(chǎn)生的關(guān)鍵。分布式技術(shù)是一種基于網(wǎng)絡(luò)的計算機處理技術(shù),與集中式相對應(yīng)。由于個人計算機的性能得到極大的提高及其使用的普及,使處理能力分布到網(wǎng)絡(luò)上的所有計算機成為可能。云計算技術(shù)是分布式計算技術(shù)的一種,其最基本的概念,是透過網(wǎng)絡(luò)將龐大的計算處理程序自動分拆成無數(shù)個較小的子程序,再交由多部服務(wù)器所組成的龐大系統(tǒng)經(jīng)搜尋、計算分析之后將處理結(jié)果回傳給用戶。微軟為語音助手Cortana特意打造了一個虛擬的記事本,并且這些待辦事項全部存于云端,如果愿意,用戶完全可以同好友分享信息,甚至是位置,興趣點等等。分布式云端技術(shù)對語音助手的貢獻如此,那么將來它對于翻譯記憶庫和術(shù)語庫的作用也不言而喻。
隨著科技的進步與社會的發(fā)展,智能化與自適應(yīng)已經(jīng)滲透到了生活的方方面面以及社會的各行各業(yè)。智能化是指由現(xiàn)代通信與信息技術(shù)、計算機網(wǎng)絡(luò)技術(shù)、行業(yè)技術(shù)、智能控制技術(shù)匯集而成的針對某一個方面的應(yīng)用;自適應(yīng)是指處理和分析過程中,根據(jù)處理數(shù)據(jù)的數(shù)據(jù)特征自動調(diào)整處理方法、處理順序、處理參數(shù)、邊界條件或約束條件,使其與所處理數(shù)據(jù)的統(tǒng)計分布特征、結(jié)構(gòu)特征相適應(yīng),以取得最佳的處理效果。微軟的語音助手Cortana最有用的部分在于自主性的學(xué)習(xí)能力和基于時間的觸發(fā)行動。隨著使用時間的推移,Cortana能夠?qū)W習(xí)你的發(fā)聲習(xí)慣,從而更準(zhǔn)確地理解你的意思,另外在了解你的喜好之后,理論上可以實現(xiàn)更智能化的主動式服務(wù)。翻譯軟件的智能化與自適應(yīng)的發(fā)展也應(yīng)該類似于微軟語音助手Cortana,使翻譯軟件的設(shè)計逐漸和現(xiàn)代電信技術(shù)、網(wǎng)絡(luò)技術(shù)、翻譯技術(shù)和智能控制技術(shù)相結(jié)合,在處理和分析翻譯材料過程中,根據(jù)其特征自動調(diào)整分析方法和處理條件,使其與所處理的翻譯材料語言分布特征、篇章、語段、語句、詞匯結(jié)構(gòu)特征等相適應(yīng),以取得最佳的輔助翻譯效果。
計算機輔助翻譯將以人工智能和云計算技術(shù)為核心,向著以語料庫為基礎(chǔ),以統(tǒng)計為導(dǎo)向,開發(fā)通用的翻譯工具發(fā)展;向著智能化、自適應(yīng)翻譯軟件發(fā)展;向著通用型、本地化的翻譯記憶庫和術(shù)語庫發(fā)展;向著智能語音識別技術(shù)使得筆譯走向口譯成為可能發(fā)展等等。它是數(shù)學(xué)科學(xué)、神經(jīng)計算科學(xué)、統(tǒng)計科學(xué)、計算機科學(xué)、語言科學(xué)和翻譯科學(xué)等跨領(lǐng)域、跨學(xué)科和跨行業(yè)的多種科學(xué)不斷發(fā)展合力而產(chǎn)生的豐碩成果,它未來的發(fā)展也必是其合力使然。
[1]http://baike.baidu.com.
[2]http://mobile.pconline.com.cn/520/5208797.html.
*2015年承德市科學(xué)技術(shù)研究與發(fā)展計劃項目《基于Trados翻譯平臺的承德市旅游文化翻譯項目集約增效管理研究》的部分研究成果(項目編號:20153020)。
H
A
**作者簡介:廉勇(1980-),承德石油高等??茖W(xué)校,英語教師,中國科學(xué)技術(shù)大學(xué),碩士研究生,從事英語翻譯、教學(xué)與研究工作。