• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于現(xiàn)代智能識(shí)別技術(shù)的英語(yǔ)機(jī)器翻譯模型

      2018-08-21 02:57:42張帆
      現(xiàn)代電子技術(shù) 2018年16期
      關(guān)鍵詞:英語(yǔ)翻譯

      張帆

      摘 要: 基于句法分析的英語(yǔ)機(jī)器翻譯方法無(wú)法解決智能識(shí)別技術(shù)中海量英語(yǔ)語(yǔ)言的部分結(jié)構(gòu)歧義導(dǎo)致機(jī)器翻譯準(zhǔn)確度低的問(wèn)題。因此,在分析智能機(jī)器翻譯工具輔助英語(yǔ)翻譯應(yīng)用的基礎(chǔ)上,設(shè)計(jì)與實(shí)現(xiàn)基于現(xiàn)代智能識(shí)別技術(shù)的英語(yǔ)機(jī)器翻譯模型。依據(jù)英文句子產(chǎn)生中文句子和對(duì)齊過(guò)程,基于英文句子獲取中文句子長(zhǎng)度、首個(gè)中文詞串的鏈接位置,獲取總體中文句子以及機(jī)器翻譯對(duì)在句子中的次數(shù)。采用基于最大熵的統(tǒng)計(jì)機(jī)器翻譯方法,通過(guò)直接最大熵模型訓(xùn)練得到相關(guān)參數(shù),獲取不同英語(yǔ)語(yǔ)言特征間的最佳組合方式,解決海量英語(yǔ)語(yǔ)言中的部分結(jié)構(gòu)歧義問(wèn)題,提高英語(yǔ)機(jī)器翻譯的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)的英語(yǔ)機(jī)器翻譯模型,具有較高的翻譯準(zhǔn)確度和穩(wěn)定性。

      關(guān)鍵詞: 智能識(shí)別技術(shù); 英語(yǔ)翻譯; 機(jī)器翻譯模型; 結(jié)構(gòu)歧義; 最大熵; 翻譯準(zhǔn)確度

      中圖分類(lèi)號(hào): TN915?34; H319.3 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)16?0151?04

      Abstract: The English machine translation method based on syntactic analysis cannot resolve the problem existing in intelligent recognition technology for part of structural ambiguity in the massive English language, resulting in low accuracy of machine translation. Therefore, an English machine translation model based on modern intelligent recognition technology is designed and implemented on the basis of application analysis of intelligent machine translation tool assisted English translation. Chinese sentences and alignment process are generated based on English sentences, Chinese sentence lengths and the link position of the first Chinese word string are obtained based on English sentences, and the whole Chinese sentences and the number of machine translated sentences are obtained. The statistical machine translation method based on the maximum entropy is adopted. The best combination mode of different English language features is obtained after obtaining related parameters by means of direct maximum entropy model training, so as to resolve the problem of part of structural ambiguity in the massive English language, and improve the accuracy of English machine translation. The experimental results show that the designed English machine translation model has high translation accuracy and stability.

      Keywords: intelligent recognition technology; English translation; machine translation model; structural ambiguity; maximum entropy; translation accuracy

      由于全球化的高速發(fā)展,不同國(guó)家間的信息流動(dòng)呈現(xiàn)高速性,英語(yǔ)成為當(dāng)前國(guó)際間溝通的主要語(yǔ)言。當(dāng)前智能識(shí)別技術(shù)在不同領(lǐng)域中的應(yīng)用價(jià)值不斷提升,基于現(xiàn)代智能識(shí)別技術(shù)的英語(yǔ)機(jī)器翻譯模型,能夠提高英語(yǔ)機(jī)器翻譯效率和準(zhǔn)確度,實(shí)現(xiàn)無(wú)障礙交流[1?2]。而傳統(tǒng)基于句法分析的英語(yǔ)機(jī)器翻譯方法,無(wú)法解決智能識(shí)別技術(shù)中的海量英語(yǔ)語(yǔ)言中的部分結(jié)構(gòu)歧義問(wèn)題,存在機(jī)器翻譯準(zhǔn)確度低的問(wèn)題。因此,本文設(shè)計(jì)基于現(xiàn)代智能識(shí)別技術(shù)的英語(yǔ)機(jī)器翻譯模型,通過(guò)直接最大熵模型,獲取復(fù)雜英語(yǔ)句子中不同特征間的最佳組合方式,消除部分結(jié)構(gòu)歧義,提高英語(yǔ)機(jī)器翻譯的準(zhǔn)確度[3?4]。

      1 基于現(xiàn)代智能識(shí)別技術(shù)的英語(yǔ)機(jī)器翻譯模型

      1.1 智能機(jī)器翻譯工具輔助英語(yǔ)機(jī)器翻譯的應(yīng)用

      隨著現(xiàn)代智能識(shí)別技術(shù)的發(fā)展,出現(xiàn)了較多的智能機(jī)器翻譯工具。當(dāng)前的在線機(jī)器翻譯的機(jī)器翻譯結(jié)果還存在一定缺陷,尤其是全文范圍采用服務(wù)器對(duì)不同語(yǔ)言數(shù)據(jù)實(shí)施對(duì)比學(xué)習(xí)后,獲取各語(yǔ)言間的語(yǔ)法以及文字相關(guān)規(guī)律,存在機(jī)器翻譯效率低以及準(zhǔn)確度低的弊端[5?6]。因此應(yīng)采用其他現(xiàn)代智能識(shí)別技術(shù)實(shí)現(xiàn)英語(yǔ)的準(zhǔn)確機(jī)器翻譯。

      1.2 現(xiàn)代智能識(shí)別技術(shù)下的英語(yǔ)機(jī)器翻譯

      若用戶(hù)不知道“匯率”一詞怎么機(jī)器翻譯,則依據(jù)經(jīng)驗(yàn)可得該單詞內(nèi)會(huì)存在“rate”,則在搜索引擎(如Baidu:www.baidu.com,MSN Search:http://search.msn.com/)內(nèi)輸入“rate率”實(shí)施檢索,在檢索結(jié)果內(nèi)可獲取準(zhǔn)確的機(jī)器翻譯:“匯率(exchange rate)”。

      1.3 基于現(xiàn)代智能識(shí)別技術(shù)的英語(yǔ)機(jī)器翻譯模型

      通過(guò)式(8)能夠?qū)嵤└佑行У臋z索,獲取高質(zhì)量的英語(yǔ)機(jī)器翻譯結(jié)果。

      2 實(shí)驗(yàn)分析

      2.1 實(shí)驗(yàn)一

      實(shí)驗(yàn)語(yǔ)料采用的是中君公司提供的586 538句對(duì)漢英平行語(yǔ)料,從中任意采集1 000句對(duì)當(dāng)成測(cè)試語(yǔ)料,2 000句對(duì)當(dāng)成開(kāi)發(fā)語(yǔ)料,剩下的當(dāng)成訓(xùn)練語(yǔ)料。實(shí)驗(yàn)基于句子長(zhǎng)度將測(cè)試語(yǔ)料分割成簡(jiǎn)單句子、一般句子以及復(fù)雜句子三種測(cè)試集,如表1所示。

      采用本文方法和傳統(tǒng)句法分析機(jī)器翻譯方法,針對(duì)表1中的測(cè)試集運(yùn)算BLEU值,結(jié)果如表2所示。其中,BLUE值是一種機(jī)器翻譯的自動(dòng)評(píng)價(jià)方法,其值越高,說(shuō)明機(jī)器翻譯的質(zhì)量越好。分析表2可得,機(jī)器翻譯簡(jiǎn)單句子時(shí),本文方法和傳統(tǒng)句法分析機(jī)器翻譯方法的BLEU值基本一致,而機(jī)器翻譯一般句子時(shí),本文方法的BLEU略高于句法分析機(jī)器翻譯方法,特別是在機(jī)器翻譯復(fù)雜句子時(shí),本文方法的BLEU遠(yuǎn)遠(yuǎn)高于句法分析機(jī)器翻譯方法。因此說(shuō)明,本文方法的優(yōu)勢(shì)是機(jī)器翻譯復(fù)雜句子,復(fù)雜句子中存在大量的最高名詞短語(yǔ),本文方法采用基于最大熵思想的統(tǒng)計(jì)機(jī)器翻譯方法,可獲取復(fù)雜句子中不同英語(yǔ)語(yǔ)言特征間的最佳組合方式,消除部分結(jié)構(gòu)歧義,提高英語(yǔ)機(jī)器翻譯的準(zhǔn)確度。

      2.2 實(shí)驗(yàn)二

      實(shí)驗(yàn)通過(guò)兩個(gè)圓形描述句法分析機(jī)器翻譯方法和實(shí)際機(jī)器翻譯結(jié)果的概率分布。圓形中的顏色越深則說(shuō)明檢索范圍內(nèi)該處的準(zhǔn)確機(jī)器翻譯結(jié)果概率越高,進(jìn)而分析不同機(jī)器翻譯方法的解碼性能。

      將不同方法獲得的概率結(jié)果映射到實(shí)際機(jī)器翻譯結(jié)果中,以實(shí)現(xiàn)對(duì)比不同方法的檢索范圍。將傳統(tǒng)句法分析機(jī)器翻譯方法、基于樹(shù)翻譯方法和基于森林翻譯方法與本文所提方法進(jìn)行對(duì)比。得到如圖1~圖4的實(shí)驗(yàn)結(jié)果。其中左側(cè)圓代表不同方法的準(zhǔn)確翻譯概率結(jié)果,右側(cè)圓代表實(shí)際機(jī)器翻譯結(jié)果的概率分布。

      由圖1可知,基于傳統(tǒng)句法分析機(jī)器翻譯方法檢索得到的最終概率在左下角,而實(shí)際機(jī)器翻譯結(jié)果概率在右上角,且該種方法無(wú)法映射到實(shí)際結(jié)果中,證明傳統(tǒng)方法的翻譯精度較差。

      基于樹(shù)的機(jī)器翻譯方法內(nèi)句法分析獲取的點(diǎn)在實(shí)際機(jī)器翻譯結(jié)果的中不是概率最高的點(diǎn),如圖2所示?;跇?shù)的機(jī)器翻譯方法得到的結(jié)果概率雖然無(wú)法對(duì)應(yīng)到實(shí)際機(jī)器翻譯結(jié)果,但其可以映射到其中,但映射范圍較小。

      基于森林的機(jī)器翻譯方法內(nèi)句法分析獲取的森林能夠覆蓋句法分析機(jī)器翻譯中概率最高的范圍,可獲取更趨向?qū)嶋H機(jī)器翻譯結(jié)果的最優(yōu)位置的點(diǎn),如圖3所示。圖3中,雖然該方法的映射范圍較大,但其映射準(zhǔn)確度較低。

      本文機(jī)器翻譯方法與實(shí)際機(jī)器翻譯結(jié)果的檢索范圍對(duì)比如圖4所示,能夠看出本文采用直接最大熵方法進(jìn)行句法分析檢索獲取的最優(yōu)點(diǎn)是實(shí)際機(jī)器翻譯結(jié)果的最優(yōu)點(diǎn),基本可以完全映射到實(shí)際機(jī)器翻譯結(jié)果中。實(shí)驗(yàn)說(shuō)明,傳統(tǒng)句法分析機(jī)器翻譯方法性能較差,不具有對(duì)比意義。而采用基于樹(shù)的機(jī)器翻譯方法、基于森林的機(jī)器翻譯方法以及本文方法的解碼性能逐步提升,如圖5所示。

      從圖5中可以看出,三種方法的檢索范圍不斷提升,本文方法的BLEU值最高,獲取的規(guī)則數(shù)量高于傳統(tǒng)基于樹(shù)機(jī)器翻譯方法以及基于森林機(jī)器翻譯方法,具有較高的解碼檢索性能。

      3 結(jié) 論

      本文設(shè)計(jì)基于現(xiàn)代信息計(jì)算的英語(yǔ)機(jī)器翻譯模型,采用直接最大熵模型得到復(fù)雜英語(yǔ)句子內(nèi)不同特征間的最佳組合方式,解決海量英語(yǔ)語(yǔ)言中的部分結(jié)構(gòu)歧義問(wèn)題,提高英語(yǔ)機(jī)器翻譯的準(zhǔn)確度。

      參考文獻(xiàn)

      [1] 趙靜.基于統(tǒng)計(jì)的漢英機(jī)器翻譯技術(shù)的研究[J].電子設(shè)計(jì)工程,2016,24(21):69?71.

      ZHAO Jing. Research on the technology of C?E machine translation based on statistics [J]. Electronic design engineering, 2016, 24(21): 69?71.

      [2] 宋柔,葛詩(shī)利.面向篇章機(jī)器翻譯的英漢翻譯單位和翻譯模型研究[J].中文信息學(xué)報(bào),2015,29(5):125?135.

      SONG Rou, GE Shili. English?Chinese translation unit and translation model for discourse?based machine translation [J]. Journal of Chinese information processing, 2015, 29(5): 125?135.

      [3] 唐海慶,熊德意.基于選擇偏向性的統(tǒng)計(jì)機(jī)器翻譯模型[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,52(1):127?133.

      TANG Haiqing, XIONG Deyi. A selectional preference based translation model for SMT [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 127?133.

      [4] 楊呈永.物聯(lián)網(wǎng)虛假數(shù)據(jù)特征自適應(yīng)檢測(cè)方法仿真[J].計(jì)算機(jī)仿真,2017,34(4):276?279.

      YANG Chengyong. Simulation of false data feature adaptive detection in Internet of Things [J]. Computer simulation, 2017, 34(4): 276?279.

      [5] HERMANTO A, ADJI T B, SETIAWAN N A. Recurrent neural network language model for English?Indonesian machine translation: experimental study [C]// Proceedings of International Conference on Science in Information Technology. Yogyakarta: IEEE, 2016: 132?136.

      [6] ESCOLANO C, COSTA?JUSS? M R, FONOLLOSA J A R. The TALP?UPC neural machine translation system for German/Finnish?English using the inverse direction model in rescoring [C]// Proceedings of 2nd Conference on Machine Translation. Copenhagen: Association for Computational Linguistics, 2017: 283?287.

      [7] BASTAN M, KHADIVI S, HOMAYOUNPOUR M M. Neural machine translation on scarce?resource condition: a case?study on Persian?English [C]// Proceedings of Iranian Conference on Electrical Engineering. Tehran: IEEE, 2017: 1485?1490.

      [8] 胡濱.基于信息共享空間的科技博物館服務(wù)模式創(chuàng)新[J].科技通報(bào),2015,31(11):277?282.

      HU Bin. Innovation in service model of science and technology museum based on information commons [J]. Bulletin of science and technology, 2015, 31(11): 277?282.

      [9] 何向真,萬(wàn)福成,于洪志,等.基于藏語(yǔ)語(yǔ)義分析的機(jī)器翻譯技術(shù)研究[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(15):134?137.

      HE Xiangzhen, WAN Fucheng, YU Hongzhi, et al. Machine translation technology based on Tibetan semantic parsing [J]. Computer engineering and applications, 2015, 51(15): 134?137.

      [10] 高鵬,黃瑛.礦物加工工程英語(yǔ)的特征及翻譯[J].中國(guó)科技翻譯,2016,29(2):15?18.

      GAO Peng, HUANG Ying. The characteristics and translation of mineral processing engineering English [J]. Chinese science & technology translators journal, 2016, 29(2): 15?18.

      猜你喜歡
      英語(yǔ)翻譯
      地鐵站內(nèi)公示語(yǔ)英語(yǔ)翻譯的特點(diǎn)和技巧
      翻譯轉(zhuǎn)換理論指導(dǎo)下的石油英語(yǔ)翻譯
      英語(yǔ)翻譯中跨文化視角轉(zhuǎn)換及翻譯技巧探討
      中國(guó)諺語(yǔ)VS英語(yǔ)翻譯
      評(píng)《科技英語(yǔ)翻譯》(書(shū)評(píng))
      英語(yǔ)翻譯中跨文化視角轉(zhuǎn)換及翻譯技巧探討
      透視高校英語(yǔ)翻譯教學(xué)
      試論如何提高英語(yǔ)翻譯能力
      跨文化交流中的英語(yǔ)翻譯功能研究
      文化差異對(duì)大學(xué)英語(yǔ)翻譯教學(xué)的影響分析
      人間(2015年21期)2015-03-11 15:24:28
      河源市| 怀安县| 普兰县| 方城县| 望都县| 米易县| 方正县| 德昌县| 木里| 托克逊县| 闸北区| 积石山| 安图县| 高邮市| 民乐县| 桐庐县| 台湾省| 巴楚县| 和平县| 怀化市| 金平| 桑植县| 江达县| 平和县| 阿荣旗| 苗栗县| 德格县| 临桂县| 鹤山市| 天长市| 松溪县| 龙南县| 锡林郭勒盟| 井陉县| 白玉县| 木里| 紫云| 仲巴县| 读书| 甘谷县| 寿光市|