• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    融合檢索技術(shù)的譯文推薦系統(tǒng)

    2017-04-08 05:55:36蔣宗禮王威
    關(guān)鍵詞:語料文檔子系統(tǒng)

    蔣宗禮, 王威

    (北京工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,北京 100124)

    融合檢索技術(shù)的譯文推薦系統(tǒng)

    蔣宗禮, 王威

    (北京工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,北京 100124)

    本文將基于單語語料的檢索技術(shù)運(yùn)用到機(jī)器翻譯中,構(gòu)建了一個(gè)漢英譯文推薦系統(tǒng),解決傳統(tǒng)方法雙語料庫構(gòu)建代價(jià)高昂的問題,同時(shí)提高最終譯文的流暢性。譯文推薦系統(tǒng)包括查詢翻譯和信息檢索兩部分:查詢翻譯根據(jù)給定的一組中文,生成N-best英文結(jié)果;信息檢索評(píng)價(jià)目標(biāo)語言與候選譯文的相似程度。系統(tǒng)綜合兩部分得分返回推薦譯文??紤]到N-best結(jié)果與候選譯文的詞序一致性,采用Levenshtein距離使得排序結(jié)果更加合理。在英漢數(shù)據(jù)集上的實(shí)驗(yàn)表明:在不同n階語言模型下,譯文推薦系統(tǒng)都有很好的表現(xiàn),加入Levenshtein距離取得了最高70.83%的f測度值。

    信息檢索;機(jī)器翻譯;自然語言處理;單語語料;Levenshtein距離;推薦系統(tǒng);跨語言

    信息時(shí)代,每天都有不同語言的信息在生成、傳播和轉(zhuǎn)換??缯Z言信息檢索[1](cross-language information retrieval, CLIR)為克服語言障礙提供了一種方便的途徑。

    融合檢索技術(shù)的譯文推薦系統(tǒng),簡稱為翻譯檢索(translation retrieval, TR)系統(tǒng),將翻譯問題轉(zhuǎn)化成檢索問題,屬于CLIR問題的一個(gè)特例。其不同之處在于檢索模型的相關(guān)性評(píng)價(jià)。CLIR返回與用戶查詢意圖最相近的文檔,而TR的文檔庫由單個(gè)句子構(gòu)成,最終得到的是包含查詢譯文的句子。

    翻譯檢索的概念最早由Baldwin等[2]在翻譯記憶系統(tǒng)中提出,與基于樣例[3]的翻譯相似,該方法依賴大規(guī)模的高質(zhì)量雙語語料。學(xué)者從互聯(lián)網(wǎng)中獲得平行語料[4-5],代價(jià)仍然高昂。Berger等[6]將統(tǒng)計(jì)機(jī)器翻譯的方法運(yùn)用到信息檢索中,F(xiàn)ederico等[1]實(shí)現(xiàn)了一個(gè)基于N-best查詢翻譯的CLIR系統(tǒng),將需求分為查詢翻譯模型和查詢文檔模型。信息檢索方面,Ng[5]采用一個(gè)最大似然估計(jì)的信息檢索模型,Witten[6]使用平滑策略來優(yōu)化概率估計(jì),Navarro在文獻(xiàn)[7]介紹了字符串相似性匹配的相關(guān)技術(shù)。Sanchez-Martinez等[8]用源文檔檢索目標(biāo)文檔,比較了使用統(tǒng)計(jì)機(jī)器翻譯技術(shù)的不同策略。陳士杰等[9]實(shí)現(xiàn)了一個(gè)基于Lucene的英漢跨語言信息檢索系統(tǒng),旨在尋找更為有效的英漢查詢翻譯方法以及提高中文檢索系統(tǒng)的性能。

    傳統(tǒng)漢英翻譯檢索方法的效果嚴(yán)重依賴于漢英平行語料庫的規(guī)模與質(zhì)量。TR系統(tǒng)使用單語語料庫實(shí)現(xiàn)翻譯檢索,提高譯文流暢性的同時(shí),解決了雙語料庫構(gòu)建代價(jià)太大的問題,其返回的單個(gè)句子直接為翻譯人員提供輔助。

    本文研究如何在漢英數(shù)據(jù)集上利用檢索模型為翻譯人員提供參考譯文。系統(tǒng)由查詢翻譯子系統(tǒng)和檢索子系統(tǒng)構(gòu)成,查詢翻譯子系統(tǒng)采用基于短語的統(tǒng)計(jì)機(jī)器翻譯方法,對(duì)給定的中文查詢,翻譯出N-best條查詢譯文。檢索子系統(tǒng)采用單語語料庫,基于向量空間模型評(píng)價(jià)查詢譯文與文檔的相似性,最后返回高質(zhì)量的參考譯文。同時(shí),檢索子系統(tǒng)根據(jù)Levenshtein距離給出更恰當(dāng)?shù)膮⒖甲g文排序。

    1 翻譯檢索系統(tǒng)

    依統(tǒng)計(jì)學(xué)的角度,融合檢索技術(shù)的譯文推薦系統(tǒng)可以描述如下。

    給定一個(gè)中文查詢s,本文希望從文檔集合D中返回具有最大翻譯概率的譯文d′:

    d′=argmaxd∈D{Pr(d|s)}

    注意到中文查詢一般為一句話,因此文檔集合包含的并非一系列長段文檔,而是目標(biāo)語言的一系列句子。更一般地,系統(tǒng)應(yīng)返回多個(gè)按相關(guān)度排序的候選譯文,翻譯人員依次瀏覽獲得幫助。

    為了解決中文查詢s與對(duì)應(yīng)的英語文檔d的差異問題,引入隱藏變量t,表示查詢s對(duì)應(yīng)的N-best譯文中的某個(gè)句子。同時(shí)假設(shè)對(duì)給定的s與t,d產(chǎn)生的概率只與t有關(guān):

    Pr(d|s)=Pr(d,t|s)=Pr(t|s)×Pr(d|t)

    式中:Pr(t|s)由查詢翻譯子系統(tǒng)計(jì)算,Pr(d|t)將由檢索子系統(tǒng)計(jì)算。

    1.1 系統(tǒng)架構(gòu)

    圖1給出融合檢索技術(shù)的譯文推薦系統(tǒng)的整體架構(gòu),系統(tǒng)接受一個(gè)中文查詢,最終返回多個(gè)候選譯文。

    圖1 翻譯檢索系統(tǒng)總體架構(gòu)Fig.1 Translation retrieval system architecture

    系統(tǒng)分為查詢翻譯子系統(tǒng)和檢索子系統(tǒng),其中漢英平行語料庫用來訓(xùn)練查詢翻譯模型,英文單語語料庫用來提供檢索查詢。

    本文借助NiuTrans構(gòu)建查詢翻譯子系統(tǒng)[10],訓(xùn)練翻譯模型以及n-gram語言模型。輸入的中文經(jīng)過查詢翻譯子系統(tǒng)得到目標(biāo)語言英文的N-best譯文。檢索子系統(tǒng)接受查詢翻譯系統(tǒng)的輸出結(jié)果,以Apache Lucene為基礎(chǔ),采用向量空間模型計(jì)算查詢語句與候選文檔的相似度,通過加入Levenshtein距離,使最終返回的參考譯文的排序更合理。

    1.2 查詢翻譯子系統(tǒng)

    查詢翻譯子系統(tǒng)計(jì)算將中文查詢翻譯成英文的概率,并得到N-best英文譯文,該問題可描述為

    式中:Pr(t|s)表示把給定源語言查詢s翻譯成目標(biāo)語言查詢t的可能性。為了求得Pr(t|s),引入對(duì)數(shù)線性(log-linear)模型:

    (1)

    式中:{hi(s,t)|i=1,2,…,M}是計(jì)算Pr(t|s)的特征集合,λi表示第i個(gè)特征對(duì)應(yīng)的權(quán)重值,該值由最小錯(cuò)誤率函數(shù)訓(xùn)練[11](minimum error rate training,MERT)。

    本文的查詢翻譯子系統(tǒng)采用基于短語的翻譯模型,選用了如下特征:

    1) 短語翻譯概率PrΦ(t|s),該概率決定了源語言短語是否能正確地翻譯成英文,其值通過最大似然估計(jì)獲得。

    2) 反向短語翻譯概率PrΦ(s|t),雙向的翻譯概率通常優(yōu)于僅僅使用正向的模型。

    3) 詞匯加權(quán)概率Prlex(t|s),這是一種平滑方法,把短語分解成詞的翻譯來檢查它們的匹配程度,用來衡量不常出現(xiàn)短語的可靠性。

    4) 反向詞匯加權(quán)概率Prlex(s|t),雙向的詞匯加權(quán)概率得到更優(yōu)的翻譯質(zhì)量。

    5) 語言模型概率Prlm(t),表示目標(biāo)語言查詢t在語料中出現(xiàn)的概率,確保輸出句子的流利性,賦予較大權(quán)重。

    6) 位變模型概率Prd(s,t),衡量短語調(diào)序的正確性,包括基于最大熵的調(diào)序模型fme(s,t)和基于MSD的調(diào)序模型fmsd(s,t)。

    7) 加權(quán)激勵(lì)(bonus),包括單詞激勵(lì)(TWB)length(t);單詞刪除激勵(lì)(WDB);短語激勵(lì)(PB)。

    用式(1)將所有的特征用對(duì)數(shù)線性模型結(jié)合起來,得到

    Pr(t|s)=PrΦ(t|s)λ1×PrΦ(s|t)λ2×
    Prlex(t|s)λ3×Prlex(s|t)λ4×
    Prd(s,t)λ5×Prlm(t)λ6×exp(λTWB×
    length(t))×exp(λPB)×exp(λWDB)

    為了優(yōu)化特征權(quán)值,令S=(s1,s2,…,sm)表示源語言句子,u(λ)為權(quán)值的估計(jì),T(u(λ))=(t1,t2,…,tm)為目標(biāo)譯文結(jié)果,R=(r1,r2,…,rm)是標(biāo)準(zhǔn)譯文,根據(jù)MERT算法有

    采用BLEU值定義錯(cuò)誤函數(shù)Err(),通過上述多次迭代得到適合的特征權(quán)重。

    Err(T(u(λ)),R)=1-BLEU(T(u(λ)),R)

    1.3 檢索子系統(tǒng)

    檢索子系統(tǒng)計(jì)算從查詢語句t到文檔d的可能性,使用基于向量空間模型構(gòu)建檢索算法。查詢和文檔被表示為向量,其相似度通過向量夾角的余弦值表示:

    (2)

    其中

    wt,t′=lg(N/ft′)+1,wd,t′=lg(fd,t′+1)

    本文將查詢語句t中的一項(xiàng)表示為t′。fd,t′是項(xiàng)t′在文檔d中出現(xiàn)的頻率。N是文檔總數(shù),ft′是包含項(xiàng)t′的文檔數(shù)目。

    受詞錯(cuò)誤率啟發(fā),考慮到查詢翻譯子系統(tǒng)生成的N-best目標(biāo)結(jié)果與單語語料庫候選譯文詞序上的一致性,本文在檢索模型中引入Levenshtein距離[12]計(jì)算查詢語句與候選文檔的最少編輯次數(shù),以此作為衡量兩者相似性的特征之一。Levenshtein距離的加入使得候選文檔可以按對(duì)原查詢語言的忠實(shí)度排序,在語序上保持一致性,因此可以提高準(zhǔn)確率,后文實(shí)驗(yàn)中將對(duì)比加入Levenshtein距離和不加入Levenshtein距離的差異性。

    用E(t,d)表示Levenshtein距離的得分,式(2)可寫為

    E(t,d)λ2

    同樣,λ值由MERT算法訓(xùn)練。

    2 翻譯檢索算法

    結(jié)合兩個(gè)子系統(tǒng),TR系統(tǒng)的算法可描述為兩階段。第一階段計(jì)算Pr(t|s)。為縮小解空間,只取源語言s的N-best譯文,生成集合Bn(s):

    第二階段計(jì)算Pr(d|t)。限定候選文檔中必須至少包含查詢語的一項(xiàng),令D(t)表示包含查詢項(xiàng)的文檔集合

    算法偽代碼見算法1。給定一個(gè)中文查詢s,首先生成s的N-best譯文集合Bn(s),對(duì)每個(gè)屬于集合的t,計(jì)算對(duì)應(yīng)的概率得分Pr′(t|s)。然后對(duì)包含查詢語的文檔集合D(t)計(jì)算其中每個(gè)文檔d的得分,最終對(duì)候選文檔進(jìn)行排序。

    算法 1:翻譯檢索算法

    1)輸入中文查詢s;

    2)由查詢翻譯子系統(tǒng)生成集Bn(s);

    3)對(duì)每一個(gè)屬于Bn(s)的目標(biāo)語句t

    4) 計(jì)算Pr′(t|s);

    5)對(duì)每一個(gè)屬于Bn(s)的目標(biāo)語句t

    6)N=0

    7) 對(duì)每一個(gè)d∈D(t)

    8) 計(jì)算Pr′(t|s);

    9) 更新N=N+Pr′(d|t);

    10) 對(duì)每一個(gè)d∈T(t)

    11) 更新Pr(d)=Pr(d)+Pr′(t|s)×Pr′(d|t)/N;

    12)返回n條排序過的候選文檔;

    算法2:1-best翻譯檢索算法

    1)輸入中文查詢s;

    5)返回n條排序過的候選文檔;

    3 實(shí)驗(yàn)評(píng)估

    本文在英漢數(shù)據(jù)集上進(jìn)行了多組實(shí)驗(yàn),對(duì)比不同參數(shù)對(duì)最終結(jié)果的影響:

    1) 不同個(gè)數(shù)的N-best譯文。N分別取1、5、10;

    2)n元文法模型的n分別取3、4;

    3) 是否加入Levenshtein距離。

    3.1 數(shù)據(jù)集

    融合檢索技術(shù)的譯文推薦系統(tǒng)是數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng),采用的數(shù)據(jù)集由NiuTrans提供。細(xì)分為六個(gè)部分:

    1) 翻譯模型訓(xùn)練集,包含45 M條漢英平行語料和對(duì)應(yīng)的對(duì)齊語料;

    2) 語言模型訓(xùn)練集,包含18 M條單語語料;

    3) 優(yōu)化調(diào)整數(shù)據(jù)集,包含130 k條中文語料以及其對(duì)應(yīng)的參考譯文,用來進(jìn)行最小錯(cuò)誤率訓(xùn)練;

    4) 測試數(shù)據(jù)集,包含140 k條中文語句;

    5) 標(biāo)準(zhǔn)譯文數(shù)據(jù)集,測試集的標(biāo)準(zhǔn)譯文(323 k);

    6) 檢索文檔數(shù)據(jù)集,包含50 M英文語料(內(nèi)含50%的標(biāo)準(zhǔn)譯文)。

    對(duì)中文語料使用ICTCLAS2011進(jìn)行分詞,并用空格隔開。漢英對(duì)齊來自GIZA++的結(jié)果。對(duì)英文語料做了符號(hào)化和大小寫規(guī)整的預(yù)處理。檢索的每個(gè)文檔由單個(gè)句子構(gòu)成。

    3.2 評(píng)測指標(biāo)

    本文采用目前應(yīng)用最為廣泛的自動(dòng)評(píng)測指標(biāo)BLEU[13](bilingual evaluation understudy)。它是一種有效解決詞序作用的評(píng)測方法,考慮了機(jī)器翻譯譯文與參考譯文中較長n元文法的匹配情況。

    通常將n元文法的最大階數(shù)設(shè)置為4,因此BLEU指標(biāo)定義為

    式中:T、R分別表示目標(biāo)語言與標(biāo)準(zhǔn)譯文,Precisionn(T,R) 是n元文法的準(zhǔn)確率,BP(brevity penalty)是一個(gè)長度懲罰因子。

    在BLEU基礎(chǔ)上,加入人工評(píng)測,對(duì)結(jié)果進(jìn)行準(zhǔn)確率和召回率的評(píng)測,在返回的n條文檔中比較能否包含參考譯文。一般的,我們既不想輸出錯(cuò)誤單詞也不想遺漏任何信息,因此同等的對(duì)待準(zhǔn)確率和召回率,定義準(zhǔn)確率和召回率的調(diào)和平均f測度[13](f-measure@n):

    3.3 實(shí)驗(yàn)結(jié)果

    本文在漢英數(shù)據(jù)集上隨機(jī)地抽取了多組查詢語句對(duì)進(jìn)行了實(shí)驗(yàn),對(duì)參數(shù)的不同取值做了對(duì)比實(shí)驗(yàn)。

    表1是在1-best條件下,不同階數(shù)語言模型下的5次實(shí)驗(yàn)結(jié)果以及與Moses 4元文法的比較。

    表1 不同階數(shù)下的BLEU值和與Moses的比較

    Table 1 BLEU scores with differentn-gram setting and comparison with Moses 4-gram setting

    實(shí)驗(yàn)序號(hào)BLEU值3-gram4-gramMoses:4-gram134.2135.4534.26233.1634.3933.94334.4435.6235.12433.7134.5234.72534.3535.0434.87平均33.9235.0034.58

    從表1中可以看出在1-best條件下,4-gram的語言模型有較好表現(xiàn),結(jié)果優(yōu)于Moses的翻譯結(jié)果。

    表2給出在4元文法基礎(chǔ)上不同N-best譯文和加入Levenshtein距離后的實(shí)驗(yàn)結(jié)果。表中:-L表示不加入該距離,相反,+L表示加入。

    表3給出加入Levenshtein距離條件下,不同N-best譯文的準(zhǔn)確率(p)和召回率(r)結(jié)果:

    表2反映了加入Levenshtein距離的改進(jìn)效果。事實(shí)上,加入Levenshtein距離的檢索模型會(huì)考慮檢索語句與候選文檔間的編輯次數(shù),這樣會(huì)顯著提高結(jié)果的召回率,同時(shí),查詢翻譯模型的語言模型保證了譯文的流暢性,因此,加入Levenshtein距離也可以更好的提高最終結(jié)果的準(zhǔn)確率,其f測度值也就更高。

    表2 不同數(shù)量N-best譯文在加入/不加入Levenshtein距離下的f測度結(jié)果

    Table 2f-measure results without/with Levenshtein-distance by using differentN-best translation

    n條譯文下的f-measure值1-best5-best10-best-L+L-L+L-L+Lf@164.6268.2667.5469.5668.4269.98f@567.4969.6868.8270.8369.0470.13f@1063.3667.2663.5866.9763.0265.52

    表3 不同數(shù)量N-best譯文的準(zhǔn)確率與召回率結(jié)果

    Table 3 Precision and recall results by using differentN-best translation

    譯文數(shù)量1-best5-best10-bestp r p r p r184.5457.2486.6158.1286.6858.68592.3655.9494.1856.7693.9555.941094.4752.2295.0251.4295.8349.78

    實(shí)驗(yàn)結(jié)果也表明,在5-best譯文和f@5時(shí)系統(tǒng)得到最佳f測度值。從表3中可以看出在提供更多候選參考項(xiàng)目時(shí),準(zhǔn)確率會(huì)不斷升高,但其召回率將下降較多,因此,選用適量的候選項(xiàng)目有利于翻譯人員迅速準(zhǔn)確的得到參考結(jié)果。

    綜上,從本文在英漢的數(shù)據(jù)集上對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行的自動(dòng)評(píng)測(BLUE)和人工評(píng)測(f@n)結(jié)果看,BLEU指標(biāo)優(yōu)于目前主流的基于短語的機(jī)器翻譯系統(tǒng)(Moses)。但需要注意的是,BLEU指標(biāo)只關(guān)注句子的局部,沒有更多地考慮整體語法的連貫性,所以系統(tǒng)在4元文法基礎(chǔ)上表現(xiàn)不錯(cuò),超出4元文法時(shí)就可能混亂。

    由此,本文更加看重實(shí)驗(yàn)結(jié)果的f測度,從表3看出,準(zhǔn)確率高于召回率,這是利于實(shí)際應(yīng)用的。事實(shí)上,融合檢索技術(shù)的譯文推薦系統(tǒng)旨在為翻譯人員提供參考,提高翻譯的流暢性,并不要求候選文檔與標(biāo)準(zhǔn)譯文完全匹配,因此候選文檔更多的包含標(biāo)準(zhǔn)譯文是更為重要的,即準(zhǔn)確率更能反映出翻譯系統(tǒng)的性能。

    4 結(jié)論

    融合檢索技術(shù)的譯文推薦系統(tǒng),將翻譯問題視作為檢索問題,可為翻譯人員提供高質(zhì)量的參考譯文。檢索數(shù)據(jù)集的好壞很大程度決定了最終譯文的參考質(zhì)量,而我們的系統(tǒng)可以方便的獲得大規(guī)模的單語語料集,與傳統(tǒng)的基于平行語料的翻譯系統(tǒng)相比有很大優(yōu)勢。漢英數(shù)據(jù)集上的實(shí)驗(yàn)表明:

    1)與基于短語的翻譯系統(tǒng)相比,我們?nèi)〉昧烁鼉?yōu)的BLEU指標(biāo);

    2)將Levenshtein距離加入檢索模型也可以提高f測度值并取得了最高70.83的f測度值。

    未來,將把本文的成果運(yùn)用到更多種類的雙語翻譯中。同時(shí),進(jìn)一步改進(jìn)檢索模型,以求針對(duì)翻譯問題提供更為高效的檢索算法。

    [1]FEDERICO M, BERTOLDI N. Statistical cross-language information retrieval using n-best query translations[C]//Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, NY, USA: ACM, 2003: 167-174.

    [2]BALDWIN T, TANAKA H. The effects of word order and segmentation on translation retrieval performance[C]//Proceedings of the 18th Conference on Computational Linguistics. Stroudsburg, PA, USA: Association for Computational Linguistics, 2000: 35-41.

    [3]Nirenburg S, DOMASHNEV C, GRANNES D J. Two approaches to matching in example-based machine translation[C]//Proceedings of the 5th International Conference on Theoretical and Methodological Issues in Machine Translation. 1993: 47-57.

    [4]ZHAO Bing, VOGEL S. Adaptive parallel sentences mining from web bilingual news collection[C]//Proceedings of the 2002 IEEE International Conference on Data Mining. Maebashi City, Japan: IEEE Computer Society, 2002: 745-745.

    [5]RESNIK P, SMITH N A. The Web as a parallel corpus[J]. Computational linguistics, 2002, 29(3): 349-380

    [6]BERGER A, LAFFERTY J. Information retrieval as statistical translation[C]//Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Berkeley, California: ACM, 1999: 222-229.

    [7]NG K. A maximum likelihood ratio information retrieval model[R]. 2006.

    [8]WITTEN I H, BELL T C. The zero-frequency problem: estimating the probabilities of novel events in adaptive text compression[J]. IEEE transactions on information theory, 1991, 37(4): 1085-1094.

    [9]NAVARRO G. A guided tour to approximate string matching[J]. ACM computing surveys, 2001, 33(1): 31-88.

    [11]陳士杰, 張玥杰. 基于Lucene的英漢跨語言信息檢索[J]. 計(jì)算機(jī)工程, 2005, 31(13): 62-64.

    CHEN Shijie, ZHANG Yuejie. English-Chinese cross-language information retrieval using Lucene system[J]. Computer engineering, 2005, 31(13): 62-64.

    [12]XIAO Tong, ZHU Jingbo, ZHANG Hao, et al. NiuTrans: an open source toolkit for phrase-based and syntax-based machine translation[C]//Proceedings of the ACL 2012 System Demonstrations. Stroudsburg, PA, USA: Association for Computational Linguistics, 2012: 19-24.

    [13]OCH F J. Minimum error rate training in statistical machine translation[C]//Proceedings of the 41st Annual Meeting on Association for Computational Linguistics. Stroudsburg, PA, USA: Association for Computational Linguistics, 2003: 160-167.

    [14]LEVENSHTEIN V I. Binary codes capable of correcting deletions, insertions, and reversals[J]. Soviet physics doklady, 1966, 10(8): 707-710.

    [15]科恩. 統(tǒng)計(jì)機(jī)器翻譯[M]. 宗成慶, 張霄軍, 譯. 北京: 電子工業(yè)出版社, 2012.

    KOEHN P. Statistical machine translation[M]. ZONG Qingcheng, ZHANG Xiaojun, trans. Beijing: Publishing House of Electronics Industry, 2012.

    Translation recommendation system with information retrieval technology

    JIANG Zongli, WANG Wei

    (College of Computer Science and Technology, Beijing University of Technology, Beijing 100124, China)

    In this study, we apply a retrieval technology based on a monolingual corpus to machine translation and construct a Chinese-English translation recommendation system. The system solves the problem of conventional approaches that mainly rely on a parallel corpus, which is difficult to collect. It also improves the fluency of the final translation references. The translation recommendation system combines query-translation and information retrieval. For a given set of Chinese queries, the query-translation function generatesN-best English results and the information retrieval function computes the similarity of the query and the candidate translation. The two scores are weighted to return recommended translations. Considering the consistency of word order of theN-best results and the translation candidates, we use Levenshtein-distance to obtain more rational retrieval results. Experiments on English-Chinese data sets show that, under differentn-order language models, the proposed translation recommendation system demonstrates good performance and achieves a maximumf-measure value of 70.83% using Levenshtein-distance.

    information retrieval (IR); machine translation (MT); natural language processing (NLP); monolingual corpus; Levenshtein-distance; recommendation system; cross-language

    2016-01-14.

    日期:2017-01-11.

    國家自然科學(xué)基金項(xiàng)目 (61133003).

    蔣宗禮(1956-),男,教授,博士生導(dǎo)師.

    蔣宗禮,E-mail: jiangzl@bjut.edu.cn.

    10.11990/jheu.201601053

    TP391

    A

    1006-7043(2017)03-0419-06

    蔣宗禮, 王威.融合檢索技術(shù)的譯文推薦系統(tǒng)[J]. 哈爾濱工程大學(xué)學(xué)報(bào), 2017, 38(3):419-424.

    JIANG Zongli, WANG Wei.Translation recommendation system with information retrieval technology[J]. Journal of Harbin Engineering University, 2017, 38(3):419-424.

    網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/23.1390.u.20170111.1509.011.html

    猜你喜歡
    語料文檔子系統(tǒng)
    不對(duì)中轉(zhuǎn)子系統(tǒng)耦合動(dòng)力學(xué)特性研究
    有人一聲不吭向你扔了個(gè)文檔
    GSM-R基站子系統(tǒng)同步方案研究
    駝峰測長設(shè)備在線監(jiān)測子系統(tǒng)的設(shè)計(jì)與應(yīng)用
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
    欧美成人午夜精品| 操出白浆在线播放| 亚洲国产看品久久| 久久精品亚洲精品国产色婷小说| 久久久久九九精品影院| 国产又爽黄色视频| 国产精品一区二区精品视频观看| 亚洲成人久久爱视频| 波多野结衣高清作品| 久久香蕉精品热| 首页视频小说图片口味搜索| 国产精品,欧美在线| 国产精品国产高清国产av| 一本精品99久久精品77| 夜夜爽天天搞| 日韩成人在线观看一区二区三区| 色播在线永久视频| 日韩欧美一区二区三区在线观看| svipshipincom国产片| 免费搜索国产男女视频| 波多野结衣av一区二区av| 日韩国内少妇激情av| 别揉我奶头~嗯~啊~动态视频| 1024香蕉在线观看| 脱女人内裤的视频| 成人午夜高清在线视频 | 成人国产一区最新在线观看| 最近最新中文字幕大全电影3 | 视频在线观看一区二区三区| 日韩欧美一区视频在线观看| 90打野战视频偷拍视频| 手机成人av网站| 亚洲欧洲精品一区二区精品久久久| 18禁美女被吸乳视频| 欧美在线黄色| 日韩中文字幕欧美一区二区| 欧洲精品卡2卡3卡4卡5卡区| 久久久久九九精品影院| 91成年电影在线观看| 一级a爱片免费观看的视频| 欧美精品亚洲一区二区| 亚洲在线自拍视频| 日本一区二区免费在线视频| 亚洲人成77777在线视频| 搡老岳熟女国产| 手机成人av网站| 一级毛片女人18水好多| 国产成人一区二区三区免费视频网站| 香蕉丝袜av| 国产不卡一卡二| 亚洲男人天堂网一区| 国产又爽黄色视频| 999精品在线视频| 老司机深夜福利视频在线观看| 1024香蕉在线观看| 成人av一区二区三区在线看| 老司机福利观看| 久久中文看片网| 久久精品人妻少妇| 亚洲一区中文字幕在线| 午夜免费鲁丝| 老司机福利观看| 欧美乱妇无乱码| or卡值多少钱| 2021天堂中文幕一二区在线观 | 国产主播在线观看一区二区| 精品一区二区三区av网在线观看| 一进一出抽搐动态| 91成年电影在线观看| 男人舔女人下体高潮全视频| 一边摸一边做爽爽视频免费| 国产激情欧美一区二区| 中文字幕精品亚洲无线码一区 | 免费搜索国产男女视频| 19禁男女啪啪无遮挡网站| 午夜福利在线在线| 久久国产精品影院| 免费一级毛片在线播放高清视频| 亚洲国产中文字幕在线视频| 99在线视频只有这里精品首页| 亚洲av第一区精品v没综合| 天堂动漫精品| 欧美+亚洲+日韩+国产| 国语自产精品视频在线第100页| 国产又黄又爽又无遮挡在线| 狂野欧美激情性xxxx| 国产精华一区二区三区| 久久人妻福利社区极品人妻图片| 香蕉av资源在线| 亚洲真实伦在线观看| 成人特级黄色片久久久久久久| 91在线观看av| 日本在线视频免费播放| 99精品久久久久人妻精品| av免费在线观看网站| 一级毛片精品| 亚洲国产中文字幕在线视频| 精品一区二区三区四区五区乱码| 在线观看午夜福利视频| 日本精品一区二区三区蜜桃| 神马国产精品三级电影在线观看 | 亚洲国产中文字幕在线视频| 精品无人区乱码1区二区| 国产成人精品无人区| 久久婷婷人人爽人人干人人爱| 亚洲精品一区av在线观看| 无限看片的www在线观看| 国产高清videossex| 午夜精品久久久久久毛片777| 日本 欧美在线| 免费高清在线观看日韩| 久久狼人影院| 久久久久久人人人人人| 欧美不卡视频在线免费观看 | 在线观看日韩欧美| 日本a在线网址| 淫秽高清视频在线观看| 国产主播在线观看一区二区| 亚洲av成人不卡在线观看播放网| 亚洲国产高清在线一区二区三 | 无遮挡黄片免费观看| 国产av在哪里看| 亚洲中文字幕日韩| 久久精品亚洲精品国产色婷小说| 黄色毛片三级朝国网站| 欧美一区二区精品小视频在线| 精品国产国语对白av| 亚洲欧美日韩高清在线视频| 成人国语在线视频| 免费在线观看亚洲国产| 久久性视频一级片| 狠狠狠狠99中文字幕| 天堂√8在线中文| 国产不卡一卡二| 最好的美女福利视频网| 一级黄色大片毛片| 久久久久久久久中文| 高清在线国产一区| 欧美黄色淫秽网站| 国产成人av教育| 久久九九热精品免费| 听说在线观看完整版免费高清| av欧美777| 变态另类成人亚洲欧美熟女| 少妇 在线观看| 免费电影在线观看免费观看| 成人三级黄色视频| 日韩成人在线观看一区二区三区| 成人国产一区最新在线观看| 国内少妇人妻偷人精品xxx网站 | 99精品欧美一区二区三区四区| 国产男靠女视频免费网站| 亚洲 欧美 日韩 在线 免费| 国产精品99久久99久久久不卡| 色综合婷婷激情| 成人精品一区二区免费| av有码第一页| 亚洲av成人av| 两个人免费观看高清视频| 久久精品国产亚洲av香蕉五月| 草草在线视频免费看| 亚洲精品一区av在线观看| 亚洲 国产 在线| 一区二区三区高清视频在线| 99久久久亚洲精品蜜臀av| 不卡一级毛片| 久久精品91蜜桃| 亚洲成人久久性| 日韩精品青青久久久久久| 精品电影一区二区在线| 一边摸一边做爽爽视频免费| 亚洲专区国产一区二区| 亚洲五月色婷婷综合| 女同久久另类99精品国产91| www日本在线高清视频| 香蕉久久夜色| 看黄色毛片网站| 午夜免费鲁丝| 啦啦啦观看免费观看视频高清| 国产成人av激情在线播放| 国产高清videossex| 日本三级黄在线观看| 亚洲国产中文字幕在线视频| 国产久久久一区二区三区| 亚洲国产精品久久男人天堂| 午夜成年电影在线免费观看| 熟女少妇亚洲综合色aaa.| 欧美另类亚洲清纯唯美| 成人18禁在线播放| 国产又黄又爽又无遮挡在线| 久久午夜综合久久蜜桃| 中文字幕最新亚洲高清| 午夜成年电影在线免费观看| 天堂影院成人在线观看| 久久国产精品人妻蜜桃| 国产精品一区二区免费欧美| 淫妇啪啪啪对白视频| 久久青草综合色| 中文字幕av电影在线播放| 看片在线看免费视频| 中文字幕av电影在线播放| 悠悠久久av| 亚洲免费av在线视频| 亚洲成国产人片在线观看| 精品久久蜜臀av无| 国产久久久一区二区三区| 国产av一区在线观看免费| 丰满人妻熟妇乱又伦精品不卡| 国产高清videossex| 国产99久久九九免费精品| 免费在线观看日本一区| 国产1区2区3区精品| 一级毛片女人18水好多| 久久 成人 亚洲| 亚洲国产日韩欧美精品在线观看 | 欧美中文日本在线观看视频| 美女扒开内裤让男人捅视频| www.熟女人妻精品国产| 国产成人av激情在线播放| 中文字幕高清在线视频| 9191精品国产免费久久| 成人国产综合亚洲| 亚洲国产精品sss在线观看| 欧美激情极品国产一区二区三区| 欧美成人一区二区免费高清观看 | 亚洲 欧美 日韩 在线 免费| 此物有八面人人有两片| 少妇被粗大的猛进出69影院| 露出奶头的视频| 美女高潮到喷水免费观看| 午夜福利在线观看吧| 最近最新免费中文字幕在线| 国产精品美女特级片免费视频播放器 | 午夜精品在线福利| 两个人看的免费小视频| 夜夜看夜夜爽夜夜摸| 日韩大码丰满熟妇| 成人18禁高潮啪啪吃奶动态图| 777久久人妻少妇嫩草av网站| 免费看日本二区| 人妻丰满熟妇av一区二区三区| 亚洲中文字幕日韩| 国产成年人精品一区二区| 最近在线观看免费完整版| 久久青草综合色| 日韩免费av在线播放| 琪琪午夜伦伦电影理论片6080| 久久精品国产99精品国产亚洲性色| 欧美 亚洲 国产 日韩一| 一二三四社区在线视频社区8| 国产亚洲欧美精品永久| 一区二区三区高清视频在线| 禁无遮挡网站| 久久国产精品影院| 日韩av在线大香蕉| 国产精品一区二区免费欧美| 国产av一区二区精品久久| 97超级碰碰碰精品色视频在线观看| 一区二区三区激情视频| 亚洲国产欧美一区二区综合| www日本在线高清视频| 女性生殖器流出的白浆| 精品国内亚洲2022精品成人| 亚洲第一青青草原| 高清在线国产一区| 老熟妇仑乱视频hdxx| av在线天堂中文字幕| 亚洲人成伊人成综合网2020| 男男h啪啪无遮挡| 久久久久久人人人人人| 亚洲第一青青草原| 最近最新免费中文字幕在线| 国产在线精品亚洲第一网站| 午夜两性在线视频| 久久99热这里只有精品18| 69av精品久久久久久| 久久久久久亚洲精品国产蜜桃av| 欧美国产日韩亚洲一区| netflix在线观看网站| 成人国产一区最新在线观看| 精品乱码久久久久久99久播| 99riav亚洲国产免费| 欧美日韩亚洲国产一区二区在线观看| 久久久久精品国产欧美久久久| 欧美乱色亚洲激情| 亚洲精品一区av在线观看| 亚洲熟妇熟女久久| 中国美女看黄片| 亚洲在线自拍视频| 又紧又爽又黄一区二区| 亚洲av成人av| 在线av久久热| 激情在线观看视频在线高清| 久久天堂一区二区三区四区| 久9热在线精品视频| 丁香六月欧美| 2021天堂中文幕一二区在线观 | 99久久综合精品五月天人人| 熟女电影av网| av在线天堂中文字幕| 日本三级黄在线观看| 91字幕亚洲| 国内毛片毛片毛片毛片毛片| 久久热在线av| 精品国产国语对白av| 999久久久精品免费观看国产| 日韩 欧美 亚洲 中文字幕| 真人一进一出gif抽搐免费| 成人精品一区二区免费| avwww免费| 桃红色精品国产亚洲av| 91在线观看av| 亚洲国产看品久久| 亚洲五月婷婷丁香| 欧美 亚洲 国产 日韩一| 18禁黄网站禁片午夜丰满| 中文资源天堂在线| 久久精品国产亚洲av香蕉五月| 亚洲成人久久爱视频| 亚洲精品av麻豆狂野| 成人18禁在线播放| 亚洲中文字幕日韩| 欧美性猛交黑人性爽| 亚洲一区高清亚洲精品| 白带黄色成豆腐渣| 亚洲精品色激情综合| 午夜精品久久久久久毛片777| 国产激情欧美一区二区| 少妇粗大呻吟视频| 成人免费观看视频高清| 日本撒尿小便嘘嘘汇集6| 两性午夜刺激爽爽歪歪视频在线观看 | 国产精华一区二区三区| www国产在线视频色| 久久 成人 亚洲| 久久久久久九九精品二区国产 | 波多野结衣高清无吗| 久久香蕉国产精品| 国产极品粉嫩免费观看在线| 真人做人爱边吃奶动态| 国产男靠女视频免费网站| 国产成人精品久久二区二区91| 中文在线观看免费www的网站 | 一进一出抽搐gif免费好疼| 美女高潮喷水抽搐中文字幕| 十八禁人妻一区二区| 国产成人一区二区三区免费视频网站| 午夜日韩欧美国产| www.自偷自拍.com| 19禁男女啪啪无遮挡网站| 免费看日本二区| 曰老女人黄片| 国产高清激情床上av| 亚洲五月天丁香| 午夜久久久在线观看| 久久国产精品影院| 岛国视频午夜一区免费看| 欧美人与性动交α欧美精品济南到| 两个人看的免费小视频| 欧美日韩精品网址| 天天躁狠狠躁夜夜躁狠狠躁| 两个人免费观看高清视频| 不卡一级毛片| 亚洲精品国产精品久久久不卡| x7x7x7水蜜桃| 亚洲国产精品久久男人天堂| 亚洲电影在线观看av| 男女床上黄色一级片免费看| aaaaa片日本免费| 美女国产高潮福利片在线看| 国产精品久久久av美女十八| 极品教师在线免费播放| 色av中文字幕| 亚洲成人免费电影在线观看| 极品教师在线免费播放| 精品第一国产精品| 日韩欧美国产一区二区入口| 亚洲狠狠婷婷综合久久图片| 成年免费大片在线观看| 757午夜福利合集在线观看| 国产欧美日韩一区二区三| 亚洲色图 男人天堂 中文字幕| 精品国产乱子伦一区二区三区| 国内少妇人妻偷人精品xxx网站 | 国产成人影院久久av| 国产成人av激情在线播放| www.自偷自拍.com| 夜夜爽天天搞| 亚洲中文日韩欧美视频| 2021天堂中文幕一二区在线观 | 日本熟妇午夜| 国产免费av片在线观看野外av| 国产真实乱freesex| 国产亚洲精品一区二区www| 欧美黑人精品巨大| 免费在线观看亚洲国产| 午夜两性在线视频| 久久中文字幕一级| 欧美国产日韩亚洲一区| 午夜视频精品福利| 成人午夜高清在线视频 | av中文乱码字幕在线| 制服丝袜大香蕉在线| 亚洲久久久国产精品| 久久中文字幕人妻熟女| 老司机午夜十八禁免费视频| 中文字幕精品免费在线观看视频| 欧美激情 高清一区二区三区| 无人区码免费观看不卡| 国产精品一区二区精品视频观看| 国产欧美日韩精品亚洲av| 非洲黑人性xxxx精品又粗又长| 日本熟妇午夜| 免费在线观看完整版高清| 国产日本99.免费观看| 免费无遮挡裸体视频| 俄罗斯特黄特色一大片| 日日爽夜夜爽网站| 午夜福利一区二区在线看| 久久九九热精品免费| 国产成+人综合+亚洲专区| 欧美午夜高清在线| 午夜精品久久久久久毛片777| 在线十欧美十亚洲十日本专区| 99热只有精品国产| 国产97色在线日韩免费| 久久国产精品影院| 久久久久久久午夜电影| 日本三级黄在线观看| 每晚都被弄得嗷嗷叫到高潮| 黄色视频不卡| 亚洲欧美精品综合久久99| 中文亚洲av片在线观看爽| 在线天堂中文资源库| www国产在线视频色| 欧美成人午夜精品| 国产精品二区激情视频| 无人区码免费观看不卡| 搞女人的毛片| 国产精品久久久久久精品电影 | 国产在线精品亚洲第一网站| 色哟哟哟哟哟哟| 听说在线观看完整版免费高清| 欧美中文综合在线视频| 国产高清视频在线播放一区| 中文字幕人妻丝袜一区二区| 亚洲色图av天堂| 国产精品一区二区三区四区久久 | 亚洲在线自拍视频| 最好的美女福利视频网| 日韩av在线大香蕉| 欧美久久黑人一区二区| 精品一区二区三区视频在线观看免费| 久久久精品欧美日韩精品| 久久人妻av系列| 日本五十路高清| 精品久久久久久久末码| 国产精品电影一区二区三区| 国产精品综合久久久久久久免费| 久久中文字幕一级| 中文字幕最新亚洲高清| 成人国产一区最新在线观看| 亚洲aⅴ乱码一区二区在线播放 | 亚洲av电影不卡..在线观看| 999久久久精品免费观看国产| 精品久久久久久久毛片微露脸| 熟女少妇亚洲综合色aaa.| 亚洲电影在线观看av| 嫩草影院精品99| 色尼玛亚洲综合影院| 大型黄色视频在线免费观看| 亚洲一码二码三码区别大吗| 精品一区二区三区av网在线观看| 免费看a级黄色片| 精品久久久久久久末码| 成人精品一区二区免费| 50天的宝宝边吃奶边哭怎么回事| 神马国产精品三级电影在线观看 | 久久中文字幕一级| 亚洲欧洲精品一区二区精品久久久| 国产爱豆传媒在线观看 | 嫩草影院精品99| 久久久久精品国产欧美久久久| 波多野结衣高清无吗| 日本 欧美在线| 久久久久久久久中文| 婷婷六月久久综合丁香| 中文字幕人妻熟女乱码| 亚洲国产精品合色在线| 国产午夜精品久久久久久| 人妻久久中文字幕网| 久久久久久人人人人人| 亚洲国产欧美一区二区综合| 真人做人爱边吃奶动态| 国产高清激情床上av| 操出白浆在线播放| 一二三四在线观看免费中文在| 久久久水蜜桃国产精品网| 少妇的丰满在线观看| 一级a爱视频在线免费观看| 成人三级黄色视频| 成在线人永久免费视频| 国产高清videossex| www.自偷自拍.com| 午夜免费激情av| 亚洲午夜精品一区,二区,三区| 久久香蕉国产精品| 国产片内射在线| 人人妻,人人澡人人爽秒播| 久久精品91无色码中文字幕| 国产亚洲精品一区二区www| 亚洲国产欧洲综合997久久, | 精品不卡国产一区二区三区| 黑丝袜美女国产一区| 亚洲avbb在线观看| 日韩欧美国产一区二区入口| 99riav亚洲国产免费| 亚洲一区二区三区不卡视频| 天堂动漫精品| 亚洲欧洲精品一区二区精品久久久| 2021天堂中文幕一二区在线观 | 国产精品国产高清国产av| 亚洲中文av在线| 最新美女视频免费是黄的| 精华霜和精华液先用哪个| 亚洲人成电影免费在线| 国产精品98久久久久久宅男小说| 久久中文字幕人妻熟女| 看免费av毛片| 免费高清视频大片| 精品国内亚洲2022精品成人| 国产成年人精品一区二区| 亚洲国产精品久久男人天堂| 国产真人三级小视频在线观看| 国产精品美女特级片免费视频播放器 | 性欧美人与动物交配| 国产精品国产高清国产av| АⅤ资源中文在线天堂| 高清在线国产一区| 无遮挡黄片免费观看| 99精品久久久久人妻精品| 人人妻人人澡欧美一区二区| 久久亚洲精品不卡| 亚洲成a人片在线一区二区| 亚洲成人久久性| 这个男人来自地球电影免费观看| 欧美乱码精品一区二区三区| 一二三四社区在线视频社区8| 日韩欧美在线二视频| 日本五十路高清| 国产熟女午夜一区二区三区| 在线观看66精品国产| 久久精品国产亚洲av高清一级| 亚洲中文日韩欧美视频| 深夜精品福利| 国产av一区在线观看免费| 亚洲第一av免费看| aaaaa片日本免费| 国内少妇人妻偷人精品xxx网站 | 搡老熟女国产l中国老女人| 久久精品影院6| 最近最新中文字幕大全电影3 | 久久久久久久午夜电影| 美女扒开内裤让男人捅视频| 黄色成人免费大全| 亚洲av日韩精品久久久久久密| 欧美中文综合在线视频| 免费在线观看影片大全网站| 18美女黄网站色大片免费观看| 亚洲va日本ⅴa欧美va伊人久久| 19禁男女啪啪无遮挡网站| 日本一本二区三区精品| 国产欧美日韩一区二区三| 法律面前人人平等表现在哪些方面| 久久人人精品亚洲av| 99精品久久久久人妻精品| 国产一级毛片七仙女欲春2 | 国产精品亚洲美女久久久| 色综合站精品国产| 久久 成人 亚洲| 在线天堂中文资源库| 久久久久久久久免费视频了| 国产精品久久久久久精品电影 | 免费看a级黄色片| 国产日本99.免费观看| 日韩精品青青久久久久久| 禁无遮挡网站| 亚洲人成网站在线播放欧美日韩| a级毛片在线看网站| 亚洲精品一卡2卡三卡4卡5卡| av视频在线观看入口| 亚洲最大成人中文| 国产高清激情床上av| 法律面前人人平等表现在哪些方面| 久久国产精品男人的天堂亚洲| 亚洲成国产人片在线观看| 久久人人精品亚洲av| 亚洲免费av在线视频| 人人妻人人澡欧美一区二区| 99热6这里只有精品| 波多野结衣高清无吗| 精品无人区乱码1区二区| 精品国产乱子伦一区二区三区| 国产免费男女视频| 欧美日韩亚洲综合一区二区三区_| 久久精品国产综合久久久| 91成年电影在线观看| 亚洲中文日韩欧美视频| 久久久久久大精品| 精品高清国产在线一区| 中文字幕人妻丝袜一区二区| 精品一区二区三区av网在线观看| 宅男免费午夜| xxx96com| АⅤ资源中文在线天堂|