• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于歸一化點(diǎn)向互信息的低資源平行語料過濾方法*

    2022-01-25 14:11:04章浩然
    通信技術(shù) 2021年12期
    關(guān)鍵詞:語料平行短語

    吳 霖,章浩然

    (昆明理工大學(xué),云南 昆明 650500)

    關(guān)鍵字:神經(jīng)機(jī)器翻譯;過濾;歸一化點(diǎn)向互信息算法;平行語料;對齊信息

    0 引言

    神經(jīng)機(jī)器翻譯是數(shù)據(jù)驅(qū)動(dòng)模型,提高平行語料的規(guī)模和質(zhì)量是提升神經(jīng)機(jī)器翻譯性能最簡單有效的方法。然而,通過非人工方式得到的平行語料,其規(guī)模足夠但質(zhì)量不佳。平行語料質(zhì)量不佳的情況下,提高其規(guī)模并不會(huì)讓模型有較大的性能提升甚至存在性能下降的情況,因此提高平行語料的質(zhì)量成了提升模型性能的關(guān)鍵,這使得平行語料過濾方法變得越來越重要。

    語料過濾方法是從一個(gè)大規(guī)模的、含有噪聲的平行語料中,過濾出一個(gè)較高質(zhì)量的子語料,并以此來提高翻譯模型性能的方法。當(dāng)前,根據(jù)句子長度、句子長度比例以及語言標(biāo)識(shí)等來過濾語料的方法較為簡單和通用。其中語言標(biāo)識(shí)過濾是過濾掉特定語言對中不屬于該語言對的句子,例如在漢泰語料中,只過濾源語言不為漢語且目標(biāo)語言不為泰語的句子。但是,這些方法只能過濾存在明顯錯(cuò)誤的句對,難以判別并過濾詞翻譯錯(cuò)誤或句意不一致的句對。利用少量干凈的平行語料來提供對齊信息,根據(jù)提供的對齊信息來判別每個(gè)句對是否為噪聲句對的過濾方法也較為常見[1-3],但這些過濾方法都需要有少量干凈的平行語料。但在低資源語言對中,可能存在大規(guī)模且含有噪聲的平行語料,并不存在少量干凈的平行語料。

    例如OpenSubtitles[4]中的漢泰平行語料就存在大量噪聲,致使翻譯模型性能不佳,也不存在干凈的且領(lǐng)域相同的平行語料提供對齊信息;因此需要從噪聲語料或單語語料中尋找對齊信息。而在神經(jīng)機(jī)器翻譯領(lǐng)域中,通常采用跨語言預(yù)訓(xùn)練模型或多語言預(yù)訓(xùn)練模型來提供對齊信息。Ivana 等人[5]利用無監(jiān)督神經(jīng)機(jī)器翻譯生成偽平行語料來提供偽對齊信息,然后利用該偽平行語料微調(diào)跨語言模型(Cross-lingual Language Model,XLM)[6],以此來獲取多語言句子嵌入信息。該方法可以用于計(jì)算句子間的相互翻譯程度,從而挖掘和過濾平行語料,但這樣的方法需要龐大的單語語料和強(qiáng)大的硬件支持。

    為了減少對單語語料和硬件的依賴,從噪聲語料中抽取出對齊信息是更為有效的方法。點(diǎn)向互信息(Pointwise Mutual Information,PMI)[7]是一種獲取語料中詞對共現(xiàn)概率的方法,其詞對共現(xiàn)概率是由詞對中兩個(gè)詞各自出現(xiàn)的概率和其共同出現(xiàn)概率來得到的。由于噪聲語料中,對齊較差的詞對不具備規(guī)律性,其共同出現(xiàn)的概率低,會(huì)被PMI 賦予低共現(xiàn)概率,而對齊較好的詞對存在一定的規(guī)律性,會(huì)被PMI 賦予高共現(xiàn)概率,通過這樣的方法可以從噪聲語料中抽取出可靠性高的對齊信息。然而,由于PMI 會(huì)給予低頻詞更大的權(quán)重,這會(huì)導(dǎo)致低頻詞對具備更大的共現(xiàn)概率,形成噪聲,降低對齊信息的質(zhì)量。因此,本文采用給予低頻詞對更低權(quán)重的歸一化點(diǎn)向互信息(Normalized Pointwise Mutual Information,NPMI)[8]來抽取噪聲語料中的對齊信息。

    本文采用基于NPMI的平行語料過濾方法,該方法直接在噪聲語料中抽取出對齊信息,并利用其中可靠性高的對齊信息來過濾噪聲語料。本文在OpenSubtitles的泰語—漢語翻譯方向上提高了5.8個(gè)BLEU 值,漢語—泰語翻譯方向上提高了10 個(gè)BLEU 值。該方法在2020 年國際機(jī)器翻譯大賽給出的柬埔寨語—英語單向翻譯任務(wù)中實(shí)驗(yàn),得到的結(jié)果比基線高了0.4 個(gè)BLEU 值。

    1 相關(guān)工作

    1.1 平行語料過濾任務(wù)

    國際機(jī)器翻譯大賽(WMT)在2018 年[9]、2019 年[10]、2020 年[11]分別舉行了不同語言對的平行語料過濾任務(wù)比賽,其中也包括低資源語言對,例如柬埔寨語-英語以及普什圖語-英語,這也是目前最有影響力的平行語料過濾任務(wù)。在WMT2020的任務(wù)中,參賽者根據(jù)噪聲語料中每個(gè)句對的質(zhì)量進(jìn)行評(píng)分,最終按照每個(gè)句對的分?jǐn)?shù)由高到低選取。為了降低平行語料數(shù)量的影響,官方規(guī)定了過濾后的平行語料中,英語語料的詞元(token)數(shù)為5百萬左右。其評(píng)價(jià)平行語料質(zhì)量的方法是在該平行語料上訓(xùn)練一個(gè)翻譯模型,翻譯模型的雙語評(píng)估替補(bǔ)(Bilingual Evaluation Understudy,BLEU)值越大則代表平行語料質(zhì)量越好。此外,所有參賽者都使用相同的翻譯模型,參數(shù)由官方給定。

    1.2 平行語料過濾任務(wù)

    句對的相互翻譯程度(以下稱之為平行度)的計(jì)算是過濾方法的核心。句對平行度的計(jì)算可以分為詞級(jí)和句級(jí),現(xiàn)有的過濾方法也主要以這兩個(gè)方面為主。因此,如何找到意思表達(dá)更精確的詞向量或句向量,以及如何找到更為精準(zhǔn)的對齊信息是提高過濾性能的關(guān)鍵。

    Herold 等人[12]采用glove[13]在每個(gè)語言的單語語料上分別學(xué)習(xí)該語言的詞向量,并將兩種語言的單語詞向量映射到同一向量空間,兩種語言句子中每個(gè)詞對的余弦相似度的總和作為句對平行度,最后實(shí)驗(yàn)證明了語言標(biāo)識(shí)檢測方法的有效性以及適用范圍。除了利用詞向量來計(jì)算兩個(gè)語言句子的平行度外,還可以利用多語言預(yù)訓(xùn)練模型或跨語言預(yù)訓(xùn)練模型,具體是將兩種語言的詞或句子向量映射到相同向量空間中并在一定程度上將它們進(jìn)行對齊,以此來保證兩種語言的詞或句子向量可以進(jìn)行更為精確的余弦相似度計(jì)算。

    阿里巴巴團(tuán)隊(duì)[14]利用小規(guī)模干凈的平行語料對語料過濾模型(GPT-2[15])進(jìn)行了最初的訓(xùn)練;之后利用該過濾模型對噪聲語料進(jìn)行過濾,將高質(zhì)量的平行語料和干凈的平行語料進(jìn)行合并;最后利用合并后的語料訓(xùn)練一個(gè)新版本的過濾模型,并迭代3 次來提高過濾模型的過濾性能。

    字節(jié)跳動(dòng)[16]團(tuán)隊(duì)利用大規(guī)模的單語語料和官方提供的干凈平行語料上訓(xùn)練了一個(gè)高性能的XLM,并在XLM 上添加一個(gè)線性或卷積層來預(yù)測每個(gè)句對是否平行,最終用4 個(gè)參數(shù)不同或最后一層不同的XLM 對每個(gè)句對進(jìn)行評(píng)分,以它們的平均得分作為最終的質(zhì)量評(píng)分。

    評(píng)估句對的平行度不僅可以利用余弦相似度,而且可以利用翻譯模型的交叉熵?fù)p失值。Marcin[1]利用對偶條件交叉熵?fù)p失結(jié)合語言模型作為過濾條件。其中對偶條件交叉熵?fù)p失由兩個(gè)相反翻譯方向的翻譯模型計(jì)算兩個(gè)交叉熵?fù)p失值的差異得到,用于過濾掉對齊錯(cuò)誤的句對;而語言模型分別為一個(gè)領(lǐng)域內(nèi)和領(lǐng)域外的語言模型來計(jì)算其領(lǐng)域的相似性得到,用于過濾掉與領(lǐng)域不相關(guān)的句對。

    1.3 PMI

    PMI 是一種在訓(xùn)練語料上構(gòu)建一個(gè)共現(xiàn)矩陣,來對訓(xùn)練語料重新加權(quán)的方法。計(jì)算方法為:

    式中:x和y分別為源語言的詞和目標(biāo)語言的詞;p(x)和p(y)分別為x和y在語料中出現(xiàn)的概率;p(x,y)為x和y兩個(gè)詞共同出現(xiàn)的概率。

    在實(shí)踐中發(fā)現(xiàn),將詞對中的負(fù)相關(guān)置0,PMI的表現(xiàn)會(huì)更好。而NPMI 也是一種在訓(xùn)練語料上構(gòu)建一個(gè)共現(xiàn)矩陣,來對訓(xùn)練語料重新加權(quán)的方法。該方法對PMI 進(jìn)行了規(guī)范化,從而緩解了PMI 對低頻詞對的偏向。計(jì)算方法為:

    2 方 法

    OpenSubtitles 中的漢泰平行語料質(zhì)量較差,且沒有同領(lǐng)域高質(zhì)量的平行語料作為錨點(diǎn)提供對齊信息。因此本文選擇直接在漢泰噪聲語料上抽取對齊信息,通過NPMI 來計(jì)算每個(gè)詞對的共現(xiàn)概率,并利用高共現(xiàn)概率的詞對來過濾噪聲語料。

    機(jī)器翻譯領(lǐng)域存在大量一對一的詞對,但也存在多對一、一對多甚至多對多的短語對。為了能夠獲取噪聲語料中存在的短語對信息。本文采用快速對齊(fast align)[17]來得到源句子與目標(biāo)句子中詞的對齊信息,以此來構(gòu)建出源與目標(biāo)的短語對表,并過濾掉其中低頻率的短語對。通過該方法得到的短語表,可以用于簡單的過濾。

    本文將源語言和目標(biāo)語言分別用X和Y進(jìn)行表示,并利用Px和Py代表分別從X和Y中抽取得到的短語。f(X,Y)是根據(jù)fast align 從X和Y中獲得的詞對齊信息,構(gòu)建出的短語對函數(shù)。因此,本文的NPMI 不計(jì)算噪聲語料中所有可能存在的詞對或短語對,只計(jì)算短語表中存在的詞對或短語對,這樣可以減少可靠性低的對齊信息數(shù)量,進(jìn)而提高從噪聲語料中提取對齊信息的可靠性。

    利用統(tǒng)計(jì)機(jī)器翻譯的fast align 技術(shù),本文可以得到所有可能的短語表(其中包括詞對),若將句子中的短語看作為一個(gè)詞,平行語料中依然以一對一詞對為主,因此本文采用與Tu 等人[18]一樣的翻譯覆蓋率來進(jìn)一步保證兩個(gè)句子的平行度。本文以整個(gè)源句子在目標(biāo)句子中是否存在相對應(yīng)的翻譯為基礎(chǔ),若源句子中的某個(gè)詞在目標(biāo)句子中沒有與之相對應(yīng)的詞,則降低源句子的翻譯覆蓋率。同樣判斷目標(biāo)句中的每個(gè)詞是否可以在源句子中找到相對應(yīng)的詞,如果沒有與之對應(yīng)的詞,則降低目標(biāo)句子的翻譯覆蓋率。之所以對源句子和目標(biāo)句子都做翻譯覆蓋率的調(diào)整,原因有二:一是翻譯是雙向的,需要在漢泰和泰漢兩個(gè)翻譯方向上都訓(xùn)練;二是防止源或目標(biāo)句子的每個(gè)詞都指向目標(biāo)或源中的同一個(gè)詞,從而避免存在錯(cuò)誤的翻譯覆蓋率。

    為了計(jì)算噪聲語料中對齊信息的可靠性,本文采用NPMI 方法。該方法是對PMI 進(jìn)行了歸一化,防止低頻短語對的可靠性太高。同時(shí)根據(jù)正點(diǎn)向互信息(Positive Pointwise Mutual Information,PPMI)[19](只保留PMI 中大于0的值)的效果好于PMI的效果,本文只使用了NPMI 中大于0的部分。

    本文使用了由NPMI 得到的對齊信息和翻譯覆蓋率(normalized pointwise Mutual Information and Translation Coverage,MITC)來評(píng)估源句子與目標(biāo)句子的平行度,計(jì)算方法為:

    式中:|·|為短語或句子包含的token 個(gè)數(shù),用該方法來防止長句子對擁有太高的分?jǐn)?shù)和短句子對擁有太低的分?jǐn)?shù),盡管短句子對的質(zhì)量可能高于長句子對的質(zhì)量;C(Y|X)為X中的所有可以在Y中找到對應(yīng)翻譯的詞在整個(gè)X中的占比,即X的翻譯覆蓋率;C(X|Y)為Y的翻譯覆蓋率。

    這里計(jì)算源句子和目標(biāo)句子平行度的依據(jù)是:

    (1)如果對齊信息(Px,Py)有很高的可靠性,則包含(Px,Py)的句對(X,Y)同樣有很高的對齊可靠性,即句對的平行度很高;

    (2)如果短語Px或者Py在X或Y整個(gè)句子中的占比非常大,則對齊信息(Px,Py)與句對(X,Y)是強(qiáng)關(guān)聯(lián);

    (3)若C(Y|X)和C(X|Y)代表了(X,Y)整體平行度,則翻譯覆蓋率越高,(X,Y)的整體平行度就越高。

    3 實(shí) 驗(yàn)

    本文在漢泰翻譯上采用OpenSubtitles 中的漢泰語料作為訓(xùn)練集,總共有117 萬句對,驗(yàn)證集和測試集均為2 000 句對。在柬埔寨語—英語翻譯方向上采用WMT2020的平行語料過濾任務(wù)的噪聲語料過濾后的語料作為訓(xùn)練集,驗(yàn)證集與測試集由WMT2020 官方給出,驗(yàn)證集有2 378 句對,測試集有2 309 句對。

    翻譯模型采用transformer[20],批次大小為64,嵌入層維度為512,隱藏層維度為512,編碼器和解碼器的層數(shù)均設(shè)置為6,注意力頭個(gè)數(shù)設(shè)置為8,學(xué)習(xí)率為0.000 5,丟棄率(dropout)為0.1,解碼采用集束搜索,集束寬度設(shè)置為4,優(yōu)化器設(shè)置為Adam,最大Epoch 設(shè)置為100。訓(xùn)練結(jié)束的標(biāo)志為連續(xù)10 個(gè)epoch 模型在驗(yàn)證集上的損失值沒有超過當(dāng)前最優(yōu)損失值就停止訓(xùn)練。詞匯表大小設(shè)置為50 000,泰語用pythainlp[21]進(jìn)行分詞,漢語利用jieba 進(jìn)行分詞。采用不區(qū)分大小寫的BLEU-4 來測量BLEU 值。模型利用tensorflow 2.2 進(jìn)行實(shí)現(xiàn),所有實(shí)驗(yàn)均在Nvidia GPU(GTX titan X)上運(yùn)行。

    柬埔寨語—英語實(shí)驗(yàn)采用的模型由官方提供。源語言與目標(biāo)語言共享詞嵌入,編碼器層與解碼器層均為5 層,嵌入層維度為512,隱藏層維度為2 048,注意力頭個(gè)數(shù)均為2,dropout 為0.4,學(xué)習(xí)率設(shè)置為0.001,優(yōu)化器設(shè)置為Adam,最大epoch 設(shè)置為100。過濾過程中,柬埔寨語采用KhmerNLP[22]進(jìn)行分詞。

    3.1 漢泰OpenSubtitles 實(shí)驗(yàn)

    3.1.1 預(yù)過濾和基線

    針對漢泰的OpenSubtitles 語料,為了盡可能提高翻譯模型的性能,本文先從句子長度和句子比例進(jìn)行分析,找到最佳的句子長度和句子長度比例。在以下實(shí)驗(yàn)中,本文先對原始的117 萬語料按長度比例進(jìn)行過濾,然后隨機(jī)抽取20 萬作為訓(xùn)練集,此過程重復(fù)3 次取它們的平均值。實(shí)驗(yàn)結(jié)果如表1所示。

    表1 句子長度比例對BLEU 值的影響

    在不限制句子長度的情況下,本文只利用句對的句子長度比例對語料進(jìn)行過濾,句子長度比例為1.5 則代表句子長度比例在1.5 以上的句對都將被過濾掉。實(shí)驗(yàn)結(jié)果證明,句子長度比例為2的時(shí)候,最適合該漢泰語料,可以將翻譯模型的性能最大化。

    本文在句子比例為2的條件下,為了找到能將翻譯模型性能最大化的語料,針對句子最大長度進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表2 所示。

    表2 句子最大長度對BLEU 值的影響

    從句子長度來看,最大長度為10的語料可以將翻譯模型的性能最大化,這可能是因?yàn)镺penSubtitles 上漢泰語料的平均長度在9 個(gè)token 左右(泰語語料的每句話的平均長度為9.5 個(gè)token,漢語語料的每句話的平均長度為8.1 個(gè)token),但該句子長度過短,因此本文選擇對翻譯模型的性能提升次佳的句子最大長度為30的語料。

    句子比例為2 且句子最大長度為10的語料(包含20 萬句對)的BLEU 值與用完整原始語料(包含117 萬句對)的BLEU 近似,這說明基于規(guī)則的語料過濾方法的有效性,也證明了OpenSubtitles的漢泰語料的確存在著大量的噪聲。

    最后利用常規(guī)的langid 工具包過濾掉其中泰語端句子并不屬于泰語或者漢語端句子并不屬于漢語的句對?;€實(shí)驗(yàn)結(jié)果如表3 所示。

    表3 基線的BLEU 值

    基線(20 萬)是在原始語料中隨機(jī)抽取20 萬平行語料上訓(xùn)練的模型,而基線(117 萬)是在完整的原始語料上訓(xùn)練的模型。在經(jīng)過句子比例為2、句子長度為30 以及l(fā)angid 過濾后的語料(本文稱之為預(yù)過濾語料)上訓(xùn)練的模型與在基線(20 萬)上訓(xùn)練的模型相比,在泰漢上高了3.029 個(gè)BLEU值,在漢泰上高了2.898 個(gè)BLEU 值。而預(yù)過濾(20 萬)與基線(117 萬)相比,在泰漢上高了0.168 個(gè)BLEU 值,在漢泰上低了0.663 個(gè)BLEU 值,預(yù)過濾(20 萬)的性能與基線(117 萬)的性能相當(dāng)。實(shí)驗(yàn)證明,利用預(yù)過濾方法可以有效地提高語料的質(zhì)量。

    3.1.2 基于NPMI的過濾方法

    本文先利用fast align 得到短語對表,針對這個(gè)短語對表對整個(gè)漢泰語料進(jìn)行了NPMI。從而得到短語對表中每一個(gè)短語對的共現(xiàn)概率,并且過濾掉了共現(xiàn)概率低于0.2的短語對。實(shí)驗(yàn)結(jié)果如表4所示。

    表4 不同條件下NPMI 過濾效果的對比

    在該實(shí)驗(yàn)中,表中“短語對N”代表在短語對數(shù)量大于等于N的語料上訓(xùn)練的模型,MITC 代表著在NPMI 和翻譯覆蓋率過濾后的語料上進(jìn)行訓(xùn)練的模型。本文不做短語對數(shù)量為4 及以上的實(shí)驗(yàn)的原因是過濾后的平行語料數(shù)量不到12 萬,而其他方法的數(shù)量均在20 萬以上,且隨機(jī)抽取20 萬語料進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)證明,在共現(xiàn)短語對數(shù)量上,共現(xiàn)短語對3的效果優(yōu)于共現(xiàn)短語對2的效果,因此擁有更多共現(xiàn)短語對的句子對具備更高的相互翻譯程度。但單純地利用共現(xiàn)短語對個(gè)數(shù)進(jìn)行判定的方法,也會(huì)導(dǎo)致在長句子上具有更大的優(yōu)勢,因此采用翻譯覆蓋率來降低語料中長句子的優(yōu)勢。實(shí)驗(yàn)表明,利用共現(xiàn)短語對在句對中的翻譯覆蓋率來進(jìn)行過濾是更佳的選擇,比起在共現(xiàn)短語對數(shù)量為3 個(gè)以上語料上訓(xùn)練的模型,在搭配翻譯覆蓋率語料(MITC)上訓(xùn)練的模型,在泰漢上提高了1.61 個(gè)BLEU,在漢泰上提高了2.42 個(gè)BLEU。將在MITC 上訓(xùn)練的模型與在預(yù)過濾語料上訓(xùn)練的模型相比,在泰漢上提高了5.884 個(gè)BLEU 值,在漢泰上提高了10 個(gè)BLEU 值。

    3.1.3 NPMI 對生成式偽平行語料的過濾效果

    本文除了在抽取式方法得到的平行語料上進(jìn)行實(shí)驗(yàn),也在生成式方法得到的平行語料上進(jìn)行實(shí)驗(yàn)。

    本文利用在基線(117 萬)語料上訓(xùn)練的模型和在MITC 過濾后的語料上訓(xùn)練的模型來生成偽平行語料。以此來探索NPMI 在對偽平行語料過濾的有效性。

    將在117 萬和MITC 語料上訓(xùn)練的兩個(gè)翻譯模型生成的偽平行語料(數(shù)量均為117 萬),與MITC的訓(xùn)練語料進(jìn)行混合。這是為了比較兩個(gè)翻譯模型生成的偽平行語料質(zhì)量,同時(shí)保證存在高質(zhì)量的平行語料,防止NPMI 被回譯生成的偽平行語料干擾,影響過濾效果。之后利用混合后的語料,分別在不進(jìn)行NPMI 過濾和進(jìn)行NPMI 過濾的情況下,重新訓(xùn)練翻譯模型。實(shí)驗(yàn)結(jié)果如表5 所示。

    表5 NPMI 對生成式偽平行語料的過濾效果

    表5 中,基線(117 萬)代表在原始語料上訓(xùn)練的模型;MITC 代表在經(jīng)過NPMI 和翻譯覆蓋率過濾后的語料上訓(xùn)練的模型;117 萬(未過濾)代表在基線(117 萬)生成的偽平行語料和經(jīng)過NPMI和翻譯覆蓋率過濾后的語料上訓(xùn)練的模型;117 萬(過濾)代表在117 萬(未過濾)所用語料的基礎(chǔ)上,進(jìn)行了NPMI 和翻譯覆蓋率過濾后的語料上訓(xùn)練的模型;MITC(未過濾)代表在MITC 生成的偽平行語料和經(jīng)過NPMI 和翻譯覆蓋率過濾后的語料上訓(xùn)練的模型;MITC(過濾)代表在MITC(未過濾)所用語料的基礎(chǔ)上,進(jìn)行了NPMI 和翻譯覆蓋率過濾后的語料上訓(xùn)練的模型。

    從117 萬(未過濾)模型和MITC(未過濾)模型的性能上可以看出,利用回譯生成偽平行語料的質(zhì)量依賴于翻譯模型的性能。在性能上,基線(117萬)模型性能比MITC 模型在泰漢上低了6.052 個(gè)BLEU 值,而在漢泰上低了9.356 個(gè)BLEU 值。這個(gè)差異在各自生成的偽平行語料的質(zhì)量上得到了體現(xiàn)。117 萬(未過濾)模型與MITC(未過濾)模型相比,在泰漢上低了4.12 個(gè)BLEU 值,而漢泰上則低了6.83 個(gè)BLEU 值。

    在分別對兩個(gè)語料做NPMI 過濾后,雙方的混合語料規(guī)模均出現(xiàn)了下降,117 萬(過濾)模型訓(xùn)練集數(shù)量在泰漢和漢泰兩個(gè)方向均為57 萬左右,而MITC(過濾)模型訓(xùn)練集數(shù)量在泰漢上有79 萬左右,但是漢泰上不到76 萬。經(jīng)過過濾后存在的數(shù)量差異也表明了雙方生成的偽平行語料在質(zhì)量上存在差異。此外,117 萬(過濾)模型與117 萬(未過濾)模型相比,在泰漢和漢泰兩個(gè)翻譯方向上分別提高了1.44 和1.42 個(gè)BLEU 值;MITC(過濾)模型與MITC(未過濾)模型相比,在泰漢和漢泰兩個(gè)翻譯方向上分別提高了1.42和1.11個(gè)BLEU值。這證明了NPMI 過濾方法確實(shí)可以過濾掉生成式偽平行語料中的低質(zhì)量句對。

    同時(shí),本文為進(jìn)一步探索NPMI 在生成式偽平行語料上過濾的效果。采用MITC(過濾)語料訓(xùn)練的翻譯模型來再次生成偽平行語料,生成的語料會(huì)與最初訓(xùn)練的語料進(jìn)行混合。實(shí)驗(yàn)結(jié)果如表6 所示。

    表6 NPMI 對第二次生成的偽平行語料的過濾效果

    在該實(shí)驗(yàn)中,表中“短語對N”代表在短語對數(shù)量大于等于N的語料上訓(xùn)練的模型,MITC 代表在MITC 過濾后的語料進(jìn)行訓(xùn)練的模型。本文使用所有符合篩選條件的語料作為訓(xùn)練集,泰漢實(shí)驗(yàn)中,短語對數(shù)量為3 以上的語料有87 萬,短語對數(shù)量為4 以上的語料有66 萬,短語對數(shù)量為5 以上的語料有49 萬;在漢泰實(shí)驗(yàn)中,短語對數(shù)量為3 以上的語料有86 萬,短語對數(shù)量為4 以上的語料有65 萬,短語對數(shù)量為5 以上的語料有47 萬;經(jīng)過MITC 過濾的語料在泰漢和漢泰上均為99 萬。在泰漢上,短語對3 和短語對4 模型的性能高于在未過濾語料上訓(xùn)練出來的模型性能,這表明在泰漢上NPMI 具備過濾第二次生成的偽平行語料的能力,但在漢泰上,沒有在任何過濾后語料上訓(xùn)練的模型性能高于在未過濾語料上訓(xùn)練的模型性能。本文猜想,NPMI 在泰漢上有過濾效果,但在漢泰上沒有過濾效果,是由于泰漢翻譯模型(表5 中的MITC泰漢模型)生成的偽平行語料中依然存在對模型性能只造成負(fù)面影響的噪聲,但漢泰翻譯模型(表5中的MITC 漢泰模型)生成的偽平行語料中的極大部分語料已經(jīng)不是簡單的噪聲語料,都是對模型的性能有正面影響也有負(fù)面影響的句對。而NPMI 直接對平行語料進(jìn)行過濾,會(huì)直接將這樣的語料過濾掉導(dǎo)致模型缺乏部分必要的語義信息,致使模型性能降低。在該實(shí)驗(yàn)的漢泰中也體現(xiàn)了這一情況,語料規(guī)模的下降會(huì)導(dǎo)致模型性能的下降,性能最高的MITC 模型也是漢泰語料最多的模型,訓(xùn)練語料高達(dá)99 萬。

    3.2 柬埔寨語—英語WMT20 實(shí)驗(yàn)

    為了證明本文方法的有效性,本文在WMT2020的柬埔寨語—英語的平行語料過濾任務(wù)中也做了實(shí)驗(yàn)。

    在WMT2020的平行語料過濾任務(wù)中,官方提供了帶有噪聲的柬埔寨語—英語的平行語料。參與者只需要提供過濾后的平行語料,其余的由官方提供,包括參數(shù)一致的翻譯模型,共同的驗(yàn)證集和測試集。

    柬埔寨語—英語同樣是低資源語言對,現(xiàn)有的干凈平行語料稀少,過濾過程中無法采用干凈的平行語料作為錨點(diǎn)對噪聲語料進(jìn)行過濾。雖然官方提供了少量的干凈平行語料,但本文為了實(shí)驗(yàn)的一致性并沒有使用該平行語料,依然采用NPMI 直接從噪聲語料提取對齊信息,之后利用可靠性高的對齊信息進(jìn)行過濾。

    對比實(shí)驗(yàn)使用的數(shù)據(jù)都是英語token 數(shù)量為2百萬的語料。實(shí)驗(yàn)結(jié)果如表7 所示。

    表7 柬英上不同過濾方法的對比

    實(shí)驗(yàn)表明,NPMI的過濾在驗(yàn)證集和測試集上均比LASER 低了0.2 個(gè)BLEU 值,但將NPMI 和LASER 進(jìn)行聯(lián)合過濾之后,在驗(yàn)證集上比LASER 高了0.8個(gè)BLEU值,而在測試集上高了0.4個(gè)BLEU值。

    4 結(jié)語

    針對非人工方式得到的平行語料的規(guī)模足夠但質(zhì)量不佳的問題,提出了基于NPMI的平行語料過濾方法。該方法在不使用任何單語語料和干凈平行語料而只使用噪聲語料的情況下,可以直接抽取出噪聲語料中可靠性高的對齊信息,并利用該對齊信息對噪聲語料進(jìn)行過濾。在抽取式的平行語料上,過濾效果良好,在只生成一次的偽平行語料上,NPMI 也可以提高偽平行語料的質(zhì)量,但在二次生成的偽平行語料上,過濾效果不佳。如何改進(jìn)NPMI 在多次生成的偽平行語料的過濾效果是筆者未來的研究方向。

    猜你喜歡
    語料平行短語
    向量的平行與垂直
    平行
    逃離平行世界
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    再頂平行進(jìn)口
    汽車觀察(2016年3期)2016-02-28 13:16:36
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
    一区二区av电影网| 99久久综合免费| av又黄又爽大尺度在线免费看| av超薄肉色丝袜交足视频| 天天操日日干夜夜撸| 久久女婷五月综合色啪小说| 精品人妻熟女毛片av久久网站| 日本黄色日本黄色录像| 他把我摸到了高潮在线观看 | 黄片大片在线免费观看| 国产精品1区2区在线观看. | 久久免费观看电影| 一级毛片女人18水好多| 大陆偷拍与自拍| 18禁国产床啪视频网站| 欧美精品亚洲一区二区| 欧美人与性动交α欧美软件| 久久ye,这里只有精品| 少妇人妻久久综合中文| 午夜老司机福利片| 久久精品成人免费网站| 新久久久久国产一级毛片| 亚洲精品国产区一区二| 自拍欧美九色日韩亚洲蝌蚪91| 国产成人精品在线电影| 午夜激情av网站| 高清在线国产一区| 狠狠婷婷综合久久久久久88av| 国产91精品成人一区二区三区 | 黄色 视频免费看| 久久国产精品影院| 老司机亚洲免费影院| 欧美乱码精品一区二区三区| 中文字幕高清在线视频| 亚洲情色 制服丝袜| 免费av中文字幕在线| 亚洲成人手机| 99久久人妻综合| 亚洲精品美女久久久久99蜜臀| 亚洲激情五月婷婷啪啪| 国产片内射在线| 国产老妇伦熟女老妇高清| 精品亚洲乱码少妇综合久久| 国产一区二区三区在线臀色熟女 | 纯流量卡能插随身wifi吗| 男女无遮挡免费网站观看| 亚洲av日韩精品久久久久久密| 超色免费av| 免费久久久久久久精品成人欧美视频| 免费在线观看视频国产中文字幕亚洲 | 精品亚洲成a人片在线观看| 十八禁网站网址无遮挡| 欧美成狂野欧美在线观看| 黑人猛操日本美女一级片| 国产精品久久久久久精品电影小说| 精品亚洲成国产av| 日本a在线网址| 色婷婷av一区二区三区视频| 欧美日韩国产mv在线观看视频| 91字幕亚洲| 一二三四社区在线视频社区8| 久久久久国内视频| 91老司机精品| 12—13女人毛片做爰片一| 国产欧美日韩一区二区三 | 久久99热这里只频精品6学生| 97精品久久久久久久久久精品| 午夜影院在线不卡| 国产伦人伦偷精品视频| 久久久国产一区二区| 高清欧美精品videossex| 亚洲精品一区蜜桃| 狠狠婷婷综合久久久久久88av| 日本撒尿小便嘘嘘汇集6| 真人做人爱边吃奶动态| videos熟女内射| 91成年电影在线观看| 黄色片一级片一级黄色片| 欧美久久黑人一区二区| 久久久久久人人人人人| 90打野战视频偷拍视频| 在线av久久热| 午夜激情av网站| 美女中出高潮动态图| 91av网站免费观看| 2018国产大陆天天弄谢| 麻豆乱淫一区二区| 成年动漫av网址| av网站免费在线观看视频| 91麻豆av在线| 麻豆乱淫一区二区| 老汉色av国产亚洲站长工具| 日本wwww免费看| 国精品久久久久久国模美| 亚洲国产欧美日韩在线播放| 91成年电影在线观看| 国产精品秋霞免费鲁丝片| 少妇猛男粗大的猛烈进出视频| 国产无遮挡羞羞视频在线观看| 国产一卡二卡三卡精品| 美女主播在线视频| 精品卡一卡二卡四卡免费| 日韩制服丝袜自拍偷拍| 免费观看av网站的网址| 欧美另类亚洲清纯唯美| 亚洲中文字幕日韩| 纯流量卡能插随身wifi吗| 亚洲精品一二三| 亚洲一区二区三区欧美精品| 91老司机精品| 嫩草影视91久久| 免费高清在线观看日韩| 成人三级做爰电影| 另类精品久久| 免费高清在线观看日韩| 国产成人啪精品午夜网站| 日韩 亚洲 欧美在线| 热99久久久久精品小说推荐| 操出白浆在线播放| 免费在线观看视频国产中文字幕亚洲 | 亚洲精品久久久久久婷婷小说| av天堂久久9| 久久久久久免费高清国产稀缺| 国产一区二区三区综合在线观看| av片东京热男人的天堂| 黄色视频在线播放观看不卡| 91精品三级在线观看| 男人操女人黄网站| 咕卡用的链子| 久久精品国产亚洲av香蕉五月 | 日韩欧美免费精品| 丰满人妻熟妇乱又伦精品不卡| 久久人人爽人人片av| 国产伦理片在线播放av一区| 午夜老司机福利片| 一边摸一边抽搐一进一出视频| 一区二区日韩欧美中文字幕| 亚洲精品自拍成人| 精品国产乱子伦一区二区三区 | 亚洲伊人久久精品综合| 国产精品99久久99久久久不卡| 18禁国产床啪视频网站| 亚洲伊人久久精品综合| 97精品久久久久久久久久精品| kizo精华| 人人妻人人澡人人看| 亚洲av成人一区二区三| 精品人妻在线不人妻| 又大又爽又粗| 国产成人精品久久二区二区免费| 巨乳人妻的诱惑在线观看| 亚洲av电影在线进入| 99久久精品国产亚洲精品| 老司机深夜福利视频在线观看 | 国产成人av激情在线播放| 久久久久久久大尺度免费视频| 亚洲性夜色夜夜综合| 精品久久蜜臀av无| 动漫黄色视频在线观看| 香蕉丝袜av| 亚洲国产中文字幕在线视频| 老司机靠b影院| 日韩三级视频一区二区三区| av又黄又爽大尺度在线免费看| 国产精品久久久久久精品电影小说| 国产不卡av网站在线观看| 免费观看a级毛片全部| 亚洲 欧美一区二区三区| 男人舔女人的私密视频| 精品福利永久在线观看| 久久国产精品人妻蜜桃| 丁香六月天网| 大香蕉久久成人网| 国产在视频线精品| 在线精品无人区一区二区三| 777米奇影视久久| 老司机在亚洲福利影院| 99国产精品免费福利视频| 精品国产一区二区久久| 久久久久国产精品人妻一区二区| 国产一区二区激情短视频 | 极品少妇高潮喷水抽搐| 91国产中文字幕| 久久精品国产综合久久久| 欧美97在线视频| 一级,二级,三级黄色视频| 中文字幕最新亚洲高清| 国产日韩欧美亚洲二区| 黄片大片在线免费观看| 中文字幕精品免费在线观看视频| 国产一卡二卡三卡精品| 菩萨蛮人人尽说江南好唐韦庄| 久久久久网色| 亚洲中文av在线| 777米奇影视久久| 婷婷色av中文字幕| 69av精品久久久久久 | 国产精品1区2区在线观看. | 久久精品国产a三级三级三级| 交换朋友夫妻互换小说| 欧美日韩国产mv在线观看视频| 午夜福利一区二区在线看| 69精品国产乱码久久久| 夜夜骑夜夜射夜夜干| 欧美午夜高清在线| 一本—道久久a久久精品蜜桃钙片| 99热全是精品| 亚洲人成77777在线视频| 美女扒开内裤让男人捅视频| 亚洲少妇的诱惑av| 欧美成狂野欧美在线观看| 夜夜骑夜夜射夜夜干| 精品乱码久久久久久99久播| 美女扒开内裤让男人捅视频| 新久久久久国产一级毛片| 这个男人来自地球电影免费观看| 欧美人与性动交α欧美软件| 国产欧美日韩精品亚洲av| 各种免费的搞黄视频| 在线观看www视频免费| 成在线人永久免费视频| 天堂8中文在线网| 涩涩av久久男人的天堂| 一区在线观看完整版| 国产老妇伦熟女老妇高清| 亚洲精品美女久久av网站| 成年女人毛片免费观看观看9 | 亚洲av电影在线观看一区二区三区| 欧美+亚洲+日韩+国产| 母亲3免费完整高清在线观看| 一级毛片精品| 蜜桃在线观看..| 99热网站在线观看| 亚洲精品国产av蜜桃| 美女大奶头黄色视频| 国产成人免费无遮挡视频| avwww免费| 国产国语露脸激情在线看| 色老头精品视频在线观看| 欧美日本中文国产一区发布| 美女扒开内裤让男人捅视频| 一个人免费看片子| 18禁黄网站禁片午夜丰满| 一二三四在线观看免费中文在| 色94色欧美一区二区| 亚洲精品国产色婷婷电影| 十八禁高潮呻吟视频| 欧美日韩成人在线一区二区| 黄色视频在线播放观看不卡| 香蕉丝袜av| 多毛熟女@视频| av在线app专区| 欧美亚洲 丝袜 人妻 在线| 女人爽到高潮嗷嗷叫在线视频| 欧美老熟妇乱子伦牲交| 91麻豆av在线| 在线观看人妻少妇| 在线观看免费午夜福利视频| 国产无遮挡羞羞视频在线观看| 国产福利在线免费观看视频| 无限看片的www在线观看| 国产在线视频一区二区| 精品第一国产精品| 在线观看免费视频网站a站| 日韩制服骚丝袜av| 悠悠久久av| 亚洲黑人精品在线| 亚洲中文日韩欧美视频| 久久中文看片网| 自拍欧美九色日韩亚洲蝌蚪91| 91字幕亚洲| 桃红色精品国产亚洲av| 欧美日韩精品网址| 久久99一区二区三区| 中文字幕高清在线视频| 19禁男女啪啪无遮挡网站| 伦理电影免费视频| 一区二区日韩欧美中文字幕| 色综合欧美亚洲国产小说| 欧美+亚洲+日韩+国产| 大香蕉久久成人网| 国产视频一区二区在线看| 91av网站免费观看| 欧美乱码精品一区二区三区| 亚洲av日韩精品久久久久久密| 成人18禁高潮啪啪吃奶动态图| 少妇精品久久久久久久| 免费不卡黄色视频| 成年av动漫网址| 久久性视频一级片| 亚洲中文字幕日韩| 久久久久国内视频| 97精品久久久久久久久久精品| 国产伦人伦偷精品视频| 国产亚洲精品一区二区www | 欧美激情 高清一区二区三区| 亚洲综合色网址| 精品人妻一区二区三区麻豆| 精品久久久久久电影网| 天天躁夜夜躁狠狠躁躁| 国产欧美日韩综合在线一区二区| 久久久久久久大尺度免费视频| 亚洲精品久久久久久婷婷小说| a级毛片黄视频| 成在线人永久免费视频| 黑人操中国人逼视频| 国产三级黄色录像| 国产成人免费无遮挡视频| 一本一本久久a久久精品综合妖精| 欧美另类亚洲清纯唯美| 国产精品香港三级国产av潘金莲| 久久久国产一区二区| 久久久国产欧美日韩av| 99久久精品国产亚洲精品| 久久久久久久国产电影| 99热国产这里只有精品6| 啦啦啦啦在线视频资源| 这个男人来自地球电影免费观看| 亚洲精品成人av观看孕妇| 亚洲av日韩在线播放| 人妻人人澡人人爽人人| 大陆偷拍与自拍| 美女福利国产在线| av有码第一页| 国产av国产精品国产| 人人妻人人爽人人添夜夜欢视频| 欧美久久黑人一区二区| 欧美午夜高清在线| 欧美精品av麻豆av| 久久亚洲国产成人精品v| 欧美中文综合在线视频| 青春草视频在线免费观看| 可以免费在线观看a视频的电影网站| 十八禁高潮呻吟视频| 18禁黄网站禁片午夜丰满| 丝袜在线中文字幕| 在线观看免费午夜福利视频| 亚洲全国av大片| 别揉我奶头~嗯~啊~动态视频 | 亚洲免费av在线视频| 成年av动漫网址| 精品熟女少妇八av免费久了| 亚洲精品国产av蜜桃| 欧美人与性动交α欧美精品济南到| 激情视频va一区二区三区| 一级,二级,三级黄色视频| 国产精品久久久久久精品电影小说| 天堂中文最新版在线下载| 欧美乱码精品一区二区三区| 精品国产乱码久久久久久男人| 丝袜美足系列| 亚洲九九香蕉| 久久精品亚洲熟妇少妇任你| 99国产综合亚洲精品| 99久久99久久久精品蜜桃| 大香蕉久久网| 美女福利国产在线| 久久女婷五月综合色啪小说| 真人做人爱边吃奶动态| 日韩视频一区二区在线观看| 国产在视频线精品| 国产伦人伦偷精品视频| 啦啦啦视频在线资源免费观看| 亚洲成av片中文字幕在线观看| 丰满人妻熟妇乱又伦精品不卡| 欧美黑人精品巨大| 国产精品一区二区在线不卡| 黄片小视频在线播放| 亚洲国产精品一区三区| 人人妻人人爽人人添夜夜欢视频| 啦啦啦中文免费视频观看日本| 一二三四社区在线视频社区8| 黄色a级毛片大全视频| 99精品欧美一区二区三区四区| 天堂8中文在线网| www.999成人在线观看| 9色porny在线观看| www.av在线官网国产| 中文字幕av电影在线播放| 国产欧美日韩精品亚洲av| 精品国内亚洲2022精品成人 | 成人av一区二区三区在线看 | 国产野战对白在线观看| 精品欧美一区二区三区在线| 久久精品国产亚洲av香蕉五月 | 亚洲第一欧美日韩一区二区三区 | 国产一卡二卡三卡精品| 色视频在线一区二区三区| 久久久久精品人妻al黑| 黄色毛片三级朝国网站| 亚洲性夜色夜夜综合| 美国免费a级毛片| 国内毛片毛片毛片毛片毛片| 久久精品亚洲熟妇少妇任你| 一级片免费观看大全| 亚洲精品第二区| 亚洲五月婷婷丁香| 纯流量卡能插随身wifi吗| 国产国语露脸激情在线看| 99久久人妻综合| 国产成人免费观看mmmm| 美女中出高潮动态图| 国产亚洲午夜精品一区二区久久| 国产精品久久久人人做人人爽| √禁漫天堂资源中文www| 人妻 亚洲 视频| 中文精品一卡2卡3卡4更新| 欧美在线黄色| 免费av中文字幕在线| 久久精品国产亚洲av香蕉五月 | 夜夜夜夜夜久久久久| 久久久国产欧美日韩av| www.精华液| 久久毛片免费看一区二区三区| 国产成人啪精品午夜网站| 另类亚洲欧美激情| 一级毛片女人18水好多| 黑丝袜美女国产一区| 天天躁日日躁夜夜躁夜夜| 国内毛片毛片毛片毛片毛片| 国产老妇伦熟女老妇高清| 最近最新免费中文字幕在线| 国产无遮挡羞羞视频在线观看| 最黄视频免费看| 亚洲伊人色综图| 国产成人免费观看mmmm| avwww免费| 搡老乐熟女国产| 91精品三级在线观看| 91精品国产国语对白视频| 亚洲av电影在线进入| 老司机深夜福利视频在线观看 | 成人av一区二区三区在线看 | 国产精品久久久av美女十八| 亚洲国产欧美在线一区| 久久天堂一区二区三区四区| 国精品久久久久久国模美| 免费高清在线观看日韩| a级毛片黄视频| 亚洲精品日韩在线中文字幕| 亚洲国产欧美日韩在线播放| 99热网站在线观看| 久久亚洲精品不卡| 黄片播放在线免费| 女人久久www免费人成看片| 丰满少妇做爰视频| 精品福利永久在线观看| 99九九在线精品视频| 国产精品二区激情视频| 99久久99久久久精品蜜桃| 久久女婷五月综合色啪小说| 不卡av一区二区三区| 久久天躁狠狠躁夜夜2o2o| 性色av一级| 亚洲欧美成人综合另类久久久| 国产日韩欧美亚洲二区| svipshipincom国产片| 国产伦理片在线播放av一区| 黄色毛片三级朝国网站| 黄色视频不卡| 丰满迷人的少妇在线观看| 久久久水蜜桃国产精品网| 王馨瑶露胸无遮挡在线观看| 国产免费福利视频在线观看| 精品少妇一区二区三区视频日本电影| 在线观看免费午夜福利视频| 午夜福利视频在线观看免费| 91麻豆av在线| 深夜精品福利| 王馨瑶露胸无遮挡在线观看| 伊人亚洲综合成人网| 亚洲熟女毛片儿| 亚洲一卡2卡3卡4卡5卡精品中文| 99国产极品粉嫩在线观看| 午夜激情久久久久久久| 欧美激情 高清一区二区三区| 久久国产亚洲av麻豆专区| 天堂中文最新版在线下载| 久久久久国产精品人妻一区二区| 操出白浆在线播放| 精品一区二区三卡| 午夜免费鲁丝| 丝袜美腿诱惑在线| 一级黄色大片毛片| 别揉我奶头~嗯~啊~动态视频 | 国产精品 欧美亚洲| 亚洲av美国av| 一区二区三区乱码不卡18| 久久免费观看电影| 天天躁夜夜躁狠狠躁躁| 熟女少妇亚洲综合色aaa.| 国产伦理片在线播放av一区| 亚洲中文日韩欧美视频| av网站免费在线观看视频| 老汉色∧v一级毛片| 最黄视频免费看| 亚洲欧美色中文字幕在线| 制服人妻中文乱码| 视频区欧美日本亚洲| a级毛片黄视频| 制服诱惑二区| 免费黄频网站在线观看国产| 国产日韩一区二区三区精品不卡| 久久国产精品大桥未久av| 国产精品99久久99久久久不卡| 美女主播在线视频| 精品一区二区三卡| 亚洲精品久久午夜乱码| 国产免费福利视频在线观看| 国产无遮挡羞羞视频在线观看| 国产成人免费观看mmmm| 国产一卡二卡三卡精品| 欧美日韩国产mv在线观看视频| 中亚洲国语对白在线视频| 12—13女人毛片做爰片一| 大码成人一级视频| 在线精品无人区一区二区三| 欧美人与性动交α欧美软件| 中文欧美无线码| 午夜福利视频在线观看免费| 国产精品一区二区免费欧美 | 亚洲欧美精品综合一区二区三区| 国产极品粉嫩免费观看在线| 一区福利在线观看| av在线播放精品| 亚洲一码二码三码区别大吗| 少妇粗大呻吟视频| 久久久久国产一级毛片高清牌| 男女床上黄色一级片免费看| 超碰成人久久| 一区在线观看完整版| 亚洲第一av免费看| 亚洲精品久久午夜乱码| 国产福利在线免费观看视频| 久久久久久人人人人人| 日本猛色少妇xxxxx猛交久久| 欧美黑人欧美精品刺激| 丰满少妇做爰视频| 一区二区三区精品91| 精品亚洲成国产av| 91老司机精品| 精品免费久久久久久久清纯 | av免费在线观看网站| 操出白浆在线播放| 国产av一区二区精品久久| 免费在线观看日本一区| 国产成人精品无人区| 蜜桃国产av成人99| 日韩一卡2卡3卡4卡2021年| 午夜免费观看性视频| 精品高清国产在线一区| 久久精品成人免费网站| 涩涩av久久男人的天堂| 久久人人爽av亚洲精品天堂| 免费观看人在逋| 久久久精品区二区三区| 十分钟在线观看高清视频www| 午夜福利,免费看| 欧美 亚洲 国产 日韩一| 日本av免费视频播放| 少妇精品久久久久久久| 免费在线观看日本一区| 啪啪无遮挡十八禁网站| 18禁观看日本| 老司机福利观看| 99国产精品免费福利视频| av不卡在线播放| tocl精华| 国产精品香港三级国产av潘金莲| 日日摸夜夜添夜夜添小说| 人成视频在线观看免费观看| 黄色 视频免费看| 亚洲综合色网址| 亚洲国产日韩一区二区| 女人爽到高潮嗷嗷叫在线视频| 国产成人精品久久二区二区91| 亚洲精品第二区| bbb黄色大片| 精品人妻在线不人妻| 啦啦啦中文免费视频观看日本| 最近中文字幕2019免费版| 亚洲一区中文字幕在线| 免费在线观看黄色视频的| 国产主播在线观看一区二区| 精品少妇内射三级| 欧美亚洲 丝袜 人妻 在线| 国产在线观看jvid| 国产成人免费无遮挡视频| 久久精品成人免费网站| 少妇精品久久久久久久| 日日摸夜夜添夜夜添小说| 1024视频免费在线观看| 国产日韩欧美亚洲二区| xxxhd国产人妻xxx| 亚洲国产欧美一区二区综合| videos熟女内射| 看免费av毛片| 麻豆av在线久日| av在线老鸭窝| av国产精品久久久久影院| cao死你这个sao货| 亚洲精品一区蜜桃| 午夜免费鲁丝| 久久免费观看电影| tube8黄色片| 真人做人爱边吃奶动态| 免费人妻精品一区二区三区视频| 国产xxxxx性猛交| 亚洲av片天天在线观看| 国产一区二区三区av在线| 午夜免费观看性视频| 美国免费a级毛片| 欧美日韩福利视频一区二区| 国产91精品成人一区二区三区 | 美女午夜性视频免费|