• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種面向中文拼寫糾錯的自監(jiān)督預(yù)訓(xùn)練方法

    2023-11-24 01:40:12蘇錦鈿余珊珊洪曉斌
    關(guān)鍵詞:拼寫錯誤掩碼字形

    蘇錦鈿 余珊珊 洪曉斌

    (1.華南理工大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,廣東 廣州 510006;2.廣東藥科大學(xué) 醫(yī)藥信息工程學(xué)院,廣東 廣州 510006;3.華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州 510640)

    中文拼寫糾錯(CSC)也稱中文拼寫檢測,是自然語言處理(NLP)及中文文本分析中的一個重要子任務(wù)和研究方向,其主要目的是利用計算機(jī)技術(shù)識別中文文本中包含的拼寫錯誤并進(jìn)行糾正[1-3]。早期的研究主要以基于規(guī)則、N-元語法、統(tǒng)計機(jī)器翻譯和神經(jīng)網(wǎng)絡(luò)的方法為主,如NMT[4]和CPN[2]等。近幾年,隨著Transformer 結(jié)構(gòu)[5]及以BERT[6]為代表的預(yù)訓(xùn)練語言模型在多個NLP任務(wù)中取得了突出的效果,一些學(xué)者陸續(xù)將預(yù)訓(xùn)練語言模型引入到CSC任務(wù)中,并提出一系列新的拼寫糾錯模型,如FASPell[1]、SM-BERT[3]、SpellGCN[7]、DCN[8]、DCSpell[9]、PLOME[10]、PHMOSpell[11]、ReaLiSe[12]等。

    相對于早期其他的CSC 工作,BERT 和RoBERTa[13]等預(yù)訓(xùn)練語言模型可以通過海量文本預(yù)訓(xùn)練和下游任務(wù)微調(diào)的方式更好地學(xué)習(xí)字詞及句子的語義和上下文信息,從而進(jìn)一步提升模型在CSC任務(wù)中的效果。但BERT 等在預(yù)訓(xùn)練過程中主要利用掩碼語言模型(MLM)隨機(jī)屏蔽句子中的字,然后結(jié)合上下文預(yù)測其正確值。這一方面假定文本序列中各個字相互獨(dú)立,即忽略詞組中各個字之間的依賴關(guān)系;另一方面影響了模型對拼寫錯誤的識別和糾正能力,且沒有考慮錯誤字詞在發(fā)音和字形上的相似性,從而導(dǎo)致預(yù)訓(xùn)練和微調(diào)目標(biāo)不一致。針對BERT 的字獨(dú)立性假設(shè)及預(yù)訓(xùn)練與微調(diào)階段不一致問題,文獻(xiàn)[14]在英文BERT 的全詞掩碼(WWM)模型基礎(chǔ)上,結(jié)合中文的特點(diǎn)提出一個基于全詞和連續(xù)詞組掩蔽策略的MacBERT 模型。但MacBERT在CSC任務(wù)中同樣面臨預(yù)訓(xùn)練與微調(diào)目標(biāo)不一致問題,特別是CSC中的大部分錯誤主要是因?yàn)榘l(fā)音或字形相近引起的,而不是同義詞誤用,并且很少出現(xiàn)連續(xù)多個詞拼寫錯誤的情況。

    本文針對BERT 的中文拼寫錯誤識別及糾正能力不足問題,提出一種面向中文拼寫糾錯的自監(jiān)督預(yù)訓(xùn)練方法MASC,將BERT中的MLM和MacBERT中的Mac任務(wù)轉(zhuǎn)換成基于混淆集的拼寫錯誤識別及糾正任務(wù);在全詞掩碼的基礎(chǔ)上利用混淆集從音調(diào)相同、音調(diào)相近和字形相近等多個方面構(gòu)造拼寫錯誤候選字,給出相應(yīng)的掩碼策略、替換策略和預(yù)訓(xùn)練任務(wù),從而進(jìn)一步增強(qiáng)BERT 的拼寫錯誤識別及糾正能力;還通過sighan13、sighan14 和sighan15等公開CSC 語料集上的實(shí)驗(yàn)證明MASC 能夠在不改變BERT/RoBERTa/MacBERT 等模型現(xiàn)有結(jié)構(gòu)的前提下,進(jìn)一步提升它們在下游CSC任務(wù)中的效果。

    1 相關(guān)工作

    與英文拼寫糾錯相比,中文拼寫糾錯面臨更多的困難和挑戰(zhàn),特別是中文字詞之間沒有定界符、缺乏形態(tài)上的變化和嚴(yán)重依賴于上下文語義等特點(diǎn),使得對中文拼寫錯誤字符的識別及糾正高度依賴上下文語境。近幾年,隨著各種預(yù)訓(xùn)練語言模型在許多NLP任務(wù)上取得一系列突出的成果,部分學(xué)者開始將它們引入到CSC中。文獻(xiàn)[1]提出一種基于去噪自動編碼器(DAE)和解碼器的中文拼寫檢查器——FASPell,其中DAE 采用BERT 中的掩碼語言模型,而解碼器采用把握度-字符相似度解碼器;文獻(xiàn)[2]提出一個雙向GRU 和BERT 的SM-BERT 模型,其主要思路是通過一個基于雙向GRU 的錯誤檢測網(wǎng)絡(luò)識別句子中可能出錯的字的位置,并利用這些位置信息對糾錯網(wǎng)絡(luò)中的輸入句子進(jìn)行軟掩碼,從而讓模型學(xué)習(xí)只針對可能出錯的字進(jìn)行糾正,而非句子中所有的字;文獻(xiàn)[8]提出一種基于動態(tài)連接網(wǎng)絡(luò)的DCN 模型,其主要思路是在RoBERTa[13]的基礎(chǔ)上利用拼音增強(qiáng)候選生成器生成候選的中文字,并通過注意力網(wǎng)絡(luò)對相鄰中文字間的依賴關(guān)系進(jìn)行建模;文獻(xiàn)[7]提出一種拼寫檢查卷積圖網(wǎng)絡(luò)Spell-GCN,通過結(jié)合BERT 和卷積圖網(wǎng)絡(luò)刻畫字符的發(fā)音/形狀相似性知識以及字之間的先驗(yàn)依賴關(guān)系,并生成正確的拼寫校正;文獻(xiàn)[15]在Transformer注意力機(jī)制的基礎(chǔ)上添加高斯分布的偏置矩陣,用于提高模型對局部文本的關(guān)注程度,同時使用ON_STM 模型對錯誤文本表現(xiàn)出的特殊語法結(jié)構(gòu)特征進(jìn)行語法信息提取;文獻(xiàn)[16]則提出一種融合漢字多特征嵌入的端到端中文拼寫檢查算法模型BFMBERT,主要利用結(jié)合混淆集的預(yù)訓(xùn)練任務(wù)讓BERT 學(xué)習(xí)中文拼寫錯誤知識。總的來說,這些工作均證明了BERT和RoBERTa等預(yù)訓(xùn)練語言模型能夠進(jìn)一步改善字詞及句子的語義表征,從而提升模型在下游CSC 任務(wù)中的效果。但由于BERT 和RoBERTa等模型在預(yù)訓(xùn)練過程中是通過上下文信息學(xué)習(xí)字詞的語義,而CSC任務(wù)中拼寫錯誤的字詞通常是離散出現(xiàn)的,因此導(dǎo)致預(yù)訓(xùn)練語言模型一方面在拼寫錯誤識別方面存在一定的不足,另一方面在糾正時往往需通過額外的神經(jīng)網(wǎng)絡(luò)層引入錯誤字詞和正確字詞在音調(diào)或字形等方面的相似性知識。

    文獻(xiàn)[14]在英文BERT 的全詞掩碼WWM 基礎(chǔ)上,結(jié)合中文的特點(diǎn)提出一個基于全詞和詞組掩蔽策略的模型MacBERT。MacBERT 將BERT 中的MLM 任務(wù)轉(zhuǎn)換為面向同義詞替換的文本校正任務(wù),即讓模型學(xué)習(xí)如何將替換后的同義詞識別為原來的字詞,目的是縮小預(yù)訓(xùn)練和微調(diào)階段之間的差距。但MacBERT 在CSC 中同樣面臨預(yù)訓(xùn)練與微調(diào)不一致的問題。一方面,CSC中的大部分拼寫錯誤并不是由同義詞誤用引起的,而是由音調(diào)相同、音調(diào)相近或字形相似等因素導(dǎo)致的;另一方面,CSC中一般以單個的字或單詞拼寫錯誤為主,很少出現(xiàn)連續(xù)多個詞組的拼寫錯誤。

    文獻(xiàn)[17]指出約83%的中文拼寫錯誤與音調(diào)相似性相關(guān),48%與字形相似性相關(guān)。表1 給出了CSC中一些常見的拼寫錯誤及原因,其中粗斜體部分表示錯誤的字詞,括號中的粗體為正確字詞,方括號中為錯誤字詞與正確字詞的拼音。

    表1 常見中文拼寫錯誤例子Table 1 Examples of common CSC errors

    CSC中大部分的拼寫錯誤主要是因?yàn)橐粽{(diào)相同、音調(diào)相近或字形相近等引起的,但BERT/RoBERTa/MacBERT等預(yù)訓(xùn)練語言模型在預(yù)訓(xùn)練過程中均沒有考慮這些相似性知識。文獻(xiàn)[18]嘗試在預(yù)訓(xùn)練階段引入拼音相似性知識,并提出了混淆漢字和噪聲拼音的替換策略;文獻(xiàn)[19]也在BERT的基礎(chǔ)上提出一個預(yù)訓(xùn)練模型SpellBERT,并利用圖神經(jīng)網(wǎng)絡(luò)將字的偏旁部首和拼音信息引入到預(yù)訓(xùn)練任務(wù)中。但這些工作均沒有進(jìn)一步探討如何利用現(xiàn)有的混淆集更好地融合發(fā)音和字形等相似性知識。文獻(xiàn)[10]提出的PLOME在訓(xùn)練預(yù)訓(xùn)練語言模型時引入基于語義混淆集的MASK 策略,并將拼音和筆畫作為預(yù)訓(xùn)練語言模型以及模型微調(diào)的輸入,但需依賴于額外的筆畫知識;文獻(xiàn)[11]則結(jié)合光學(xué)字形識別(OCR)及自動語音識別(ASR),從多模態(tài)的角度對拼音特征、字形特征、語音特征進(jìn)行信息融合和錯誤字預(yù)測;文獻(xiàn)[12]同樣也利用了中文字符上的語義、聲音和字形等多模態(tài)信息。但這些工作均需要在下游任務(wù)中對不同模態(tài)信息進(jìn)行融合。因此本文的主要目的是在上述工作的基礎(chǔ)上,通過預(yù)訓(xùn)練任務(wù)和混淆集將中文拼寫糾錯中錯誤字詞與正確字詞間的音調(diào)及字形相似性知識引入到預(yù)訓(xùn)練語言模型中,從而提升模型在下游CSC任務(wù)中的拼寫錯誤識別及糾正能力。

    2 面向中文拼寫糾錯的自監(jiān)督預(yù)訓(xùn)練MASC

    下面提出一種中文拼寫糾錯掩碼語言模型的自監(jiān)督預(yù)訓(xùn)練方法MASC。

    2.1 MASC預(yù)訓(xùn)練

    BERT中的MLM在預(yù)訓(xùn)練過程中對每一個句子隨機(jī)選擇其中15%的字,然后用[MASK]標(biāo)記進(jìn)行掩碼后,通過預(yù)訓(xùn)練讓模型學(xué)習(xí)如何根據(jù)上下文信息預(yù)測被掩碼字的真實(shí)值。每一個字被選中并進(jìn)行掩碼的概率為15%,被選中的字當(dāng)中有80%的概率被[MASK]標(biāo)記替換、10%的概率保持不變、10%的概率隨機(jī)用詞匯表中的字進(jìn)行替換。

    MASC采用類似于MLM的選擇策略,但是對每一個被選中進(jìn)行掩碼的字,利用混淆集得到相應(yīng)的候選字后進(jìn)行替換,最后通過訓(xùn)練讓模型學(xué)習(xí)根據(jù)上下文信息預(yù)測被替換字的真實(shí)值以及是否存在拼寫出錯。具體來說,MASC的流程如圖1所示。

    圖1 MASC的流程Fig.1 Process of MASC

    具體來說,MASC主要采用以下策略。

    (1)基于全詞掩碼和N-grams語法的掩碼策略

    MASC 在BERT 的全詞掩碼WWM 基礎(chǔ)上,結(jié)合MacBERT的N-grams掩碼策略,采用一元和二元詞的字掩碼方式。由于一般文本中的大部分錯誤為單字或某個單詞,很少連續(xù)多個單詞出現(xiàn)錯誤,因此MASC 中只考慮一元詞(字)和二元詞(連續(xù)兩個字或完整的單詞)的掩碼策略。具體來說,選擇輸入句子中15%的字進(jìn)行替換,被選中的字有90%的概率為一元詞組、10%的概率為二元詞。若被選中的字為某個詞組的字,則有15%的概率同時選擇該詞組中的其他字。掩碼選擇算法selectMasked-Char的核心偽代碼表示如下:

    (2)基于混淆集的替換策略

    MASC在文獻(xiàn)[2]中的混淆集基礎(chǔ)上結(jié)合PinYin工具進(jìn)行擴(kuò)充,并劃分為同音同調(diào)、同音異調(diào)、近音同調(diào)、近音異調(diào)和字形相近5種不同類型。

    對于每一個待掩碼的字或詞,采用以下替換策略:40%的概率采用同音同調(diào)字典,15%的概率采用同音異調(diào)字典,15%的概率采用近音同調(diào)字典,10%的概率采用近音異調(diào)字典,10%的概率采用字形相近字典,10%的概率保持不變。表2給出了不同掩碼方法的示例,其中每一個“+”表示在前一個“+”基礎(chǔ)上繼續(xù)增加新的掩碼方法,例如“++WWM”表示在上一行“+MLM”的基礎(chǔ)上增加WWM。

    替換策略算法charMaskWithConfuseSet 的部分核心偽代碼表示如下:

    2.2 基于MASC的預(yù)訓(xùn)練模型

    為了最大程度地利用BERT/RoBERTa/MacBERT 等預(yù)訓(xùn)練模型中已學(xué)習(xí)到的大量知識,MASC 采用原有的預(yù)訓(xùn)練模型結(jié)構(gòu),如圖2 所示。其中,ai(1≤i≤n)和bj(1≤j≤m)分別表示輸入長度為n和m的句子A和B中的各個字符。

    圖2 基于MASC的預(yù)訓(xùn)練模型結(jié)構(gòu)Fig.2 Pre-training model structure of MASC

    為了區(qū)別一般的BERT/RoBERTa/MacBERT,將基于MASC 的BERT/RoBERTa/MacBERT 的模型分別記為MascBERT/MascRoBERTa/MascMacBERT。

    以MascBERT 為例,預(yù)訓(xùn)練任務(wù)可形式化地定義為:給定任意一對中文文本序列A={a1,a2,…,an}和B={b1,b2,…,bm},根據(jù)BERT 的輸入要求將A和B進(jìn)行串聯(lián)并構(gòu)造成輸入序列X={x0,x1,…,xt},其中t=n+m+2:

    MascBERT 通過詞向量嵌入層Embedding 和多層連續(xù)Transformer隱層將輸入X轉(zhuǎn)換為上下文表示H(L)∈RN×d,其中L為隱層數(shù)量,N為輸入的字符最大長度(通常最大為512),d為隱層的詞向量維度(通常為768或1 024):

    在H(L)的基礎(chǔ)上,MascBERT 的主要目標(biāo)是預(yù)測替換后的文本序列中拼寫錯誤字的正確值以及是否存在拼寫錯誤。對于替換后的錯誤字的隱層向量用子集Hm∈Rk×d表示,其中k為被替換字的總數(shù)。默認(rèn)情況下與BERT 一樣采用輸入序列長度的15%作為k的值,即k=int(t×15%)。

    對于訓(xùn)練集中的第i個句子,利用待訓(xùn)練參數(shù)矩陣W1∈R|V|×d和偏置向量b1∈ RM將Hm投影到詞匯表V上并預(yù)測相應(yīng)的概率分布pi:

    利用標(biāo)準(zhǔn)交叉熵函數(shù)Losscor計算相應(yīng)的糾正損失值:

    式中,M為每一批數(shù)據(jù)的數(shù)量,yij為M中第i個句子的第j個字的正確值;pij為M中第i個句子的第j個被替換字在詞匯表V中的概率分布。

    為了進(jìn)一步提高模型對拼寫錯誤的識別能力,MascBERT 同時還對句子中各個位置上是否存在拼寫錯誤進(jìn)行判斷。利用待訓(xùn)練參數(shù)矩陣W2∈R1×d和偏置向量b2∈RM對H(L)進(jìn)行轉(zhuǎn)換,并利用sigmoid 函數(shù)計算相應(yīng)的錯誤概率值qi:

    qi中每一個位置的值越接近1,則表示該位置出現(xiàn)拼寫錯誤的概率越大。利用二元交叉熵函數(shù)Lossdet計算相應(yīng)的錯誤識別損失值,其中l(wèi)ij(1≤j≤t)為第i個句子中第j個位置是否出現(xiàn)拼寫錯誤的正確值,“1”表示存在拼寫錯誤,“0”表示不存在拼寫錯誤:

    BERT的預(yù)訓(xùn)練任務(wù)除MLM外,還包括句子相鄰關(guān)系預(yù)測任務(wù)NSP。ALBERT[20]和MacBERT[14]針對NSP的效果不佳問題,進(jìn)一步提出句子順序關(guān)系預(yù)測SOP。對于MASC,可根據(jù)需要結(jié)合NSP 或SOP等其他預(yù)訓(xùn)練任務(wù),相應(yīng)的損失函數(shù)分別為

    式中,LossNSP、LossSOP分別為針對NSP和SOP任務(wù)的損失函數(shù)。

    3 實(shí)驗(yàn)與分析

    3.1 實(shí)驗(yàn)準(zhǔn)備

    為了利用MASC 進(jìn)行預(yù)訓(xùn)練,實(shí)驗(yàn)從文獻(xiàn)[21]的生成語料集ACG中隨機(jī)選擇3萬個目標(biāo)正確句子作為預(yù)訓(xùn)練語料集,記為ACG3W;同時,還采用漢語水平考試(HSK)語料集中的部分句子作為預(yù)訓(xùn)練數(shù)據(jù)。HSK 語料集共包含156 820 個句子,最大長度為417 個字,平均長度為27.35 個字??紤]到訓(xùn)練效率和句子表達(dá)完整性等因素,只從HSK語料集中選擇3萬個句子作為預(yù)訓(xùn)練數(shù)據(jù),每條數(shù)據(jù)的長度在12到120個字之間,并以句號、問號和感嘆號等結(jié)尾,記為HSK3W。

    因?qū)嶒?yàn)條件和篇幅限制,實(shí)驗(yàn)中只選擇3個最常用的BERT 中文預(yù)訓(xùn)練語言模型作為基礎(chǔ)模型進(jìn)行新的MASC 預(yù)訓(xùn)練,包括:bert-base-chinese、chinese-bert-wwm和chinese-macbert-base,分別簡單記為base、wwm 和macbert。3 個模型均包含12 個隱層、12個多頭自注意力,輸出張量為768維,參數(shù)量約為1.1 億,詞匯量約為2.1 萬。第1 個模型的原始預(yù)訓(xùn)練采用MLM和NSP,第2個模型采用全詞掩碼的MLM和NSP,第3個模型采用N-grams(包括一元、二元和三元詞組),并利用近義詞代替[MASK]進(jìn)行預(yù)測。

    預(yù)訓(xùn)練過程采用批量訓(xùn)練的方式,每一批數(shù)據(jù)的數(shù)量為32,學(xué)習(xí)率為5×10-5,共訓(xùn)練5 輪,并采用Adam優(yōu)化器。由于原始HSK和ACG中的數(shù)據(jù)大部分為單個句子,因此預(yù)訓(xùn)練過程中只考慮MASC及相應(yīng)的Lossdet和Losscor,而忽略NSP或SOP任務(wù)。

    為驗(yàn)證MASC 的有效性,實(shí)驗(yàn)用3 個經(jīng)典的公開CSC語料集sighan13[22]、sighan14[23]和sighan15[24],并參照文獻(xiàn)[2]的做法,利用OpenCC工具將各語料集中的繁體中文句子轉(zhuǎn)換成簡體中文,同時利用PinYin工具獲取混淆集中各個單詞的拼音信息。3個語料集的相關(guān)統(tǒng)計信息如表3所示。

    表3 3個CSC語料集的統(tǒng)計信息1)Table 3 Statistical information about three corpora

    由于各語料集中句子的最大長度均明顯小于512 個字,因此在微調(diào)和測試過程中均取其最大長度值作為閾值。

    與文獻(xiàn)[1,3,7]等其他工作類似,實(shí)驗(yàn)中均采用CSC任務(wù)中常用的句子級別精確率P(Precision)、召回率R(Recall)和F1 值等作為評價指標(biāo),并區(qū)分錯誤識別網(wǎng)絡(luò)D(Detection Network)和糾正網(wǎng)絡(luò)C(Correction Network)。例如,PD和PC分別表示識別網(wǎng)絡(luò)和糾正網(wǎng)絡(luò)的精確率,RD和RC分別表示識別網(wǎng)絡(luò)和糾正網(wǎng)絡(luò)的召回率,F(xiàn)1D和F1C分別表示識別網(wǎng)絡(luò)和糾正網(wǎng)絡(luò)的F1 值。同時,為了減少參數(shù)初始化及訓(xùn)練過程中產(chǎn)生的偏差,在下游任務(wù)中取3次獨(dú)立微調(diào)和測試的結(jié)果平均值作為最終實(shí)驗(yàn)結(jié)果。

    3.2 預(yù)訓(xùn)練語言模型對比

    為了分別對比原始base、wwm 和macbert 與采用MASC進(jìn)行再次預(yù)訓(xùn)練后的效果,本實(shí)驗(yàn)采用文獻(xiàn)[7]中BERT 的類似結(jié)構(gòu),在最后Transformer 隱層輸出序列的基礎(chǔ)上,分別利用sigmoid 和softmax層用于錯誤識別和糾正判斷。表4給出了采用不同預(yù)訓(xùn)練語言模型后MASC 在3 個語料集上的效果,后綴agc、hsk和all分別表示采用ACG3W、HSK3W和同時采用ACG3W及HSK3W進(jìn)行MASC預(yù)訓(xùn)練的結(jié)果?;赽ase 的MASC 即相當(dāng)于文獻(xiàn)[21]中的BERT 模型,實(shí)驗(yàn)結(jié)果來自于相應(yīng)文獻(xiàn);其他實(shí)驗(yàn)結(jié)果均為本文的實(shí)驗(yàn)結(jié)果。粗體部分表示在該語料集上不同模型的最好效果。

    表4 不同預(yù)訓(xùn)練語言模型的MASC在3個語料集上的效果Table 4 Performance on three corpora of MASC with different pre-trained language models %

    由表4可知:

    (1)當(dāng)采用3 種不同的預(yù)訓(xùn)練語言模型時,MASC 在3 個語料集上的表現(xiàn)不同。總體上來說,MASC在macbert上的效果最好,而在bert和wwm上則表現(xiàn)各不同。本文認(rèn)為主要的原因是macbert 在base基礎(chǔ)上結(jié)合文本校正預(yù)訓(xùn)練任務(wù),進(jìn)一步增強(qiáng)了模型識別詞組和同義詞的能力,而且通過大規(guī)模的再次預(yù)訓(xùn)練能更好地學(xué)習(xí)句子的上下文語義并提升模型在CSC中的效果。而wwm在3個語料集上的效果并沒有明顯優(yōu)于base,甚至部分效果更差,主要是因?yàn)椋? 個語料集中的大部分錯誤以單字為主(具體統(tǒng)計信息可見表5),而很少整個詞出錯,這與wwm 在預(yù)訓(xùn)練時的全詞掩碼策略存在較大的差異;還與3個語料集本身存在一定的差異有關(guān)。

    表5 3個語料集中字和詞錯誤的統(tǒng)計信息Table 5 Statistic information about character and word errors in three corpora

    wwm與base均沒有考慮錯誤字詞與正確字詞間的發(fā)音或字形相似性知識,且面臨預(yù)訓(xùn)練和與微調(diào)不一致的問題。

    (2)對于hsk、acg 和all 3 種不同的預(yù)訓(xùn)練語料集,MASC 采用all 數(shù)據(jù)后在3 個CSC 語料集上總體表現(xiàn)最好,采用hsk 的次之,而采用acg 的最差。這說明預(yù)訓(xùn)練數(shù)據(jù)的內(nèi)容對于模型在下游任務(wù)中的效果有著較大的影響。3 個CSC 語料中的句子主要來自國外的中文初學(xué)者所寫的散文。HSK中的句子來自于漢語水平考試(HSK)語料集,而ACG的句子則主要來自于人民日報的報道。因此,總體上各個CSC 語料集與ACG 句子內(nèi)容和語法結(jié)構(gòu)上相差較大,而與HSK 非常接近。實(shí)驗(yàn)結(jié)果也證明了hsk在CSC 語料集上的表現(xiàn)確實(shí)優(yōu)于acg。采用all 訓(xùn)練數(shù)據(jù)后,模型效果大部分情況下表現(xiàn)較好,特別是在錯誤識別效果方面均有一定的提升,但在糾正方面因與acg 訓(xùn)練數(shù)據(jù)的內(nèi)容存在一定差異及總體訓(xùn)練不充分等因素,導(dǎo)致糾正的效果有時候略下降。

    (3)采用不同訓(xùn)練數(shù)據(jù)后,MASC在3個語料集上的錯誤識別效果均得到了一定的提升,這說明MASC確實(shí)能有效地提升模型的中文拼寫錯誤識別能力。但在文本糾正方面,采用wwm后模型的效果并沒有提升,反而下降了。本文認(rèn)為主要是因?yàn)閣wm中對詞組的掩碼與CSC中以單字拼寫錯誤為主的情況存在很大差異,因此預(yù)訓(xùn)練后反而容易引入一些噪聲數(shù)據(jù),從而導(dǎo)致模型的糾正效果受到一定的影響。

    3.3 消融實(shí)驗(yàn)

    本實(shí)驗(yàn)以sighan15 語料集為例對MASC 中的各組成部分進(jìn)行消融分析。結(jié)合表4所示的結(jié)果,以MascBERT+base+all 作為基線模型進(jìn)行分析,實(shí)驗(yàn)結(jié)果如表6所示。其中“-”表示在原來模型基礎(chǔ)上去除相應(yīng)的組成部分,例如,-N-grams表示不考慮詞掩碼,即只采用字掩碼,-tone表示不考慮拼音的音調(diào),-visual 表示不考慮字形相近信息,-lossdet表示不考慮錯誤識別層和相應(yīng)的損失函數(shù)。

    表6 MascBERT的消融實(shí)驗(yàn)結(jié)果Table 6 Ablation experiment result for MascBERT %

    從表6中的實(shí)驗(yàn)結(jié)果可知:去除N-grams之后,MascBERT 在錯誤識別效果方面稍有下降,而在糾正方面不僅沒有下降,反而有一定的提升。本文認(rèn)為這主要是因?yàn)閟ighan的訓(xùn)練集和測試集都是以單個字的錯誤為主,因此去除N-grams雖然降低了錯誤識別效果,但在糾正時減少了詞組所帶來的一些干擾信息,因此更符合下游任務(wù)的特點(diǎn),從而使糾正效果有一定的提升。這也與表5的結(jié)果相符,同時也說明雖然MascBERT 中采用全詞及多元詞組掩碼能夠提升模型在許多下游任務(wù)中的表現(xiàn),但對于CSC任務(wù)卻不一定有效。對于聲調(diào)和字形相近信息來說,總體上聲調(diào)對模型的效果影響更大,這主要是因?yàn)榇蟛糠制磳戝e誤的正確字與錯誤字之間存在發(fā)音相同的情況,而字形相近的錯誤相對較少。去除錯誤識別層及相應(yīng)的損失函數(shù)后,模型的效果明顯有一定的下降,這主要是因?yàn)樵璏LM中只考慮對被掩碼字正確值的判斷,而忽略了對該字是否存在拼寫錯誤進(jìn)行識別。因此增加錯誤識別和損失函數(shù)后,能夠引導(dǎo)模型進(jìn)一步根據(jù)上下文判斷相應(yīng)的字是否存在拼寫錯誤,而不只是單獨(dú)考慮是否語義正確。當(dāng)同時去除聲調(diào)和錯誤識別判斷后,模型的效果下降明顯,甚至比不采用MASC的效果更差。這主要是因?yàn)閟ighan15語料集中的拼寫錯誤大多是因?yàn)橥艋蚪舳鸬?,因此單純只考慮N-grams和字形相近信息反而容易在預(yù)訓(xùn)練時引入噪聲數(shù)據(jù),特別是在預(yù)訓(xùn)練數(shù)據(jù)量比較有限以及訓(xùn)練不充分的情況下。

    3.4 實(shí)例分析

    下面繼續(xù)以sighan15 語料集中的部分句子為例,分別對BERT 和MascBERT 的判斷結(jié)果進(jìn)行對比分析。測試集中的3個句子如下。

    句子1:這兩問題真的嚴(yán)重,我么(們)受不了。

    句子2:可是你現(xiàn)在不在宿舍,所以我留了一枝(紙)條。

    句子3:我以前想要高(告)訴你,可是我忘了。我真戶禿(糊涂)。

    分別采用預(yù)訓(xùn)練及微調(diào)后的BERT和MascBERT進(jìn)行判斷,結(jié)果如表7所示,其中粗體字表示對應(yīng)錯誤的預(yù)測結(jié)果。

    表7 常見中文拼寫錯誤例子Table 7 Examples of common CSC errors

    從表7 可以看出,BERT 的輸出結(jié)果句子在語義上是合理通順的,但不是正確的目標(biāo)句子,特別是預(yù)測的字詞與錯誤字詞之間沒有發(fā)音或字形上的相似性信息;而MascBERT 的輸出結(jié)果不僅在句子語義上是合理的,而且能夠更好地學(xué)習(xí)到字之間在發(fā)音上的相似性知識。

    4 結(jié)語

    針對現(xiàn)有BERT/RoBERTa/MacBERT 等預(yù)訓(xùn)練語言模型的MLM在CSC任務(wù)中面臨預(yù)訓(xùn)練與微調(diào)任務(wù)不一致的問題,提出一種面向中文拼寫糾錯的自監(jiān)督預(yù)訓(xùn)練方法MASC,將MLM 中對被掩碼字的正確值預(yù)測轉(zhuǎn)換成對拼寫錯誤字的識別和糾正,同時結(jié)合混淆集引入音調(diào)相同、音調(diào)相近和字形相近等相似性知識。實(shí)驗(yàn)結(jié)果表明,所提出的MASC可在不改變BERT/RoBERTa/MacBERT 等模型結(jié)構(gòu)的前提下,有效地提升預(yù)訓(xùn)練語言模型在下游CSC任務(wù)中的效果。下一步將繼續(xù)研究如何改進(jìn)預(yù)訓(xùn)練任務(wù)中的掩碼策略和候選字生成策略,以提升模型的錯誤識別及糾正能力;還將探討如何在下游任務(wù)中進(jìn)一步引入其他相似性知識,以避免依賴于特定的混淆集。

    猜你喜歡
    拼寫錯誤掩碼字形
    低面積復(fù)雜度AES低熵掩碼方案的研究
    甲骨文“黍”字形義考
    甲骨文中的字形直立化二則
    復(fù)習(xí)生字字形的方法
    初中生英語詞匯學(xué)習(xí)策略探究
    贏未來(2018年1期)2018-04-20 07:11:36
    基于布爾異或掩碼轉(zhuǎn)算術(shù)加法掩碼的安全設(shè)計*
    從2017年6月四級翻譯閱卷看段落翻譯中的詞匯錯誤類型
    考試周刊(2017年92期)2018-02-03 01:00:32
    添一筆變個字
    由wrong錯拼成worry引發(fā)的行動研究
    基于掩碼的區(qū)域增長相位解纏方法
    日韩视频一区二区在线观看| 69av精品久久久久久| www.www免费av| 久久香蕉激情| 国产单亲对白刺激| 极品人妻少妇av视频| e午夜精品久久久久久久| 十分钟在线观看高清视频www| 成人三级做爰电影| 高清av免费在线| 人人妻人人添人人爽欧美一区卜| 亚洲av成人一区二区三| 亚洲色图av天堂| 亚洲成人免费电影在线观看| 少妇粗大呻吟视频| 99久久人妻综合| 国产精品香港三级国产av潘金莲| 久久天堂一区二区三区四区| 日韩三级视频一区二区三区| 国产精品av久久久久免费| 最近最新免费中文字幕在线| 成人三级做爰电影| 久久国产精品影院| 在线观看免费视频网站a站| 露出奶头的视频| 99香蕉大伊视频| 久久久久久久久免费视频了| 精品国产亚洲在线| 91麻豆精品激情在线观看国产 | 成人影院久久| 成人特级黄色片久久久久久久| 日本 av在线| 亚洲国产精品一区二区三区在线| √禁漫天堂资源中文www| 在线十欧美十亚洲十日本专区| 女人高潮潮喷娇喘18禁视频| 90打野战视频偷拍视频| 国产黄色免费在线视频| 久久久精品国产亚洲av高清涩受| av福利片在线| 一进一出抽搐动态| 久久久久国产一级毛片高清牌| 国产日韩一区二区三区精品不卡| 黄色毛片三级朝国网站| 国产免费男女视频| 亚洲精品国产区一区二| 亚洲国产毛片av蜜桃av| 天堂√8在线中文| 免费高清在线观看日韩| 日韩免费av在线播放| 人人妻,人人澡人人爽秒播| www.999成人在线观看| 久久久久国内视频| svipshipincom国产片| 不卡av一区二区三区| 欧美日韩亚洲高清精品| 不卡一级毛片| 午夜a级毛片| 欧美日韩亚洲综合一区二区三区_| 中文欧美无线码| 日韩欧美在线二视频| 超碰成人久久| 国产成人系列免费观看| 亚洲,欧美精品.| 一夜夜www| 免费在线观看黄色视频的| 国产高清videossex| 免费观看精品视频网站| 精品久久久精品久久久| 又紧又爽又黄一区二区| 97碰自拍视频| 午夜免费观看网址| 国产有黄有色有爽视频| 成人黄色视频免费在线看| 熟女少妇亚洲综合色aaa.| 99国产精品99久久久久| 777久久人妻少妇嫩草av网站| 自线自在国产av| 80岁老熟妇乱子伦牲交| 黑丝袜美女国产一区| 18美女黄网站色大片免费观看| 国产精品秋霞免费鲁丝片| 正在播放国产对白刺激| 亚洲一区中文字幕在线| 97碰自拍视频| 99国产精品免费福利视频| 黄色视频,在线免费观看| 日韩av在线大香蕉| 男人操女人黄网站| 国产单亲对白刺激| 中文字幕最新亚洲高清| 在线国产一区二区在线| 亚洲欧美日韩另类电影网站| 韩国精品一区二区三区| 国产欧美日韩一区二区三| 国产av精品麻豆| 中文欧美无线码| 国产精品久久电影中文字幕| 欧美日韩国产mv在线观看视频| 久久精品91蜜桃| 巨乳人妻的诱惑在线观看| 国产成人精品在线电影| 国产精品成人在线| 黄色丝袜av网址大全| 免费在线观看视频国产中文字幕亚洲| 激情视频va一区二区三区| 国产深夜福利视频在线观看| 三上悠亚av全集在线观看| 午夜a级毛片| 一区福利在线观看| 国产午夜精品久久久久久| 日韩视频一区二区在线观看| 亚洲久久久国产精品| 免费女性裸体啪啪无遮挡网站| 如日韩欧美国产精品一区二区三区| 91麻豆av在线| 99久久99久久久精品蜜桃| 亚洲精品中文字幕在线视频| 在线观看一区二区三区| 国产一区二区三区在线臀色熟女 | netflix在线观看网站| 亚洲精品中文字幕在线视频| 一进一出好大好爽视频| 51午夜福利影视在线观看| aaaaa片日本免费| 黑人欧美特级aaaaaa片| 又黄又粗又硬又大视频| 三上悠亚av全集在线观看| 午夜福利,免费看| 又大又爽又粗| 欧美另类亚洲清纯唯美| 在线播放国产精品三级| 国产精品电影一区二区三区| 日韩国内少妇激情av| 国产成人欧美| 国产蜜桃级精品一区二区三区| 日韩欧美免费精品| 欧美成狂野欧美在线观看| www.熟女人妻精品国产| 欧美日韩瑟瑟在线播放| 人人妻,人人澡人人爽秒播| 长腿黑丝高跟| 1024视频免费在线观看| 身体一侧抽搐| 免费av毛片视频| 人成视频在线观看免费观看| 欧美中文综合在线视频| 韩国av一区二区三区四区| 在线视频色国产色| 极品教师在线免费播放| 制服诱惑二区| 欧美成人免费av一区二区三区| 久久久久久久久中文| 超碰97精品在线观看| 亚洲伊人色综图| 国产免费av片在线观看野外av| 18禁美女被吸乳视频| 精品国产一区二区久久| 欧美丝袜亚洲另类 | 免费高清视频大片| 大香蕉久久成人网| 成人影院久久| 精品少妇一区二区三区视频日本电影| 亚洲精品久久成人aⅴ小说| 免费女性裸体啪啪无遮挡网站| 免费不卡黄色视频| 美女福利国产在线| 国产精品综合久久久久久久免费 | 在线视频色国产色| 国产精品自产拍在线观看55亚洲| 99久久国产精品久久久| 看黄色毛片网站| 久久人人97超碰香蕉20202| 日韩三级视频一区二区三区| 欧美乱妇无乱码| 欧洲精品卡2卡3卡4卡5卡区| 亚洲色图av天堂| 久久精品国产亚洲av香蕉五月| 久久精品成人免费网站| 多毛熟女@视频| 在线观看日韩欧美| 国产精品一区二区免费欧美| 久久久久久人人人人人| 视频区欧美日本亚洲| 丝袜美腿诱惑在线| 一夜夜www| 亚洲成a人片在线一区二区| 丝袜美足系列| 乱人伦中国视频| 十八禁网站免费在线| 中国美女看黄片| 久久人妻av系列| 亚洲精品成人av观看孕妇| 免费高清视频大片| 免费女性裸体啪啪无遮挡网站| 18禁裸乳无遮挡免费网站照片 | 少妇被粗大的猛进出69影院| 另类亚洲欧美激情| 91成年电影在线观看| 99在线视频只有这里精品首页| 精品第一国产精品| 中文亚洲av片在线观看爽| 午夜免费观看网址| 桃红色精品国产亚洲av| 日韩大尺度精品在线看网址 | 国产亚洲精品第一综合不卡| 精品久久久久久久毛片微露脸| aaaaa片日本免费| 美国免费a级毛片| 新久久久久国产一级毛片| 国产精品av久久久久免费| 女人精品久久久久毛片| 国产熟女xx| 美女大奶头视频| 国产精品久久久久久人妻精品电影| 色综合欧美亚洲国产小说| 欧美国产精品va在线观看不卡| av欧美777| 国产欧美日韩一区二区精品| 国产免费男女视频| 91精品三级在线观看| 亚洲成人免费av在线播放| 十八禁人妻一区二区| 女人爽到高潮嗷嗷叫在线视频| 精品乱码久久久久久99久播| 在线av久久热| 精品一区二区三区视频在线观看免费 | a级毛片在线看网站| 麻豆一二三区av精品| 在线永久观看黄色视频| 精品国产一区二区久久| 又紧又爽又黄一区二区| 极品教师在线免费播放| 国产精品一区二区免费欧美| 一级a爱片免费观看的视频| tocl精华| 国产伦一二天堂av在线观看| 日韩成人在线观看一区二区三区| 性色av乱码一区二区三区2| 久久久久久亚洲精品国产蜜桃av| 久久影院123| 999久久久精品免费观看国产| 91精品三级在线观看| 国产成人一区二区三区免费视频网站| 欧美乱色亚洲激情| 国产又爽黄色视频| 最近最新免费中文字幕在线| 久久影院123| 老汉色∧v一级毛片| 久久久国产精品麻豆| 久久久久久亚洲精品国产蜜桃av| 免费日韩欧美在线观看| 国产av一区二区精品久久| 国产精华一区二区三区| 可以在线观看毛片的网站| 天天躁夜夜躁狠狠躁躁| 精品国产乱码久久久久久男人| 熟女少妇亚洲综合色aaa.| 亚洲欧美激情在线| 色综合站精品国产| 性欧美人与动物交配| 国产精品99久久99久久久不卡| 一进一出好大好爽视频| 成人黄色视频免费在线看| 在线国产一区二区在线| 久久人人精品亚洲av| 嫩草影院精品99| svipshipincom国产片| 12—13女人毛片做爰片一| 国产伦人伦偷精品视频| 成人18禁在线播放| 日本黄色视频三级网站网址| 免费高清视频大片| av福利片在线| 国产在线精品亚洲第一网站| 欧美日韩黄片免| 一二三四社区在线视频社区8| 后天国语完整版免费观看| 一区二区三区国产精品乱码| 91成人精品电影| 亚洲国产欧美一区二区综合| 亚洲在线自拍视频| 好男人电影高清在线观看| 国产有黄有色有爽视频| svipshipincom国产片| 不卡一级毛片| 大陆偷拍与自拍| 夜夜夜夜夜久久久久| 午夜激情av网站| 老汉色av国产亚洲站长工具| 亚洲成a人片在线一区二区| 97人妻天天添夜夜摸| 男女床上黄色一级片免费看| 国产成人一区二区三区免费视频网站| 岛国在线观看网站| 天堂√8在线中文| 久久草成人影院| 女同久久另类99精品国产91| 国产午夜精品久久久久久| 两人在一起打扑克的视频| 亚洲精品中文字幕在线视频| 久久精品成人免费网站| a级毛片黄视频| 嫩草影院精品99| 日日爽夜夜爽网站| 88av欧美| 久久伊人香网站| 天天影视国产精品| 免费不卡黄色视频| 天天躁夜夜躁狠狠躁躁| 香蕉国产在线看| 一边摸一边做爽爽视频免费| 免费人成视频x8x8入口观看| 中文字幕高清在线视频| 日本精品一区二区三区蜜桃| 成年女人毛片免费观看观看9| 在线观看免费视频日本深夜| 国产成人精品在线电影| 熟女少妇亚洲综合色aaa.| 一二三四在线观看免费中文在| 人人妻人人爽人人添夜夜欢视频| 一级作爱视频免费观看| 美国免费a级毛片| 一进一出好大好爽视频| 国产欧美日韩综合在线一区二区| 亚洲va日本ⅴa欧美va伊人久久| 欧美老熟妇乱子伦牲交| 国产97色在线日韩免费| 中文亚洲av片在线观看爽| 欧美激情高清一区二区三区| 丰满人妻熟妇乱又伦精品不卡| 免费日韩欧美在线观看| 国产精品久久久久成人av| 亚洲精品一区av在线观看| 男人操女人黄网站| 一二三四在线观看免费中文在| 天天添夜夜摸| 国产成人啪精品午夜网站| 一区二区三区激情视频| 免费观看人在逋| 欧美中文综合在线视频| 国产精品亚洲一级av第二区| 黑丝袜美女国产一区| 黄色怎么调成土黄色| 午夜福利欧美成人| 免费观看人在逋| 精品一区二区三区av网在线观看| 亚洲国产欧美日韩在线播放| 黄色视频,在线免费观看| 亚洲精品国产一区二区精华液| 免费在线观看影片大全网站| 国产深夜福利视频在线观看| 亚洲国产看品久久| 亚洲五月婷婷丁香| 精品卡一卡二卡四卡免费| 亚洲国产精品999在线| 香蕉国产在线看| 国产亚洲精品一区二区www| 国产av一区二区精品久久| 午夜老司机福利片| 久久国产精品影院| 一个人免费在线观看的高清视频| 免费久久久久久久精品成人欧美视频| 99久久久亚洲精品蜜臀av| 亚洲黑人精品在线| 色播在线永久视频| 亚洲激情在线av| 亚洲一区高清亚洲精品| 一进一出抽搐gif免费好疼 | 欧美最黄视频在线播放免费 | 免费在线观看视频国产中文字幕亚洲| 久久天堂一区二区三区四区| 两人在一起打扑克的视频| 日韩中文字幕欧美一区二区| 免费观看人在逋| 欧美久久黑人一区二区| 久久国产乱子伦精品免费另类| 久久性视频一级片| 女人爽到高潮嗷嗷叫在线视频| 88av欧美| 亚洲avbb在线观看| 一进一出抽搐gif免费好疼 | 亚洲自偷自拍图片 自拍| 黄色视频不卡| 国产日韩一区二区三区精品不卡| 天天影视国产精品| 久99久视频精品免费| 女人爽到高潮嗷嗷叫在线视频| 国产亚洲精品第一综合不卡| 久久久久九九精品影院| 成人精品一区二区免费| 美女高潮喷水抽搐中文字幕| 老司机福利观看| 亚洲专区中文字幕在线| 18美女黄网站色大片免费观看| 亚洲一区二区三区不卡视频| 麻豆一二三区av精品| av在线播放免费不卡| 99香蕉大伊视频| 国产精品1区2区在线观看.| 黑丝袜美女国产一区| 精品国产乱子伦一区二区三区| 国产不卡一卡二| 午夜老司机福利片| 亚洲人成网站在线播放欧美日韩| 一夜夜www| 亚洲国产欧美网| 欧美黑人欧美精品刺激| 熟女少妇亚洲综合色aaa.| 99久久人妻综合| tocl精华| 国产视频一区二区在线看| 亚洲av第一区精品v没综合| 一区二区三区国产精品乱码| 亚洲男人天堂网一区| 熟女少妇亚洲综合色aaa.| 天天影视国产精品| av片东京热男人的天堂| 少妇粗大呻吟视频| a在线观看视频网站| 日韩免费高清中文字幕av| 99热只有精品国产| 日韩一卡2卡3卡4卡2021年| 色哟哟哟哟哟哟| 男女下面插进去视频免费观看| 国产精品野战在线观看 | 一级片'在线观看视频| 波多野结衣高清无吗| 一夜夜www| 中文字幕高清在线视频| 亚洲第一青青草原| av网站在线播放免费| 午夜免费成人在线视频| 国产av又大| 少妇 在线观看| 欧美成人性av电影在线观看| 久久 成人 亚洲| 欧美黄色片欧美黄色片| 法律面前人人平等表现在哪些方面| 99国产极品粉嫩在线观看| 国产欧美日韩一区二区精品| 亚洲熟女毛片儿| a级毛片在线看网站| 久久久久国产精品人妻aⅴ院| 久久中文字幕人妻熟女| 男男h啪啪无遮挡| 99在线人妻在线中文字幕| 最近最新中文字幕大全电影3 | 香蕉国产在线看| 手机成人av网站| 午夜亚洲福利在线播放| 久久国产亚洲av麻豆专区| 亚洲久久久国产精品| 国内久久婷婷六月综合欲色啪| 一二三四在线观看免费中文在| 涩涩av久久男人的天堂| 制服诱惑二区| 亚洲五月色婷婷综合| 日韩欧美免费精品| 中文字幕高清在线视频| 亚洲激情在线av| 美女扒开内裤让男人捅视频| 久久久国产欧美日韩av| 午夜老司机福利片| 99久久久亚洲精品蜜臀av| 亚洲精品中文字幕在线视频| 国产精品美女特级片免费视频播放器 | 久久青草综合色| 久久狼人影院| 欧美中文日本在线观看视频| 亚洲专区中文字幕在线| 亚洲精华国产精华精| 一本综合久久免费| 国产不卡一卡二| 99热国产这里只有精品6| 无限看片的www在线观看| 精品久久久精品久久久| 在线免费观看的www视频| 亚洲avbb在线观看| aaaaa片日本免费| 9191精品国产免费久久| 国产黄a三级三级三级人| 黄色a级毛片大全视频| 日韩欧美三级三区| av天堂久久9| av视频免费观看在线观看| 欧美中文综合在线视频| 欧美黑人精品巨大| 狂野欧美激情性xxxx| 热re99久久精品国产66热6| 女人被躁到高潮嗷嗷叫费观| 免费人成视频x8x8入口观看| 国产精品久久久久成人av| 亚洲熟妇中文字幕五十中出 | 一边摸一边做爽爽视频免费| 国产精品久久久久久人妻精品电影| 高清欧美精品videossex| 亚洲九九香蕉| 好看av亚洲va欧美ⅴa在| 叶爱在线成人免费视频播放| 国产熟女xx| www.999成人在线观看| 99国产精品99久久久久| av网站免费在线观看视频| 欧美亚洲日本最大视频资源| 中文字幕色久视频| 亚洲久久久国产精品| 午夜福利影视在线免费观看| 午夜免费激情av| 人人妻,人人澡人人爽秒播| 夫妻午夜视频| 国产黄a三级三级三级人| 欧美国产精品va在线观看不卡| 国产精品偷伦视频观看了| 99久久人妻综合| 国产精品永久免费网站| 90打野战视频偷拍视频| 亚洲色图av天堂| 精品熟女少妇八av免费久了| 男人舔女人下体高潮全视频| 啦啦啦在线免费观看视频4| 性色av乱码一区二区三区2| 在线观看www视频免费| 十分钟在线观看高清视频www| 国产91精品成人一区二区三区| 亚洲精华国产精华精| netflix在线观看网站| 亚洲人成77777在线视频| 中文字幕高清在线视频| 国产一区二区在线av高清观看| 亚洲色图综合在线观看| 久久精品影院6| 日日夜夜操网爽| 琪琪午夜伦伦电影理论片6080| 人成视频在线观看免费观看| 亚洲在线自拍视频| 日韩精品免费视频一区二区三区| 成人亚洲精品av一区二区 | 老鸭窝网址在线观看| 国产精品国产高清国产av| 国产成人精品无人区| av免费在线观看网站| 男人的好看免费观看在线视频 | 精品乱码久久久久久99久播| 亚洲情色 制服丝袜| 国产精品1区2区在线观看.| 欧美老熟妇乱子伦牲交| 91老司机精品| 欧美午夜高清在线| 国产精品一区二区免费欧美| 99在线人妻在线中文字幕| 91精品国产国语对白视频| 国产欧美日韩精品亚洲av| 免费观看精品视频网站| 91精品三级在线观看| 黄色a级毛片大全视频| 亚洲av成人av| 亚洲精品久久午夜乱码| 日韩三级视频一区二区三区| 久久 成人 亚洲| av在线天堂中文字幕 | 天天躁夜夜躁狠狠躁躁| 桃色一区二区三区在线观看| 亚洲第一av免费看| √禁漫天堂资源中文www| 88av欧美| 欧美日韩瑟瑟在线播放| 一进一出抽搐动态| 久久天堂一区二区三区四区| 无限看片的www在线观看| 国产欧美日韩一区二区精品| 一区福利在线观看| 国产成人免费无遮挡视频| 18美女黄网站色大片免费观看| 新久久久久国产一级毛片| 亚洲在线自拍视频| 男女下面插进去视频免费观看| 自线自在国产av| 制服人妻中文乱码| 日本a在线网址| 国产欧美日韩一区二区三区在线| 久久久久精品国产欧美久久久| 久久人妻福利社区极品人妻图片| 久久婷婷成人综合色麻豆| www.精华液| av在线天堂中文字幕 | 国产精品久久视频播放| 久久人人精品亚洲av| 精品国内亚洲2022精品成人| 国产精品久久视频播放| 亚洲自拍偷在线| 国产精品电影一区二区三区| 1024视频免费在线观看| 亚洲av成人不卡在线观看播放网| 中文字幕色久视频| 国产欧美日韩一区二区三| 国产激情欧美一区二区| 国产欧美日韩精品亚洲av| 天堂影院成人在线观看| 亚洲激情在线av| 免费在线观看日本一区| 久久精品国产清高在天天线| 91麻豆av在线| 久久精品aⅴ一区二区三区四区| 国产有黄有色有爽视频| 黄色毛片三级朝国网站| 99国产综合亚洲精品| 99国产精品一区二区三区| 日韩大码丰满熟妇| 纯流量卡能插随身wifi吗| 国产97色在线日韩免费| 久热这里只有精品99| 脱女人内裤的视频| 男女之事视频高清在线观看| 女同久久另类99精品国产91|