• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于聚類和雙向門控循環(huán)單元-條件隨機(jī)場(chǎng)的多類型流式文檔結(jié)構(gòu)識(shí)別

    2021-07-20 02:07:02姜雨彤田英愛
    科學(xué)技術(shù)與工程 2021年17期
    關(guān)鍵詞:段落語料文檔

    王 娟,李 寧,姜雨彤,田英愛

    (北京信息科技大學(xué)網(wǎng)絡(luò)文化與數(shù)字文化傳播重點(diǎn)實(shí)驗(yàn)室,北京 100101)

    文檔結(jié)構(gòu)識(shí)別基于對(duì)文檔中單元角色的判斷,實(shí)現(xiàn)流式文檔的智能化理解,這在文檔自動(dòng)排版和優(yōu)化、信息檢索、智能問答系統(tǒng)等領(lǐng)域均有重要作用。中外已存在許多關(guān)于流式文檔結(jié)構(gòu)識(shí)別的研究,在這些已有的研究中,根據(jù)研究方法的不同可以分為基于規(guī)則、語法、機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)的方法。Han等[1]結(jié)合文檔格式特征及內(nèi)容特征,定義模板規(guī)則,進(jìn)而確定文檔單元的語義角色。Geng等[2]使用基于規(guī)則的方法識(shí)別文檔中參考文獻(xiàn)的著錄項(xiàng),之后使用基于決策樹的方法判斷參考文獻(xiàn)的類型標(biāo)志。Lei等[3]分析流式文檔的特點(diǎn),基于條件隨機(jī)場(chǎng)構(gòu)建文檔結(jié)構(gòu)識(shí)別模型,實(shí)驗(yàn)結(jié)果表明該算法能夠較好地識(shí)別論文類型的文檔,識(shí)別的單元角色種類較豐富,但其依賴手工特征,局限性較強(qiáng)。張真等[4]將文檔結(jié)構(gòu)識(shí)別任務(wù)看成序列標(biāo)注任務(wù),提出基于神經(jīng)網(wǎng)絡(luò)構(gòu)建文檔結(jié)構(gòu)識(shí)別模型,該算法提高了論文類型文檔結(jié)構(gòu)識(shí)別準(zhǔn)確率,但對(duì)其他類型文檔結(jié)構(gòu)識(shí)別效果不理想。近年來,在自然語言處理(natural language processing, NLP)研究領(lǐng)域,序列標(biāo)注任務(wù)有大量成熟的研究成果。為能夠同時(shí)利用不同算法的優(yōu)勢(shì),很多學(xué)者提出神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)算法結(jié)合的混合算法思想,從而得到最優(yōu)的序列標(biāo)注模型。Kadari等[5]首先將神經(jīng)網(wǎng)絡(luò)和條件隨機(jī)場(chǎng)結(jié)合起來,構(gòu)建雙向長短時(shí)記憶-條件隨機(jī)場(chǎng)(bi-directional long short-term memory-conditional random field,Bi-LSTM-CRF)的模型,這種混合的序列標(biāo)注模型在NLP領(lǐng)域的語義角色標(biāo)注、命名識(shí)別等諸多任務(wù)上取得顯著成績(jī),因而逐漸取代單一的基于深度學(xué)習(xí)的模型成為主流的序列標(biāo)注模型。由于Bi-LSTM自身存在缺陷,Che等[6]提出基于雙向門控循環(huán)單元和條件隨機(jī)場(chǎng)(bidirectional gated recurrent unit-conditional random field,BiGRU-CRF)結(jié)合的混合序列標(biāo)注模型解決中文分詞序列標(biāo)記任務(wù),實(shí)驗(yàn)證明該混合模型比LSTM神經(jīng)網(wǎng)絡(luò)更容易訓(xùn)練,效果最佳。與此同時(shí),由于深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)能夠獲得局部特征,Guillaume等[7]將雙向長短期記憶單元、條件隨機(jī)場(chǎng)和卷積神經(jīng)網(wǎng)絡(luò)三者結(jié)合,構(gòu)建混合序列標(biāo)注模型,在命名實(shí)體識(shí)別領(lǐng)域取得很好的效果,但該模型不足之處在于,輸入長度的增加會(huì)導(dǎo)致性能下降。注意力機(jī)制的引入有助于克服這一缺點(diǎn),同時(shí)注意力機(jī)制能避免神經(jīng)網(wǎng)絡(luò)模型中輸入順序不合理,計(jì)算效率較低等問題[8]。在智能問答領(lǐng)域,Nie等[9]構(gòu)建答案選擇模型,加入注意力機(jī)制,使其能夠重點(diǎn)關(guān)注答案的某些部分,并取得較好的效果。

    目前,特殊設(shè)計(jì)的文檔結(jié)構(gòu)識(shí)別模型可以識(shí)別特定的文檔類型,但是對(duì)多種類型文檔結(jié)構(gòu)識(shí)別效果不好。為解決多類型文檔結(jié)構(gòu)識(shí)別問題,現(xiàn)借鑒相互獨(dú)立、完全窮盡(mutually exclusive collectively exhaustive,MECE)原則[10]和Rebsamen等[11]提出的方法,將不同類型或等級(jí)的數(shù)據(jù)分割視為單獨(dú)的任務(wù),即把多類型文檔結(jié)構(gòu)識(shí)別任務(wù)通過文檔分類的方式將其分解成若干個(gè)單類型文檔結(jié)構(gòu)識(shí)別的子問題,每一個(gè)子問題都是一個(gè)小規(guī)模的局部模型。因此,多類型文檔分治模型的核心思想是構(gòu)建文檔分類器實(shí)現(xiàn)文檔的自動(dòng)分類,進(jìn)而將該問題分解成單類型文檔結(jié)構(gòu)識(shí)別。對(duì)于文檔分類,分為有監(jiān)督學(xué)習(xí)的分類和無監(jiān)督學(xué)習(xí)的聚類[12]。Twinandilla等[13]使用K-means方法預(yù)先定義聚類中心和聚類個(gè)數(shù),通過調(diào)整損失函數(shù),將文檔對(duì)象基于文檔語義信息劃分成多個(gè)互不相交的簇,目標(biāo)是正確地根據(jù)主題對(duì)文檔進(jìn)行聚類,K-means算法思想簡(jiǎn)單且效果較好,但聚類個(gè)數(shù)需要預(yù)先確定。Zendrato等[14]使用改進(jìn)的X-means算法,用戶只需指定聚類個(gè)數(shù)所屬的范圍,算法會(huì)自動(dòng)選擇最優(yōu)的K值。文檔聚類方法的輸入特征大部分是文檔的文本信息,往往忽略文檔結(jié)構(gòu)信息。馮健等[15]采用劃分聚類方法,基于文檔對(duì)象模型結(jié)構(gòu)進(jìn)行文檔聚類,分析釣魚網(wǎng)頁文檔,實(shí)驗(yàn)表明該方法準(zhǔn)確率較高,效果較好。

    現(xiàn)擬使用語義信息和結(jié)構(gòu)信息來計(jì)算相似度,但為了盡可能減少主觀干預(yù),未采用具有噪聲的基于密度的聚類方法(density-based spatial clustering of applications with noise,DBSCAN),而采用X-means算法進(jìn)行文檔分類,實(shí)現(xiàn)了將大規(guī)模文檔集合分解成若干個(gè)小規(guī)模文檔集合的目標(biāo)后,嘗試將雙向門循環(huán)單元和條件隨機(jī)場(chǎng)結(jié)合的混合深度學(xué)習(xí)模型應(yīng)用到文檔結(jié)構(gòu)識(shí)別領(lǐng)域,并引入注意力機(jī)制,構(gòu)建各個(gè)小規(guī)模文檔集合的單類型文檔結(jié)構(gòu)識(shí)別模型,實(shí)現(xiàn)多類型文檔的結(jié)構(gòu)識(shí)別的目標(biāo)。

    1 文檔的結(jié)構(gòu)及其表示

    聚類算法將文檔聚類成簇后,針對(duì)每個(gè)簇,分析其語義,總結(jié)出對(duì)應(yīng)的段落角色集合,由于不同簇之間文檔類型差異較大,分析而得的文檔段落角色集合各不相同。隨后根據(jù)聚類得到的簇,分別構(gòu)建文檔結(jié)構(gòu)識(shí)別模型。

    每類的輸出層,由統(tǒng)計(jì)文檔類別中存在的段落角色種類定義。當(dāng)前語料庫中段落角色集合為PC={份號(hào)、發(fā)文機(jī)關(guān)標(biāo)志、發(fā)文字號(hào)、標(biāo)題、發(fā)文機(jī)關(guān)、發(fā)文日期、正文標(biāo)題、一級(jí)標(biāo)題、二級(jí)標(biāo)題、抄送機(jī)關(guān)、印發(fā)機(jī)關(guān)與日期、表格、表題、題目、作者、三級(jí)標(biāo)題、班級(jí)、圖題、圖片、文本段落、導(dǎo)師姓名、落款日期、作者單位、郵箱、中文摘要、中文關(guān)鍵詞、英文摘要、英文關(guān)鍵詞、公式、程序代碼、封面題目、副題目、四級(jí)標(biāo)題、引言內(nèi)容、日期內(nèi)容、機(jī)構(gòu)、目錄內(nèi)容、說明}。初始K值為1~8,最終模型書目為K=4。文檔結(jié)構(gòu)識(shí)別模型各參數(shù)設(shè)置及輸出層定義如表1所示。

    表1 簇類-模型參數(shù)設(shè)置及輸出層定義

    2 基于X-means算法的文檔聚類與分類

    劃分聚類算法是最基礎(chǔ)的聚類算法,該算法通過數(shù)據(jù)間簡(jiǎn)單的相似度計(jì)算即可將數(shù)據(jù)對(duì)象分組。該算法流程如圖1所示。主要包括三部分內(nèi)容,首先對(duì)輸入數(shù)據(jù)進(jìn)行特征提取和特征選擇,其次是數(shù)據(jù)對(duì)象相似度計(jì)算,最后是根據(jù)相似度結(jié)果將數(shù)據(jù)對(duì)象進(jìn)行分組。該方法最終將數(shù)據(jù)對(duì)象劃分到不同的類別或簇中,同一個(gè)簇中數(shù)據(jù)對(duì)象集合具有較高的相似度,而不同的簇中數(shù)據(jù)對(duì)象差別較大。

    圖1 聚類算法基本流程

    傳統(tǒng)的K-means 聚類算法是劃分聚類中較為基礎(chǔ)的算法,對(duì)于大規(guī)模的數(shù)據(jù)集有較好的聚類效果,其算法復(fù)雜度為O(mnkR)。其中,m為數(shù)據(jù)特征維數(shù),n為數(shù)據(jù)規(guī)模,k為指定的聚類簇個(gè)數(shù),R為總體迭代次數(shù)。雖然K-means 聚類算法高效簡(jiǎn)單,但也存在一定的局限性:算法中聚簇個(gè)數(shù)需要預(yù)先指定,同時(shí)每一輪迭代計(jì)算開銷較大且很容易陷入局部最優(yōu)解,鑒于此,文本選擇使用傳統(tǒng)K-means 的改進(jìn)算法即X-means 聚類算法。

    X-means算法的主要思路是先對(duì)文檔集合實(shí)現(xiàn)聚類,針對(duì)每一個(gè)文檔聚類簇繼續(xù)進(jìn)行K=2的聚類。具體步驟如下。

    (1)選擇特征集。選取的特征不同于其他文檔聚類方法,選取格式結(jié)合語義的特征集合完成文檔聚類,以實(shí)現(xiàn)對(duì)文檔按照領(lǐng)域及書寫格式劃分的目標(biāo)。

    (2)文檔完成初始聚類。語料中的每行特征集合數(shù)據(jù)均代表一篇文檔,從下限值Kmin開始,從N個(gè)數(shù)據(jù)對(duì)象中隨機(jī)選擇Kmin個(gè)數(shù)據(jù)對(duì)象作為初始聚類中心,計(jì)算其余數(shù)據(jù)對(duì)象與聚類中心的歐式距離,根據(jù)歐氏距離的值,將數(shù)據(jù)對(duì)象分配到與其距離最短的聚類簇中,計(jì)算每一個(gè)聚類簇的數(shù)據(jù)對(duì)象的均值,作為新的聚類中心,然后計(jì)算誤差平方和(the sum of squares due to error,SSE)評(píng)價(jià)當(dāng)前聚類結(jié)果,若SSE發(fā)生了變化,則迭代計(jì)算歐式距離重新歸類并計(jì)算新的聚類中心,若SSE未發(fā)生變化保持穩(wěn)定,則當(dāng)前的聚類算法結(jié)束,輸出聚類結(jié)果。

    (3)初始聚類完成后,針對(duì)每一個(gè)分類結(jié)果,完成二分聚類,得到最優(yōu)的聚類結(jié)果。本著各文檔聚類簇之間盡可能分開,各文檔聚類簇本身盡可能緊湊的原則,從范圍[Kmin=1,Kmax=10]內(nèi)找到最優(yōu)的聚類數(shù)K,即:針對(duì)每一個(gè)聚類簇,完成二分聚類,計(jì)算貝葉斯信息準(zhǔn)則(Bayesian information criterion,BIC)得分,決定是否進(jìn)行二分聚類,如果K值比指定的Kmax大或者不存在可分裂的聚類中心點(diǎn),那么算法停止,否則迭代繼續(xù)分裂聚類。最終,得到最優(yōu)聚類數(shù)K和最優(yōu)的聚類結(jié)果。在得到的聚類結(jié)果中,文本會(huì)自動(dòng)給數(shù)據(jù)維度后增加一個(gè)新列Cluster{Cluster1, Cluster2,…},用來標(biāo)注聚類類別,以支持后續(xù)的處理。

    歐式距離計(jì)算公式如(1)所示。

    (1)

    式(1)中:data為數(shù)據(jù)對(duì)象;j為第i個(gè)聚類中心;m為數(shù)據(jù)特征維度;dataj、Ctij為data數(shù)據(jù)對(duì)象和Cti聚類中心的第j個(gè)屬性值。

    此外,聚類結(jié)果由SSE評(píng)價(jià),公式為

    (2)

    該評(píng)價(jià)方法計(jì)算的是data數(shù)據(jù)對(duì)象和Cti聚類中心對(duì)應(yīng)點(diǎn)誤差的平方和,SSE值越趨近零,越說明模型擬合得更好,數(shù)據(jù)預(yù)測(cè)結(jié)果越好。

    選擇X-means 算法完成文檔聚類有如下優(yōu)點(diǎn)。

    (1)在算法初始時(shí)不預(yù)先給出聚簇個(gè)數(shù)K, 只指定聚簇個(gè)數(shù)K的大概范圍[K1,K2],該算法會(huì)在指定的[K1,K2]范圍內(nèi)通過BIC 值的評(píng)價(jià)方法不斷調(diào)整聚類簇的個(gè)數(shù),進(jìn)而找到一個(gè)最優(yōu)的聚簇個(gè)數(shù)K以實(shí)現(xiàn)聚類分組。

    (2)針對(duì)局部最優(yōu)解問題,X-means 每一輪迭代均使用2-means 方法,2-means 對(duì)局部最優(yōu)解不敏感。

    (3)該算法使用K-D樹分區(qū),加速了K-means 的每一輪迭代。

    3 基于BIGRU-CRF的文檔結(jié)構(gòu)識(shí)別方法

    流式文檔的每個(gè)段落可以看成一個(gè)基本單元,流式文檔可以看作基于這些單元之上的序列,段落與段落間存在前后依賴關(guān)系,進(jìn)而文檔結(jié)構(gòu)識(shí)別可以看成是序列標(biāo)注問題。針對(duì)文檔結(jié)構(gòu)識(shí)別問題,提出BiGRU-CRF模型。BiGRU-CRF模型將神經(jīng)網(wǎng)絡(luò)與統(tǒng)計(jì)學(xué)習(xí)相結(jié)合,解決了文檔結(jié)構(gòu)識(shí)別針對(duì)小規(guī)模語料訓(xùn)練性能較差、識(shí)別準(zhǔn)確率較低等問題。循環(huán)神經(jīng)網(wǎng)絡(luò)可以很好地完成短序列任務(wù),但針對(duì)長序列問題,RNN存在較大缺陷,它在訓(xùn)練中會(huì)頻繁出現(xiàn)梯度消失和爆炸等問題,導(dǎo)致訓(xùn)練中斷,使RNN無法記憶長距離信息。為避免RNN的缺點(diǎn),相關(guān)研究人員提出了長短期記憶網(wǎng)絡(luò)LSTM,可以有效地利用長距離序列信息,有效彌補(bǔ)RNN的不足,較好地求解長序列任務(wù)。但是由于LSTM網(wǎng)絡(luò)參數(shù)較多,網(wǎng)絡(luò)訓(xùn)練開銷較大,導(dǎo)致LSTM在是使用中有一定的局限性,因此,相關(guān)研究者提出了GRU模型,該模型對(duì)LSTM進(jìn)行簡(jiǎn)化,減少了網(wǎng)絡(luò)參數(shù),在解決長時(shí)序列任務(wù)時(shí),既保持了LSTM的效果,同時(shí)又使結(jié)構(gòu)更加簡(jiǎn)單,有效地縮短模型訓(xùn)練的時(shí)間,同時(shí)模型訓(xùn)練更易于收斂,需要的數(shù)據(jù)更少,模型效果更好。BiGRU模型獲取自上而下和自下而上的長短距離信息,由于文檔段落較多,數(shù)據(jù)信息較復(fù)雜,所以在BiGRU模型中引入自注意力機(jī)制。BiGRU加入自注意力機(jī)制會(huì)更好地獲得段落特征序列中長距離相互依賴的特征,自注意力能夠?qū)⑿蛄兄腥我鈨蓚€(gè)段落的特征矩陣通過一個(gè)計(jì)算步驟直接聯(lián)系到一起,而不是按照序列依次計(jì)算,有效地縮短依賴特征之間的關(guān)系。因?yàn)闂l件隨機(jī)場(chǎng)有突出的序列標(biāo)注能力,所以將BiGRU層結(jié)合自注意力機(jī)制得到的文檔特征信息結(jié)果作為特征向量的最終表示,使用CRF模型聯(lián)合建模進(jìn)行標(biāo)注決策,可以獲得全局最優(yōu)的序列標(biāo)注。這時(shí)構(gòu)建的文檔結(jié)構(gòu)識(shí)別模型,不僅會(huì)更好地捕獲輸入的段落特征序列中長距離的相互依賴的特征,而且該模型經(jīng)過CRF層的兩個(gè)特征函數(shù)處理,能夠更好地完成上下文預(yù)測(cè)。

    3.1 語料處理

    語料主要來源于北京信息科技大學(xué)文檔資源庫,包括各個(gè)類型文檔資源共計(jì)約50 000篇,其中經(jīng)過標(biāo)注工具標(biāo)注的文檔約5 000篇。

    基于Office Word Add-in 開發(fā)標(biāo)注工具輔助人工操作,采用半自動(dòng)化標(biāo)注模式通過插入文檔批注對(duì)語料進(jìn)行標(biāo)注;通過擴(kuò)展樣式表語言轉(zhuǎn)換(extensible stylesheet language transformations,XSLT)模板定義結(jié)構(gòu),將帶有批注序列的流式文檔轉(zhuǎn)換成符合定義的XML文檔,便于機(jī)器讀取;最后基于Word對(duì)象模型,自動(dòng)提取文檔特征,并填充到XML文檔中。文檔語料構(gòu)建過程如圖2所示。

    圖2 文檔語料構(gòu)建過程

    3.2 特征選取

    在構(gòu)建多類型文檔分治模型前,需要先提取特征。對(duì)于文檔結(jié)構(gòu)識(shí)別來說,除語義特征外的大部分特征均需要從文檔的底層抽取,而深度學(xué)習(xí)算法無法有效地自動(dòng)提取這些特征,因此需要采用人工提煉特征。通過分析寫作習(xí)慣及文檔的排版規(guī)則,從文檔中挖掘出多種特征。通過卡方檢驗(yàn),最后選擇出18種特征,表2為特征選擇結(jié)果。

    表2 特征選擇結(jié)果

    3.3 文檔結(jié)構(gòu)識(shí)別模型架構(gòu)及實(shí)現(xiàn)

    提出的BiGRU-CRF模型分為4個(gè)部分:采用Embedding降維進(jìn)行向量編碼作為輸入層、使用BiGRU結(jié)合CRF訓(xùn)練結(jié)構(gòu)識(shí)別模型、訓(xùn)練層加入自注意力模型,輔助調(diào)整模型參數(shù)。文檔結(jié)構(gòu)識(shí)別模型分為訓(xùn)練和測(cè)試兩部分,在訓(xùn)練階段,從第2節(jié)聚類結(jié)果中,選擇多篇文檔語料數(shù)據(jù),其中在3.1節(jié)中論述的特征預(yù)處理后的文本格式即為當(dāng)前的輸入語料格式,并采用BiGRU-CRF模型進(jìn)行訓(xùn)練;最后,在測(cè)試階段,選擇多篇該類文檔的語料數(shù)據(jù),使用上一步驟中訓(xùn)練好的文檔結(jié)構(gòu)識(shí)別模型進(jìn)行這些文檔單元角色的測(cè)試,得到最終的測(cè)試結(jié)果,并與預(yù)先標(biāo)注的結(jié)果對(duì)比,為分模型析和評(píng)價(jià)提供數(shù)據(jù)支撐??傮w框架如圖3所示。

    圖3 文檔結(jié)構(gòu)識(shí)別模型總體框架

    文檔結(jié)構(gòu)識(shí)別模型的輸入層即將3.2節(jié)中經(jīng)特征選擇提取的特征輸入到Embedding層進(jìn)行降維,完成向量編碼,若輸入的是不等長樣本,對(duì)其進(jìn)行padding補(bǔ)零之后輸入到Embedding層,形成文檔特征的初始表示,傳遞給下一層的BiGRU神經(jīng)網(wǎng)絡(luò)訓(xùn)練。BiGRU層自主學(xué)習(xí)輸入的文檔特征信息,同時(shí)記憶上下文依賴信息,得到其權(quán)重關(guān)系分布,輸出新的特征向量。在此基礎(chǔ)上,引入自注意力機(jī)制層,該層對(duì)上一層輸出的特征向量計(jì)算注意力概率分布,通過該分布對(duì)特征向量進(jìn)行點(diǎn)積運(yùn)算,最后累加,其結(jié)果作為特征向量的最終表示。這時(shí)深度學(xué)習(xí)網(wǎng)絡(luò)會(huì)更好地捕獲輸入的段落特征序列中長距離的相互依賴的特征,然后將特征向量輸出到CRF層。該層將特征向量的最終表示使用CRF模型聯(lián)合建模進(jìn)行標(biāo)注決策,以獲得全局最優(yōu)的序列標(biāo)注。

    以開題報(bào)告類型文檔為例,構(gòu)建BiGRU-CRF文檔結(jié)構(gòu)識(shí)別模型,表3為實(shí)驗(yàn)后確定的模型參數(shù)配置信息。

    表3 模型參數(shù)配置信息

    模型的具體算法流程如BiGRU-CRF混合神經(jīng)網(wǎng)絡(luò)算法迭代過程所示。

    輸入:經(jīng)初始化的開題報(bào)告文檔特征矢量Dataset_a。

    輸出:模型結(jié)構(gòu)和權(quán)重分布。

    Function BiGRU_CRF_Train(Dataset_a):

    Initialization特征變量設(shè)為零矩陣,初始化分類數(shù)num_class設(shè)置為13

    For所有文檔特征集合Dataset_a do:

    For每一篇文檔單元特征集合do:

    以字典形式保存每一個(gè)離散型特征和所有連續(xù)型特征拼接成的一個(gè)連續(xù)型特征

    以字典的形式保存檔單元角色標(biāo)簽

    End For

    End For

    獲取初始化的特征矩陣,對(duì)每一個(gè)特征降維

    連接所有特征變量得到變量input_all

    對(duì)input_all進(jìn)行變長序列處理,長序列切割,短序列填充零值,得到變量input_middle

    將input_middle輸入到GRU 模型中

    設(shè)置GRU 模型參數(shù):

    正則化dropout值設(shè)為0.2,輸出維度設(shè)為128,return_sequences設(shè)為True,得到變量x_gru

    將x_gru輸入到GRU 模型中,設(shè)置相同的參數(shù),得到變量x_bigru

    將x_bigru輸入到自注意力機(jī)制模型中

    設(shè)置自注意力模型參數(shù):

    注意力類型為multiplicative,注意力偏置設(shè)為false,得到變量x_atten,將x_atten輸?shù)紺RF 模型中

    設(shè)置CRF 參數(shù):

    分類參數(shù)設(shè)num_class,得到變量crf_output

    模型編譯,選擇Nadam 優(yōu)化算法

    打印模型結(jié)構(gòu),返回模型

    防止過擬合,采用EarlyStopping 法

    設(shè)置早停法參數(shù):

    監(jiān)測(cè)驗(yàn)證集的損失值,設(shè)置為min 模式,10 輪訓(xùn)練驗(yàn)證集損失值

    停止減少后模型訓(xùn)練中止,加入tensorboard 可視化

    模型訓(xùn)練

    設(shè)置模型訓(xùn)練參數(shù):

    迭代25 次,訓(xùn)練集驗(yàn)證集分布設(shè)置為0.2,一次訓(xùn)練選取樣本量為8

    保存模型結(jié)構(gòu)和模型權(quán)重到指定目錄,其中將save_best_only 設(shè)為true,保存驗(yàn)證集損失最小的模型權(quán)重

    End Function

    4 實(shí)驗(yàn)結(jié)果及分析

    4.1 文檔聚類實(shí)驗(yàn)

    選取語料庫3 000篇未標(biāo)注類型的文檔,其中混合了公文在內(nèi)的許多類型文檔。該部分?jǐn)?shù)據(jù)集因保密性要求,僅在GitHub(https://github.com/COSLab)上公布了68篇數(shù)據(jù)。

    4.1.1 評(píng)價(jià)指標(biāo)

    文檔結(jié)構(gòu)識(shí)別模型的評(píng)估指標(biāo)分為兩部分:段落單元的評(píng)估指標(biāo)和總體的評(píng)估指標(biāo)。

    針對(duì)段落單元的評(píng)估指標(biāo)采用查準(zhǔn)率(Precision,P)、查全率(Recall,R)和F1值(F1-score),通過這3項(xiàng)評(píng)估指標(biāo)對(duì)作者、題目、文本段落、圖片以及表格等各個(gè)段落單元進(jìn)行測(cè)評(píng)和分析。

    查準(zhǔn)率是相對(duì)于預(yù)測(cè)結(jié)果而言的,其含義是在被所有預(yù)測(cè)為標(biāo)簽N的樣本中,實(shí)際為標(biāo)簽N的概率,計(jì)算公式為

    (3)

    式(3)中:TP為模型預(yù)測(cè)結(jié)果為N的集合中,實(shí)際為標(biāo)簽N的樣本數(shù)量;Ptotal代表模型預(yù)測(cè)結(jié)果為標(biāo)簽N的總樣本數(shù)量。

    查全率是相對(duì)于樣本而言的,其含義是實(shí)際為標(biāo)簽N的樣本中,被預(yù)測(cè)為標(biāo)簽N的概率,計(jì)算公式為

    (4)

    式(4)中:Rtotal代表實(shí)際為標(biāo)簽N的總樣本數(shù)量。

    F1值的計(jì)算公式為

    (5)

    針對(duì)總體的評(píng)估指標(biāo),由于流式文檔中不同角色單元的數(shù)量差異較大,不同段落角色數(shù)量不平衡,正文的比重很大,遠(yuǎn)超過其他角色標(biāo)簽,因此不能簡(jiǎn)單采用上述3項(xiàng)指標(biāo)。采用上述3項(xiàng)指標(biāo)對(duì)應(yīng)的宏平均和微平均作為總體評(píng)價(jià)指標(biāo)。宏平均是指先對(duì)每一個(gè)標(biāo)簽統(tǒng)計(jì)上述3個(gè)指標(biāo)值,再對(duì)所有的標(biāo)簽求算術(shù)平均值。微平均指不區(qū)分標(biāo)簽進(jìn)行統(tǒng)計(jì),將所有標(biāo)簽一次性全考慮進(jìn)來。在實(shí)驗(yàn)過程中,對(duì)各個(gè)深度學(xué)習(xí)模型的使用上述評(píng)估指標(biāo),從而評(píng)價(jià)各個(gè)模型對(duì)文檔結(jié)構(gòu)識(shí)別的效果。這樣帶來的好處是可以更好地評(píng)價(jià)算法、模型在整個(gè)數(shù)據(jù)集上的性能。

    4.1.2 實(shí)驗(yàn)結(jié)果及分析

    文檔集合經(jīng)過聚類算法后,得到的聚類結(jié)果如圖4和圖5所示。

    圖4 聚類模型實(shí)驗(yàn)結(jié)果1

    圖5 聚類模型實(shí)驗(yàn)結(jié)果2

    通過聚類算法發(fā)現(xiàn),如果聚成4類,聚類的結(jié)果基本符合人工對(duì)文檔類型劃分的預(yù)期,大致分為論文類型、標(biāo)準(zhǔn)文本類型、公文類型和開題報(bào)告類型。其中論文類型文檔共1 512篇、標(biāo)準(zhǔn)類型文檔共575篇、公文類型文檔共586篇、開題報(bào)告類型文檔共488篇。因此可以實(shí)現(xiàn)分而治之的設(shè)想。

    聚類算法得到的4類文檔的實(shí)驗(yàn)結(jié)果如表4、表5所示。

    基于多個(gè)分類模型識(shí)別文檔,每一個(gè)識(shí)別模型均有其對(duì)應(yīng)的段落角色集合,同時(shí)每一個(gè)識(shí)別模型的準(zhǔn)確率均達(dá)到了92%以上,各個(gè)分類模型的識(shí)別結(jié)果如表4、表5所示,單模型和分治模型的結(jié)果總體比較如圖6所示,綜合4個(gè)模型得總體的算術(shù)平均值約為95%。

    表4 模型1和模型2的實(shí)驗(yàn)結(jié)果

    表5 模型3和模型4實(shí)驗(yàn)結(jié)果

    圖6 單一模型與分治模型的實(shí)驗(yàn)結(jié)果對(duì)比

    (2)用單模型去識(shí)別所有文檔,段落角色集合為第1節(jié)中論述的PC。得到的總體識(shí)別結(jié)果只有75%左右,效果較差,很明顯,例如中文摘要、引言這樣的段落角色很容易識(shí)別成文本段落。

    由此可以得出,所提出的分治模型能夠有效地解決多類型文檔結(jié)構(gòu)識(shí)別問題。

    4.2 文檔結(jié)構(gòu)識(shí)別實(shí)驗(yàn)

    根據(jù)4.1中文檔聚類算法得到的論文、開題報(bào)告、公文、標(biāo)準(zhǔn)這4類文檔集合,構(gòu)建最優(yōu)的文檔結(jié)構(gòu)識(shí)別模型。每種類型的文檔語料分為訓(xùn)練集和測(cè)試集。

    使用相同的語料庫,在相同環(huán)境配置的條件下,對(duì)不同模型分別進(jìn)行實(shí)驗(yàn)對(duì)比,實(shí)驗(yàn)采用4.1節(jié)中論述的查準(zhǔn)率、查全率和F1值,以及對(duì)應(yīng)的宏平均和微平均進(jìn)行評(píng)估。

    以聚類結(jié)果中數(shù)據(jù)規(guī)模最小的開題報(bào)告類型為例,對(duì)模型進(jìn)行評(píng)估和分析。近年來,已有幾個(gè)性能較好的模型。張真等[4]使用LSTM模型對(duì)文檔段落進(jìn)行預(yù)測(cè),現(xiàn)同樣選擇LSTM進(jìn)行對(duì)比實(shí)驗(yàn)。

    表6展示了本文模型與文獻(xiàn)[4]提出的模型實(shí)驗(yàn)對(duì)比結(jié)果。

    從表6中可以看出,同樣是處理序列標(biāo)注任務(wù)的模型,本文模型能夠更有效地完成文檔結(jié)構(gòu)識(shí)別的任務(wù)。此外,開題報(bào)告類型的數(shù)據(jù)規(guī)模較小是一個(gè)難點(diǎn),本文模型的整體識(shí)別效果較語料豐富的論文類型差距不大,但是,針對(duì)分級(jí)標(biāo)題,級(jí)別越低,寫作自由度越高,導(dǎo)致識(shí)別效果較差,三級(jí)標(biāo)題的識(shí)別效果只能達(dá)到0.65左右。從最終預(yù)測(cè)結(jié)果中得出,標(biāo)題識(shí)別錯(cuò)誤的情況為,大部分被識(shí)別成二級(jí)標(biāo)題或一級(jí)標(biāo)題,少量被識(shí)別成正文,說明各個(gè)標(biāo)題之間的特征差異較小。

    表6 不同文檔結(jié)構(gòu)識(shí)別模型效果對(duì)比

    表7是不同模型的參數(shù)對(duì)照表。從表7中可以看出,本文的模型參數(shù)較少,迭代25次即趨于穩(wěn)定,而文獻(xiàn)[4]模型參數(shù)較多,迭代次數(shù)到40次才趨于穩(wěn)定,但仍上下波動(dòng)。在數(shù)據(jù)規(guī)模較少的開題報(bào)告類的文檔訓(xùn)練中,尤為明顯。

    表7 模型參數(shù)對(duì)照

    綜上,無論是識(shí)別效果上還是性能上,本文模型在文檔結(jié)構(gòu)識(shí)別上效果均好于文獻(xiàn)[4]模型。

    方正飛翔是目前市面上書籍、科技排版效率最高的交互式排版軟件,word超強(qiáng)的兼容性,可以在導(dǎo)入時(shí)保留原版式。將本文模型識(shí)別結(jié)果與方正飛翔軟件進(jìn)行對(duì)比,結(jié)果如表8所示。在12類段落角色標(biāo)簽中,文本模型的識(shí)別結(jié)果除表題、表格以外,均高于方正軟件,其中作者、一級(jí)標(biāo)題、二級(jí)標(biāo)題、三級(jí)標(biāo)題均高出約0.2。而方正飛翔軟件在圖題、圖片、表格、表題等段落標(biāo)簽上的識(shí)別結(jié)果較好,本文模型與其結(jié)果持平,而圖題僅低0.05。

    表8 與方正飛翔軟件的識(shí)別效果對(duì)比

    5 結(jié)論

    針對(duì)多類型文檔結(jié)構(gòu)識(shí)別問題,提出多類型文檔分治模型,把多類型文檔結(jié)構(gòu)識(shí)別分為三個(gè)步驟。第一步,基于改進(jìn)的X-means 聚類算法構(gòu)建文檔分類器。第二步,為每個(gè)分類訓(xùn)練文檔結(jié)構(gòu)識(shí)別模型,充分利用段落角色的序列化特點(diǎn),將序列標(biāo)注方法結(jié)合到文檔結(jié)構(gòu)識(shí)別模型中去,結(jié)合雙向門控單元模型、條件隨機(jī)場(chǎng)模型并加入自注意力機(jī)制,構(gòu)建文檔結(jié)構(gòu)識(shí)別模型。第三步,對(duì)新文檔分類并調(diào)用相應(yīng)的文檔結(jié)構(gòu)識(shí)別模型。分治模型使得機(jī)器學(xué)習(xí)從大規(guī)模尋優(yōu)目標(biāo)轉(zhuǎn)化為小規(guī)模尋優(yōu)目標(biāo),降低了文檔結(jié)構(gòu)識(shí)別模型的訓(xùn)練復(fù)雜度,實(shí)驗(yàn)結(jié)果表明,該方法能夠有效識(shí)別多類型文檔結(jié)構(gòu),提高了模型的準(zhǔn)確性及方法的通用性,更符合實(shí)際應(yīng)用場(chǎng)景。

    本文模型雖然取得良好的效果,但仍有問題值得進(jìn)一步改進(jìn)。

    (1)數(shù)據(jù)集的拓展。使用的語料只是其中較少的一部分且涉及的種類較少,不夠全面,雖然提出的多類型文檔分治模型可以解決多類型文檔結(jié)構(gòu)的識(shí)別問題,但是如果能夠擴(kuò)充語料集,在獲得更豐富的語料的條件下,可以進(jìn)一步調(diào)整聚類的簇?cái)?shù)、特征的維度,對(duì)文檔進(jìn)行更精細(xì)的分類識(shí)別,以獲得更好的整體識(shí)別效果。

    (1)段落角色的細(xì)粒度識(shí)別。目前作為研究目的,對(duì)于流式文檔的段落角色劃分還比較粗,一些段落角色未作識(shí)別,例如:頁眉、頁腳、腳注等,在實(shí)際應(yīng)用中,可以考慮增加更多的段落角色識(shí)別能力。

    猜你喜歡
    段落語料文檔
    有人一聲不吭向你扔了個(gè)文檔
    【短文篇】
    心理小測(cè)試
    夏天,愛情的第四段落
    散文詩(2017年17期)2018-01-31 02:34:11
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    弄清段落關(guān)系 按圖索驥讀文
    讀寫算(下)(2016年11期)2016-05-04 03:44:07
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    日本黄色日本黄色录像| 大陆偷拍与自拍| 十八禁人妻一区二区| 日本vs欧美在线观看视频| 国产精品美女特级片免费视频播放器 | 侵犯人妻中文字幕一二三四区| 天天躁狠狠躁夜夜躁狠狠躁| 高清黄色对白视频在线免费看| 99在线视频只有这里精品首页| 国产亚洲欧美98| 女警被强在线播放| 亚洲片人在线观看| 亚洲国产精品sss在线观看 | av欧美777| 免费看a级黄色片| 天天躁夜夜躁狠狠躁躁| 久久精品91蜜桃| 精品福利观看| 91精品国产国语对白视频| 夜夜躁狠狠躁天天躁| 中文字幕最新亚洲高清| 日韩欧美在线二视频| 国产片内射在线| 亚洲欧洲精品一区二区精品久久久| 精品国内亚洲2022精品成人| 国产激情久久老熟女| 一级毛片高清免费大全| 91成人精品电影| 露出奶头的视频| 99热国产这里只有精品6| 伦理电影免费视频| 精品一区二区三区视频在线观看免费 | 亚洲性夜色夜夜综合| 久久这里只有精品19| 精品高清国产在线一区| 精品久久久久久,| 国内毛片毛片毛片毛片毛片| 老司机午夜福利在线观看视频| 午夜91福利影院| 久久欧美精品欧美久久欧美| 淫秽高清视频在线观看| 性欧美人与动物交配| 无限看片的www在线观看| 精品人妻1区二区| 亚洲狠狠婷婷综合久久图片| 日韩一卡2卡3卡4卡2021年| 午夜日韩欧美国产| 新久久久久国产一级毛片| 亚洲人成77777在线视频| 国产极品粉嫩免费观看在线| 国产精品野战在线观看 | 视频在线观看一区二区三区| 无限看片的www在线观看| 欧美人与性动交α欧美精品济南到| 热99re8久久精品国产| 人人妻人人澡人人看| 十分钟在线观看高清视频www| 久久久久国产一级毛片高清牌| 国产成人欧美在线观看| 两人在一起打扑克的视频| www国产在线视频色| 免费av中文字幕在线| 淫妇啪啪啪对白视频| 久久国产精品人妻蜜桃| 国产精品一区二区免费欧美| 真人做人爱边吃奶动态| 亚洲国产精品合色在线| 亚洲欧美激情在线| 亚洲 国产 在线| 亚洲国产精品999在线| 18禁国产床啪视频网站| 国产精品自产拍在线观看55亚洲| 久久精品成人免费网站| 亚洲五月婷婷丁香| 很黄的视频免费| 老司机午夜福利在线观看视频| 欧美另类亚洲清纯唯美| 校园春色视频在线观看| 国产成人精品久久二区二区免费| 欧美精品亚洲一区二区| 精品久久久久久,| 日本黄色日本黄色录像| 久久天躁狠狠躁夜夜2o2o| 国产亚洲欧美98| 啦啦啦在线免费观看视频4| 亚洲人成网站在线播放欧美日韩| 91成人精品电影| av有码第一页| 久久久久国内视频| 国产精品美女特级片免费视频播放器 | 黑人欧美特级aaaaaa片| 一级毛片女人18水好多| 午夜福利影视在线免费观看| 亚洲五月色婷婷综合| 欧美+亚洲+日韩+国产| 欧美黄色片欧美黄色片| 亚洲五月天丁香| 成人手机av| 国产黄色免费在线视频| www.www免费av| 国产成人一区二区三区免费视频网站| 91老司机精品| 亚洲va日本ⅴa欧美va伊人久久| 国产一区二区三区视频了| 男女下面进入的视频免费午夜 | 午夜老司机福利片| 久久久国产成人免费| 性少妇av在线| 伦理电影免费视频| 国产成人免费无遮挡视频| 免费在线观看视频国产中文字幕亚洲| 亚洲国产精品合色在线| 欧美日韩黄片免| 啦啦啦免费观看视频1| 另类亚洲欧美激情| 99精品欧美一区二区三区四区| 午夜福利在线免费观看网站| 最近最新中文字幕大全免费视频| 99国产精品一区二区蜜桃av| 国产精华一区二区三区| 国产成人av教育| 91麻豆av在线| 无限看片的www在线观看| 大型黄色视频在线免费观看| 天天躁狠狠躁夜夜躁狠狠躁| 琪琪午夜伦伦电影理论片6080| 国产精品久久久久久人妻精品电影| 免费看十八禁软件| 久久久国产成人精品二区 | 老司机在亚洲福利影院| 两性午夜刺激爽爽歪歪视频在线观看 | 热99国产精品久久久久久7| 久热爱精品视频在线9| av中文乱码字幕在线| 亚洲片人在线观看| 午夜福利在线免费观看网站| 国产成人精品久久二区二区91| 这个男人来自地球电影免费观看| 国产精品成人在线| 免费一级毛片在线播放高清视频 | 天天添夜夜摸| 国产精品永久免费网站| 精品电影一区二区在线| 啪啪无遮挡十八禁网站| 麻豆一二三区av精品| 亚洲自拍偷在线| 久久亚洲真实| 国产成人精品久久二区二区免费| 久久狼人影院| 久99久视频精品免费| 美国免费a级毛片| 日韩精品免费视频一区二区三区| 视频区图区小说| 久久久久国产精品人妻aⅴ院| 精品乱码久久久久久99久播| 亚洲欧美激情综合另类| 日韩中文字幕欧美一区二区| 国产精品自产拍在线观看55亚洲| www.精华液| 在线观看www视频免费| 亚洲中文av在线| 亚洲成国产人片在线观看| 国产精品99久久99久久久不卡| 国产一区二区三区综合在线观看| 国产亚洲欧美精品永久| 老汉色∧v一级毛片| 国产精品自产拍在线观看55亚洲| 丰满人妻熟妇乱又伦精品不卡| 欧美一区二区精品小视频在线| 免费女性裸体啪啪无遮挡网站| 黄色丝袜av网址大全| 亚洲全国av大片| 免费观看人在逋| 国产av一区在线观看免费| 悠悠久久av| 日本a在线网址| 欧美大码av| 欧美+亚洲+日韩+国产| 欧美在线一区亚洲| 国产aⅴ精品一区二区三区波| 国产精品99久久99久久久不卡| 午夜影院日韩av| 日韩欧美一区二区三区在线观看| 大陆偷拍与自拍| 别揉我奶头~嗯~啊~动态视频| 亚洲精品国产色婷婷电影| 午夜91福利影院| 悠悠久久av| 在线永久观看黄色视频| a在线观看视频网站| 一级毛片精品| 亚洲成人免费av在线播放| 国产精品久久久久久人妻精品电影| 国产精品永久免费网站| 一二三四在线观看免费中文在| 精品一品国产午夜福利视频| 国产精品日韩av在线免费观看 | 亚洲精品av麻豆狂野| 老熟妇仑乱视频hdxx| 国产亚洲欧美在线一区二区| 无人区码免费观看不卡| 国产精品乱码一区二三区的特点 | 亚洲男人天堂网一区| 最近最新免费中文字幕在线| 视频区图区小说| 欧美最黄视频在线播放免费 | 一二三四社区在线视频社区8| 性色av乱码一区二区三区2| 免费看十八禁软件| x7x7x7水蜜桃| 久久久久精品国产欧美久久久| 色播在线永久视频| 国产精品综合久久久久久久免费 | 99精品在免费线老司机午夜| 久久精品亚洲熟妇少妇任你| 久久欧美精品欧美久久欧美| 99在线人妻在线中文字幕| 国产精品成人在线| 熟女少妇亚洲综合色aaa.| av国产精品久久久久影院| 热99国产精品久久久久久7| 午夜影院日韩av| 国产亚洲欧美在线一区二区| 高清毛片免费观看视频网站 | 亚洲午夜理论影院| 一进一出抽搐gif免费好疼 | 国产高清国产精品国产三级| 九色亚洲精品在线播放| av欧美777| av超薄肉色丝袜交足视频| 亚洲欧美精品综合久久99| 国产成+人综合+亚洲专区| 国产深夜福利视频在线观看| 国产一区二区三区在线臀色熟女 | 欧美一区二区精品小视频在线| 天堂动漫精品| 老司机午夜十八禁免费视频| 咕卡用的链子| 午夜a级毛片| 日韩大码丰满熟妇| 国产精品电影一区二区三区| 久久久久久人人人人人| 在线免费观看的www视频| 日韩高清综合在线| 国产精品电影一区二区三区| 亚洲全国av大片| 欧美日韩乱码在线| 精品日产1卡2卡| 午夜两性在线视频| 成熟少妇高潮喷水视频| 人妻丰满熟妇av一区二区三区| 久久人人97超碰香蕉20202| 国产精品爽爽va在线观看网站 | 亚洲欧美精品综合一区二区三区| 国产又色又爽无遮挡免费看| 国产成人精品久久二区二区91| 亚洲第一欧美日韩一区二区三区| 又黄又粗又硬又大视频| 国产三级在线视频| 国产一区二区三区在线臀色熟女 | 亚洲第一av免费看| 91av网站免费观看| 日韩一卡2卡3卡4卡2021年| 久久久久精品国产欧美久久久| 黑人巨大精品欧美一区二区mp4| 国产精品二区激情视频| 精品无人区乱码1区二区| 国产成人精品久久二区二区免费| 色在线成人网| 一个人观看的视频www高清免费观看 | 欧美另类亚洲清纯唯美| 欧美日韩精品网址| 精品久久久久久,| 高清黄色对白视频在线免费看| 国产亚洲欧美98| 亚洲一区二区三区不卡视频| 久久国产乱子伦精品免费另类| 亚洲av第一区精品v没综合| 国产亚洲欧美精品永久| 久热爱精品视频在线9| 午夜免费观看网址| 一级作爱视频免费观看| 高潮久久久久久久久久久不卡| 亚洲成人久久性| 19禁男女啪啪无遮挡网站| 三级毛片av免费| 无限看片的www在线观看| 国产一区在线观看成人免费| 久久天躁狠狠躁夜夜2o2o| 久久青草综合色| 男女午夜视频在线观看| 母亲3免费完整高清在线观看| 淫妇啪啪啪对白视频| 韩国精品一区二区三区| 亚洲精品在线观看二区| 国产成年人精品一区二区 | 在线观看免费视频日本深夜| 一个人免费在线观看的高清视频| 高清在线国产一区| 午夜视频精品福利| 麻豆av在线久日| 日日摸夜夜添夜夜添小说| 亚洲欧美日韩无卡精品| 制服诱惑二区| 激情在线观看视频在线高清| 国产成人精品在线电影| 黑人猛操日本美女一级片| 午夜精品国产一区二区电影| 麻豆av在线久日| 黑人操中国人逼视频| 国产又色又爽无遮挡免费看| 成年人黄色毛片网站| 国产成人免费无遮挡视频| 村上凉子中文字幕在线| 久久久久久久精品吃奶| 日日爽夜夜爽网站| 一进一出好大好爽视频| 精品久久久久久电影网| 在线观看www视频免费| 亚洲七黄色美女视频| 91精品国产国语对白视频| 免费看a级黄色片| 真人一进一出gif抽搐免费| 亚洲一区中文字幕在线| 80岁老熟妇乱子伦牲交| 如日韩欧美国产精品一区二区三区| www日本在线高清视频| 久久久久久大精品| 成人18禁高潮啪啪吃奶动态图| 久久国产乱子伦精品免费另类| 69精品国产乱码久久久| 九色亚洲精品在线播放| 19禁男女啪啪无遮挡网站| 国内久久婷婷六月综合欲色啪| 新久久久久国产一级毛片| 日韩人妻精品一区2区三区| 久久国产亚洲av麻豆专区| av中文乱码字幕在线| av超薄肉色丝袜交足视频| 亚洲午夜理论影院| 久热这里只有精品99| 女警被强在线播放| 两性午夜刺激爽爽歪歪视频在线观看 | 黑人操中国人逼视频| 成人18禁在线播放| 亚洲色图av天堂| 久久精品aⅴ一区二区三区四区| 精品免费久久久久久久清纯| 大码成人一级视频| 欧美日韩av久久| 欧美在线黄色| 日韩人妻精品一区2区三区| 老司机福利观看| 999精品在线视频| 国产一区二区三区综合在线观看| 性欧美人与动物交配| 天堂俺去俺来也www色官网| 男女床上黄色一级片免费看| 免费在线观看亚洲国产| 亚洲专区字幕在线| 国产av一区二区精品久久| 热99re8久久精品国产| 老熟妇乱子伦视频在线观看| 久久久水蜜桃国产精品网| 成熟少妇高潮喷水视频| 国产一区二区三区视频了| 亚洲精品中文字幕一二三四区| 欧美久久黑人一区二区| 午夜免费成人在线视频| 99riav亚洲国产免费| 精品卡一卡二卡四卡免费| 午夜a级毛片| 日本wwww免费看| 九色亚洲精品在线播放| 亚洲av日韩精品久久久久久密| 男女高潮啪啪啪动态图| 91字幕亚洲| 视频在线观看一区二区三区| 国产精品久久久久成人av| 天堂动漫精品| www.熟女人妻精品国产| 自线自在国产av| 久久性视频一级片| 丰满饥渴人妻一区二区三| 一区二区三区精品91| 国产精品久久久久成人av| 欧美激情高清一区二区三区| 亚洲专区字幕在线| 一个人观看的视频www高清免费观看 | 亚洲免费av在线视频| 女人高潮潮喷娇喘18禁视频| 最新在线观看一区二区三区| 男人舔女人下体高潮全视频| 精品久久蜜臀av无| 日本 av在线| 日本三级黄在线观看| 国产精品国产av在线观看| 国内久久婷婷六月综合欲色啪| 午夜免费观看网址| 午夜免费鲁丝| 亚洲狠狠婷婷综合久久图片| 又黄又粗又硬又大视频| av超薄肉色丝袜交足视频| 亚洲专区国产一区二区| 欧美成狂野欧美在线观看| 欧美亚洲日本最大视频资源| x7x7x7水蜜桃| 亚洲国产精品sss在线观看 | 成人三级黄色视频| av网站在线播放免费| 亚洲精品久久成人aⅴ小说| 亚洲欧洲精品一区二区精品久久久| 欧美老熟妇乱子伦牲交| 啦啦啦在线免费观看视频4| 美女高潮到喷水免费观看| 亚洲av片天天在线观看| 51午夜福利影视在线观看| 精品福利观看| 一边摸一边抽搐一进一小说| 国产亚洲av高清不卡| 在线观看免费日韩欧美大片| 伊人久久大香线蕉亚洲五| 亚洲欧美激情综合另类| 一a级毛片在线观看| 多毛熟女@视频| 免费在线观看完整版高清| 高潮久久久久久久久久久不卡| 色综合站精品国产| 免费在线观看视频国产中文字幕亚洲| 1024视频免费在线观看| 免费在线观看影片大全网站| 亚洲欧美激情综合另类| 在线观看一区二区三区| 久久人人爽av亚洲精品天堂| 琪琪午夜伦伦电影理论片6080| 女人爽到高潮嗷嗷叫在线视频| 午夜亚洲福利在线播放| 国产xxxxx性猛交| 少妇的丰满在线观看| 美女午夜性视频免费| 国产激情久久老熟女| 男女下面进入的视频免费午夜 | 欧美在线一区亚洲| 超碰成人久久| 日韩视频一区二区在线观看| 亚洲情色 制服丝袜| 亚洲专区中文字幕在线| 亚洲人成电影观看| 老司机深夜福利视频在线观看| 亚洲精品国产精品久久久不卡| 午夜久久久在线观看| 午夜影院日韩av| 日本wwww免费看| 不卡一级毛片| 黄片大片在线免费观看| 又黄又爽又免费观看的视频| 88av欧美| 国产精品一区二区在线不卡| 一a级毛片在线观看| 在线av久久热| 亚洲av成人不卡在线观看播放网| 波多野结衣一区麻豆| 又紧又爽又黄一区二区| 大型av网站在线播放| av电影中文网址| 亚洲狠狠婷婷综合久久图片| 久久青草综合色| 日韩欧美三级三区| 国产精品一区二区在线不卡| 欧美黑人精品巨大| 欧洲精品卡2卡3卡4卡5卡区| 久久国产乱子伦精品免费另类| 美女 人体艺术 gogo| 99久久久亚洲精品蜜臀av| 日韩有码中文字幕| 丁香欧美五月| 国产精品一区二区免费欧美| 免费高清在线观看日韩| 一二三四在线观看免费中文在| 如日韩欧美国产精品一区二区三区| 99国产极品粉嫩在线观看| 少妇的丰满在线观看| 91麻豆精品激情在线观看国产 | av在线天堂中文字幕 | 51午夜福利影视在线观看| 在线观看66精品国产| av福利片在线| 日韩成人在线观看一区二区三区| 久久影院123| 露出奶头的视频| 日韩精品中文字幕看吧| 欧美成狂野欧美在线观看| 神马国产精品三级电影在线观看 | 国产一区二区三区综合在线观看| 国产亚洲精品一区二区www| 国产成人精品久久二区二区91| 久久久久久免费高清国产稀缺| 亚洲人成伊人成综合网2020| 久久精品国产亚洲av香蕉五月| 淫妇啪啪啪对白视频| 久久中文字幕一级| 国产视频一区二区在线看| 精品国产一区二区久久| av欧美777| 怎么达到女性高潮| 亚洲七黄色美女视频| 一区二区三区激情视频| 最新在线观看一区二区三区| 国产精品国产av在线观看| 黄片播放在线免费| 日本精品一区二区三区蜜桃| 亚洲欧美日韩高清在线视频| 91av网站免费观看| 国产视频一区二区在线看| 十八禁人妻一区二区| 亚洲欧美激情在线| 午夜老司机福利片| 日韩欧美一区二区三区在线观看| 黄色毛片三级朝国网站| 母亲3免费完整高清在线观看| 国产欧美日韩一区二区三区在线| 老司机福利观看| 久久精品影院6| 免费在线观看视频国产中文字幕亚洲| 香蕉国产在线看| 欧美av亚洲av综合av国产av| 丰满迷人的少妇在线观看| av在线天堂中文字幕 | 久久久久久久精品吃奶| 老汉色∧v一级毛片| 大码成人一级视频| 天堂动漫精品| 岛国在线观看网站| 麻豆国产av国片精品| 美女午夜性视频免费| av国产精品久久久久影院| 亚洲欧美一区二区三区黑人| 老司机靠b影院| 可以免费在线观看a视频的电影网站| 男女床上黄色一级片免费看| 亚洲自偷自拍图片 自拍| 嫁个100分男人电影在线观看| 午夜免费成人在线视频| 搡老乐熟女国产| 香蕉丝袜av| 亚洲欧美日韩另类电影网站| 操美女的视频在线观看| 国产一卡二卡三卡精品| 亚洲av片天天在线观看| 国产精品久久久久久人妻精品电影| 国产视频一区二区在线看| 青草久久国产| 天天躁夜夜躁狠狠躁躁| 后天国语完整版免费观看| 国产欧美日韩一区二区三区在线| bbb黄色大片| 亚洲欧美日韩无卡精品| 亚洲成国产人片在线观看| 久久久久亚洲av毛片大全| 国产亚洲欧美98| 色在线成人网| 久久久久久亚洲精品国产蜜桃av| 欧美av亚洲av综合av国产av| 精品日产1卡2卡| 国产精品国产av在线观看| 中文字幕最新亚洲高清| 深夜精品福利| 久久人人爽av亚洲精品天堂| 亚洲熟妇中文字幕五十中出 | 男女下面进入的视频免费午夜 | 欧美一级毛片孕妇| 日韩精品免费视频一区二区三区| 精品久久久久久成人av| 日本 av在线| 成人18禁在线播放| 国产一卡二卡三卡精品| 我的亚洲天堂| 天堂√8在线中文| 色播在线永久视频| 国产精品自产拍在线观看55亚洲| 在线国产一区二区在线| 丝袜美腿诱惑在线| www日本在线高清视频| 在线观看午夜福利视频| 亚洲三区欧美一区| 国产国语露脸激情在线看| av中文乱码字幕在线| 高清av免费在线| 久久天堂一区二区三区四区| 免费在线观看日本一区| 亚洲av电影在线进入| 色婷婷久久久亚洲欧美| 午夜福利在线观看吧| 亚洲成人久久性| 免费不卡黄色视频| 婷婷六月久久综合丁香| 精品一区二区三区av网在线观看| 亚洲精品国产精品久久久不卡| netflix在线观看网站| 日本a在线网址| 一边摸一边做爽爽视频免费| a在线观看视频网站| 日韩精品青青久久久久久| 可以免费在线观看a视频的电影网站| 在线永久观看黄色视频| av国产精品久久久久影院| 日本免费a在线| 又紧又爽又黄一区二区| 欧美日韩一级在线毛片| 午夜免费成人在线视频| 校园春色视频在线观看| 午夜福利,免费看| 看片在线看免费视频| 18禁美女被吸乳视频| 国产精品一区二区精品视频观看|