• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于事件異構(gòu)圖表示的文本去重算法

    2023-03-08 06:32:34艾瑋許佳謝燦豪孟濤
    關(guān)鍵詞:異構(gòu)標簽語義

    艾瑋,許佳,謝燦豪,孟濤

    (中南林業(yè)科技大學(xué) 計算機與信息工程學(xué)院,湖南 長沙 410018)

    隨著大數(shù)據(jù)時代網(wǎng)絡(luò)信息激增,擴展了人們獲取信息的渠道,有利于信息的傳播,但是隨之而來的是大量重復(fù)網(wǎng)絡(luò)信息,如何對大量且重復(fù)的網(wǎng)絡(luò)信息進行提煉是亟待解決的問題.其次,從當(dāng)前的網(wǎng)絡(luò)信息中可以得出,當(dāng)前網(wǎng)絡(luò)信息中需要分析、提煉的大部分是新聞文本.因此,對新聞文本展開文本去重研究是十分必要的,并且如何從冗余的數(shù)據(jù)中獲取需要的信息,是信息處理的首要任務(wù).

    當(dāng)前主流的去重方法,均是通過文本表示技術(shù)獲取文本的向量表示,再計算向量之間的相似度,從而判斷文本之間是否相似、重復(fù).而隨著詞向量、神經(jīng)網(wǎng)絡(luò)、預(yù)訓(xùn)練模型等技術(shù)的發(fā)展,研究者們不斷提出基于不同文本表示的文本去重算法,通過不同的文本表示方法可以將當(dāng)前的文本去重技術(shù)分為四類:經(jīng)典文本表示方法、分布式文本表示方法、上下文表示方法以及圖結(jié)構(gòu)表示方法.不同的文本表示方法,所獲取的文本信息也是不一樣的,而獲取的文本信息越多,文本相似度計算結(jié)果越準確,從而文本去重準確率越高,并且新聞文本的核心是其描述的事件,因此更多地獲取新聞文本描述的事件的語義信息,有利于提高文本去重的準確率.

    首先,在經(jīng)典的文本表示方法中主要有二值0-1、詞頻(Term Frequency,TF)、詞頻-逆文本頻率指數(shù)(Term Frequency–Inverse Document Frequency)等向量文本表示,經(jīng)典的文本表示方法能獲取淺層的文本語義[1].王誠等作者提出了基于TF-IDF 的Simhash大規(guī)模文本去重[2],該方法通過TF-IDF 技術(shù)篩選出文本的主題詞匯,再采取Simhash 算法,獲取文本的向量表示,該方法消除了大量的噪聲,能有效地進行大規(guī)模文本去重,同時也能保持Simhash的高效計算性能.但是經(jīng)典的文本表示方法只能獲取淺層的文本語義,無法獲取較深層次的語義信息及文本結(jié)構(gòu)信息,因此基于分布式假設(shè)理論的神經(jīng)網(wǎng)絡(luò)語言模型與分布式詞向量表示應(yīng)運而生.

    分布式文本表示方法主要有NNLM(Neural Net?work Language Model)[3]、Word2vec[4]、Glove[5]等,分布式文本表示方法能獲取詞語的局部上下文信息,增加了文本表示的語義含量.崔潔提出了進行加權(quán)處理的Word2vec 算法進行文本相似度計算[6],該研究考慮了詞語中的局部文本信息,也對詞語的位置信息進行考慮,結(jié)合余弦相似度得到最終的文本是否重復(fù)的信息.但是分布式文本表示方法存在文本多義詞以及未登錄詞(Out of Vocabulary,OOV)問題.于是研究者們針對上述問題,提出了基于上下文的文本表示方法.

    基于上下文的文本表示方法主要有ELMo(Em?bedding from Language Models)[7]、BERT(Bidirec?tional Encoder Representation from Transformers)[8]等模型,這些模型能解決分布式文本表示的相關(guān)問題,還能獲取文本序列的上下文信息.寧春妹提出了基于BERT 的文本相似度算法[9],利用BERT 進行文本表示,解決一詞多義的問題,在文本相似度上取得較好的結(jié)果.盡管目前使用最多的文本表示是基于上下文的文本表示方法,但是它忽略了文本的全局結(jié)構(gòu)信息,而圖結(jié)構(gòu)能夠很好地表示結(jié)構(gòu)信息,因此提出了基于圖結(jié)構(gòu)的文本表示方法.

    目前主要有兩種圖結(jié)構(gòu),分別是詞連通子圖結(jié)構(gòu)與事件連通子圖結(jié)構(gòu).二者均是通過將文本中的詞或者特征句當(dāng)作節(jié)點,并將詞或者特征句之間的關(guān)系構(gòu)建邊,得到最終的圖結(jié)構(gòu),通過圖結(jié)構(gòu)能夠?qū)⑽谋镜慕Y(jié)構(gòu)信息進行表示,豐富了文本表示的信息含量.劉銘等人提出了基于詞進行構(gòu)建篇章級事件表示的文本相似度方法[10],通過圖結(jié)構(gòu)將句子級事件進行連接,形成篇章級事件表示,能將事件內(nèi)部觸發(fā)詞與事件元素進行聯(lián)系,之后采取結(jié)合EM思想的TextRank 算法,計算得出文本的相似度.譚偉志等人提出了面向事件的文本表示方法計算文本相似度[11],該方法將特征句作為圖結(jié)構(gòu)的基本節(jié)點,特征句之間的關(guān)系作為邊,以此構(gòu)建事件語義網(wǎng)絡(luò)模型,之后采取PageRank算法,計算得出文本的相似度.

    基于圖結(jié)構(gòu)的文本表示方法中,對圖的表征除了采取PageRank 等算法,還有采取圖核算法的.蔣強榮等提出使用圖核算法對文本圖表示結(jié)構(gòu)表征[12],在計算表征后的向量的相似度得到文本相似度,通過圖核算法能更好地表征結(jié)構(gòu)信息,提高計算的準確率.左咪等提出的基于W-L 圖核算法的文本圖表示進行圖表征[13],利用W-L 圖核算法,能獲取圖的結(jié)構(gòu)信息并且能簡化圖計算的復(fù)雜度,有效提升了圖相似度計算的準確率及性能.雖然當(dāng)前基于圖結(jié)構(gòu)的文本表示已經(jīng)使得文本去重效果得到提升,并且采取的相關(guān)圖表征算法也有一定的效率及效果上的提升.但是,目前基于圖結(jié)構(gòu)的文本表示仍然存在一定的缺陷,無法對事件語義或者事件元素關(guān)系進行完整表示,并且當(dāng)前圖表征計算方法,不能獲取圖結(jié)構(gòu)信息或者不能對多種節(jié)點類型的圖進行完整表征.

    針對上述問題,本文以新聞文本為研究對象,根據(jù)新聞文本的核心內(nèi)容事件進行分析,提出基于事件異構(gòu)圖表示的文本去重算法,該算法首先采取事件異構(gòu)圖進行文本圖表示,事件異構(gòu)圖包含了事件實體、事件觸發(fā)詞、事件特征句三種節(jié)點類型,以及多種節(jié)點邊類型,通過事件異構(gòu)圖可以更好地表達出文本的各種信息.其次,為了更好地表征事件異構(gòu)圖,我們采取能夠獲取圖結(jié)構(gòu)信息及語義信息的圖核算法進行圖表征,但是當(dāng)前的圖核算法無法對異構(gòu)圖進行表征,所以本文提出雙標簽圖核算法表征異構(gòu)圖結(jié)構(gòu),通過標簽的信息迭代逐步對全部的節(jié)點信息進行表征,并且雙標簽圖核算法能降低圖計算的復(fù)雜度,達到提高去重的效果以及效率的目的.因此,基于事件異構(gòu)圖表示的文本去重算法能有效地提高文本去重算法的效率及效果.

    1 事件異構(gòu)圖

    在本節(jié)中,主要介紹構(gòu)建事件異構(gòu)圖的相關(guān)過程以及相關(guān)定義,主要包括事件抽取、關(guān)系識別、事件異構(gòu)圖定義及構(gòu)建.

    1.1 事件抽取

    事件是文本表示的最小語義單位,并且一篇文本中會存在多個事件語義單位[14],我們首先對事件進行如下定義:

    式中,E代表事件,W是事件的觸發(fā)詞,S是事件的特征句,C是事件的主要對象,O是事件的次要對象,T是事件發(fā)生的時間.

    我們選取Han 等人提出的中文新聞事件抽取算法[15]來完成本文的事件抽取.根據(jù)事件的定義,事件抽取的內(nèi)容主要包括事件的實體、觸發(fā)詞、時間、地點、事件句等元素.如給定一段文本信息,采取中文新聞事件抽取算法[15]得到圖1 所示的事件信息.從圖中可知,下畫線標記的句子是事件的特征句S,事件的實體對象C、O分別是“永安期貨”與“中信證券”,事件的觸發(fā)詞W為“龍頭企業(yè)”,事件的時間T為“1 月4 日”.其中,事件元組中的O與T可以是空的.

    圖1 事件抽取示例圖Fig.1 Event extraction example graph

    1.2 關(guān)系識別

    關(guān)系識別是當(dāng)前構(gòu)圖的關(guān)鍵部分,如何讓文本表示中的結(jié)構(gòu)信息更加豐富,是本文需要考慮的一個重要問題.我們采取兩種方法進行關(guān)系識別,第一種是馬彬等作者提出的基于事件依存線索的事件語義關(guān)系識別[16],第二種是楊竣輝等作者提出的基于語義事件因果關(guān)系識別[17],采取這兩種方法進行關(guān)系獲取,主要是由于目前事件關(guān)系的識別結(jié)果的準確率還有一定的提升空間,為了不過多引入噪聲,采取常用的因果關(guān)系識別,以及較為準確的事件語義依存線索進行其余的關(guān)系識別與關(guān)系新增.本文所包含的關(guān)系如表1所示.

    表1 關(guān)系表Tab.1 Relationship table

    例如,給定一個文本抽取后的三個事件,通過因果關(guān)系識別方法進行關(guān)系識別,得到如圖2 所示的關(guān)系.從圖中可以看出,三個事件的實體均是“永安期貨、中信證券”,將這三個事件分別表示為A、B、C,彼此之間存在兩種關(guān)系,分別是要素間因果關(guān)系、隱性因果關(guān)系.其中,因為A、B事件的要素“行業(yè)龍頭”引導(dǎo)了“估值溢價”要素發(fā)生,因此A、B 之間存在要素間因果關(guān)系.這些關(guān)系在構(gòu)圖的時候,能夠使得事件異構(gòu)圖的結(jié)構(gòu)更加完善,包含的信息更加豐富.

    圖2 關(guān)系識別示例圖Fig.2 Relationship recognition example graph

    1.3 事件異構(gòu)圖

    異構(gòu)圖的概念是包含多種節(jié)點類型、多種節(jié)點連接類型的圖,它能夠表達更多的信息.因此,本文提出基于事件構(gòu)建事件異構(gòu)圖進行文本表示,利用多種節(jié)點類型及節(jié)點連接類型表示文本的信息.定義如下所示.

    定義1事件異構(gòu)圖:在一篇新聞文本中,存在N個事件,并且N個事件之間存在M個關(guān)系,此時可以以事件為對象構(gòu)建事件異構(gòu)圖.如式(2)所示:

    式中,G代表事件異構(gòu)圖;V是事件異構(gòu)圖的節(jié)點集,包括三種類型的節(jié)點,分別是特征句S、觸發(fā)詞W,以及主要對象C與次要對象O;R是事件異構(gòu)圖的節(jié)點邊集,包含多種事件之間的關(guān)系以及事件元素之間的關(guān)系.具體表示如式(3)所示.

    式中,N代表存在多少個事件E,M代表存在多少個關(guān)系.從公式(3)中可以看出,如何將這些節(jié)點與關(guān)系進行連接并構(gòu)建圖是本文的關(guān)鍵.若按照一般的相似度、事件關(guān)系等進行連接,比如,特征句之間根據(jù)相似度連接,觸發(fā)詞根據(jù)相似度關(guān)系進行連接等,這些無法包含事件的語義特征,且圖之間的關(guān)系錯亂,節(jié)點本身的作用被隱藏,無法達到豐富語義的目的.

    因此,本文將特征句、觸發(fā)詞、事件實體構(gòu)建一個圖的具體模式結(jié)構(gòu)—Λ 結(jié)構(gòu),該結(jié)構(gòu)既能包含事件的語義特征,又能使得各種節(jié)點類型在圖中的結(jié)構(gòu)清晰明了,便于信息的傳遞.Λ結(jié)構(gòu)定義如下.

    定義2Λ 結(jié)構(gòu):當(dāng)事件以元組形式表示時,以事件特征句S為中心節(jié)點,將事件的實體C、O與事件的觸發(fā)詞W作為子節(jié)點,并連接到中心節(jié)點特征句S上,形成具體模式Λ結(jié)構(gòu).

    圖3(a)所展示的是事件已構(gòu)成的具體模式Λ 結(jié)構(gòu),圖3(b)所展示的是部分關(guān)系實例,圖3(c)是具體的事件異構(gòu)圖實例展示,其中包含5 個Λ 結(jié)構(gòu),各種節(jié)點之間存在著因果關(guān)系、時序關(guān)系等4 種關(guān)系、16條邊.

    圖3 事件異構(gòu)圖示意圖Fig.3 Schematic diagram of event heterogeneous graph

    1.4 構(gòu)建事件異構(gòu)圖

    通過上述小節(jié)的描述,我們可知,通過采取事件抽取、關(guān)系識別等技術(shù),獲取構(gòu)建圖的節(jié)點集V和R.在傳統(tǒng)的圖構(gòu)建方式中,是通過詞的權(quán)重篩選后進行無差別連接構(gòu)圖,或者通過事件的相似度進行構(gòu)圖,這兩種構(gòu)建方式均不能表示事件的句法信息,導(dǎo)致圖結(jié)構(gòu)表示不夠精準.

    而本文是通過事件的Λ 結(jié)構(gòu)構(gòu)圖,通過計算事件的Λ 結(jié)構(gòu)的相似度,能獲得事件之間的依存關(guān)系,更加精準地判別事件之間的相似關(guān)系.因此,事件的Λ結(jié)構(gòu)相似度的計算如式(4)所示:

    式中,Λ(Ea)、Λ(Eb)分別是事件Ea、Eb的Λ 結(jié)構(gòu)的向量表示.若相似度大于閾值U,則認為兩事件是相似的,反之則不相似.通過此我們可以將文本中描述相同事件的Λ 結(jié)構(gòu)連接,形成部分Λ 結(jié)構(gòu)連接子圖,減少關(guān)系識別的復(fù)雜度,增加事件異構(gòu)圖的結(jié)構(gòu)信息.

    最后,根據(jù)節(jié)點集R進行完整構(gòu)圖.本文主要存在如表1 所示的關(guān)系類型.其中,顯、隱性因果關(guān)系以及事件要素之間的因果關(guān)系,主要通過事件的元素進行分析,將事件間的因果關(guān)系轉(zhuǎn)換為更細粒度的事件元素之間的因果關(guān)系,同時還會考慮事件的時序關(guān)系,并不會同時存在多種關(guān)系.而依存關(guān)系根據(jù)的線索廣泛,兩事件之間會存在多種關(guān)系,因此,若通過依存關(guān)系識別后,實體依存關(guān)系、觸發(fā)詞依存關(guān)系、結(jié)構(gòu)依存關(guān)系均存在,此時我們并不將全部的關(guān)系進行連接,而是根據(jù)設(shè)定的關(guān)系優(yōu)先選取策略進行連接,依存關(guān)系選取策略為:實體依存關(guān)系>觸發(fā)詞依存關(guān)系>結(jié)構(gòu)依存關(guān)系.假如兩事件之間同時存在觸發(fā)詞依存關(guān)系、結(jié)構(gòu)依存關(guān)系,根據(jù)選取策略,僅選取觸發(fā)詞依存關(guān)系進行連接,這樣有利于減少圖結(jié)構(gòu)中關(guān)系的重復(fù)度.

    根據(jù)以上三個步驟,即可完成事件異構(gòu)圖的構(gòu)建,具體詳細流程見算法詳解.

    2 基于事件異構(gòu)圖表示的去重算法

    本節(jié)主要介紹本文提出的文本去重算法,首先介紹算法如何對事件異構(gòu)圖進行表征,其次介紹根據(jù)表征后的信息如何進行去重計算,最后介紹文本去重算法的全部流程及其偽代碼.

    2.1 事件異構(gòu)圖的表征

    當(dāng)前圖結(jié)構(gòu)表征采取的是非異構(gòu)圖表征算法,無法獲取圖結(jié)構(gòu)的語義信息,導(dǎo)致最終的信息有所缺失.圖核算法雖然能獲取圖的結(jié)構(gòu)信息與語義信息,但是也無法處理本文所提出的異構(gòu)圖結(jié)構(gòu).因此,本文提出了雙標簽圖核算法表征事件異構(gòu)圖的方法,該方法將只能對同構(gòu)圖表征的圖核算法[13],改進為對異構(gòu)圖表征的雙標簽圖核算法,該算法既能獲取圖的結(jié)構(gòu)與語義信息,又能對異構(gòu)圖實現(xiàn)表征.

    本文提出的雙標簽圖核算法表征方法,首先將Λ 結(jié)構(gòu)中的子節(jié)點轉(zhuǎn)變?yōu)闃撕炐畔⑦M行傳遞,而雙標簽也增加了信息的含量,提升了圖表征的信息含量.事件異構(gòu)圖的雙標簽圖核算法表征方法迭代流程圖如圖4 所示,下面我們將具體描述雙標簽圖核算法的迭代步驟,以及每個迭代步驟如何實現(xiàn)及其作用.

    首先,將多節(jié)點類型的事件異構(gòu)圖,轉(zhuǎn)變?yōu)閱晤愋?、雙標簽的圖結(jié)構(gòu).從事件異構(gòu)圖的定義可知,節(jié)點的類型存在三種,分別是特征句、實體、觸發(fā)詞,而事件異構(gòu)圖由具體的Λ 結(jié)構(gòu)組成.因此,將特征句當(dāng)作單節(jié)點,觸發(fā)詞以及實體當(dāng)作標簽,進行圖結(jié)構(gòu)的信息表征的基礎(chǔ)內(nèi)容.于是,我們采取公式(5),并根據(jù)事件節(jié)點的子節(jié)點實體及觸發(fā)詞的內(nèi)容,進行節(jié)點標簽初始化,得到如圖4中A步驟所示的節(jié)點的數(shù)字標簽集.

    式中,L是W、C的映射統(tǒng)一對象,F(xiàn)函數(shù)對相同的映射對象賦相同的標簽值,∑是一個標簽集,其大小是自然數(shù)集.在賦值時,通過函數(shù)F將不同的映射對象賦不同的標簽值,相同的映射對象賦予相同的標簽值.

    當(dāng)異構(gòu)圖的雙標簽賦值轉(zhuǎn)變完成后,此時存在兩個事件異構(gòu)圖G、G′,基于此我們開始展開雙標簽圖核的迭代流程.首先我們對節(jié)點標簽進行擴展,獲取鄰居節(jié)點信息,以當(dāng)前節(jié)點標簽開始,鄰居節(jié)點的標簽按照大小順序進行排序,形成節(jié)點的多集,如式(6)所示.

    其中,k代表節(jié)點j的鄰居節(jié)點個數(shù),如圖4 中的B 步驟所示,在事件異構(gòu)圖G中,原本節(jié)點標簽“2,2”的多集為“21,22”.

    圖4 雙標簽圖核算法迭代流程Fig.4 Iterative process of double label graph kernel algorithm

    當(dāng)節(jié)點標簽擴展完成后,對擴展的節(jié)點進行標簽壓縮,再次通過公式(5),接著上一次的標簽值繼續(xù)更新節(jié)點標簽,對相同的擴展標簽賦予相同的標簽值,不同的擴展標簽賦予不同的標簽值,如圖4 的步驟C所示,對G中的多集“21”賦予新標簽“5”,G′中的多集“21”也賦予相同的新標簽“5”,而G中的多集“1113”賦予新標簽“11”,G′中的“11113”賦予新的標簽“10”.

    將步驟C 獲得的新標簽對上一個圖的節(jié)點標簽進行更新.如圖4 的步驟D 所示,原始標簽為“1,2”,迭代后的標簽為“6,7”.通過公式(7)可得到每個標簽迭代后的一維向量.

    其中,∑*是當(dāng)前節(jié)點的標簽集合,φ函數(shù)是統(tǒng)計節(jié)點標簽的個數(shù),形成最終的一維向量.如圖4 中的E 步驟所示,得到四個標簽的一維向量φC(G)、φW(G)、φC(G′)、φW(G′).

    由于本文的標簽為兩個,因此每次迭代后所得到的圖一維向量為各個標簽的一維向量拼接,通過公式(8)形成最終的圖一維向量.

    其中,當(dāng)φ的下標為0 時,表示的是原始標簽的向量表示;當(dāng)φ的下標為i時,表示的是第i次迭代的標簽向量表示.

    最終,具體的雙標簽圖核算法步驟如表2所示.

    表2 雙標簽圖核算法Tab.2 Double label graph kernel algorithm

    2.2 文本相似度的計算

    本文提出的基于事件異構(gòu)圖表示的文本去重算法,首先對文本采取事件異構(gòu)圖的圖結(jié)構(gòu)表示后,對圖結(jié)構(gòu)進行表征,得到文本的向量.通過2.1小節(jié),我們可知圖表征采取的是基于雙標簽的圖核算法表征,而每次迭代循環(huán)均會得到新的圖表征信息,通過循環(huán)標簽壓縮迭代對圖進行表征,當(dāng)φi與φi-1相等時,意味著圖的信息擴展到最外層的信息,因此圖的標簽壓縮迭代停止.

    當(dāng)圖核算法每循環(huán)一次,圖核能獲取更多的信息,比如第一次節(jié)點標簽更新,包含了該節(jié)點的直接相鄰的節(jié)點的信息,而第二次迭代時新增了間隔為1的鄰居節(jié)點信息,以此類推,每次迭代所獲取的φ(Gi)與φ(G′i)向量是每次迭代更新的圖信息表征.因此,計算圖結(jié)構(gòu)之間的相似度,也就是計算圖表征過程中每次迭代所產(chǎn)生的向量的相似度.而每次迭代后所獲取的信息也會越來越多,于是當(dāng)計算圖的相似度時,隨著迭代次數(shù)增加,圖向量中會持續(xù)引入噪聲,導(dǎo)致最終的圖相似度計算結(jié)果存在偏差.

    因此,本文為了減少噪聲對相似度計算的影響,對不同迭代次數(shù)下的向量相似度給予不同的權(quán)重,這種方法將使得最終得到的相似度值更準確,減少了由引入其他信息而導(dǎo)致的相似度值減少.權(quán)重給予的方法如公式(9)所示.

    式中,h是圖迭代的總次數(shù),i是當(dāng)前迭代的次數(shù),i的最大值等于h.隨著迭代次數(shù)的增加,對應(yīng)的權(quán)重值逐漸減小.

    因此,最終的事件異構(gòu)圖文本相似度的計算公式如式(10)所示:

    最終,若通過公式(10)得出的相似度值大于或等于閾值Y,則兩事件異構(gòu)圖為相似的,即文本是相似的;反之則不相似.

    2.3 文本去重算法描述

    本文提出的基于事件異構(gòu)圖表示的文本去重算法的主要步驟如表3所示,簡稱HGW-L.本算法采取偽代碼的方式進行展示,具體見偽代碼的算法說明.

    表3 算法偽代碼Tab.3 Algorithm pseudocode

    算法說明:本算法的輸入為新聞文本數(shù)據(jù),以及本文所需的相似度閾值U、Y.從數(shù)據(jù)中選取需要執(zhí)行文本去重的兩篇數(shù)據(jù)Ta、Tb,首先我們進行第一部分操作,構(gòu)建事件異構(gòu)圖對文本進行表示,如表3 的4~8 行所示.文本表示完成后,我們展開第二部分即異構(gòu)圖的圖表征迭代過程,如表3 的10~19 行所示.文本表示及迭代過程完成后,最后是迭代向量的相似度計算步驟,如表3 中的21~33 行所示.最終HGW-L 算法的輸出為兩個事件異構(gòu)圖之間是否相似,當(dāng)輸出為1時則相似,輸出為0時則不相似.

    HGW-L 算法與之前的基于圖表示的文本去重算法相比,首先在構(gòu)圖上包含更多的文本信息含量,如表3 中的第一部分構(gòu)圖建邊所示,包含多重關(guān)系,能使得語義信息更加豐富.其次,能實現(xiàn)異構(gòu)圖的表征,并且包含圖的結(jié)構(gòu)與語義信息,有利于提升去重的效果.

    3 實驗分析

    在本小節(jié)中,我們將對本文提出的文本去重算法進行分析、比較,并在真實的數(shù)據(jù)集上驗證本文提出的文本去重算法的效果.

    3.1 數(shù)據(jù)集及評估指標

    由于文本去重領(lǐng)域沒有公開的測試集,因此我們從新聞文本數(shù)據(jù)集(搜狗語料、今日頭條語料)中分別隨機取出大小不同的數(shù)據(jù)集進行效果檢測,并對這些數(shù)據(jù)進行人工標注,確定數(shù)據(jù)的重復(fù)標簽.數(shù)據(jù)集具體的大小劃分如表4所示.

    表4 數(shù)據(jù)集信息Tab.4 DataSet information

    文本去重的本質(zhì)是查找重復(fù)和非重復(fù)的數(shù)據(jù)的能力,因此本文主要采取精確率、召回率、以及F1值三個評估指標對文本去重方法進行評估,下面將詳細介紹評估指標的計算公式.

    去重的精確率反映文本去重方法計算的準確程度,是一個重要的評價標準.準確率Pre 的計算方法如公式(11)所示:

    召回率反映去重的范圍的覆蓋面.召回率Rec的計算方法如公式(12)所示:

    式中,x代表人工標注為重復(fù)且去重算法計算得出的重復(fù)標記一致的個數(shù),y代表人工標注為重復(fù)且去重算法計算得出的重復(fù)標記不一致的個數(shù),z代表人工標注為非重復(fù)且去重算法計算得出的重復(fù)標記一致的個數(shù).

    F1值即準確率和召回率的調(diào)和平均值,計算方法如公式(13)所示:

    3.2 相似度閾值實驗分析

    本文的閾值選取有兩個,第一個是事件的Λ 結(jié)構(gòu)相似度閾值U,第二個是事件異構(gòu)圖相似度閾值Y.本節(jié)將通過實驗選取閾值U、Y的最佳值.

    3.2.1 相似度閾值U選取實驗

    相似度閾值U是圖構(gòu)建的重要步驟之一,通過判斷Λ結(jié)構(gòu)的相似度,識別出相似關(guān)系并進行連接構(gòu)圖;不同的相似度閾值U會影響事件之間的相似度準確率,越準確的相似度值越能使得事件異構(gòu)圖中相似的信息聚集,使得異構(gòu)圖中的關(guān)系更加準確,便于后續(xù)的圖信息表示.在本文的數(shù)據(jù)集下進行實驗,實驗結(jié)果如圖5所示.

    在圖5 中,橫坐標代表不同的閾值U,閾值的取值范圍為0.40~0.80,縱坐標代表不同閾值U下實驗對應(yīng)的F1值,此時的閾值Y設(shè)定為0.60.從圖5 的(a)與(b)中我們可以看出,當(dāng)閾值U的取值范圍為0.60~0.70 時,實驗的F1值相對穩(wěn)定并且能取得較好的效果.從圖中可以看出,頭條數(shù)據(jù)集的實驗效果相對低于搜狗數(shù)據(jù)集,這是由于頭條數(shù)據(jù)集中的新聞的類型涵蓋面更廣闊,存在一定的效果差距.最終本文在后續(xù)實驗中,選取0.65 作為相似度閾值U的實驗值.

    圖5 相似度閾值U實驗結(jié)果圖Fig.5 The similarity threshold U experiment result graph

    3.2.2 相似度閾值Y選取實驗

    相似度閾值Y是判斷去重的主要依據(jù),通過判斷事件異構(gòu)圖之間的相似度值是否在設(shè)定閾值區(qū)間范圍內(nèi),從而判斷出文本是否重復(fù).我們從不同的數(shù)據(jù)集類型以及大小中展開實驗,得到如圖6 所示的結(jié)果,其中,橫坐標代表不同的閾值Y,閾值的取值范圍為0.40~0.80,縱坐標代表不同閾值Y下實驗對應(yīng)的F1值.

    從圖6的(a)與(b)中可以得出,當(dāng)閾值Y的取值范圍為0.55~0.65 時,算法在搜狗數(shù)據(jù)集與頭條數(shù)據(jù)集上的效果均達到較好的值.取值范圍之外的Y值,算法的F1值均有所下降.故本文的相似度閾值Y設(shè)定為0.6,此時的HGW-L 文本去重算法的F1值在搜狗數(shù)據(jù)集上能達到0.9以上.

    圖6 相似度閾值Y實驗結(jié)果圖Fig.6 The similarity threshold Y experiment result graph

    3.3 對比實驗選取

    本文是基于事件異構(gòu)圖表示的文本去重計算,因此我們將選取基于圖結(jié)構(gòu)的文本去重方法,以及其余基于分布式向量和上下文的文本表示方法的去重算法,形成多方面的對比,驗證本算法的可行性以及準確性.我們選取了五種去重方法進行對比試驗,如表5所示.

    表5 對比實驗選取表Tab.5 The comparison experiment selection table

    首先,根據(jù)本文采取的文本表示方法,選取同類型的對比算法,即采取圖表示的文本去重算法,主要有E-TC 算法與T-C 算法.其中,E-TC 算法是基于篇章級事件圖的去重方法[10],首先采取事件實體以及事件觸發(fā)詞構(gòu)圖,然后使用基于EM 思想的TextRank算法計算圖,再結(jié)合余弦相似度得到最終文本的相似度.T-C 算法是基于事件連通圖的去重方法[11],該方法采取的是以詞為節(jié)點進行建圖,再基于PageR?ank算法進行計算,最終結(jié)合余弦相似度得到最終文本的相似度.

    其次選取能獲取文本上下文信息的文本表示方法,有B-R 算法與B-L 算法,其中B-R 算法是基于BERT 進行文本表示的[18],B-L 算法是基于Bi-LSTM進行文本表示的[19],這兩種方法均直接進行文本向量轉(zhuǎn)換,再對向量進行相似度計算從而得到最終的文本重復(fù)標簽.

    最后,我們還選取了基于分布式表示的去重方法,該算法采取的文本表示方式是當(dāng)前使用較多的,有較好的去重效果,因此本文設(shè)計了該類型的對比試驗.W-V 算法采取基于加權(quán)的Word2vec[6],通過Word2vec 算法對文本進行向量表示,結(jié)合余弦相似度計算并得到文本的相似性.

    這五種方法從不同的去重角度、去重效率等方面進行選取,是符合多角度的實驗對比分析的,通過最終的結(jié)果能更好地驗證本文提出的文本去重算法的效果及效率.

    3.4 實驗結(jié)果及分析

    本小節(jié)將選取的五種對比算法與本文所提出的方法,在不同大小、不同類型的新聞數(shù)據(jù)集上進行驗證,并對本文提出的文本去重算法的效果及性能進行驗證與分析.

    3.4.1 效果分析

    首先,我們將六種算法分別在不同的類型數(shù)據(jù)集以及不同數(shù)據(jù)大小下進行實驗,并根據(jù)本文的評估指標得到圖7所示的結(jié)果.

    由圖7 實驗結(jié)果可得,本文所提出的HGW-L 算法,在兩個不同來源、大小的數(shù)據(jù)集上的結(jié)果均優(yōu)于其他五種去重算法,其中T-C 算法的效果最差,ETC 算法、B-R 算法、B-L 算法、W-V 算法的效果僅次于我們所提出的HGW-L算法.

    圖7 對比算法實驗結(jié)果圖Fig.7 Comparison algorithm experiment result graph

    其中,E-TC 算法能獲取文章的結(jié)構(gòu)信息,但是忽略了事件的句法信息,如果是相同的特征詞及實體,當(dāng)出現(xiàn)不同的句法表示存在區(qū)別時,無法判斷出兩者不相似,因此其效果僅次于我們所提出的算法.而B-L 算法、B-R 算法與W-V 算法,通過使用Bi-LSTM、BERT以及加權(quán)的Word2vec算法,能獲取短語或者事件的上下文關(guān)系,能得到較為豐富的文本語義信息,但是無法對文本的結(jié)構(gòu)信息進行全局分析,獲取的結(jié)構(gòu)信息存在局部缺陷,因此整體結(jié)果相比而言較差.而T-C 算法通過構(gòu)建詞語連通子圖的文本表示,基于PageRank 算法,獲取的文本語義信息較差,忽略了詞語的上下文關(guān)系,無法對不同語境下的事件進行區(qū)分,雖然是基于圖結(jié)構(gòu)的文本表示,但是在去重上的效果較差.而本文提出的HGW-L 算法,通過多種節(jié)點類型以及節(jié)點連接類型獲取更多的語義信息及結(jié)構(gòu)信息,再通過雙標簽圖核算法獲取精準的圖表征,使得最終的相似度值的含義更加準確,達到當(dāng)前最優(yōu)F1值.

    因此,本文所提出的方法在新聞文本數(shù)據(jù)上能實現(xiàn)更準確的去重,提升了去重算法的效果.

    3.4.2 性能分析

    由于事件抽取、關(guān)系識別以及構(gòu)圖等步驟對文本的性能有一定的影響.因此,本文的性能分析從不同的組別進行實驗分析,分別是包含了事件抽取、關(guān)系識別等任務(wù)的運行時間分析,以及不包含前期處理、直接構(gòu)圖的運行時間分析.均在本文的數(shù)據(jù)集上進行實驗,得到了圖8中的兩組實驗對比結(jié)果.

    圖8 對比算法性能結(jié)果圖Fig.8 Comparison algorithm performance results

    在圖8 中,子圖(a)、(b)是本文提出的算法與對比算法分別在兩個數(shù)據(jù)集上的消耗時間對比,由于本文的算法與E-TC、T-C 算法同屬于基于圖表示的算法,因此在這段時間計算中,我們僅從基于事件或者文本開始構(gòu)圖計算,并不包含文本的事件抽取、實體識別等任務(wù);子圖(c)、(d)與子圖(a)、(b)的不同之處在于,將事件抽取、實體識別、關(guān)系識別等任務(wù)的時間均包含到總運行時間,從圖中可以看出,新增的不同樣式的柱狀圖是這些任務(wù)的運行時間.

    從子圖(a)、(b)中我們可以看出,處理相同數(shù)據(jù)量時,性能最差的是基于BERT 的B-R 算法與基于Bi-LSTM 的B-L 算法,性能最好的是本文提出的HGW-L 算法,并且能迅速處理完成,而另外兩個基于圖結(jié)構(gòu)的E-TC、T-C 算法的性能與基于Word2vec算法性能保持中等并且相差不大.本文提出的HGW-L 去重算法,由于采取雙標簽圖核算法,計算的性能為線性級,能保持較高的性能水準.而B-R、B-L 算法,需要對上下文進行處理,存在一定的計算消耗,因此處理時間較差.

    從子圖(c)、(d)中我們可以看出,當(dāng)增加了事件抽取、關(guān)系識別等任務(wù)的處理時間后,基于圖的去重算法性能優(yōu)勢減少.此時最佳性能算法為W-V 算法,該算法通過詞向量的處理,能較快速地實現(xiàn)去重計算過程,而效果最差的是基于圖表示的E-TC 算法,篇章及事件構(gòu)造需要識別更多的內(nèi)容,對文本的前期處理更加復(fù)雜,因此算法運行時間隨著數(shù)據(jù)的增加而增加,導(dǎo)致性能最差.

    因此,雖然本文在包括文本處理的時間后,性能不是最佳的,但是從整體上看,本算法的性能還是優(yōu)于其余算法,并且能對處理后的文本進行快速去重.

    4 總結(jié)及展望

    本算法是針對新聞文本的去重算法.在對目前新聞文本去重研究現(xiàn)狀進行分析后,我們針對當(dāng)前新聞文本去重存在的語義表示不完善、效率較低等問題,提出基于事件異構(gòu)圖表示的文本去重方法,該方法首先采取事件異構(gòu)圖的文本圖表示方法.可以獲取更多的語義信息,提高去重計算的準確率.其次,通過提出雙標簽圖核算法表征方法,對事件異構(gòu)圖進行表征,能高質(zhì)量且高效地獲取圖的結(jié)構(gòu)與語義信息.最后,我們在真實數(shù)據(jù)集上進行了對比實驗分析,實驗結(jié)果證明,本算法在真實數(shù)據(jù)集上的效果均優(yōu)于對比算法,并在其余算法性能對比中,運行效率有所優(yōu)化.

    然而,當(dāng)前去重計算較為冗余,盡管采取圖核算法能減少圖計算的復(fù)雜度,能提升去重算法的性能,但是進一步減少冗余計算,能使得本算法在大數(shù)據(jù)環(huán)境下快速計算.因此,我們后續(xù)計劃對算法的去重計算次數(shù)進行優(yōu)化,減少重復(fù)迭代計算次數(shù),提高去重算法的性能.

    猜你喜歡
    異構(gòu)標簽語義
    試論同課異構(gòu)之“同”與“異”
    語言與語義
    無懼標簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    overlay SDN實現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
    “上”與“下”語義的不對稱性及其認知闡釋
    標簽化傷害了誰
    LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
    基于多進制查詢樹的多標簽識別方法
    計算機工程(2015年8期)2015-07-03 12:20:27
    認知范疇模糊與語義模糊
    久久久久国内视频| 又黄又粗又硬又大视频| 日韩中文字幕欧美一区二区| 婷婷精品国产亚洲av在线| 在线视频色国产色| 天堂动漫精品| 高清毛片免费观看视频网站| 午夜成年电影在线免费观看| 免费在线观看视频国产中文字幕亚洲| 男人舔女人的私密视频| АⅤ资源中文在线天堂| 成年人黄色毛片网站| 狂野欧美激情性xxxx| 欧美最黄视频在线播放免费| 在线观看免费视频日本深夜| 欧美在线黄色| 精品免费久久久久久久清纯| 成人国语在线视频| 香蕉久久夜色| 女人高潮潮喷娇喘18禁视频| 麻豆国产97在线/欧美 | 在线观看日韩欧美| 国产aⅴ精品一区二区三区波| 免费在线观看视频国产中文字幕亚洲| 亚洲成人精品中文字幕电影| 久久中文字幕人妻熟女| av片东京热男人的天堂| 亚洲午夜理论影院| 男人舔女人的私密视频| 欧美日韩中文字幕国产精品一区二区三区| 两性夫妻黄色片| 99热这里只有精品一区 | 精品一区二区三区av网在线观看| 久久香蕉精品热| av在线播放免费不卡| 88av欧美| 丰满人妻一区二区三区视频av | 久久天躁狠狠躁夜夜2o2o| 亚洲av第一区精品v没综合| 免费看美女性在线毛片视频| 变态另类丝袜制服| 亚洲国产欧美人成| 久久人妻福利社区极品人妻图片| 日本a在线网址| 免费搜索国产男女视频| 免费在线观看黄色视频的| 亚洲一区高清亚洲精品| 久久久精品大字幕| 国产亚洲精品av在线| 在线十欧美十亚洲十日本专区| 一边摸一边做爽爽视频免费| 999久久久国产精品视频| 亚洲成人中文字幕在线播放| 丰满人妻一区二区三区视频av | 亚洲人成网站高清观看| 亚洲最大成人中文| 麻豆久久精品国产亚洲av| 男女床上黄色一级片免费看| 欧美乱妇无乱码| 日本一本二区三区精品| 久久久久久人人人人人| 国内毛片毛片毛片毛片毛片| 欧洲精品卡2卡3卡4卡5卡区| 99久久99久久久精品蜜桃| 国产一区二区三区视频了| 欧美日韩国产亚洲二区| 中亚洲国语对白在线视频| 欧美日韩福利视频一区二区| 亚洲精品av麻豆狂野| 日韩国内少妇激情av| 亚洲av五月六月丁香网| 日本黄色视频三级网站网址| 国产又色又爽无遮挡免费看| 黄色视频不卡| 成人午夜高清在线视频| 精品熟女少妇八av免费久了| 精品一区二区三区av网在线观看| 国产精品亚洲美女久久久| 黑人巨大精品欧美一区二区mp4| 12—13女人毛片做爰片一| av天堂在线播放| 国产主播在线观看一区二区| АⅤ资源中文在线天堂| 在线观看美女被高潮喷水网站 | 午夜福利免费观看在线| 日本a在线网址| 国模一区二区三区四区视频 | 国产精品一区二区免费欧美| ponron亚洲| videosex国产| 精品日产1卡2卡| 老熟妇乱子伦视频在线观看| 少妇被粗大的猛进出69影院| 亚洲人成电影免费在线| 91在线观看av| 国内精品久久久久久久电影| 法律面前人人平等表现在哪些方面| 亚洲一区二区三区不卡视频| 欧美黑人精品巨大| 最近在线观看免费完整版| 国产精品电影一区二区三区| 麻豆成人av在线观看| 男人舔奶头视频| 露出奶头的视频| 亚洲aⅴ乱码一区二区在线播放 | 五月玫瑰六月丁香| 后天国语完整版免费观看| 国产激情偷乱视频一区二区| av国产免费在线观看| 亚洲国产精品成人综合色| svipshipincom国产片| 午夜两性在线视频| 国产精品自产拍在线观看55亚洲| 丰满人妻熟妇乱又伦精品不卡| 精品少妇一区二区三区视频日本电影| 久久久久久久午夜电影| 亚洲avbb在线观看| 一区二区三区高清视频在线| 亚洲精品中文字幕一二三四区| 亚洲精品国产一区二区精华液| 在线观看免费视频日本深夜| 舔av片在线| 性欧美人与动物交配| 欧美乱色亚洲激情| 久久久久久久久久黄片| 日本撒尿小便嘘嘘汇集6| 岛国在线观看网站| 亚洲熟妇中文字幕五十中出| 可以免费在线观看a视频的电影网站| 在线十欧美十亚洲十日本专区| 丰满的人妻完整版| 国内精品久久久久久久电影| 亚洲欧美精品综合一区二区三区| 欧美一区二区国产精品久久精品 | 91字幕亚洲| 极品教师在线免费播放| 久久午夜综合久久蜜桃| 99久久久亚洲精品蜜臀av| 视频区欧美日本亚洲| 久久久久国产一级毛片高清牌| 亚洲专区国产一区二区| videosex国产| 级片在线观看| 久久久久久九九精品二区国产 | 真人做人爱边吃奶动态| 波多野结衣巨乳人妻| 麻豆av在线久日| 在线看三级毛片| 最新美女视频免费是黄的| 久久精品亚洲精品国产色婷小说| 一区二区三区激情视频| 午夜影院日韩av| 丰满的人妻完整版| 久久精品综合一区二区三区| 免费看十八禁软件| 国产97色在线日韩免费| 啦啦啦观看免费观看视频高清| 激情在线观看视频在线高清| 亚洲成人免费电影在线观看| 日韩欧美精品v在线| 亚洲狠狠婷婷综合久久图片| 国产欧美日韩一区二区精品| 精品久久久久久久久久久久久| 在线观看66精品国产| 天堂动漫精品| 欧美极品一区二区三区四区| 免费在线观看影片大全网站| 人成视频在线观看免费观看| 欧美一级a爱片免费观看看 | 三级毛片av免费| 婷婷亚洲欧美| 免费高清视频大片| 熟女少妇亚洲综合色aaa.| 久久久久久免费高清国产稀缺| 最近视频中文字幕2019在线8| 校园春色视频在线观看| 国产三级中文精品| 日本一二三区视频观看| 久久久久久久久中文| 亚洲片人在线观看| 日本撒尿小便嘘嘘汇集6| 国产精品99久久99久久久不卡| 亚洲精品美女久久av网站| 首页视频小说图片口味搜索| 久久香蕉精品热| 91成年电影在线观看| 人妻久久中文字幕网| 国产高清videossex| 亚洲avbb在线观看| 国产99久久九九免费精品| 激情在线观看视频在线高清| 91字幕亚洲| 天堂动漫精品| 中亚洲国语对白在线视频| 久久久久久亚洲精品国产蜜桃av| 在线国产一区二区在线| av在线播放免费不卡| tocl精华| 亚洲精品一卡2卡三卡4卡5卡| 亚洲精品国产精品久久久不卡| 精品欧美一区二区三区在线| 亚洲国产高清在线一区二区三| 91成年电影在线观看| 日本三级黄在线观看| ponron亚洲| 国产精品久久久久久人妻精品电影| 黄色a级毛片大全视频| 国产野战对白在线观看| 麻豆国产av国片精品| 免费在线观看视频国产中文字幕亚洲| av有码第一页| 高清在线国产一区| 少妇人妻一区二区三区视频| 18禁黄网站禁片午夜丰满| 亚洲色图av天堂| 亚洲国产欧美人成| 男女那种视频在线观看| 神马国产精品三级电影在线观看 | 老鸭窝网址在线观看| 草草在线视频免费看| 叶爱在线成人免费视频播放| 1024手机看黄色片| 中文字幕久久专区| 国产一区二区三区视频了| 亚洲国产看品久久| 视频区欧美日本亚洲| 国产精品美女特级片免费视频播放器 | 天天躁狠狠躁夜夜躁狠狠躁| 国内毛片毛片毛片毛片毛片| 在线观看日韩欧美| 国内精品久久久久精免费| 国产一级毛片七仙女欲春2| 在线永久观看黄色视频| 又大又爽又粗| 观看免费一级毛片| 少妇粗大呻吟视频| 高清毛片免费观看视频网站| 久久久久国产精品人妻aⅴ院| 长腿黑丝高跟| 欧美极品一区二区三区四区| 色在线成人网| 1024手机看黄色片| 国语自产精品视频在线第100页| a级毛片a级免费在线| 观看免费一级毛片| 国产精品久久久人人做人人爽| 免费在线观看成人毛片| 日韩欧美 国产精品| 中亚洲国语对白在线视频| 亚洲成av人片在线播放无| 国产精品免费一区二区三区在线| 午夜成年电影在线免费观看| 国产真人三级小视频在线观看| 久99久视频精品免费| 国语自产精品视频在线第100页| 国产一区二区三区在线臀色熟女| 丁香六月欧美| 长腿黑丝高跟| 91老司机精品| 久久这里只有精品中国| 久久草成人影院| 国内少妇人妻偷人精品xxx网站 | 精品一区二区三区av网在线观看| 国产精品久久久久久精品电影| 女人被狂操c到高潮| 999精品在线视频| 亚洲国产欧美一区二区综合| 又黄又爽又免费观看的视频| 制服丝袜大香蕉在线| 日日摸夜夜添夜夜添小说| 国产精品av视频在线免费观看| 成年免费大片在线观看| 好男人电影高清在线观看| 国模一区二区三区四区视频 | 丁香欧美五月| 久久久国产成人精品二区| 99久久久亚洲精品蜜臀av| 18美女黄网站色大片免费观看| 特级一级黄色大片| 天天添夜夜摸| 精品高清国产在线一区| 国产三级黄色录像| 国产激情久久老熟女| 日韩国内少妇激情av| 亚洲第一电影网av| 亚洲av电影不卡..在线观看| 手机成人av网站| 免费电影在线观看免费观看| 国内精品久久久久久久电影| 欧美乱色亚洲激情| avwww免费| 俺也久久电影网| 久久人妻av系列| 老熟妇乱子伦视频在线观看| 亚洲,欧美精品.| 亚洲成av人片免费观看| 久久热在线av| 一级黄色大片毛片| 中文字幕人妻丝袜一区二区| 久99久视频精品免费| 好看av亚洲va欧美ⅴa在| 在线视频色国产色| 免费人成视频x8x8入口观看| 校园春色视频在线观看| 成人高潮视频无遮挡免费网站| 在线观看一区二区三区| 大型av网站在线播放| 免费高清视频大片| 丝袜人妻中文字幕| 久久久久免费精品人妻一区二区| 国产又色又爽无遮挡免费看| 男插女下体视频免费在线播放| 在线观看舔阴道视频| 久久精品国产清高在天天线| 在线观看日韩欧美| 一本综合久久免费| 香蕉av资源在线| 国产亚洲欧美98| av福利片在线观看| 亚洲精品美女久久久久99蜜臀| 亚洲欧美激情综合另类| 757午夜福利合集在线观看| 久久精品aⅴ一区二区三区四区| 一边摸一边抽搐一进一小说| 亚洲欧洲精品一区二区精品久久久| 亚洲av五月六月丁香网| 国产欧美日韩精品亚洲av| 性欧美人与动物交配| 午夜激情av网站| 免费在线观看完整版高清| 久久久国产成人免费| 韩国av一区二区三区四区| 在线视频色国产色| 国产精品久久久久久人妻精品电影| 亚洲人成网站高清观看| 伊人久久大香线蕉亚洲五| а√天堂www在线а√下载| 国产精品永久免费网站| 国产精品久久久人人做人人爽| 欧美日韩亚洲国产一区二区在线观看| 日韩精品免费视频一区二区三区| 午夜成年电影在线免费观看| 国产精品久久久人人做人人爽| 亚洲国产中文字幕在线视频| 久久99热这里只有精品18| 亚洲精品国产一区二区精华液| av国产免费在线观看| 又爽又黄无遮挡网站| 午夜福利18| 免费在线观看亚洲国产| 久久人人精品亚洲av| 亚洲欧美激情综合另类| 精品久久久久久,| 两人在一起打扑克的视频| 97碰自拍视频| 成年免费大片在线观看| 丁香欧美五月| 亚洲国产中文字幕在线视频| 一区福利在线观看| 亚洲欧洲精品一区二区精品久久久| 黄色女人牲交| 国产又黄又爽又无遮挡在线| 一进一出好大好爽视频| 国产精品一区二区免费欧美| 亚洲熟妇熟女久久| 中文字幕高清在线视频| 久久久久久大精品| 国产精品永久免费网站| 欧美不卡视频在线免费观看 | 国产三级中文精品| 国产亚洲精品久久久久5区| 法律面前人人平等表现在哪些方面| 亚洲国产高清在线一区二区三| av在线天堂中文字幕| 99热这里只有精品一区 | 一本大道久久a久久精品| 99re在线观看精品视频| 国产欧美日韩一区二区精品| 好看av亚洲va欧美ⅴa在| 亚洲,欧美精品.| 亚洲成a人片在线一区二区| 亚洲专区国产一区二区| 19禁男女啪啪无遮挡网站| 成年女人毛片免费观看观看9| 一边摸一边做爽爽视频免费| 黄色视频不卡| 亚洲国产中文字幕在线视频| 午夜免费观看网址| 精品久久久久久久久久免费视频| 国产精品九九99| 日日爽夜夜爽网站| 99精品欧美一区二区三区四区| 可以免费在线观看a视频的电影网站| 两个人的视频大全免费| 两性午夜刺激爽爽歪歪视频在线观看 | 一区福利在线观看| 好男人在线观看高清免费视频| 亚洲精品av麻豆狂野| 巨乳人妻的诱惑在线观看| 俺也久久电影网| 国产亚洲精品av在线| 久久婷婷人人爽人人干人人爱| 给我免费播放毛片高清在线观看| 国产亚洲精品一区二区www| 欧美黄色片欧美黄色片| 97超级碰碰碰精品色视频在线观看| 婷婷精品国产亚洲av| 国产一区二区在线av高清观看| 美女 人体艺术 gogo| 精品不卡国产一区二区三区| 久久中文字幕一级| 午夜日韩欧美国产| 亚洲七黄色美女视频| 亚洲色图av天堂| 又大又爽又粗| ponron亚洲| 欧美色欧美亚洲另类二区| 亚洲乱码一区二区免费版| 久久精品国产99精品国产亚洲性色| 美女大奶头视频| 国产成人啪精品午夜网站| 国产精品久久久人人做人人爽| 两个人看的免费小视频| 琪琪午夜伦伦电影理论片6080| 亚洲成人久久性| 91成年电影在线观看| 国产成+人综合+亚洲专区| 两个人视频免费观看高清| av免费在线观看网站| 91国产中文字幕| 欧美一区二区精品小视频在线| 久久久精品国产亚洲av高清涩受| 丁香欧美五月| 亚洲天堂国产精品一区在线| 亚洲精品美女久久av网站| 日韩欧美在线乱码| 欧美zozozo另类| 国产亚洲av高清不卡| 后天国语完整版免费观看| 大型黄色视频在线免费观看| 老司机午夜福利在线观看视频| 两个人免费观看高清视频| 日本一本二区三区精品| 国产精品爽爽va在线观看网站| 亚洲自偷自拍图片 自拍| 欧美黑人巨大hd| 亚洲电影在线观看av| 可以在线观看的亚洲视频| 国产男靠女视频免费网站| 人妻久久中文字幕网| 91麻豆精品激情在线观看国产| 国产成人av激情在线播放| 视频区欧美日本亚洲| 欧美 亚洲 国产 日韩一| 18美女黄网站色大片免费观看| 色哟哟哟哟哟哟| 国产成人一区二区三区免费视频网站| 国产在线观看jvid| 91大片在线观看| 亚洲中文av在线| 搞女人的毛片| 午夜影院日韩av| 中出人妻视频一区二区| 国产91精品成人一区二区三区| 一级毛片女人18水好多| 少妇裸体淫交视频免费看高清 | 香蕉丝袜av| 国产精品1区2区在线观看.| tocl精华| 久久国产乱子伦精品免费另类| 国产精品 欧美亚洲| 一二三四社区在线视频社区8| 亚洲午夜理论影院| 色播亚洲综合网| 亚洲一区二区三区色噜噜| 三级毛片av免费| 99re在线观看精品视频| 国产成人av激情在线播放| 亚洲狠狠婷婷综合久久图片| 国产精品国产高清国产av| 欧美成人一区二区免费高清观看 | 99国产极品粉嫩在线观看| 精品日产1卡2卡| 五月伊人婷婷丁香| 色综合欧美亚洲国产小说| 久久99热这里只有精品18| 99精品在免费线老司机午夜| 91av网站免费观看| 三级男女做爰猛烈吃奶摸视频| 后天国语完整版免费观看| 男女午夜视频在线观看| 一本精品99久久精品77| 亚洲狠狠婷婷综合久久图片| 变态另类成人亚洲欧美熟女| 99久久国产精品久久久| 日本 av在线| 欧美最黄视频在线播放免费| 午夜亚洲福利在线播放| 在线观看www视频免费| xxxwww97欧美| 午夜免费观看网址| 91在线观看av| 18禁裸乳无遮挡免费网站照片| 91字幕亚洲| 校园春色视频在线观看| 九色成人免费人妻av| 亚洲最大成人中文| 好男人在线观看高清免费视频| 亚洲成人精品中文字幕电影| 男女那种视频在线观看| 我要搜黄色片| 精品一区二区三区视频在线观看免费| 亚洲一区高清亚洲精品| 村上凉子中文字幕在线| 99久久综合精品五月天人人| 欧美又色又爽又黄视频| 国产高清激情床上av| 亚洲欧美精品综合久久99| 男人舔奶头视频| 久久这里只有精品19| 日本黄色视频三级网站网址| 亚洲国产精品成人综合色| 精品福利观看| 免费搜索国产男女视频| 老司机在亚洲福利影院| 中亚洲国语对白在线视频| 国产午夜福利久久久久久| 无人区码免费观看不卡| 午夜福利在线在线| 免费在线观看亚洲国产| 国产精品久久久久久亚洲av鲁大| 黄色片一级片一级黄色片| 免费在线观看影片大全网站| 麻豆成人午夜福利视频| 夜夜看夜夜爽夜夜摸| tocl精华| 日韩欧美 国产精品| 一进一出抽搐动态| 男人舔奶头视频| aaaaa片日本免费| 欧美日本亚洲视频在线播放| 99久久精品国产亚洲精品| 久久久国产欧美日韩av| 久久草成人影院| 一a级毛片在线观看| 成人亚洲精品av一区二区| avwww免费| 国内久久婷婷六月综合欲色啪| 久久精品国产亚洲av香蕉五月| 高清在线国产一区| 日韩欧美三级三区| 脱女人内裤的视频| 国产av一区二区精品久久| 丝袜美腿诱惑在线| 日日爽夜夜爽网站| 欧美日韩中文字幕国产精品一区二区三区| 一区二区三区国产精品乱码| 中文字幕熟女人妻在线| 精品久久久久久久人妻蜜臀av| 视频区欧美日本亚洲| 亚洲av片天天在线观看| 日韩欧美免费精品| 亚洲午夜精品一区,二区,三区| 精品久久久久久久末码| 国产亚洲精品久久久久久毛片| 欧美成狂野欧美在线观看| 亚洲全国av大片| 97超级碰碰碰精品色视频在线观看| 国产成人系列免费观看| 熟女少妇亚洲综合色aaa.| 1024香蕉在线观看| 精品国内亚洲2022精品成人| 国产一区二区三区在线臀色熟女| 搞女人的毛片| 精品久久久久久久末码| 亚洲精品在线美女| 黄色片一级片一级黄色片| 欧美av亚洲av综合av国产av| 蜜桃久久精品国产亚洲av| 欧美黄色片欧美黄色片| 精品久久久久久久人妻蜜臀av| 国产黄色小视频在线观看| 婷婷精品国产亚洲av| 给我免费播放毛片高清在线观看| 天堂av国产一区二区熟女人妻 | 久久国产乱子伦精品免费另类| 色综合欧美亚洲国产小说| 在线观看一区二区三区| 精品久久久久久成人av| 在线免费观看的www视频| 一级毛片女人18水好多| 成在线人永久免费视频| 国内精品一区二区在线观看| 日韩大码丰满熟妇| 少妇粗大呻吟视频| 国产69精品久久久久777片 | 久久精品国产清高在天天线| 日日夜夜操网爽| 欧美日韩亚洲综合一区二区三区_| 老熟妇乱子伦视频在线观看| 毛片女人毛片| 一区二区三区高清视频在线| 国产区一区二久久| 一a级毛片在线观看| 两个人看的免费小视频| 九九热线精品视视频播放| 两性午夜刺激爽爽歪歪视频在线观看 | 亚洲专区字幕在线| 别揉我奶头~嗯~啊~动态视频| 精品国产美女av久久久久小说| 不卡av一区二区三区| 美女 人体艺术 gogo| 亚洲18禁久久av| av免费在线观看网站| www国产在线视频色|