• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多元特征加權(quán)改進(jìn)的TextRank關(guān)鍵詞提取方法*

    2020-04-07 04:09:02余本功張宏梅曹雨蒙
    數(shù)字圖書館論壇 2020年3期
    關(guān)鍵詞:文檔語義詞語

    余本功 張宏梅 曹雨蒙

    知識(shí)組織與應(yīng)用

    基于多元特征加權(quán)改進(jìn)的TextRank關(guān)鍵詞提取方法*

    余本功 張宏梅 曹雨蒙

    (合肥工業(yè)大學(xué)管理學(xué)院,合肥 230009)

    現(xiàn)有的關(guān)鍵詞提取方法從文檔集或者單文檔方面考慮詞語的特征,很少考慮詞語在單文檔和文檔集中的綜合特征對(duì)關(guān)鍵詞提取效果產(chǎn)生的影響,因此,本文提出多元特征加權(quán)的關(guān)鍵詞提取方法。該方法通過Word2vec模型提取出詞語在文檔集中的語義關(guān)系特征與詞語在單文檔中的重要性特征,通過線性加權(quán)的方式計(jì)算出詞語的綜合影響力,用于改進(jìn)TextRank模型中的概率轉(zhuǎn)移矩陣,最后迭代計(jì)算選取排名靠前的詞語作為文檔的關(guān)鍵詞。實(shí)驗(yàn)結(jié)果表明,從單文檔和文檔集兩方面綜合考慮詞語的影響力,可以有效地改善關(guān)鍵詞的提取效果。

    關(guān)鍵詞提??;TextRank ;Word2vec;多元特征加權(quán)

    隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)互聯(lián)網(wǎng)的普及,以論壇、博客、頭條和知乎社區(qū)為主流的媒介平臺(tái)成為人們共享知識(shí)及發(fā)表言論的重要場(chǎng)所。這些平臺(tái)上存儲(chǔ)大量有用的非結(jié)構(gòu)化文本信息,如何從承載這些信息的文本中提取對(duì)用戶有用的信息成為了一個(gè)亟需解決的難題。自然語言處理技術(shù)為解決這一難題提供了強(qiáng)有力的技術(shù)支撐。

    關(guān)鍵詞提取作為自然語言處理的核心技術(shù)之一,對(duì)自然語言處理技術(shù)的應(yīng)用有重要的作用。一方面,它為自然語言處理中的文本聚類分類、熱點(diǎn)識(shí)別、創(chuàng)新評(píng)價(jià)研究,以及知識(shí)圖譜和領(lǐng)域知識(shí)網(wǎng)絡(luò)的構(gòu)建打下了基礎(chǔ)[1-5];另一方面,關(guān)鍵詞提取技術(shù)可以提高用戶檢索信息的效率和準(zhǔn)確性[6],幫助用戶獲得有用信息。如在中國知網(wǎng)上搜索學(xué)術(shù)論文時(shí),用戶一般會(huì)通過輸入的關(guān)鍵詞檢索論文,而網(wǎng)頁是通過與用戶輸入的關(guān)鍵詞進(jìn)行匹配,返回給用戶相似度最高的文章。因此,對(duì)關(guān)鍵詞提取進(jìn)行研究是十分必要的,特別是在文本信息應(yīng)用和信息檢索等方面具有極其重要的現(xiàn)實(shí)意義和應(yīng)用價(jià)值。

    當(dāng)前,關(guān)鍵詞提取方法主要分為有監(jiān)督方法和無監(jiān)督方法。有監(jiān)督方法是將關(guān)鍵詞提取問題轉(zhuǎn)化為分類問題或標(biāo)注問題[7-8],借助分類算法來判斷候選詞是否為關(guān)鍵詞,由于語料集難以獲取,有監(jiān)督方法受到了制約,無監(jiān)督方法因不需訓(xùn)練語料而受到了學(xué)者的廣泛關(guān)注。因此,研究者們圍繞無監(jiān)督方法進(jìn)行了大量的研究工作,來改進(jìn)關(guān)鍵詞提取的效果。

    1 相關(guān)工作

    隨著自然語言處理技術(shù)的發(fā)展,研究者在關(guān)鍵詞提取方法上不斷創(chuàng)新,使得關(guān)鍵詞提取方法更加成熟。關(guān)鍵詞提取無監(jiān)督方法主要包括3種,基于主題模型的關(guān)鍵詞提取方法[9]、基于統(tǒng)計(jì)特征的關(guān)鍵詞提取方法[10]和基于圖模型的關(guān)鍵詞提取方法[11-12]。在這3種方法中,基于主題模型的關(guān)鍵詞提取方法僅考慮了主題信息,丟失了關(guān)鍵詞本身的統(tǒng)計(jì)特征信息;基于統(tǒng)計(jì)特征的關(guān)鍵詞提取方法容易忽略詞語的語義信息;基于圖模型的關(guān)鍵詞提取方法沒有考慮統(tǒng)計(jì)特征對(duì)詞語節(jié)點(diǎn)權(quán)重的影響。因此,在對(duì)無監(jiān)督方法進(jìn)行研究的過程中,如何揚(yáng)長(zhǎng)避短是研究者思考的重點(diǎn)。

    基于主題模型的關(guān)鍵詞提取方法是通過主題模型中主題分布的性質(zhì)對(duì)關(guān)鍵詞進(jìn)行提取。LDA是主題模型中應(yīng)用最廣的模型[13],其核心思想是文檔由多個(gè)主題構(gòu)成,而主題是由詞語的概率分布表示,只要找到文檔的主題,然后選擇主題中概率最大的詞語,就可以將其作為文檔的關(guān)鍵詞。為進(jìn)一步提高關(guān)鍵詞提取效果,研究者在LDA模型上做了許多改進(jìn)工作。朱澤德等[14]將LDA模型與TFIDF相融合,提出一種基于文檔隱含主題的關(guān)鍵詞提取新算法TFITF;李湘東等[15]在抽取粗粒度特征時(shí),將詞性、詞語位置等權(quán)重?cái)U(kuò)展到LDA的生成模型中,增強(qiáng)了特征的表意性;邱明濤等[16]利用擴(kuò)展的LDA模型調(diào)整詞語的權(quán)值,彌補(bǔ)了LDA模型在話題解釋性上的不足;楊春艷等[17]引入引用內(nèi)容,建立Labeled-LDA模型,從語義層面分析了文檔中詞匯之間的關(guān)系,提高了主題提取的質(zhì)量與準(zhǔn)確率。

    基于統(tǒng)計(jì)特征的關(guān)鍵詞提取方法主要是利用詞語在文檔中的詞權(quán)重、詞語位置,以及詞語的關(guān)聯(lián)信息衡量詞語是否能夠作為文章的關(guān)鍵詞。詞權(quán)重主要包括詞性、詞頻、詞長(zhǎng)等,而詞語位置是指文檔中詞語的分布信息,如標(biāo)題、段首、段尾;詞語的關(guān)聯(lián)信息涵蓋互信息、均值、方差、TFIDF[18]等。在基于統(tǒng)計(jì)的關(guān)鍵詞提取方法中,有學(xué)者對(duì)這些統(tǒng)計(jì)特征進(jìn)行線性組合,通過計(jì)算得分來選取關(guān)鍵詞,如著名的YAKE方法[19]綜合影響詞語得分的詞頻、長(zhǎng)度、位置、首字母狀態(tài)等信息對(duì)關(guān)鍵詞重要性進(jìn)行評(píng)分。但大多數(shù)學(xué)者是以TFIDF為核心,將常見的統(tǒng)計(jì)特征引入TFIDF中來改進(jìn)關(guān)鍵詞提取方法。羅燕等[20]通過齊普夫定律推導(dǎo)出同頻詞數(shù)統(tǒng)計(jì)規(guī)律,提出結(jié)合同頻詞數(shù)統(tǒng)計(jì)規(guī)律的TFIDF關(guān)鍵詞提取方法;余本功等[21]使用詞性和調(diào)節(jié)函數(shù)對(duì)TFIDF進(jìn)行優(yōu)化,并結(jié)合問答社區(qū)中多個(gè)用戶特征綜合計(jì)算詞語的權(quán)重,獲得更加精準(zhǔn)的關(guān)鍵詞;陳列蕾等[22]提出結(jié)合詞語位置分布特征與基于Scopus數(shù)據(jù)庫檢索的TFIDF從英文摘要中提取關(guān)鍵詞的方法。除此之外,為使TFIDF方法能夠適合不同長(zhǎng)度的語料,F(xiàn)lorescu等[23]提出使用單詞的算數(shù)平均值來代替IDF的對(duì)數(shù)取值計(jì)算方式,其效果優(yōu)于傳統(tǒng)的TFIDF方法。

    基于圖模型的關(guān)鍵詞提取方法以TextRank[12]模型為代表,是目前應(yīng)用最廣泛的方法。該方法受PageRank的啟發(fā),通過詞語間的共現(xiàn)關(guān)系建立網(wǎng)絡(luò)圖,然后進(jìn)行迭代排序,抽取前N個(gè)詞語作為關(guān)鍵詞。由于該模型具有很強(qiáng)的適應(yīng)性和擴(kuò)展能力,因此,研究者在此基礎(chǔ)上進(jìn)行了改進(jìn),主要分為兩個(gè)方面。一是在TextRank中引入統(tǒng)計(jì)特征屬性。李航等[24]使用神經(jīng)網(wǎng)絡(luò)對(duì)詞語平均信息熵、詞性、位置進(jìn)行加權(quán)計(jì)算,將得到的綜合權(quán)重融合到TextRank中,以改進(jìn)詞語節(jié)點(diǎn)的初始權(quán)重及概率轉(zhuǎn)移矩陣;Yan[25]將詞語的上下文信息、詞語位置、詞語中心等特征引入圖模型中,用于改進(jìn)節(jié)點(diǎn)的初始權(quán)重;Biswas等[26]提出用于提取Twitter的KECNW模型,著重強(qiáng)調(diào)了圖模型的集體節(jié)點(diǎn)權(quán)重取決于頻率、中心性、鄰居節(jié)點(diǎn)位置等參數(shù);張莉婧等[27]通過引入G1賦權(quán)法對(duì)TFIDF、詞語位置、詞語長(zhǎng)度和詞性賦予不同權(quán)重并計(jì)算綜合權(quán)重,對(duì)TextRank中的重啟概率和概率轉(zhuǎn)移矩陣進(jìn)行改進(jìn);夏天[28]將覆蓋影響力、位置影響力和頻度影響力引入TextRank中,通過計(jì)算詞語間的影響力,從而實(shí)現(xiàn)對(duì)概率轉(zhuǎn)移矩陣的改進(jìn);劉竹辰等[29]在學(xué)者夏天的基礎(chǔ)上對(duì)詞語位置進(jìn)行修改,提高了關(guān)鍵詞提取的準(zhǔn)確率。二是模型間的相互融合。在模型相互融合方面,主要是利用LDA模型和Word2vec[30]對(duì)TextRank進(jìn)行改進(jìn)。在LDA與TextRank結(jié)合方面,一些學(xué)者選擇先對(duì)候選關(guān)鍵詞進(jìn)行聚類,然后將其作為圖中的節(jié)點(diǎn)進(jìn)行迭代計(jì)算,從而獲得關(guān)鍵詞,如TopicRank[31]模型與Multipartiterank[32]模型,后者是在前者的基礎(chǔ)上進(jìn)行改進(jìn),更加強(qiáng)調(diào)主題的多樣性;然而,通過主題模型獲得主題影響力或用詞語相似性來改進(jìn)TextRank中的概率轉(zhuǎn)移矩陣和節(jié)點(diǎn)初始值占據(jù)了該方面研究的主流地位[33-35]。在Word2vec與TextRank結(jié)合方面,夏天[36]利用Word2vec生成詞向量,對(duì)詞向量進(jìn)行聚類以獲取聚類影響力,并與位置影響力、覆蓋影響力進(jìn)行加權(quán),改進(jìn)詞語節(jié)點(diǎn)間的概率轉(zhuǎn)移矩陣,提高了關(guān)鍵詞提取的準(zhǔn)確率;寧建飛等[37]利用Word2vec將文檔集中的詞語生成詞向量,構(gòu)建詞語相似度矩陣,改進(jìn)TextRank中節(jié)點(diǎn)的初始權(quán)重以及概率轉(zhuǎn)移矩陣。

    綜上所述,利用多特征融合或模型結(jié)合的無監(jiān)督方法在一定程度上提升了關(guān)鍵詞提取的效果。如在基于圖模型的關(guān)鍵詞提取方法中,將Word2vec計(jì)算出的詞語相似性引入圖模型中,取得了一定的效果,但尚未考慮到詞語在文檔內(nèi)的重要性特征。因此,本文在已有研究的基礎(chǔ)上將文檔內(nèi)詞語重要性與詞語在文檔集上的語義關(guān)系進(jìn)行線性加權(quán),將計(jì)算的詞語綜合影響力用于改進(jìn)TextRank中的概率轉(zhuǎn)移矩陣,通過強(qiáng)化詞語節(jié)點(diǎn)的權(quán)值,達(dá)到改善節(jié)點(diǎn)間影響力的相互傳遞目的,從而提高關(guān)鍵詞提取的效果。

    2 多元特征加權(quán)的關(guān)鍵詞提取方法

    2.1 模型框架及概述

    在現(xiàn)有關(guān)鍵詞提取方法的基礎(chǔ)上,本文提出一種多元特征加權(quán)改進(jìn)的TextRank關(guān)鍵詞提取方法(Improved TextRank Keyword Extraction Method Based on Multivariate Features Weighted,MFW-ITKEM),基本流程如圖1所示。詞語語義關(guān)系特征會(huì)在一定程度上影響詞語節(jié)點(diǎn)間的關(guān)系;而文檔內(nèi)詞語的重要性有利于反映詞語是否為文檔的核心部分,其權(quán)值越大,說明該詞語越有可能是文檔的關(guān)鍵詞,文檔內(nèi)詞語的重要性體現(xiàn)在詞語節(jié)點(diǎn)出度特征、詞語節(jié)點(diǎn)位置特征以及詞語節(jié)點(diǎn)頻次特征3個(gè)方面。本文通過線性加權(quán)的方式將詞語語義關(guān)系、詞語節(jié)點(diǎn)出度、詞語節(jié)點(diǎn)位置和詞語節(jié)點(diǎn)頻次4個(gè)特征進(jìn)行綜合度量,計(jì)算詞語的綜合影響力,并將其用于改進(jìn)候選關(guān)鍵詞圖中的概率轉(zhuǎn)移矩陣,優(yōu)化圖中詞語節(jié)點(diǎn)的迭代計(jì)算過程,獲取文檔內(nèi)詞語節(jié)點(diǎn)的權(quán)值,實(shí)現(xiàn)關(guān)鍵詞的抽取。

    2.2 初始候選關(guān)鍵詞圖構(gòu)建

    根據(jù)TextRank原理,中文文檔的候選關(guān)鍵詞圖的構(gòu)建分為兩個(gè)環(huán)節(jié)。對(duì)文檔進(jìn)行分句、分詞,去停用詞,保留詞性為名詞、動(dòng)詞、形容詞、副詞的詞語,獲得候選關(guān)鍵詞集合T=[w1,w2,…wm]。根據(jù)T中詞語的相鄰關(guān)系構(gòu)建候選關(guān)鍵詞圖G=(V,E),V是圖中的節(jié)點(diǎn)集合,由T中的候選關(guān)鍵詞組成,E是相鄰候選關(guān)鍵詞之間的邊集合。對(duì)于圖中任意的兩個(gè)相鄰的節(jié)點(diǎn),添加vvvv兩條邊,將TextRank構(gòu)建為一個(gè)有向圖。節(jié)點(diǎn)v的TextRank值見公式(1)。

    其中,(v)表示節(jié)點(diǎn)v的出度,d是阻尼系數(shù),默認(rèn)取值為0.85,V是節(jié)點(diǎn)集合數(shù)。通過公式(1)進(jìn)行迭代至收斂,即可獲得文檔中每個(gè)詞的權(quán)重。

    2.3 多元特征提取

    多元特征用于計(jì)算節(jié)點(diǎn)的綜合影響力,即詞語在單文檔中的重要性以及詞語在文檔集中存在的語義關(guān)系,多元特征導(dǎo)向見圖2。詞語在單文檔中的重要性由詞語節(jié)點(diǎn)的出度特征、詞語節(jié)點(diǎn)的頻次特征、詞語節(jié)點(diǎn)在文檔內(nèi)的位置特征構(gòu)成;而詞語在文檔集中的語義關(guān)系是通過Word2vec將詞典表征為詞向量,計(jì)算向量間的相似度來獲得詞語在語義方面的關(guān)系。因此,提出詞語的綜合影響力計(jì)算公式(2)。

    其中,θ和π是詞語在文檔內(nèi)及文檔集上特征的系數(shù),(im(v,v))為在文檔集中詞匯之間的相似度,θ和π在實(shí)驗(yàn)中取值都為0.5。

    2.3.1 文檔內(nèi)詞語節(jié)點(diǎn)重要性的計(jì)算

    在關(guān)鍵詞圖中,一個(gè)詞語節(jié)點(diǎn)對(duì)其鄰居節(jié)點(diǎn)的影響力是由該詞語節(jié)點(diǎn)的重要性決定的,本文在已有研究基礎(chǔ)上將詞語節(jié)點(diǎn)在單文檔中的特征分為詞語節(jié)點(diǎn)出度、詞語節(jié)點(diǎn)頻次以及詞語節(jié)點(diǎn)位置。令表示節(jié)點(diǎn)的重要性,、、表示3個(gè)要素所占的比例,通過公式(3)計(jì)算詞語節(jié)點(diǎn)的重要性。根據(jù)經(jīng)驗(yàn),參數(shù)設(shè)為α=0.34、β=0.33、γ=0.33。

    (1)詞語節(jié)點(diǎn)出度特征。指詞語節(jié)點(diǎn)vi將其出度影響力均勻地分配給其他詞語節(jié)點(diǎn),旨在說明詞語節(jié)點(diǎn)vi與其相鄰詞語節(jié)點(diǎn)之間的關(guān)系。

    (2)詞語節(jié)點(diǎn)頻次特征。指詞語在文本中出現(xiàn)的次數(shù),頻次越高的詞語其獲得的影響權(quán)重越大。

    (3)詞語節(jié)點(diǎn)位置特征。指詞語在文本中所處的位置,一般詞語在標(biāo)題中的重要性高于其他位置。如果詞語在標(biāo)題中出現(xiàn),則取值為一個(gè)參數(shù),參數(shù)取值范圍?∈[20,30] ;如果在其他位置,則賦值為1。

    2.3.2 文檔集詞語間的關(guān)系特征

    (1)Word2vec模型。Word2vec是Google團(tuán)隊(duì)開源的將詞表征成向量的工具[30],主要包含跳字模型(skip-gram)和連續(xù)詞袋模型(Continuous Bag-Of-Words Model,CBOW),如圖3所示。CBOW模型和skip-gram模型都是由輸入層、投影層和輸出層組成,兩個(gè)模型不同之處在于CBOW模型是利用上下文來預(yù)測(cè)中心詞出現(xiàn)的概率,skip-gram模型是用中心詞預(yù)測(cè)上下文出現(xiàn)在中心詞附近的概率。與統(tǒng)計(jì)語言模型相比,Word2vec模型生成的詞向量不僅解決了維度災(zāi)難問題,而且通過相似性的計(jì)算強(qiáng)化了詞語之間的語義關(guān)系。因此,可以利用Word2vec訓(xùn)練得到的詞向量計(jì)算相似性,來獲得詞語之間的語義關(guān)系。

    (2)文檔集中詞語節(jié)點(diǎn)語義特征的計(jì)算。為進(jìn)一步研究文檔集合中詞語節(jié)點(diǎn)存在的語義關(guān)系對(duì)單文檔中詞語節(jié)點(diǎn)的影響力,需要對(duì)文檔集合中詞語節(jié)點(diǎn)的語義關(guān)系進(jìn)行量化。本文利用Word2vec對(duì)文檔集中的詞語節(jié)點(diǎn)進(jìn)行詞向量表征,通過余弦公式計(jì)算詞向量的相似性,獲得詞語節(jié)點(diǎn)在文檔集中的語義關(guān)系特征。詞語節(jié)點(diǎn)在文檔集中語義關(guān)系的計(jì)算需要在構(gòu)建候選關(guān)鍵詞圖前完成,一般分為:①對(duì)給定的文檔集進(jìn)行分句、分詞,獲得詞匯集S1,S1由N個(gè)子詞匯集組成,每組子詞匯集對(duì)應(yīng)一篇文檔;②對(duì)詞匯集S1去停用詞,保留詞性為名詞、動(dòng)詞、形容詞及副詞的詞語,進(jìn)行合并生成詞典D=[w1,w2,…wn],該詞典是關(guān)鍵詞圖中所有候選關(guān)鍵詞的全集;③利用訓(xùn)練好的Word2vec對(duì)詞典D進(jìn)行詞向量表達(dá),得到D的詞向量。

    通過詞典中詞語的詞向量,利用余弦公式計(jì)算詞典D中詞語的相似度,獲得詞語在文檔集中所存在的語法關(guān)系,故詞典中詞語的相似度計(jì)算見公式(4)。

    其中,c是目標(biāo)文檔句中的第個(gè)詞,u是源文檔句中第個(gè)詞,uc均為詞向量。

    假設(shè)詞典的大小為n,則可以得到一個(gè)n×n的詞語相似度矩陣,見公式(5)。

    其中,(im(v,v))表示詞典的相似度矩陣,w表示詞典中詞語節(jié)點(diǎn)vv的相似度。

    2.4 概率轉(zhuǎn)移矩陣的計(jì)算與關(guān)鍵詞提取

    傳統(tǒng)的詞圖中,詞語節(jié)點(diǎn)的權(quán)重依賴于相鄰詞語節(jié)點(diǎn)的貢獻(xiàn)度。為了對(duì)TextRank進(jìn)行改進(jìn),本文引入詞語綜合影響力對(duì)概率轉(zhuǎn)移矩陣進(jìn)行優(yōu)化,提高關(guān)鍵詞提取的準(zhǔn)確性。詞語節(jié)點(diǎn)的權(quán)重由兩個(gè)因素所決定:一是詞語節(jié)點(diǎn)本身的重要性,代表詞語在文檔內(nèi)部結(jié)構(gòu)中的作用,一般設(shè)定為1,在迭代過程中由相鄰詞語節(jié)點(diǎn)的分值進(jìn)行調(diào)整,記為(v);二是由詞語在單文檔中重要性和詞語在文檔集中語義關(guān)系所構(gòu)成的分值,表示詞語的綜合影響力。因此,定義新的節(jié)點(diǎn)重要性迭代計(jì)算公式(6)。

    在迭代計(jì)算前,構(gòu)建詞語節(jié)點(diǎn)間的概率轉(zhuǎn)移矩陣,見公式(7)。

    其中,w表示節(jié)點(diǎn)v的影響力轉(zhuǎn)移到其他節(jié)點(diǎn)的概率,每列概率之和為1。w的權(quán)重可以通過公式(8)計(jì)算得到。

    在引入概率轉(zhuǎn)移矩陣之后,令B表示一次迭代的結(jié)果,則迭代公式可以轉(zhuǎn)化為公式(9)。

    其中,為維數(shù)為的單位向量。通過公式(9)進(jìn)行迭代計(jì)算,當(dāng)兩次的計(jì)算結(jié)果差異小于0.001時(shí),表明計(jì)算結(jié)果達(dá)到收斂狀態(tài)。最后對(duì)所有的詞語節(jié)點(diǎn)權(quán)重降序排列,將排名靠前的N個(gè)詞作為關(guān)鍵詞。

    3 實(shí)驗(yàn)及分析

    為了對(duì)提出的基于多元特征加權(quán)改進(jìn)的TextRank關(guān)鍵詞提取方法進(jìn)行驗(yàn)證,本文選取專利文本摘要進(jìn)行實(shí)證分析,并與其他學(xué)者提出的方法進(jìn)行對(duì)比,分析關(guān)鍵詞提取效果。專利文本是一種特殊的文本,它以精簡(jiǎn)的方式存儲(chǔ)著最新的科學(xué)技術(shù),通過對(duì)專利文本進(jìn)行挖掘,能夠快速地捕捉到技術(shù)前沿,為企業(yè)提供一定的參考價(jià)值,激發(fā)企業(yè)的創(chuàng)新能力。本文選取制造行業(yè)的汽車專利文本,提取汽車技術(shù)前沿的關(guān)鍵詞,為人們快速了解最新技術(shù)提供便捷。

    3.1 數(shù)據(jù)集獲取及處理

    本文數(shù)據(jù)來自國內(nèi)文獻(xiàn)檢索平臺(tái)中國知網(wǎng),選擇高級(jí)檢索方式,以“申請(qǐng)人=安徽江淮汽車股份有限公司”為檢索條件,選擇公開日期為2016年4月20日—2017年2月15日共1?038條文本,剔除文本摘要篇幅小于150字的專利文本,共得到843條文本,對(duì)得到的843條專利文本進(jìn)行數(shù)據(jù)清洗。剔除申請(qǐng)?zhí)?、專利?hào)、申請(qǐng)日、公開號(hào)等結(jié)構(gòu)化信息,保留專利文本的標(biāo)題和摘要文本,將每條專利摘要和標(biāo)題看作一個(gè)文檔存儲(chǔ)在xlsx文件中,為解決專利文本摘要中沒有標(biāo)準(zhǔn)的關(guān)鍵詞問題,筆者采用人工標(biāo)注的方式在每條專利摘要中標(biāo)注10個(gè)關(guān)鍵詞作為標(biāo)準(zhǔn)關(guān)鍵詞,與算法自動(dòng)提取出的關(guān)鍵詞進(jìn)行對(duì)比分析。

    本實(shí)驗(yàn)使用Python自帶的結(jié)巴分詞工具對(duì)數(shù)據(jù)進(jìn)行分詞,通過停用詞詞典將通用詞以及標(biāo)點(diǎn)符號(hào)過濾掉,進(jìn)行詞性標(biāo)注,在團(tuán)隊(duì)所構(gòu)建的2萬條汽車專用詞典的基礎(chǔ)上加入未收錄的汽車專用術(shù)語,共引入41?891個(gè)汽車術(shù)語,以此來提高分詞效果。

    本文使用維基百科語料作為Word2vec訓(xùn)練集,完成詞向量的訓(xùn)練,利用訓(xùn)練好的參數(shù)對(duì)專利文本進(jìn)行詞向量的表達(dá)。

    3.2 對(duì)比實(shí)驗(yàn)設(shè)置及結(jié)果分析

    本文采用的數(shù)據(jù)語料是江淮專利文本摘要和標(biāo)題,為了對(duì)關(guān)鍵詞的提取效果進(jìn)行評(píng)估,本文選擇準(zhǔn)確率(P值)、召回率(R值)和F值3個(gè)指標(biāo)。

    本文提出的多元特征的關(guān)鍵詞提取方法是將文檔外部信息與文檔內(nèi)部信息相結(jié)合,對(duì)專利文本摘要進(jìn)行關(guān)鍵詞提取研究,提取的關(guān)鍵詞取值范圍為[3-10]。本文設(shè)置了兩類對(duì)比實(shí)驗(yàn),第一類是特征組合實(shí)驗(yàn),通過對(duì)不同特征的融合,說明特征的疊加能夠有效提升關(guān)鍵詞的提取效果;第二類是不同關(guān)鍵詞算法之間的比較,旨在表明本文提出的算法優(yōu)于其他算法。在各性能對(duì)比圖表中僅顯示關(guān)鍵詞個(gè)數(shù)為3、5、7、10的準(zhǔn)確率、召回率以及F值。

    3.2.1 特征組合

    通過單個(gè)特征進(jìn)行分析,以TextRank模型為基準(zhǔn),分別加入表示詞語在文檔內(nèi)的重要性特征,即詞語節(jié)點(diǎn)出度特征(A)、詞語節(jié)點(diǎn)位置特征(B)、詞語節(jié)點(diǎn)頻次特征(C)和詞語在文檔集間的語義關(guān)系特征(D),依次對(duì)模型中的初始概率轉(zhuǎn)移矩陣進(jìn)行改進(jìn)。從圖4可以看出,在單個(gè)特征中,B的準(zhǔn)確率、召回率和F值均高于其他特征,而D是單個(gè)特征中提取效果最差的,原因在于僅考慮文檔集間的語義關(guān)系,忽略了單文檔的詞語節(jié)點(diǎn)出度、詞語在文本中的位置以及頻次產(chǎn)生的影響,所以對(duì)于提取單文檔關(guān)鍵詞來說,準(zhǔn)確率、召回率、F值均較差。

    為更好地說明特征對(duì)實(shí)驗(yàn)結(jié)果的影響,本文在單個(gè)特征的基礎(chǔ)上將不同特征進(jìn)行組合,如圖5所示。

    圖5的實(shí)驗(yàn)結(jié)果顯示,將詞語在文檔集上的語義特征與詞語在文檔內(nèi)的重要性相融合,其準(zhǔn)確率、召回率和F值均大于詞語位置特征與其他單個(gè)特征相組合的效果,即A+B+C+D的關(guān)鍵詞提取性能要?jiǎng)儆谄渌卣鞯慕M合性能。

    3.2.2 算法比較

    不同算法的對(duì)比在這里分為兩組,第一組是將本文提出的MFW-ITKEM算法與傳統(tǒng)的TextRank和TFIDF算法作對(duì)比,第二組是將本文提出的MFW-ITKEM算法與其他研究者提出的算法作比較。

    第一組實(shí)驗(yàn)包括以下3種算法。

    (1)TextRank。通過滑動(dòng)窗口構(gòu)建共現(xiàn)網(wǎng)絡(luò),迭代計(jì)算詞語重要性,輸出排名靠前的詞語作為關(guān)鍵詞[12]。

    (2)TFIDF。詞頻逆文檔算法,在基于詞頻的關(guān)鍵詞提取算法中,既考慮了詞語在單篇文檔中詞頻的大小,也將詞語對(duì)整個(gè)文檔集的區(qū)分能力納入計(jì)算中,這是一種經(jīng)典算法。

    (3)MFW-ITKEM。本文提出的方法在已有研究的基礎(chǔ)上,將詞語在文檔內(nèi)的特征與詞語在文檔集上的語法特征相融合,改進(jìn)TextRank中的概率轉(zhuǎn)移矩陣,進(jìn)行關(guān)鍵詞的抽取。

    表1和圖6是本文提出的MFW-ITKEM算法與經(jīng)典的TextRank和TFIDF算法的對(duì)比,可以看到,本文提出的方法在提取效果上均優(yōu)于經(jīng)典方法,其優(yōu)勢(shì)在于將節(jié)點(diǎn)在文檔內(nèi)的特征與節(jié)點(diǎn)在文檔集上的語義特征引入TextRank方法中。

    第二組實(shí)驗(yàn)包括以下5種算法。

    (1)T1。Word2vec算法,通過詞向量計(jì)算詞語的相似性,然后聚類得到關(guān)鍵詞[38]。

    (2)T2。將詞向量進(jìn)行聚類,將外部知識(shí)融入TextRank的計(jì)算中[36]。

    (3)T3。將詞語的位置信息和詞距融入詞圖模型中,來提升單文檔的關(guān)鍵詞提取效果[29]。

    (4)T4。將Word2vec與TextRank相結(jié)合,將提取出的詞向量作為TextRank的輸入,采用了模型結(jié)合的方式[37]。

    (5)MFW-ITKEM。本文提出的算法。

    表2和圖7的統(tǒng)計(jì)結(jié)果顯示,橫向上比較來看,在關(guān)鍵詞個(gè)數(shù)較小時(shí),5種方法的準(zhǔn)確率和F值基本相等,但是隨著關(guān)鍵詞個(gè)數(shù)的增加,MFW-ITKEM的準(zhǔn)確率和F值都有所提高,且高于其他研究者的方法,表明MFW-ITKEM方法在關(guān)鍵詞提取方面有更明顯的優(yōu)勢(shì)。

    根據(jù)F值從縱向上分析,在關(guān)鍵詞數(shù)量為5、7、10的情況下,MFW-ITKEM在效果上均優(yōu)于其他4種算法。具體來說,關(guān)鍵詞數(shù)目為5時(shí),5種算法的排序?yàn)門4

    通過兩類實(shí)驗(yàn)結(jié)果分析,驗(yàn)證了本文提出的方法在使用詞向量獲取文檔集間的詞語關(guān)系的基礎(chǔ)上引入文檔內(nèi)的相鄰詞語的出度特征、頻率特征和詞語位置特征,能夠有效地提高關(guān)鍵詞的提取效果,比其他學(xué)者提出的僅考慮單文檔的統(tǒng)計(jì)特征或是通過詞向量聚類的算法更有優(yōu)勢(shì)。

    4 結(jié)語

    本文在基于圖模型的關(guān)鍵詞提取方法的基礎(chǔ)上,綜合考慮詞語在單文檔中的重要性和其在文檔集中的語義關(guān)系,提出將這兩部分通過線性加權(quán)的方式融合來計(jì)算詞語的綜合影響力,并以此來改進(jìn)TextRank方法的概率轉(zhuǎn)移矩陣,實(shí)現(xiàn)圖中節(jié)點(diǎn)的權(quán)重計(jì)算并獲得關(guān)鍵詞,經(jīng)過實(shí)驗(yàn)驗(yàn)證,該算法提高了關(guān)鍵詞的提取效果。

    本文所提出的算法也存在一些不足。訓(xùn)練Word2vec的語料均來自維基百科,尚未涵蓋汽車專業(yè)領(lǐng)域的一些術(shù)語,造成在使用單特征提取關(guān)鍵詞的實(shí)驗(yàn)中效果并不理想。后續(xù)研究將考慮使用汽車領(lǐng)域的語料集來訓(xùn)練Word2vec模型,并進(jìn)一步擴(kuò)大關(guān)鍵詞提取的文本,且將該方法與具體的應(yīng)用領(lǐng)域相結(jié)合,如熱點(diǎn)分析、創(chuàng)新評(píng)價(jià)以及主題演化方面,為用戶提供更有價(jià)值的參考。

    [1] 毛太田,蔣冠文,李勇,等. 新媒體時(shí)代下網(wǎng)絡(luò)熱點(diǎn)事件情感傳播特征研究[J]. 情報(bào)科學(xué),2019,37(4):29-35,96.

    [2] 王健,張俊妮. 統(tǒng)計(jì)模型在中文文本挖掘中的應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理,2017,36(4):609-619.

    [3] 馬宗國,尹圓圓. 我國研究聯(lián)合體研究的知識(shí)圖譜分析——基于1992—2017年中國知網(wǎng)期刊文獻(xiàn)[J]. 科技管理研究,2019,39(5):246-250.

    [4] 余本功,陳楊楠,楊穎. 基于主題模型和專利數(shù)據(jù)的技術(shù)創(chuàng)新評(píng)價(jià)研究[J]. 現(xiàn)代情報(bào),2019,39(1):111-117,168.

    [5] 趙汝南,常志遠(yuǎn),姜博,等. 基于網(wǎng)絡(luò)演化的領(lǐng)域知識(shí)發(fā)展趨勢(shì)研究[J]. 數(shù)字圖書館論壇,2016(3):24-29.

    [6] 溫有奎. 信息檢索系統(tǒng)的關(guān)聯(lián)關(guān)鍵詞推薦研究[J]. 數(shù)字圖書館論壇,2016(4):11-14.

    [7] 趙京勝,朱巧明,周國棟,等. 自動(dòng)關(guān)鍵詞抽取研究綜述[J]. 軟件學(xué)報(bào),2017,28(9):2431-2449.

    [8] 常耀成,張宇翔,王紅,等. 特征驅(qū)動(dòng)的關(guān)鍵詞提取算法綜述[J]. 軟件學(xué)報(bào),2018,29(7):2046-2070.

    [9] WEI H X,GAO G L,SU X D. LDA-Based Word Image Representation for Keyword Spotting on Historical Mongolian Documents[C]//Neural Information Processing(ICONIP). Springer,2016:432-441.

    [10] 傅柱,王曰芬,陳必坤. 國內(nèi)外知識(shí)流研究熱點(diǎn):基于詞頻的統(tǒng)計(jì)分析[J]. 圖書館學(xué)研究,2016(14):2-12.

    [11] BOUDIN F. A Comparison of Centrality Measures for Graph-Based Keyphrase Extraction[C]//Proceedings of the 6th International Joint Conference on Natural Language Processing. Nagoya:Asian Federation of Natural Language Processing,2013:834-838

    [12] MIHALCEA R,TARAU P. TextRank:Bringing Order into Texts[C]//Proceedings of Conference on Empirical Methods in Natural Language Processing,Stroudsburg:ACL,Barcelona. 2004:404-411.

    [13] BLEI D M,NGA Y,JODAN M I.Latentdirichlet allocation[J]. The Journal of Machine Learning Research,2003,3:993-1022.

    [14] 朱澤德,李淼,張健,等. 一種基于LDA模型的關(guān)鍵詞抽取方法[J]. 中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,46(6):2142-2148

    [15] 李湘東,巴志超,黃莉. 一種基于加權(quán)LDA模型和多粒度的文本特征選擇方法[J]. 現(xiàn)代圖書情報(bào)技術(shù),2015(5):42-49.

    [16] 邱明濤,馬靜,張磊,等. 基于可擴(kuò)展LDA模型的微博話題特征抽取研究[J]. 情報(bào)科學(xué),2017,35(4):22-26,31.

    [17] 楊春艷,潘有能,趙莉. 基于語義和引用加權(quán)的文獻(xiàn)主題提取研究[J]. 圖書情報(bào)工作,2016,60(9):131-138,146.

    [18] PAIK J H. A novel TF-IDF weighting scheme for effective ranking[C]//Proceedings of the 36th International ACM SIGIR conference on Research and Development in Information Retrieval. ACM,2013:343-352.

    [19] CAMPOS R,VíTOR M,PASQUALI A,et al. YAKE! Collection-Independent Automatic Keyword Extractor[C]//In Advances in Information Retrieval-40th European Conference on Information Retrieval. Springer ECIR 2018,Lecture Notes in Computer Science,Grenoble,F(xiàn)rance. Cham,2018:806-810.

    [20] 羅燕,趙書良,李曉超,等. 基于詞頻統(tǒng)計(jì)的文本關(guān)鍵詞提取方法[J]. 計(jì)算機(jī)應(yīng)用,2016,36(3):718-725.

    [21] 余本功,李婷,楊穎. 基于多屬性加權(quán)的社會(huì)化問答社區(qū)關(guān)鍵詞提取方法[J]. 圖書情報(bào)工作,2018,62(5):132-139.

    [22] 陳列蕾,方暉. 基于Scopus檢索和TFIDF的論文關(guān)鍵詞自動(dòng)提取方法[J]. 南京大學(xué)學(xué)報(bào)(自然科學(xué)),2018,54(3):604-611.

    [23] FLORESCU C,CARAGEA C. A New Scheme for Scoring Phrases in Unsupervised Keyphrase Extraction[C]//Proceedings of the Advances in Information Retrieval-39th European Conference on Information Retrieval.ECIR 2017,Lecture Notes in Computer Science Aberdeen,UK,2017.

    [24] 李航,唐超蘭,楊賢,等. 融合多特征的TextRank關(guān)鍵詞抽取方法[J]. 情報(bào)雜志,2017,36(8):183-187.

    [25] YAN Y. A Graph-based approach of automatic key phraseextraction[J]. Procedia Computer Science,2017,107:248-255.

    [26] BISWAS S K,BORDOLOI M,SHREYA J. A graph based keyword extraction model using collective node weight[J]. Expert Systems with Applications,2018,97:51-59.

    [27] 張莉婧,李業(yè)麗,曾慶濤,等. 基于改進(jìn)TextRank的關(guān)鍵詞抽取算法[J]. 北京印刷學(xué)院學(xué)報(bào),2016,24(4):51-55.

    [28] 夏天. 詞語位置加權(quán)Text Rank的關(guān)鍵詞抽取研究[J]. 現(xiàn)代圖書情報(bào)技術(shù),2013(9):30-34.

    [29] 劉竹辰,陳浩,于艷華,等. 詞位置分布加權(quán)TextRank的關(guān)鍵詞提取[J]. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2018,2(9):74-79.

    [30] MIKOLOVT,CHEN K,CORRADO G,et al. Efficient Estimation of Word Representations in Vector Space[C]//Proceedings of the 2013 International Conference on Learning Representations,ICLR 2013,Workshop Track,Scottsdale,Arizona,USA. 2013:1-12.

    [31] BOUGOUIN A,BOUDINF,BéATRICE D. TopicRank:Graph-Based Topic Ranking for Keyphrase Extraction[C]// Proceedings of the 6th International Joint Conference on Natural Language Processing,IJCNLP 2013,Nagoya,Japan2013:543-551.

    [32] BOUDINF. Unsupervised key phraseextraction with multipartite graphs[C]//Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies,NAACL HLT,Association for Computational Linguistics,NewOrleans:June 1-6,2018,2:667-672.

    [33] STERCKX L,DEMEESTER T,DELEU J,et al. Creation and evaluation of large keyphrase extraction collections with multiple opinions[J]. Language Resources and Evaluation,2017,52:503-532.

    [34] 顧益軍,夏天. 融合LDA與TextRank的關(guān)鍵詞抽取研究[J]. 現(xiàn)代圖書情報(bào)技術(shù),2014(7/8):41-47.

    [35] 劉嘯劍,謝飛,吳信東. 基于圖和LDA主題模型的關(guān)鍵詞抽取算法[J]. 情報(bào)學(xué)報(bào),2016,35(6):664-672.

    [36] 夏天. 詞向量聚類加權(quán)TextRank的關(guān)鍵詞抽?。跩]. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2017,1(2):28-34.

    [37] 寧建飛,劉降珍. 融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 現(xiàn)代圖書情報(bào)技術(shù),2016(6):20-27.

    [38] 李躍鵬,金翠,及俊川. 基于word2vec的關(guān)鍵詞提取算法[J]. 科研信息化技術(shù)與應(yīng)用,2015,6(4):54-59.

    Improved TextRank Keyword Extraction Method Based on Multivariate Features Weighted

    YU BenGong ZHANG HongMei CAO YuMeng

    ( School of Management, Hefei University of Technology, Hefei 230009, China )

    Existing keyword extraction methods take into account the characteristics of words from the document set or single document, and rarely comprehensively considered the impact of the comprehensive features of words in single document and document set on the keyword extraction effect. This paper proposed a multi-feature weighted keyword extraction method. This method used the Word2vec model to extract the semantic relationship characteristics of words in the document set, and the importance characteristics of words in a single document to calculate the comprehensive influence of the words in a linear weighting manner, which was used to improve the probability transition matrix in the TextRank model. Finally, iterative calculation selected the top-ranked words as the keywords of the document. Experimental results show that comprehensive consideration of the influence of words from both a single document and a document set can effectively improve the effect of keyword extraction.

    Keyword Extraction; TextRank; Word2vec; Multivariate Feature Weighting

    TP391

    10.3772/j.issn.1673-2286.2020.03.006

    (2020-02-28)

    *本研究得到國家自然科學(xué)基金資助項(xiàng)目“基于制造大數(shù)據(jù)的產(chǎn)品研發(fā)知識(shí)集成與服務(wù)機(jī)制研究”(編號(hào):71671057)資助。

    余本功,男,1971年生,博士,教授,研究方向:信息系統(tǒng)、機(jī)器學(xué)習(xí)。

    張宏梅,女,1994年生,碩士,通信作者,研究方向:數(shù)據(jù)挖掘、自然語言處理,E-mail:18856002708@163.com。

    曹雨蒙,女,1994年生,碩士,研究方向:機(jī)器學(xué)習(xí)、自然語言處理。

    猜你喜歡
    文檔語義詞語
    容易混淆的詞語
    有人一聲不吭向你扔了個(gè)文檔
    找詞語
    語言與語義
    詞語欣賞
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    一枚詞語一門靜
    認(rèn)知范疇模糊與語義模糊
    国语自产精品视频在线第100页| 国产视频首页在线观看| 中文在线观看免费www的网站| 最近最新中文字幕免费大全7| 亚洲精华国产精华液的使用体验| 床上黄色一级片| 国产午夜精品论理片| 日韩高清综合在线| 只有这里有精品99| 国产高清三级在线| 亚洲综合色惰| 免费观看性生交大片5| 少妇高潮的动态图| 亚洲精品国产成人久久av| 91精品一卡2卡3卡4卡| 国产成人精品婷婷| 成人美女网站在线观看视频| 国产精品不卡视频一区二区| 久久99热这里只频精品6学生 | 大又大粗又爽又黄少妇毛片口| 国产高清视频在线观看网站| 亚洲国产日韩欧美精品在线观看| 日韩大片免费观看网站 | 国产成人a∨麻豆精品| 秋霞伦理黄片| 少妇猛男粗大的猛烈进出视频 | 综合色av麻豆| a级一级毛片免费在线观看| www日本黄色视频网| 边亲边吃奶的免费视频| 久久欧美精品欧美久久欧美| 99热这里只有精品一区| 国产黄a三级三级三级人| 真实男女啪啪啪动态图| 久久午夜福利片| 日韩欧美 国产精品| 精品久久久久久久久久久久久| 国产精品国产三级专区第一集| 国产av一区在线观看免费| 大香蕉久久网| 久久99热这里只频精品6学生 | 亚洲国产日韩欧美精品在线观看| 久久久色成人| 麻豆久久精品国产亚洲av| 亚洲图色成人| 视频中文字幕在线观看| 男女那种视频在线观看| 日韩强制内射视频| 国产精品一区二区性色av| 精品99又大又爽又粗少妇毛片| 国产高清国产精品国产三级 | 熟女电影av网| 老司机影院成人| 五月伊人婷婷丁香| 国产色婷婷99| 免费观看的影片在线观看| 精品久久久久久久久亚洲| 国产精品国产高清国产av| 热99re8久久精品国产| 国产精品,欧美在线| 国产高清不卡午夜福利| 精品久久久久久成人av| 久久午夜福利片| 一级毛片电影观看 | 少妇熟女aⅴ在线视频| 久久久久网色| 色吧在线观看| 欧美区成人在线视频| 最近最新中文字幕大全电影3| 一本久久精品| 18禁在线播放成人免费| 三级国产精品片| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 美女黄网站色视频| 久久久久国产网址| 国产男人的电影天堂91| 国产精品一区www在线观看| 色吧在线观看| 黄色配什么色好看| 嘟嘟电影网在线观看| 久久精品久久精品一区二区三区| 国产极品精品免费视频能看的| 少妇高潮的动态图| 国产亚洲一区二区精品| 国产亚洲精品久久久com| 日韩三级伦理在线观看| 成人毛片a级毛片在线播放| 日韩欧美国产在线观看| 亚洲成人av在线免费| 久久6这里有精品| 精品人妻偷拍中文字幕| 天堂av国产一区二区熟女人妻| 国产精品一区www在线观看| 狂野欧美激情性xxxx在线观看| 99久久无色码亚洲精品果冻| 女的被弄到高潮叫床怎么办| 天美传媒精品一区二区| 国产女主播在线喷水免费视频网站 | av福利片在线观看| 超碰97精品在线观看| 成年女人永久免费观看视频| 久久99蜜桃精品久久| 免费一级毛片在线播放高清视频| 能在线免费观看的黄片| 观看美女的网站| 深夜a级毛片| 国内少妇人妻偷人精品xxx网站| 免费黄网站久久成人精品| 久久6这里有精品| 99热网站在线观看| 国内少妇人妻偷人精品xxx网站| 97超碰精品成人国产| 久久精品国产鲁丝片午夜精品| 亚洲精品影视一区二区三区av| 黑人高潮一二区| 久久热精品热| 天堂影院成人在线观看| 卡戴珊不雅视频在线播放| 97超视频在线观看视频| av在线观看视频网站免费| 亚洲人成网站在线观看播放| 国产淫片久久久久久久久| 精品久久久久久成人av| 色噜噜av男人的天堂激情| 天堂av国产一区二区熟女人妻| 插阴视频在线观看视频| 欧美精品国产亚洲| av在线亚洲专区| 三级毛片av免费| 国产精品人妻久久久影院| 国产亚洲精品av在线| 国产精品美女特级片免费视频播放器| av免费在线看不卡| av黄色大香蕉| 亚洲精品成人久久久久久| 日韩高清综合在线| 日韩欧美 国产精品| 日本黄色片子视频| 麻豆久久精品国产亚洲av| 精品一区二区三区视频在线| 人妻制服诱惑在线中文字幕| 成人特级av手机在线观看| 女人久久www免费人成看片 | 免费播放大片免费观看视频在线观看 | 国产单亲对白刺激| 国产亚洲最大av| 中文字幕免费在线视频6| 欧美精品一区二区大全| 蜜桃亚洲精品一区二区三区| 免费搜索国产男女视频| 激情 狠狠 欧美| 我要搜黄色片| 26uuu在线亚洲综合色| 国产国拍精品亚洲av在线观看| 精品99又大又爽又粗少妇毛片| 国产精品女同一区二区软件| 91久久精品电影网| 精品久久久久久久人妻蜜臀av| 亚洲国产精品成人综合色| 美女被艹到高潮喷水动态| 51国产日韩欧美| 高清日韩中文字幕在线| 人体艺术视频欧美日本| 亚洲精品乱码久久久v下载方式| 国产免费视频播放在线视频 | 精品久久国产蜜桃| 欧美不卡视频在线免费观看| 在线观看66精品国产| 久久久久久久久久黄片| 国产亚洲91精品色在线| 国产午夜精品论理片| 久久久国产成人精品二区| 99国产精品一区二区蜜桃av| 欧美bdsm另类| 永久网站在线| 18+在线观看网站| 久久这里只有精品中国| 美女被艹到高潮喷水动态| 免费黄网站久久成人精品| 成人午夜高清在线视频| 亚洲综合色惰| 中文天堂在线官网| 国产精品永久免费网站| av女优亚洲男人天堂| 久久99精品国语久久久| 不卡视频在线观看欧美| 国产淫片久久久久久久久| 亚洲av男天堂| 国产极品精品免费视频能看的| 亚洲欧美成人精品一区二区| 成人亚洲精品av一区二区| 26uuu在线亚洲综合色| 日日摸夜夜添夜夜添av毛片| 日本三级黄在线观看| 18禁裸乳无遮挡免费网站照片| 中文字幕熟女人妻在线| 国产精品av视频在线免费观看| 一区二区三区高清视频在线| 黄色配什么色好看| 赤兔流量卡办理| 三级国产精品片| 麻豆成人午夜福利视频| 69人妻影院| 日韩人妻高清精品专区| 精品熟女少妇av免费看| 人妻制服诱惑在线中文字幕| 亚洲国产日韩欧美精品在线观看| 美女高潮的动态| 国产成人aa在线观看| 热99re8久久精品国产| 午夜视频国产福利| 中文字幕久久专区| 尤物成人国产欧美一区二区三区| 国产亚洲一区二区精品| 最后的刺客免费高清国语| 在线观看美女被高潮喷水网站| 一级毛片久久久久久久久女| 欧美一区二区国产精品久久精品| 久久久久久久久大av| 色噜噜av男人的天堂激情| 黄色欧美视频在线观看| 午夜福利视频1000在线观看| 男女边吃奶边做爰视频| 成人三级黄色视频| 欧美日韩综合久久久久久| 又爽又黄无遮挡网站| 久久精品久久精品一区二区三区| 日本黄色视频三级网站网址| 两性午夜刺激爽爽歪歪视频在线观看| 麻豆成人av视频| videos熟女内射| 99热这里只有是精品在线观看| 国模一区二区三区四区视频| 九色成人免费人妻av| 精品一区二区免费观看| 日本与韩国留学比较| 国产免费一级a男人的天堂| 日韩,欧美,国产一区二区三区 | 国产成人午夜福利电影在线观看| 国产精品一二三区在线看| 国产真实乱freesex| 日日干狠狠操夜夜爽| 国产成人精品婷婷| 国产高潮美女av| 国产乱人偷精品视频| 美女xxoo啪啪120秒动态图| 亚洲aⅴ乱码一区二区在线播放| 亚洲国产欧洲综合997久久,| 国产不卡一卡二| 亚洲精品乱码久久久久久按摩| 亚洲中文字幕一区二区三区有码在线看| 看十八女毛片水多多多| 国产精品国产高清国产av| 伦精品一区二区三区| 中文资源天堂在线| 久久久欧美国产精品| 天堂av国产一区二区熟女人妻| 两性午夜刺激爽爽歪歪视频在线观看| 久久久久久九九精品二区国产| 亚洲av不卡在线观看| 丝袜喷水一区| av在线老鸭窝| 国产日韩欧美在线精品| 精品久久久久久久久久久久久| 国产亚洲av片在线观看秒播厂 | 插逼视频在线观看| 免费av不卡在线播放| 国产av码专区亚洲av| 午夜福利网站1000一区二区三区| 高清午夜精品一区二区三区| 少妇高潮的动态图| 波多野结衣巨乳人妻| 真实男女啪啪啪动态图| 高清在线视频一区二区三区 | 成人av在线播放网站| 丰满少妇做爰视频| 欧美成人一区二区免费高清观看| 久久久色成人| 亚洲一区高清亚洲精品| 精品人妻熟女av久视频| 91精品一卡2卡3卡4卡| 亚洲最大成人中文| 亚洲国产精品国产精品| 欧美xxxx黑人xx丫x性爽| 国产亚洲最大av| 亚洲国产欧美在线一区| 久久99热这里只有精品18| 久久国产乱子免费精品| 国产午夜福利久久久久久| 五月伊人婷婷丁香| 夫妻性生交免费视频一级片| 久久亚洲国产成人精品v| 亚洲人成网站在线观看播放| 国产午夜精品论理片| 一个人看视频在线观看www免费| 亚洲欧美日韩东京热| 色综合色国产| 最近中文字幕2019免费版| 成人亚洲欧美一区二区av| 精品一区二区三区人妻视频| 2022亚洲国产成人精品| 黄片wwwwww| 国产一区二区在线观看日韩| 菩萨蛮人人尽说江南好唐韦庄 | 看十八女毛片水多多多| 色网站视频免费| 麻豆久久精品国产亚洲av| 国产伦理片在线播放av一区| 亚洲欧美成人精品一区二区| 人妻制服诱惑在线中文字幕| 嘟嘟电影网在线观看| 久久精品综合一区二区三区| 美女xxoo啪啪120秒动态图| 在线播放国产精品三级| 欧美性感艳星| 免费观看在线日韩| 免费人成在线观看视频色| 老司机影院成人| 亚洲国产欧美人成| 国产精品无大码| 国产熟女欧美一区二区| 建设人人有责人人尽责人人享有的 | kizo精华| 在线观看美女被高潮喷水网站| 国产午夜精品论理片| 精品99又大又爽又粗少妇毛片| 午夜精品在线福利| 桃色一区二区三区在线观看| 日韩一区二区三区影片| 日本爱情动作片www.在线观看| 亚洲国产欧洲综合997久久,| 国产精品福利在线免费观看| 精品不卡国产一区二区三区| 免费av观看视频| 亚洲天堂国产精品一区在线| 特大巨黑吊av在线直播| 久久久久久久国产电影| 91精品国产九色| 午夜精品国产一区二区电影 | 人人妻人人澡人人爽人人夜夜 | 久久亚洲精品不卡| 亚洲最大成人手机在线| 女人十人毛片免费观看3o分钟| 男女国产视频网站| 五月玫瑰六月丁香| 国产成年人精品一区二区| 国产亚洲91精品色在线| 国产伦精品一区二区三区四那| 国产精品不卡视频一区二区| 啦啦啦观看免费观看视频高清| 午夜免费男女啪啪视频观看| 欧美xxxx性猛交bbbb| 国产在视频线精品| 搡老妇女老女人老熟妇| 国产亚洲最大av| 又爽又黄a免费视频| 国产一级毛片在线| 一卡2卡三卡四卡精品乱码亚洲| 久久久色成人| 亚洲国产最新在线播放| 丰满少妇做爰视频| 成人av在线播放网站| 麻豆精品久久久久久蜜桃| 国产精品麻豆人妻色哟哟久久 | 日韩大片免费观看网站 | 日韩人妻高清精品专区| 日韩一本色道免费dvd| 哪个播放器可以免费观看大片| 免费看美女性在线毛片视频| 亚洲av一区综合| 国产高清有码在线观看视频| 亚洲国产精品成人综合色| 简卡轻食公司| 91精品国产九色| 又黄又爽又刺激的免费视频.| 午夜免费男女啪啪视频观看| 哪个播放器可以免费观看大片| 久久久久性生活片| 国产淫片久久久久久久久| 久久人人爽人人片av| 一级黄片播放器| 久久国内精品自在自线图片| 青春草亚洲视频在线观看| 亚洲精品456在线播放app| 水蜜桃什么品种好| 一二三四中文在线观看免费高清| 国产国拍精品亚洲av在线观看| 少妇丰满av| 国产精品无大码| 人妻夜夜爽99麻豆av| 搞女人的毛片| 亚洲在线观看片| 在线播放国产精品三级| av卡一久久| 91av网一区二区| 精品国产三级普通话版| 看非洲黑人一级黄片| 变态另类丝袜制服| 天天躁日日操中文字幕| 午夜激情欧美在线| 观看免费一级毛片| 人妻制服诱惑在线中文字幕| 亚洲精品aⅴ在线观看| av免费观看日本| 九色成人免费人妻av| 天美传媒精品一区二区| 一个人免费在线观看电影| 在现免费观看毛片| 国产在视频线精品| 一级毛片电影观看 | 国产高潮美女av| 日韩精品青青久久久久久| 少妇被粗大猛烈的视频| 一二三四中文在线观看免费高清| 亚洲成av人片在线播放无| 青青草视频在线视频观看| 韩国av在线不卡| 午夜视频国产福利| 国产精品福利在线免费观看| 少妇裸体淫交视频免费看高清| 热99re8久久精品国产| av在线亚洲专区| av.在线天堂| 精品久久国产蜜桃| 99热全是精品| 亚洲国产日韩欧美精品在线观看| 蜜臀久久99精品久久宅男| 高清av免费在线| 超碰97精品在线观看| 欧美不卡视频在线免费观看| 久久婷婷人人爽人人干人人爱| 一本久久精品| 青春草视频在线免费观看| 熟女电影av网| 99久久精品热视频| 欧美zozozo另类| 久久精品久久久久久久性| 国产午夜精品一二区理论片| 久久热精品热| 国产亚洲91精品色在线| 嫩草影院入口| 国产成年人精品一区二区| av天堂中文字幕网| 一级黄色大片毛片| 国产三级中文精品| 97在线视频观看| 亚洲四区av| 日本一本二区三区精品| 熟女电影av网| 热99在线观看视频| 欧美性感艳星| 国产乱来视频区| 少妇的逼水好多| 亚洲中文字幕一区二区三区有码在线看| 校园人妻丝袜中文字幕| 欧美人与善性xxx| 色尼玛亚洲综合影院| 亚洲在久久综合| 深夜a级毛片| 美女国产视频在线观看| 国产一区二区在线av高清观看| 禁无遮挡网站| 少妇的逼水好多| 欧美又色又爽又黄视频| 久久精品国产自在天天线| 最近视频中文字幕2019在线8| 三级毛片av免费| 亚洲av中文字字幕乱码综合| 一区二区三区高清视频在线| 亚洲精品乱久久久久久| 好男人视频免费观看在线| 国语对白做爰xxxⅹ性视频网站| 高清在线视频一区二区三区 | 男人和女人高潮做爰伦理| 直男gayav资源| 一级黄色大片毛片| 七月丁香在线播放| 一区二区三区免费毛片| 内地一区二区视频在线| 白带黄色成豆腐渣| 亚洲欧洲国产日韩| 中国国产av一级| 精品人妻熟女av久视频| a级一级毛片免费在线观看| 国产一级毛片七仙女欲春2| 欧美日韩在线观看h| 99九九线精品视频在线观看视频| 少妇熟女欧美另类| 国产美女午夜福利| 精品少妇黑人巨大在线播放 | 狂野欧美激情性xxxx在线观看| 热99re8久久精品国产| a级一级毛片免费在线观看| 久久热精品热| 综合色av麻豆| 国产精华一区二区三区| 免费无遮挡裸体视频| 久久久久久九九精品二区国产| 男女边吃奶边做爰视频| 国产69精品久久久久777片| 日日摸夜夜添夜夜添av毛片| 晚上一个人看的免费电影| 国产亚洲精品av在线| 人人妻人人澡欧美一区二区| 国产精品女同一区二区软件| 超碰97精品在线观看| 亚洲成av人片在线播放无| 日韩精品青青久久久久久| 色综合站精品国产| 人妻少妇偷人精品九色| 国产精品人妻久久久久久| 久久99蜜桃精品久久| 91久久精品国产一区二区成人| 国产一区二区在线观看日韩| 69人妻影院| 水蜜桃什么品种好| 女人久久www免费人成看片 | 亚洲国产欧洲综合997久久,| 亚洲欧美日韩卡通动漫| 亚洲内射少妇av| 成年av动漫网址| 中文天堂在线官网| 欧美性感艳星| 亚洲精品乱码久久久v下载方式| av福利片在线观看| 国产精品三级大全| 乱码一卡2卡4卡精品| av在线蜜桃| 最近中文字幕高清免费大全6| 级片在线观看| 日本黄色视频三级网站网址| 97超视频在线观看视频| 成人二区视频| 亚洲色图av天堂| 高清日韩中文字幕在线| 国产美女午夜福利| 国产午夜精品论理片| 亚洲美女视频黄频| 极品教师在线视频| 亚洲av电影不卡..在线观看| 亚洲欧美精品自产自拍| 舔av片在线| 久久精品国产亚洲av天美| 亚洲第一区二区三区不卡| 国产精品三级大全| 亚洲最大成人手机在线| 国产在视频线在精品| 国内精品美女久久久久久| 噜噜噜噜噜久久久久久91| 欧美成人免费av一区二区三区| 亚洲第一区二区三区不卡| 国产精品一及| 日本欧美国产在线视频| 午夜视频国产福利| 亚洲欧美成人综合另类久久久 | 好男人视频免费观看在线| 亚洲av中文字字幕乱码综合| av在线观看视频网站免费| 人妻少妇偷人精品九色| 大又大粗又爽又黄少妇毛片口| 亚洲av成人精品一二三区| 精品人妻熟女av久视频| 国产黄片美女视频| 国产一区二区在线观看日韩| 午夜福利在线观看吧| 天堂影院成人在线观看| 老司机影院毛片| 日韩欧美三级三区| 国产69精品久久久久777片| 日日摸夜夜添夜夜添av毛片| 天堂√8在线中文| 中文乱码字字幕精品一区二区三区 | 国产av码专区亚洲av| 色播亚洲综合网| 国产乱人偷精品视频| 黄色欧美视频在线观看| 永久免费av网站大全| 性插视频无遮挡在线免费观看| 91精品一卡2卡3卡4卡| 国产成人福利小说| 国产精品三级大全| 国产美女午夜福利| 男的添女的下面高潮视频| 一区二区三区乱码不卡18| 国产黄片美女视频| 免费观看性生交大片5| 看免费成人av毛片| 最近中文字幕高清免费大全6| 麻豆成人av视频| 久久综合国产亚洲精品| 久久久久久久久中文| or卡值多少钱| 国产精品不卡视频一区二区| 成人漫画全彩无遮挡| 久久久欧美国产精品| or卡值多少钱| 91精品一卡2卡3卡4卡| or卡值多少钱| 91狼人影院| 亚洲欧洲日产国产| 午夜视频国产福利| 国产亚洲最大av| 欧美日本视频| 深爱激情五月婷婷| 日本三级黄在线观看| 夜夜看夜夜爽夜夜摸| 99久久精品国产国产毛片| 亚洲中文字幕日韩| 毛片女人毛片| 永久免费av网站大全| 乱系列少妇在线播放| 日韩精品青青久久久久久| 免费黄色在线免费观看| 汤姆久久久久久久影院中文字幕 | 高清av免费在线|