• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于無監(jiān)督學(xué)習(xí)的可持續(xù)發(fā)展目標(biāo)數(shù)據(jù)分類

    2021-09-17 09:43:30雷聲黎建輝張麗麗
    關(guān)鍵詞:詞頻類別文檔

    雷聲,黎建輝,張麗麗

    1.中國科學(xué)院計算機網(wǎng)絡(luò)信息中心,北京 100190 2.中國科學(xué)院大學(xué),北京 100049

    引言

    聯(lián)合國可持續(xù)發(fā)展目標(biāo)(Sustainable Development Goals,SDGs)是聯(lián)合國在2015年9月制定的17 個全球發(fā)展目標(biāo),旨在從2015年—2030年間以綜合方式徹底解決社會、經(jīng)濟和環(huán)境三個維度的發(fā)展問題,從而轉(zhuǎn)向可持續(xù)發(fā)展道路[1]。SDGs 數(shù)據(jù)對可持續(xù)發(fā)展工作具有極為重要的指導(dǎo)意義,它對可持續(xù)發(fā)展給出了細致而全面的數(shù)據(jù)指標(biāo),涉及范圍極廣,值得研究的相關(guān)數(shù)據(jù)也極多。數(shù)據(jù)與計算技術(shù)飛速發(fā)展,在科學(xué)研究中能夠起到輔助與支撐的作用,甚至能夠驅(qū)動和引領(lǐng)科學(xué)研究活動[2]。截至目前,對SDGs 數(shù)據(jù)及工作進行研究討論的中英文文獻數(shù)量已經(jīng)達到了數(shù)十萬篇。SDGs 所涉及的龐大數(shù)據(jù)量在為相關(guān)科研工作提供信息的同時也提高了科研人員的使用難度,要想在如此海量的數(shù)據(jù)中獲得與研究目標(biāo)相關(guān)的數(shù)據(jù),就必須將數(shù)據(jù)進行合理的分類。機器學(xué)習(xí)時代的來臨實現(xiàn)了很多技術(shù)上的應(yīng)用[3]。聯(lián)合國為SDGs 中的每項指標(biāo)都提供了詳細的描述文檔,基于機器學(xué)習(xí)利用這些描述文檔為數(shù)據(jù)進行分類可以更好地為從事SDGs 相關(guān)研究的科研人員提供便利。

    現(xiàn)有的文本分類算法大多屬于有監(jiān)督模型,它需要大量人工標(biāo)注的文檔作為訓(xùn)練集,而聯(lián)合國官方能夠提供的標(biāo)記數(shù)據(jù)極少,利用有監(jiān)督甚至半監(jiān)督模型都難以得到令人滿意的效果。且聯(lián)合國為每個SDGs 指標(biāo)都制定了詳細的描述文檔,人工地根據(jù)這些文檔對數(shù)據(jù)進行標(biāo)記會是一個復(fù)雜而耗時的工程。因此,使用無監(jiān)督算法來進行實際分類是更為合適的選擇。本文基于數(shù)據(jù)描述無監(jiān)督地對科學(xué)數(shù)據(jù)進行了SDGs 相關(guān)性分類,主要分為以下兩個階段:

    (1)類別描述信息篩選。本文綜合textrank 和相對詞頻統(tǒng)計(Relative Frequency,RF)的方法,無監(jiān)督地從聯(lián)合國所提供指標(biāo)描述文檔中提取指標(biāo)關(guān)鍵詞集,以此作為類別描述信息。

    (2)數(shù)據(jù)分類。本文將類別信息和數(shù)據(jù)描述信息投影到同一語義空間中,基于相似度匹配的自學(xué)習(xí)算法無監(jiān)督地對數(shù)據(jù)進行了分類。

    在聯(lián)合國官方所提供的官方數(shù)據(jù)集上的測試表明,我們對SDGs 科學(xué)數(shù)據(jù)的分類是有效的;且相對于目前主流的基于主題模型的無監(jiān)督文本分類算法而言,我們所提模型能夠取得更好的效果。

    1 相關(guān)工作

    1.1 無監(jiān)督文本關(guān)鍵詞提取

    無監(jiān)督的文本關(guān)鍵詞提取方法種類繁多,但按其原理大致可以分為以下三類:基于統(tǒng)計的方法、基于圖結(jié)構(gòu)的方法以及基于語義的方法。

    (1)基于統(tǒng)計的方法通常綜合統(tǒng)計TFIDF[4]、詞共現(xiàn)[5]、詞頻[6]、詞性[7]等一系列指標(biāo)信息,再根據(jù)這些指標(biāo)進行排序。例如羅燕等人[6]通過齊普夫定律推導(dǎo)出文本中同頻詞數(shù)的計算公式,并綜合詞頻統(tǒng)計和TFIDF 進行了關(guān)鍵詞提?。籅arker 等人[7]通過詞頻及詞長等特征選擇性提取名詞短語作為文本關(guān)鍵詞;Song 等人[4]綜合單詞詞性的語法信息和TFIDF 信息提出了一種新聞關(guān)鍵詞提取方法。這種方法簡單易用,但需要大量文本進行對比統(tǒng)計,在文本數(shù)量較少的情況下效果不佳。

    (2)基于圖結(jié)構(gòu)的方法將詞語視作圖中的節(jié)點,按照特定的規(guī)則為節(jié)點之間進行關(guān)聯(lián),據(jù)此迭代計算詞語的重要性。典型地,Mihalcea 等人[8]提出的textrank 模型基于google 所提Pagerank 的鏈接分析理論,通過迭代計算節(jié)點邊緣權(quán)重來計算詞語重要性;Bellaachia 等人[9]提出的NERank 模型在節(jié)點邊緣權(quán)重的基礎(chǔ)上,也考慮了單詞權(quán)重;Saroj 等人[10]綜合考慮詞語節(jié)點的中心程度、位置、詞頻、及鄰居頻數(shù)來考慮節(jié)點的重要性,從而提取關(guān)鍵詞。這種方法比較靈活,既可以僅利用文檔本身的信息來完成關(guān)鍵詞抽取,也可以很容易地融合外界權(quán)重、相似度等信息來綜合構(gòu)建詞圖網(wǎng)絡(luò)。

    (3)基于語義的方法通常使用PLSA[11]、LDA[12]等主題模型或者word2vec[13]等語言模型對文本和詞匯進行語義建模,進而抽取關(guān)鍵詞。例如石晶等人[14]基于LDA 得到文本和詞匯的主題分布,通過比對詞與文檔的主題分布情況來獲取關(guān)鍵詞;劉嘯劍等人[15]利用文檔和詞語的主題信息并結(jié)合詞語的統(tǒng)計特征來為候選詞打分。這種方法能夠獲取語義相似性的關(guān)系,因此常常能夠獲得不錯的效果。

    本文綜合了相對詞頻和textrank 的方法從聯(lián)合國提供的SDGs 描述文檔中抽取關(guān)鍵詞,以得到SDGs 類別描述詞集。

    1.2 無監(jiān)督文本分類

    現(xiàn)有的無監(jiān)督文本分類研究按照其思想可被大致分為以下兩類:基于相似度匹配的方法和基于主題模型的方法。

    (1)基于相似度匹配的方法通常通過計算、對比類別描述和文本之間的相似度來實現(xiàn)分類,它并不關(guān)注樣本本身,而是將文本和類別投影到同一語義空間中并直接對二者進行比較,廣泛適用于各種數(shù)據(jù)集。例如Druck 等人[16]首先預(yù)定義一批類別關(guān)鍵詞,利用最大熵算法,最大化文檔的預(yù)期類別分布與類別中相應(yīng)關(guān)鍵詞的類別分布之間的相似度來優(yōu)化分類器參數(shù);Chang 等人[17]通過基于英文維基百科的顯示語義分析(Explicit Semantic Analysis,ESA)來計算文檔與類別描述之間的相似度,但這種方法需要準(zhǔn)確地用詞條描述來替換對應(yīng)詞條,難以推廣到概念描述不夠多的其他領(lǐng)域及數(shù)據(jù)集中;Song 等人[18]同樣利用ESA 來評估文檔-類別相似度,并通過對類別進行分層來解決類別重合,獲得了良好的效果。

    (2)基于主題模型的方法通常先學(xué)習(xí)文檔集得到聯(lián)合概率分布,再通過聯(lián)合概率分布得到條件概率分布實現(xiàn)分類,它基于數(shù)據(jù)集中的共現(xiàn)分布進行推理,能夠很好地分析文本本身的特點且不依賴于外界知識庫,是目前主流的無監(jiān)督文本分類方法。但由于主題模型的分布推理通?;诠铂F(xiàn)統(tǒng)計,當(dāng)面對小規(guī)模數(shù)據(jù)集或短文本數(shù)據(jù)集時,詞共現(xiàn)矩陣往往過于稀疏,因此在這些數(shù)據(jù)集上的應(yīng)用效果并不理想。Xia 等人[19]首先利用類別描述種子詞產(chǎn)生少量文本,通過LDA 推理得到類別的狄利克雷先驗(主題-詞矩陣),再通過詞分布推斷具體文本的類別分布; Li 等人[20]直接利用類別描述種子詞集和主題模型進行主題推斷,從而完成對文本種類標(biāo)簽的預(yù)測;Yang 等人[21]為了解決短文本數(shù)據(jù)集共現(xiàn)矩陣稀疏的問題,將文本中的詞排列組合成二元詞組來構(gòu)建共現(xiàn)矩陣,但這種重復(fù)統(tǒng)計所帶來的提升非常有限,效果依然不夠理想。

    由于基于主題模型的方法在短文本上應(yīng)用效果不佳,而SDGs 數(shù)據(jù)描述文本的長度通常在10~100詞之間,屬于短文本。因此,本文主要采用了基于相似度匹配的方法,一方面,本文利用詞向量構(gòu)建通用語義空間,直接通過文本-類別間的距離度量來對文本進行分類,以適應(yīng)不同類型的文本數(shù)據(jù);另一方面,也利用同類文本中詞匯的相似分布,通過自訓(xùn)練算法對分類器進行迭代更新。

    2 SDGs 數(shù)據(jù)分類方法設(shè)計

    本文對SDGs 科學(xué)數(shù)據(jù)進行分類的流程框架如圖1所示,主要包括數(shù)據(jù)提取和文本分類兩個部分。

    圖1 基于無監(jiān)督的SDGs 數(shù)據(jù)分類Fig.1 Unsupervised SDGs data classification

    (1)數(shù)據(jù)提取。根據(jù)聯(lián)合國提供的指標(biāo)類別描述文檔,利用綜合textrank 和相對詞頻統(tǒng)計的關(guān)鍵詞抽取算法提取出SDGs 類別關(guān)鍵詞作為類別描述,提取待分類的科學(xué)數(shù)據(jù)中的標(biāo)題及描述信息得到數(shù)據(jù)描述文本。

    (2)文本分類。通過一個基于無監(jiān)督的文本分類算法根據(jù)(1)中提取出的數(shù)據(jù)描述文本對科學(xué)數(shù)據(jù)進行歸類。

    2.1 SDGs 類別關(guān)鍵詞提取

    由于本文提取類別關(guān)鍵詞來表征類別信息,這些關(guān)鍵詞應(yīng)當(dāng)具有兩個特點:(1)能夠概括類別;(2)能夠與其他類別進行區(qū)分。前者需要利用常規(guī)的關(guān)鍵詞抽取算法如TFIDF、textrank 等對官方所給描述文檔進行精煉提取,后者需要關(guān)鍵詞為類別專屬詞或具有足夠的類別區(qū)分度。在本文中,我們首先采用textrank 初篩出類別關(guān)鍵詞,再根據(jù)詞頻計算詞語的相對詞頻,再次篩選得到具有區(qū)分度的詞語集合作為最終的類別描述。

    首先,我們根據(jù)文本內(nèi)部之間的共現(xiàn)關(guān)系構(gòu)建詞圖,首先利用textrank 公式迭代計算各個詞語節(jié)點的重要度得分,初步篩選出較多的類別描述詞;然后,我們通過公式(1)來統(tǒng)計獲取類別i中候選詞w的相對詞頻RF(w,i),為每個類進行再次篩選,得到少量具有類別區(qū)分度的最終類別關(guān)鍵詞。

    其中│Di│代表類別i中包含的文檔數(shù)量,nw,i則為詞語w在類別i中出現(xiàn)的次數(shù),TF(w,i)代表詞w在類別i中出現(xiàn)的頻率。SDGs 中每個類別中包含的文檔數(shù)量可能有較大差別,因此在計算類間相對性時需要排除這個因素影響。

    2.2 基于無監(jiān)督的文本分類

    本文所設(shè)計的基于詞向量的無監(jiān)督文本分類模型(Seedword and Embedding based Text Classification,SeedETC)以類別描述詞集和待分類數(shù)據(jù)描述文本集及對應(yīng)的初始化權(quán)重為輸入,利用詞向量將這些文本投影到同一語義空間,通過類EM 算法的自訓(xùn)練迭代算法[21]更新分類器模型的相關(guān)參數(shù),并輸出文本對應(yīng)的類別標(biāo)簽,主要包括以下四個步驟:

    (1)詞向量編碼:利用已有詞向量模型對類別描述詞集及待分類文本進行編碼,得到詞向量集;

    (2)文本分類:根據(jù)詞向量及文本權(quán)重對待分類文檔進行分類;

    (3)模型更新:對分類結(jié)果進行評估,更新部分樣本的類別標(biāo)記,更新類別描述詞、類別詞權(quán)重及文本權(quán)重。

    (4)重復(fù)(1)、(2)、(3)步直到模型收斂。

    2.2.1 詞向量編碼

    詞向量使得詞之間存在“距離”概念,從而能夠表征詞之間的相似關(guān)系。使用詞向量進行詞的向量化表示時,能夠充分考慮到文本的局部和整體信息[22]。本層將文檔以及類別描述中的所有詞表征為向量的形式。目前,主流詞向量的表示方法有三種:一是基于詞頻統(tǒng)計的方式,比如使用全局矩陣分解的LSA[24]等,這種方式需要大量數(shù)據(jù)提供足夠的共現(xiàn)統(tǒng)計信息,不適用于本文任務(wù);第二種是基于局部上下文窗口的方式,如word2vec[25]、glove[26]等,能夠用于多種場景,計算代價低,效果也很好,是目前主流的詞向量表示方式;第三種則是基于預(yù)訓(xùn)練任務(wù)得到附屬詞向量產(chǎn)物的方式,如bert[27]等,這類模型相較于第二種效果更好,但其模型復(fù)雜,計算代價高,單純作為詞向量使用不夠靈活。因此,本文采用了拼接大規(guī)模語料和新領(lǐng)域語料的glove 詞向量來完成單詞的向量化編碼。

    由于glove 是基于全局共現(xiàn)統(tǒng)計的算法,難以實現(xiàn)增量訓(xùn)練,而為了擬合數(shù)據(jù)集的分布,本文最終在經(jīng)過大規(guī)模語料D0預(yù)訓(xùn)練得到的glove 模型基礎(chǔ)上,額外使用待分類數(shù)據(jù)SDGs 元數(shù)據(jù)描述語料D1訓(xùn)練得到新數(shù)據(jù)分布的詞向量,將這兩種向量歸一化后進行加權(quán)拼接,得到最終的詞向量,如公式(2)所示:

    2.2.2 文本分類

    在文本分類層,我們依據(jù)文檔詞與類別描述詞間的距離對文本進行分類。與常見的先對詞向量進行拼接或加權(quán)平均構(gòu)造文本向量,通過計算待分類文本與類別描述文本的向量間距來衡量文本與類別相似度的方法不同,本文使用詞作為一個獨立的單位,并不根據(jù)文檔對詞進行整合。在分類時,本層通過詞-詞、詞-類別、文本-類別3 個階段來計算文本與類別間的相似度,如算法1所示。

    算法1:文本分類器輸入:待分類數(shù)據(jù)描述文本d的詞向量集,Ew,d;類別描述文本Li的詞向量集,Ew,Li;閾值窗口大小Cd;文本權(quán)重向量 Wd,l ;輸出:數(shù)據(jù)分類結(jié)果,prediction(d);文本d與各個類別的Li的相似度 ,sim(d,Li)Initialize:Wd,l=[1 for Li in Labels]For Li in labels do For wd in document d do For wLi in label Li descriptions do

    其中,由于一篇文本中具有很多通用詞,在各個類別中分布都較為均勻,我們通過窗口Cd篩除掉這些對分類無意義的詞,只保留與分類有關(guān)詞的信息。

    2.2.3 模型更新

    本層的作用主要有以下兩個方面:一方面是更新文本標(biāo)記,利用改進的輪廓系數(shù)指標(biāo)來評估分類結(jié)果,為被認為正確分類的文本更新類別標(biāo)記;另一方面對分類器參數(shù)進行更新,利用分類結(jié)果、文本與類別及數(shù)據(jù)集中其他文本的相似度,更新分類器中的類別描述詞及其權(quán)重、文本權(quán)重等參數(shù)。

    (1)文本標(biāo)簽更新

    本文通過改進原用于評估聚類效果的輪廓系數(shù)(silhouettes)算法[28]來評估每個節(jié)點與類別的相對相關(guān)性。假定在分類層我們認為文檔d屬于類別Li(d與類別Li的相似度最高),那么輪廓系數(shù)公式如式(3)所示。

    很容易發(fā)現(xiàn)silhouettes 公式的分母是為了除去相似度大小因素的影響而只關(guān)注距離的相對比例。但在實驗中我們發(fā)現(xiàn),相似度本身數(shù)值大小也非常重要,因此我們?nèi)サ袅耸?3)中的分母,據(jù)此得到改進的分類評估公式:

    在每輪迭代時,根據(jù)剩余待分類樣本數(shù)設(shè)定一個評估閾值,對所有分類評估分數(shù)高于閾值的樣本更新其類別標(biāo)簽,剩余樣本則投入下一輪訓(xùn)練。

    (2)分類器參數(shù)更新

    對于分類器,主要需要更新以下3 種參數(shù):類別描述詞、類別描述詞權(quán)重和文本權(quán)重。

    由于我們需要的類別描述詞需要滿足對類別的高區(qū)分度條件,因此本文通過相對詞頻統(tǒng)計來更新每個類別的描述詞。首先,從已更新標(biāo)簽的文本集中選出類別c 中的高頻詞作為該類別候選詞,并計算這些詞在當(dāng)前類與其他類別中的相對詞頻比例:

    我們認為高頻詞可以有效表征類別,而相對詞頻比越高,說明這個詞的類別區(qū)分度越高,最終篩選出相對詞頻比排名更高且滿足最低閾值的少量詞作為本輪分類器中更新的類別描述詞。

    由于我們利用了相對詞頻比來獲取具有高區(qū)分度的關(guān)鍵詞,單純利用已更新標(biāo)簽的文本來更新其權(quán)重,將會導(dǎo)致權(quán)重偏高。為了獲取更真實的詞分布信息,我們借鑒了姜震等人[29]利用不精確的偽標(biāo)簽(Pseudo label)擴充訓(xùn)練集的思想,利用了全體樣本來更新類別描述詞的權(quán)重。將所有樣本在當(dāng)前輪次中的預(yù)測結(jié)果作為偽標(biāo)簽,通過詞頻統(tǒng)計來更新詞權(quán)重。綜合以上考慮,最終確定類別描述詞權(quán)重W(w,c)更新公式如式(6)所示:

    在本文中,文本與文本間的相似度完全由單詞計算得到,沒有利用到任何詞序信息,無法識別到長詞組。因此,本文對待分類文本進行了二元詞組統(tǒng)計,并基于統(tǒng)計結(jié)果計算待分類文本間的相似度,通過相似度閾值篩選得到文檔d的近鄰文本集neighbord,并依據(jù)屬于類別Li的已標(biāo)記近鄰樣本提高該文檔對于類別Li的權(quán)重:

    3 SDGs 數(shù)據(jù)分類實驗

    3.1 實驗數(shù)據(jù)

    本文在聯(lián)合國官方所提供的SDGs 指標(biāo)元數(shù)據(jù)集[30]上進行了類別描述關(guān)鍵詞集的構(gòu)建,并以聯(lián)合國官方SDGs 數(shù)據(jù)庫[31]為實驗數(shù)據(jù)集,驗證了本文所提框架的有效性。

    在數(shù)據(jù)集處理方面,對于聯(lián)合國所提供的257個SDGs 元數(shù)據(jù),我們僅僅保留每個文檔中的goal、target、indicator,computation method 和definition,concepts 字段,其他諸如Disaggregation、Collection process 等字段被過濾掉。對2 個數(shù)據(jù)集我們均采用了傳統(tǒng)的文本預(yù)處理流程來對這些數(shù)據(jù)集進行簡單預(yù)處理,利用nltk[32]來對文本進行分詞、去掉停用詞、詞形還原并剔除詞向量模型中不包含的詞匯得到我們所使用的數(shù)據(jù)集,其基本信息如表1所示。由于SDGs 數(shù)據(jù)庫所包含的詞數(shù)較少,不作詞頻的限制,對于SDGs 指標(biāo)元數(shù)據(jù)集,我們額外篩除了詞頻低于5 的詞,以減少噪音的產(chǎn)生。在實驗類別選擇方面,聯(lián)合國官方將SDGs 指標(biāo)統(tǒng)分為17 個可持續(xù)發(fā)展目標(biāo),并在這17 個一級目標(biāo)(goal)下逐級細分,得到169 個二級目標(biāo)(target)乃至257 個三級指標(biāo)(indicator)。本文按照17 個一級目標(biāo)劃分類別,并在此基礎(chǔ)上進行分類實驗。

    表1 SDGs 數(shù)據(jù)集信息Table 1 Information of SDGs datasets

    3.2 實驗相關(guān)參數(shù)

    (1)關(guān)鍵詞提?。涸趖extrank 算法中,我們設(shè)置其阻尼系數(shù)為0.85,窗口大小為5,邊和節(jié)點的權(quán)重都初始化為1。在抽取過程中,首先通過textrank獲取評分靠前的200 個候選詞,再篩出相對詞頻系數(shù)大于2 的少量關(guān)鍵詞作為當(dāng)前類別的描述詞集。

    (2)文本分類層:由于數(shù)據(jù)描述通常較短(SDGs數(shù)據(jù)庫中的數(shù)據(jù)描述平均長度僅為11 個單詞),本文將窗口Cn 固定為5。

    (3)模型更新層:標(biāo)簽更新的閾值由每輪的更新樣本數(shù)量決定,按照實驗數(shù)據(jù)集的具體規(guī)模,本文在實驗中每輪更新200 個數(shù)據(jù)的標(biāo)簽;而對于類別描述詞的更新閾值,本文實驗設(shè)置每輪每類關(guān)鍵詞更新數(shù)量不超過2 個,且其詞頻比需滿足最低閾值0.8;對于類別描述權(quán)重,實驗將公式(7)中的值設(shè)為0.5,值設(shè)為0.05,k 值設(shè)為1/17;對于近鄰樣本,規(guī)定相似度大于0.2 的樣本為近鄰樣本。

    1)喘證急性加重期;2)排除間質(zhì)性肺病,肺癌等其他需要治療的慢性肺部疾??;合并嚴(yán)重的呼吸、循環(huán)、泌尿、血液、神經(jīng)和內(nèi)分泌系統(tǒng)等疾病、精神患者、惡性腫瘤、傳染病患者;妊娠期或哺乳期婦女;近半年內(nèi)已接受過中藥貼敷治療、刮痧、穴位拔罐的患者;3)貼敷穴位、刮痧部位有皮損或瘢痕體質(zhì)者,及對藥物或敷料特別敏感的患者;4)研究者認為不適合參加本研究者。

    3.3 實驗結(jié)果分析

    3.3.1 對比實驗

    (1)類別關(guān)鍵詞提取實驗

    為了驗證我們所使用的關(guān)鍵詞提取算法的有效性,我們將以下兩種常規(guī)的文檔關(guān)鍵詞提取算法在SDGs 元數(shù)據(jù)集的提取結(jié)果也應(yīng)用于數(shù)據(jù)分類中,并根據(jù)最終的分類結(jié)果進行對比。

    ①TFIDF[4]:首先將同類別的文檔拼接成一整篇類別描述文檔,再利用TFIDF 公式從類別描述文檔集中抽取得到類別關(guān)鍵詞集。

    ②textrank[8]:與TFIDF 實驗類似,首先將同類別文檔進行拼接,再對不同類別的描述文檔分別構(gòu)建圖網(wǎng)絡(luò),通過textrank 算法提取文檔關(guān)鍵詞,篩除類別重復(fù)詞,得到最終的關(guān)鍵詞集。

    (2)數(shù)據(jù)分類實驗

    為了驗證所提方法在無監(jiān)督文本分類任務(wù)上的有效性,我們選取了以下基準(zhǔn)模型,在textrank+RF方法提取得到的關(guān)鍵詞基礎(chǔ)上進行了對比實驗。

    ②STM[20]:使用人工設(shè)定的少量類別描述種子詞,利用主題模型對文本進行分類,該方法在長文本上獲得了很好的效果。

    ③SeedBTM[21]:使用詞向量擴展得到更大的類別描述詞集合,對文本中的單詞進行排列組合得到二元詞組,在這些詞組基礎(chǔ)上構(gòu)建二元主題模型,在短文本上獲得了比STM 更好的效果。

    (3)詞向量模型對比實驗

    為了探討不同詞向量模型對實驗結(jié)果的影響,我們在常用的glove、Bert 預(yù)訓(xùn)練模型所產(chǎn)生的詞向量上進行了對比實驗。

    ①glove[26]:由于glove 詞向量利用到了統(tǒng)計信息,難以進行增量訓(xùn)練。我們采用了stanford 開源提供的100 維詞向量[33]作為外界語料詞向量,同時在SDGs 元數(shù)據(jù)集綜合SDGs 待分類數(shù)據(jù)集上進行g(shù)love 訓(xùn)練得到的詞向量作為語料向量,并以1:2進行加權(quán)組合。

    ②Bert[27]:本文以google 開源提供的預(yù)訓(xùn)練語言模型[34]作為基礎(chǔ),在SDGs 元數(shù)據(jù)集和待分類數(shù)據(jù)集上進行增量訓(xùn)練,以最后一層的輸出作為最終使用的詞向量。

    3.3.2 實驗結(jié)果及分析

    本文所采用的綜合textrank 和相對詞頻方法的關(guān)鍵詞提取結(jié)果如表2所示。

    表2 SDGs 中g(shù)oal 層面的類別關(guān)鍵詞提取結(jié)果Table 2 Category keyword extraction results at the goal level in SDGs

    類別關(guān)鍵詞集14fish,marine,fishery,ocean,sustainable,ph 15specie,wildlife,forest,biodiversity 16right,develop,victim,traffic,chamber 17development,least,worldwide,broadband,statistical,partnership

    在將類別描述詞集應(yīng)用于分類算法時,我們發(fā)現(xiàn),一方面類別描述并非越詳細越好,而應(yīng)該在能夠描述類別的基礎(chǔ)上盡量保證類別之間的差距足夠大,以得到一個盡量準(zhǔn)確的初始分類界面。當(dāng)類別關(guān)鍵詞集過大時,詞集中往往擁有很多噪聲信息,初始分類界面不夠準(zhǔn)確,導(dǎo)致分類效果不佳;當(dāng)類別關(guān)鍵詞集過小時,類別描述不夠充分,部分文檔無法分類,分類效果也不理想。

    如圖2所示,在分類器第一輪迭代上的對比實驗表明,當(dāng)相對詞頻篩選閾值不超過某個值時(閾值過高會使得描述詞集過小,只有2-3 個詞),相對詞頻分數(shù)越低,分類的準(zhǔn)確度也會隨之降低。因此,我們最終所選相對詞頻分數(shù)的閾值大小為2,以保證最終每個類別的描述詞集大小在5 左右。

    圖2 在不同相對詞頻閾值下的分類準(zhǔn)確度Fig.2 Classification accuracy of different relative word frequency thresholds

    表3 展示了不同方法在SDGs 數(shù)據(jù)庫上實驗得到的結(jié)果??梢钥闯觯c當(dāng)前主流的基于主題模型的分類方法相比,我們的分類方法取得了更好的效果;而與基礎(chǔ)的TFIDF 等關(guān)鍵詞提取算法相比,我們所使用的關(guān)鍵詞提取方法得到的詞匯更適用于本文模型。

    表3 文本分類實驗結(jié)果比較Table 3 Comparison of text classification experiment results

    更具體地,我們通過F1-micro 來對比評估SeedETC 的分類性能。由圖3 可以看出,我們所提SeedETC 方法對比SeedBTM 在F1-micro 指標(biāo)上提高了33%,而在不擅長短文本分類的STM 及DescLDA 上分別提升了39%和 52%。這主要是由于主題模型往往需要足夠大的數(shù)據(jù)集以支撐其基于詞共現(xiàn)統(tǒng)計的主題分布建模,而SDGs 數(shù)據(jù)集數(shù)據(jù)量較少,難以提供足夠的信息,導(dǎo)致共現(xiàn)矩陣過于稀疏,而我們的方法利用了外界訓(xùn)練得到的詞向量,除了數(shù)據(jù)集內(nèi)部分布外也能捕捉外界信息,因此能夠獲得更好的效果。此外,由實驗結(jié)果可以發(fā)現(xiàn),glove詞向量比經(jīng)過大規(guī)模預(yù)訓(xùn)練的bert 模型所得詞向量效果也要更好,初步推測這是由于數(shù)據(jù)集過小,bert詞向量受到外界噪聲信息影響較大,難以很好的表征SDGs 相關(guān)語料的分布造成的。Glove 詞向量直接對外界和SDGs 語料訓(xùn)練得到的詞向量進行加權(quán)拼接,更能夠表征SDGs 數(shù)據(jù)集內(nèi)部的詞匯分布。

    圖3 不同方法實驗得到的F1-micro 分數(shù)Fig.3 F1-micro scores obtained from experiments with different methods

    而在關(guān)鍵詞提取算法中,相較于常規(guī)TFIDF 及textrank 關(guān)鍵詞提取方法得到的類別描述詞集而言,我們利用textrank+RF得到的關(guān)鍵詞也具有明顯優(yōu)勢。

    由表3 可以看出,textrank+RF 方法所得關(guān)鍵詞在與TFIDF 的對比實驗中,其F1-micro 指標(biāo)上提升了7%,而在與textrank 的對比實驗中提升了25%。這主要是由于TFIDF 方法通過逆文檔頻率IDF,與其他類別文檔進行了一定的區(qū)分;textrank 方法只考慮了文檔內(nèi)部的高頻詞,缺少與其他類別之間關(guān)鍵詞的區(qū)分;我們的方法主要關(guān)注的就是詞語在不同類別間的相對詞頻,能夠得到具有極高類別區(qū)分度的單詞作為類別描述詞。這也在一定程度上印證了我們在前文中提出的類別描述不一定要足夠詳細但一定要有足夠的類別區(qū)分度的觀點。

    4 結(jié)束語

    本文以聯(lián)合國官網(wǎng)所提供的聯(lián)合國可持續(xù)發(fā)展目標(biāo)(SDGs)指標(biāo)數(shù)據(jù)集為例,設(shè)計了一種基于詞向量的無監(jiān)督文本分類方法(SeedETC)進行數(shù)據(jù)分類。其中,無監(jiān)督文本分類方法往往需要一些關(guān)鍵詞來提供類別信息,本文又提出了基于textrank 和相對詞頻的關(guān)鍵詞提取方法,從SDGs 元數(shù)據(jù)描述文檔中提取得到了類別描述關(guān)鍵詞集用于文本分類模型。實驗結(jié)果表明,我們的方法取得了較好的分類效果,取得了0.813 的micro-F1 score,且與其他無監(jiān)督文本分類方法對比,本文所提SeedETC 算法具有更好的性能。由于本文所使用算法高度依賴于詞向量,當(dāng)詞向量不能夠準(zhǔn)確表征數(shù)據(jù)分布時分類效果將會大幅下降,下一步工作中將會繼續(xù)探討更穩(wěn)定的詞向量改進方式,并探索將本文所使用方法應(yīng)用于其他領(lǐng)域。

    利益沖突聲明

    所有作者聲明不存在利益沖突關(guān)系。

    猜你喜歡
    詞頻類別文檔
    基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
    園林科技(2021年3期)2022-01-19 03:17:48
    有人一聲不吭向你扔了個文檔
    基于RI碼計算的Word復(fù)制文檔鑒別
    服務(wù)類別
    新校長(2016年8期)2016-01-10 06:43:59
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    詞頻,一部隱秘的歷史
    云存儲中支持詞頻和用戶喜好的密文模糊檢索
    論類別股東會
    商事法論集(2014年1期)2014-06-27 01:20:42
    以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報》學(xué)術(shù)研究特色
    圖書館論壇(2014年8期)2014-03-11 18:47:59
    中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
    免费看不卡的av| 日日爽夜夜爽网站| 国产老妇伦熟女老妇高清| 天天躁夜夜躁狠狠躁躁| 亚洲男人天堂网一区| 成人亚洲欧美一区二区av| 最新的欧美精品一区二区| 国产成人免费观看mmmm| 校园人妻丝袜中文字幕| 欧美 亚洲 国产 日韩一| 国产黄色视频一区二区在线观看| 999精品在线视频| 可以免费在线观看a视频的电影网站 | 久久精品国产a三级三级三级| 新久久久久国产一级毛片| 国产一区有黄有色的免费视频| 精品一区二区三卡| 亚洲精品一二三| 亚洲欧美成人精品一区二区| 少妇的逼水好多| 午夜福利视频在线观看免费| 少妇精品久久久久久久| 国产又色又爽无遮挡免| 深夜精品福利| 岛国毛片在线播放| 亚洲国产精品999| 久久久久久伊人网av| 91国产中文字幕| 叶爱在线成人免费视频播放| 丝袜美腿诱惑在线| 国产有黄有色有爽视频| 成人毛片a级毛片在线播放| 日产精品乱码卡一卡2卡三| 久久久亚洲精品成人影院| 国产精品蜜桃在线观看| 在线观看一区二区三区激情| 欧美黄色片欧美黄色片| 午夜福利在线免费观看网站| 天天躁夜夜躁狠狠久久av| 午夜福利网站1000一区二区三区| 免费高清在线观看视频在线观看| 久久精品国产自在天天线| √禁漫天堂资源中文www| 日本av手机在线免费观看| 久久97久久精品| 咕卡用的链子| 午夜日韩欧美国产| 99九九在线精品视频| 咕卡用的链子| 国语对白做爰xxxⅹ性视频网站| av天堂久久9| 国产精品欧美亚洲77777| 亚洲精品国产色婷婷电影| 久久99热这里只频精品6学生| 毛片一级片免费看久久久久| 热99国产精品久久久久久7| 欧美日韩av久久| 麻豆精品久久久久久蜜桃| 久久久精品区二区三区| 日韩,欧美,国产一区二区三区| 只有这里有精品99| 免费观看性生交大片5| 亚洲av综合色区一区| 国产av一区二区精品久久| 黄色一级大片看看| 我要看黄色一级片免费的| 99久久中文字幕三级久久日本| 一级毛片电影观看| 王馨瑶露胸无遮挡在线观看| 少妇熟女欧美另类| 晚上一个人看的免费电影| 91成人精品电影| 精品99又大又爽又粗少妇毛片| 日本午夜av视频| 亚洲熟女精品中文字幕| 欧美日韩精品成人综合77777| 菩萨蛮人人尽说江南好唐韦庄| 成人国产av品久久久| 久久精品国产亚洲av天美| 欧美av亚洲av综合av国产av | 1024香蕉在线观看| 黑丝袜美女国产一区| 日韩一本色道免费dvd| 免费观看在线日韩| 老鸭窝网址在线观看| 亚洲精品,欧美精品| 男的添女的下面高潮视频| 人人妻人人澡人人爽人人夜夜| 国产av精品麻豆| 精品酒店卫生间| 国产又爽黄色视频| 美女视频免费永久观看网站| 一区二区三区乱码不卡18| 91久久精品国产一区二区三区| av片东京热男人的天堂| 国产精品国产三级专区第一集| 久久久久精品人妻al黑| 18+在线观看网站| 黄色一级大片看看| 汤姆久久久久久久影院中文字幕| 日韩一卡2卡3卡4卡2021年| 2018国产大陆天天弄谢| 国产综合精华液| 9191精品国产免费久久| 精品国产超薄肉色丝袜足j| 精品酒店卫生间| 国产欧美亚洲国产| 久久免费观看电影| 少妇人妻久久综合中文| 久久综合国产亚洲精品| 久久久久网色| 如何舔出高潮| 国产午夜精品一二区理论片| 精品国产乱码久久久久久男人| 婷婷色麻豆天堂久久| 在线观看国产h片| 国产乱来视频区| 黄片小视频在线播放| 在线观看免费日韩欧美大片| 男男h啪啪无遮挡| 久久人人97超碰香蕉20202| 色94色欧美一区二区| 久久久久久伊人网av| 春色校园在线视频观看| 赤兔流量卡办理| 成人毛片a级毛片在线播放| 街头女战士在线观看网站| 国产老妇伦熟女老妇高清| 国产精品嫩草影院av在线观看| 久久人人爽人人片av| 国产深夜福利视频在线观看| 国产精品不卡视频一区二区| 大话2 男鬼变身卡| 久久精品国产自在天天线| 欧美国产精品一级二级三级| 在线观看免费高清a一片| 精品少妇一区二区三区视频日本电影 | 最近最新中文字幕大全免费视频 | 欧美精品高潮呻吟av久久| av.在线天堂| 亚洲精品国产一区二区精华液| 国产黄色视频一区二区在线观看| 伦理电影大哥的女人| 亚洲国产av影院在线观看| 国产免费一区二区三区四区乱码| 午夜福利一区二区在线看| 久久99蜜桃精品久久| 啦啦啦视频在线资源免费观看| av线在线观看网站| 美女大奶头黄色视频| 国产视频首页在线观看| 亚洲av在线观看美女高潮| 香蕉丝袜av| 在线观看三级黄色| 亚洲av综合色区一区| videosex国产| 777米奇影视久久| 国产成人aa在线观看| 人人妻人人爽人人添夜夜欢视频| 亚洲av男天堂| 国产日韩欧美视频二区| 99国产综合亚洲精品| 大码成人一级视频| 久久久久久免费高清国产稀缺| 黄色一级大片看看| 国产精品亚洲av一区麻豆 | 青春草视频在线免费观看| 男女边摸边吃奶| 日韩成人av中文字幕在线观看| 99久久人妻综合| 免费观看av网站的网址| 久久人人爽av亚洲精品天堂| 在线观看一区二区三区激情| 波多野结衣一区麻豆| 日韩欧美精品免费久久| 宅男免费午夜| 各种免费的搞黄视频| 亚洲欧美日韩另类电影网站| 女人久久www免费人成看片| 亚洲av.av天堂| 欧美精品亚洲一区二区| 波野结衣二区三区在线| 亚洲精品国产一区二区精华液| 国产亚洲一区二区精品| 中文字幕人妻丝袜制服| 色视频在线一区二区三区| 日日啪夜夜爽| 久久精品亚洲av国产电影网| av电影中文网址| av视频免费观看在线观看| 婷婷色综合大香蕉| 国产 精品1| 十八禁网站网址无遮挡| av网站在线播放免费| 青春草国产在线视频| 国产成人精品福利久久| 黑人猛操日本美女一级片| 欧美日韩亚洲高清精品| 亚洲精品aⅴ在线观看| 国产综合精华液| 极品少妇高潮喷水抽搐| 国产精品 国内视频| 色视频在线一区二区三区| 国产野战对白在线观看| 91午夜精品亚洲一区二区三区| 亚洲,一卡二卡三卡| 国产野战对白在线观看| 中文欧美无线码| 久久午夜福利片| 午夜福利乱码中文字幕| 日韩伦理黄色片| 免费日韩欧美在线观看| www.av在线官网国产| 亚洲精品乱久久久久久| 女的被弄到高潮叫床怎么办| 母亲3免费完整高清在线观看 | 久久毛片免费看一区二区三区| 欧美日韩视频精品一区| 日韩免费高清中文字幕av| 亚洲人成网站在线观看播放| 国产97色在线日韩免费| 女人被躁到高潮嗷嗷叫费观| 日韩人妻精品一区2区三区| 日本爱情动作片www.在线观看| 亚洲少妇的诱惑av| 视频在线观看一区二区三区| 亚洲综合精品二区| 国产欧美亚洲国产| 欧美日韩亚洲国产一区二区在线观看 | 两性夫妻黄色片| 亚洲精品国产av成人精品| 久久亚洲国产成人精品v| 国产国语露脸激情在线看| 成年人午夜在线观看视频| 成年人免费黄色播放视频| 国产一区亚洲一区在线观看| 激情视频va一区二区三区| 99国产综合亚洲精品| 国产日韩一区二区三区精品不卡| 五月伊人婷婷丁香| 2021少妇久久久久久久久久久| a级片在线免费高清观看视频| 成人国产麻豆网| 9热在线视频观看99| 亚洲精品美女久久av网站| av网站在线播放免费| 中文字幕亚洲精品专区| 在线观看免费日韩欧美大片| 亚洲一区中文字幕在线| 成人免费观看视频高清| 久久ye,这里只有精品| 纯流量卡能插随身wifi吗| 老司机影院毛片| 欧美精品av麻豆av| 国产亚洲精品第一综合不卡| 国产极品粉嫩免费观看在线| 性色av一级| 亚洲欧美精品自产自拍| 久久精品国产综合久久久| 欧美老熟妇乱子伦牲交| 熟女少妇亚洲综合色aaa.| 亚洲国产成人一精品久久久| 国产精品偷伦视频观看了| 日韩免费高清中文字幕av| 99国产精品免费福利视频| 2018国产大陆天天弄谢| 国产精品熟女久久久久浪| 精品亚洲成国产av| av在线app专区| 亚洲中文av在线| 最新中文字幕久久久久| 久久 成人 亚洲| 日韩制服丝袜自拍偷拍| 亚洲经典国产精华液单| 少妇人妻久久综合中文| 国产精品久久久久久av不卡| 久久久国产欧美日韩av| 满18在线观看网站| 男女边吃奶边做爰视频| 人妻系列 视频| 国产伦理片在线播放av一区| 日本av免费视频播放| 久久韩国三级中文字幕| 国产野战对白在线观看| 天堂中文最新版在线下载| 大码成人一级视频| 免费黄色在线免费观看| 午夜福利,免费看| 亚洲一区二区三区欧美精品| 天天躁夜夜躁狠狠久久av| 免费在线观看视频国产中文字幕亚洲 | 亚洲av免费高清在线观看| 亚洲 欧美一区二区三区| 免费观看性生交大片5| 欧美日韩视频高清一区二区三区二| 欧美日韩视频高清一区二区三区二| 国产精品久久久久久av不卡| 国产 一区精品| 18禁观看日本| 久久婷婷青草| 在线观看免费视频网站a站| 一本久久精品| 国产精品久久久久成人av| 两个人免费观看高清视频| 一区二区三区精品91| 一级毛片电影观看| 亚洲国产欧美日韩在线播放| 女性生殖器流出的白浆| 日韩三级伦理在线观看| 秋霞在线观看毛片| 大香蕉久久网| 久久久久视频综合| 久久人人爽人人片av| 国产一区二区激情短视频 | 丰满乱子伦码专区| 纯流量卡能插随身wifi吗| 精品国产露脸久久av麻豆| 夫妻午夜视频| 飞空精品影院首页| 国产免费福利视频在线观看| 9色porny在线观看| 国产免费又黄又爽又色| 波多野结衣一区麻豆| 国语对白做爰xxxⅹ性视频网站| 一区二区日韩欧美中文字幕| 国产 一区精品| 国精品久久久久久国模美| 人人妻人人澡人人看| 少妇猛男粗大的猛烈进出视频| videos熟女内射| 欧美日韩综合久久久久久| 免费av中文字幕在线| 777久久人妻少妇嫩草av网站| 午夜日韩欧美国产| 97在线人人人人妻| 午夜福利网站1000一区二区三区| 大片电影免费在线观看免费| 国产精品99久久99久久久不卡 | 国产亚洲av片在线观看秒播厂| 超碰成人久久| 乱人伦中国视频| 中文字幕人妻丝袜制服| 色哟哟·www| 午夜激情av网站| 一区二区日韩欧美中文字幕| 精品国产乱码久久久久久男人| 国产又色又爽无遮挡免| 在线天堂最新版资源| 久久99精品国语久久久| av免费观看日本| 爱豆传媒免费全集在线观看| 久久精品国产自在天天线| 午夜激情久久久久久久| 一二三四中文在线观看免费高清| 秋霞在线观看毛片| 精品一区二区三卡| 黑丝袜美女国产一区| 中文字幕色久视频| 自拍欧美九色日韩亚洲蝌蚪91| 国产成人a∨麻豆精品| 超碰97精品在线观看| 80岁老熟妇乱子伦牲交| 肉色欧美久久久久久久蜜桃| av福利片在线| 看免费av毛片| 精品国产超薄肉色丝袜足j| 午夜影院在线不卡| 欧美日韩一区二区视频在线观看视频在线| 精品国产乱码久久久久久小说| 国产视频首页在线观看| 亚洲四区av| 精品亚洲成国产av| 日本vs欧美在线观看视频| 久久精品国产亚洲av天美| 日韩伦理黄色片| 久久久久久人人人人人| 精品国产乱码久久久久久小说| 久热久热在线精品观看| 日本午夜av视频| 777久久人妻少妇嫩草av网站| videosex国产| 亚洲成av片中文字幕在线观看 | 久久99一区二区三区| 精品久久久久久电影网| 久久精品夜色国产| 国产一区二区激情短视频 | 日韩免费高清中文字幕av| 日韩在线高清观看一区二区三区| 性少妇av在线| 亚洲三区欧美一区| 欧美日韩一区二区视频在线观看视频在线| 久久久久久久久免费视频了| 在线观看一区二区三区激情| 欧美日韩精品成人综合77777| a级毛片黄视频| 90打野战视频偷拍视频| 青春草亚洲视频在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 国产精品无大码| 亚洲av免费高清在线观看| 精品视频人人做人人爽| 韩国精品一区二区三区| 大香蕉久久网| 高清av免费在线| 久久精品久久久久久久性| 日本-黄色视频高清免费观看| 在线观看美女被高潮喷水网站| 女人高潮潮喷娇喘18禁视频| 如日韩欧美国产精品一区二区三区| 免费日韩欧美在线观看| 免费大片黄手机在线观看| 久久久国产一区二区| 免费黄网站久久成人精品| 汤姆久久久久久久影院中文字幕| 一级毛片我不卡| 不卡视频在线观看欧美| 欧美中文综合在线视频| 亚洲图色成人| 大香蕉久久成人网| 中文乱码字字幕精品一区二区三区| 黄色配什么色好看| √禁漫天堂资源中文www| 日本91视频免费播放| av免费观看日本| 国产日韩欧美视频二区| 男女下面插进去视频免费观看| 久久久久精品性色| 亚洲av中文av极速乱| 在线观看www视频免费| 成人黄色视频免费在线看| 香蕉精品网在线| 国产欧美日韩综合在线一区二区| videos熟女内射| 777米奇影视久久| h视频一区二区三区| 欧美少妇被猛烈插入视频| a级片在线免费高清观看视频| 午夜免费鲁丝| 日韩熟女老妇一区二区性免费视频| 99九九在线精品视频| 免费观看在线日韩| 免费黄色在线免费观看| 日本色播在线视频| av在线app专区| 自拍欧美九色日韩亚洲蝌蚪91| 久久久亚洲精品成人影院| 看免费av毛片| 国产精品.久久久| 国产免费一区二区三区四区乱码| 大话2 男鬼变身卡| 少妇熟女欧美另类| 精品国产乱码久久久久久小说| 日日啪夜夜爽| 免费久久久久久久精品成人欧美视频| 尾随美女入室| 丝袜美足系列| 永久网站在线| 亚洲精品成人av观看孕妇| 男人操女人黄网站| 国产在线一区二区三区精| 成年女人毛片免费观看观看9 | 欧美日韩视频高清一区二区三区二| 国产在线免费精品| 一区二区三区乱码不卡18| 永久免费av网站大全| 免费黄色在线免费观看| 国产 一区精品| 亚洲精品一区蜜桃| 国产一区亚洲一区在线观看| 国产av一区二区精品久久| 青青草视频在线视频观看| 九草在线视频观看| 精品少妇久久久久久888优播| 亚洲欧美成人精品一区二区| 高清不卡的av网站| 欧美日韩一区二区视频在线观看视频在线| 久久精品夜色国产| 免费播放大片免费观看视频在线观看| 国产免费又黄又爽又色| 久久久久久久久免费视频了| 色网站视频免费| 黄色视频在线播放观看不卡| 69精品国产乱码久久久| 午夜福利视频在线观看免费| 国产高清国产精品国产三级| www.av在线官网国产| 春色校园在线视频观看| 亚洲精品视频女| 在线亚洲精品国产二区图片欧美| xxx大片免费视频| 国产又色又爽无遮挡免| 毛片一级片免费看久久久久| 精品福利永久在线观看| 欧美成人精品欧美一级黄| 美女国产视频在线观看| 少妇的逼水好多| 日本爱情动作片www.在线观看| 国产高清不卡午夜福利| 午夜激情av网站| 婷婷色综合大香蕉| 亚洲第一av免费看| 我的亚洲天堂| av.在线天堂| 亚洲三区欧美一区| 99热网站在线观看| 亚洲精华国产精华液的使用体验| 大片免费播放器 马上看| 成人毛片a级毛片在线播放| 999精品在线视频| 女人精品久久久久毛片| 日韩在线高清观看一区二区三区| 好男人视频免费观看在线| 人成视频在线观看免费观看| 女人被躁到高潮嗷嗷叫费观| 中文精品一卡2卡3卡4更新| 高清视频免费观看一区二区| 美国免费a级毛片| 视频在线观看一区二区三区| 亚洲图色成人| 精品一区在线观看国产| 亚洲经典国产精华液单| 一二三四在线观看免费中文在| 久久久国产一区二区| 亚洲久久久国产精品| 咕卡用的链子| 视频在线观看一区二区三区| av线在线观看网站| 国产片内射在线| 亚洲成色77777| 777久久人妻少妇嫩草av网站| 欧美bdsm另类| 成年女人在线观看亚洲视频| 国产av国产精品国产| 最近最新中文字幕大全免费视频 | 丝袜脚勾引网站| 哪个播放器可以免费观看大片| 国产成人精品一,二区| 人人妻人人添人人爽欧美一区卜| 欧美日韩一区二区视频在线观看视频在线| 久久久精品区二区三区| 日韩大片免费观看网站| 伦精品一区二区三区| 国产精品久久久久成人av| 超色免费av| 精品亚洲成a人片在线观看| 激情五月婷婷亚洲| 亚洲人成77777在线视频| 侵犯人妻中文字幕一二三四区| 日韩制服骚丝袜av| 亚洲精品一二三| 亚洲综合精品二区| 国产精品无大码| 亚洲第一av免费看| 亚洲精品av麻豆狂野| 国产成人精品无人区| 在线亚洲精品国产二区图片欧美| www.精华液| 久久精品人人爽人人爽视色| 侵犯人妻中文字幕一二三四区| 少妇人妻久久综合中文| 亚洲少妇的诱惑av| 精品午夜福利在线看| 一区福利在线观看| av福利片在线| 国产精品人妻久久久影院| 97在线人人人人妻| 国产精品无大码| 亚洲国产欧美日韩在线播放| 一区二区av电影网| 欧美日韩亚洲国产一区二区在线观看 | 久久精品国产亚洲av高清一级| 日韩 亚洲 欧美在线| 国产成人精品无人区| 国产日韩欧美视频二区| 人人妻人人澡人人看| 少妇精品久久久久久久| 亚洲综合色网址| 国产午夜精品一二区理论片| 久久影院123| 少妇被粗大的猛进出69影院| 91在线精品国自产拍蜜月| 老司机影院毛片| 丝袜脚勾引网站| 亚洲第一区二区三区不卡| 日本欧美国产在线视频| 日韩av在线免费看完整版不卡| 青春草国产在线视频| 久久这里只有精品19| 精品一区二区三卡| 制服人妻中文乱码| 另类亚洲欧美激情| 91久久精品国产一区二区三区| 亚洲久久久国产精品| 高清不卡的av网站| 日本-黄色视频高清免费观看| 一边摸一边做爽爽视频免费| 久久99精品国语久久久| 99久久人妻综合| 午夜激情久久久久久久| 久久亚洲国产成人精品v| 国产免费视频播放在线视频| 狠狠婷婷综合久久久久久88av| 精品久久久精品久久久| 夫妻性生交免费视频一级片| 9191精品国产免费久久| 国产福利在线免费观看视频| 亚洲三区欧美一区| 精品久久久久久电影网| 欧美97在线视频| 男女边吃奶边做爰视频| 另类亚洲欧美激情| 国精品久久久久久国模美| 永久网站在线| 丰满迷人的少妇在线观看| 婷婷色av中文字幕|