• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于不同內(nèi)容層面的特定領(lǐng)域研究主題差異分析研究

    2021-06-10 03:32:38章成志
    關(guān)鍵詞:特征詞全文聚類

    趙 磊,章成志

    (南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院信息管理系,南京 210094)

    1 引言

    隨著信息技術(shù)的進(jìn)步和開放獲取運(yùn)動(dòng)的日益蓬勃發(fā)展,以期刊、報(bào)告、會(huì)議為代表的全文本數(shù)據(jù)獲取更加容易,數(shù)據(jù)量呈爆發(fā)式增長(zhǎng)。與此同時(shí),自然語言處理、機(jī)器學(xué)習(xí)等計(jì)算機(jī)技術(shù)不斷發(fā)展,使得對(duì)學(xué)術(shù)論文的挖掘分析深入到全文之中。與基于機(jī)器可讀目錄等元數(shù)據(jù)進(jìn)行的傳統(tǒng)文獻(xiàn)計(jì)量研究相比,基于全文本文獻(xiàn)的計(jì)量研究在引用行為、實(shí)體抽取、關(guān)鍵詞自動(dòng)抽取、新興研究話題和新興技術(shù)預(yù)測(cè)等方面為文獻(xiàn)計(jì)量學(xué)的研究提供了更加廣闊的空間[1]。

    盡管全文本文獻(xiàn)的獲取更加容易,但是與標(biāo)題和摘要相比,文獻(xiàn)的全文內(nèi)容仍然較難獲取,例如在Web of Science(簡(jiǎn)稱WOS)數(shù)據(jù)庫(kù)中,只提供了文獻(xiàn)的標(biāo)題和摘要內(nèi)容,沒有提供全文內(nèi)容,這給基于全文本文獻(xiàn)的主題分析帶來了困難。因此,分析標(biāo)題和摘要、全文內(nèi)容中的主題差異,對(duì)使用標(biāo)題和摘要中的主題內(nèi)容來揭示全文的研究?jī)?nèi)容具有重要意義。此外,引文內(nèi)容是作者對(duì)他人研究成果的總結(jié)和概括,分析引文內(nèi)容與施引文獻(xiàn)內(nèi)容的主題差異,可以發(fā)現(xiàn)引文內(nèi)容對(duì)其施引文獻(xiàn)內(nèi)容的作用,進(jìn)而分析作者的引用動(dòng)機(jī)[2]。然而,目前鮮有研究從不同內(nèi)容層面:標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容,對(duì)其主題差異進(jìn)行分析,因此該研究是有必要的。

    隨著新冠肺炎(簡(jiǎn)稱COVID-19)疫情的爆發(fā)并在全球范圍內(nèi)蔓延,眾多領(lǐng)域的科研人員積極投入到了新冠病毒的研究中,發(fā)表了大量的學(xué)術(shù)成果,為病毒結(jié)構(gòu)分析、病例診斷、疫苗研發(fā)、公共衛(wèi)生管理等工作做出極大貢獻(xiàn)。目前,已有一些研究人員從大量文獻(xiàn)中挖掘信息,為新冠研究提供參考,例如為分析當(dāng)前科學(xué)研究的轉(zhuǎn)變和在全球流行病預(yù)防和控制中的應(yīng)用,YANG 等使用文獻(xiàn)計(jì)量聚類算法從國(guó)際合作、跨學(xué)科合作和研究熱點(diǎn)的角度描述和分析當(dāng)前的COVID-19 研究態(tài)勢(shì)[3]。

    為了探究在文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的研究主題是否存在差異,并分析國(guó)內(nèi)學(xué)者在應(yīng)對(duì)新冠肺炎疫情的過程中所關(guān)注的主要研究?jī)?nèi)容。本研究將基于新冠領(lǐng)域的中文期刊論文,從文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中識(shí)別研究主題,并進(jìn)行對(duì)比研究,分析三者之間的主題差異,總結(jié)新冠研究的主要內(nèi)容,為后續(xù)的新冠防治和研究提供參考。

    2 相關(guān)工作概述

    本研究主要使用主題識(shí)別方法來提取新冠論文中的研究主題,并對(duì)文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的主題差異進(jìn)行分析。因此,首先介紹了情報(bào)分析和數(shù)據(jù)挖掘領(lǐng)域中主題識(shí)別的相關(guān)方法,并提出了本文所采用的主題識(shí)別方法;然后列舉了基于不同內(nèi)容層面的主題分析研究,提出了本文研究的不同之處。

    2.1 主題識(shí)別研究概述

    目前,主題識(shí)別方法主要包括兩類,一類是基于特征詞的主題識(shí)別方法,另一類是基于概率模型的主題識(shí)別方法[4]?;谔卣髟~的主題識(shí)別方法,主要包括詞頻分析法、共詞分析法等。其中,詞頻分析方法主要對(duì)文本中的特征詞進(jìn)行分析,能夠較為直接地反映文本的主要內(nèi)容,例如儲(chǔ)節(jié)旺等[5]運(yùn)用詞頻分析法,對(duì)文獻(xiàn)關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì),分析了2002—2011 年10年來知識(shí)管理領(lǐng)域的研究熱點(diǎn)、應(yīng)用領(lǐng)域和研究方法。共詞分析法是在詞頻統(tǒng)計(jì)的基礎(chǔ)上,更加關(guān)注特征詞的共現(xiàn)關(guān)系,例如陳紅琳等[6]以國(guó)內(nèi)文本情感分析的學(xué)術(shù)論文為對(duì)象,利用共詞分析法,研究關(guān)鍵詞之間的聯(lián)系,探討了近10 年來在文本情感分析的研究熱點(diǎn)及現(xiàn)狀。此外,這兩種方法還可以進(jìn)行融合,共同用于主題識(shí)別研究,如高勁松等[7]構(gòu)建了一個(gè)詞頻分析和共詞分析融合的關(guān)鍵詞頻度演化模型,以揭示學(xué)科熱點(diǎn)及其類團(tuán)結(jié)構(gòu)的變化情況。

    在基于概率模型的主題識(shí)別方法中,具有代表性的模型方法是LDA 模型[8]。該模型用一個(gè)服從Dirichlet 分布的K 維隱含隨機(jī)變量表示文檔的主題概率分布,模擬文檔的生成過程,可用于從大規(guī)模文檔數(shù)據(jù)中抽取潛在主題,已經(jīng)被廣泛應(yīng)用于各類文本的主題識(shí)別任務(wù)中,例如BOON-ITT[9]為了分析Twitter 用戶在新冠疫情期間關(guān)注的話題,使用LDA 主題模型和自然語言處理方法分析了107 990 條與新冠相關(guān)的Twitter 推文。

    雖然LDA 模型逐漸成為主題識(shí)別領(lǐng)域的主要方法之一,但由于LDA 采用詞袋模型,僅考慮一個(gè)詞匯是否在一篇文檔中出現(xiàn),而不考慮其出現(xiàn)的順序[10],使得不同語義的詞匯可能會(huì)出現(xiàn)在同一個(gè)主題下,再加上缺乏研究領(lǐng)域的相關(guān)知識(shí),很難對(duì)每一個(gè)主題進(jìn)行總結(jié)。因此,本文在進(jìn)行主題識(shí)別時(shí),采用基于特征詞的主題識(shí)別方法,即首先從文檔內(nèi)容中抽取特征詞,并使用Word2Vec 模型來訓(xùn)練詞向量,在相鄰詞之間建立語義聯(lián)系;然后使用AP 聚類算法對(duì)特征詞進(jìn)行聚類,以避免相同詞反復(fù)出現(xiàn)在同一簇中,同時(shí)降低不同語義的特征詞出現(xiàn)在同一簇中的可能性;最后采用人工判讀的方式,識(shí)別文檔內(nèi)容中的主題。

    2.2 基于不同內(nèi)容層面的主題分析研究

    主題分析能夠反映某領(lǐng)域的研究水平和總體狀況,揭示該領(lǐng)域的研究現(xiàn)狀、熱點(diǎn)及發(fā)展趨勢(shì)[11]。目前,可用于文獻(xiàn)主題分析的數(shù)據(jù)源有文獻(xiàn)標(biāo)題、摘要、作者給出的關(guān)鍵詞、全文,例如劉志輝[12]為了分析國(guó)外信息歷史的研究現(xiàn)狀,從文獻(xiàn)的標(biāo)題中抽取關(guān)鍵詞,然后對(duì)高頻關(guān)鍵詞進(jìn)行分析,得到圖書館史、信息學(xué)史、信息科學(xué)、信息社會(huì)是信息歷史關(guān)注的重要領(lǐng)域。李萬輝等[13]從文獻(xiàn)的摘要中抽取高頻關(guān)鍵詞,得到1990—2009 年20 年內(nèi)城市信息化持續(xù)研究的熱點(diǎn)詞有:數(shù)字城市、信息產(chǎn)業(yè)、電子政務(wù)、信息技術(shù)、無線城市、信息資源建設(shè)、電子商務(wù)、企業(yè)信息化、社會(huì)信息化、信息共享、信息服務(wù)等詞。張濤等[14]以CSSCI 數(shù)據(jù)庫(kù)中1998—2019 年1 361 篇輿情文獻(xiàn)為數(shù)據(jù)集,使用作者給出的關(guān)鍵詞,分析了中國(guó)輿情文獻(xiàn)研究的主題及演化趨勢(shì)。TATSAWAN 等[15]為了細(xì)粒度地掌握?qǐng)D書館學(xué)的知識(shí)趨勢(shì),運(yùn)用了共詞分析、文本摘要、主題建模等文本挖掘技術(shù),對(duì)6 種圖書館學(xué)的全文期刊文章進(jìn)行了細(xì)致的分析。

    在所使用的數(shù)據(jù)源中,文獻(xiàn)的標(biāo)題、摘要、全文需要使用自然語言處理等技術(shù),從文本中抽取出特征詞或者關(guān)鍵詞,然后在特征詞或者關(guān)鍵詞的基礎(chǔ)上進(jìn)行主題識(shí)別研究,比基于作者給出的關(guān)鍵詞的主題分析復(fù)雜,因而使用這些數(shù)據(jù)源進(jìn)行主題分析的研究相對(duì)較少。此外,從全文內(nèi)容中抽取的引文內(nèi)容也是研究被引文獻(xiàn)主題內(nèi)容的重要數(shù)據(jù)源。

    目前,大多數(shù)研究均使用單一數(shù)據(jù)源對(duì)文獻(xiàn)的研究主題進(jìn)行分析,鮮有學(xué)者關(guān)注到文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的研究主題是否存在差異。因此,本文以新冠領(lǐng)域的中文期刊文獻(xiàn)為數(shù)據(jù)集,探究在文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的研究主題是否存在差異,分析標(biāo)題和摘要中的主題內(nèi)容是否可以揭示全文的研究?jī)?nèi)容,以及引文內(nèi)容對(duì)其施引文獻(xiàn)內(nèi)容的作用,并總結(jié)國(guó)內(nèi)學(xué)者在新冠流行期間所做的主要研究工作,為后續(xù)的新冠防治和研究提供參考。

    3 研究思路與關(guān)鍵技術(shù)描述

    3.1 研究思路

    本研究以CNKI 數(shù)據(jù)庫(kù)(https://www.cnki.net)中的新冠論文為研究對(duì)象,分析標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的主題差異,其研究過程主要分為3 部分:第一部分是新冠數(shù)據(jù)的采集;第二部分是數(shù)據(jù)的預(yù)處理;第三部分是數(shù)據(jù)分析和主題對(duì)比研究,如圖1 所示。

    圖1 研究框架圖Fig.1 Research framework

    在數(shù)據(jù)采集的過程中,為方便文獻(xiàn)內(nèi)容的解析,本文采集了HTML 文檔等內(nèi)容,并同時(shí)采集了論文中作者標(biāo)注的關(guān)鍵詞以及新冠病毒疫情防控相關(guān)詞匯(https://cidian.cnki.net/cidian/XG_Link),以用于擴(kuò)展分詞器的詞典,讓分詞器具有識(shí)別新冠術(shù)語的能力。在預(yù)處理階段,需要解析HTML 文檔,即從文檔內(nèi)容中抽取出論文摘要、全文以及參考文獻(xiàn)內(nèi)容,并根據(jù)參考文獻(xiàn)在全文中的引用標(biāo)志找到對(duì)應(yīng)的引文內(nèi)容句。在數(shù)據(jù)分析和主題對(duì)比研究中,分別從標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中抽取特征詞,根據(jù)詞頻度量特征詞的分布差異,并使用聚類算法進(jìn)行特征詞聚類,分析研究主題并進(jìn)行對(duì)比研究。

    為了分析在文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的研究主題差異,需要確保研究的數(shù)據(jù)集之間彼此互不相交。因此,在全文內(nèi)容中,需要去掉標(biāo)題、摘要和引文內(nèi)容,而對(duì)剩余的部分進(jìn)行分析。在本文中,將去掉標(biāo)題、摘要和引文內(nèi)容的全文依然稱為全文,但實(shí)際上這部分內(nèi)容已不再包含標(biāo)題、摘要和引文內(nèi)容,需要引起讀者注意。

    3.2 關(guān)鍵技術(shù)描述

    3.2.1 數(shù)據(jù)采集及預(yù)處理

    (1)數(shù)據(jù)來源。COVID-19 是一場(chǎng)全人類正在遭受的重大突發(fā)公共衛(wèi)生事件,為了能夠?qū)ふ业胶线m的應(yīng)對(duì)辦法,國(guó)內(nèi)學(xué)者積極開展新冠研究,發(fā)表了大量的學(xué)術(shù)論文。CNKI 為其開辟了一個(gè)出版專欄(https://cajn.cnki.net/xgbt),以方便研究者分享和交流最新的研究成果。本文從該專欄中采集了2020 年1 月份至6 月份的新冠文獻(xiàn),去除重復(fù)、信息不全以及全文內(nèi)容是英文的文獻(xiàn),共獲得HTML 全文數(shù)據(jù)2 510 條,采集的字段內(nèi)容如表1 所示。

    表1 采集的論文字段Table 1 The fields of collected papers

    圖2 是論文發(fā)文量隨OA 首發(fā)時(shí)間變化的分布圖,該時(shí)間字段在OA 專欄中可以獲取,時(shí)間范圍為2020年1 月29 日至2020 年6 月30 日。由圖2 可知,自COVID-19 爆發(fā)以來,有關(guān)此項(xiàng)研究的學(xué)術(shù)論文產(chǎn)出不斷增加,尤其是前3 個(gè)月,發(fā)文總數(shù)急劇增加。這表明COVID-19 從爆發(fā)之初就得到了國(guó)內(nèi)學(xué)者的普遍關(guān)注。隨著研究力度不斷加大,有關(guān)COVID-19 的認(rèn)識(shí)進(jìn)一步深化,對(duì)戰(zhàn)勝病毒、控制疫情起著重要作用。

    圖2 新冠論文時(shí)間分布曲線Fig.2 Time distribution curve of COVID-19 papers

    (2)數(shù)據(jù)預(yù)處理。由于采集到的全文數(shù)據(jù)是HTML格式,不能直接用于數(shù)據(jù)分析,需要從HTML 文檔中抽取出文獻(xiàn)摘要、全文和參考文獻(xiàn)內(nèi)容,然后在全文內(nèi)容的基礎(chǔ)上,抽取出引文內(nèi)容句,完成文本分詞等工作。①引文內(nèi)容句抽取。引文內(nèi)容是作者引用他人研究成果的文字表述,是對(duì)他人研究成果的吸收和借鑒,在一定程度上能夠反映他人成果的主要內(nèi)容,需要使用引用標(biāo)記進(jìn)行標(biāo)注。本文根據(jù)參考文獻(xiàn)對(duì)應(yīng)的引用標(biāo)記從全文內(nèi)容中抽取引文內(nèi)容句,即通過引用標(biāo)記的位置向前和向后尋找句子的結(jié)束標(biāo)志,通常為句號(hào),將引文內(nèi)容句從全文中抽取出來。通常,一篇文獻(xiàn)會(huì)引用多篇文獻(xiàn),也就會(huì)抽取出多個(gè)引文內(nèi)容句,將這些引文內(nèi)容句組合在一起,就構(gòu)成了該篇文獻(xiàn)對(duì)應(yīng)的引文內(nèi)容數(shù)據(jù)。②基于規(guī)則的參考文獻(xiàn)解析。每條參考文獻(xiàn)的內(nèi)容都按照一定的格式規(guī)范進(jìn)行組織和書寫,可以使用基于規(guī)則的方式進(jìn)行解析。在本文采集的學(xué)術(shù)論文集合中,參考文獻(xiàn)的引用格式主要采用的是“GB/T 7714-2015”,但也有少數(shù)參考文獻(xiàn)存在格式錯(cuò)誤。因此,本文在進(jìn)行解析之前,剔除了格式錯(cuò)誤的參考文獻(xiàn),并使用正則表達(dá)式進(jìn)行各字段內(nèi)容的提取,如引用文獻(xiàn)的標(biāo)題、作者、來源、年份。通過解析,共獲得了35 773 條引用文獻(xiàn)信息,文獻(xiàn)的類型主要是期刊、專著和會(huì)議文獻(xiàn)。③文本分詞。文本分詞是進(jìn)行文本分析的基礎(chǔ),其效果的好壞會(huì)直接影響到分析結(jié)果。本文使用的分詞工具是Jieba 分詞器(https://pypi.org/project/jieba/),由于該分詞器中的詞典不包含新冠研究領(lǐng)域的專業(yè)術(shù)語,在進(jìn)行本文分詞時(shí),會(huì)造成專業(yè)術(shù)語無法切分準(zhǔn)確。因此,需要擴(kuò)展Jieba的分詞詞典。

    通常,學(xué)術(shù)論文中作者標(biāo)注的關(guān)鍵詞是由相關(guān)術(shù)語組成。為了提升分詞效果,采集了新冠論文中的13 865個(gè)關(guān)鍵詞作為Jieba 分詞器的拓展詞典,使分詞器可以識(shí)別新冠研究領(lǐng)域中的術(shù)語。對(duì)分詞后的文本去停用詞,其中停用詞主要包括數(shù)字、數(shù)學(xué)符號(hào)和無意義的虛詞等。

    3.2.2 文檔特征詞抽取

    TF-IDF 算法可以計(jì)算一個(gè)詞對(duì)于一篇文檔或者一篇文檔對(duì)于一個(gè)文檔集合的重要性。其基本原理是:詞項(xiàng)的重要性與其在文檔中出現(xiàn)的頻次正相關(guān),與其在文檔集中出現(xiàn)的頻次負(fù)相關(guān),其中TF 代表詞項(xiàng)頻率,IDF 代表逆文檔頻率指數(shù),通過公式(1)得到詞項(xiàng)Wi在單篇文檔中的重要程度[16]。

    其中,nij表示詞Wi在文檔j 中出現(xiàn)的次數(shù),N 為文檔集中總的文檔數(shù),ni表示包含詞Wi的文檔數(shù)總和。一般來說,單字詞和雙字詞包含的語義過于廣泛,例如“治療”“疫情”等,而由3 個(gè)及以上的字符構(gòu)成的詞所包含的語義更具體,如“核酸檢測(cè)”“中醫(yī)藥”等。因此,本文在對(duì)一篇文檔中的詞計(jì)算TF-IDF權(quán)重后,將字符長(zhǎng)度低于3 的詞過濾,以確保抽取到的特征詞語義清晰。

    此外,一篇文檔中包含大量特征詞,但絕大多數(shù)是一些高頻低權(quán)詞,對(duì)于文檔的表征意義不大。因此,本文根據(jù)實(shí)驗(yàn)的需求,選取了TF-IDF 權(quán)重排名前50的詞作為文檔的特征詞。

    3.2.3 特征詞分布差異度量與聚類

    (1)基于JS 散度的特征詞分布差異度量。Kullback-Leibler散度(簡(jiǎn)稱KL散度)于1951年由KU1LBACK 等提出,主要用于統(tǒng)計(jì)變量間的獨(dú)立性,即從概率分布的角度去衡量?jī)蓚€(gè)變量間的距離[17],計(jì)算公式如公式(2)所示。由于該方法在度量?jī)蓚€(gè)變量的分布時(shí)不具有對(duì)稱性,LIN 在此基礎(chǔ)上提出了一種變體——JS 散度,解決了KL 散度非對(duì)稱的問題[18],計(jì)算公式如公式(3)所示。

    本文將使用JS 散度來度量在文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中抽取的特征詞的分布差異,即根據(jù)標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容,對(duì)抽取的特征詞進(jìn)行分組,然后從每部分中選取相同數(shù)量的高頻特征詞,使用詞頻進(jìn)行歸一化,計(jì)算JS 距離值。JS 值取值范圍為[0,1],若值趨近于1,則兩個(gè)變量獨(dú)立性更強(qiáng),即兩者之間的差異更大,反之,差異更小。

    (2)構(gòu)造詞向量。文本數(shù)據(jù)是一種符號(hào)集合,無法直接通過計(jì)算機(jī)進(jìn)行處理。詞嵌入可以將文本數(shù)據(jù)中的詞映射為一個(gè)向量,即將詞語表示為一個(gè)濃密的、低維度的實(shí)值向量,向量中的每一個(gè)維度可視為對(duì)應(yīng)特定的語義[19],從而使得計(jì)算機(jī)可以對(duì)文本數(shù)據(jù)進(jìn)行計(jì)算和分析。

    Word2Vec 是谷歌開發(fā)的一款詞嵌入開源工具,其基礎(chǔ)是神經(jīng)語言模型[20]。Word2Vec 可以將詞從一個(gè)非常稀疏的向量空間映射到一個(gè)低維的空間,并保留詞向量之間的位置關(guān)系。Word2Vec 中有兩種模型,分別是CBOW 和Skip-gram。其中,CBOW 模型訓(xùn)練時(shí)需要輸入的是上下文中詞t 相關(guān)詞的詞向量,對(duì)這些輸入詞向量進(jìn)行累加處理后輸出詞t 的詞向量。Skip-gram與CBOW 的輸入與輸出相反,輸入詞t 的詞向量,通過恒等投影輸出詞t 上下文對(duì)應(yīng)詞的詞向量。本文借助Gensim 庫(kù),使用論文全文數(shù)據(jù)對(duì)Word2Vec 的CBOW模型進(jìn)行訓(xùn)練,從而獲得相應(yīng)詞的詞向量。

    (3)基于AP 的特征詞聚類。近鄰傳播算法(英文名為Affinity Propagation,簡(jiǎn)稱AP算法)是最早由FREY 等在2007 年提出,該聚類算法的主要特點(diǎn)是無需事先指定聚類數(shù)目并且聚類結(jié)果穩(wěn)定[21]。近鄰傳播算法的基本原理是通過吸引度和歸屬度矩陣的更新來調(diào)整聚類中心的數(shù)量和位置,直到聚類中心不再變動(dòng)或者迭代次數(shù)超過預(yù)先設(shè)定的最大迭代次數(shù),其中兩個(gè)矩陣的更新是近鄰傳播算法的關(guān)鍵步驟。對(duì)于具有n個(gè)點(diǎn)的數(shù)據(jù)集,其吸引度和歸屬度可以表示為n×n 矩陣。本文借助Sklearn 庫(kù)(https://scikit-learn.org/stable),使用余弦相似度[22]計(jì)算n 個(gè)節(jié)點(diǎn)的相似度矩陣,以初始化AP 聚類模型,從而獲得相應(yīng)的聚類結(jié)果。

    為了量化聚類結(jié)果的性能,本文使用了輪廓系數(shù)[23]作為評(píng)估指標(biāo)。該系數(shù)取值范圍為[-1,1],取值越接近1 則說明聚類性能越好,相反,取值越接近-1 則說明聚類性能越差。

    4 結(jié)果分析

    首先,對(duì)參考文獻(xiàn)的解析結(jié)果進(jìn)行分析,介紹了高被引文獻(xiàn)主要的研究?jī)?nèi)容。其次,使用JS 散度度量了文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的特征詞分布差異。最后,對(duì)標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中抽取的特征詞進(jìn)行聚類,識(shí)別新冠的研究主題,并從主題內(nèi)容上對(duì)比分析具體的差異。

    4.1 高被引文獻(xiàn)內(nèi)容分析

    按照作者和文獻(xiàn)標(biāo)題,對(duì)期刊、專著和會(huì)議類型的35 773 條引用文獻(xiàn)信息進(jìn)行統(tǒng)計(jì),得到19 912 篇引用文獻(xiàn)在數(shù)據(jù)集中的引用次數(shù)列表。表2 列舉了引用次數(shù)排名前10 的文獻(xiàn),這些文獻(xiàn)的引用次數(shù)占總文獻(xiàn)引用次數(shù)的6.78%,且文獻(xiàn)的發(fā)表時(shí)間較早。其中,排名第一的文獻(xiàn)報(bào)告了41 名新冠感染患者的癥狀、體征、實(shí)驗(yàn)室檢查結(jié)果、影像學(xué)檢查結(jié)果、潛在疾病和并發(fā)癥,并得出結(jié)論,COVID-19 會(huì)引起嚴(yán)重急性呼吸窘迫綜合征,導(dǎo)致ICU 病例和死亡率的增加[24];排名第二的文獻(xiàn)同樣介紹了99 例新冠感染患者的流行病學(xué)和臨床特征[25];排名第三的文獻(xiàn)報(bào)告了一種新的CoV(2019-nCoV),并實(shí)現(xiàn)了對(duì)該病毒的分離以及初步描述了其特定細(xì)胞病變效應(yīng)和形態(tài)[26]。從這些文獻(xiàn)的研究?jī)?nèi)容上看,早期的新冠研究集中于新冠患者的臨床癥狀和治療研究,以及對(duì)新冠病毒的認(rèn)識(shí)和溯源研究上,這些研究對(duì)后期新冠的診斷、治療和防治起著重要作用。

    表2 高被引文獻(xiàn)Top10Table 2 Top 10 of highly cited works

    4.2 文獻(xiàn)不同內(nèi)容層面的特征詞分布差異分析

    為了考察從標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中抽取的特征詞分布是否存在差異,本文分別從這3 個(gè)部分中抽取高頻特征詞,使用JS 散度計(jì)算三者之間的相關(guān)性,結(jié)果如圖3 所示。從圖中可以看到,隨著提取的高頻特征詞增多,三者之間的JS 距離值越小,意味著三者之間的內(nèi)容相似性越強(qiáng)。但是,三者之間還是存在一定差異,即標(biāo)題和摘要與引文內(nèi)容的相似性要比標(biāo)題和摘要與全文內(nèi)容、全文內(nèi)容與引文內(nèi)容的相似性低,而標(biāo)題和摘要與全文內(nèi)容的相似性最高,這也反映出標(biāo)題和摘要是對(duì)全文內(nèi)容的總結(jié)和提煉,具有較高的內(nèi)容相關(guān)性。引文內(nèi)容是作者引用他人成果的總結(jié)和概括,與其施引文獻(xiàn)全文內(nèi)容相關(guān),同時(shí)也要高于引文內(nèi)容與施引文獻(xiàn)標(biāo)題和摘要的相關(guān)性。

    圖3 不同文獻(xiàn)部分中的高頻特征詞分布差異Fig.3 Distribution differences of high frequency feature words in different parts of a research paper

    在此分析基礎(chǔ)上,本文擴(kuò)展了研究實(shí)驗(yàn),分析了不同引用頻次的引用文獻(xiàn)在引用內(nèi)容的相似性上是否存在差異,即根據(jù)引用文獻(xiàn)被引用的次數(shù)劃分不同層次,使用JS 散度計(jì)算文獻(xiàn)不同層次之間的內(nèi)容相似度。本文將引用次數(shù)達(dá)到10 次及以上的文獻(xiàn)歸類為高頻引用文獻(xiàn),該類文獻(xiàn)占總引用文獻(xiàn)的1.66%,引用次數(shù)介于1~10 之間的文獻(xiàn)歸類為中頻引用文獻(xiàn),占總引用文獻(xiàn)的17.53%,而引用次數(shù)為1 的文獻(xiàn)歸類為低頻引用文獻(xiàn),占總引用文獻(xiàn)80.81%,分別計(jì)算高頻、中頻和低頻引用文獻(xiàn)之間的JS 值,如圖4 所示。由圖4 可知,不同引用頻次的引用文獻(xiàn)在引文內(nèi)容的相似性上存在差異,即中頻和低頻引用文獻(xiàn)在引文內(nèi)容的相似程度上較高,而高頻和低頻引用文獻(xiàn)在引文內(nèi)容的相似程度上較低。

    圖4 不同引用頻次文獻(xiàn)的高頻特征詞分布差異Fig.4 Distribution differences of high frequency feature words in works with different citation frequencies

    4.3 特征詞聚類結(jié)果分析

    從標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中抽取特征詞直接進(jìn)行聚類分析,會(huì)造成聚類數(shù)過多,如圖5 所示。因此,本文分別從這3 部分內(nèi)容中,將抽取的特征詞進(jìn)行匯總,并按照詞頻大小,選取高頻特征詞進(jìn)行聚類分析。為了盡可能涵蓋較多主題內(nèi)容,并確保聚類數(shù)在合適范圍內(nèi),本文經(jīng)過多次實(shí)驗(yàn),選取前100個(gè)高頻詞進(jìn)行聚類分析最為合適。

    圖5 聚類數(shù)與特征詞數(shù)的分布變化趨勢(shì)圖Fig.5 The distribution trend of the number of clusters and the number of feature words

    在完成聚類分析后,根據(jù)特征詞的語義,采用人工判讀的方式,對(duì)每一個(gè)聚類簇進(jìn)行主題總結(jié),并使用輪廓系數(shù)來量化聚類效果,以分析在標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中的主題差異。

    4.3.1 標(biāo)題和摘要中主題識(shí)別結(jié)果

    從2 510 篇文獻(xiàn)的標(biāo)題和摘要中,使用TF-IDF 算法抽取50 個(gè)特征詞,共獲得特征詞8 224 個(gè)。然后根據(jù)詞頻選取前100 個(gè)高頻特征詞進(jìn)行AP 聚類,聚類結(jié)果的輪廓系數(shù)為0.278,聚類效果較好,主題結(jié)果如圖6 所示。

    圖6 標(biāo)題&摘要中主題聚類結(jié)果Fig.6 The results of topic clustering in the title&abstract

    從特征詞聚類結(jié)果可以看出,標(biāo)題和摘要中的研究主題主要涉及新冠病毒、疫情防控、中醫(yī)治療、病理分析、新冠發(fā)生地、新冠檢測(cè)、藥物分析、病例分析、診療方案、臨床分型、新冠就診、新冠傳播、抗病毒藥物、網(wǎng)絡(luò)藥理學(xué)、防控措施、新冠藥物研究16個(gè)研究主題。

    4.3.2 引文內(nèi)容中主題識(shí)別結(jié)果

    本文從2 510 篇文獻(xiàn)的全文內(nèi)容中,根據(jù)引用標(biāo)記抽取引文內(nèi)容句,并去除重復(fù)內(nèi)容,共抽取出引文內(nèi)容句39 287 句。然后使用TF-IDF 算法從每篇文獻(xiàn)對(duì)應(yīng)的引文內(nèi)容中抽取50 個(gè)特征詞,共獲得特征詞19 733 個(gè)。最后根據(jù)詞頻選取前100 個(gè)高頻特征詞進(jìn)行AP 聚類,聚類結(jié)果的輪廓系數(shù)為0.321,聚類效果較好,主題結(jié)果如圖7 所示。

    圖7 引文內(nèi)容中主題聚類結(jié)果Fig.7 The results of topic clustering in citation content

    從特征詞聚類結(jié)果可以看出,引文內(nèi)容中的研究主題主要涉及診療方案、新冠病毒、新冠感染、病毒溯源、新冠傳播、核酸檢測(cè)、新冠發(fā)生地、疫情防控、臨床癥狀、醫(yī)療設(shè)施、中醫(yī)藥、抗病毒藥物、臨床分型、呼吸道癥狀、細(xì)胞因子風(fēng)暴、病理分析、基礎(chǔ)疾病17 個(gè)研究主題。

    4.3.3 全文內(nèi)容中主題識(shí)別結(jié)果

    從2 510 篇文獻(xiàn)的全文內(nèi)容中,使用TF-IDF 算法抽取50 個(gè)特征詞,共獲得特征詞34 624 個(gè)。然后根據(jù)詞頻選取前100 個(gè)高頻特征詞進(jìn)行AP 聚類,聚類結(jié)果的輪廓系數(shù)為0.33,聚類效果較好,主題結(jié)果如圖8所示。

    圖8 全文內(nèi)容中主題聚類結(jié)果Fig.8 The results of topic clustering in the full text content

    從特征詞聚類結(jié)果可以看出,全文內(nèi)容中的研究主題主要涉及新冠藥物研究、新冠病毒、新冠就診、核酸檢測(cè)、醫(yī)學(xué)檢查、中醫(yī)治療、新冠感染、臨床分型、網(wǎng)絡(luò)藥理學(xué)、臨床癥狀、疫情防控、新冠防護(hù)、病理分析、抗病毒藥物、新冠傳播、新冠發(fā)生地、中醫(yī)藥17 個(gè)研究主題。

    4.4 研究主題對(duì)比分析

    將從標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中識(shí)別出的研究主題進(jìn)行匯總,共得到27 個(gè)主題,如表3 所示。從主題內(nèi)容上看,這些主題涉及新冠的診療方案、病理分析、病毒溯源、傳播與防護(hù)、檢測(cè)與治療、抗病毒藥物研究、基礎(chǔ)疾病各方面,并且重視中醫(yī)藥和中醫(yī)治療方法在新冠防治中的運(yùn)用。此外,基于網(wǎng)絡(luò)藥理學(xué)、分子對(duì)接、富集分析、數(shù)據(jù)挖掘等方法進(jìn)行新冠治療藥物的研究與開發(fā),在新冠的研究中也占有重要地位。

    4.4.1 標(biāo)題和摘要與全文的主題對(duì)比分析

    將標(biāo)題和摘要中的研究主題與全文中的研究主題進(jìn)行對(duì)比,發(fā)現(xiàn)有11 個(gè)主題相同,即新冠病毒、新冠傳播、新冠發(fā)生地、疫情防控、抗病毒藥物、臨床分型、病理分析、新冠藥物研究、新冠就診、中醫(yī)治療、網(wǎng)絡(luò)藥理學(xué)。從主體內(nèi)容上看,這11 個(gè)主題與新冠的防治聯(lián)系緊密,在一定程度上能夠揭示當(dāng)前新冠研究的主要內(nèi)容。從主題的數(shù)量上看,全文中富含較多的主題信息,與標(biāo)題和摘要中的主題信息相比,研究者關(guān)注的內(nèi)容較多。

    4.4.2 標(biāo)題和摘要與引文內(nèi)容的主題對(duì)比分析

    標(biāo)題和摘要是作者對(duì)文獻(xiàn)全文內(nèi)容的總結(jié)和概括,引文內(nèi)容是作者對(duì)他人研究成果的總結(jié)和概括。換言之,標(biāo)題和摘要、引文內(nèi)容分別是對(duì)施引文獻(xiàn)集和被引文獻(xiàn)集的總結(jié)和概括,將二者進(jìn)行對(duì)比,可以分析引文內(nèi)容對(duì)施引文獻(xiàn)內(nèi)容的作用。

    由表3 可知,標(biāo)題和摘要、引文內(nèi)容之間有8 個(gè)相同主題,比標(biāo)題和摘要與全文的相同主題少3 個(gè),其中新冠藥物研究、新冠就診、中醫(yī)治療、網(wǎng)絡(luò)藥理學(xué)、新冠檢測(cè)、藥物分析、病例分析、防控措施8 個(gè)主題是引文內(nèi)容中沒有的,而病毒溯源、醫(yī)療設(shè)施、呼吸道癥狀、細(xì)胞因子風(fēng)暴、基礎(chǔ)疾病5 個(gè)主題是引文內(nèi)容獨(dú)有的,在標(biāo)題和摘要、全文內(nèi)容中都未出現(xiàn)。因此,引文內(nèi)容與其施引文獻(xiàn)內(nèi)容的主題相關(guān),二者可以進(jìn)行互補(bǔ)。

    表3 新冠研究主題Table 3 The research topics of COVID-19

    5 討論

    本文使用有關(guān)新冠的中文期刊文獻(xiàn)數(shù)據(jù),從不同內(nèi)容層面:標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容,探究三者之間的主題差異,得到研究主題在文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中存在差異的結(jié)論,現(xiàn)對(duì)該結(jié)論進(jìn)行討論并分析其產(chǎn)生的原因。

    首先,從主題的相似性上看,標(biāo)題和摘要與引文內(nèi)容的主題相似性低于全文內(nèi)容與引文內(nèi)容的主題相似性,而全文內(nèi)容與引文內(nèi)容的主題相似性又低于標(biāo)題和摘要與全文內(nèi)容的主題相似性。究其原因,文獻(xiàn)的標(biāo)題和摘要是對(duì)全文內(nèi)容的總結(jié)和提煉,具有高度的內(nèi)容相關(guān)性,引文內(nèi)容是作者引用他人成果的總結(jié)和概括,與其施引的文獻(xiàn)內(nèi)容相關(guān)。其次,從主題數(shù)量上看,全文內(nèi)容中富含較多的主題信息,與標(biāo)題和摘要相比,新冠感染、核酸檢測(cè)、臨床癥狀、中醫(yī)藥、醫(yī)學(xué)檢查、新冠防護(hù)六個(gè)主題受到研究者的關(guān)注。最后,從引用和被引用內(nèi)容上看,引文內(nèi)容中涵蓋的主題信息較廣,與標(biāo)題和摘要相比,新冠病毒的溯源、醫(yī)療設(shè)施以及基礎(chǔ)疾病等內(nèi)容受到研究者的關(guān)注。

    綜上所述,標(biāo)題和摘要中的研究主題與全文內(nèi)容中的研究主題更相似,在對(duì)文獻(xiàn)進(jìn)行主題分析時(shí),可以使用標(biāo)題和摘要中的研究主題來概括全文內(nèi)容的研究主題;引文內(nèi)容與其施引文獻(xiàn)內(nèi)容的主題相關(guān),二者可以進(jìn)行互補(bǔ),能夠凸顯出新冠研究的主要內(nèi)容。

    此外,本文還發(fā)現(xiàn)不同引用頻次的文獻(xiàn),在引文內(nèi)容中揭示的研究主題也不同,即中頻和低頻引用文獻(xiàn)在主題的相似程度上更高,而高頻和低頻引用文獻(xiàn)在主題的相似程度上更低。經(jīng)過分析,被高頻引用的文獻(xiàn)側(cè)重新冠的流行病學(xué)和臨床特征研究,這些文獻(xiàn)發(fā)表時(shí)間較早,對(duì)新冠病毒的診斷和治療具有重要的指導(dǎo)作用。然而,被中頻和低頻引用的文獻(xiàn)發(fā)布時(shí)間較晚,研究的內(nèi)容涵蓋新冠的各個(gè)方面,主題內(nèi)容寬而廣,沒有高頻引用文獻(xiàn)中的主題集中,故而兩者之間的主題相似性較低。

    6 結(jié)語

    自從COVID-19 在全球爆發(fā)以來,許多國(guó)家、機(jī)構(gòu)和科研人員都把研究重點(diǎn)放在該主題上,這導(dǎo)致了新冠領(lǐng)域的學(xué)術(shù)論文迅速增長(zhǎng)。使用文獻(xiàn)計(jì)量方法來分析新冠的研究現(xiàn)狀,可以了解新冠研究的最新動(dòng)態(tài),給相關(guān)研究者提供參考。本文的研究建立在中文期刊文獻(xiàn)資料的分析基礎(chǔ)上,分析了國(guó)內(nèi)學(xué)者在新冠研究中的主要內(nèi)容,得出了研究主題在文獻(xiàn)的標(biāo)題和摘要、引文內(nèi)容、全文內(nèi)容中存在差異,即與標(biāo)題和摘要相比,全文中富含更多的主題內(nèi)容,但二者的主題內(nèi)容差異較小,可以使用標(biāo)題和摘要中的主題內(nèi)容來表征全文的研究?jī)?nèi)容;引文內(nèi)容與其施引文獻(xiàn)內(nèi)容的主題相關(guān),二者可以進(jìn)行內(nèi)容互補(bǔ)。

    中國(guó)在疫情的防治工作中,采取了一系列有效措施,使得疫情得到穩(wěn)步控制。此外,國(guó)內(nèi)學(xué)者在新冠研究中也做了大量工作,研究的內(nèi)容涉及新冠的發(fā)病機(jī)理、病毒溯源、傳播與防護(hù)、檢測(cè)與治療、抗病毒藥物研究、基礎(chǔ)疾病等各方面,并且重視中醫(yī)藥和中醫(yī)治療方法在新冠治療中的運(yùn)用,為新冠疫情的防治提供了理論和實(shí)踐保障。

    本文使用特征詞聚類來識(shí)別研究主題,也存在一些不足之處。一方面,由于缺乏醫(yī)學(xué)領(lǐng)域的專業(yè)知識(shí),對(duì)主題的總結(jié)欠妥,不能很好地確定每一聚類簇的主題。另一方面,特征詞抽取的準(zhǔn)確率需要進(jìn)一步提高,未來可以考慮使用機(jī)器學(xué)習(xí)的方法來抽取論文中的關(guān)鍵詞,對(duì)關(guān)鍵詞進(jìn)行分析。

    猜你喜歡
    特征詞全文聚類
    全文中文摘要
    全文中文摘要
    基于改進(jìn)TFIDF算法的郵件分類技術(shù)
    基于DBSACN聚類算法的XML文檔聚類
    產(chǎn)品評(píng)論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
    青年再造
    基于改進(jìn)的遺傳算法的模糊聚類算法
    面向文本分類的特征詞選取方法研究與改進(jìn)
    一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
    構(gòu)思精巧余味無窮 諷刺鞭撻淋漓盡致——再談“虛榮”貫穿《項(xiàng)鏈》全文
    黑人欧美特级aaaaaa片| netflix在线观看网站| 日本黄色视频三级网站网址| 精品国产美女av久久久久小说| 久久中文字幕人妻熟女| 两人在一起打扑克的视频| 亚洲精品av麻豆狂野| 曰老女人黄片| 亚洲精品久久成人aⅴ小说| 日韩欧美免费精品| 国内精品久久久久久久电影| 美国免费a级毛片| 国产高清视频在线播放一区| 午夜免费成人在线视频| 久久精品aⅴ一区二区三区四区| 黄色视频不卡| 国产精品美女特级片免费视频播放器 | 亚洲专区中文字幕在线| 美女高潮喷水抽搐中文字幕| 真人一进一出gif抽搐免费| 久久久国产成人精品二区| 男男h啪啪无遮挡| 99久久久亚洲精品蜜臀av| 国产精品,欧美在线| а√天堂www在线а√下载| 国产亚洲欧美98| 一区二区三区国产精品乱码| 波多野结衣高清无吗| 老汉色av国产亚洲站长工具| 久久性视频一级片| 看免费av毛片| 好男人电影高清在线观看| 国产精品久久久久久精品电影 | 亚洲欧美精品综合一区二区三区| 午夜福利一区二区在线看| av在线天堂中文字幕| 日本一区二区免费在线视频| 99久久99久久久精品蜜桃| 一进一出抽搐gif免费好疼| 99精品欧美一区二区三区四区| 亚洲精品久久国产高清桃花| 精品无人区乱码1区二区| 亚洲天堂国产精品一区在线| 99国产精品一区二区三区| 成人特级黄色片久久久久久久| 午夜福利一区二区在线看| 夜夜爽天天搞| 亚洲天堂国产精品一区在线| 一边摸一边做爽爽视频免费| 天堂√8在线中文| 男人操女人黄网站| 最新美女视频免费是黄的| 国产视频一区二区在线看| 一进一出好大好爽视频| 亚洲色图 男人天堂 中文字幕| 淫妇啪啪啪对白视频| 亚洲电影在线观看av| 亚洲成人国产一区在线观看| 在线观看日韩欧美| 亚洲国产日韩欧美精品在线观看 | 欧美成人免费av一区二区三区| 99国产精品一区二区三区| 18禁黄网站禁片免费观看直播| 国产精品日韩av在线免费观看| av超薄肉色丝袜交足视频| e午夜精品久久久久久久| 色综合婷婷激情| 伊人久久大香线蕉亚洲五| av有码第一页| 免费看日本二区| 欧美性长视频在线观看| 国产蜜桃级精品一区二区三区| 视频在线观看一区二区三区| 日本一本二区三区精品| 身体一侧抽搐| 国产亚洲欧美在线一区二区| 日本一区二区免费在线视频| 无限看片的www在线观看| 色在线成人网| 亚洲一码二码三码区别大吗| 亚洲国产中文字幕在线视频| 亚洲午夜精品一区,二区,三区| 天天躁狠狠躁夜夜躁狠狠躁| 久久天躁狠狠躁夜夜2o2o| 狠狠狠狠99中文字幕| 亚洲欧美精品综合久久99| 又黄又粗又硬又大视频| 草草在线视频免费看| 欧美黑人巨大hd| 伦理电影免费视频| 日本免费一区二区三区高清不卡| АⅤ资源中文在线天堂| www.999成人在线观看| 亚洲va日本ⅴa欧美va伊人久久| 美国免费a级毛片| 1024手机看黄色片| 国产日本99.免费观看| 两人在一起打扑克的视频| 久久国产精品人妻蜜桃| 免费一级毛片在线播放高清视频| 欧美绝顶高潮抽搐喷水| 久久精品91蜜桃| 午夜影院日韩av| 久久香蕉国产精品| 色精品久久人妻99蜜桃| 黄色片一级片一级黄色片| 伦理电影免费视频| 亚洲国产日韩欧美精品在线观看 | 久久精品人妻少妇| 国产又色又爽无遮挡免费看| 久久久久久国产a免费观看| 国产亚洲精品久久久久5区| 在线观看免费日韩欧美大片| www.精华液| 女人爽到高潮嗷嗷叫在线视频| 久久 成人 亚洲| 侵犯人妻中文字幕一二三四区| 久久精品国产清高在天天线| 午夜老司机福利片| 激情在线观看视频在线高清| 宅男免费午夜| aaaaa片日本免费| 亚洲最大成人中文| 久久99热这里只有精品18| 亚洲av熟女| 欧美国产日韩亚洲一区| 一区二区三区高清视频在线| 91av网站免费观看| 国产高清videossex| 国产精品亚洲一级av第二区| videosex国产| 日韩欧美在线二视频| 亚洲专区国产一区二区| 久久久久久国产a免费观看| 久久久精品国产亚洲av高清涩受| √禁漫天堂资源中文www| 婷婷亚洲欧美| 精品高清国产在线一区| 黄片大片在线免费观看| 精品一区二区三区四区五区乱码| 免费观看精品视频网站| 老熟妇仑乱视频hdxx| 18禁国产床啪视频网站| 国产成人精品久久二区二区91| 1024手机看黄色片| 亚洲中文av在线| 久久人妻福利社区极品人妻图片| 欧美丝袜亚洲另类 | 99国产精品一区二区三区| 一进一出抽搐gif免费好疼| 一二三四社区在线视频社区8| 国产伦人伦偷精品视频| 美女 人体艺术 gogo| 国产亚洲精品av在线| 91字幕亚洲| 色综合站精品国产| 99在线视频只有这里精品首页| 日韩一卡2卡3卡4卡2021年| 国产精品一区二区免费欧美| av免费在线观看网站| 精品国产一区二区三区四区第35| 99国产综合亚洲精品| 国产国语露脸激情在线看| 50天的宝宝边吃奶边哭怎么回事| 一级黄色大片毛片| 久久精品aⅴ一区二区三区四区| 亚洲七黄色美女视频| 夜夜夜夜夜久久久久| 一级毛片高清免费大全| 成人av一区二区三区在线看| 久久久久久久久久黄片| 亚洲精品久久国产高清桃花| svipshipincom国产片| 欧美精品啪啪一区二区三区| 在线视频色国产色| 久久中文字幕一级| 免费看日本二区| 亚洲午夜精品一区,二区,三区| 两个人免费观看高清视频| 久久精品成人免费网站| 欧美中文综合在线视频| 日本熟妇午夜| 国产成人系列免费观看| 国产黄色小视频在线观看| 亚洲成a人片在线一区二区| 免费一级毛片在线播放高清视频| 欧美成人午夜精品| 国产欧美日韩一区二区三| 69av精品久久久久久| 亚洲色图 男人天堂 中文字幕| 一级毛片精品| 日本免费一区二区三区高清不卡| 哪里可以看免费的av片| 国产精华一区二区三区| 亚洲欧美精品综合久久99| 99国产精品99久久久久| 久久欧美精品欧美久久欧美| 在线天堂中文资源库| 久久久久九九精品影院| 亚洲国产中文字幕在线视频| 成人国产综合亚洲| 男人舔女人下体高潮全视频| cao死你这个sao货| 久久中文字幕一级| 两人在一起打扑克的视频| 淫妇啪啪啪对白视频| 中文亚洲av片在线观看爽| 欧美黑人精品巨大| 久久久久久久精品吃奶| 桃色一区二区三区在线观看| 人人妻人人看人人澡| 伊人久久大香线蕉亚洲五| a级毛片a级免费在线| 99久久精品国产亚洲精品| 一卡2卡三卡四卡精品乱码亚洲| 韩国av一区二区三区四区| 每晚都被弄得嗷嗷叫到高潮| av欧美777| 久久精品91无色码中文字幕| 男女那种视频在线观看| 婷婷精品国产亚洲av| 精品国产一区二区三区四区第35| 制服丝袜大香蕉在线| 女人被狂操c到高潮| 中文字幕精品免费在线观看视频| 女人高潮潮喷娇喘18禁视频| 黑丝袜美女国产一区| 在线看三级毛片| 国产成+人综合+亚洲专区| 无遮挡黄片免费观看| 亚洲欧美一区二区三区黑人| 99热这里只有精品一区 | 国产免费av片在线观看野外av| a在线观看视频网站| 色av中文字幕| 999久久久国产精品视频| 99久久无色码亚洲精品果冻| 搞女人的毛片| 国产精品日韩av在线免费观看| 久久伊人香网站| 国产av在哪里看| www.www免费av| 韩国av一区二区三区四区| 久久久久久久久久黄片| 国产精品永久免费网站| www日本黄色视频网| 中文字幕人妻熟女乱码| 熟女电影av网| 99久久无色码亚洲精品果冻| 亚洲va日本ⅴa欧美va伊人久久| 在线天堂中文资源库| svipshipincom国产片| 日本五十路高清| 亚洲成av人片免费观看| 欧美国产精品va在线观看不卡| 国产精品久久久人人做人人爽| 国产精品九九99| 波多野结衣av一区二区av| av在线天堂中文字幕| 夜夜夜夜夜久久久久| 欧美 亚洲 国产 日韩一| 亚洲国产毛片av蜜桃av| 国产成人精品久久二区二区91| 欧美日韩亚洲国产一区二区在线观看| 亚洲欧美精品综合一区二区三区| 久久精品国产亚洲av香蕉五月| 亚洲九九香蕉| 少妇的丰满在线观看| 日本熟妇午夜| 久久婷婷人人爽人人干人人爱| 国产精华一区二区三区| 亚洲精品av麻豆狂野| 亚洲 国产 在线| 嫩草影院精品99| 免费看日本二区| 亚洲专区国产一区二区| 波多野结衣高清作品| 久99久视频精品免费| 国产熟女xx| 两个人免费观看高清视频| 最近在线观看免费完整版| 成人精品一区二区免费| 人人妻人人澡欧美一区二区| 亚洲欧美精品综合久久99| 亚洲va日本ⅴa欧美va伊人久久| 国产在线观看jvid| 成在线人永久免费视频| 久久草成人影院| 又紧又爽又黄一区二区| 亚洲av成人av| 99久久精品国产亚洲精品| 欧美不卡视频在线免费观看 | 人人妻,人人澡人人爽秒播| 国产亚洲精品久久久久5区| 亚洲欧洲精品一区二区精品久久久| 亚洲精品在线美女| 一个人免费在线观看的高清视频| 人妻久久中文字幕网| 国产亚洲精品久久久久久毛片| 欧美激情极品国产一区二区三区| 日本撒尿小便嘘嘘汇集6| 亚洲午夜精品一区,二区,三区| 十八禁网站免费在线| 夜夜夜夜夜久久久久| ponron亚洲| 亚洲成av人片免费观看| 亚洲精品在线美女| 国产色视频综合| 一级黄色大片毛片| 1024视频免费在线观看| av免费在线观看网站| 亚洲av第一区精品v没综合| netflix在线观看网站| av有码第一页| 可以在线观看毛片的网站| 岛国视频午夜一区免费看| 高清在线国产一区| 日韩欧美一区二区三区在线观看| 高清在线国产一区| 香蕉av资源在线| 成人三级做爰电影| 男人舔女人下体高潮全视频| 一卡2卡三卡四卡精品乱码亚洲| 色在线成人网| 可以免费在线观看a视频的电影网站| 亚洲精品在线观看二区| 亚洲欧美激情综合另类| 2021天堂中文幕一二区在线观 | 精华霜和精华液先用哪个| 免费在线观看亚洲国产| 最好的美女福利视频网| 欧美黄色淫秽网站| 97碰自拍视频| aaaaa片日本免费| 日韩精品青青久久久久久| 麻豆成人午夜福利视频| 麻豆久久精品国产亚洲av| 俺也久久电影网| 变态另类成人亚洲欧美熟女| 中亚洲国语对白在线视频| 两性午夜刺激爽爽歪歪视频在线观看 | 黄色视频,在线免费观看| 高潮久久久久久久久久久不卡| 1024香蕉在线观看| 黄片播放在线免费| 在线免费观看的www视频| 日本 av在线| aaaaa片日本免费| 国产精品久久久久久亚洲av鲁大| 国产日本99.免费观看| 亚洲av成人不卡在线观看播放网| 日韩一卡2卡3卡4卡2021年| www.自偷自拍.com| 97超级碰碰碰精品色视频在线观看| 欧美+亚洲+日韩+国产| 久久香蕉激情| 韩国精品一区二区三区| 国产麻豆成人av免费视频| 12—13女人毛片做爰片一| 成人手机av| 亚洲电影在线观看av| 91国产中文字幕| 国产精品亚洲一级av第二区| 在线观看免费日韩欧美大片| 国产成人欧美| av福利片在线| 亚洲国产欧美日韩在线播放| 1024手机看黄色片| 天天躁夜夜躁狠狠躁躁| 欧美色欧美亚洲另类二区| 韩国精品一区二区三区| 久久久久久亚洲精品国产蜜桃av| 久久国产精品男人的天堂亚洲| 亚洲第一欧美日韩一区二区三区| 久久精品夜夜夜夜夜久久蜜豆 | 久久久久精品国产欧美久久久| 一区二区日韩欧美中文字幕| 国内久久婷婷六月综合欲色啪| 黄色女人牲交| 欧美久久黑人一区二区| 国产黄a三级三级三级人| 脱女人内裤的视频| 91成年电影在线观看| 中文字幕高清在线视频| 国产精品精品国产色婷婷| 色综合婷婷激情| a级毛片a级免费在线| 国产亚洲精品av在线| 久久久精品欧美日韩精品| 男男h啪啪无遮挡| 久久久国产精品麻豆| 人人妻人人看人人澡| 午夜福利免费观看在线| 久久久久久久久中文| 99国产综合亚洲精品| 中文字幕精品免费在线观看视频| 成人午夜高清在线视频 | 91国产中文字幕| 亚洲精品中文字幕在线视频| 日本一区二区免费在线视频| 久久人人精品亚洲av| 欧美黄色淫秽网站| 午夜a级毛片| 正在播放国产对白刺激| 久久精品影院6| 看片在线看免费视频| 成人亚洲精品一区在线观看| 亚洲专区字幕在线| 老鸭窝网址在线观看| 欧美成人午夜精品| 在线观看日韩欧美| 欧美日本亚洲视频在线播放| 亚洲精品国产一区二区精华液| 黄色女人牲交| 欧美一级a爱片免费观看看 | 国产97色在线日韩免费| av欧美777| 午夜久久久久精精品| 中文字幕人妻丝袜一区二区| 国产1区2区3区精品| or卡值多少钱| 久久久久国产精品人妻aⅴ院| 色播亚洲综合网| 侵犯人妻中文字幕一二三四区| 成人手机av| 久久久久久九九精品二区国产 | 又黄又粗又硬又大视频| 日本 欧美在线| 精品国产超薄肉色丝袜足j| 中文字幕人妻熟女乱码| 村上凉子中文字幕在线| 亚洲国产中文字幕在线视频| 88av欧美| 精品卡一卡二卡四卡免费| 丝袜美腿诱惑在线| 国产精品98久久久久久宅男小说| 成年人黄色毛片网站| 天天躁夜夜躁狠狠躁躁| 狂野欧美激情性xxxx| 老汉色∧v一级毛片| 国产真实乱freesex| 午夜福利在线在线| 婷婷丁香在线五月| 国产精品,欧美在线| 一级毛片女人18水好多| 精品久久久久久久毛片微露脸| 亚洲av中文字字幕乱码综合 | 国产精品亚洲一级av第二区| 久99久视频精品免费| 午夜影院日韩av| 美女扒开内裤让男人捅视频| 国产蜜桃级精品一区二区三区| 人妻久久中文字幕网| 91成人精品电影| av福利片在线| 亚洲五月色婷婷综合| 亚洲七黄色美女视频| 精品卡一卡二卡四卡免费| 黄色视频不卡| 久久久久久久久免费视频了| 久热这里只有精品99| 在线av久久热| 国产精品综合久久久久久久免费| 1024视频免费在线观看| 超碰成人久久| 叶爱在线成人免费视频播放| 日日摸夜夜添夜夜添小说| 欧美黄色片欧美黄色片| 成熟少妇高潮喷水视频| 村上凉子中文字幕在线| 非洲黑人性xxxx精品又粗又长| 身体一侧抽搐| 黄片大片在线免费观看| 一级a爱视频在线免费观看| 一夜夜www| 国产亚洲精品综合一区在线观看 | 国产三级黄色录像| 我的亚洲天堂| 老汉色av国产亚洲站长工具| 日韩大尺度精品在线看网址| 天堂√8在线中文| 免费在线观看日本一区| 亚洲av成人av| 国产精品av久久久久免费| 亚洲欧美日韩高清在线视频| 香蕉av资源在线| 夜夜躁狠狠躁天天躁| 18禁国产床啪视频网站| 老司机午夜十八禁免费视频| 亚洲 欧美 日韩 在线 免费| 这个男人来自地球电影免费观看| 国产精品98久久久久久宅男小说| 亚洲国产精品成人综合色| 日本熟妇午夜| 黄频高清免费视频| 色综合婷婷激情| 久久人妻福利社区极品人妻图片| av电影中文网址| 欧美激情高清一区二区三区| 亚洲av片天天在线观看| 免费看美女性在线毛片视频| 国产精品国产高清国产av| 欧美zozozo另类| 国产伦一二天堂av在线观看| 亚洲人成77777在线视频| 免费一级毛片在线播放高清视频| 国产三级黄色录像| 丁香六月欧美| 日韩视频一区二区在线观看| 国产精品1区2区在线观看.| 欧美日韩一级在线毛片| 精品久久久久久,| 最近最新中文字幕大全电影3 | 国产97色在线日韩免费| 免费电影在线观看免费观看| 在线观看舔阴道视频| 亚洲精华国产精华精| 老汉色∧v一级毛片| www国产在线视频色| 国产精品,欧美在线| 中文资源天堂在线| 久久久久国内视频| 女人高潮潮喷娇喘18禁视频| 国产又黄又爽又无遮挡在线| 嫩草影院精品99| 日本成人三级电影网站| 国产一区二区在线av高清观看| 国产熟女xx| 午夜免费激情av| 精品人妻1区二区| 久久久久精品国产欧美久久久| 91成年电影在线观看| 手机成人av网站| 久99久视频精品免费| 国内揄拍国产精品人妻在线 | 美女高潮喷水抽搐中文字幕| 国产免费男女视频| 给我免费播放毛片高清在线观看| 国产成人系列免费观看| 国产在线精品亚洲第一网站| 欧美日韩乱码在线| 老汉色∧v一级毛片| 少妇的丰满在线观看| 亚洲国产欧洲综合997久久, | 真人一进一出gif抽搐免费| 一级a爱片免费观看的视频| 人妻丰满熟妇av一区二区三区| 狠狠狠狠99中文字幕| 成人av一区二区三区在线看| 99热这里只有精品一区 | 亚洲精品一区av在线观看| 制服人妻中文乱码| 制服丝袜大香蕉在线| 老汉色∧v一级毛片| 亚洲av电影不卡..在线观看| 亚洲精品粉嫩美女一区| 黄色成人免费大全| 可以在线观看的亚洲视频| 亚洲精品久久成人aⅴ小说| 一区二区三区国产精品乱码| 在线观看午夜福利视频| 色在线成人网| 人人澡人人妻人| 男女之事视频高清在线观看| 悠悠久久av| 午夜成年电影在线免费观看| 天天添夜夜摸| 妹子高潮喷水视频| 精品久久蜜臀av无| av有码第一页| 在线观看免费视频日本深夜| 性欧美人与动物交配| 长腿黑丝高跟| 国产精品一区二区精品视频观看| 久久这里只有精品19| 亚洲第一青青草原| 少妇熟女aⅴ在线视频| 精品熟女少妇八av免费久了| av在线播放免费不卡| 亚洲av中文字字幕乱码综合 | 久久精品91蜜桃| 99久久综合精品五月天人人| 久久久水蜜桃国产精品网| 精品福利观看| x7x7x7水蜜桃| 99精品欧美一区二区三区四区| 日韩国内少妇激情av| av福利片在线| 国产av一区二区精品久久| 女人爽到高潮嗷嗷叫在线视频| 青草久久国产| 18禁黄网站禁片免费观看直播| 国产1区2区3区精品| 色精品久久人妻99蜜桃| 精品久久久久久,| 一级毛片精品| 国产成人影院久久av| 国产精品久久久av美女十八| 精品第一国产精品| 亚洲精品中文字幕一二三四区| 日本免费一区二区三区高清不卡| 天堂影院成人在线观看| а√天堂www在线а√下载| 成人国产一区最新在线观看| 欧美久久黑人一区二区| 免费人成视频x8x8入口观看| 女人高潮潮喷娇喘18禁视频| 精品国内亚洲2022精品成人| 日本 欧美在线| 欧美av亚洲av综合av国产av| 看片在线看免费视频| 大香蕉久久成人网| 啦啦啦免费观看视频1| 亚洲午夜理论影院| 欧美成狂野欧美在线观看|