• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    科研興趣空間挖掘與多任務(wù)推薦研究
    ——基于異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)

    2023-11-21 09:48:50崔鴻飛馮子函張靖雨
    情報(bào)學(xué)報(bào) 2023年10期
    關(guān)鍵詞:合作者異質(zhì)信息網(wǎng)絡(luò)

    崔鴻飛,馮子函,張靖雨

    (1. 北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院,北京 100083;2. 北京航空航天大學(xué)經(jīng)濟(jì)管理學(xué)院,北京 100191;3. 愛丁堡大學(xué)商學(xué)院,愛丁堡 EH8 9JU)

    0 引 言

    隨著科研進(jìn)程的不斷推進(jìn)與發(fā)展,研究人員間的科研活動(dòng)日趨復(fù)雜化、多樣化,獲得一項(xiàng)科研成果往往需要不同研究方向的研究者密切合作[1],以及從不同研究主題中獲取新的靈感[2]。然而,由于各領(lǐng)域研究者不斷增多,潛在的合作者變得越來越多,隨著學(xué)術(shù)問題的研究日趨深入,研究者所面臨的知識爆炸問題也日趨嚴(yán)重。在這種情況下,研究者難以在有限的時(shí)間中,對自己領(lǐng)域內(nèi)外的潛在合作者和研究靈感進(jìn)行全面了解。

    與此同時(shí),隨著信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)上涌現(xiàn)了許多優(yōu)秀的科研文獻(xiàn)數(shù)據(jù)庫,如美國科學(xué)信息研究所創(chuàng)建的多學(xué)科核心期刊文獻(xiàn)數(shù)據(jù)庫Web of Science (www.webofknowledge.com)、美國國立醫(yī)學(xué)圖書館國家生物技術(shù)信息中心的醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫PubMed(http://www.ncbi.nl.nih.gov/pubmed)等,收錄了其關(guān)注的各個(gè)領(lǐng)域的大量研究成果。這些成果主要以論文形式展示,囊括了作者的合作關(guān)系、作者對關(guān)鍵詞的選擇等大量科研行為。合理利用這些科研行為信息,個(gè)性化地提供潛在合作者和研究靈感的推薦列表以供篩選,對研究者來說,不僅可以有效地節(jié)約時(shí)間,更可以使其科學(xué)研究道路更具有方向性。

    對科研論文中的科研行為信息進(jìn)行挖掘,一種比較常見的做法是將大量論文中蘊(yùn)含的科研關(guān)系抽象成同質(zhì)(homogeneous)[1,3-4]或異質(zhì)(heterogeneous)信息網(wǎng)絡(luò)(information network)[5-7],各種科研主體(如作者、關(guān)鍵詞等)被抽象為網(wǎng)絡(luò)中的節(jié)點(diǎn),對象間的各種聯(lián)系(如合著關(guān)系)被抽象成網(wǎng)絡(luò)中的邊。這種網(wǎng)絡(luò)化處理方法已經(jīng)被廣泛應(yīng)用于科研關(guān)系分析及推薦任務(wù)的研究中,并在數(shù)據(jù)整合、數(shù)據(jù)挖掘、科研合作關(guān)系理解、科研個(gè)性化推薦研究等方面做出了重要貢獻(xiàn)(詳見下文“相關(guān)研究”)。然而,這類研究往往具有兩個(gè)特點(diǎn):其一,現(xiàn)有研究往往更關(guān)注科研共著關(guān)系(或科研合作者推薦),忽略了科研興趣方向推薦任務(wù)的研究;其二,現(xiàn)有研究往往基于同質(zhì)信息網(wǎng)絡(luò),忽略了作者與機(jī)構(gòu)之間的從屬關(guān)系、作者與文章關(guān)鍵詞之間的學(xué)科領(lǐng)域與科研興趣關(guān)系當(dāng)中蘊(yùn)含的巨大信息量。在最新的一些研究中,已經(jīng)有學(xué)者開始關(guān)注并分析異質(zhì)信息網(wǎng)絡(luò)[5-7],但這些研究引入異質(zhì)性的普遍目標(biāo)依然是科研合作者推薦任務(wù),或者即使涉及關(guān)鍵詞推薦,也缺乏對關(guān)鍵詞推薦正確率的量化分析。而完全從異質(zhì)性視角出發(fā),分析作者與關(guān)鍵詞之間的關(guān)系,并為科研人員提供有效的關(guān)鍵詞推薦列表,激發(fā)科研人員的研究靈感,是非常重要且至今尚缺乏深入研究的主題。

    在關(guān)鍵詞推薦和合作者推薦的雙任務(wù)推薦背景下,本研究希望探討與同質(zhì)信息網(wǎng)絡(luò)表示的視角相比,基于異質(zhì)信息網(wǎng)絡(luò)的節(jié)點(diǎn)表示與推薦方法是否更加適用。為此,本研究基于PubMed 文獻(xiàn)數(shù)據(jù)庫,選擇當(dāng)前研究熱點(diǎn)之一,即生命組學(xué)及醫(yī)學(xué)相關(guān)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域,分析科研工作者之間以及科研工作者與領(lǐng)域關(guān)鍵詞之間的關(guān)系,同時(shí)解決合作者推薦與研究興趣推薦兩大任務(wù)?;谠擃I(lǐng)域2010—2021 年發(fā)表的13 萬篇論文,本研究濾除僅出現(xiàn)1 次的作者與關(guān)鍵詞,篩選出1.1 萬篇適合進(jìn)行科研合作者及關(guān)鍵詞預(yù)測的文獻(xiàn),從異質(zhì)性視角將文獻(xiàn)抽象成為包含作者、機(jī)構(gòu)、關(guān)鍵詞、論文多種主體的“科研異質(zhì)信息網(wǎng)絡(luò)”,并使用異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法metapath2vec 進(jìn)行網(wǎng)絡(luò)節(jié)點(diǎn)嵌入,生成一個(gè)同時(shí)對作者與關(guān)鍵詞進(jìn)行語義化向量表示、充分體現(xiàn)作者研究興趣的異質(zhì)科研興趣空間,進(jìn)而基于該異質(zhì)科研興趣空間同時(shí)完成科研合作者與科研關(guān)鍵詞推薦兩種任務(wù),在兩種任務(wù)中均獲得更優(yōu)的表現(xiàn)。此外,本研究的關(guān)注點(diǎn)不僅在于推薦任務(wù),還對網(wǎng)絡(luò)分析過程中生成的異質(zhì)科研興趣空間中蘊(yùn)含的豐富語義信息開展進(jìn)一步挖掘和研究,以證明該興趣空間對表示科研人員潛在研究方向的有效性,并在科研領(lǐng)域交叉與關(guān)聯(lián)的理解中提供啟發(fā)性方向。

    1 相關(guān)研究

    1.1 基于經(jīng)典網(wǎng)絡(luò)視角的科研推薦研究

    “科研推薦”是存在于兩個(gè)科研主體(如作者、關(guān)鍵詞、機(jī)構(gòu)、期刊等)間的推薦任務(wù)的統(tǒng)稱,其背后包含了各種具體的推薦任務(wù),如本研究主要關(guān)注的科研合作者推薦、科研關(guān)鍵詞推薦等。在網(wǎng)絡(luò)視角下,科研推薦的本質(zhì)是一種鏈接預(yù)測(link prediction),當(dāng)模型預(yù)測兩個(gè)科研主體在網(wǎng)絡(luò)中有大概率產(chǎn)生聯(lián)系時(shí),其中一個(gè)科研主體就會(huì)被推薦給與之匹配的另一個(gè)科研主體。

    現(xiàn)有關(guān)于“科研推薦”的研究主要集中于科研合作者推薦,“科研網(wǎng)絡(luò)”是執(zhí)行這一推薦任務(wù)的主要載體。比如,張金柱等[1]構(gòu)建了作者-關(guān)鍵詞二分網(wǎng)絡(luò),并使用基于路徑組合的網(wǎng)絡(luò)指標(biāo)與邏輯回歸進(jìn)行了科研合著預(yù)測;劉萍等[8]、關(guān)盼盼[9]以社交網(wǎng)絡(luò)理論為基礎(chǔ),在作者關(guān)系的研究中引入隱含狄利克雷分布(latent Dirichlet allocation,LDA)來刻畫作者的研究興趣,進(jìn)而實(shí)現(xiàn)科研合作者的推薦;余傳明等[3]、Yan 等[10]、呂偉民等[11]、秦紅武等[12]在作者合著網(wǎng)絡(luò)的分析中應(yīng)用了鏈接預(yù)測的特征指標(biāo),如Adamic-Adar index(AA)、common neighbors(CN)、Katz indices(Katz)等,其中,呂偉民等[11]、秦紅武等[12]分別將極端隨機(jī)樹、k-means 算法與這些指標(biāo)結(jié)合,余傳明等[3]將基于路徑的與基于鄰居的網(wǎng)絡(luò)特征指標(biāo)彼此間融合,以“特征融合”為基本思路完成科研合作推薦的任務(wù)。

    上述研究的共同特點(diǎn)是基于網(wǎng)絡(luò)結(jié)構(gòu)指標(biāo)特征,結(jié)合統(tǒng)計(jì)學(xué)習(xí)理論建立模型,實(shí)現(xiàn)對網(wǎng)絡(luò)鏈接關(guān)系進(jìn)行預(yù)測的目標(biāo)。這種方式非常依賴于模型開發(fā)者對網(wǎng)絡(luò)的理解和對特征的選擇經(jīng)驗(yàn),同時(shí)對于大規(guī)模數(shù)據(jù)集,這種傳統(tǒng)的網(wǎng)絡(luò)分析方法對計(jì)算力的要求非常高。隨著深度學(xué)習(xí)領(lǐng)域研究的創(chuàng)新與突破,網(wǎng)絡(luò)表示學(xué)習(xí)逐漸在科研推薦任務(wù)中得到越來越廣泛的應(yīng)用,這種方法直接通過模型訓(xùn)練從原始數(shù)據(jù)中自動(dòng)提取特征,避免了對模型開發(fā)者經(jīng)驗(yàn)的過度依賴;同時(shí),在大規(guī)模網(wǎng)絡(luò)的計(jì)算方面,往往可以比傳統(tǒng)網(wǎng)絡(luò)分析方法具有更優(yōu)的速度,因此,在科研推薦研究中逐漸開始扮演重要角色。

    1.2 基于網(wǎng)絡(luò)表示學(xué)習(xí)的科研推薦研究

    網(wǎng)絡(luò)表示學(xué)習(xí)(network representation learning)是表示學(xué)習(xí)(representation learning)方法的一個(gè)重要分支。相關(guān)實(shí)驗(yàn)已經(jīng)證明,將網(wǎng)絡(luò)表示學(xué)習(xí)算法應(yīng)用于鏈路預(yù)測等下游任務(wù)中,其表現(xiàn)往往優(yōu)于一些基于指標(biāo)計(jì)算的傳統(tǒng)算法,在SDNE(structural deep network embedding)[13]與node2vec[14]等研究中皆可體現(xiàn)。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,這種以數(shù)據(jù)隱式特征提取為思路的研究方法,被廣泛應(yīng)用于科研行為數(shù)據(jù)的分析中。

    在這些基于網(wǎng)絡(luò)表示學(xué)習(xí)的科研推薦研究工作中,學(xué)者們往往先構(gòu)建以推薦主體為節(jié)點(diǎn)的科研網(wǎng)絡(luò),再利用各種網(wǎng)絡(luò)表示學(xué)習(xí)方法對網(wǎng)絡(luò)主體進(jìn)行向量化表示。例如,張金柱等[1]使用網(wǎng)絡(luò)表示學(xué)習(xí)算法在合著網(wǎng)絡(luò)中對作者向量進(jìn)行表示學(xué)習(xí)以完成科研合作預(yù)測任務(wù);余傳明等[4]將不同網(wǎng)絡(luò)表示學(xué)習(xí)算法下的作者向量表示進(jìn)行了加權(quán)平均融合,并基于此構(gòu)建科研合作推薦模型;張鑫等[15]將網(wǎng)絡(luò)表示學(xué)習(xí)算法生成的作者節(jié)點(diǎn)嵌入與基于作者主題模型生成的作者主題向量表征進(jìn)行線性特征融合,用于作者合作預(yù)測。上述研究的相似點(diǎn)在于它們的同質(zhì)性視角:在這些研究中,被進(jìn)行表示學(xué)習(xí)的網(wǎng)絡(luò)都是科研合作網(wǎng)絡(luò),或稱“共著網(wǎng)絡(luò)”,其本質(zhì)是一種僅包含作者節(jié)點(diǎn),并以作者合作關(guān)系為邊的同質(zhì)信息網(wǎng)絡(luò)。因此,上述研究中所利用的網(wǎng)絡(luò)表示學(xué)習(xí)算法都屬于同質(zhì)信息網(wǎng)絡(luò)嵌入方法,如Deep-Walk、node2vec、LINE (large-scale information network embedding)、SDNE 等。

    事實(shí)上,在科研關(guān)系預(yù)測問題中,同質(zhì)的作者合作關(guān)系僅是豐富科研行為信息中的冰山一角。一個(gè)直觀的靈感是,如果把作者與研究機(jī)構(gòu)的從屬關(guān)系、作者對關(guān)鍵詞的選取關(guān)系等信息融入網(wǎng)絡(luò)進(jìn)行挖掘,在科研關(guān)系預(yù)測中可能會(huì)獲得更好的效果。隨著網(wǎng)絡(luò)表示學(xué)習(xí)方法的不斷發(fā)展,異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法越來越成熟,學(xué)者們對科研網(wǎng)絡(luò)的構(gòu)建與分析,自然而然地轉(zhuǎn)向了異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法。劉云楓等[5]在網(wǎng)絡(luò)構(gòu)建時(shí)引入作者、關(guān)鍵詞、機(jī)構(gòu)、論文、出版物多種主體,提出了一種基于不同元路徑的多關(guān)系映射方法以獲取表示學(xué)習(xí)的語料庫;王鑫[7]在異質(zhì)信息網(wǎng)絡(luò)構(gòu)建的基礎(chǔ)上,提出了一種基于屬性網(wǎng)絡(luò)表示和主題感知的學(xué)術(shù)合作者推薦(topic-aware academic collaborator recommendation based on attributed network representation learning,TACR-ANRL)算法。這些研究通過在網(wǎng)絡(luò)中引入異質(zhì)信息,對作者向量給出了更精準(zhǔn)的表示,從而獲得了更優(yōu)的合作者推薦結(jié)果。在本研究關(guān)注的另一個(gè)重要推薦任務(wù)即關(guān)鍵詞推薦方面,相關(guān)研究非常缺乏。其中一項(xiàng)優(yōu)秀的先驅(qū)性研究來自林原等[16],該研究將作者、地址、關(guān)鍵詞3 種信息用于構(gòu)建科研異質(zhì)信息網(wǎng)絡(luò),利用node2vec 方法進(jìn)行網(wǎng)絡(luò)嵌入后,為科研工作者推薦了合作者、機(jī)構(gòu)與關(guān)鍵詞。在這項(xiàng)研究中,雖然科研網(wǎng)絡(luò)為異質(zhì)信息網(wǎng)絡(luò),但圖嵌入算法依然為同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法,這種方式是否能充分發(fā)揮異質(zhì)信息網(wǎng)絡(luò)的異質(zhì)性優(yōu)勢,有待進(jìn)一步討論。同時(shí),這項(xiàng)研究并未設(shè)計(jì)相關(guān)指標(biāo)對合作者與關(guān)鍵詞的推薦正確率進(jìn)行評估。這些方面非常值得進(jìn)一步探索。已有很多網(wǎng)絡(luò)表示學(xué)習(xí)算法,如經(jīng)典的以隨機(jī)游走為基礎(chǔ)的metapath2vec[17]和在其基礎(chǔ)上從不同角度改進(jìn)的spacey[18]、 JUST[19]、 BHIN2vec (balanced heterogeneous information network to vector)[20]、HHNE(hyperbolic heterogeneous information network embedding model)[21]等,以矩陣分解為基礎(chǔ)的PME(projected metric embedding model)[22]、 EOE (embedding of embedding)[23]等,以及近年來不斷涌現(xiàn)的深度學(xué)習(xí)方法GATNE(general attributed multiplex heterogeneous network embedding)[24]、 MAGNN (metapath aggregated graph neural network)[25]、HGT(heterogeneous graph transformer)[26]等,這些算法均能夠應(yīng)用于異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí),其中部分算法被證明在一些作者合作網(wǎng)絡(luò)的鏈路預(yù)測任務(wù)中可以獲得良好效果[17,27-28]。基于這些算法,本課題組的一項(xiàng)預(yù)研究工作[29]驗(yàn)證了基于metapath2vec 的網(wǎng)絡(luò)表示學(xué)習(xí)方法,所得到的作者與其所發(fā)表過的關(guān)鍵詞之間的平均距離顯著低于該作者與隨機(jī)選擇的關(guān)鍵詞之間的距離,這為本研究的雙目標(biāo)推薦系統(tǒng)提供了充分的可行性依據(jù)。

    此外,盡管網(wǎng)絡(luò)表示學(xué)習(xí)的方法有效地提升了科研推薦任務(wù)的效果,但對科研主體嵌入表示結(jié)果的解釋和分析研究仍較為缺乏。從向量空間中深入分析同質(zhì)或異質(zhì)科研主體之間的位置和聚集關(guān)系,尤其是關(guān)鍵詞空間或關(guān)鍵詞相關(guān)的作者空間的分析,會(huì)為理解科研工作者視角下的領(lǐng)域定位、領(lǐng)域之間相關(guān)性與領(lǐng)域差異,提供豐富的可解釋性資源。因此,本研究不但在異質(zhì)信息網(wǎng)絡(luò)構(gòu)建、網(wǎng)絡(luò)表示學(xué)習(xí)算法使用、推薦模型構(gòu)建與評估等各方面進(jìn)行了更深一步的探索,而且完成了科研合作者與科研興趣推薦的任務(wù),并對嵌入的向量空間進(jìn)行了全局與個(gè)體視角的深入可視化分析。這些工作將為現(xiàn)有的科研推薦研究工作提供新的分析角度,研究結(jié)論也將為科研人員理解領(lǐng)域交叉、尋找新的研究方向提供靈感。

    2 研究思路和方法

    2.1 研究思路

    本研究的整體思路如圖1 所示。本研究聚焦于生命組學(xué)及醫(yī)學(xué)相關(guān)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)大領(lǐng)域,收集了2010—2021 年發(fā)表的13 萬篇科研論文,并根據(jù)數(shù)據(jù)記錄質(zhì)量、作者出現(xiàn)次數(shù)等標(biāo)準(zhǔn)(詳見3.1 節(jié)),從中篩選出1.1 萬篇,構(gòu)成適合進(jìn)行科研合作者及關(guān)鍵詞推薦的科研數(shù)據(jù)集。基于作者、機(jī)構(gòu)、關(guān)鍵詞、論文信息,為了說明異質(zhì)視角處理科研關(guān)鍵詞及合作者推薦任務(wù)時(shí)相較于傳統(tǒng)同質(zhì)視角的效果差異,本研究構(gòu)建了基于科研行為的異質(zhì)信息網(wǎng)絡(luò)(簡稱“異質(zhì)科研行為信息網(wǎng)絡(luò)”),并使用經(jīng)典的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法metapath2vec學(xué)習(xí)這些科研主體在異質(zhì)信息網(wǎng)絡(luò)所抽象的科研行為背后的語義信息,得到作者、機(jī)構(gòu)、關(guān)鍵詞、論文4 種科研主體的向量表示。根據(jù)metapath2vec 算法的特性,上述4 種向量可以在同一個(gè)空間進(jìn)行分析,本研究稱之為“異質(zhì)科研興趣空間”,在此空間中,距離的遠(yuǎn)近表示同質(zhì)或異質(zhì)主體之間的相關(guān)程度,利用這種特性,分別計(jì)算不同科研主體的向量表示之間的相似度,并基于該相似度完成科研推薦任務(wù);同時(shí),針對該情景定義相應(yīng)的評價(jià)指標(biāo),對推薦結(jié)果的正確率進(jìn)行評價(jià)。

    本研究的推薦任務(wù)包括科研合作者推薦和關(guān)鍵詞推薦??紤]到推薦任務(wù)的一致性,本研究選取了現(xiàn)有研究中同時(shí)涉及這兩項(xiàng)任務(wù)的林原等[16]的研究作為對比基線方法,該方法采用同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法對異質(zhì)信息網(wǎng)絡(luò)進(jìn)行分析,在合作者與科研關(guān)鍵詞方面均給出了參考性的推薦結(jié)果。進(jìn)一步將該結(jié)果的正確率指標(biāo)化(詳見2.5 節(jié)),并將其與本研究的推薦結(jié)果進(jìn)行比較。此外,本研究的數(shù)據(jù)集規(guī)模較為龐大(訓(xùn)練集共3.9 萬個(gè)節(jié)點(diǎn)),考慮到基線方法原始選取的同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法node2vec 在大型數(shù)據(jù)集上所需內(nèi)存極大,運(yùn)行時(shí)間長,在實(shí)際應(yīng)用中的計(jì)算效率受限,本研究采用速度更快、更適合大型數(shù)據(jù)集[30],且正確率表現(xiàn)不亞于node2vec[17-18,31-32]的方法LINE 作為替代,用于分析在異質(zhì)信息網(wǎng)絡(luò)的節(jié)點(diǎn)表示方面,異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法相較于同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法的特性。

    2.2 異質(zhì)科研行為信息網(wǎng)絡(luò)的建立與嵌入

    2.2.1 異質(zhì)科研行為信息網(wǎng)絡(luò)的建立

    本研究構(gòu)建的異質(zhì)科研行為信息網(wǎng)絡(luò)GHeter,包含的節(jié)點(diǎn)種類集合為TV={A,K,P,O},A、K、P、O分別代表作者(author)、關(guān)鍵詞(keyword)、論文(paper)、機(jī)構(gòu)(organization)4 種網(wǎng)絡(luò)節(jié)點(diǎn);包含的邊種類集合為TE={(O,A),(A,P),(P,K)},(O,A)、(A,P)、(P,K)分別代表作者相對于機(jī)構(gòu)的從屬關(guān)系、作者相對于論文的發(fā)表關(guān)系、論文相對于關(guān)鍵詞的包含關(guān)系3 種邊。異質(zhì)科研行為信息網(wǎng)絡(luò)中節(jié)點(diǎn)與邊的具體抽象方式如圖2a 所示。

    圖2 科研行為信息網(wǎng)絡(luò)構(gòu)建方法

    值得注意的是,該網(wǎng)絡(luò)為無向網(wǎng)絡(luò),且作者A與機(jī)構(gòu)O節(jié)點(diǎn)間通過邊(O,A)直接相連;本研究在作者A與關(guān)鍵詞K這兩類節(jié)點(diǎn)間引入了論文P,并使用邊(A,P)和(P,K)相連兩者。一方面,相比于將作者A與關(guān)鍵詞K通過邊(A,K)直接相連,這種做法能夠顯著減少邊的條數(shù);另一方面,能更好地還原關(guān)鍵詞與作者在現(xiàn)實(shí)語義上的聯(lián)系。

    2.2.2 異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)與元路徑

    本研究選擇了一種基于網(wǎng)絡(luò)結(jié)構(gòu)的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法——metapath2vec,用于盡量完整地表征網(wǎng)絡(luò)結(jié)構(gòu)。該算法在異質(zhì)信息網(wǎng)絡(luò)中使用元路徑引導(dǎo)的隨機(jī)游走策略來捕獲不同類型節(jié)點(diǎn)和關(guān)系的結(jié)構(gòu)以及語義相關(guān)性,然后利用針對異質(zhì)節(jié)點(diǎn)的skip-gram 模型執(zhí)行網(wǎng)絡(luò)嵌入。該模型在提出時(shí)已經(jīng)被證明當(dāng)其用于一個(gè)計(jì)算機(jī)領(lǐng)域會(huì)議論文科研數(shù)據(jù)集時(shí),可以有效地挖掘會(huì)議之間的聯(lián)系,并能在一定程度上反映作者之間的研究方向關(guān)聯(lián)(雖然該研究并未展示其在作者合作關(guān)系與關(guān)鍵詞興趣方面的挖掘效果)。

    在metapath2vec 算法中,采樣時(shí)的隨機(jī)游走需要根據(jù)指定的元路徑(meta-path) 進(jìn)行[17],其中“元路徑”

    被定義在一種固定的R=R1?R2?… ?Rl-1復(fù)合關(guān)系上,用于拓展網(wǎng)絡(luò)節(jié)點(diǎn)之間的語義關(guān)聯(lián)。本研究參考了一種常被應(yīng)用于科研主題數(shù)據(jù)集如DBIS(database and information system)[33]、AMiner[34]等的有效元路徑方案,并結(jié)合異質(zhì)科研行為信息網(wǎng)絡(luò)中的節(jié)點(diǎn)和節(jié)點(diǎn)間的語義關(guān)系,定義了元路徑“OA-P-K-P-A-O”用于指導(dǎo)算法采樣時(shí)的隨機(jī)游走。該條元路徑包含了網(wǎng)絡(luò)中的所有類型節(jié)點(diǎn),在隨機(jī)游走過程中能夠直接采樣作者對關(guān)鍵詞的使用關(guān)系(體現(xiàn)在A-P-K與K-P-A)。此外,還包括作者與機(jī)構(gòu)的從屬關(guān)系(體現(xiàn)在O-A與A-O)、作者與作者因關(guān)鍵詞興趣而產(chǎn)生的關(guān)聯(lián)(體現(xiàn)在A-P-K-P-A)等各類聯(lián)系。使用這樣的元路徑能夠?qū)⒏嗟恼Z義融合于算法生成的嵌入向量中,從而在下游任務(wù)中實(shí)現(xiàn)更可靠的關(guān)鍵詞與合作者推薦。

    2.3 基線方法中的科研行為網(wǎng)絡(luò)建立與嵌入

    基于林原等[16]研究中的網(wǎng)絡(luò)構(gòu)建方式與網(wǎng)絡(luò)表示學(xué)習(xí)思維,本研究將相同的科研行為數(shù)據(jù)建立成為基線科研行為網(wǎng)絡(luò)GBaseline。在該網(wǎng)絡(luò)中,節(jié)點(diǎn)種類依舊包括作者(A)、機(jī)構(gòu)(O)、關(guān)鍵詞(K),邊則刻畫了作者間的合作關(guān)系(author-author,AA)、作者相對于機(jī)構(gòu)的從屬關(guān)系(author-organization,A-O)、作者相對于關(guān)鍵詞的使用關(guān)系(author-keyword,A-K)、機(jī)構(gòu)間的合作關(guān)系(organization-organization,O-O) 以及機(jī)構(gòu)相對于關(guān)鍵詞的使用關(guān)系(organization-keyword,O-K)?;€科研行為網(wǎng)絡(luò)中節(jié)點(diǎn)與邊的具體抽象方式見圖2b。

    根據(jù)基線算法的原設(shè)計(jì),本研究采用同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法對基線科研行為網(wǎng)絡(luò)GBaseline中的節(jié)點(diǎn)進(jìn)行嵌入表示。考慮到對大型數(shù)據(jù)集的適配,本研究使用同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法LINE 替代原基線算法設(shè)計(jì)中的node2vec(詳見2.1 節(jié)),用于探索利用基于同質(zhì)的方法處理異質(zhì)信息網(wǎng)絡(luò)時(shí)會(huì)發(fā)生的現(xiàn)象。LINE 算法使用KL (Kullback-Leibler)散度作為損失函數(shù),計(jì)算節(jié)點(diǎn)相似度在向量表示下的概率分布與實(shí)際網(wǎng)絡(luò)中的經(jīng)驗(yàn)分布之間的差異,并經(jīng)過優(yōu)化獲得每個(gè)節(jié)點(diǎn)的低維向量表示。

    2.4 科研主體間的相似度計(jì)算方法

    得到作者、關(guān)鍵詞等科研主體的向量表示后,本研究通過向量間的相似度來表征不同科研對象間的“距離”,相似度越高,表示兩個(gè)對象在異質(zhì)科研興趣空間中的距離越近,越可能存在潛在的關(guān)聯(lián)。本研究選擇余弦相似度作為向量間的相似度的度量。向量X=(X1,X2,…,Xn)與向量Y=(Y1,Y2,…,Yn)間的相似度sim (X,Y)的計(jì)算公式為

    其中,向量X與向量Y可以是同類型的科研主體,如作者向量Ai與作者向量Aj;也可以是不同類型的科研主體,如作者向量Ai與關(guān)鍵詞向量Kj。具體的科研主體類型由推薦任務(wù)本身的需求決定。

    2.5 推薦模型及其評價(jià)指標(biāo)

    本研究是雙任務(wù)目標(biāo),即可以同時(shí)完成科研關(guān)鍵詞推薦和科研合作者推薦。為了在推薦任務(wù)中充分為用戶提供新信息,本研究以科研主體間的相似度為標(biāo)準(zhǔn),在篩除用戶已經(jīng)使用過的關(guān)鍵詞或已經(jīng)合作過的作者后,再進(jìn)行top-n推薦。在科研關(guān)鍵詞推薦任務(wù)中,本研究為作者推薦其在異質(zhì)科研興趣空間中最接近(即向量相似度最大)的且未使用過的n個(gè)關(guān)鍵詞。類似地,在科研合作者推薦任務(wù)中,與被推薦作者向量相似度最大的n個(gè)未合作過的作者將被推薦。

    在評價(jià)指標(biāo)方面,由于科研推薦任務(wù)與很多其他領(lǐng)域(如電影推薦等)的推薦任務(wù)有相通之處,本研究參考了電影推薦場景中衡量推薦效果的指標(biāo)[35],利用“用戶命中率(hit user proportion,HUP)”來描述在未來一段時(shí)間(即測試集時(shí)間范圍)內(nèi)使用了模型推薦的關(guān)鍵詞或合作者的作者比例,計(jì)算公式為

    其中,U表示測試集中的作者總數(shù);Ii表示第i名作者在測試集中是否使用了模型推薦的關(guān)鍵詞或合作者,若使用過,則Ii= 1,否則,Ii= 0。HUP 指標(biāo)能夠描述推薦列表在現(xiàn)實(shí)中將為多大比例的作者提供幫助,HUP 值越大,表示推薦的效果越好。

    3 實(shí)驗(yàn)與分析

    3.1 數(shù)據(jù)獲取與預(yù)處理

    本研究使用的數(shù)據(jù)集來自生物醫(yī)學(xué)和健康科學(xué)領(lǐng)域的PubMed(https://pubmed.ncbi.nlm.nih.gov/)數(shù)據(jù)庫,它是當(dāng)今國際最權(quán)威的醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫之一Medline 的免費(fèi)檢索工具,由美國國立醫(yī)學(xué)圖書館開發(fā),也是生物醫(yī)學(xué)及健康領(lǐng)域使用最廣泛的互聯(lián)網(wǎng)文獻(xiàn)檢索工具。近年來,深度學(xué)習(xí)方法發(fā)展迅猛,在生物與醫(yī)學(xué)領(lǐng)域也產(chǎn)生了深刻的影響。同時(shí),PubMed 還有一套非常全面且規(guī)范的主題詞表(medical subject headings,MeSH),其將論文中可能出現(xiàn)的各種科研概念的書寫形式進(jìn)行了嚴(yán)格的控制和規(guī)范,并對每一篇論文進(jìn)行了主題詞標(biāo)注,可以認(rèn)為,PubMed 數(shù)據(jù)庫中的MeSH 主題詞比作者在撰寫論文時(shí)標(biāo)注的關(guān)鍵詞更加全面、規(guī)范和準(zhǔn)確,因此,采用MeSH 主題詞作為關(guān)鍵詞的代表。本研究下載了2010 年1 月1 日至2021 年2 月28 日發(fā)表的所有深度學(xué)習(xí)、機(jī)器學(xué)習(xí)相關(guān)的主題論文,檢索式為“(deep learning) OR (machine learning) OR (neural network)”,共下載131691 篇。

    由于文化原因和語言習(xí)慣,英文姓名往往存在著大量重名。為了明確區(qū)分同名作者,避免在研究中將不同的科研實(shí)體混淆,本研究使用作者所屬機(jī)構(gòu)字段對作者姓名進(jìn)行了消歧處理[29]。簡而言之,若兩篇論文中某兩名作者所留姓名相同且其所屬的若干機(jī)構(gòu)中存在相同所屬機(jī)構(gòu),則這兩名作者將被視為同一個(gè)作者,并使用相同的作者ID 進(jìn)行標(biāo)識。

    鑒于各文獻(xiàn)所屬期刊的記錄習(xí)慣不同,為了按照統(tǒng)一的時(shí)間字段劃分?jǐn)?shù)據(jù)集,本研究選取相關(guān)文獻(xiàn)數(shù)最多的時(shí)間字段,即PubMed 收錄時(shí)間,作為劃分訓(xùn)練集與測試集的標(biāo)準(zhǔn)。共有108477 篇論文擁有此字段,其中2010—2019 年發(fā)表的論文77467篇,2020 年及以后發(fā)表的論文31010 篇。訓(xùn)練集為構(gòu)建異質(zhì)科研行為信息網(wǎng)絡(luò)和后續(xù)分析科研興趣空間的基礎(chǔ)。由于關(guān)鍵詞推薦是本研究的重要目標(biāo)之一,在進(jìn)行數(shù)據(jù)清洗過程中,本研究將沒有關(guān)鍵詞字段的論文直接剔除。同時(shí),由于僅出現(xiàn)一次的作者節(jié)點(diǎn)和關(guān)鍵詞節(jié)點(diǎn)在網(wǎng)絡(luò)中無法起到鏈接不同論文的作用,也無法用于推薦正確率的測試,無法提供額外的語義信息,因此,本研究對作者與關(guān)鍵詞的累計(jì)出現(xiàn)次數(shù)進(jìn)行了篩選,將所有只出現(xiàn)一次的作者與關(guān)鍵詞剔除。清洗后的訓(xùn)練集剩余10670 篇論文。在測試集中,為了充分測試為已有論文發(fā)表的研究者推薦關(guān)鍵詞或合作者的效果,本研究僅保留在訓(xùn)練集中出現(xiàn)過的作者和與其相關(guān)的機(jī)構(gòu)、關(guān)鍵詞、論文數(shù)據(jù),清洗后的測試集剩余485 篇論文,其與清洗后的訓(xùn)練集共同組成適合進(jìn)行科研推薦研究的高質(zhì)量數(shù)據(jù)集。最終數(shù)據(jù)集情況如表1所示。

    表1 數(shù)據(jù)集情況

    3.2 推薦模型評價(jià)

    為評價(jià)本研究方法的推薦效果,從兩個(gè)角度對模型進(jìn)行評價(jià)。從定量角度,基于上述以2020 年1月1 日為界的訓(xùn)練集和測試集,利用訓(xùn)練集的數(shù)據(jù)進(jìn)行表示學(xué)習(xí),并在測試集中驗(yàn)證推薦效果,通過與基線方法的效果進(jìn)行比較分析,來說明本研究方法的優(yōu)勢和可靠性。從定性角度,在推薦結(jié)果中隨機(jī)選取了一些案例,對照測試集中的真實(shí)數(shù)據(jù),用于對模型效果進(jìn)行更形象和具體的說明。

    3.2.1 定量評價(jià)指標(biāo)

    基于預(yù)處理后的訓(xùn)練集,分別采用本研究方法(詳見2.2 節(jié))與基線方法(詳見2.3 節(jié))構(gòu)建異質(zhì)科研行為信息網(wǎng)絡(luò)GHeter與基線科研行為網(wǎng)絡(luò)GBaseline,并分別進(jìn)行節(jié)點(diǎn)嵌入表示,最終得到兩個(gè)不同的向量空間。本研究分別基于這兩個(gè)向量空間,按照向量相似度指標(biāo)從高到低排序,進(jìn)行合作者與關(guān)鍵詞的top-n推薦(詳見2.4 節(jié)),并剔除訓(xùn)練集中已經(jīng)與被推薦作者產(chǎn)生過聯(lián)系的推薦對象,對兩種方法分別計(jì)算用戶命中率(HUP)(詳見2.5節(jié))??蒲泻献髡吲c關(guān)鍵詞推薦的top-10、top-20、top-50 和top-100 推薦結(jié)果如表2 所示。由于本研究方法使用的metapath2vec 與基線方法使用的LINE 在嵌入表示時(shí)均具有一定的隨機(jī)性,為避免因單次實(shí)驗(yàn)結(jié)果的浮動(dòng)而導(dǎo)致對比不公平,本研究將實(shí)驗(yàn)重復(fù)5 次,表2 所示為所有實(shí)驗(yàn)結(jié)果的平均值。

    表2 推薦模型的HUP對比 %

    結(jié)果表明,在關(guān)鍵詞推薦任務(wù)中,本研究方法在所有推薦級別的用戶命中率均高于基線方法,尤其是在top-20 以上的推薦級別,本研究方法的效果有非常明顯的優(yōu)勢,均有約1/3 的提升。在進(jìn)行top-100 推薦時(shí),本研究方法的用戶命中率可達(dá)31.49%;而由于本研究方法僅推薦了用戶沒有使用過的關(guān)鍵詞,這意味著瀏覽本研究方法的推薦列表將為近1/3 的用戶提供新的靈感。

    在合作者推薦任務(wù)中,本研究方法并非在所有情況下都優(yōu)于基線方法。在進(jìn)行top-10 與top-20 級別推薦時(shí),本研究方法表現(xiàn)優(yōu)于基線方法,分別改善39.75%和13.11%;而在進(jìn)行top-50 與top-100 級別推薦時(shí),用戶命中率較基線方法略低,分別下降8.79%和14.87%。盡管如此,依然可以看到,本研究方法傾向于把對用戶信息量最大的結(jié)果集中在頭部,在選取較小的推薦數(shù)量時(shí),即可展現(xiàn)出較為優(yōu)越的推薦效果,這種情況在top-10 級別時(shí)現(xiàn)得尤其明顯,提升近40%。

    由表2 可以看到,與基線方法相比,本研究方法在合作者推薦方面能獲得同樣理想的結(jié)果,并且更傾向于把有效結(jié)果集中在頭部推薦結(jié)果中;在關(guān)鍵詞推薦方面,本研究方法則具備極大的優(yōu)勢,改善效果十分明顯。值得深思的是,在本研究方法構(gòu)建的異質(zhì)科研行為信息網(wǎng)絡(luò)中,作者節(jié)點(diǎn)A與關(guān)鍵詞節(jié)點(diǎn)K并沒有直接相連;反而在基線方法的科研行為網(wǎng)絡(luò)構(gòu)建中,作者節(jié)點(diǎn)與關(guān)鍵詞節(jié)點(diǎn)被直接連接。相較于兩種節(jié)點(diǎn)直接相連的基線方法,沒有直接相連的異質(zhì)科研行為信息網(wǎng)絡(luò)在進(jìn)行嵌入表示后所得到的作者向量A與其關(guān)鍵詞向量K之間相似度更高。其中的主要區(qū)別是,在基線方法中,雖然目標(biāo)網(wǎng)絡(luò)是異質(zhì)信息網(wǎng)絡(luò),但網(wǎng)絡(luò)嵌入方法是基于同質(zhì)的方法,導(dǎo)致異質(zhì)節(jié)點(diǎn)被當(dāng)作同質(zhì)節(jié)點(diǎn)進(jìn)行嵌入表示,失去了異質(zhì)節(jié)點(diǎn)之間本來的語義信息;而本研究充分考慮到這一點(diǎn),通過異質(zhì)信息網(wǎng)絡(luò)嵌入方法充分挖掘異質(zhì)科研主體之間的語義相關(guān)性,在為作者推薦關(guān)鍵詞這種異質(zhì)性推薦任務(wù)中,獲得了非常明顯的優(yōu)勢。

    此外,為了衡量推薦模型的穩(wěn)定性,本研究還計(jì)算了5 次重復(fù)實(shí)驗(yàn)中HUP 值的方差,結(jié)果如表3所示。可以看到,本研究方法中的模型在兩種推薦任務(wù)的各個(gè)推薦級別中,方差均小于基線方法,尤其在合作者推薦方面更為明顯,可以認(rèn)為基于異質(zhì)信息網(wǎng)絡(luò)嵌入表示的推薦模型具有更優(yōu)的穩(wěn)定性。

    表3 推薦模型的穩(wěn)定性對比 %

    3.2.2 定性推薦案例

    在真實(shí)的合作者推薦任務(wù)中,對于推薦清單中的潛在合作者,科研人員需要從論文、學(xué)術(shù)關(guān)系方面對被推薦者進(jìn)行了解,并通過郵件、會(huì)議等渠道進(jìn)行充分溝通,才會(huì)真正產(chǎn)生合作意向,因此,合作者推薦的清單宜少而精(如10 人)。因此,選取了3 個(gè)有代表性的top-10 合作者推薦案例,用于說明本研究方法的推薦效果,如表4 所示。

    表4 合作者推薦結(jié)果舉例

    表4 展示了相同單位、相同國家不同單位、不同國家不同單位3 種合作者推薦的情況。對于一些研究方向較為集中的單位,同一領(lǐng)域的研究者通常人數(shù)較多,相互之間學(xué)術(shù)交流較為充分,學(xué)者之間的表示向量往往更加相似,因此,在top-10 合作者推薦時(shí),更容易推薦本單位的研究者。例如,美國德克薩斯大學(xué)健康科學(xué)中心生物醫(yī)學(xué)信息學(xué)院的Yuqi Si,被預(yù)測成功的是來自他同單位的合作者Kirk Roberts,這也是他在測試集中的唯一新合作者。Kirk Roberts 曾與同單位的另一學(xué)者Hua Xu 以共同通信作者的方式合作發(fā)表文章,而Yuqi Si 則曾經(jīng)參與過Hua Xu 的其他文章工作。此后,以Yuqi Si 為第一作者、Kirk Roberts 為通信作者的方式展開了合作。此外,本研究方法也會(huì)對不同單位的研究人員進(jìn)行有效的推薦。例如,來自韓國VUNO 公司的Yeha Lee,2020 年以來共有3 位新合作者,均來自韓國世宗醫(yī)院,其中Ki-Hyun Jeon 被本研究算法預(yù)測成功。雖然以前從未合作過,但他們有一個(gè)共同的合作者,來自韓國世宗醫(yī)院的Joon-Myoung Kwon。來自不同國家的研究者也會(huì)被推薦,如Muhammed Talo 來自土耳其Munzur 大學(xué)的計(jì)算機(jī)工程系,其測試集中的唯一新合作者被本研究方法預(yù)測成功,新合作者是新加坡國家心臟中心的Ru-San Tan。這兩位研究者雖然以前從未合作過,但他們都各自與對方單位的其他研究人員進(jìn)行過合作??梢钥吹剑诒狙芯磕P蛯撛诤献髡叩耐扑]過程中,有效抓取了作者以往合作關(guān)系網(wǎng)絡(luò)中蘊(yùn)含的信息。

    在關(guān)鍵詞推薦任務(wù)中,目標(biāo)是為科研工作者提供潛在的興趣方向。在此場景下,科研人員往往通過自身的研究經(jīng)驗(yàn)和適度的相關(guān)文獻(xiàn)查詢,即可從推薦的關(guān)鍵詞列表中提取自己真正感興趣的主題。因此,用戶對關(guān)鍵詞推薦列表的信息處理成本較低,可以推薦較多關(guān)鍵詞(如50 或100 個(gè))供用戶參考。

    表5 展示了隨機(jī)選取的3 個(gè)top-50 關(guān)鍵詞推薦案例。Robert Whelan 來自愛爾蘭都柏林圣三一大學(xué),本研究方法為其推薦成功的關(guān)鍵詞為“沖動(dòng)行為/生理學(xué)”,這個(gè)關(guān)鍵詞在其訓(xùn)練集數(shù)據(jù)中并沒有字面上非常貼近的表述,3 個(gè)比較接近的關(guān)鍵詞為“前額葉皮層/診斷成像/生理病理學(xué)”“延遲貼現(xiàn)/生理學(xué)”和“新紋狀體/診斷成像和生理病理學(xué)”,因?yàn)榇竽X前額葉皮層受損會(huì)導(dǎo)致沖動(dòng)控制能力降低,紋狀體也和沖動(dòng)行為的可能性成正相關(guān),而延遲折扣則是研究沖動(dòng)行為的重要視角之一。這說明本研究模型可以從醫(yī)學(xué)語義方面對關(guān)鍵詞進(jìn)行理解并推薦。同時(shí),推薦列表中的一部分其他關(guān)鍵詞也與Robert Whelan 在測試集中使用的新關(guān)鍵詞高度相關(guān),如“神經(jīng)網(wǎng)絡(luò)/診斷成像/生理學(xué)/生理病理學(xué)”“功能神經(jīng)成像/方法”“心理/生理學(xué)理論”等,分別與作者實(shí)際的“神經(jīng)網(wǎng)絡(luò)/診斷成像/生理學(xué)”“功能神經(jīng)成像”“心理/生理學(xué)”等非常接近。另外,兩位研究者獲得的關(guān)鍵詞推薦列表也有類似現(xiàn)象。例如,美國斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的Jure Leskovec,除推薦了與實(shí)際使用“RNA 序列分析”“RNA/遺傳學(xué)”等高度相關(guān)的關(guān)鍵詞“序列分析”“RNA/方法”“外顯子”以外,還推薦了與骨關(guān)節(jié)炎在醫(yī)學(xué)上高度相關(guān)的“樹突狀細(xì)胞/免疫學(xué)”“T淋巴細(xì)胞亞群/免疫學(xué)”等,而這些在訓(xùn)練集上并無直接關(guān)聯(lián)的關(guān)鍵詞,應(yīng)是綜合研究者的合作關(guān)系與關(guān)鍵詞使用綜合推薦的結(jié)果;日本大阪大學(xué)醫(yī)學(xué)研究生院眼科的Atsuya Miki,在命中“青光眼、開角/診斷成像/生理病理”等關(guān)鍵詞之外,還推薦了大量直接包含“青光眼”的關(guān)鍵詞,這些應(yīng)是通過與訓(xùn)練集中的“眼內(nèi)壓/生理學(xué)”和“房角鏡檢查”在醫(yī)學(xué)語義上的相關(guān)性進(jìn)行推薦的。由此可見,在本研究方法的關(guān)鍵詞推薦過程中,確實(shí)能基于醫(yī)學(xué)語義相關(guān)性進(jìn)行有效的推薦。

    表5 關(guān)鍵詞推薦舉例

    3.3 異質(zhì)向量空間的語義分析

    上述實(shí)驗(yàn)結(jié)果證明,本研究方法具有更好的推薦效果,其核心在于使用異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法metapath2vec 生成的異質(zhì)向量空間(異質(zhì)科研興趣空間),這個(gè)空間可以同時(shí)表示作者之間、關(guān)鍵詞之間以及作者與關(guān)鍵詞之間富含語義相關(guān)性的豐富信息。為了呈現(xiàn)這種語義相關(guān)性,本研究重新使用全部數(shù)據(jù)集,刨除沒有關(guān)鍵詞字段的論文以及僅出現(xiàn)一次的作者節(jié)點(diǎn)和關(guān)鍵詞節(jié)點(diǎn)后,構(gòu)建異質(zhì)科研興趣空間,并對其中包含的關(guān)鍵詞向量與作者向量分別進(jìn)行可視化與語義分析。本研究使用t-SNE(t-distributed stochastic neighbor embedding) 算法,將關(guān)鍵詞向量與作者向量同時(shí)映射到二維平面,并結(jié)合關(guān)鍵詞與作者的特點(diǎn),進(jìn)行可視化及相關(guān)討論。

    3.3.1 關(guān)鍵詞向量空間

    本研究涉及的所有關(guān)鍵詞在異質(zhì)科研興趣空間中的低維分布如圖3 所示??梢钥吹?,盡管各關(guān)鍵詞向量廣泛分散于整個(gè)向量空間中,其局部依然展示了非常明顯的聚集現(xiàn)象。語義相近或邏輯相關(guān)的關(guān)鍵詞會(huì)聚集分布在近似的區(qū)域,即關(guān)鍵詞向量具有“語義聚集”的特點(diǎn)。例如,在圖3 中,空間第二象限框出的幾個(gè)關(guān)鍵詞均傾向于與“空氣污染(air pollution)”話題相關(guān),這個(gè)區(qū)域除該關(guān)鍵詞本身,還包括“空氣污染物/分析(air pollutants/analysis)”“顆粒物(particulate matter)”“二氧化氮(nitrogen dioxide) ”“氣溶膠/分析(aerosols/analysis) ”以及“氣象學(xué)(meteorology)”等。有趣的是,“早產(chǎn)/化學(xué)誘導(dǎo)(premature birth/chemically induced) ” 和“環(huán)境暴露(environmental exposure)”等關(guān)鍵詞也在此區(qū)域內(nèi)。事實(shí)上,環(huán)境暴露主要是指以各種形式接觸環(huán)境中的污染物,而空氣污染是最普遍、影響最廣泛的暴露因素之一。近年來,隨著國內(nèi)外科學(xué)界對空氣污染的關(guān)注,在空氣污染暴露與妊娠結(jié)局相關(guān)性方面,涌現(xiàn)了越來越多的研究,其中包括空氣中各類污染物對早產(chǎn)的影響。在關(guān)鍵詞空間的其他區(qū)域,也存在著這樣表面看似不相關(guān),卻在科學(xué)研究中聯(lián)系密切的關(guān)鍵詞語義聚集現(xiàn)象。比如,空間最右側(cè)框出的“農(nóng)作物育種”區(qū)域,盡管大部分關(guān)鍵詞都和農(nóng)作物種子的分類與培育直接相關(guān),如“種子/分類(seeds/classification) ”和“發(fā)芽(germination)”等,但同時(shí)也存在著“高光譜成像(hyperspectral imaging)”這樣表面上無關(guān),但在科研語義上高度相關(guān)的關(guān)鍵詞,這是因?yàn)楦吖庾V成像可以在分析種子活性、活力、潛在缺陷、凈度等問題上發(fā)揮巨大作用。

    圖3 關(guān)鍵詞空間

    為了進(jìn)一步研究局部區(qū)域中關(guān)鍵詞遠(yuǎn)近分布的細(xì)節(jié)特性,本研究選取了圖3 右上側(cè)作為示例區(qū)域并進(jìn)行局部放大,研究各個(gè)關(guān)鍵詞向量的詞義和位置(圖4a)。該區(qū)域明顯與遺傳發(fā)育相關(guān),除了包括“大腦皮層/細(xì)胞學(xué)/生長發(fā)育(cerebral cortex/cytology/growth & development) ”“哺乳動(dòng)物胚胎(embryo, mammalian)”這種細(xì)胞發(fā)育和分化研究中常見的目標(biāo)細(xì)胞類型,還有研究細(xì)胞發(fā)育與分化時(shí)所使用的常見手段,如“基因表達(dá)/生理學(xué)(gene expression/physiology)”“發(fā)育中的基因表達(dá)/生理學(xué)(gene expression regulation, developmental/physiology)”,也包含了各種蛋白質(zhì)的遺傳代謝問題,如“轉(zhuǎn)錄因子/遺傳學(xué)/代謝(transcription factors/genetics/metabolism) ”“鈣黏蛋白/遺傳學(xué)/代謝(cadherins/genetics/metabolism) ”“同源結(jié)構(gòu)域蛋白質(zhì)/遺傳學(xué)/代謝(homeodomain proteins/genetics/metabolism)”這種蛋白質(zhì)大類,以及“分化抑制蛋白2/遺傳學(xué)/代謝(inhibitor of differentiation protain 2/genetics/metabolism) ”“EphA7 受體/遺傳學(xué)/代謝(receptor, EphA7/ genetics/metabolism)”等特定蛋白質(zhì)。值得注意的是,與遺傳代謝相關(guān)的各種蛋白質(zhì)研究形成了極為密集的聚集現(xiàn)象(圖4b)。與其聚集在一起的是“LIM 同源結(jié)構(gòu)域蛋白(LIM-homeodomain proteins) ”,雖然該主題詞不帶“genetics/metabolism”,但其與同區(qū)域的幾種蛋白質(zhì)都在各種腫瘤演化及進(jìn)展中扮演了非常重要的角色,這一現(xiàn)象更體現(xiàn)了關(guān)鍵詞在科研興趣空間中“語義聚集”的特點(diǎn)??梢钥闯觯m然局部區(qū)域內(nèi)部的關(guān)鍵詞表面上并非十分相似,但從研究興趣、科研問題和研究手段上來看,它們之間有著密不可分的聯(lián)系。這種聯(lián)系若由研究人員挖掘,則需要大量的時(shí)間用于文獻(xiàn)調(diào)研和分析,而本研究方法可以自動(dòng)地發(fā)現(xiàn)這些潛在的關(guān)聯(lián),在充分節(jié)約時(shí)間的基礎(chǔ)之上,為研究人員提供更多的靈感,甚至可以讓不熟悉某個(gè)領(lǐng)域的新研究者,通過科研興趣空間中特定關(guān)鍵詞的局部分布,快速了解整個(gè)相關(guān)小領(lǐng)域。

    圖4 遺傳發(fā)育相關(guān)關(guān)鍵詞區(qū)域示意

    3.3.2 作者向量空間

    與研究關(guān)鍵詞向量空間類似,本研究對科研興趣空間中的作者向量進(jìn)行可視化分析。為了體現(xiàn)科研興趣視角下的作者向量間關(guān)系,考慮到作者文章中包含的關(guān)鍵詞能夠在一定程度上反映作者的研究興趣與研究方向,選取了一些整體熱度較高的關(guān)鍵詞,并以“是否使用過某關(guān)鍵詞”為標(biāo)準(zhǔn)對作者向量空間中的點(diǎn)進(jìn)行標(biāo)注,“使用過”為深灰色,反之為淺灰色(圖5、圖6),進(jìn)而對這些區(qū)域進(jìn)行研究。

    圖5 相關(guān)主題的作者分布區(qū)域差異示例

    可以看到,在人類主題相關(guān)的研究中(圖5),研究“成年人(adult)”主題的作者主要分布于第二象限,并少量分布于第三象限。相對來說,“青年人(young adult)”作為成年人的子群體,該主題相關(guān)的作者分布范圍也是研究“成年人”作者分布范圍的子集,有所不同的是,“青年人”主題的作者分布更偏重于第二象限,而第三象限分布非常少。有趣的是,“中年人(middle aged)”雖然也是成年人的子群體,該主題的研究者分布范圍卻與“成年人”主題研究者形成了交錯(cuò)趨勢,更偏重于第三象限,且在區(qū)域下側(cè)明顯聚集了更多的作者,這可能是由于研究“中年人”的作者從興趣上還有一部分傾向于細(xì)胞老化的研究話題。

    圖6 展示了相同主題下的作者分布與作者研究側(cè)重點(diǎn)之間存在的聯(lián)系。其中,圖6a 與圖6b 的研究主題均包含“計(jì)算機(jī)輔助的圖像處理(image processing, computer-assisted)”,兩者唯一的區(qū)別為是否具有副主題詞“方法(methods) ”(圖6b),這一微小差異卻使兩個(gè)關(guān)鍵詞的使用者產(chǎn)生了巨大的差異(分別分布在第二象限與第三象限)。類似地,圖6c 與圖6d 的研究主題均為“核磁共振成像(magnetic resonance imaging) ”,但由于副主題詞“方法(methods)”的存在,兩個(gè)關(guān)鍵詞的研究者也分別分布于兩個(gè)不同的象限區(qū)域??梢钥吹?,“計(jì)算機(jī)輔助的圖像處理”作者的分布范圍,大部分在“核磁共振成像”作者分布的區(qū)域子集中,除此之外,僅在第四象限與第三象限下部有小簇聚集,與“核磁共振成像”區(qū)域有明顯區(qū)別(圖6a、圖6c),這說明目前大部分計(jì)算機(jī)輔助的圖像處理研究都應(yīng)用在核磁共振成像數(shù)據(jù)中。對比圖6b 與圖6d 可以發(fā)現(xiàn),核磁共振成像的方法學(xué)研究者分布在第三象限的部分明顯與計(jì)算機(jī)輔助圖像處理的方法學(xué)研究者分布區(qū)域重疊。根據(jù)上述結(jié)果可知,在作者向量空間中,醫(yī)學(xué)圖像處理領(lǐng)域的方法驅(qū)動(dòng)研究者傾向于分布在第三象限,即使這些研究者的研究主題不同(如一部分研究者研究核磁共振成像,另一部分研究者研究其他種類的圖像處理),他們也可能因各種圖像處理方法學(xué)研究的模型理論相關(guān)性而聚集在一起。這充分說明了在科研興趣空間中,作者向量分布的語義學(xué)意義。

    4 結(jié) 語

    本研究將科研行為數(shù)據(jù)抽象成具有4 類節(jié)點(diǎn)、3類邊的異質(zhì)信息網(wǎng)絡(luò),使用異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法metapath2vec 對其進(jìn)行了嵌入表示,再通過余弦相似度計(jì)算向量間的相似度,據(jù)此構(gòu)建了基于異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法的科研關(guān)鍵詞推薦與科研合作者推薦模型。與基線方法的對比結(jié)果,驗(yàn)證了本研究構(gòu)建的模型在完成科研關(guān)鍵詞與科研合作者推薦任務(wù)中均具有良好的效果和穩(wěn)定性,尤其在科研關(guān)鍵詞推薦任務(wù)方面有著非常強(qiáng)的優(yōu)勢,這主要得益于本研究更關(guān)注科研行為網(wǎng)絡(luò)本身的“異質(zhì)”特性,并使用了相應(yīng)的異質(zhì)信息網(wǎng)絡(luò)表示算法對其進(jìn)行處理,合理地挖掘了不同種類節(jié)點(diǎn)之間的語義信息。同時(shí),通過對異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法生成的異質(zhì)科研興趣空間中作者與關(guān)鍵詞的向量進(jìn)行可視化分析,本研究發(fā)現(xiàn)各主體向量表示具有非常明確和合理的語義聚集特點(diǎn),這些語義特點(diǎn)往往需要研究者耗費(fèi)大量時(shí)間進(jìn)行文獻(xiàn)閱讀與總結(jié),但本研究方法能夠自動(dòng)挖掘和發(fā)現(xiàn)它們,有助于從研究興趣視角更為快速、深入與準(zhǔn)確地理解領(lǐng)域中各個(gè)子領(lǐng)域的特點(diǎn)與關(guān)聯(lián)。

    需要說明的是,本研究尚有一些可以改進(jìn)的方面。比如,作為一項(xiàng)探索性工作,本研究傾向于闡述在雙任務(wù)目標(biāo)的前提下,異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法相較于同質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法在處理異質(zhì)信息網(wǎng)絡(luò)方面的優(yōu)勢。本研究使用的metapath2vec僅是眾多異質(zhì)信息網(wǎng)絡(luò)表示算法的典型代表,還有更新的方法值得嘗試。在后續(xù)研究中可以對異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)算法做進(jìn)一步改進(jìn),構(gòu)建更適合科研推薦任務(wù)的模型,從而進(jìn)一步提升推薦效果。此外,本研究僅考慮了作者、論文、關(guān)鍵詞、機(jī)構(gòu)4種較為基礎(chǔ)的科研主體及其之間的關(guān)系,未來可考慮引入更多樣的科研主體(如文獻(xiàn)出版物、發(fā)表時(shí)間等),以進(jìn)一步豐富對科研行為的研究與探索。

    猜你喜歡
    合作者異質(zhì)信息網(wǎng)絡(luò)
    有“德”的人
    中外文摘(2021年8期)2021-11-11 16:10:08
    有“德”的人
    怎樣是最好的合作者
    今日文摘(2018年23期)2018-12-17 05:21:20
    怎樣是最好的合作者
    意林(2018年20期)2018-10-31 14:50:42
    幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪的教義學(xué)展開
    刑法論叢(2018年2期)2018-10-10 03:32:22
    非法利用信息網(wǎng)絡(luò)罪的適用邊界
    法律方法(2018年3期)2018-10-10 03:21:34
    網(wǎng)絡(luò)共享背景下信息網(wǎng)絡(luò)傳播權(quán)的保護(hù)
    幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪若干問題探究
    隨機(jī)與異質(zhì)網(wǎng)絡(luò)共存的SIS傳染病模型的定性分析
    Ag2CO3/Ag2O異質(zhì)p-n結(jié)光催化劑的制備及其可見光光催化性能
    亚洲 欧美 日韩 在线 免费| 九色国产91popny在线| av有码第一页| 在线观看www视频免费| 国产亚洲欧美精品永久| 一个人免费在线观看的高清视频| 欧美精品亚洲一区二区| 成人三级做爰电影| 日本a在线网址| 免费在线观看影片大全网站| 国产激情久久老熟女| 国产精品精品国产色婷婷| 黄色女人牲交| 一级a爱视频在线免费观看| 午夜久久久久精精品| 欧美日韩一级在线毛片| 俄罗斯特黄特色一大片| 亚洲第一av免费看| 黑人巨大精品欧美一区二区mp4| 国产精品一区二区免费欧美| 国产亚洲精品av在线| 免费女性裸体啪啪无遮挡网站| 啦啦啦免费观看视频1| 国产精品免费视频内射| 50天的宝宝边吃奶边哭怎么回事| 无人区码免费观看不卡| 日韩欧美免费精品| 大型av网站在线播放| 一边摸一边抽搐一进一小说| 大香蕉久久成人网| 免费女性裸体啪啪无遮挡网站| 男女午夜视频在线观看| 久久国产精品影院| 国产精品电影一区二区三区| 两人在一起打扑克的视频| 日韩av在线大香蕉| www.999成人在线观看| 村上凉子中文字幕在线| 亚洲精品一卡2卡三卡4卡5卡| 中文字幕av电影在线播放| 国产日韩一区二区三区精品不卡| 国产国语露脸激情在线看| 满18在线观看网站| 亚洲激情在线av| 老司机靠b影院| 丝袜美足系列| 亚洲av电影不卡..在线观看| 亚洲人成电影观看| 国产一区二区三区在线臀色熟女| 婷婷六月久久综合丁香| 在线观看www视频免费| 日日摸夜夜添夜夜添小说| 久久久久国产一级毛片高清牌| 久久久国产成人免费| 亚洲九九香蕉| 亚洲av美国av| 午夜福利欧美成人| 亚洲 欧美 日韩 在线 免费| 精品久久久精品久久久| 两个人看的免费小视频| 国产国语露脸激情在线看| 一边摸一边抽搐一进一小说| 精品久久久久久久毛片微露脸| 免费av毛片视频| 国产主播在线观看一区二区| 久久久国产欧美日韩av| 亚洲成人久久性| 午夜激情av网站| 国产亚洲精品一区二区www| 精品第一国产精品| 少妇的丰满在线观看| 久久性视频一级片| 免费人成视频x8x8入口观看| 久久中文字幕一级| 天堂√8在线中文| 久热这里只有精品99| 国产在线观看jvid| 老熟妇仑乱视频hdxx| 女同久久另类99精品国产91| 亚洲国产日韩欧美精品在线观看 | 久久久久久久久中文| 日本三级黄在线观看| 欧美中文日本在线观看视频| bbb黄色大片| 成人手机av| 99国产精品一区二区蜜桃av| 国产一区二区在线av高清观看| 日本欧美视频一区| 精品国产国语对白av| 亚洲 欧美一区二区三区| 老司机午夜福利在线观看视频| 日日摸夜夜添夜夜添小说| 两性夫妻黄色片| 91av网站免费观看| 国产一区二区三区综合在线观看| 一区福利在线观看| 午夜福利18| 女人被躁到高潮嗷嗷叫费观| 欧美成人午夜精品| 美女国产高潮福利片在线看| 看免费av毛片| 亚洲国产精品久久男人天堂| 女人精品久久久久毛片| 真人一进一出gif抽搐免费| 日本a在线网址| www国产在线视频色| 成人亚洲精品一区在线观看| 亚洲av美国av| 亚洲国产看品久久| 男人舔女人的私密视频| 精品少妇一区二区三区视频日本电影| 老司机在亚洲福利影院| 欧美日韩瑟瑟在线播放| 国产精品综合久久久久久久免费 | 男女午夜视频在线观看| 亚洲国产欧美日韩在线播放| 妹子高潮喷水视频| 亚洲人成网站在线播放欧美日韩| 国产精品98久久久久久宅男小说| 欧美性长视频在线观看| 天天一区二区日本电影三级 | 亚洲第一av免费看| 身体一侧抽搐| 午夜两性在线视频| 国产精品99久久99久久久不卡| 波多野结衣巨乳人妻| 制服人妻中文乱码| 夜夜夜夜夜久久久久| 成年人黄色毛片网站| 午夜免费激情av| 国产成人精品无人区| 精品国产乱码久久久久久男人| 19禁男女啪啪无遮挡网站| 国产精品免费一区二区三区在线| 久久人人精品亚洲av| 国产精品综合久久久久久久免费 | 国产高清视频在线播放一区| 国产精品一区二区精品视频观看| 免费一级毛片在线播放高清视频 | 男人舔女人的私密视频| 在线观看www视频免费| 国产精品99久久99久久久不卡| 日本欧美视频一区| 99国产综合亚洲精品| 亚洲自偷自拍图片 自拍| 午夜免费观看网址| 最新美女视频免费是黄的| 亚洲人成电影观看| 天天躁狠狠躁夜夜躁狠狠躁| 国产亚洲精品久久久久久毛片| 久久人人爽av亚洲精品天堂| 一进一出抽搐动态| 18美女黄网站色大片免费观看| 美女高潮喷水抽搐中文字幕| 18禁观看日本| 亚洲欧美日韩另类电影网站| 麻豆一二三区av精品| 精品国产一区二区久久| 人成视频在线观看免费观看| 精品免费久久久久久久清纯| 男女午夜视频在线观看| 99国产精品一区二区三区| 可以在线观看毛片的网站| 极品人妻少妇av视频| 一级片免费观看大全| av超薄肉色丝袜交足视频| АⅤ资源中文在线天堂| 国产又爽黄色视频| 丁香欧美五月| 久久精品91蜜桃| 国语自产精品视频在线第100页| 精品不卡国产一区二区三区| 悠悠久久av| 成人特级黄色片久久久久久久| 久久久久久久久中文| www.熟女人妻精品国产| 狂野欧美激情性xxxx| 一个人观看的视频www高清免费观看 | 午夜福利在线观看吧| videosex国产| 欧美日韩中文字幕国产精品一区二区三区 | 999精品在线视频| 亚洲成人免费电影在线观看| 久久 成人 亚洲| 50天的宝宝边吃奶边哭怎么回事| 成人三级做爰电影| 在线观看免费午夜福利视频| 精品熟女少妇八av免费久了| 亚洲av熟女| 国产国语露脸激情在线看| 18禁美女被吸乳视频| 琪琪午夜伦伦电影理论片6080| 国产精品久久久人人做人人爽| 纯流量卡能插随身wifi吗| 中文亚洲av片在线观看爽| 老司机深夜福利视频在线观看| 精品久久久久久久久久免费视频| 国产精品一区二区免费欧美| www国产在线视频色| 一进一出抽搐动态| 精品日产1卡2卡| 久99久视频精品免费| 成年人黄色毛片网站| av超薄肉色丝袜交足视频| 男女之事视频高清在线观看| 久久久久久久久久久久大奶| 久久久国产精品麻豆| 欧美日本中文国产一区发布| 女生性感内裤真人,穿戴方法视频| 精品一品国产午夜福利视频| 亚洲av电影在线进入| 国产精品免费一区二区三区在线| 国产又色又爽无遮挡免费看| 久久国产精品男人的天堂亚洲| 纯流量卡能插随身wifi吗| 国产又爽黄色视频| 午夜免费成人在线视频| 每晚都被弄得嗷嗷叫到高潮| 一区二区三区高清视频在线| 久热爱精品视频在线9| 动漫黄色视频在线观看| 免费在线观看视频国产中文字幕亚洲| 我的亚洲天堂| 在线十欧美十亚洲十日本专区| 国产精品98久久久久久宅男小说| 九色国产91popny在线| 亚洲 欧美一区二区三区| 亚洲第一电影网av| 亚洲精品国产色婷婷电影| 亚洲男人的天堂狠狠| www国产在线视频色| 欧美久久黑人一区二区| 丰满人妻熟妇乱又伦精品不卡| 久久国产精品人妻蜜桃| 熟女少妇亚洲综合色aaa.| 夜夜夜夜夜久久久久| 日本三级黄在线观看| 国产单亲对白刺激| 欧美中文日本在线观看视频| 99久久国产精品久久久| 69精品国产乱码久久久| 久久精品国产99精品国产亚洲性色 | 搡老妇女老女人老熟妇| 亚洲性夜色夜夜综合| 亚洲av电影在线进入| 久9热在线精品视频| 亚洲五月婷婷丁香| 可以在线观看的亚洲视频| 国产亚洲av嫩草精品影院| 电影成人av| 国产熟女午夜一区二区三区| 99riav亚洲国产免费| 可以免费在线观看a视频的电影网站| av片东京热男人的天堂| 99久久综合精品五月天人人| 久久精品国产99精品国产亚洲性色 | 日本撒尿小便嘘嘘汇集6| 久久香蕉激情| 女人被狂操c到高潮| 两人在一起打扑克的视频| 亚洲第一电影网av| 亚洲av五月六月丁香网| 亚洲三区欧美一区| 村上凉子中文字幕在线| 此物有八面人人有两片| 一区福利在线观看| 免费少妇av软件| 亚洲国产看品久久| 精品人妻在线不人妻| 久久亚洲精品不卡| 久久中文字幕人妻熟女| 国产av精品麻豆| 欧美成人性av电影在线观看| 国产精品av久久久久免费| 久久人妻福利社区极品人妻图片| 最近最新中文字幕大全免费视频| 久久中文字幕一级| 亚洲色图 男人天堂 中文字幕| 亚洲色图 男人天堂 中文字幕| 亚洲人成电影免费在线| 国产国语露脸激情在线看| 日本vs欧美在线观看视频| √禁漫天堂资源中文www| 午夜久久久在线观看| 看黄色毛片网站| 9191精品国产免费久久| 黑人巨大精品欧美一区二区蜜桃| 亚洲精品粉嫩美女一区| 国产精品秋霞免费鲁丝片| 色综合婷婷激情| 男男h啪啪无遮挡| 欧美一区二区精品小视频在线| 精品电影一区二区在线| 国产91精品成人一区二区三区| 国产成年人精品一区二区| 俄罗斯特黄特色一大片| 国产高清有码在线观看视频 | 日本撒尿小便嘘嘘汇集6| 欧美中文综合在线视频| 正在播放国产对白刺激| 欧美绝顶高潮抽搐喷水| 亚洲av五月六月丁香网| 欧美日本亚洲视频在线播放| 在线视频色国产色| 免费av毛片视频| 99精品欧美一区二区三区四区| 久久香蕉国产精品| 少妇裸体淫交视频免费看高清 | 亚洲人成伊人成综合网2020| 看免费av毛片| 亚洲av成人一区二区三| 亚洲电影在线观看av| 久久久久久人人人人人| 成人三级黄色视频| 国产精品久久久人人做人人爽| 亚洲精品美女久久久久99蜜臀| 两个人视频免费观看高清| av超薄肉色丝袜交足视频| 欧美一级毛片孕妇| www.熟女人妻精品国产| 又黄又爽又免费观看的视频| 一级黄色大片毛片| 国产免费av片在线观看野外av| 88av欧美| 18禁裸乳无遮挡免费网站照片 | 成人三级黄色视频| 亚洲性夜色夜夜综合| 麻豆av在线久日| 欧洲精品卡2卡3卡4卡5卡区| 国产精品电影一区二区三区| 精品一区二区三区视频在线观看免费| 久久欧美精品欧美久久欧美| 久久香蕉国产精品| 久久亚洲真实| 成年女人毛片免费观看观看9| av天堂久久9| 黑人巨大精品欧美一区二区mp4| 天天躁夜夜躁狠狠躁躁| 欧美日本中文国产一区发布| 日日干狠狠操夜夜爽| 欧美一级毛片孕妇| 99精品在免费线老司机午夜| 欧美成人午夜精品| 国产亚洲精品第一综合不卡| 久久久久久国产a免费观看| 母亲3免费完整高清在线观看| www国产在线视频色| 精品国产乱子伦一区二区三区| 久久国产精品影院| 波多野结衣高清无吗| 国产一区二区在线av高清观看| 国产成人精品无人区| 久久人妻av系列| 老汉色∧v一级毛片| 美女高潮喷水抽搐中文字幕| а√天堂www在线а√下载| 欧美日韩一级在线毛片| 日韩欧美在线二视频| 美国免费a级毛片| 亚洲精品在线美女| 丰满的人妻完整版| 黑丝袜美女国产一区| 亚洲人成电影免费在线| 国产高清videossex| 久久精品亚洲熟妇少妇任你| 国产欧美日韩一区二区三区在线| 99精品欧美一区二区三区四区| 亚洲av熟女| 可以免费在线观看a视频的电影网站| 99精品在免费线老司机午夜| 国产又色又爽无遮挡免费看| 丝袜人妻中文字幕| 国产麻豆成人av免费视频| 精品久久久久久久久久免费视频| 亚洲一区中文字幕在线| 巨乳人妻的诱惑在线观看| 欧美日韩中文字幕国产精品一区二区三区 | 亚洲av电影在线进入| 91国产中文字幕| 国产av一区在线观看免费| 国产亚洲精品一区二区www| 亚洲三区欧美一区| 日韩中文字幕欧美一区二区| 亚洲少妇的诱惑av| 日本五十路高清| 亚洲精品国产精品久久久不卡| 在线观看午夜福利视频| 欧美另类亚洲清纯唯美| 色老头精品视频在线观看| 免费看a级黄色片| 天堂√8在线中文| 高清毛片免费观看视频网站| www.熟女人妻精品国产| 国产精品乱码一区二三区的特点 | 日韩高清综合在线| 国内精品久久久久精免费| 侵犯人妻中文字幕一二三四区| 国产私拍福利视频在线观看| 高清黄色对白视频在线免费看| 国产97色在线日韩免费| 日日爽夜夜爽网站| 在线观看www视频免费| 亚洲av美国av| 免费看十八禁软件| 最新美女视频免费是黄的| 国产精品一区二区精品视频观看| 一二三四社区在线视频社区8| a在线观看视频网站| 一级毛片高清免费大全| 在线观看www视频免费| 精品乱码久久久久久99久播| a级毛片在线看网站| 欧洲精品卡2卡3卡4卡5卡区| 亚洲专区国产一区二区| 欧美黑人精品巨大| 欧美人与性动交α欧美精品济南到| 最新美女视频免费是黄的| 久久人人97超碰香蕉20202| 欧美激情极品国产一区二区三区| 好男人在线观看高清免费视频 | 国产精品 欧美亚洲| 成人国产综合亚洲| 午夜福利欧美成人| 中国美女看黄片| 丰满人妻熟妇乱又伦精品不卡| 亚洲专区中文字幕在线| 国产三级黄色录像| 操出白浆在线播放| 中文字幕高清在线视频| 老熟妇仑乱视频hdxx| 琪琪午夜伦伦电影理论片6080| 久久久久九九精品影院| 色在线成人网| 国产精品九九99| 狂野欧美激情性xxxx| 日韩国内少妇激情av| 精品乱码久久久久久99久播| 1024视频免费在线观看| 制服人妻中文乱码| 每晚都被弄得嗷嗷叫到高潮| 久久久水蜜桃国产精品网| 国产成人欧美在线观看| 香蕉久久夜色| 宅男免费午夜| 亚洲一卡2卡3卡4卡5卡精品中文| 欧美最黄视频在线播放免费| 国产男靠女视频免费网站| 国产精品爽爽va在线观看网站 | 一区福利在线观看| 最近最新免费中文字幕在线| svipshipincom国产片| 国产精品亚洲一级av第二区| 在线免费观看的www视频| 亚洲一卡2卡3卡4卡5卡精品中文| 成人欧美大片| 国产精品久久久久久精品电影 | 久久性视频一级片| 国产在线精品亚洲第一网站| 12—13女人毛片做爰片一| 亚洲中文av在线| 亚洲人成伊人成综合网2020| 国产精品国产高清国产av| 国产精品九九99| 久久久久久久久免费视频了| 日韩精品免费视频一区二区三区| 禁无遮挡网站| 熟妇人妻久久中文字幕3abv| 免费少妇av软件| 亚洲精品久久国产高清桃花| 精品久久久久久久久久免费视频| 国产精品综合久久久久久久免费 | 嫁个100分男人电影在线观看| 9191精品国产免费久久| 一级a爱片免费观看的视频| 中亚洲国语对白在线视频| 看免费av毛片| 免费看a级黄色片| 午夜精品在线福利| 亚洲中文日韩欧美视频| 久久国产乱子伦精品免费另类| 国产成人精品久久二区二区91| 亚洲国产精品久久男人天堂| 免费看a级黄色片| 一个人观看的视频www高清免费观看 | 人人妻,人人澡人人爽秒播| 亚洲七黄色美女视频| 夜夜躁狠狠躁天天躁| 久久久久亚洲av毛片大全| 香蕉国产在线看| 女人爽到高潮嗷嗷叫在线视频| 一区福利在线观看| 女警被强在线播放| 超碰成人久久| 免费高清视频大片| 国产成人欧美在线观看| 国产亚洲av高清不卡| 丝袜美腿诱惑在线| 亚洲精品国产色婷婷电影| 97碰自拍视频| 久久亚洲真实| 欧美最黄视频在线播放免费| 国产精品,欧美在线| 18禁黄网站禁片午夜丰满| 女性被躁到高潮视频| 美女高潮到喷水免费观看| 色综合欧美亚洲国产小说| 不卡一级毛片| а√天堂www在线а√下载| 国产精品一区二区免费欧美| 国产高清激情床上av| av福利片在线| 久久精品亚洲熟妇少妇任你| 一个人免费在线观看的高清视频| 婷婷丁香在线五月| 国产一级毛片七仙女欲春2 | 国产欧美日韩精品亚洲av| 成年女人毛片免费观看观看9| 成人特级黄色片久久久久久久| 中亚洲国语对白在线视频| 99国产精品99久久久久| avwww免费| 在线av久久热| 亚洲中文字幕日韩| 制服丝袜大香蕉在线| 亚洲精品av麻豆狂野| 午夜a级毛片| 免费不卡黄色视频| 国产99白浆流出| 国产亚洲精品久久久久5区| 国产成人精品久久二区二区免费| 男女做爰动态图高潮gif福利片 | 一级毛片女人18水好多| 久久久国产欧美日韩av| 一级作爱视频免费观看| 亚洲色图av天堂| 亚洲中文av在线| 国产成人av激情在线播放| 亚洲国产看品久久| 国产国语露脸激情在线看| 老司机靠b影院| 老鸭窝网址在线观看| 咕卡用的链子| 久久精品人人爽人人爽视色| 天堂影院成人在线观看| 人人妻人人澡欧美一区二区 | 久久久久国产精品人妻aⅴ院| 国产三级黄色录像| 男男h啪啪无遮挡| 国产精品免费一区二区三区在线| www国产在线视频色| 免费少妇av软件| 黄色片一级片一级黄色片| 亚洲欧美激情在线| 十八禁人妻一区二区| 亚洲五月色婷婷综合| 久久中文字幕人妻熟女| 午夜日韩欧美国产| 十八禁网站免费在线| 久久久久精品国产欧美久久久| 色综合亚洲欧美另类图片| 女人被狂操c到高潮| 伊人久久大香线蕉亚洲五| 非洲黑人性xxxx精品又粗又长| 日本黄色视频三级网站网址| 日韩av在线大香蕉| 久久久久国产精品人妻aⅴ院| 国产一区二区三区在线臀色熟女| 夜夜躁狠狠躁天天躁| 免费高清视频大片| 九色国产91popny在线| 亚洲精品久久成人aⅴ小说| 少妇的丰满在线观看| 国产av在哪里看| 亚洲人成电影免费在线| 精品国产超薄肉色丝袜足j| 免费搜索国产男女视频| 老司机深夜福利视频在线观看| 久久久精品欧美日韩精品| 国产精品野战在线观看| 中文字幕人妻丝袜一区二区| 国产人伦9x9x在线观看| 国产精品久久久久久精品电影 | 久久久精品国产亚洲av高清涩受| 欧美亚洲日本最大视频资源| a在线观看视频网站| 亚洲国产高清在线一区二区三 | 国产在线观看jvid| 夜夜夜夜夜久久久久| 日韩精品青青久久久久久| 可以在线观看的亚洲视频| 欧美亚洲日本最大视频资源| 一区二区三区精品91| 999久久久精品免费观看国产| 亚洲五月天丁香| 国产精品99久久99久久久不卡| a级毛片在线看网站| 亚洲av五月六月丁香网| 两个人视频免费观看高清| 国产乱人伦免费视频| 男女下面插进去视频免费观看| 免费在线观看视频国产中文字幕亚洲| 俄罗斯特黄特色一大片| av电影中文网址| av在线天堂中文字幕| 国产熟女xx| 国产成人精品无人区| 757午夜福利合集在线观看| 亚洲精品中文字幕一二三四区| 亚洲色图av天堂| 中国美女看黄片| 在线观看免费视频日本深夜| 又大又爽又粗| 国产一级毛片七仙女欲春2 | 国产精品久久视频播放| 国产亚洲精品久久久久久毛片|