• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于引證關(guān)系的作者與主題多重共現(xiàn)網(wǎng)絡(luò)構(gòu)建

      2019-12-12 09:23:48劉愛琴吳瑞瑞
      數(shù)字圖書館論壇 2019年10期
      關(guān)鍵詞:圖譜關(guān)聯(lián)檢索

      劉愛琴 吳瑞瑞

      基于引證關(guān)系的作者與主題多重共現(xiàn)網(wǎng)絡(luò)構(gòu)建

      劉愛琴 吳瑞瑞

      (山西大學(xué)經(jīng)濟(jì)與管理學(xué)院,太原 030006)

      利用可視化工具描述知識(shí)資源及其載體,深層次地挖掘知識(shí)內(nèi)容及其結(jié)構(gòu)關(guān)系,表征知識(shí)之間的關(guān)聯(lián)是有效提高信息檢索效率和準(zhǔn)確率,實(shí)現(xiàn)數(shù)據(jù)庫服務(wù)模式創(chuàng)新的重要途徑。本文從數(shù)據(jù)庫檢索因子優(yōu)化入手,以CNKI中國引文數(shù)據(jù)庫的數(shù)據(jù)作為依據(jù),基于引證關(guān)系,對(duì)知識(shí)發(fā)現(xiàn)領(lǐng)域研究群體進(jìn)行知識(shí)圖譜構(gòu)建和聚類分析,一方面展示了群體族群關(guān)系及整體知識(shí)架構(gòu),挖掘出知識(shí)發(fā)現(xiàn)領(lǐng)域作者群體、主題及引文之間的超網(wǎng)絡(luò)模型;另一方面驗(yàn)證了將二次凝練因子作為基礎(chǔ)特征項(xiàng)進(jìn)行應(yīng)用的效果,提高了信息檢索的查全率和查準(zhǔn)率,彌補(bǔ)信息檢索的缺陷。

      知識(shí)圖譜;知識(shí)關(guān)聯(lián);多重共現(xiàn);引證關(guān)系

      論文共現(xiàn)現(xiàn)象在科學(xué)社會(huì)體系中普遍存在,通過共現(xiàn)分析可以從多角度、多方位挖掘論文中的隱含信息以揭示其內(nèi)在關(guān)聯(lián)[1]。隨著可視化技術(shù)的不斷完善,共現(xiàn)現(xiàn)象的表述逐步走向形式化,知識(shí)圖譜成為形式化表述的一種重要方式。利用可視化工具描述知識(shí)資源及其載體,深層次地挖掘知識(shí)內(nèi)容及其結(jié)構(gòu)關(guān)系,表征知識(shí)之間的關(guān)聯(lián)能有效提高信息檢索效率和準(zhǔn)確率,也是實(shí)現(xiàn)數(shù)據(jù)庫服務(wù)模式創(chuàng)新的重要途徑[2]。因此,基于引證關(guān)系,本文對(duì)知識(shí)發(fā)現(xiàn)領(lǐng)域研究群體進(jìn)行知識(shí)圖譜構(gòu)建和聚類分析,一方面展示了群體族群關(guān)系及整體知識(shí)架構(gòu),挖掘出知識(shí)發(fā)現(xiàn)領(lǐng)域作者與主題之間的超網(wǎng)絡(luò)模型;另一方面提高了信息檢索的查全率和查準(zhǔn)率,彌補(bǔ)信息檢索的缺陷。

      1 文獻(xiàn)綜述

      知識(shí)圖譜最早出現(xiàn)在管理學(xué)領(lǐng)域,隨后向信息技術(shù)領(lǐng)域和圖情領(lǐng)域靠攏,慢慢滲透到各行各業(yè)[3]。國外對(duì)知識(shí)圖譜的研究起步相對(duì)較早,在文獻(xiàn)數(shù)量、質(zhì)量對(duì)比上占有一定優(yōu)勢(shì)。O’Donnell等[4]認(rèn)為,知識(shí)圖譜是一種節(jié)點(diǎn)鏈接,通過一系列的鏈接與其他概念相連,以知識(shí)圖譜作為認(rèn)知加工的支架有助于人們?cè)谡J(rèn)知過程中快速產(chǎn)生有效響應(yīng)。Van Eck等[5]全面概述了VOSviewer以一種易于解釋的方式顯示大型書目的強(qiáng)大功能,并通過構(gòu)建和顯示數(shù)千種主要期刊的共引圖來證明VOSviewer程序構(gòu)造的合理性。Boyack等[6]通過直接引用、書目耦合、共引文分析,以及基于引文與文內(nèi)耦合的多重方法對(duì)生物醫(yī)學(xué)文獻(xiàn)的聚類情況進(jìn)行研究,比較不同方法的聚類精確度。Porter等[7]通過運(yùn)用新的跨學(xué)科指標(biāo)和科學(xué)制圖可視化方法研究不同領(lǐng)域的跨學(xué)科程度,發(fā)現(xiàn)跨學(xué)科指數(shù)呈現(xiàn)適度增長,但只略微增加了與遠(yuǎn)距離認(rèn)知領(lǐng)域的關(guān)系,主要分布仍然集中在鄰近學(xué)科;同時(shí)表明,疊加學(xué)科知識(shí)圖譜能夠?yàn)槲磥砜鐚W(xué)科研究提供通用標(biāo)準(zhǔn)。

      2005年,由陳悅等[8]共同署名的《悄然興起的科學(xué)知識(shí)圖譜》在《科學(xué)學(xué)研究》上發(fā)表,多數(shù)研究者認(rèn)為其標(biāo)志著國內(nèi)知識(shí)圖譜領(lǐng)域研究的開始;文章認(rèn)為科學(xué)知識(shí)圖譜是科學(xué)計(jì)量學(xué)表達(dá)形式轉(zhuǎn)換的產(chǎn)物,在揭示科學(xué)知識(shí)內(nèi)涵、結(jié)構(gòu)及其活動(dòng)規(guī)律的進(jìn)程中起到了簡化作用。侯海燕等[9]通過對(duì)科學(xué)計(jì)量學(xué)、應(yīng)用數(shù)學(xué)及計(jì)算機(jī)科學(xué)等相關(guān)學(xué)科進(jìn)行可視化研究,交叉整合各學(xué)科代表性成果并繪制圖譜,剖析科研熱點(diǎn),同時(shí)預(yù)測演進(jìn)趨勢(shì)。陳悅等[10]給出知識(shí)圖發(fā)展歷程簡介,并將傳統(tǒng)知識(shí)圖譜與現(xiàn)代知識(shí)圖譜的類型和實(shí)現(xiàn)原理進(jìn)行對(duì)比,表明其作為知識(shí)管理工具的有效性。秦長江等[11]主要講述構(gòu)建知識(shí)圖譜的理論及方法技術(shù),并結(jié)合具體應(yīng)用疏通知識(shí)圖譜的發(fā)展脈絡(luò)。趙蓉英等[12]用Cite SpaceⅡ圍繞圖書館主題展開討論,并對(duì)引文數(shù)據(jù)和主題詞數(shù)據(jù)進(jìn)行分析,梳理了該學(xué)科的代表性文獻(xiàn)和領(lǐng)軍人物。龐宏燊等[13]選取競爭情報(bào)學(xué)科的2個(gè)多重共現(xiàn)網(wǎng)絡(luò)研究主題發(fā)展趨勢(shì)的分析模型,解析競爭情報(bào)在各個(gè)因素方向的發(fā)展態(tài)勢(shì)與變化,并對(duì)技術(shù)過程提出改進(jìn)意見。郭秋萍等[14]構(gòu)建基于作者-關(guān)鍵詞-引文3個(gè)子網(wǎng)的多重共現(xiàn)超網(wǎng)絡(luò),并以圖書館、情報(bào)與文獻(xiàn)學(xué)學(xué)科領(lǐng)域的知識(shí)服務(wù)為主題進(jìn)行實(shí)證分析,揭示科技文獻(xiàn)網(wǎng)絡(luò)不同節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,為研究文獻(xiàn)之間的隱性關(guān)聯(lián)關(guān)系提供新的研究方法。郭紅梅等[15]將一系列具有語義信息的術(shù)語進(jìn)行疊加,檢測多重術(shù)語關(guān)系在識(shí)別文本核心主題方面的效用,結(jié)果表明3種關(guān)系的疊加使文本主題更為凸顯,克服了單獨(dú)考慮一種關(guān)系時(shí)造成的信息缺失。Lee等[16]重點(diǎn)分析主題-方法二重共現(xiàn)關(guān)系,考察傳播學(xué)中的主題變化趨勢(shì)。Leydesdorff[17]把異質(zhì)網(wǎng)絡(luò)思想進(jìn)行擴(kuò)展,構(gòu)建了作者-關(guān)鍵詞-期刊三重共現(xiàn)網(wǎng)絡(luò),將不同類型節(jié)點(diǎn)及其交叉關(guān)系展現(xiàn)在同一網(wǎng)絡(luò)圖譜中,更加真實(shí)地反應(yīng)研究網(wǎng)絡(luò)。

      綜上所述,當(dāng)前學(xué)者主要運(yùn)用可視化工具對(duì)某一領(lǐng)域的基礎(chǔ)元素進(jìn)行一層架構(gòu),并分析其具體應(yīng)用和發(fā)展趨勢(shì),沒有進(jìn)行整合提升。本文以CNKI中國引文數(shù)據(jù)庫的數(shù)據(jù)作為依據(jù),首先通過作者間的引證關(guān)系形成同被引網(wǎng)絡(luò)并將知識(shí)圖譜進(jìn)行升級(jí)應(yīng)用,運(yùn)用社會(huì)網(wǎng)絡(luò)分析法對(duì)該群體進(jìn)行凝聚子群分析;隨后基于作者群體、主題與引文的關(guān)聯(lián)關(guān)系構(gòu)建多重共現(xiàn)超網(wǎng)絡(luò)模型,通過逐層凝練整合,構(gòu)建三者之間更精準(zhǔn)的關(guān)聯(lián)體系框架,有效提高信息檢索效率和準(zhǔn)確率,實(shí)現(xiàn)數(shù)據(jù)庫服務(wù)模式創(chuàng)新的重要途徑。

      2 基于引證關(guān)系的作者與主題多重共現(xiàn)網(wǎng)絡(luò)構(gòu)建

      2.1 群體可視化知識(shí)圖譜構(gòu)建與分析

      在科學(xué)文獻(xiàn)體系結(jié)構(gòu)中,引證文獻(xiàn)是論文的基本屬性,也是文獻(xiàn)之間得以連接的內(nèi)在樞紐。在文獻(xiàn)中,引證文獻(xiàn)以各種形式的標(biāo)注呈現(xiàn),用以揭示文獻(xiàn)之間的相互引用關(guān)系[18]。著者同被引是由被引文獻(xiàn)延伸而來,本文借助被引文獻(xiàn)構(gòu)建著者同被引網(wǎng)絡(luò),具體方法及數(shù)據(jù)處理如下。

      (1)以知識(shí)發(fā)現(xiàn)為檢索主題,統(tǒng)計(jì)CNKI中國引文數(shù)據(jù)庫中收錄的文獻(xiàn)。以發(fā)表數(shù)3篇、被引總數(shù)150次作為篩選條件,選出47位高被引作者作為研究對(duì)象,見表1。

      (2)以CNKI中國引文數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)學(xué)科為檢索范疇,搜索47位作者彼此之間的共被引頻次,不計(jì)同名作者的相關(guān)文獻(xiàn),統(tǒng)計(jì)整理得到我國知識(shí)發(fā)現(xiàn)學(xué)科學(xué)術(shù)群體的同被引矩陣(TOP10),見表2。

      (3)以Ucinet和Netdraw軟件作為分析工具,利用凝聚子群解析著者同被引矩陣并生成同被引網(wǎng)絡(luò)圖譜,再現(xiàn)整體網(wǎng)絡(luò)集合中所有成員之間的關(guān)系密度,探究我國知識(shí)發(fā)現(xiàn)領(lǐng)域作者之間的內(nèi)在關(guān)聯(lián),全部作者凝聚得到8個(gè)子群,最少3人,最多18人,見表3。

      其中,群體A中3位作者集中于數(shù)據(jù)庫方面的研究,李德仁與王新洲側(cè)重空間數(shù)據(jù)挖掘的理論方法與應(yīng)用,李德毅則比較注重?cái)?shù)據(jù)庫與知識(shí)發(fā)現(xiàn)的應(yīng)用。從發(fā)文情況來看,多數(shù)作品均由任意2人或3人共同署名,總發(fā)文數(shù)相差不多,但被引次數(shù)李德仁最多(1?881次),其次是李德毅(1?664次)、王新洲(1?009次)。從該群體同被引頻次來看,李德仁與李德毅同被引頻次最高,達(dá)162次;李德毅與王新洲、李德仁與王新洲所差無幾,分別為56次和61次。李德毅的同被引頻次總和在整個(gè)網(wǎng)絡(luò)中最高(1?106次),其次是李德仁(954次)、王新洲(423次),3位學(xué)者總被引頻次整體排位靠前,在整個(gè)網(wǎng)絡(luò)中地位十分重要。

      群體B中,4位作者的主要研究方向是空間數(shù)據(jù)挖掘。其中,邸凱昌偏重于相關(guān)理論與實(shí)際應(yīng)用,其他3人更傾向于方法、分類等客觀性描述。從該群體的同被引頻次分析,王樹良與史文中和邸凱昌的同被引頻次分別為89次和81次,史文中和邸凱昌為57次,王樹良和周成虎以及邸凱昌和周成虎均為56次,史文中和周成虎為44次。從同被引頻次總和看,王樹良是557次,史文中555次,邸凱昌718次,周成虎433次??梢?,邸凱昌不論是在該群體還是在整個(gè)網(wǎng)絡(luò)中影響力較大。

      群體C中,3位作者主要關(guān)注知識(shí)發(fā)現(xiàn)領(lǐng)域的人工智能、粗糙集等技術(shù),且以算法為主。從該群體彼此間的同被引頻次來看,張文修和胡可云最多(113次),其次是陸玉昌和胡可云(93次)、陸玉昌和張文修(65次)。從被引頻次總和看,陸玉昌742次,張文修750次,胡可云695次。由數(shù)據(jù)可知,該群體成員關(guān)系較為親密,學(xué)術(shù)地位相當(dāng)。

      群體D中,3位作者研究方向集中在數(shù)據(jù)挖掘與關(guān)聯(lián)規(guī)則。其中,施鵬飛以算法運(yùn)用為主,蔡慶生與黃亞樓主要描述算法的實(shí)現(xiàn)過程。該群體成員同被引次數(shù)整體相對(duì)較少,蔡慶生與施鵬飛33次,蔡慶生與黃亞樓11次,施鵬飛與黃亞樓7次。從同被引頻次總和看,蔡慶生709次,施鵬飛439次,黃亞樓224次,相較其作品數(shù)量而言,被引次數(shù)較多。

      群體E中,9位作者的作品多屬同一時(shí)期,集中在該學(xué)科萌芽階段,側(cè)重論證相關(guān)算法的形成過程。胡學(xué)鋼、劉宗田關(guān)注關(guān)聯(lián)規(guī)則,王秀峰和劉明吉研究決策樹,焦李成、商琳以及林士敏探索數(shù)據(jù)挖掘,石純一和史開泉?jiǎng)t注重粗糙集。從該群體的同被引頻次看,劉明吉和王秀峰最多(47次),其次是石純一和劉宗田(33次)、石純一和胡學(xué)鋼(21次)、石純一和王秀峰(14次),剩余任意兩位作者共同被引次數(shù)較少(均在10次以下),表明其研究成果關(guān)聯(lián)度不大。從同被引頻次總和看,石純一最多(561次),其次是劉宗田、胡學(xué)鋼、王秀峰、焦李成、劉明吉、林士敏、商琳、史開泉。

      群體F有18位作者,在整個(gè)網(wǎng)絡(luò)中占比最大。該群體研究范圍廣泛,在數(shù)據(jù)庫、算法、應(yīng)用、關(guān)聯(lián)規(guī)則、數(shù)據(jù)挖掘等方面均有所涉足,研究方向有所交叉,又有所側(cè)重。如唐常杰、程繼華、鄭誠、劉君強(qiáng)、李增智、歐陽為民、王清毅、陳恩紅均涉及關(guān)聯(lián)規(guī)則,但唐常杰圍繞基因表達(dá)式展開,歐陽為民以數(shù)據(jù)庫為主,陳恩紅則借助貝葉斯方法進(jìn)行研究。從同被引頻次來看,次數(shù)較少,甚至多數(shù)人之間都沒有共被引關(guān)系;從同被引頻次總和來看,歐陽為民最高,其次是高文、程繼華、吉根林、鄭誠、陳恩紅、王清毅、潘云鶴、唐常杰、呂安民、朱紹文、劉君強(qiáng)、周傲英、盧正鼎、謝榕、張?zhí)鞈c、殷國富、李增智。

      群體G中,4位作者的共同研究方向是圖書館的數(shù)字資源整合、圖書館的變革方向,以及與數(shù)字化結(jié)合的圖書館如何快速實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)。溫有奎和畢強(qiáng)從語義檢索方向研究檢索方法的改進(jìn),張曉林和朱東華從數(shù)據(jù)處理方面進(jìn)行研究。從該群體的同被引頻次來看,張曉林與畢強(qiáng)和溫有奎次數(shù)較多,有16次和13次,剩余彼此之間次數(shù)很少。從被引頻次總和而言,張曉林最多,其次是畢強(qiáng)、溫有奎。

      群體H的3位作者主要研究知識(shí)發(fā)現(xiàn)在醫(yī)藥領(lǐng)域的應(yīng)用。同被引頻次顯示,只有蔣永光與吳朝暉之間有共被引關(guān)系(8次),其余任意兩位作者之間沒有關(guān)聯(lián),只是共同將知識(shí)發(fā)現(xiàn)作為工具,在熟悉領(lǐng)域加以應(yīng)用。3人的總被引頻次偏少,表明3人的研究方向與群體其他人員之間的一致程度較低。

      47位作者同被引網(wǎng)絡(luò)的可視化成果分析,揭示了我國知識(shí)發(fā)現(xiàn)領(lǐng)域?qū)W術(shù)群體結(jié)構(gòu)分布、成員地位,明確主要學(xué)者之間的關(guān)聯(lián)程度。

      2.2 網(wǎng)絡(luò)整體屬性分析

      利用Ucinet軟件,對(duì)我國知識(shí)發(fā)現(xiàn)領(lǐng)研究群體同被引網(wǎng)絡(luò)進(jìn)行分析,計(jì)算出該網(wǎng)絡(luò)的可達(dá)矩陣密度是0.744,即該網(wǎng)絡(luò)關(guān)聯(lián)度為0.744。由該數(shù)據(jù)可以看出我國知識(shí)發(fā)現(xiàn)領(lǐng)研究群體同被引網(wǎng)絡(luò)的關(guān)聯(lián)度較高,學(xué)者之間的聯(lián)系較為緊密。且該網(wǎng)絡(luò)中節(jié)點(diǎn)之間的平均距離為1.256,表明在該網(wǎng)絡(luò)體系中,每兩位作者之間建立相應(yīng)的學(xué)術(shù)關(guān)聯(lián)只需通過1.256個(gè)人就能實(shí)現(xiàn)。

      2.3 網(wǎng)絡(luò)中心性分析

      2.3.1 程度中心性

      我國知識(shí)發(fā)現(xiàn)領(lǐng)研究群體同被引網(wǎng)絡(luò)程度中心性分析結(jié)果顯示(見表4),張文修在該團(tuán)體中程度中心性最高,達(dá)0.978?3,節(jié)點(diǎn)關(guān)系數(shù)是45,表明其中有45位學(xué)者與他存在同被引關(guān)系。同樣可知,節(jié)點(diǎn)數(shù)超過40且程度中心性超過0.850?0有17位,說明該部分作者在該網(wǎng)絡(luò)中處在核心地位,是我國知識(shí)發(fā)現(xiàn)學(xué)術(shù)研究群體的核心成員。

      2.3.2 中介中心性

      Ucinet軟件分析結(jié)果顯示(見表5),知識(shí)發(fā)現(xiàn)領(lǐng)域研究群體同被引矩陣網(wǎng)絡(luò)的平均中介性是5.894,平均標(biāo)準(zhǔn)化中介性為0.569;張文修的中介中心性最高,達(dá)23.349,標(biāo)準(zhǔn)化中介性為2.256;其中有6位作者的標(biāo)準(zhǔn)化中介中心性大于1,說明在該領(lǐng)域這6位作者領(lǐng)導(dǎo)性程度較高,掌握資源能力較強(qiáng),能夠作為成員間聯(lián)系的主要紐帶,推動(dòng)該領(lǐng)域的交流進(jìn)程,加速創(chuàng)新發(fā)展。

      2.4 基于引證關(guān)系的作者與主題多重共現(xiàn)網(wǎng)絡(luò)構(gòu)建

      選定某一學(xué)科的科技文獻(xiàn)集合作為樣本,用A={a1,a2,a3,…am}表示作者群體集合,K={k1,k2,k3,…kn}表示主題集合,C={c1,c2,c3,…cp}表示引文集合,則基于作者群體、主題和引文之間的關(guān)聯(lián)關(guān)系可做出如下定義:R={(ai,kt)|1≤i≤m,1≤t≤n}∪{(ai,cv)|1≤i≤m,1≤v≤p}∪{(kt,cv)|1≤t≤n,1≤v≤p}∪{(ai,kt,cv)|1≤i≤m,1≤t≤n,1≤v≤p}。該定義描述4種共現(xiàn)情況:作者群體ai與主題kt的共現(xiàn);作者群體ai與引文cv的共現(xiàn);主題kt與引文cv的共現(xiàn);作者群體ai與主題kt、引文cv的共現(xiàn)。

      2.4.1 基于引證關(guān)系的作者與主題多重共現(xiàn)網(wǎng)絡(luò)構(gòu)建步驟

      第一,選定某一領(lǐng)域,按照作者群體、主題和引文之間彼此的對(duì)應(yīng)關(guān)系,識(shí)別每篇文獻(xiàn)對(duì)應(yīng)作者所屬子群得到每篇文獻(xiàn)對(duì)應(yīng)的作者群體、主題和引文關(guān)系表;第二,通過Bib Excel整理得到文獻(xiàn)標(biāo)號(hào),分別與作者群體、主題和引文之間的對(duì)應(yīng)關(guān)系,以及作者群體共現(xiàn)矩陣、主題共現(xiàn)矩陣和引文共現(xiàn)矩陣;第三,導(dǎo)入SQL Server,生成作者群體表、主題表、引文表,并借助SQL Server的查詢功能和Excel的統(tǒng)計(jì)功能,對(duì)作者群體-主題-引文之間的關(guān)聯(lián)關(guān)系進(jìn)整理記錄,得到作者群體-主題-引文共現(xiàn)頻次表;第四,與主題-引文共現(xiàn)頻次表、作者群體-主題共現(xiàn)頻次表、作者群體-引文共現(xiàn)頻次表逐一對(duì)應(yīng)進(jìn)行轉(zhuǎn)換,生成作者群體-主題-引文共現(xiàn)矩陣;第五,共現(xiàn)矩陣導(dǎo)入U(xiǎn)cinet軟件,對(duì)作者群體-主題-引文矩陣進(jìn)行可視化操作,生成多重共現(xiàn)超網(wǎng)絡(luò)。

      2.4.2 實(shí)例應(yīng)用

      選取群體C陸玉昌、張文修、胡可云3位作者以及其在知識(shí)發(fā)現(xiàn)領(lǐng)域相關(guān)的主題詞和引文進(jìn)行實(shí)例展示。將陸玉昌、張文修和胡可云作為單個(gè)個(gè)體進(jìn)行研究,形成的作者-主題-引文的多重共現(xiàn)超網(wǎng)絡(luò)模型的可視化圖譜(見圖1),在異構(gòu)層中,通過不同基礎(chǔ)特征項(xiàng)之間的聯(lián)系,構(gòu)成局部網(wǎng)絡(luò),以揭示異質(zhì)節(jié)點(diǎn)之間的關(guān)聯(lián)。

      從圖1可直接發(fā)現(xiàn)作者、主題與引文之間的關(guān)聯(lián)關(guān)系,能夠表示彼此之間在研究方向上的關(guān)聯(lián)程度。借助該圖譜進(jìn)行檢索,當(dāng)出現(xiàn)網(wǎng)絡(luò)中的某一節(jié)點(diǎn)時(shí),需通過關(guān)聯(lián)關(guān)系,層層篩選得到全部文獻(xiàn)??梢姡枚嘀毓铂F(xiàn)超網(wǎng)絡(luò)的層次性結(jié)構(gòu),在檢索過程中能夠?qū)崿F(xiàn)檢索信息的快速聚集。當(dāng)輸入“知識(shí)發(fā)現(xiàn)”“胡可云”,檢索結(jié)果見表6所示。

      以上兩篇文獻(xiàn)為初次檢索所得結(jié)果,利用圖1可關(guān)聯(lián)得到陸玉昌的《貝葉斯統(tǒng)計(jì)推斷》、張文修的《信息系統(tǒng)與知識(shí)發(fā)現(xiàn)》,但需要層層發(fā)現(xiàn)。

      若將陸玉昌、張文修和胡可云可作為一個(gè)研究群體,將其與主題和引文關(guān)聯(lián)進(jìn)行可視化操作,得到基于作者群體-主題-引文的多重共現(xiàn)超網(wǎng)絡(luò),如圖2所示。作者群體替代作者作為構(gòu)建網(wǎng)絡(luò)的基礎(chǔ)單元,與主題、引文進(jìn)行關(guān)聯(lián),直接展示整個(gè)群體的研究方向。

      利用圖2檢索時(shí),檢索類目“作者”以群體作為檢索單元,結(jié)果以“群體模式”呈現(xiàn),省去層層篩選的時(shí)間,能夠?qū)z索過程起到優(yōu)化作用。當(dāng)輸入“知識(shí)發(fā)現(xiàn)”“胡可云”,檢索結(jié)果見表7所示。

      以上檢索結(jié)果均為初次所得,由于3位作者是一個(gè)整體,在同一領(lǐng)域檢索時(shí),將按照其關(guān)聯(lián)關(guān)系主動(dòng)顯示全部結(jié)果,避免盲目查找,一次實(shí)現(xiàn)該領(lǐng)域相關(guān)作者以及其著作的集合。

      3 總結(jié)

      基于引證關(guān)系,本文對(duì)知識(shí)發(fā)現(xiàn)領(lǐng)域研究群體的可視化知識(shí)圖譜進(jìn)行分析,直觀呈現(xiàn)該群體成員的研究方向分布、學(xué)術(shù)地位等級(jí)及信息關(guān)聯(lián)等情況。隨后,在此基礎(chǔ)上基于引證關(guān)系構(gòu)建作者群體與主題的多重共現(xiàn)超網(wǎng)絡(luò)模型,驗(yàn)證將二次凝練的因子作為基礎(chǔ)特征項(xiàng)進(jìn)行應(yīng)用的效果,實(shí)現(xiàn)檢索信息的快速聚集。

      [1] 龐弘燊,方曙. 基于多重共現(xiàn)的可視化分析工具設(shè)計(jì)及其知識(shí)發(fā)現(xiàn)方法研究[J]. 圖書情報(bào)知識(shí),2012(2):100-107.

      [2] 曹樹金,吳育冰,韋景竹,等. 知識(shí)圖譜研究的脈絡(luò)、流派與趨勢(shì)——基于SSCI與CSSCI期刊論文的計(jì)量與可視化[J]. 中國圖書館學(xué)報(bào),2015,41(5):16-34.

      [3] BORNER K,CHEN C,BOYACK K W. Visualizing knowledge domains[J]. Annual Review of Information Science and Technology,2003,37(1):179-255.

      [4] O’DONNELL A M,DANSEREAU D F,HALL R H. Knowledge maps as scaffolds for cognitive processing[J]. Educational Psychology Review,2002,14(1):71-86.

      [5] VAN ECK N J,WALTMAN L. Software survey:VOS viewer,a computer program for bibliometric mapping[J]. Scientometrics,2010,84(2):523-538.

      [6] BOYACK K W,KLAVANS R. Co-citation analysis,bibliographic coupling,and direct citation:which citation approach represents the research front most accurately?[J]. Journal of the American Society for Information Science and Technology,2010,61(12):2389-2404.

      [7] PORTER A L,RAFOLS I. Is science becoming more interdisciplinary? Measuring and mapping six research fields overtime[J]. Scientometrics,2009,81(3):719-745.

      [8] 陳悅,劉則淵. 悄然興起的科學(xué)知識(shí)圖譜[J]. 科學(xué)學(xué)研究,2005,23(2):149-154.

      [9] 侯海燕,劉則淵,陳悅,等. 當(dāng)代國際科學(xué)學(xué)研究熱點(diǎn)演進(jìn)趨勢(shì)知識(shí)圖譜[J]. 科研管理,2006,27(3):90-96.

      [10] 陳悅,劉則淵,陳勁,等. 科學(xué)知識(shí)圖譜的發(fā)展歷程[J]. 科學(xué)學(xué)研究,2008,26(3):449-460.

      [11] 秦長江,侯漢清. 知識(shí)圖譜——信息管理與知識(shí)管理的新領(lǐng)域[J]. 大學(xué)圖書館學(xué)報(bào),2009,27(1):30-37.

      [12] 趙蓉英,王菊. 圖書館學(xué)知識(shí)圖譜分析[J]. 中國圖書館學(xué)報(bào),2011,37(2):40-50.

      [13] 龐弘燊,方曙,楊志剛,等. 研究領(lǐng)域的主題發(fā)展趨勢(shì)分析方法研究——基于多重共現(xiàn)的視角[J]. 情報(bào)理論與實(shí)踐,2012,35(8):44-47,73.

      [14] 郭秋萍,梁夢(mèng)麗,劉秀麗,等. 基于作者-關(guān)鍵詞-引文多重共現(xiàn)的超網(wǎng)絡(luò)知識(shí)關(guān)聯(lián)研究[J]. 情報(bào)理論與實(shí)踐,2016,39(7):20-26.

      [15] 郭紅梅,張智雄. 基于多重文本術(shù)語關(guān)系疊加識(shí)別文本核心主題的有效性探索[J]. 情報(bào)學(xué)報(bào),2017,36(11):1157-1164.

      [16] LEE K,JUNG H,SONG M. Subject-method topic network analysis in communication studies[J]. Scientometrics,2016,109(3):1761-1787.

      [17] LEYDESDORF L. What Can Heterogeneity Add to the Scientometric Map? Steps towards algorithmic historiography[EB/OL].[2019-09-01]. https://arxiv.org/abs/1002.0532.

      [18] 張靜. 引文、引文分析與學(xué)術(shù)論文評(píng)價(jià)[J]. 社會(huì)科學(xué)管理與評(píng)論,2008(1):33-38.

      Construction of Multiple Co-occurrence Network of Author and Subject Based on Citation Relationship

      LIU AiQin WU RuiRui

      ( School of Economics and Management, Shanxi University, Taiyuan 030006, China )

      Using visualization tools to describe knowledge resources and their carriers, deeply mine knowledge content and its structural relationship, and represent the association between knowledge are important ways to effectively improve the efficiency and accuracy of information retrieval and realize the innovation of database service mode. Based on the data of CNKI Chinese Citation Database and the citation relationship, this paper constructs the knowledge map and cluster analysis of the research groups in the field of knowledge discovery. On the one hand, it shows the relationship between groups and the overall knowledge structure, and excavates the hypernetwork model among authors, keywords and citations in the field of knowledge discovery. It proves the effect of using the secondary condensation factor as the basic feature item, improves the recall and precision of information retrieval, and makes up for the shortcomings of information retrieval.

      Knowledge Map; Knowledge Association; Multiple Co-occurrence; Citation Relationship

      G353.1

      10.3772/j.issn.1673-2286.2019.10.004

      劉愛琴,女,1974年生,博士,副教授,碩士生導(dǎo)師,研究方向:信息技術(shù)與信息服務(wù),E-mail:km_aql@sina.com。

      吳瑞瑞,女,1996年生,碩士研究生,研究方向:信息技術(shù)與信息服務(wù)。

      (2019-09-05)

      猜你喜歡
      圖譜關(guān)聯(lián)檢索
      繪一張成長圖譜
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      2019年第4-6期便捷檢索目錄
      奇趣搭配
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      主動(dòng)對(duì)接你思維的知識(shí)圖譜
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      雜草圖譜
      語言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
      岳普湖县| 从化市| 昌平区| 海安县| 嘉兴市| 肇源县| 林甸县| 白玉县| 武冈市| 汶川县| 深圳市| 溧水县| 顺平县| 津南区| 南漳县| 抚宁县| 科技| 任丘市| 太原市| 灵寿县| 潞西市| 渭南市| 太和县| 兴安盟| 金乡县| 景东| 射阳县| 舟山市| 和静县| 浦县| 台前县| 启东市| 武宣县| 万安县| 天镇县| 丹寨县| 南陵县| 托克逊县| 平定县| 临高县| 威远县|