袁潤(rùn) 李瑩 王婧怡
摘要:核心期刊刊載的論文是具有重要的理論與指導(dǎo)意義的學(xué)術(shù)研究成果,通常代表學(xué)術(shù)的研究方向和熱點(diǎn)。文章以我國(guó)圖情領(lǐng)域近十年核心期刊的學(xué)術(shù)論文為研究對(duì)象,對(duì)發(fā)文量、作者、機(jī)構(gòu)進(jìn)行分析,以此對(duì)圖請(qǐng)領(lǐng)域十年來(lái)的研究趨勢(shì)進(jìn)行分析。利用了R語(yǔ)言函數(shù)包,對(duì)關(guān)鍵詞頻次排序和網(wǎng)絡(luò)系數(shù)計(jì)算,通過(guò)關(guān)鍵詞詞頻分析、共現(xiàn)網(wǎng)絡(luò)分析,對(duì)研究?jī)?nèi)容進(jìn)行分析,以期望探究圖情領(lǐng)域的發(fā)展特征和研究熱點(diǎn),為后續(xù)的深入研究提供參考。
關(guān)鍵詞:文獻(xiàn)計(jì)量;R語(yǔ)言;詞頻分析;社會(huì)網(wǎng)絡(luò)分析
一、引言
本文選取 “圖書(shū)情報(bào)與檔案管理”學(xué)科的18種學(xué)術(shù)期刊2007~2016年這10年間的論文作為數(shù)據(jù)源。原因如下:第一、選取的樣本是核心期刊,具有較高的學(xué)術(shù)參考價(jià)值,較為權(quán)威且相對(duì)客觀。第二、選取2007~2016年數(shù)據(jù),該數(shù)據(jù)集時(shí)間跨度較長(zhǎng)、數(shù)據(jù)量較大,能比較全面地反映這段時(shí)間圖書(shū)情報(bào)領(lǐng)域的研究成果。通過(guò)系統(tǒng)且連續(xù)地收集學(xué)科期刊的載文信息,就能夠從一個(gè)視角比較全面地反映學(xué)科的發(fā)展特征和演變過(guò)程。本文用計(jì)量分析對(duì)載文量、核心作者、機(jī)構(gòu)進(jìn)行分析,以此了解我國(guó)圖情領(lǐng)域研究的發(fā)展脈絡(luò)。使用詞頻分析和網(wǎng)絡(luò)分析揭示了該學(xué)科10年來(lái)學(xué)者關(guān)注和研究的熱點(diǎn),以期探索我國(guó)圖情領(lǐng)研究十年來(lái)的整體情況。
二、數(shù)據(jù)收集及研究工具
(一)數(shù)據(jù)來(lái)源
除了《情報(bào)學(xué)報(bào)》的載文數(shù)據(jù)來(lái)源于CSSCI,其他17種期刊的載文數(shù)據(jù)全部來(lái)源于CNKI。數(shù)據(jù)采集的過(guò)程大致需要以下步驟:1.檢索,按照刊名和時(shí)間檢索;2.導(dǎo)出檢索結(jié)果,用自定義文獻(xiàn)導(dǎo)出格式,選擇Title-題名、Author-作者、Organ-單位、Source-文獻(xiàn)來(lái)源、Keyword-關(guān)鍵詞、Year-年等6個(gè)字段數(shù)據(jù);3.清洗數(shù)據(jù),刪除“會(huì)議”、“投稿須知”等數(shù)據(jù),最終得到53134條記錄。也就是說(shuō),在這10年內(nèi),這18種期刊共計(jì)發(fā)表論文53134篇。
(二)研究工具
本文的研究工具選取開(kāi)源的數(shù)據(jù)統(tǒng)計(jì)分析R語(yǔ)言和可視化軟件citespace。利用了R語(yǔ)言的readxl貢獻(xiàn)包(package)來(lái)實(shí)現(xiàn)文獻(xiàn)計(jì)量的統(tǒng)計(jì),包括數(shù)據(jù)導(dǎo)入和進(jìn)行頻次排序等工作。然后用citespace繪制關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖,并用R語(yǔ)言igraph函數(shù)對(duì)關(guān)鍵詞網(wǎng)絡(luò)節(jié)點(diǎn)的中介中心度進(jìn)行相關(guān)計(jì)算。
三、研究現(xiàn)狀分析
(一)總體研究趨勢(shì)分析
從圖1來(lái)看,論文數(shù)量雖然在2007~2010年間和2014~2015年間有所上升,但總體呈現(xiàn)下降的趨勢(shì)。2016和2007年相比發(fā)文量減少了732篇。在期刊版面不變的條件下,發(fā)文量減小,說(shuō)明每篇論文的篇幅有所增加。也可以間接地表明本學(xué)科學(xué)者的研究不斷深入,每篇文章的信息量和研究水平在不斷提升,論文質(zhì)量不斷提高。
觀察18種期刊的載文量可以看出《圖書(shū)情報(bào)工作》改版為半月刊之后載文數(shù)量最大,10年中發(fā)表了7596篇論文。在本學(xué)科中具有較大的影響力。而《中國(guó)圖書(shū)館學(xué)報(bào)》的載文量是最小的,10年中僅僅發(fā)表了905篇論文,但該期刊仍然是圖情學(xué)科最具影響力的期刊,因此期刊的載文量大小并不能說(shuō)明什么問(wèn)題。
(二)作者及機(jī)構(gòu)發(fā)文量統(tǒng)計(jì)
圖情領(lǐng)域的研究主體是研究者和機(jī)構(gòu)。通過(guò)對(duì)作者和機(jī)構(gòu)分析,我們可以發(fā)掘圖情領(lǐng)域科研精英及核心研究力量。
1. 論文核心作者情況分析
由表2可以清晰的看出作者發(fā)文量和作者數(shù)量的關(guān)系。18種期刊在10年中刊發(fā)的論文中總共有31277位作者。發(fā)文量在1~10篇之間的這部分作者占據(jù)了總作者數(shù)的94.8%。而發(fā)文量11篇以上的作者有1621人,只占總作者數(shù)的5.2%。
核心作者是指發(fā)文較多,并且對(duì)學(xué)術(shù)界有一定影響力和競(jìng)爭(zhēng)力的精英作者。因涉及到學(xué)科研究者的評(píng)價(jià)問(wèn)題,目前對(duì)核心作者的選擇尚未有統(tǒng)一的方法。本文用普賴斯公式來(lái)界定核心作者,普賴斯公式:M=0.749,該公式在具體應(yīng)用時(shí),需做適當(dāng)修改,將Nmax定義為論文發(fā)表篇數(shù)的最高值。這樣該公式得出的結(jié)果才更符合“核心作者”的特征。本例中Nmax為230,得到發(fā)文量在12篇以上的即是核心作者。經(jīng)統(tǒng)計(jì),發(fā)文量在12篇以上的作者達(dá)到一千余人,核心作者群大約占總作者人數(shù)的5%,可以看出本學(xué)科研究領(lǐng)域中有一群高產(chǎn)的核心作者群,并且因發(fā)文量大已具有一定影響力。由于核心作者數(shù)量較大,本文展示發(fā)文量最高的前10位作者,很巧合發(fā)現(xiàn)發(fā)文量高于100篇的也是這10位作者。
這些高產(chǎn)的核心作者可以認(rèn)為是本學(xué)科的領(lǐng)軍人物,因其豐富的科研成果奠定了在本學(xué)科重要的學(xué)術(shù)地位。發(fā)文量最多是武漢大學(xué)的邱均平教授,10年發(fā)文量高達(dá)230篇。排名第二是南京大學(xué)的朱慶華教授,10年發(fā)文量146篇。這些高產(chǎn)作者對(duì)推動(dòng)圖情領(lǐng)域的發(fā)展做出了重要的貢獻(xiàn)。
2. 論文機(jī)構(gòu)分布情況分析
發(fā)文量較高的機(jī)構(gòu)主要集中在國(guó)內(nèi)圖書(shū)情報(bào)學(xué)術(shù)力量雄厚的高校。例如老牌圖情機(jī)構(gòu)武漢大學(xué)在十年間的發(fā)文量高達(dá)3310余篇,作者發(fā)文數(shù)量和關(guān)鍵詞數(shù)量也是最多。南京大學(xué)、吉林大學(xué)、北京大學(xué)這三個(gè)機(jī)構(gòu)發(fā)文高達(dá)1400篇以上,這四個(gè)機(jī)構(gòu)不僅發(fā)文量占總發(fā)文量的相當(dāng)大的比重,作者數(shù)量也較高,這一點(diǎn)也表明了其科研隊(duì)伍實(shí)力雄厚。
綜合核心作者的所在機(jī)構(gòu),發(fā)現(xiàn)發(fā)文量較多的學(xué)者主要集中在這些學(xué)術(shù)實(shí)力雄厚高校中。發(fā)文量前三的作者所在機(jī)構(gòu)和發(fā)文量前三的機(jī)構(gòu)不謀而合。這一點(diǎn)似乎表明,一流學(xué)者往往在一流的重視相關(guān)學(xué)科建設(shè)的學(xué)術(shù)機(jī)構(gòu),或者說(shuō),科研力量雄厚的一流學(xué)術(shù)機(jī)構(gòu)一定擁有數(shù)量較多的知名專家學(xué)者。
四、主要研究?jī)?nèi)容分析
(一)高頻關(guān)鍵詞分析和主題詞分析
詞頻分析法利用某一學(xué)科領(lǐng)域中相關(guān)文獻(xiàn)的關(guān)鍵詞或核心詞的詞頻高低來(lái)確定領(lǐng)域的研究熱點(diǎn)與發(fā)展趨勢(shì)。詞頻分析是一種具有客觀性、準(zhǔn)確性、系統(tǒng)性的方法,在一定程度上擺脫了定性方法的個(gè)人主觀性。
本文用高低頻詞界定公式計(jì)算高頻詞閾值,公式如下,公式中I1是指只出現(xiàn)過(guò)1次的關(guān)鍵詞數(shù)量。18種核心期刊10年間的只出現(xiàn)過(guò)1次關(guān)鍵詞有43888個(gè),因此詞頻高于為259.7的關(guān)鍵詞是高頻關(guān)鍵詞,共得到45個(gè)高頻關(guān)鍵詞。
表4是按照詞頻的排序得到了高頻關(guān)鍵詞表,觀察發(fā)現(xiàn)這些詞語(yǔ)都是我們所熟悉的常在文獻(xiàn)中出現(xiàn)的關(guān)鍵詞,均與本學(xué)科研究主題關(guān)聯(lián)密切。頻次出現(xiàn)500次以上的關(guān)鍵詞共有12個(gè),可以看出10年來(lái)圖書(shū)館學(xué)的研究熱點(diǎn)和最主要內(nèi)容集中在“信息服務(wù)”、“知識(shí)服務(wù)”、“知識(shí)管理”等方面。雖然圖書(shū)館學(xué)的研究?jī)?nèi)容是多元化,但研究也存在側(cè)重性。出現(xiàn)頻次最高的是“圖書(shū)館”,在10年中共出現(xiàn)4693次,出現(xiàn)次數(shù)遠(yuǎn)遠(yuǎn)超過(guò)其他的關(guān)鍵詞。圖書(shū)情報(bào)學(xué)主要以圖書(shū)館為基礎(chǔ),因此大部分論文是圍繞“圖書(shū)館”相關(guān)內(nèi)容進(jìn)行研究。在上表中包含“服務(wù)”的關(guān)鍵詞出現(xiàn)次數(shù)也較多,“信息服務(wù)、知識(shí)服務(wù)、圖書(shū)館服務(wù)、學(xué)科服務(wù)”這些高頻詞都驗(yàn)證了圖書(shū)館的職能以信息、知識(shí)服務(wù)為主。
另外值得注意的是,“微博”這個(gè)詞在十年間一共出現(xiàn)316次,是目前圖書(shū)情報(bào)領(lǐng)域的一個(gè)研究熱點(diǎn)。微博是普及率非常高的社交工具,人們可以通過(guò)微博進(jìn)行分享和交流,現(xiàn)在微博已經(jīng)成為中國(guó)網(wǎng)民網(wǎng)絡(luò)社交的主要工具。結(jié)合微博的背景,可以發(fā)現(xiàn)圖情領(lǐng)域領(lǐng)域?qū)W者較關(guān)注熱門(mén)事物,并且會(huì)結(jié)合本學(xué)科領(lǐng)域的內(nèi)容對(duì)這些社會(huì)熱點(diǎn)進(jìn)行研究。相類似的詞語(yǔ)還如“云計(jì)算”、“數(shù)據(jù)挖掘”、“本體”、“web2.0”等。圖情學(xué)科的研究?jī)?nèi)容會(huì)受到社會(huì)的發(fā)展和當(dāng)下的話題熱點(diǎn)的影響,社會(huì)熱點(diǎn)展示了當(dāng)今的社會(huì)討論的焦點(diǎn)。表面圖情學(xué)科的研究是關(guān)注時(shí)事、不斷發(fā)展、與時(shí)俱進(jìn)的。
(二)年度高頻詞和突顯詞分析
高頻關(guān)鍵詞一般來(lái)說(shuō)是作者研究?jī)?nèi)容的重要概括。將每年的關(guān)鍵詞頻次統(tǒng)計(jì)出來(lái)倒排序,可以很清楚地發(fā)現(xiàn)當(dāng)年的高頻詞,這些詞可以反映出本年的研究重點(diǎn)。有些詞語(yǔ)的頻次變化并非平滑,而是在某個(gè)時(shí)間段有出現(xiàn)數(shù)量發(fā)生較大程度的變化,這樣的詞就被稱為是突顯詞,突顯詞可以有效地揭示一段時(shí)間學(xué)科領(lǐng)域的熱點(diǎn)問(wèn)題。
通過(guò)突顯值探測(cè)2008年“知識(shí)管理”和“信息服務(wù)”頻次合計(jì)達(dá)到400次。此后每年高頻詞中都出現(xiàn)“信息服務(wù)”,說(shuō)明2008年開(kāi)始“信息服務(wù)”開(kāi)始成為圖情領(lǐng)域新的研究熱點(diǎn)。2011年的突顯詞“社會(huì)網(wǎng)絡(luò)分析”出現(xiàn)了62次,而在之前出現(xiàn)的次數(shù)卻很少,意味2011年開(kāi)始 “社會(huì)網(wǎng)絡(luò)分析”被本學(xué)科高度關(guān)注。隨著微信產(chǎn)品的市場(chǎng)占有率和用戶普及率逐步擴(kuò)大,研究者對(duì)此的關(guān)注點(diǎn)也不斷地增加,“微信”這個(gè)詞在2016年也出現(xiàn)了40次。另外通過(guò)研究發(fā)現(xiàn),每年的高頻關(guān)鍵詞之間重復(fù)率很高,可以側(cè)面地說(shuō)明研究熱點(diǎn)存在一定的繼承性和延續(xù)性,研究者對(duì)于原本就是學(xué)科研究熱點(diǎn)的內(nèi)容似乎更有研究興趣。很多研究者會(huì)在熱門(mén)研究點(diǎn)的基礎(chǔ)上再進(jìn)行深入挖掘,在對(duì)研究熱點(diǎn)進(jìn)行持續(xù)探究的過(guò)程中也會(huì)發(fā)現(xiàn)新的研究點(diǎn)。
(三)共現(xiàn)網(wǎng)絡(luò)分析
關(guān)鍵詞是論文中主要內(nèi)容的濃縮,是作者精煉出來(lái)的概括論文主題的詞匯。關(guān)鍵詞體現(xiàn)學(xué)術(shù)文獻(xiàn)的靈魂,同時(shí)能反映論文的研究方向和研究主題。18種核心期刊10年學(xué)術(shù)論文中的關(guān)鍵詞一共有62515個(gè)。本文的樣本量一共有62515個(gè)關(guān)鍵詞,樣本數(shù)量比較大,因此取詞頻在大于等于200個(gè)的關(guān)鍵詞,共現(xiàn)網(wǎng)絡(luò)可以直觀地展示關(guān)鍵詞與關(guān)鍵詞之間的隱性關(guān)系本文。用citespace進(jìn)行可視化繪圖,得到圖2的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖。
從上圖可以看出研究熱點(diǎn)除了“圖書(shū)館”之外,主要集中在“公共圖書(shū)館、數(shù)字圖書(shū)館、本體、關(guān)聯(lián)數(shù)據(jù)、信息服務(wù)”等。這些關(guān)鍵詞在網(wǎng)絡(luò)中地位很高,證明這些都是該學(xué)科十年來(lái)研究的重點(diǎn)內(nèi)容。
linton freeman認(rèn)為,中介中心度的含義是“中介中心度較高的點(diǎn)可以通過(guò)控制或者曲解信息的傳遞而影響群體”。在關(guān)鍵詞網(wǎng)絡(luò)中,中介中心度越高證明該節(jié)點(diǎn)在網(wǎng)絡(luò)中占據(jù)重要地位并對(duì)網(wǎng)絡(luò)中別的節(jié)點(diǎn)銜接能力較強(qiáng)。在共現(xiàn)網(wǎng)絡(luò)中,通過(guò)對(duì)全部關(guān)鍵詞中介中心度進(jìn)行排序比較,就能了解該關(guān)鍵詞是否處于核心地位。為避免忽略中低頻關(guān)鍵詞,導(dǎo)致分析結(jié)果的整體性欠佳,故本文結(jié)合中介中心度較高的關(guān)鍵詞進(jìn)行進(jìn)一步分析。
結(jié)合關(guān)鍵詞網(wǎng)絡(luò)和中介中心度較高的關(guān)鍵詞,可知目前圖書(shū)館學(xué)研究主要分為兩項(xiàng):
1. 新興主題——新興主題是隨著新的科研成果和新興技術(shù)產(chǎn)生的具有時(shí)代特征的主題。在科學(xué)技術(shù)的不斷發(fā)展下,新興主題處于一種不斷變化的過(guò)程。通過(guò)對(duì)新事物、新技術(shù)、新方法的研究能夠促進(jìn)圖情領(lǐng)域的發(fā)展和創(chuàng)新。
21世紀(jì)是大數(shù)據(jù)的時(shí)代,大數(shù)據(jù)不斷地滲透到工作和生活的各個(gè)方面,圖書(shū)館也運(yùn)用這類新技術(shù)和新方法完善和提高其服務(wù)。因此圖書(shū)館學(xué)目前研究的重點(diǎn)也涉及到“開(kāi)放數(shù)據(jù)、大數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、科研數(shù)據(jù)、數(shù)據(jù)管理、數(shù)據(jù)共享、數(shù)據(jù)館員、數(shù)據(jù)獲取、數(shù)據(jù)加值服務(wù)” 等方面。 “數(shù)字圖書(shū)館”也是目前研究者研究的重要興趣點(diǎn),數(shù)字圖書(shū)館是能夠處理和存儲(chǔ)文獻(xiàn)的圖書(shū)館。隨著信息科技的發(fā)展,需要存儲(chǔ)和傳播的信息量越來(lái)越大,信息種類和形式越來(lái)越豐富,傳統(tǒng)的圖書(shū)館機(jī)制已經(jīng)不能滿足這些需求,因此目前需要這些的電子化信息倉(cāng)儲(chǔ),方便存儲(chǔ)大量的信息。
2. 傳統(tǒng)主題——這些研究包括圖書(shū)館管理、信息資源建設(shè)、圖書(shū)館服務(wù)以及學(xué)科基礎(chǔ)理論和圖書(shū)館學(xué)基本研究方法。這些都是圖情領(lǐng)域一直以來(lái)的研究點(diǎn),研究者仍然在這些傳統(tǒng)研究點(diǎn)上持續(xù)深入挖掘,以夯實(shí)圖情領(lǐng)域的理論基礎(chǔ)。
五、總結(jié)
核心期刊最能代表圖書(shū)情報(bào)領(lǐng)域的研究?jī)?nèi)容和研究成果。通過(guò)對(duì)2007~2016年我國(guó)圖情領(lǐng)域的分析,首先可以看出我國(guó)圖情該領(lǐng)域的科研人員能力在不斷提升,研究的問(wèn)題也不斷深入。縱觀核心作者和發(fā)文量較高的機(jī)構(gòu),發(fā)現(xiàn)本學(xué)科研究領(lǐng)域中研究者群體有一定穩(wěn)定性,已經(jīng)擁有了一定影響力的核心作者群。圖情領(lǐng)域的老牌高校目前仍然在本領(lǐng)域發(fā)揮主要的科研力量,另外該領(lǐng)域發(fā)文量最高的機(jī)構(gòu)一定擁有發(fā)文量較高的作者,一流學(xué)者往往在一流的學(xué)術(shù)機(jī)構(gòu)。
其次,我國(guó)圖情領(lǐng)域?qū)W科發(fā)展是與時(shí)俱進(jìn)的,隨著社會(huì)和科學(xué)的不斷發(fā)展,大眾對(duì)于信息的需求與日俱增。圖情領(lǐng)域順應(yīng)時(shí)代的發(fā)展,學(xué)者將新事物、新技術(shù)結(jié)合本學(xué)科進(jìn)行研究,這些新技術(shù)和新方法在推動(dòng)圖情學(xué)科的發(fā)展的同時(shí)也催生新了研究熱點(diǎn),能夠豐富圖書(shū)情報(bào)學(xué)科內(nèi)容。
最后,目前圖情領(lǐng)域研究主題是多元化的,但研究主題仍然以圖書(shū)館為基礎(chǔ)。研究熱點(diǎn)仍集中于圖書(shū)館的理論研究和研究方法,包括圖書(shū)館的職能如信息、服務(wù)、知識(shí)等方面。這些研究可以類比于圖情領(lǐng)域的“土壤”,研究者必須重視這方面研究。
參考文獻(xiàn):
[1]朱亞麗.《現(xiàn)代圖書(shū)情報(bào)技術(shù)》核心著者測(cè)評(píng)[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2004(12).
[2]儲(chǔ)節(jié)旺,錢(qián)倩.基于詞頻分析的近10年知識(shí)管理的研究熱點(diǎn)及研究方法[J].情報(bào)科學(xué),2014(10).
[3]田丹,劉奕杉,王玉琳.熱點(diǎn)分析類文章的文獻(xiàn)計(jì)量分析——以詞頻分析方法為例[J].情報(bào)科學(xué),2017(08).
[4]趙爽.基于共詞分析的我國(guó)電子商務(wù)領(lǐng)域研究熱點(diǎn)探析[D].吉林大學(xué),2017.
[5]馬妍春,黃可心.科技論文摘要、關(guān)鍵詞及參考文獻(xiàn)的規(guī)范化[J].情報(bào)科學(xué),1999(06).
[6]王燕玲.2000~2011年WOS科學(xué)學(xué)期刊關(guān)鍵詞分析——以共詞和SNA為方法[J].現(xiàn)代情報(bào),2012(08).
[7]朱慶華,李亮.社會(huì)網(wǎng)絡(luò)分析法及其在情報(bào)學(xué)中的應(yīng)用[J].情報(bào)理論與實(shí)踐,2008(02).
[8]楊秀秀.管理科學(xué)與工程學(xué)科共詞網(wǎng)絡(luò)整體特性、生長(zhǎng)性及熱點(diǎn)研究[D].浙江大學(xué),2014.
(作者單位:江蘇大學(xué)科技信息研究所)