楊玉梅 黎仁國 蘭鷹
摘? ?要:通過CNKI核心期刊數(shù)據(jù)庫,收集了近10年大數(shù)據(jù)在圖書館應(yīng)用的文獻(xiàn),并運(yùn)用CiteSpace的計(jì)量統(tǒng)計(jì)功能對(duì)文獻(xiàn)的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),通過對(duì)關(guān)鍵詞的分析,掌握該領(lǐng)域研究現(xiàn)狀、熱點(diǎn)以及趨勢,把握研究重點(diǎn),明確研究方向,為數(shù)據(jù)化浪潮下的相關(guān)研究提供參考。結(jié)果表明,當(dāng)前大數(shù)據(jù)在圖書館的應(yīng)用研究主要集中在數(shù)字圖書館、數(shù)據(jù)分析、信息服務(wù)、云計(jì)算、知識(shí)服務(wù)、人工智等領(lǐng)域,但學(xué)術(shù)無止境,研究人員應(yīng)該嘗試找到新的突破口,從而進(jìn)行更多的創(chuàng)新性研究。
關(guān)鍵詞:大數(shù)據(jù);圖書館;知識(shí)圖譜;Citespace
中圖分類號(hào):G35? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2024)06-0129-04
引言
大數(shù)據(jù)是伴隨云計(jì)算、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等技術(shù)發(fā)展起來的新興事物。大數(shù)據(jù)時(shí)代,數(shù)字已經(jīng)滲透到當(dāng)今各個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。在此過程中,海量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)應(yīng)運(yùn)而生。這些數(shù)據(jù)具備體量大(Volume)、類型多(Variety)、價(jià)值密度低(Value)和速度快(Velocity)的4V特征。圖書館承載著知識(shí)的收集、存儲(chǔ)、加工以及開發(fā)與創(chuàng)新的任務(wù)。隨著大數(shù)據(jù)時(shí)代的到來,圖書館數(shù)據(jù)種類不斷增加,數(shù)據(jù)量日益增長,智能化、個(gè)性化服務(wù)和對(duì)海量數(shù)據(jù)的實(shí)時(shí)分析和潛在價(jià)值挖掘的需求也在快速增長,因此圖書館在一定程度上也具備大數(shù)據(jù)的4V特征[1]。中國知網(wǎng)上不乏關(guān)于大數(shù)據(jù)在圖書館應(yīng)用的研究文獻(xiàn),而其中篇名最能反映文獻(xiàn)研究內(nèi)容,所以課題成員限定檢索字段為“篇名”字段,不限制時(shí)間,文獻(xiàn)來源類別限定為北大核心、CSSCI、CSCD,檢索日期為2022年4月30日,以“大數(shù)據(jù)”和“圖書館”作為檢索詞,共檢索出404篇文獻(xiàn)。根據(jù)知網(wǎng)檢索結(jié)果統(tǒng)計(jì),這些文獻(xiàn)中應(yīng)用研究占66.67%,開發(fā)研究占25.93%,行業(yè)研究占3.7%,管理研究占3.7%。在大數(shù)據(jù)背景之下,圖書館具體做了哪些方面的工作或研究,單憑閱讀幾篇文獻(xiàn)還不足以深入了解。因此,為了準(zhǔn)確把握?qǐng)D書館在大數(shù)據(jù)環(huán)境下的成長過程及發(fā)展趨勢,本文以圖書館在大數(shù)據(jù)時(shí)代的研究文獻(xiàn)為研究對(duì)象,并運(yùn)用CiteSpace的計(jì)量統(tǒng)計(jì)功能對(duì)文獻(xiàn)的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),通過關(guān)鍵詞的分析,掌握該領(lǐng)域研究現(xiàn)狀、熱點(diǎn)以及趨勢,把握研究重點(diǎn)、明確研究方向,以應(yīng)對(duì)當(dāng)今時(shí)代下的數(shù)據(jù)化浪潮,并為今后的研究提供參考。
一、數(shù)據(jù)來源與研究方法
(一)數(shù)據(jù)來源
通過在中國知網(wǎng)數(shù)據(jù)庫查閱相關(guān)文獻(xiàn)了解到,如今大數(shù)據(jù)背景下的圖書館研究越來越受研究人員的關(guān)注,但是鮮有人對(duì)其做系統(tǒng)化分析。本文以中國知網(wǎng)數(shù)據(jù)庫相關(guān)文獻(xiàn)為研究對(duì)象,對(duì)收集的文獻(xiàn)數(shù)據(jù)進(jìn)行梳理歸納,對(duì)作者、關(guān)鍵詞等做統(tǒng)計(jì)以及圖譜分析,并根據(jù)分析結(jié)論總結(jié)目前國內(nèi)大數(shù)據(jù)背景下圖書館的研究現(xiàn)狀、熱點(diǎn)及趨勢,為圖書館數(shù)據(jù)化實(shí)踐提供理論指導(dǎo)。
(二)研究方法
本研究采用了文獻(xiàn)調(diào)研法和文獻(xiàn)計(jì)量法。知識(shí)圖譜可以對(duì)學(xué)科知識(shí)的結(jié)構(gòu)、規(guī)律和分布情況進(jìn)行可視化呈現(xiàn),同時(shí)可以對(duì)學(xué)科領(lǐng)域的歷史脈絡(luò)、發(fā)展動(dòng)態(tài)、研究熱點(diǎn)和研究前沿進(jìn)行科學(xué)繪制、全景勾勒和重點(diǎn)凸顯[2]。Citespace可以構(gòu)建可視化知識(shí)圖譜,能夠直觀反映某一領(lǐng)域的研究熱點(diǎn)、趨勢等。筆者通過在中國知網(wǎng)數(shù)據(jù)庫期刊庫收集大數(shù)據(jù)在圖書館應(yīng)用的相關(guān)研究文獻(xiàn),借助Citespace和中國知網(wǎng)的分析功能,對(duì)論文年度發(fā)文量、關(guān)鍵詞共現(xiàn)、關(guān)鍵詞突現(xiàn)圖等進(jìn)行分析,揭示其研究現(xiàn)狀、熱點(diǎn)、前沿和趨勢。
二、文獻(xiàn)統(tǒng)計(jì)與知識(shí)圖譜分析
(一)年份發(fā)文數(shù)量統(tǒng)計(jì)分析
通過對(duì)文獻(xiàn)的年代發(fā)文量統(tǒng)計(jì),可以在一定程度上發(fā)現(xiàn)某一個(gè)主題的研究發(fā)展速度和規(guī)模。本文對(duì)通過之前提到的條件下檢索出來的文獻(xiàn)進(jìn)行了統(tǒng)計(jì),發(fā)現(xiàn)基于大數(shù)據(jù)的圖書館研究方面的文獻(xiàn)最早發(fā)表時(shí)間為2012年8月,從2012—2022年,核心期刊文獻(xiàn)發(fā)表數(shù)量統(tǒng)計(jì)如表1所示。
從表1可以看出2012—2022年基于大數(shù)據(jù)的圖書館研究文獻(xiàn)數(shù)量變化過程。2012—2014年是逐步上升的階段,2014年增加明顯,2016到達(dá)高峰。2015—2018年文獻(xiàn)增量相較之前有所減少,但該期間數(shù)量變化幅度不大,相對(duì)較穩(wěn)定。從2019年開始發(fā)文量呈下降趨勢,隨后逐年降低。
(二)關(guān)鍵詞共現(xiàn)分析
關(guān)鍵詞是文獻(xiàn)作者提取出來的體現(xiàn)文獻(xiàn)主要內(nèi)容或主要內(nèi)容某一方面的詞匯。高頻關(guān)鍵詞共現(xiàn)圖譜能夠有效地幫助研究者了解某一領(lǐng)域的研究文獻(xiàn)主題分布情況,并能掌握某一領(lǐng)域的研究熱點(diǎn)。本研究運(yùn)用Citespace的關(guān)鍵詞分析功能,設(shè)置時(shí)間為1992—2022年,Time Slicing設(shè)為1年,將節(jié)點(diǎn)類型設(shè)置為“Keword”,節(jié)點(diǎn)闕值設(shè)置為50,選擇Pathfinder算法,得到高頻關(guān)鍵詞知識(shí)圖譜見圖1。圖1中,節(jié)點(diǎn)數(shù)量N=315,節(jié)點(diǎn)間連線數(shù)量E=609,節(jié)點(diǎn)間聯(lián)系緊密。圖中“大數(shù)據(jù)”節(jié)點(diǎn)最大,代表該關(guān)鍵詞在所研究文獻(xiàn)中出現(xiàn)頻率最高;其次是“圖書館”“數(shù)據(jù)挖掘”“知識(shí)服務(wù)”“信息服務(wù)”“云計(jì)算”等。因?yàn)殛P(guān)鍵詞“圖書館”和“大數(shù)據(jù)”是研究主題確定的關(guān)鍵詞,所以雖然這幾個(gè)高頻詞匯出現(xiàn)頻率高,但是體現(xiàn)不出大數(shù)據(jù)在圖書館應(yīng)用研究的具體方向,而排名隨后的高頻詞匯則更能體現(xiàn)圖書館大數(shù)據(jù)應(yīng)用研究的具體情況。表1列出了排名前20的高頻詞匯,除去“大數(shù)據(jù)”“圖書館”,其他高頻關(guān)鍵詞,如“大數(shù)據(jù)”“圖書館”“學(xué)科服務(wù)”“信息服務(wù)”“數(shù)據(jù)挖掘”“知識(shí)服務(wù)”“數(shù)據(jù)分析”“精準(zhǔn)服務(wù)”“數(shù)據(jù)處理”和“服務(wù)模式”等的中介中心性值較強(qiáng),是該學(xué)科領(lǐng)域關(guān)注的焦點(diǎn),也是研究熱點(diǎn)。
(三)關(guān)鍵詞聚類分析
聚類分析是一種探索性的分析,指將物理或抽象對(duì)象的集合分組為由相似的對(duì)象組成的多個(gè)聚類的分析過程。聚類過程中,研究人員不必事先定義分類標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā)自動(dòng)進(jìn)行分類,將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,因此同一個(gè)類或者簇中的對(duì)象有很大的相似性,可以定義為一個(gè)研究領(lǐng)域。本文運(yùn)用Citespace對(duì)樣本數(shù)據(jù)進(jìn)行聚類分析,通過LLR算法提取數(shù)據(jù)標(biāo)簽為聚類名,得到關(guān)鍵詞聚類圖譜為圖2。聚類結(jié)果顯示,聚類模塊值Q=0.5005>0.3,說明聚類結(jié)構(gòu)顯著;聚類平均輪廓值S=0.8781>0.7,說明該聚類可信。主要聚類有“#0圖書館”“#1數(shù)字圖書館”“#2數(shù)據(jù)分析”“#3知識(shí)服務(wù)”“#4信息服務(wù)”“#5云計(jì)算”“#6精準(zhǔn)服務(wù)”“#7區(qū)塊鏈”“#8人工智能”“#9大數(shù)據(jù)服務(wù)”“#10知識(shí)管理”“#11協(xié)同過濾”。
圖2? 大數(shù)據(jù)在圖書館的應(yīng)用研究關(guān)鍵詞聚類圖譜
通過“timeline”繪制關(guān)鍵詞聚類的時(shí)間圖譜,如圖3所示。從圖3中可以看出每個(gè)研究領(lǐng)域的時(shí)間跨度及研究主題。
“#0圖書館”“#1數(shù)字圖書館”“#2數(shù)據(jù)分析”“#4信息服務(wù)”和“#5云計(jì)算”聚類對(duì)象最早出現(xiàn)時(shí)間為2012年。其中,“#0圖書館”聚類內(nèi)部時(shí)間跨度最長,從2012年一直延續(xù)至今;其次是“#4信息服務(wù)”,從2012年延續(xù)至2020年。除此之外,聚類對(duì)象出現(xiàn)時(shí)間較2012年晚,且持續(xù)時(shí)間較長的是“#3知識(shí)服務(wù)”“#6精準(zhǔn)服務(wù)”“#7區(qū)塊鏈”和“#8人工智能”。
(四)關(guān)鍵詞突現(xiàn)
關(guān)鍵詞突現(xiàn)是某一時(shí)期內(nèi)關(guān)鍵詞出現(xiàn)頻率突然增加,關(guān)鍵詞突現(xiàn)圖譜能夠體現(xiàn)某一時(shí)期內(nèi)研究領(lǐng)域的研究熱點(diǎn)。通過Citespace提供的Burst detection功能對(duì)高頻關(guān)鍵詞進(jìn)行統(tǒng)計(jì),本研究共統(tǒng)計(jì)出25個(gè)突現(xiàn)詞,結(jié)果如圖4所示。突現(xiàn)關(guān)鍵詞的Strength值越高,說明這一時(shí)期在該關(guān)鍵詞方面的研究越多。不同時(shí)期內(nèi)突現(xiàn)詞的變化反映了研究熱點(diǎn)隨時(shí)間推移產(chǎn)生的變化,通過對(duì)突現(xiàn)因時(shí)間變化的推移研究,可以進(jìn)一步了解研究領(lǐng)域的發(fā)展趨勢。
從圖4看出,2012—2014年間突現(xiàn)關(guān)鍵詞有“數(shù)據(jù)挖掘”“數(shù)據(jù)處理”“數(shù)據(jù)分析”和“云計(jì)算”,其中“數(shù)據(jù)挖掘”突現(xiàn)強(qiáng)度最大。2013—2017年間突現(xiàn)關(guān)鍵詞有“知識(shí)服務(wù)”“信息服務(wù)”“保護(hù)”“信息素養(yǎng)”“敏感數(shù)據(jù)”“微服務(wù)”“服務(wù)創(chuàng)新”“服務(wù)模式”和“互聯(lián)網(wǎng)+”,其中“微服務(wù)”突現(xiàn)強(qiáng)度最大。2018—2022年間突現(xiàn)關(guān)鍵詞有“精準(zhǔn)服務(wù)”“區(qū)塊鏈”“共詞分析”“圖像資源”“人工智能”“數(shù)據(jù)驅(qū)動(dòng)”“系統(tǒng)設(shè)計(jì)”“讀者服務(wù)”“智慧服務(wù)”“化學(xué)科學(xué)”和“智慧化”,其中“精準(zhǔn)服務(wù)”突現(xiàn)強(qiáng)度最大,且持續(xù)時(shí)間最長。
三、結(jié)論
本研究通過Citespace對(duì)2012年至2022年4月CNKI中核心期刊收錄的404篇關(guān)于大數(shù)據(jù)在圖書館的應(yīng)用方面的文獻(xiàn)進(jìn)行了統(tǒng)計(jì),通過統(tǒng)計(jì)分析得到以下結(jié)論。
1.通過聚類時(shí)間線可以看出,圖書館聚類、數(shù)字圖書館聚類、數(shù)據(jù)分析聚類、信息服務(wù)聚類、云計(jì)算聚類的相關(guān)研究從2012年開始持續(xù)到最近時(shí)間為2022年。知識(shí)服務(wù)聚類、精準(zhǔn)服務(wù)聚類、區(qū)塊鏈聚類、人工智能聚類,相關(guān)主題最早研究時(shí)間開始于2013年,持續(xù)研究時(shí)間到2021年。持續(xù)性最長的是圖書館聚類,計(jì)算和數(shù)據(jù)分析等關(guān)鍵詞的出現(xiàn)頻率較高,表明當(dāng)前大數(shù)據(jù)在圖書館的應(yīng)用研究主要集中在這些方面。
2.從核心期刊發(fā)文量統(tǒng)計(jì)來看,2012—2017年的發(fā)文量基本呈上升趨勢,2014—2017年4年間是發(fā)文量頂峰時(shí)期,但是從2018年開始發(fā)文量開始減少,到2021年僅有17篇,2022年在設(shè)定的檢索日期內(nèi)僅檢索到1篇。從文獻(xiàn)數(shù)量上可以看出,大數(shù)據(jù)在圖書館的應(yīng)用研究在前期備受研究人員關(guān)注,但隨著時(shí)間推移研究文獻(xiàn)數(shù)量逐漸減少,研究似乎進(jìn)入疲軟狀態(tài)。由此可見,要在該領(lǐng)域做好持續(xù)性的研究,研究人員應(yīng)該嘗試找到新的突破口,進(jìn)行更多的創(chuàng)新性研究。
3.關(guān)鍵詞突現(xiàn)圖中,根據(jù)突現(xiàn)強(qiáng)度的強(qiáng)弱可以看出,2012—2015年的研究主要集中在“數(shù)據(jù)挖掘”“數(shù)據(jù)處理”“數(shù)據(jù)分析”“知識(shí)服務(wù)”等主題上。2018年—2022年,“精準(zhǔn)服務(wù)”“系統(tǒng)設(shè)計(jì)”“讀者服務(wù)”“智慧服務(wù)”“智慧化”這些關(guān)鍵詞突現(xiàn)強(qiáng)度值較大,這類主題是目前研究的主流。
參考文獻(xiàn):
[1]? ?何勝.高校圖書館應(yīng)用模式與實(shí)證研究[M].蘭州:蘭州大學(xué)出版社,2020.
[2]? ?佘世紅,楊錦玲.計(jì)算傳播研究的起源、演進(jìn)與展望:基于SSCI數(shù)據(jù)庫的知識(shí)圖譜分析(2006—2020)[J].新聞與傳播評(píng)論,2022,75(3):84-99.
[3]? ?文怡.數(shù)字人文背景下高校圖書館特藏資源建設(shè)策略探析[J].圖書館工作與研究,2023(1):48-55.
[4]? ?趙竹青,劉佳靜,鄭建明.圖書館智慧服務(wù)模式的基本要素與邏輯架構(gòu)[J].圖書館,2023(1):28-35.
[5]? ?楊格格,朱荀,徐雙培.數(shù)據(jù)素養(yǎng)視角下高校圖書館閱讀推廣策略研究[J].圖書館,2023(1):82-87.
[6]? ?文佩丹,楊新涯,尹偉宏.智慧圖書館零數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與構(gòu)建[J].圖書館學(xué)研究,2022(11):39-46.
[7]? ?程健,婁佳.美學(xué)視角下的圖書館管理藝術(shù)的改革創(chuàng)新路徑:《圖書館管理藝術(shù)與信息化應(yīng)用研究》薦讀[J].情報(bào)理論與實(shí)踐,2022,45(11):206.
[8]? ?施雨,茆意宏.新一代信息技術(shù)環(huán)境下的閱讀服務(wù)國內(nèi)外研究綜述[J].圖書館雜志,2023,2(2)1-16.
[9]? ?董曉莉.數(shù)據(jù)化視角下圖書館數(shù)字資源長期保存系統(tǒng)平臺(tái)模型構(gòu)建[J].圖書館工作與研究,2022(10):31-37.
[10]? ?周玉林.數(shù)字圖書館知識(shí)產(chǎn)權(quán)保護(hù)的立法體系完善[J].西南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2022,43(9):82-88.
Analysis of Library Big Data Application Based on Knowledge Graph
YANG Yumei1, LI Renguo2, LAN Ying1
(1. Library and Archives, North Sichuan Medical College, Nanchong 637100, China;
2. School of Mathematics and Information, China West Normal University, Nanchong 637001, China)
Abstract: Through the CNKI core journal database, literature on the application of big data in libraries in the past 10 years was collected, and CiteSpaces econometric statistical function was used to statistically analyze the keywords in the literature. Through the analysis of keywords, the research status, hotspots, and trends in this field were grasped, the research focus was grasped, and the research direction was clarified, providing reference for relevant research under the trend of dataization. The results indicate that the current research on the application of big data in libraries mainly focuses on digital libraries, data analysis, information services, cloud computing, knowledge services, artificial intelligence, and other fields. However, academic research is endless, and researchers should try to find new breakthroughs in order to conduct more innovative research.
Key words: Big data; Library; Knowledge graph; Citespace
[責(zé)任編輯? ?柯? ?黎]