徐 芳 馬 麗
(1.蘇州大學(xué)社會學(xué)院 江蘇蘇州 215123)(2.蘇州大學(xué)文正學(xué)院 江蘇蘇州 215104)
21世紀(jì)以來,伴隨著大數(shù)據(jù)、云計(jì)算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)的涌現(xiàn)與發(fā)展,信息與通信技術(shù)(Information and Communication Technologies,ICTs)和人類的生產(chǎn)生活越來越密不可分。同時(shí),ICTs在人類生產(chǎn)生活過程中的應(yīng)用,也產(chǎn)生了巨大的數(shù)據(jù),各種數(shù)據(jù)量呈幾何級數(shù)增長,以“PB(Petabytes,拍字節(jié),計(jì)算機(jī)存儲容量單位,1PB=1024TB=2^50字節(jié))”為單位的海量數(shù)據(jù)悄然在我們身邊出現(xiàn),宣告著大數(shù)據(jù)時(shí)代的來臨[1]。2012年3月,奧巴馬政府發(fā)布了美國政府的大數(shù)據(jù)計(jì)劃,希望“提高從大型復(fù)雜的數(shù)字?jǐn)?shù)據(jù)集中提取知識和觀點(diǎn)的能力”[2],這意味著美國政府開始將大數(shù)據(jù)戰(zhàn)略上升至國家戰(zhàn)略。在我國,2014年大數(shù)據(jù)首次寫入政府工作報(bào)告;2015年國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,提出要全面推進(jìn)我國大數(shù)據(jù)發(fā)展和應(yīng)用,加快建設(shè)數(shù)據(jù)強(qiáng)國;國務(wù)院總理李克強(qiáng)在十三屆全國人大一次會議上作政府工作報(bào)告三次提到“大數(shù)據(jù)”;習(xí)近平總書記更是多次表示:“要實(shí)施國家大數(shù)據(jù)戰(zhàn)略,加快建設(shè)數(shù)字中國”。在此背景下,各行各業(yè)對大數(shù)據(jù)的應(yīng)用越來越重視。
與此同時(shí),大數(shù)據(jù)的研究也引起了學(xué)界的高度重視。許多學(xué)者對大數(shù)據(jù)的研究現(xiàn)狀進(jìn)行了文獻(xiàn)計(jì)量分析[3-5]。文獻(xiàn)調(diào)查表明:關(guān)于圖情檔領(lǐng)域大數(shù)據(jù)研究的文獻(xiàn)計(jì)量分析,英文文獻(xiàn)一直都有人連續(xù)地進(jìn)行計(jì)量分析,而中文文獻(xiàn)最近的文獻(xiàn)計(jì)量研究發(fā)表在2016年且統(tǒng)計(jì)的范圍為18種CSSCI圖書情報(bào)領(lǐng)域的期刊,非CSSCI期刊的論文尚未有人做過統(tǒng)計(jì)分析。在CNKI中收錄的我國圖情檔領(lǐng)域關(guān)于大數(shù)據(jù)的研究文獻(xiàn)在2016—2018年有4 064篇,可見其發(fā)展速度之快。本研究以CNKI中近五年(2014—2018年)收錄的圖情檔領(lǐng)域大數(shù)據(jù)研究的5 214篇文獻(xiàn)為研究對象,從研究的熱點(diǎn)問題、研究的新方向、期刊分布情況、作者機(jī)構(gòu)分布情況以及作者分布情況等方面對近五年圖情檔領(lǐng)域大數(shù)據(jù)研究的現(xiàn)狀進(jìn)行了較為系統(tǒng)的分析。在文獻(xiàn)計(jì)量分析的基礎(chǔ)上,歸納和總結(jié)了近五年我國圖情檔領(lǐng)域大數(shù)據(jù)研究的5個(gè)發(fā)展趨勢。希望可以為系統(tǒng)地了解近五年圖情檔領(lǐng)域大數(shù)據(jù)研究的現(xiàn)狀和后續(xù)研究提供參考。
以中國知網(wǎng)(CNKI)作為數(shù)據(jù)來源,以“主題詞”為檢索入口,以“大數(shù)據(jù)”為檢索詞,將研究學(xué)科限定在信息科技下的“圖書情報(bào)與數(shù)字圖書館、檔案及博物館”,時(shí)間限制在近五年(2014—2018年),檢索截止日期為2019年3月24日共檢索到5 416篇文獻(xiàn)。刪除雜志社的通知、會議通知、會議報(bào)道等非學(xué)術(shù)論文后,共得到5 214篇文獻(xiàn),。
詞頻分析法是利用能夠揭示或表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞或主題詞,在某一研究領(lǐng)域文獻(xiàn)中出現(xiàn)的頻次高低,來確定該領(lǐng)域研究熱點(diǎn)和發(fā)展動向的文獻(xiàn)計(jì)量方法[6]。關(guān)鍵詞是文獻(xiàn)主題內(nèi)容的濃縮,對于關(guān)鍵詞詞頻進(jìn)行統(tǒng)計(jì)分析,能夠反映研究領(lǐng)域的研究趨勢、熱點(diǎn)所在以及相關(guān)領(lǐng)域等信息,是文獻(xiàn)計(jì)量學(xué)中常用的分析方法。
社會網(wǎng)絡(luò)分析(Social Network Analysis)被廣泛應(yīng)用于社會學(xué)研究中,圖情領(lǐng)域也多有運(yùn)用[7]。社會網(wǎng)絡(luò)分析法工具有MultiNet、NetMiner、NetDraw、Pajek、UCINET等,本研究選取UCINET和NetDraw對相關(guān)關(guān)鍵詞進(jìn)行矩陣分析,進(jìn)而得到可視化結(jié)果。
共詞分析法主要是對同一篇文獻(xiàn)中詞匯或名詞短語共同出現(xiàn)的次數(shù)進(jìn)行統(tǒng)計(jì), 以此為基礎(chǔ)揭示相關(guān)關(guān)系,進(jìn)而分析它們所代表的學(xué)科和主題的結(jié)構(gòu)變化[8]。一般來說,不同詞匯在同一篇文獻(xiàn)中出現(xiàn)次數(shù)越多,表明二者關(guān)系越緊密??梢杂嘘P(guān)鍵詞共現(xiàn)、參考文獻(xiàn)與作者共現(xiàn)、作者與機(jī)構(gòu)共現(xiàn)等方式。本文則主要研究國內(nèi)大數(shù)據(jù)關(guān)鍵詞共現(xiàn)情況。
CNKI中收錄的我國圖情檔領(lǐng)域大數(shù)據(jù)研究文獻(xiàn)數(shù)量統(tǒng)計(jì)如下:2010年,1篇;2011年,0篇;2012年,15篇;2013年,134篇;2014年,493篇;2015年,877篇;2016年,1 197篇;2017年,1 310篇;2018年,1 557篇。從數(shù)據(jù)分布來看,我國圖情檔領(lǐng)域大數(shù)據(jù)研究大致可以分為三個(gè)階段:萌芽期、快速發(fā)展期以及平穩(wěn)期。①第一階段為萌芽期。圖情檔領(lǐng)域關(guān)于大數(shù)據(jù)的相關(guān)研究在2012年之前非常少,每年發(fā)表的論文數(shù)量較少,特別是2010和2011年,說明研究尚處在萌芽期。②第二階段為快速發(fā)展期。自2013年后,與圖情檔領(lǐng)域大數(shù)據(jù)相關(guān)的研究數(shù)量急劇增長,特別是2013至2015年,幾乎每年以翻倍的數(shù)量增加,可見圖情檔領(lǐng)域關(guān)于大數(shù)據(jù)的研究熱情高漲。這可能與美國和中國相繼將大數(shù)據(jù)發(fā)展提升到國家戰(zhàn)略層面,引起了學(xué)界的廣泛關(guān)注,大數(shù)據(jù)及其應(yīng)用的研究迅猛發(fā)展,產(chǎn)出了數(shù)量較多的文獻(xiàn)等因素有關(guān)。③第三階段為平穩(wěn)期。2016年至2018年間,圖情檔領(lǐng)域關(guān)于大數(shù)據(jù)的相關(guān)研究論文數(shù)量增長速度稍微減緩,但總體而言每年的發(fā)文數(shù)量依然處于上升的趨勢,只是不再翻倍式增長,我們將該階段稱之為平穩(wěn)期。
關(guān)鍵詞是從文獻(xiàn)中提取或凝練出的能夠表示文獻(xiàn)主題概念的自然語言詞匯。統(tǒng)計(jì)分析文獻(xiàn)關(guān)鍵詞詞頻,可得出研究內(nèi)容的集中與分散情況,高頻關(guān)鍵詞更是能反映國內(nèi)大數(shù)據(jù)研究的重點(diǎn)和熱點(diǎn)[9]。
4.1.1 高頻關(guān)鍵詞分析
經(jīng)SATI軟件統(tǒng)計(jì)分析得出,2014—2018年間關(guān)于圖情檔大數(shù)據(jù)的中文文獻(xiàn)中涉及到的關(guān)鍵詞有5 467個(gè),其中出現(xiàn)一次的關(guān)鍵詞有322個(gè),反映出圖情檔專業(yè)關(guān)注焦點(diǎn)的密集性。同時(shí)根據(jù)Donohue.J.C在1973年提出的高頻詞低頻詞界分公式[10]來確定高頻關(guān)鍵詞:
其中I1指只出現(xiàn)過一次的關(guān)鍵詞數(shù)量,本次研究中,I1=322,T=24.88,推出閥值約為25,即高頻關(guān)鍵詞是大數(shù)據(jù)、圖書館、大數(shù)據(jù)時(shí)代等165個(gè)詞。其中前50個(gè)高頻關(guān)鍵詞如表1所示。
表1 高頻關(guān)鍵詞詞頻統(tǒng)計(jì)(Top50)
從上述的高頻關(guān)鍵詞中可以看出:相較于以往傳統(tǒng)的背景,在大數(shù)據(jù)時(shí)代下,圖書館、情報(bào)學(xué)、檔案、信息資源等基礎(chǔ)核心詞仍然是圖情檔領(lǐng)域不可忽視的重點(diǎn)。同時(shí)開放獲取、數(shù)據(jù)服務(wù)、知識發(fā)現(xiàn)、智庫、移動圖書館、智慧檔案館等一系列高頻關(guān)鍵詞的出現(xiàn)也反映出圖情檔領(lǐng)域緊跟時(shí)代潮流,更加注重用戶服務(wù)體驗(yàn),運(yùn)用新興技術(shù)手段更好地為人們服務(wù),揭示了圖情檔領(lǐng)域一貫注重夯實(shí)基礎(chǔ)又與時(shí)俱進(jìn)的學(xué)科特點(diǎn)。
4.1.2 高頻關(guān)鍵詞聚類分析
關(guān)鍵詞的聚類能夠集中地反映熱門內(nèi)容[11],在UCINET中對前50個(gè)高頻關(guān)鍵詞進(jìn)行聚類分析,共獲得13個(gè)聚類(稱為聚類1到聚類13)。集群中的每一個(gè)聚類都可以被視為研究主題??偟膩碚f,近五年來我國的圖情檔領(lǐng)域研究主要集中于大數(shù)據(jù)、圖書館和情報(bào)檔案、大數(shù)據(jù)時(shí)代的Citespace工具與互聯(lián)網(wǎng)、圖書館的知識情報(bào)分析與管理、大數(shù)據(jù)環(huán)境下數(shù)字化管理與信息服務(wù)、信息化建設(shè)下的學(xué)科服務(wù)與數(shù)據(jù)資源的利用、數(shù)據(jù)分析與企業(yè)、電子文件管理服務(wù)模式與閱讀推廣、大數(shù)據(jù)技術(shù)對讀者服務(wù)與信息素質(zhì)影響、檔案工作的信息化與服務(wù)創(chuàng)新、檔案數(shù)據(jù)與人工智能、圖情檔領(lǐng)域的個(gè)性化服務(wù)、信息資源的創(chuàng)新與挖掘這13個(gè)主題集群,同時(shí)這13個(gè)主題集群能夠在一定程度上反映出我國圖情檔領(lǐng)域大數(shù)據(jù)相關(guān)的研究現(xiàn)狀。
低頻關(guān)鍵詞能夠在一定程度上反映出圖情檔領(lǐng)域大數(shù)據(jù)研究新興熱點(diǎn)以及研究的發(fā)展趨勢,因此我們對詞頻為1的關(guān)鍵詞進(jìn)行了分析,20個(gè)代表性的低頻關(guān)鍵詞分別為:特色資源服務(wù)、數(shù)據(jù)質(zhì)量控制、社會化媒體、戰(zhàn)略性閱讀、讀者隱私、新媒體營銷、數(shù)字保存、數(shù)據(jù)安全保護(hù)、科學(xué)數(shù)據(jù)共享、政府信息增值、情報(bào)價(jià)值、邏輯性思維、空間數(shù)據(jù)庫、數(shù)字不平等、服務(wù)生命周期、個(gè)人信息世界、信息不平等、復(fù)雜云計(jì)算、數(shù)字地圖以及城市記憶工程。
特色資源服務(wù)、戰(zhàn)略性閱讀、新媒體營銷、復(fù)雜云計(jì)算、數(shù)字地圖等關(guān)鍵詞的出現(xiàn),說明隨著時(shí)代發(fā)展,大數(shù)據(jù)已經(jīng)滲透到圖情檔研究的各個(gè)領(lǐng)域,體現(xiàn)出大數(shù)據(jù)對圖情檔領(lǐng)域的應(yīng)用價(jià)值;而數(shù)據(jù)質(zhì)量控制、政府信息增值、空間數(shù)據(jù)庫、數(shù)字不平等、城市記憶工程等低頻詞的出現(xiàn),則表明在大數(shù)據(jù)時(shí)代,圖情檔領(lǐng)域新的研究領(lǐng)域正在悄然興起,將來很可能會成為新的研究熱點(diǎn)主題。
為了分析圖情檔領(lǐng)域大數(shù)據(jù)研究的期刊分布,我們對期刊名稱出現(xiàn)的詞頻進(jìn)行統(tǒng)計(jì)。運(yùn)用UCINET工具進(jìn)行統(tǒng)計(jì)分析,可以得到圖情檔領(lǐng)域發(fā)表大數(shù)據(jù)相關(guān)研究論文數(shù)量前30名的期刊,如表2所示。
表2 前30名期刊統(tǒng)計(jì)
上表列出了我國圖情檔領(lǐng)域大數(shù)據(jù)研究載文量前30的期刊??梢钥吹?,《圖書情報(bào)工作》《情報(bào)理論與實(shí)踐》《現(xiàn)代情報(bào)》《圖書館工作與研究》《圖書與情報(bào)》《圖書館理論與實(shí)踐》《情報(bào)雜志》等CSSCI期刊、核心期刊均在其列。這表明:雖然圖情檔領(lǐng)域的大數(shù)據(jù)研究載文量前6的期刊都是一般期刊,即一般期刊的載文量占多數(shù);但是前30名中也有10多種CSSCI來源期刊或核心期刊??傊瑘D情檔領(lǐng)域大數(shù)據(jù)研究的期刊分布呈現(xiàn)出核心期刊與非核心期刊并重的特點(diǎn)。
表3是運(yùn)用UCINET工具統(tǒng)計(jì)出的發(fā)文數(shù)量排名前30的作者機(jī)構(gòu)分布情況。
為了客觀、準(zhǔn)確地體現(xiàn)作者的機(jī)構(gòu)分布情況,我們對搜集到的機(jī)構(gòu)數(shù)據(jù)沒有做合并處理。從上表所統(tǒng)計(jì)的核心單位機(jī)構(gòu)來看,位居前列的是武漢大學(xué)信息管理學(xué)院,發(fā)文量達(dá)到了162篇。而前十名中圖情檔領(lǐng)域權(quán)威單位武漢大學(xué)、北京大學(xué)、中國人民大學(xué)、南京大學(xué)都在其中,符合當(dāng)前圖情檔領(lǐng)域?qū)τ诒緦I(yè)領(lǐng)域權(quán)威單位機(jī)構(gòu)的認(rèn)知,說明在大數(shù)據(jù)領(lǐng)域,資歷老、技術(shù)雄厚的單位機(jī)構(gòu)影響仍然很大。同時(shí)也可以看出,發(fā)文量的核心單位機(jī)構(gòu)仍然以高校為主,高校學(xué)術(shù)研究氛圍濃厚,擁有較強(qiáng)的科研隊(duì)伍和科研力量,是呈現(xiàn)這一結(jié)果的主要原因。此外,蘭州財(cái)經(jīng)大學(xué)信息工程學(xué)院本科設(shè)有信息管理與信息系統(tǒng)專業(yè),并設(shè)有該專業(yè)的碩士點(diǎn),同時(shí)擁有省級人文社科重點(diǎn)研究基地——甘肅經(jīng)濟(jì)發(fā)展數(shù)量分析研究中心;安徽財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院下設(shè)有情報(bào)學(xué)專業(yè)碩士點(diǎn)。
表3 發(fā)文數(shù)量排名前30的作者機(jī)構(gòu)分布
我們還運(yùn)用UCINET工具的頻次統(tǒng)計(jì)功能對作者出現(xiàn)的頻次進(jìn)行了統(tǒng)計(jì),前30名高產(chǎn)作者的發(fā)文數(shù)量統(tǒng)計(jì)如表4所示。
表4 前30名高產(chǎn)作者與發(fā)文數(shù)量
從表上列出的核心作者來看,我國圖情檔領(lǐng)域的知名學(xué)者,如武漢大學(xué)的李綱、馬費(fèi)成、邱均平等人,南京大學(xué)的邵波、蘇新寧等人以及北京大學(xué)的李廣建等人都不同程度地對大數(shù)據(jù)進(jìn)行了研究,成為了圖情檔領(lǐng)域大數(shù)據(jù)研究的高產(chǎn)作者。而發(fā)表文獻(xiàn)量前三的蘭州財(cái)經(jīng)大學(xué)馬曉亭與陳臣、江蘇理工學(xué)院的何勝發(fā)文總量有100多篇,這表明圖情檔領(lǐng)域關(guān)于大數(shù)據(jù)的研究已經(jīng)形成了一批穩(wěn)定的學(xué)者。
從對高頻關(guān)鍵詞的共現(xiàn)可視化分析以及聚類分析中可以看出,我國圖情檔領(lǐng)域大數(shù)據(jù)的研究在重視該領(lǐng)域的基礎(chǔ)理論研究基礎(chǔ)上,顯現(xiàn)出一些新的研究熱點(diǎn):如大數(shù)據(jù)、圖書館服務(wù)、檔案管理、創(chuàng)新、數(shù)字圖書館、互聯(lián)網(wǎng)+、數(shù)據(jù)素養(yǎng)、個(gè)性化服務(wù)、云計(jì)算、情報(bào)學(xué)、數(shù)據(jù)管理、數(shù)據(jù)挖掘、智慧圖書館、大數(shù)據(jù)技術(shù)、文獻(xiàn)計(jì)量學(xué)、數(shù)字檔案館、情報(bào)分析、競爭情報(bào)、智慧服務(wù)、知識圖譜、圖書館用戶等,現(xiàn)有研究中圖情檔專業(yè)領(lǐng)域與時(shí)代背景的聯(lián)系更加緊密。開放獲取、數(shù)據(jù)服務(wù)、智庫、移動圖書館等一系列關(guān)鍵詞的頻繁出現(xiàn),凸顯了在大數(shù)據(jù)背景下,圖情檔領(lǐng)域的技術(shù)手段更加智能化、人性化。而聚類分析得到的13個(gè)主題集群集中體現(xiàn)了大數(shù)據(jù)背景下新興技術(shù)手段與學(xué)科融合發(fā)展的新趨勢。
以上文獻(xiàn)計(jì)量結(jié)果表明,在大數(shù)據(jù)時(shí)代,圖情檔的各個(gè)領(lǐng)域都相應(yīng)地將大數(shù)據(jù)相關(guān)的新興技術(shù)應(yīng)用到各自的業(yè)務(wù)與管理活動中,涌現(xiàn)出了一些新的研究方向。例如,特色資源服務(wù)、情報(bào)價(jià)值、數(shù)據(jù)質(zhì)量控制、邏輯性思維、社會化媒體、空間數(shù)據(jù)庫、戰(zhàn)略性閱讀、數(shù)字不平等、讀者隱私、服務(wù)生命周期、新媒體營銷、個(gè)人信息世界、數(shù)字保存、數(shù)據(jù)安全保護(hù)、復(fù)雜云計(jì)算、科學(xué)數(shù)據(jù)共享、數(shù)字地圖、政府信息增值以及城市記憶工程等。其中,數(shù)據(jù)質(zhì)量控制、政府信息增值、空間數(shù)據(jù)庫、城市記憶工程等低頻關(guān)鍵詞的出現(xiàn),表明已經(jīng)有學(xué)者開始探索大數(shù)據(jù)在圖情檔前沿領(lǐng)域的應(yīng)用,涌現(xiàn)出了一些研究的新興領(lǐng)域,而這些新興領(lǐng)域在不久的將來會成為大數(shù)據(jù)在圖情檔領(lǐng)域應(yīng)用的研究熱點(diǎn)。
從統(tǒng)計(jì)的期刊分布表中可以得知,雖然發(fā)文量排名前30名的期刊中,一般期刊占大多數(shù),前6名都是一般期刊,且發(fā)文量也占大多數(shù);但是仍有10多種CSSCI來源期刊或核心期刊在列,如《圖書情報(bào)工作》《情報(bào)理論與實(shí)踐》《現(xiàn)代情報(bào)》《圖書館工作與研究》《蘭臺世界》《山西檔案》等??梢?,我國圖情檔領(lǐng)域大數(shù)據(jù)研究期刊分布呈現(xiàn)出核心期刊與非核心期刊并重的趨勢。
在以上統(tǒng)計(jì)的圖情檔領(lǐng)域大數(shù)據(jù)研究作者機(jī)構(gòu)分布的表格中,圖情檔領(lǐng)域雙一流高校武漢大學(xué)、北京大學(xué)、中國人民大學(xué)、南京大學(xué)位列前十名,武漢大學(xué)信息管理學(xué)院發(fā)文量更是高達(dá)162篇。同樣值得注意的是,黑龍江大學(xué)、安徽大學(xué)、蘭州財(cái)經(jīng)大學(xué)、國家圖書館、遼寧大學(xué)、南京圖書館等單位機(jī)構(gòu)也位列在前,且發(fā)文量占比不小??梢?,圖情檔領(lǐng)域大數(shù)據(jù)研究的作者機(jī)構(gòu)分布表現(xiàn)為分散狀態(tài),圖情檔領(lǐng)域大數(shù)據(jù)研究呈現(xiàn)出百花齊放、百家爭鳴的局面。
通過以上對圖情檔領(lǐng)域大數(shù)據(jù)研究的高產(chǎn)作者統(tǒng)計(jì)可知,一方面,大數(shù)據(jù)自出現(xiàn)以來便受到了我國圖情檔領(lǐng)域知名學(xué)者的連續(xù)關(guān)注與重視,如武漢大學(xué)的李綱、馬費(fèi)成、邱均平等教授,南京大學(xué)的邵波、蘇新寧等教授,北京大學(xué)的李廣建教授以及南京理工大學(xué)的王曰芬等,他們均出現(xiàn)在了高產(chǎn)的核心作者中,是我國圖情檔領(lǐng)域大數(shù)據(jù)研究的中堅(jiān)力量;另一方面,排名前三的馬曉亭、陳臣、何勝等人發(fā)表的大數(shù)據(jù)相關(guān)的論文都在25篇以上,為大數(shù)據(jù)在我國圖情檔領(lǐng)域的應(yīng)用研究作出了很大的貢獻(xiàn)。這些高產(chǎn)的核心作者往往有著相對成熟的研究領(lǐng)域且研究工作較為連續(xù),他們的研究成果對于圖情檔領(lǐng)域大數(shù)據(jù)的后續(xù)研究具有很大的參考價(jià)值。
本研究利用詞頻分析法、社會網(wǎng)絡(luò)分析法、共現(xiàn)分析法,對CNKI中2014—2018年間收錄的我國圖情檔大數(shù)據(jù)的相關(guān)研究,利用SATI、Excel進(jìn)行相應(yīng)的篩選、合并、統(tǒng)計(jì)等處理,同時(shí)借助UCINET和NetDraw對關(guān)鍵詞進(jìn)行進(jìn)一步的分析。結(jié)果發(fā)現(xiàn),我國圖情檔領(lǐng)域關(guān)于大數(shù)據(jù)研究的發(fā)展正處于快速發(fā)展階段。未來隨著大數(shù)據(jù)及其相關(guān)技術(shù)的迅猛發(fā)展與成熟,我國圖情檔領(lǐng)域大數(shù)據(jù)的相關(guān)研究也會隨著時(shí)代的發(fā)展形成更多的研究熱點(diǎn),涌現(xiàn)出更多的新研究方向,同時(shí)也會出現(xiàn)更多的大數(shù)據(jù)相關(guān)的研究成果。此外,雖然我們力求客觀、準(zhǔn)確地搜集原始數(shù)據(jù),并采用人工的方式對數(shù)據(jù)進(jìn)行了清洗,在此基礎(chǔ)上進(jìn)行了文獻(xiàn)計(jì)量分析,研究結(jié)論的信度一定程度得到了保證;但需要注意的是,本文也存在一些局限,由于初始文獻(xiàn)有5 426篇,最終用于文獻(xiàn)計(jì)量的相關(guān)文獻(xiàn)也有5 214篇,數(shù)量巨大且數(shù)據(jù)清洗采用的是人工處理方式,可能受到數(shù)據(jù)清洗人員的知識水平的局限,一定程度上會影響分析結(jié)果的精確程度。