朱世偉 李思思(通訊作者) 張銘君
1. 齊魯工業(yè)大學(xué)(山東省科學(xué)院) 山東 濟(jì)南 250014;2. 山東省科學(xué)院情報(bào)研究所 山東 濟(jì)南 250014
對于大數(shù)據(jù)概念的界定,目前尚無統(tǒng)一的認(rèn)識(shí)。由于所從事學(xué)科領(lǐng)域的差異,國內(nèi)外學(xué)者對“大數(shù)據(jù)”有不同的看法。一些學(xué)者認(rèn)為大數(shù)據(jù)是指無法在可容忍的時(shí)間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合[1]。還有學(xué)者指出大數(shù)據(jù)是具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[2]。另有學(xué)者認(rèn)為,大數(shù)據(jù)的概念內(nèi)涵不應(yīng)僅僅局限在技術(shù)層面:大數(shù)據(jù)可以定義為在合理時(shí)間內(nèi)采集大規(guī)模資料、處理成為常規(guī)使用者更有效決策的社會(huì)過程[3]。
著名的管理和咨詢公司麥肯錫(McKinsey)認(rèn)為,“大數(shù)據(jù)已經(jīng)滲透到工業(yè)和商業(yè)領(lǐng)域的各個(gè)方面,成為影響生產(chǎn)的一個(gè)重要因素”,大數(shù)據(jù)的應(yīng)用涉及經(jīng)濟(jì)、文化、教育、醫(yī)療、公共管理等各行各業(yè)。正是由于大數(shù)據(jù)的廣泛應(yīng)用及其背后蘊(yùn)藏的巨大潛力和價(jià)值,許多國家紛紛將“大數(shù)據(jù)”的建設(shè)和發(fā)展上升為國家戰(zhàn)略,積極推動(dòng)大數(shù)據(jù)應(yīng)用的發(fā)展[4]。
所以,借助信息可視化等研究方法,及時(shí)分析和挖掘我國大數(shù)據(jù)中心領(lǐng)域的現(xiàn)狀研究和熱點(diǎn)分析,對推進(jìn)我國大數(shù)據(jù)中心的建設(shè)發(fā)展有重要意義。
本文以中國知網(wǎng)(CNKI)總庫為數(shù)據(jù)來源,檢索時(shí)間截止為2021年4月29日,主題檢索“大數(shù)據(jù)中心”,得到我國大數(shù)據(jù)中心相關(guān)研究論文 9350篇,見下表。
表1 文獻(xiàn)類型分布
為了對我國大數(shù)據(jù)中心的研究現(xiàn)狀、研究熱點(diǎn)等有最新最及時(shí)的了解,本文對2020年以來發(fā)表的有關(guān)大數(shù)據(jù)中心研究的1912篇學(xué)術(shù)期刊又做了進(jìn)一步的分析研究,包括研究學(xué)術(shù)期刊的關(guān)鍵詞、作者、機(jī)構(gòu)等,對其進(jìn)行系統(tǒng)的詞頻統(tǒng)計(jì)、詞云圖展現(xiàn)和共現(xiàn)分析等[5]。
本文使用文獻(xiàn)計(jì)量法,通過信息可視化軟件Ucinet、詞云制作工具以及數(shù)據(jù)預(yù)處理工具COOC軟件,對文獻(xiàn)數(shù)據(jù)的類型、發(fā)文數(shù)量、文獻(xiàn)作者、發(fā)文機(jī)構(gòu)以及關(guān)鍵詞進(jìn)行分析,展示研究領(lǐng)域的基本情況以及展示研究領(lǐng)域的熱點(diǎn)主題[6]。
2.1.1 作者發(fā)文頻次。在中國知網(wǎng)(CNKI)中選中自2020年以來發(fā)表的有關(guān)大數(shù)據(jù)中心研究的1912篇學(xué)術(shù)期刊,時(shí)間截止為2021年4月29日,自定義格式導(dǎo)出文獻(xiàn),存為excel格式文檔保存。抽取文獻(xiàn)作者字段,新建excel表格保存,并將數(shù)據(jù)導(dǎo)入預(yù)處理軟件COOC,執(zhí)行相關(guān)操作,得到我國大數(shù)據(jù)中心研究的1912篇期刊的作者發(fā)文頻次情況統(tǒng)計(jì)表。為了使研究結(jié)果更加一目了然,筆者運(yùn)用詞云制作網(wǎng)站,將頻次統(tǒng)計(jì)表輸入系統(tǒng),執(zhí)行相關(guān)操作后,得到我國大數(shù)據(jù)中心研究的1912篇期刊的作者詞云圖,標(biāo)簽的大小代表標(biāo)簽出現(xiàn)的頻次,見下圖。
圖1 作者詞云圖
由統(tǒng)計(jì)表和詞云圖我們可以清晰地看出,王慶梅、計(jì)虹、王磊、劉悅琛、梅雅鑫和曾帥都是發(fā)文量較高的作者,對于我國大數(shù)據(jù)中心領(lǐng)域有著深厚的研究。
2.1.2 作者共現(xiàn)網(wǎng)絡(luò)。抽取文獻(xiàn)作者字段,新建excel表格保存,并將數(shù)據(jù)導(dǎo)入預(yù)處理軟件COOC,執(zhí)行相關(guān)操作,得到我國大數(shù)據(jù)中心研究的1912篇期刊的作者合作情況統(tǒng)計(jì)表,得到作者合作矩陣。將此矩陣導(dǎo)入可視化軟件ucinet中,通過共現(xiàn)網(wǎng)絡(luò)直觀分析作者合作的情況。
圖2 作者共現(xiàn)網(wǎng)絡(luò)
由作者共現(xiàn)網(wǎng)絡(luò),我們不難發(fā)現(xiàn),發(fā)文量較多的幾位作者,合作情況各不相同。有獨(dú)立研究的作者,例如王磊、曾帥、梅雅鑫、郭亮以及王小兵;也有合作關(guān)系較為簡單的作者,例如劉悅琛與王慶梅,兩人合作較多,再比如張欣、計(jì)虹以及張晨,3人之間有不同程度的合作;除此之外,也有小團(tuán)體的合作,例如郭燕青、張靚、王海星、齊昊、楊志清以及郭玲玲這六位作者之間,形成了一個(gè)完備圖,兩兩之間都有合作關(guān)系,也存在多人合作的現(xiàn)象,筆者隨之分析此6人的所在機(jī)構(gòu),發(fā)現(xiàn)均來自山西醫(yī)科大學(xué)第一醫(yī)院醫(yī)療大數(shù)據(jù)中心以及山西醫(yī)科大學(xué)第一醫(yī)院內(nèi)分泌科,是機(jī)構(gòu)內(nèi)部不同組織的合作。
2.2.1 關(guān)鍵詞頻次統(tǒng)計(jì)。抽取文獻(xiàn)關(guān)鍵詞字段,新建excel表格保存,并將數(shù)據(jù)導(dǎo)入預(yù)處理軟件COOC,執(zhí)行相關(guān)操作,得到我國大數(shù)據(jù)中心研究的1912篇期刊的關(guān)鍵詞頻次情況統(tǒng)計(jì)表,其中,關(guān)鍵詞頻次大于等于30次的關(guān)鍵詞情況統(tǒng)計(jì)見下表。
表2 關(guān)鍵詞頻次統(tǒng)計(jì)
續(xù)表
關(guān)鍵詞詞云圖如下。
圖3 關(guān)鍵詞詞云圖
由統(tǒng)計(jì)表和詞云圖我們可以清晰地看出,大數(shù)據(jù)、大數(shù)據(jù)中心、數(shù)據(jù)中心、工業(yè)互聯(lián)網(wǎng)、人工智能、云計(jì)算、物聯(lián)網(wǎng)、基礎(chǔ)設(shè)施建設(shè)這些研究領(lǐng)域都是出現(xiàn)頻次較高的,是目前我國大數(shù)據(jù)中心研究的研究熱點(diǎn)。
2.2.2 關(guān)鍵詞共現(xiàn)矩陣。抽取文獻(xiàn)關(guān)鍵詞字段,新建excel表格保存,并將數(shù)據(jù)導(dǎo)入預(yù)處理軟件COOC,執(zhí)行相關(guān)操作,得到我國大數(shù)據(jù)中心研究的1912篇期刊的關(guān)鍵詞共現(xiàn)情況統(tǒng)計(jì)表,其中,關(guān)鍵詞頻次大于等于40次的機(jī)構(gòu)合作情況見下表的關(guān)鍵詞共現(xiàn)矩陣。
表3 關(guān)鍵詞共現(xiàn)矩陣
將此矩陣導(dǎo)入可視化軟件ucinet中,通過共現(xiàn)網(wǎng)絡(luò)直觀分析關(guān)鍵詞共現(xiàn)的情況。
2.2.3 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。由關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)可知,大數(shù)據(jù)、大數(shù)據(jù)中心、數(shù)據(jù)中心、人工智能領(lǐng)域都是研究的熱點(diǎn)領(lǐng)域,除此之外,數(shù)字化轉(zhuǎn)型、智慧城市、云計(jì)算、疫情防控、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)也是學(xué)者研究的熱點(diǎn)。
圖4 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
本文運(yùn)用信息可視化的分析方法,以中國知網(wǎng)(CNKI)總庫為基礎(chǔ),對2020年以來發(fā)表的有關(guān)我國大數(shù)據(jù)中心研究的1912篇重點(diǎn)文獻(xiàn)的關(guān)鍵詞、作者、機(jī)構(gòu)進(jìn)行系統(tǒng)的詞頻統(tǒng)計(jì)、詞云展示和共現(xiàn)分析等。研究發(fā)現(xiàn),我國大數(shù)據(jù)中心相關(guān)的研究成果以學(xué)術(shù)期刊為主,除此之外,也有很多碩博畢業(yè)生以大數(shù)據(jù)中心相關(guān)研究作為學(xué)位論文;文獻(xiàn)作者之間的合作較少,典型合作是燕青、張靚、王海星、齊昊、楊志清以及郭玲玲這六位作者之間,兩兩之間都有合作關(guān)系,也存在多人合作的現(xiàn)象,且此六人的所在機(jī)構(gòu),均來自山西醫(yī)科大學(xué)第一醫(yī)院醫(yī)療大數(shù)據(jù)中心以及山西醫(yī)科大學(xué)第一醫(yī)院內(nèi)分泌科,是機(jī)構(gòu)內(nèi)部不同組織的合作;發(fā)文機(jī)構(gòu)之間合作較少,也多為機(jī)構(gòu)內(nèi)部合作,例如中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心、中國科學(xué)院大學(xué)以及中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室之間的合作;大數(shù)據(jù)、大數(shù)據(jù)中心、數(shù)據(jù)中心、工業(yè)互聯(lián)網(wǎng)、人工智能、云計(jì)算、物聯(lián)網(wǎng)以及基礎(chǔ)設(shè)施建設(shè)等,都是高頻關(guān)鍵詞,且在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)中,也是出于中間位置的重點(diǎn)關(guān)鍵詞,都是研究的熱點(diǎn)領(lǐng)域。