摘 要:文章從文獻(xiàn)計(jì)量分析的角度,定量分析了計(jì)算機(jī)領(lǐng)域的2311995篇文獻(xiàn),對(duì)國內(nèi)計(jì)算機(jī)領(lǐng)域的主要研究機(jī)構(gòu)、主要研究學(xué)者及該領(lǐng)域的研究熱點(diǎn)行了統(tǒng)計(jì)與分析,構(gòu)建了國內(nèi)計(jì)算機(jī)領(lǐng)域研究熱點(diǎn)的知識(shí)圖譜,并對(duì)圖譜進(jìn)行了分析和解讀,以期獲取我國計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn)有哪些,有哪些主要的研究機(jī)構(gòu),他們各自關(guān)心的研究主題又有哪些,等等。
關(guān)鍵詞:知識(shí)圖譜;計(jì)算機(jī);研究熱點(diǎn);數(shù)據(jù)分析
中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:This paper quantitatively analyses 2311995 articles in the fields of computer science,from the view of literature metrology,collecting and examining data about major research institutions,main computer research scholars and the hot domains in this field,mapping knowledge research focus in the field in China,and analyzing and interpreting the spectrum to obtain what are the research hot domains,which are the main research institutions,and what their respective topics of research are concerned with,etc.in the field of Computer Science in China.
Keywords:knowledge spectrum;computer;hot domains;data analysis
1 引言(Introduction)
當(dāng)今社會(huì),計(jì)算機(jī)的應(yīng)用已滲透到社會(huì)的各個(gè)領(lǐng)域,正在日益改變著傳統(tǒng)的工作、學(xué)習(xí)和生活的方式,推動(dòng)著社會(huì)的科學(xué)計(jì)算,成為國民經(jīng)濟(jì)基礎(chǔ)性、先導(dǎo)性、戰(zhàn)略性、支柱性產(chǎn)業(yè),是中國搶占國際經(jīng)濟(jì)制高點(diǎn)的重要引擎[1]。但是計(jì)算機(jī)領(lǐng)域的學(xué)科發(fā)展現(xiàn)狀如何,該領(lǐng)域的研究熱點(diǎn)有哪些目前還沒有系統(tǒng)全面的研究。
中國知網(wǎng)是全球最大的知識(shí)門戶網(wǎng)站,集期刊、報(bào)紙、博士碩士學(xué)位論文、會(huì)議論文、圖書、年鑒、多媒體教育教學(xué)素材為一體的知識(shí)服務(wù)網(wǎng)站。本文以中國最大中文期刊數(shù)據(jù)庫——中國知網(wǎng)的海量數(shù)據(jù)為基礎(chǔ),利用SPSS統(tǒng)計(jì)軟件,以及知識(shí)圖譜的方法和工具對(duì)計(jì)算機(jī)領(lǐng)域的主要學(xué)術(shù)機(jī)構(gòu)、學(xué)者、論文關(guān)鍵詞等數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,以期獲取我國計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn)有哪些,有哪些主要的研究機(jī)構(gòu),最主要的學(xué)者和他們的團(tuán)隊(duì)成員有哪些,他們各自關(guān)心的研究主題又有哪些等。
2 研究方法(Research method)
文獻(xiàn)計(jì)量學(xué)方法是對(duì)文獻(xiàn)和文獻(xiàn)工作進(jìn)行定量研究的方法[2],它采用數(shù)學(xué)語言進(jìn)行定量分析,以數(shù)學(xué)公式或圖形來表現(xiàn)規(guī)律,對(duì)問題的陳述及計(jì)算都采用簡明的數(shù)學(xué)符號(hào),從而簡化和加速了思維過程[3],具有深刻的描述性能和高度的概括能力[4]。使用可視化的方式,即用科學(xué)知識(shí)圖譜的研究方法來定量,并且形象直觀地監(jiān)測與評(píng)價(jià)學(xué)科的發(fā)展,正是科學(xué)計(jì)量學(xué)、文獻(xiàn)計(jì)量學(xué)、信息計(jì)量學(xué)等近10多年來一直共同關(guān)注的一個(gè)問題,而且也已經(jīng)取得了很大進(jìn)展[5]。
本文利用文獻(xiàn)計(jì)量學(xué)及知識(shí)圖譜的理念及技術(shù)對(duì)計(jì)算機(jī)領(lǐng)域的上百萬篇文章進(jìn)行定量統(tǒng)計(jì)分析。
3 研究步驟(Research steps)
3.1 數(shù)據(jù)來源
本文所統(tǒng)計(jì)分析的原始數(shù)據(jù)源自于中國知網(wǎng)數(shù)據(jù)庫,選擇對(duì)中國知網(wǎng)所收錄的計(jì)算機(jī)相關(guān)領(lǐng)域2311995篇核心期刊文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析,這些數(shù)據(jù)具有較高的準(zhǔn)確性和權(quán)威性,是有價(jià)值的研究數(shù)據(jù)。
核心期刊是指某學(xué)科(或某領(lǐng)域)的核心期刊,是指那些發(fā)表該學(xué)科(或該領(lǐng)域)論文較多、使用率(含被引率、摘轉(zhuǎn)率和流通率)較高、學(xué)術(shù)影響較大的期刊[6]。由于核心期刊是期刊中學(xué)術(shù)水平較高的刊物,對(duì)核心期刊中收錄的計(jì)算機(jī)領(lǐng)域研究文獻(xiàn)進(jìn)行檢索分析,可以更準(zhǔn)確的獲得計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn)[7]。
3.2 數(shù)據(jù)獲取及預(yù)處理
(1) 數(shù)據(jù)檢索
進(jìn)入中國知網(wǎng)(CNKI)期刊數(shù)據(jù)庫,在學(xué)科專輯導(dǎo)航中選擇“計(jì)算機(jī)硬件技術(shù)”“計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用”“互聯(lián)網(wǎng)技術(shù)”“自動(dòng)化技術(shù)”“數(shù)據(jù)庫”等計(jì)算機(jī)學(xué)科,共檢索到2311995篇相關(guān)文獻(xiàn)。
(2) 數(shù)據(jù)預(yù)處理
通過數(shù)據(jù)檢索,檢索出計(jì)算機(jī)領(lǐng)域的核心期刊文獻(xiàn)之后,利用知網(wǎng)的文獻(xiàn)題錄導(dǎo)出功能,把文獻(xiàn)的題名、作者、單位、關(guān)鍵詞等題錄數(shù)據(jù)導(dǎo)出,把所有的題錄數(shù)據(jù)進(jìn)行匯總[8],共得到2311995條題錄數(shù)據(jù),對(duì)導(dǎo)出的原始數(shù)據(jù)進(jìn)行整合,便于之后對(duì)數(shù)據(jù)的分析。
3.3 數(shù)據(jù)統(tǒng)計(jì)與分析
3.3.1 單項(xiàng)關(guān)鍵詞統(tǒng)計(jì)
對(duì)數(shù)據(jù)預(yù)處理后,通過對(duì)獲取到的題錄數(shù)據(jù)中關(guān)鍵詞進(jìn)行分列處理,其次對(duì)分列后的關(guān)鍵詞進(jìn)行整合,進(jìn)而統(tǒng)計(jì)高頻關(guān)鍵詞[9]。選取前幾位的高頻關(guān)鍵詞包括“數(shù)據(jù)庫、單片機(jī)、計(jì)算機(jī)、神經(jīng)網(wǎng)絡(luò)、遺傳算法、數(shù)據(jù)挖掘、網(wǎng)絡(luò)安全、仿真、PLC、數(shù)據(jù)采集、無線傳感器網(wǎng)絡(luò)、教學(xué)改革、故障診斷、云計(jì)算、圖像處理、電子商務(wù)”等關(guān)鍵詞。通過這些高頻關(guān)鍵詞,可以看出計(jì)算機(jī)領(lǐng)域的關(guān)注點(diǎn)。高頻關(guān)鍵詞分布見圖1。
3.3.2 關(guān)鍵詞共現(xiàn)統(tǒng)計(jì)
共現(xiàn)分析是將各種信息載體中的共現(xiàn)信息定量化的分析方法[10],可深刻、精確地挖掘隱含的或潛在的有用的文本知識(shí),發(fā)現(xiàn)研究對(duì)象之間的親疏關(guān)系,揭示研究對(duì)象所代表的學(xué)科或主體的結(jié)構(gòu)與變化[11]。
選取計(jì)算機(jī)相關(guān)學(xué)科所收錄的2311995篇文獻(xiàn)的前四個(gè)關(guān)鍵詞進(jìn)行關(guān)鍵詞共現(xiàn)統(tǒng)計(jì),構(gòu)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。通過關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),可以發(fā)現(xiàn),計(jì)算機(jī)領(lǐng)域的研究主題包括:計(jì)算機(jī)網(wǎng)絡(luò)安全、計(jì)算機(jī)的應(yīng)用、利用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷、神經(jīng)網(wǎng)絡(luò)及遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用、單片機(jī)與無線傳感器、單片機(jī)與數(shù)據(jù)采集、基于云計(jì)算的數(shù)據(jù)挖掘、數(shù)據(jù)庫與計(jì)算機(jī)網(wǎng)絡(luò)等。關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)詳見圖2。
3.3.3 作者單位統(tǒng)計(jì)
對(duì)檢索到的2311995條題錄數(shù)據(jù),利用Excel軟件對(duì)作者單位進(jìn)行分列匯總,按單位發(fā)表文獻(xiàn)數(shù)量排序,發(fā)文篇數(shù)最多的為清華大學(xué),其次為上海交通大學(xué),排第三位的是浙江大學(xué),發(fā)表文獻(xiàn)頻次從高到低前20位依次為:清華大學(xué)、上海交通大學(xué)、浙江大學(xué)、西北工業(yè)大學(xué)、華中科技大學(xué)、哈爾濱工業(yè)大學(xué)、國防科技大學(xué)、武漢大學(xué)、北京航空航天大學(xué)、東南大學(xué)、西安交通大學(xué)、華南理工大學(xué)、南京航空航天大學(xué)、同濟(jì)大學(xué)、天津大學(xué)、重慶大學(xué)、中國科學(xué)技術(shù)大學(xué)、華中理工大學(xué)、東北大學(xué)、西安電子科技大學(xué)。發(fā)文數(shù)量居前20位的機(jī)構(gòu)基本上為我國的重點(diǎn)本科院校。前二十名單位詳見圖3。
3.3.4 作者統(tǒng)計(jì)
統(tǒng)計(jì)文獻(xiàn)中作者出現(xiàn)頻次可以分析得出計(jì)算機(jī)領(lǐng)域的領(lǐng)軍人物[12]。使用獲得的2311995條題錄數(shù)據(jù),統(tǒng)計(jì)其中作者的出現(xiàn)頻次,統(tǒng)計(jì)得到排序前十五名的作者,依次為:王士同、楊靜宇、于戈、周明全、趙海、王耀南、蔡自興、陳志剛、桂衛(wèi)華、潘泉、李仁發(fā)、楊炳儒、周明天、吳敏、王汝傳。
這些高產(chǎn)作者均是計(jì)算機(jī)、信息技術(shù)領(lǐng)域的知名學(xué)者,排在前五位的作者簡介:王士同,教授(博導(dǎo)),原江南大學(xué)信息學(xué)院院長,現(xiàn)任江南大學(xué)數(shù)媒學(xué)院首席教授;楊靜宇,南京理工大學(xué)模式識(shí)別與智能系統(tǒng)國家重點(diǎn)學(xué)科學(xué)術(shù)帶頭人、博士生導(dǎo)師;于戈,現(xiàn)任東北大學(xué)計(jì)算機(jī)軟件與理論研究所所長,2015年12月16日起任計(jì)算機(jī)科學(xué)與工程學(xué)院執(zhí)行院長,一級(jí)教授,博士生導(dǎo)師;周明全,教授,博士生導(dǎo)師。北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院院長,教育部虛擬現(xiàn)實(shí)應(yīng)用工程研究中心主任,教育部計(jì)算機(jī)科學(xué)與技術(shù)委員會(huì)軟件工程教學(xué)指導(dǎo)委員會(huì)委員。趙海,現(xiàn)任東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)研究所教授、博士生導(dǎo)師,學(xué)科責(zé)任教授,面向先進(jìn)裝備制造業(yè)嵌入式技術(shù)實(shí)驗(yàn)室(省教育廳重點(diǎn)實(shí)驗(yàn)室)主任,享受國務(wù)院特殊津貼。相繼創(chuàng)建了東大新業(yè)信息技術(shù)股份有限公司、沈陽市科技局無線傳感器網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室、沈陽市發(fā)改委物聯(lián)網(wǎng)應(yīng)用基礎(chǔ)研究工程實(shí)驗(yàn)室等?,F(xiàn)任中國民主同盟中央委員、民盟遼寧省委副主委、遼寧省政協(xié)常委,曾任沈陽市人民政府參事、沈陽市委咨詢委員會(huì)委員。曾獲遼寧省第二批百千萬人才工程百人層次人選、遼寧省優(yōu)秀博士學(xué)位論文指導(dǎo)教師、沈陽市青年專業(yè)技術(shù)人才、沈陽市優(yōu)秀科技工作者稱號(hào)。
4 結(jié)論(Conclusion)
通過對(duì)計(jì)算機(jī)領(lǐng)域的2311995篇研究文獻(xiàn)的文獻(xiàn)計(jì)量學(xué)實(shí)證研究得出:計(jì)算機(jī)領(lǐng)域的主要研究機(jī)構(gòu)集中于我國的重點(diǎn)本科院校,研究領(lǐng)域主要集中在“數(shù)據(jù)庫、單片機(jī)、計(jì)算機(jī)、神經(jīng)網(wǎng)絡(luò)、遺傳算法、數(shù)據(jù)挖掘”等方面。隨著人工智能技術(shù)的發(fā)展,與之相關(guān)的計(jì)算機(jī)網(wǎng)絡(luò)安全、計(jì)算機(jī)的應(yīng)用、利用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷、神經(jīng)網(wǎng)絡(luò)及遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用、單片機(jī)與無線傳感器、單片機(jī)與數(shù)據(jù)采集、基于云計(jì)算的數(shù)據(jù)挖掘、數(shù)據(jù)庫與計(jì)算機(jī)網(wǎng)絡(luò)等主題成為計(jì)算機(jī)領(lǐng)域的關(guān)注熱點(diǎn)。
參考文獻(xiàn)(References)
[1] Mohanapriya D.,Mahesh K..A novel foreground region analysis using NCP-DBP texture pattern for robust visual tracking[J].MULTIMEDIA TOOLS AND APPLICATIONS,2017,76(24):25731-25748.
[2] Chen Wang,Hongxun Yao,Xiaoshuai Sun.Anomaly detection based on spatio-temporal sparse representation and visual attention analysis[J].Multimedia Tools and Applications,2017,76(5):6263-6279.
[3] Luming Zhang,Yang Yang,Rongrong Ji,et al.Special issue on "visual semantic analysis with weak supervision"[J].Multimedia Systems,2017,23(1):1-3.
[4]吳運(yùn)兵,陰愛英,林開標(biāo),等.基于多數(shù)據(jù)源的知識(shí)圖譜構(gòu)建方法研究[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,45(03):329-335.
[5] 吳運(yùn)兵,楊帆,賴國華,等.知識(shí)圖譜學(xué)習(xí)和推理研究進(jìn)展[J].小型微型計(jì)算機(jī)系統(tǒng),2016,37(09):2007-2013.
[6] 蘇永浩,張馳,程文亮,等.CLEQS——基于知識(shí)圖譜構(gòu)建的跨語言實(shí)體查詢系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2016,36(S1):204-206;223.
[7] 劉嶠,李楊,段宏,等.知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2016,53(03):582-600.
[8] 劉知遠(yuǎn),孫茂松,林衍凱,等.知識(shí)表示學(xué)習(xí)研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2016,53(02):247-261.
[9] 王曉陽,鄭驍慶,肖仰華.智慧搜索中的實(shí)體與關(guān)聯(lián)關(guān)系建模與挖掘[J].通信學(xué)報(bào),2015,36(12):17-27.
[10] 楊良斌.數(shù)據(jù)挖掘領(lǐng)域研究現(xiàn)狀與趨勢的可視化分析[J].圖書情報(bào)工作,2015,59(S2):142-147.
[11] 王巍巍,王志剛,潘亮銘,等.雙語影視知識(shí)圖譜的構(gòu)建研究[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,52(01):25-34.
[12] 詹川.大數(shù)據(jù)研究的知識(shí)圖譜分析[J].圖書館論壇,2015,
35(04):84-91.
作者簡介:
張小娟(1981-),女,碩士,講師.研究領(lǐng)域:信息組織與信息檢索,文獻(xiàn)計(jì)量,知識(shí)圖譜,數(shù)據(jù)分析.