姜俊鋒 丁香乾 侯瑞春 曲麗君
(1.中國海洋大學(xué)信息科學(xué)與工程學(xué)院 青島 266100)(2.青島農(nóng)業(yè)大學(xué) 青島 266109)
?
基于CitespaceⅢ的大數(shù)據(jù)研究的可視化分析*
姜俊鋒1丁香乾1侯瑞春1曲麗君2
(1.中國海洋大學(xué)信息科學(xué)與工程學(xué)院青島266100)(2.青島農(nóng)業(yè)大學(xué)青島266109)
摘要近年來,大數(shù)據(jù)已經(jīng)成為科技界和企業(yè)界,甚至成為各國政府關(guān)注的熱點(diǎn)。大數(shù)據(jù)隱含著巨大的經(jīng)濟(jì)、社會(huì)和科研價(jià)值,已經(jīng)引起了各行各業(yè)的高度重視。分析大數(shù)據(jù)研究的前沿?zé)狳c(diǎn)和未來發(fā)展趨勢(shì),有效地組織和使用大數(shù)據(jù),將對(duì)社會(huì)經(jīng)濟(jì)和科學(xué)研究發(fā)展產(chǎn)生巨大的推動(dòng)作用。論文基于Java平臺(tái)的知識(shí)圖譜分析軟件CitespaceⅢ,對(duì)大數(shù)據(jù)研究相關(guān)文獻(xiàn)進(jìn)行可視化分析,明確了開展大數(shù)據(jù)研究的經(jīng)典關(guān)鍵文獻(xiàn)和學(xué)科前沿?zé)狳c(diǎn),預(yù)測(cè)了大數(shù)據(jù)領(lǐng)域的未來發(fā)展趨勢(shì),為學(xué)者和讀者更好地了解大數(shù)據(jù)提供了幫助。
關(guān)鍵詞大數(shù)據(jù); 可視化分析; CitespaceⅢ; 知識(shí)圖譜 出現(xiàn)頻次中心性關(guān)鍵詞出現(xiàn)頻次中心性Bigdata8160.23Networks620.12MapReduce1750.19Performance500.09Cloudcomputing1530.17Analytics410.07Hadoop1080.15Algorithm410.06Datamining790.14Visualization390.04 是一篇文獻(xiàn)所表述內(nèi)容的高度概括,也是一篇文章的精髓。通過對(duì)關(guān)鍵詞進(jìn)行共現(xiàn)網(wǎng)絡(luò)分析,揭示出在大數(shù)據(jù)研究領(lǐng)域的研究熱點(diǎn)。如圖5。出現(xiàn)頻次前十位的關(guān)鍵詞及中心性如表2所示。 出現(xiàn)頻次中心性關(guān)鍵詞出現(xiàn)頻次中心性大數(shù)據(jù)12150.34圖書館340.02云計(jì)算1460.13數(shù)據(jù)分析290.11數(shù)據(jù)挖掘770.23智慧城市260.00Hadoop430.18移動(dòng)互聯(lián)250.02物聯(lián)網(wǎng)420.09MapReduce230.02
Visualization Analysis about Big Data Research Based on CitespaceⅢ
JIANG Junfeng1DING Xiangqian1HOU Ruichun1QU Lijun2
(1. College of Information Science and Engineering, China Ocean University, Qingdao266100)
(2. Qingdao Agricultural University, Qingdao266109)
AbstractIn recent years, the research about “Big Data” has been the hot topic of scientific community, business community and even dozen governments. Big data implies huge economic, social and scientific value, which has attracted attention of all walks of life. Analyzing the frontier hotspots and the future development trends of the research of the big data, organizing and utilizing the big data effectively will be a huge boost to the economic and scientific development. The knowledge mapping analysis software-CitespaceⅢ based on Java platform is used to do the visualization research about the literature related about the big data, and the critical study and frontier hotspots of the big data research are carried out, the future trends in the field of the big data are predicted, and provided help for people is provided to know the big data better.
Key Wordsbig data, visualization, CitespaceⅢ, knowledge mapping
Class NumberTP391
1引言
人、機(jī)、物三元世界的高度融合引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長(zhǎng)和數(shù)據(jù)模式的高度復(fù)雜化,世界已進(jìn)入網(wǎng)絡(luò)化的大數(shù)據(jù)時(shí)代[1]?!禢ature》和《Science》等雜志相繼出版專刊[2~3]來探討大數(shù)據(jù)帶來的挑戰(zhàn)和機(jī)遇。著名咨詢公司麥肯錫聲稱,“數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素,人們對(duì)于大數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)力增長(zhǎng)和消費(fèi)者盈余浪潮的到來”[4]。2012年3月22日,奧巴馬宣布美國政府投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃(Big Data Research and Development Initiative)”[5]。這是繼1993年美國宣布“信息高速公路”計(jì)劃后的又一次重大科技發(fā)展部署。美國政府認(rèn)為大數(shù)據(jù)是“未來的新石油”,一個(gè)國家擁有數(shù)據(jù)的規(guī)模和運(yùn)用數(shù)據(jù)的能力將成為綜合國力的重要組成部分,對(duì)數(shù)據(jù)的占有和控制將成為國家間和企業(yè)間新的爭(zhēng)奪焦點(diǎn)。本文以2009年~2014年Web of Science數(shù)據(jù)庫中大數(shù)據(jù)相關(guān)文章為研究對(duì)象,利用可視化圖譜分析工具CitespaceⅢ加以分析,得出大數(shù)據(jù)領(lǐng)域近6年的研究熱點(diǎn)前沿,以及未來可能的發(fā)展趨勢(shì)。
2研究方法和數(shù)據(jù)來源
2.1研究方法
本研究使用的可視化分析工具是美國費(fèi)城德雷克塞爾大學(xué)(Drexel)信息科學(xué)與技術(shù)學(xué)院博士陳超美開發(fā)的基于Java平臺(tái)的CitespaceⅢ軟件。CitespaceⅢ是一款用于計(jì)量和分析科學(xué)文獻(xiàn)數(shù)據(jù)的信息可視化軟件,具有多元、分時(shí)、動(dòng)態(tài)的特點(diǎn),它利用分時(shí)動(dòng)態(tài)的可視化圖譜展示科學(xué)知識(shí)的宏觀結(jié)構(gòu)以及發(fā)展脈絡(luò),直觀地展示某一領(lǐng)域的信息全部?jī)?nèi)容,識(shí)別并顯示某一領(lǐng)域科學(xué)發(fā)展的新趨勢(shì)和新動(dòng)態(tài),展現(xiàn)研究熱點(diǎn)及前沿方向[6]。
2.2數(shù)據(jù)來源
本文以SCI(Thomson.ISI)網(wǎng)絡(luò)版——Web of Science中的科學(xué)引文索引擴(kuò)展版數(shù)據(jù)庫為分析的數(shù)據(jù)來源。以“Big Data”為關(guān)鍵詞,檢索年限設(shè)定為2009~2014在Web of Science中檢索文獻(xiàn)。共計(jì)得到2639篇與大數(shù)據(jù)領(lǐng)域相關(guān)的參考文獻(xiàn)。數(shù)據(jù)下載的方式設(shè)定為“全紀(jì)錄并且包含所引用的參考文獻(xiàn)”,并且保存在以download為名稱開頭的download_bigdata.txt文件中。數(shù)據(jù)下載結(jié)束時(shí)間是2015年3月。
3結(jié)果分析
將從Web of Science上下載的大數(shù)據(jù)相關(guān)文獻(xiàn)記錄download_bigdata.txt文件全部錄入CitespaceⅢ軟件中,然后對(duì)其進(jìn)行相關(guān)選項(xiàng)的設(shè)定。首先設(shè)置時(shí)間,選擇時(shí)間分區(qū)為2009~2014年,時(shí)間跨度為1年,這樣就形成了6個(gè)時(shí)間段。然后分別選擇Keyword、Institute、Author、Cited Reference、Cited Author、Cited Journal作為分析對(duì)象,設(shè)定時(shí)間片閾值為30。這樣,運(yùn)行CitespaceⅢ軟件就可以對(duì)研究對(duì)象進(jìn)行關(guān)鍵詞共現(xiàn)分析、機(jī)構(gòu)合作分析、作者合作分析、文獻(xiàn)共引分析、作者共引分析以及期刊共引分析等,并且繪制相應(yīng)的科學(xué)知識(shí)圖譜,以揭示大數(shù)據(jù)領(lǐng)域研究的熱點(diǎn)及前沿[7]。
3.1大數(shù)據(jù)研究領(lǐng)域文獻(xiàn)的時(shí)空分布特征
某一領(lǐng)域的歷時(shí)性變化趨勢(shì)可以從一個(gè)側(cè)面反映該領(lǐng)域的發(fā)展?fàn)顩r。為此,我們對(duì)Web of Science上對(duì)大數(shù)據(jù)領(lǐng)域研究的年度發(fā)文量進(jìn)行了統(tǒng)計(jì),如圖1所示。
圖1 年費(fèi)文獻(xiàn)量柱狀圖
從年份文獻(xiàn)量柱狀圖可以看出:2009年~2014年Web of Science上共發(fā)表以“Big Data”為主題的論文2639篇,而且由2009年的16篇到2014年的1302篇,明顯看出,刊發(fā)的大數(shù)據(jù)相關(guān)研究論文數(shù)量是逐年遞增的,隨著物聯(lián)網(wǎng)、云計(jì)算等相關(guān)領(lǐng)域的快速發(fā)展以及大數(shù)據(jù)表現(xiàn)出來的巨大的商業(yè)價(jià)值、學(xué)術(shù)價(jià)值和政治價(jià)值,使得大數(shù)據(jù)的研究進(jìn)入高峰期,為未來大數(shù)據(jù)相關(guān)研究打下了堅(jiān)實(shí)的基礎(chǔ)[8]。
為了更清晰地揭示大數(shù)據(jù)研究領(lǐng)域的發(fā)展?fàn)顩r,我們對(duì)大數(shù)據(jù)相關(guān)研究的國家空間特征進(jìn)行分析。選擇country作為分析對(duì)象,運(yùn)行CitespaceⅢ軟件對(duì)2009~2014年2639篇大數(shù)據(jù)領(lǐng)域相關(guān)文獻(xiàn)的作者來源地區(qū)和國家進(jìn)行可視化分析,得到有關(guān)國家針對(duì)大數(shù)據(jù)研究的實(shí)力分布圖譜。在圖2中圓圈的大小代表來源國家出現(xiàn)的頻次,圓圈越大,表明該國作者出現(xiàn)的頻次越多,反之越少??梢郧逦乜闯鲈诖髷?shù)據(jù)研究領(lǐng)域,美國具有絕對(duì)的優(yōu)勢(shì),以頻次921居于世界首位。中國頻次479位居第二,德國頻次128,英國頻次101,韓國頻次97。由此可見,無論是西方國家還是東方國家,發(fā)達(dá)國家還是發(fā)展中國家都在積極進(jìn)行大數(shù)據(jù)有關(guān)研究。
圖2 研究領(lǐng)域人員所在國家分布圖
雖然我國還沒有明確意義上對(duì)大數(shù)據(jù)研究的發(fā)展戰(zhàn)略,但是種種跡象表明,我國政府對(duì)大數(shù)據(jù)的研究也具有積極濃厚的興趣[9],我國以479的頻次位居大數(shù)據(jù)相關(guān)研究的前列。由表1可見,我國在大數(shù)據(jù)研究領(lǐng)域年度變化有一直上升的趨勢(shì),在2014年達(dá)到了254的發(fā)文量。
表1 我國的研究發(fā)文量年度變化表
3.2關(guān)鍵節(jié)點(diǎn)文獻(xiàn)分析
圖3 共引文獻(xiàn)網(wǎng)絡(luò)圖譜
進(jìn)行大數(shù)據(jù)領(lǐng)域研究分析,網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)定為參考文獻(xiàn)和主題詞,將主題詞來源設(shè)定為文獻(xiàn)標(biāo)題、文摘、描述符三種,并且主題詞設(shè)定為“涌現(xiàn)詞”,運(yùn)行CitespaceⅢ,得到輸出網(wǎng)絡(luò)所涵蓋的節(jié)點(diǎn)(Nodes=141)和連線數(shù)(Links=346),同時(shí)繪制除了大數(shù)據(jù)研究領(lǐng)域的文獻(xiàn)共引網(wǎng)絡(luò)圖譜,如圖3所示。
從共引文獻(xiàn)網(wǎng)絡(luò)圖譜中,可以發(fā)現(xiàn):由DEAN J,Ghemawat于2008年發(fā)表的MapReduce:simplified data processing on large clusters[10]是大數(shù)據(jù)研究領(lǐng)域最近幾年引用頻次最高的文獻(xiàn)。
圖4 關(guān)鍵文獻(xiàn)歷史引用頻次
查看該文獻(xiàn)的歷史引用頻次,如圖4,可以看出該文獻(xiàn)在最近幾年被引用206次,從一篇文章的被引頻次可以看出該文章在該研究領(lǐng)域的重要程度以及該領(lǐng)域其他研究學(xué)者對(duì)該篇文章的認(rèn)可程度,也就是說引用頻次高的文章就有可能是該研究領(lǐng)域的關(guān)鍵文獻(xiàn)或者奠基性文獻(xiàn)。此外,在該領(lǐng)域的關(guān)鍵文獻(xiàn)詳細(xì)信息如表2所示。
表2 WOS中被引頻次前五位的文章
3.3關(guān)鍵詞共引分析及研究熱點(diǎn)演進(jìn)分析
圖5 大數(shù)據(jù)研究的關(guān)鍵詞共現(xiàn)
可以看出,大數(shù)據(jù)研究與MapReduce,Cloud Computing,Hadoop,Data Mining,Networks,Classification,Algorithms,Performance等技術(shù)或者領(lǐng)域有著密切關(guān)系。研究者十分注重研究大數(shù)據(jù)和云計(jì)算的結(jié)合,云計(jì)算可以快速、自動(dòng)地進(jìn)行擴(kuò)展以支持海量數(shù)據(jù)和基礎(chǔ)設(shè)施,以及其分布式并行處理能力為大數(shù)據(jù)提供靈活的計(jì)算環(huán)境。Hadoop和MapReduce[11]是能夠?qū)Y(jié)構(gòu)化或者半結(jié)構(gòu)化的海量數(shù)據(jù)進(jìn)行分布式處理的軟件框架。大數(shù)據(jù)的根本在于數(shù)據(jù)挖掘[12],數(shù)據(jù)挖掘是一種決策支持過程,它通過高度自動(dòng)化地分析海量數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,就是從結(jié)構(gòu)化或者非結(jié)構(gòu)化的海量數(shù)據(jù)中搜索隱藏于其中的有著特殊關(guān)系性的信息的過程,發(fā)現(xiàn)數(shù)據(jù)中潛在的價(jià)值,幫助決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),做出正確的決策,這對(duì)于企業(yè)的發(fā)展十分重要。從中心性也可以看出,數(shù)據(jù)挖掘是大數(shù)據(jù)研究未來著重的方向。而隨社會(huì)網(wǎng)絡(luò)數(shù)據(jù)的激素攀升,傳統(tǒng)的網(wǎng)絡(luò)挖掘方法無法有效應(yīng)對(duì)大數(shù)據(jù)社會(huì)網(wǎng)絡(luò)場(chǎng)景,為了解決這些問題,針對(duì)大數(shù)據(jù)網(wǎng)絡(luò)挖掘,提出了基于MapReduce并行計(jì)算的挖掘方法。針對(duì)大數(shù)據(jù)和分析的關(guān)系,筆者認(rèn)為,數(shù)據(jù)分析[13]是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),并使之成為信息的過程,也就說個(gè)人或者企業(yè)為了解決生活生產(chǎn)中的決策或者營銷問題,運(yùn)用科學(xué)的分析方法對(duì)數(shù)據(jù)進(jìn)行處理的過程。在以往的市場(chǎng)調(diào)研工作中,數(shù)據(jù)統(tǒng)計(jì)分析也能幫助我們挖掘出所收集數(shù)據(jù)的隱藏信息,但是這種數(shù)據(jù)的分析是“向后分析”,分析的是已經(jīng)發(fā)生過的事情,而在大數(shù)據(jù)與分析的關(guān)系中,數(shù)據(jù)的統(tǒng)計(jì)分析是“向前分析”,它具有預(yù)見性。大數(shù)據(jù)意味著“巨量復(fù)雜數(shù)據(jù)”,數(shù)據(jù)量大,結(jié)構(gòu)復(fù)雜,因此,傳統(tǒng)的可視化數(shù)據(jù)分析模型已經(jīng)無法滿足研究的需求,必須針對(duì)大數(shù)據(jù)的特點(diǎn)構(gòu)建一套有效可視化分析理論及模型[14],因此,大數(shù)據(jù)可視化研究具有十分重要的意義,也是未來大數(shù)據(jù)領(lǐng)域研究的趨勢(shì)與側(cè)重點(diǎn)。
3.4我國大數(shù)據(jù)研究分析
為了進(jìn)一步研究國內(nèi)大數(shù)據(jù)研究的現(xiàn)狀,筆者選取CNKI作為國內(nèi)大數(shù)據(jù)研究數(shù)據(jù)來源,以“大數(shù)據(jù)”作為關(guān)鍵詞,時(shí)間段選取“2009~2014年”進(jìn)行檢索,共得到1218條結(jié)果記錄。數(shù)據(jù)下載結(jié)果保存在以download為名稱開頭的download_bigdata_CNKI.txt文件中。數(shù)據(jù)下載結(jié)束時(shí)間是2015年3月。
對(duì)CNKI上發(fā)表的文獻(xiàn)進(jìn)行年度分析,發(fā)文數(shù)量年度變化圖如圖1所示。由此可見,經(jīng)過科研人員的不斷努力,已經(jīng)使我國在大數(shù)據(jù)研究領(lǐng)域中有所突破。也就是說,在近幾年,對(duì)大數(shù)據(jù)的研究已成為研究的熱點(diǎn)和重點(diǎn),處于研究的發(fā)展階段,拓展空間廣闊。
表4 CNKI中被引頻次前五位的文章
從表3的被引頻次我們可以看出,我國有關(guān)大數(shù)據(jù)研究領(lǐng)域的被引頻次較高的文章主要出現(xiàn)在2011年和2012年。王珊、王會(huì)舉等人[15](2011)對(duì)當(dāng)前大數(shù)據(jù)平臺(tái)并行數(shù)據(jù)庫、MapReduce及基于兩者的混合架構(gòu)進(jìn)行了分析歸納,設(shè)計(jì)了適合大數(shù)據(jù)分析的數(shù)據(jù)倉庫架構(gòu);覃雄派等人[16](2011)分析了當(dāng)前數(shù)據(jù)管理技術(shù)的局限性,并且提出了以MapReduce為代表的非關(guān)系數(shù)據(jù)管理技術(shù)與關(guān)系數(shù)據(jù)管理技術(shù)相結(jié)合的優(yōu)越性。孟小峰等人[17](2013)對(duì)大數(shù)據(jù)基本概念進(jìn)行剖析,闡述大數(shù)據(jù)管理的基本框架,就云計(jì)算技術(shù)對(duì)于大數(shù)據(jù)時(shí)代數(shù)據(jù)管理產(chǎn)生的應(yīng)用進(jìn)行分析,最后歸納總結(jié)了大數(shù)據(jù)時(shí)代所面臨的新挑戰(zhàn)。另外,一些學(xué)者還對(duì)大數(shù)據(jù)研究未來發(fā)展方向、與其它領(lǐng)域聯(lián)系等做了深入研究。
對(duì)從CNKI下載的大數(shù)據(jù)研究相關(guān)文獻(xiàn)進(jìn)行關(guān)鍵詞共現(xiàn)分析,得到圖6。
從圖6以及表4可以看出,我國對(duì)大數(shù)據(jù)的研究與國外學(xué)者對(duì)大數(shù)據(jù)的研究是一致的,都十分重視大數(shù)據(jù)研究與云計(jì)算的結(jié)合,充分利用云計(jì)算的分布式并行計(jì)算能力對(duì)海量的、復(fù)雜的數(shù)據(jù)進(jìn)行處理。但是,國內(nèi)外對(duì)大數(shù)據(jù)研究的側(cè)重點(diǎn)略有所不同:國內(nèi)學(xué)者研究領(lǐng)域主要集中在算法、框架、編程、性能等方面;國內(nèi)則偏重于應(yīng)用研究,涉及物聯(lián)網(wǎng)、圖書館、智慧城市等多個(gè)方面。
4結(jié)語
大數(shù)據(jù)增長(zhǎng)迅速,很多企業(yè)數(shù)據(jù)已經(jīng)進(jìn)入TB級(jí)別,對(duì)大數(shù)據(jù)處理需求的迫切性和重要性,引發(fā)了全球?qū)W術(shù)界、工業(yè)界和各國政府的高度關(guān)注和重視,全球掀起了一個(gè)與20世紀(jì)90年代信息高速公路相提并論的研究熱潮。美國和歐洲一些發(fā)達(dá)國家政府都從國家科技戰(zhàn)略層面提出了一系列的大數(shù)據(jù)技術(shù)研發(fā)計(jì)劃,以推動(dòng)政府機(jī)構(gòu)、重大行業(yè)、學(xué)術(shù)界和工業(yè)界對(duì)大數(shù)據(jù)技術(shù)的探索研究和應(yīng)用。
本文以近幾年(2009年~2014年)來WOS中有關(guān)大數(shù)據(jù)研究的相關(guān)論文為研究對(duì)象,利用知識(shí)圖譜分析軟件CitespaceⅢ剖析了大數(shù)據(jù)領(lǐng)域的研究現(xiàn)狀。
1) 大數(shù)據(jù)在企業(yè)、社會(huì)和國家層面已經(jīng)慢慢成為重要的戰(zhàn)略資源,未來幾年數(shù)據(jù)資源化將成為新的戰(zhàn)略制高點(diǎn),是搶奪的新焦點(diǎn)。
2) 大數(shù)據(jù)的處理離不開云計(jì)算技術(shù),云計(jì)算技術(shù)為大數(shù)據(jù)提供可擴(kuò)展的彈性的基礎(chǔ)設(shè)施支撐環(huán)境以及數(shù)據(jù)服務(wù)的高效模式;大數(shù)據(jù)則為云計(jì)算提供了新的商業(yè)價(jià)值。大數(shù)據(jù)與云計(jì)算的完美結(jié)合將會(huì)帶來巨大的社會(huì)價(jià)值。
3) 基于大數(shù)據(jù)的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)以及人工智能等可能會(huì)改變小世界里的很多算法以及基礎(chǔ)理論。
4) 總體而言,云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新興計(jì)算形態(tài),既是大數(shù)據(jù)產(chǎn)生的地方,也是需要大數(shù)據(jù)分析方法的領(lǐng)域。
如何識(shí)別出有效信息并且加以利用是我們應(yīng)該關(guān)注的重點(diǎn),將大數(shù)據(jù)研究領(lǐng)域與可視化相結(jié)合,了解大數(shù)據(jù)相關(guān)領(lǐng)域的發(fā)展趨勢(shì),提升數(shù)據(jù)的可操作性是未來研究的課題[18]。通過對(duì)大數(shù)據(jù)領(lǐng)域研究熱點(diǎn)的演進(jìn)分析,凸顯了大數(shù)據(jù)研究的重要發(fā)展方向、前沿?zé)狳c(diǎn)和演變,有效組織和使用大數(shù)據(jù),將對(duì)社會(huì)經(jīng)濟(jì)和科學(xué)研究發(fā)展產(chǎn)生重要影響,這也是我們國家需要密切關(guān)注的。
參 考 文 獻(xiàn)
[1] 梁文鑫.大數(shù)據(jù)時(shí)代——課堂教學(xué)將迎來真正的變革[J].北京教育學(xué)院學(xué)報(bào)(自然科學(xué)版),2013,(1).
LIANG Wenxin. Big Data era-the classroom will ushered a real change[J]. Beijing Institute of Education(Natural Science),2013,(1).
[2] Specials: Big Data[J/OL]. Nature,2008,455.(2008-09-03)[2014-07-02]. http://www.nature.com/news/specials/bigdata/index.html.
[3] A Special Issue of Science: Dealing with Data[J]. e-Science Technology & Application,2011,2(1):93-94.
[4] 鄭玲微.大步跨入“大數(shù)據(jù)”時(shí)代[J].信息化建設(shè),2013,(1).
ZHENG Lingwei. Step into the “big data” era[J]. Infromation Technologly,2013,(1).
[5] 郎楊琴.美國發(fā)布“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”[J].科研信息化技術(shù)與應(yīng)用,2012,3(2):89-93.
LANG Yangqin. US release “research and development programs of big data”[J]. Science Technology and Application,2012,3(2):89-93.
[6] 侯劍華,胡志剛.CiteSpace軟件應(yīng)用研究的回顧與展望[J].現(xiàn)代情報(bào),2013,(4).
HOU Jianhua, HU Zhigang. Retrospect and Prospect of software applied research,2013,(4).
[7] Liu Hailong, Zhu Yeping, Guo Yanzhi Li. Visualization Analysis of Subject, Region, Author, and Citation on Crop Growth Model by CiteSpace Ⅱ Software[J]. Knowledge Engineering and Managent,2014:243-252.
[8] Armbrust, Michael; Fox, Armando; Griffith, Rean; A View of Cloud Computing[J]. Commuiantions of The ACM,2010:50-58.
[9] 袁露,肖志勇,王映龍.論大數(shù)據(jù)的現(xiàn)狀及其發(fā)展研究[J].教育教學(xué)論壇,2014,(44).
YUAN Lu, XIAO Zhiyong, WANG Yinglong. The status and developmental research of the Big Data[J]. Education Teaching,2014,(44).
[10] Dean, Jeffrey; Ghemawat, Sanjay, Mapreduce: Simplified data processing on large clusters[J]. Communications of The ACM,2008:107-113.
[11] Taylor, Ronald C. An overview of the Hadoop/MapReduce/HBase framework and its current applications in bioinformatics[J]. BMC BIOINFORMATICS,2010.
[12] Deepa, V. K; Geetha, J. RexyR. Rapid Development of Applications in Data Mining[J]. IEEE International Conference on Green High Performance Computing,2013.
[13] 顧君忠.大數(shù)據(jù)與大數(shù)據(jù)分析[J].軟件產(chǎn)業(yè)與工程,2013,(4).
GU Junzhong. Big Data and Big Data Analysis[J]. Software Industry and Engineering,2013,(4).
[14] 代雙鳳,董繼陽,薛健.科學(xué)計(jì)算中大數(shù)據(jù)可視化分析與應(yīng)用[J].工程研究-跨學(xué)科視野中的工程,2014,(3).
DAI Shuangfeng, DONG Jiyang, XUE Jian. Visualization analysis and application of the big data in scientific computing[J]. Engineering-Engineering Interdisciplinary Perspective,2014,(3).
[15] 王珊,王會(huì)舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,(10).
WANG Shan, WANG Huiju, QIN Xiongpai, et al. Big Data architecture: Challenges, Present and Future[J]. Computers,2011,(10).
[16] 覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,(1).
QIN Xiongpai, WANG Huiju, DU Xiaoyong, et al. Big Data Analysis—Competition and Symbiosis of RDBMS and MapReduce[J]. Journal of Software,2012,(1).
[17] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,(1).
MENG Xiaofeng, CI Xiang. Big Data management: concepts, technologies and challenges[J]. Computer Research and Development,2013,(1).
[18] 肖明,孔成果.大數(shù)據(jù):何去何從——基于文獻(xiàn)計(jì)量學(xué)的視角[J].圖書館學(xué)刊,2014,11:110-11.
XIAO Ming, KONG Chengguo. Big Data: Where to go: Bibliometric Perspective.
中圖分類號(hào)TP391
DOI:10.3969/j.issn.1672-9722.2016.02.026
作者簡(jiǎn)介:姜俊鋒,女,碩士研究生,研究方向:軟件工程與智能信息系統(tǒng)。丁香乾,男,教授,研究方向:計(jì)算智能、軟件工程、數(shù)字家庭、制造業(yè)信息化等。侯瑞春,女,高級(jí)工程師,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)等。曲麗君,女,工程師,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)等。
基金項(xiàng)目:青島市民生科技計(jì)劃項(xiàng)目任務(wù)書(編號(hào):14-2-3-56-nsh),“青島市特色蔬菜產(chǎn)業(yè)大數(shù)據(jù)平臺(tái)建設(shè)與應(yīng)用示范”項(xiàng)目資助。
*收稿日期:2015年8月14日,修回日期:2015年9月27日