• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于知識(shí)圖譜的國內(nèi)外大數(shù)據(jù)比較研究

      2016-08-30 08:29:27
      中國科技論壇 2016年7期
      關(guān)鍵詞:數(shù)據(jù)挖掘圖譜可視化

      蘇 楠

      (四川大學(xué)公共管理學(xué)院,四川 成都 610065)

      ?

      基于知識(shí)圖譜的國內(nèi)外大數(shù)據(jù)比較研究

      蘇楠

      (四川大學(xué)公共管理學(xué)院,四川成都610065)

      以WOS和CSSCI的研究文獻(xiàn)為對(duì)象,采用文獻(xiàn)計(jì)量及可視化方法,構(gòu)建系列知識(shí)圖譜,開展國內(nèi)外大數(shù)據(jù)比較研究。結(jié)果顯示,國內(nèi)外大數(shù)據(jù)在技術(shù)方面以mapreduce、hadoop、cloudcomputing等為主要支撐,在應(yīng)用方面以金融、社會(huì)媒體、電子商務(wù)、信息服務(wù)等為主要領(lǐng)域。整體上看,中國大數(shù)據(jù)研究仍處于相對(duì)落后的局面,尤其是對(duì)基礎(chǔ)理論、價(jià)值特征的挖掘相對(duì)薄弱,將會(huì)成為未來大數(shù)據(jù)技術(shù)研發(fā)與應(yīng)用推廣的重大障礙。

      大數(shù)據(jù);國內(nèi)外;應(yīng)用;熱點(diǎn)主題;比較研究

      近年來,中國大數(shù)據(jù)研究已經(jīng)如火如荼地開展起來。大數(shù)據(jù)概念起源于歐美發(fā)達(dá)國家,其在相關(guān)方面的研究也處于領(lǐng)先地位。雖然當(dāng)前對(duì)國外大數(shù)據(jù)研究的介紹性成果已經(jīng)很多,但是國內(nèi)外大數(shù)據(jù)的比較研究還很少見。因此,亟需通過比較國內(nèi)外大數(shù)據(jù)研究進(jìn)展情況,挖掘熱點(diǎn),發(fā)現(xiàn)異同,尋找差距,探測趨勢,為推動(dòng)國家大數(shù)據(jù)戰(zhàn)略提供參考借鑒。

      1 數(shù)據(jù)與方法

      以CSSCI為數(shù)據(jù)源,以大數(shù)據(jù)、數(shù)據(jù)挖掘、bigdata為檢索詞,時(shí)間為2006—2015年,經(jīng)過精確檢索和數(shù)據(jù)清洗后最終獲得文獻(xiàn)數(shù)據(jù)958條。以WebofScience中SCI-EXPANDED、SSCI為數(shù)據(jù)源,檢索主題為bigdata、massivedata、hugedata,時(shí)間跨度為2006—2015年,獲得文獻(xiàn)數(shù)據(jù)2940條。

      研究方法選用共詞分析法、頻次分析法等,以文獻(xiàn)計(jì)量軟件CitespaceⅢ為技術(shù)工具。研究將CSSCI和SCI-EXPANDED、SSCI中的文獻(xiàn)數(shù)據(jù)導(dǎo)入標(biāo)準(zhǔn)化處理,開展詞頻分析、共詞分析,繪制能夠反映國內(nèi)外大數(shù)據(jù)研究現(xiàn)狀的聚類圖譜,開展主題挖掘和比較研究。

      2 國內(nèi)外大數(shù)據(jù)研究的知識(shí)圖譜

      2.1詞頻分析

      通過對(duì)關(guān)鍵詞的提取,發(fā)現(xiàn)CSSCI文獻(xiàn)中共提取關(guān)鍵詞815個(gè),WOS文獻(xiàn)中共提取關(guān)鍵詞2134個(gè)。表1、表2分別是國內(nèi)外大數(shù)據(jù)研究的高頻關(guān)鍵詞列表,看到國外文獻(xiàn)的關(guān)鍵詞頻次要遠(yuǎn)遠(yuǎn)高于國內(nèi)文獻(xiàn)的關(guān)鍵詞頻次。

      表1 大數(shù)據(jù)研究的高頻關(guān)鍵詞列表(前30位)

      表1顯示,中國大數(shù)據(jù)研究的領(lǐng)域標(biāo)簽為數(shù)據(jù)挖掘、大數(shù)據(jù)、大數(shù)據(jù)時(shí)代,云計(jì)算、關(guān)聯(lián)規(guī)則、學(xué)習(xí)分析、聚類分析、競爭情報(bào)、數(shù)字圖書館、知識(shí)發(fā)現(xiàn)、數(shù)據(jù)分析、信息服務(wù)、決策樹、電子商務(wù)、mapreduce等是當(dāng)前大數(shù)據(jù)研究的重點(diǎn)。大數(shù)據(jù)研究初步形成兩個(gè)細(xì)分方向:一是大數(shù)據(jù)技術(shù)研究,如關(guān)聯(lián)規(guī)則、聚類分析、數(shù)據(jù)倉庫、可視化、web數(shù)據(jù)挖掘、數(shù)據(jù)挖掘技術(shù)、粗糙集、mapreduce、hadoop等,二是大數(shù)據(jù)實(shí)際應(yīng)用,圖書館、學(xué)習(xí)分析、競爭情報(bào)、信息服務(wù)、決策樹、個(gè)性化服務(wù)、知識(shí)服務(wù)、電子商務(wù)、金融、商業(yè)智能、在線教育等等。

      表2顯示,國外大數(shù)據(jù)研究在技術(shù)方面主要有,mapreduce、systems、classification、algorithm、datamining、Design、hadoop、ontology、neural-networks、sensordata、integration等;在應(yīng)用方面則表現(xiàn)在,cloudcomputing、information、management、performance、socialmedia、internet、bioinformatics、cancer、machinelearning等。比較發(fā)現(xiàn),國外大數(shù)據(jù)的研究內(nèi)容更為廣泛、研究方向更為多元、技術(shù)創(chuàng)新相對(duì)先進(jìn)、研究層次更為深入。

      表2 國外大數(shù)據(jù)研究的高頻關(guān)鍵詞列表(前30位)

      續(xù)表2

      2.2共詞圖譜

      共詞分析是對(duì)兩個(gè)關(guān)鍵詞在文獻(xiàn)中共同出現(xiàn)的次數(shù)進(jìn)行分析,挖掘?qū)W科研究的演化情況[1]。運(yùn)用CiteSpace將同質(zhì)性節(jié)點(diǎn)抓取出來,以可視化圖譜的形式呈現(xiàn)研究熱點(diǎn),節(jié)點(diǎn)頻次、網(wǎng)絡(luò)密度、連線疏密等是識(shí)別研究結(jié)構(gòu)的重要依據(jù)[2]。

      圖1是中國大數(shù)據(jù)研究知識(shí)圖譜,全面展示了中國大數(shù)據(jù)研究的熱點(diǎn)分布。該圖譜存在若干關(guān)鍵節(jié)點(diǎn),如關(guān)聯(lián)規(guī)則、競爭情報(bào)、數(shù)據(jù)分析、信息服務(wù)、數(shù)字圖書館、知識(shí)發(fā)現(xiàn)、可視化、web數(shù)據(jù)挖掘、云計(jì)算、語義網(wǎng)、聚類分析等,每個(gè)節(jié)點(diǎn)都與周邊外圍節(jié)點(diǎn)構(gòu)成一個(gè)主題類團(tuán),這些類團(tuán)指示不同的研究方向和研究重點(diǎn)。例如,云計(jì)算-mapreduce-hadoop指向大數(shù)據(jù)技術(shù)研究,競爭情報(bào)-知識(shí)管理-決策支持-企業(yè)指向大數(shù)據(jù)的企業(yè)應(yīng)用,數(shù)字圖書館-個(gè)性化服務(wù)-圖書館服務(wù)-高校圖書館-知識(shí)服務(wù)則是指向圖書館服務(wù)中的大數(shù)據(jù)應(yīng)用研究。

      圖1 中國大數(shù)據(jù)研究的知識(shí)圖譜

      圖2是國外大數(shù)據(jù)研究知識(shí)圖譜。相較于圖1,該圖譜的關(guān)鍵節(jié)點(diǎn)結(jié)構(gòu)更復(fù)雜,節(jié)點(diǎn)之間的關(guān)聯(lián)更加密切。關(guān)鍵節(jié)點(diǎn)主要是algorithms、design、classificationmodel、optimization、prediction、cloudcomputing、hadoop、mapreduce、neural-networks、datamining、machinelearning。而由這些節(jié)點(diǎn)支撐的主題聚類數(shù)量眾多,如bigdata-analytics-twitter-socialmedia,challenges-risk-privacy,machinelearning-cloudcomputing-cloud,prediction-neuralnetworks—classification-performance-model等。國外大數(shù)據(jù)研究的不同聚類之間存在更密切的關(guān)聯(lián),呈現(xiàn)出較高程度的交叉性。

      圖2 國外大數(shù)據(jù)研究的知識(shí)圖譜

      從圖1、圖2可以發(fā)現(xiàn),大數(shù)據(jù)、數(shù)據(jù)挖掘、bigdata等并不處于圖譜的絕對(duì)中心,并且其與外圍節(jié)點(diǎn)連線數(shù)量不是最多的,反而是前文提到的那些關(guān)鍵節(jié)點(diǎn)起到了支撐大數(shù)據(jù)研究的作用,如國內(nèi)是關(guān)聯(lián)規(guī)則、競爭情報(bào)、數(shù)據(jù)分析、信息服務(wù)、數(shù)字圖書館、可視化、云計(jì)算等,而國外是algorithms、prediction、performance、classification、model、cloudcomputing、neural-networks、machinelearning、risk等。國內(nèi)外研究在主流方向上是相對(duì)一致的。在大數(shù)據(jù)技術(shù)研究上,國內(nèi)外都關(guān)注分布式系統(tǒng)、并行計(jì)算、web數(shù)據(jù)挖掘技術(shù)、社會(huì)網(wǎng)絡(luò)分析、可視化技術(shù)、云計(jì)算技術(shù)、關(guān)聯(lián)規(guī)則算法、分類算法等,除此之外,國外還突出對(duì)算法優(yōu)化技術(shù)、本體技術(shù)、統(tǒng)計(jì)元技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)等的研究,而國內(nèi)則在語義網(wǎng)、協(xié)同過濾、信息抽取等投入較多。在大數(shù)據(jù)應(yīng)用研究上,國內(nèi)外較為一致的關(guān)注點(diǎn)是信息服務(wù)、競爭情報(bào)、可視化、社會(huì)媒介、互聯(lián)網(wǎng)、新聞、電子商務(wù)等,除此之外,國內(nèi)將大數(shù)據(jù)應(yīng)用于數(shù)字圖書館、金融、數(shù)字出版、在線教育等領(lǐng)域,而國外則更加關(guān)注bioinformation、cancer、surveillance、disease、health、policy等領(lǐng)域的大數(shù)據(jù)應(yīng)用。

      除了應(yīng)用研究與技術(shù)研究之外,國外學(xué)者還對(duì)大數(shù)據(jù)的performanc、risk、prediction、architecture、privacy、security、behavior、optimization、patterns等內(nèi)涵、特征保持濃厚興趣,而這方面國內(nèi)研究相對(duì)較弱。然而這些內(nèi)涵、特征是大數(shù)據(jù)的基礎(chǔ)研究,對(duì)這些基礎(chǔ)問題的論證能夠幫助創(chuàng)新大數(shù)據(jù)技術(shù),研判大數(shù)據(jù)應(yīng)用的領(lǐng)域與價(jià)值。

      3 國內(nèi)外大數(shù)據(jù)研究的熱點(diǎn)比較

      3.1大數(shù)據(jù)基礎(chǔ)研究

      大數(shù)據(jù)基礎(chǔ)研究主要涉及的是大數(shù)據(jù)的概念界定、起源發(fā)展、性質(zhì)特征、架構(gòu)邏輯、價(jià)值意義等。在這一方面,中國相關(guān)研究數(shù)量不多且研究層次不深,國外研究者則非常重視大數(shù)據(jù)基礎(chǔ)研究。framework、performance、optimization、science、risk、privacy、prediction、architecture、security、design、behavior、challenges、patterns等關(guān)鍵詞顯示出國外對(duì)大數(shù)據(jù)基礎(chǔ)研究重要性的認(rèn)識(shí)。Laney較早地提出大數(shù)據(jù)“3V”特性,即Volume、Velocity和Variety,在他之后Demchenko.Y等人認(rèn)為大數(shù)據(jù)還具有Veracity、Value特性,進(jìn)而提煉出大數(shù)據(jù)的5V特性[3]。國外學(xué)者認(rèn)為大數(shù)據(jù)有助于重塑現(xiàn)代科學(xué)結(jié)構(gòu),從信息集成、數(shù)據(jù)挖掘等方面推動(dòng)科學(xué)研究范式的整體性、革命性改變[4]。也有學(xué)者對(duì)此提出質(zhì)疑,認(rèn)為大數(shù)據(jù)存在擴(kuò)展性不穩(wěn)定、存儲(chǔ)量過載、數(shù)據(jù)冗余與分化、測量精確性低、數(shù)據(jù)安全等問題[5]。DanahBoyd呼吁冷靜看待大數(shù)據(jù)“熱潮”,警惕大數(shù)據(jù)“陷阱”。大數(shù)據(jù)真實(shí)性、安全性就是最受質(zhì)疑的特性之一。國內(nèi)外研究者進(jìn)行了討論。ViktorMayer等認(rèn)為應(yīng)在數(shù)據(jù)處理及使用中確定限制性要素和控制手段[6]。在其啟發(fā)下,國內(nèi)研究也將“告知—同意”作為大數(shù)據(jù)安全綜合治理模式的重要依據(jù)[7]。

      國外學(xué)者關(guān)注大數(shù)據(jù)背后的邏輯,他們認(rèn)為大數(shù)據(jù)基于互聯(lián)網(wǎng)而生,其內(nèi)在價(jià)值是對(duì)離散數(shù)據(jù)、碎片信息的集成挖掘與數(shù)字重構(gòu),形成不對(duì)稱信息優(yōu)勢,而這種不對(duì)稱信息優(yōu)勢即是大數(shù)據(jù)要極力攻破的,同時(shí)又是大數(shù)據(jù)自身孕育的。掌握這種不對(duì)稱信息優(yōu)勢就是掌握了各種社會(huì)資源的調(diào)配。因此,一些研究者認(rèn)為大數(shù)據(jù)既代表著黑幕又代表著透明,而大數(shù)據(jù)研究就是要讓其更多的轉(zhuǎn)向透明。另外,國外學(xué)者對(duì)大數(shù)據(jù)的模型、流程、方法以及在工程、社會(huì)、自然等方面的關(guān)聯(lián)也比較感興趣。

      3.2大數(shù)據(jù)技術(shù)研究

      為大數(shù)據(jù)提供技術(shù)支撐的就是云計(jì)算、mapreduce、hadoop等技術(shù)。Mapreduce是基于C++的分布式算法系統(tǒng),其功能是開展大批量非結(jié)構(gòu)化數(shù)據(jù)的集中處理,實(shí)現(xiàn)效率與成本的平衡;hadoop則是基于JAVA語言的分布式框架,為mapreduce提供運(yùn)行載體,與hadoop類似的還有pnuts、gfs等;云計(jì)算技術(shù)則是基于聯(lián)機(jī)分析的多維數(shù)據(jù)分析方法,對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)及并行計(jì)算。Mapreduce與hadoop是大數(shù)據(jù)技術(shù)的基礎(chǔ),mapreduce將海量數(shù)據(jù)分類化到不同的服務(wù)器上運(yùn)行,而hadoop則為這種分類提供規(guī)則約束的平臺(tái)框架。

      云計(jì)算是大數(shù)據(jù)技術(shù)的延伸,涵蓋了gridcomputing、SOA技術(shù)、utilityconputing及分布式算法等。大數(shù)據(jù)技術(shù)在海量數(shù)據(jù)采集的廣度和速度上有一定的優(yōu)勢,但是不擅長精確分析、信息保全,而云計(jì)算則兼顧多維計(jì)算與高容量存儲(chǔ)于一體,能夠通過獨(dú)特的streamcompute方法提升半結(jié)構(gòu)化數(shù)據(jù)處理的可擴(kuò)展性、隱私性、容錯(cuò)能力等,還支持可視化、智能分析、數(shù)據(jù)集成、人機(jī)交互等。

      中國經(jīng)過一段時(shí)間對(duì)西方國家的技術(shù)學(xué)習(xí)后,已經(jīng)在一些方面取得了本土化的創(chuàng)新性成果,如,百度公司構(gòu)建了“開放云”、“數(shù)據(jù)工廠”、“百度大腦”等技術(shù)平臺(tái),阿里巴巴開發(fā)了基于OS的大規(guī)模分布式計(jì)算系統(tǒng)Apsara,中國科學(xué)院推出了適用于開源數(shù)據(jù)基準(zhǔn)測試的BigDataBench程序集[8]。但是,西方國家仍然掌握著大數(shù)據(jù)技術(shù)研究的前沿成果,如谷歌公司以Googlemapreduce處理算法、BigTable和GoogleFileSystem奠定了其在大數(shù)據(jù)技術(shù)研發(fā)上的先進(jìn)地位,IBM在對(duì)hadoop重構(gòu)基礎(chǔ)上開發(fā)了用于數(shù)據(jù)塊自動(dòng)分類的Co-hadoop算法[9],微軟則通過整合hadoop與WindowsAzure、BI構(gòu)建了兼具數(shù)據(jù)挖掘與智能商務(wù)處理能力的云計(jì)算平臺(tái),斯坦福大學(xué)設(shè)計(jì)了一個(gè)內(nèi)存容量共享、處理器多核分布的大數(shù)據(jù)工具Phoenix,F(xiàn)acebook則開發(fā)了計(jì)算能力在250PB以上的新一代大數(shù)據(jù)查詢引擎Presto。總體上,國外在大數(shù)據(jù)技術(shù)研究領(lǐng)域能夠提供更加多元、可靠、高效的技術(shù)方案,并且已經(jīng)被廣泛推廣到各個(gè)大數(shù)據(jù)應(yīng)用領(lǐng)域。

      相比而言,中國的大數(shù)據(jù)技術(shù)研究還偏重于事務(wù)型數(shù)據(jù)庫建構(gòu)階段,歐美國家已處于分析型數(shù)據(jù)平臺(tái)(AnalyticDB)研發(fā)階段。擅長探究事物時(shí)空發(fā)展規(guī)律的分析型數(shù)據(jù)平臺(tái)更符合未來社會(huì)發(fā)展需求,可以更好地提供情報(bào)分析、方案設(shè)計(jì)、決策優(yōu)化、管理分類、信息保密。

      大數(shù)據(jù)可視化技術(shù)的軟件或工具都是國外大學(xué)或公司研發(fā)的,如Jigsaw、ITF等,國外已經(jīng)開始將“數(shù)據(jù)可視化”與“可視化分析”一體化,從而提供系統(tǒng)貫通、可知性強(qiáng)、時(shí)時(shí)交互的數(shù)據(jù)服務(wù)。遺憾的是,國內(nèi)原創(chuàng)性的數(shù)據(jù)可視化分析工具幾乎是空白。國內(nèi)在數(shù)據(jù)可視化方面明顯存在資金投入較少、人才培養(yǎng)不足、政策支持較弱等問題,導(dǎo)致國內(nèi)外技術(shù)差距有進(jìn)一步擴(kuò)大的風(fēng)險(xiǎn)。

      3.3大數(shù)據(jù)應(yīng)用研究

      當(dāng)前,大數(shù)據(jù)應(yīng)用呈現(xiàn)出飛速拓展、層次推進(jìn)、內(nèi)容深化的態(tài)勢。2009年前后,大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域嶄露頭角,2012年大數(shù)據(jù)已經(jīng)被應(yīng)用到生物信息、金融分析、新聞傳播、決策分析、電子商務(wù)等領(lǐng)域,當(dāng)前大數(shù)據(jù)更深入到物流供應(yīng)鏈、智慧交通、在線教育、一對(duì)一醫(yī)療、數(shù)字出版等人們生活的方方面面。

      國外比較注重大數(shù)據(jù)在生物信息、醫(yī)療開發(fā)、衛(wèi)生健康、輿情預(yù)測、社會(huì)網(wǎng)絡(luò)、經(jīng)濟(jì)分析、物聯(lián)網(wǎng)、化學(xué)信息、藥品研發(fā)、政策決策、商業(yè)創(chuàng)新、環(huán)境保護(hù)等方面的運(yùn)用。例如,在下一代生物基因測序方面美國科學(xué)家就應(yīng)用mapreduce框架構(gòu)建了基于大數(shù)據(jù)分析能力的生物知識(shí)庫[10];美國科研機(jī)構(gòu)用大數(shù)據(jù)信息捕捉技術(shù)對(duì)若干地區(qū)的生態(tài)環(huán)境實(shí)時(shí)監(jiān)控以發(fā)現(xiàn)生態(tài)保護(hù)漏洞[11];國外學(xué)者從twitter獲取社交大數(shù)據(jù),借助復(fù)雜社會(huì)網(wǎng)絡(luò)評(píng)估區(qū)域穩(wěn)定安全問題;還有研究機(jī)構(gòu)分析居民健康狀況,預(yù)測未來若干疾病爆發(fā)的可能性[12]。

      中國大數(shù)據(jù)應(yīng)用層次還比較低,主要還處于對(duì)西方早期經(jīng)驗(yàn)的學(xué)習(xí)和模仿階段。大數(shù)據(jù)應(yīng)用相對(duì)廣泛的領(lǐng)域是生物信息、物流快遞、金融分析、電子商務(wù)、慕課教育等領(lǐng)域。雖然國內(nèi)也出現(xiàn)了將大數(shù)據(jù)應(yīng)用于國家治理能力提升、服務(wù)型政府建設(shè)、網(wǎng)絡(luò)輿情引導(dǎo)等領(lǐng)域的嘗試。但是,這種嘗試大多屬于粗淺層次或?qū)W理層面的研究探索,而非強(qiáng)調(diào)可操作、可評(píng)估的實(shí)際應(yīng)用??傮w上看,中國創(chuàng)新性的、代表性、本土化的大數(shù)據(jù)應(yīng)用案例還比較少見。對(duì)大數(shù)據(jù)本質(zhì)規(guī)律研究不足,圍繞大數(shù)據(jù)因果分析、相關(guān)分析、特征分析的專門研究缺乏,難以與國內(nèi)現(xiàn)實(shí)急需相對(duì)接,導(dǎo)致大數(shù)據(jù)應(yīng)用的頂層設(shè)計(jì)與戰(zhàn)略規(guī)劃遲遲難以突破。

      4 結(jié)束語

      比較研究發(fā)現(xiàn),中國大數(shù)據(jù)研究在理論內(nèi)涵、技術(shù)開發(fā)、應(yīng)用實(shí)踐均與歐美國家存在一定差距。尤其是在大數(shù)據(jù)價(jià)值特性、大數(shù)據(jù)分類學(xué)、大數(shù)據(jù)本體庫、大數(shù)據(jù)學(xué)科建設(shè)等研究上急需補(bǔ)課。總體上看,中國大數(shù)據(jù)研究還處于模仿和學(xué)習(xí)國外相關(guān)研究的階段。2012年奧巴馬簽署了“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,比中國推行大數(shù)據(jù)戰(zhàn)略提前了三年,并且美國在大數(shù)據(jù)研究方面有細(xì)致的發(fā)展規(guī)劃,而中國大數(shù)據(jù)發(fā)展頂層設(shè)計(jì)還比較模糊。因此,亟需理清大數(shù)據(jù)發(fā)展思路,制定定向精準(zhǔn)地技術(shù)研發(fā)與應(yīng)用方案,促進(jìn)大數(shù)據(jù)在中國全面小康社會(huì)建設(shè)過程中發(fā)揮支撐作用。

      [1]劉則淵,陳悅,等.科學(xué)知識(shí)圖譜方法與應(yīng)用[M].北京:人民出版社,2008:36.

      [2]馮璐,冷伏海.共詞分析方法理論進(jìn)展[J].中國圖書館學(xué)報(bào),2006(2):88.

      [3]DEMCHENKOY,GROSSOP,etal.Addressingbigdataissuesinscientificdatainfrastructure[C].CollaborationTechnologiesandSystems,2013InternationalConferenceonIEEE,2013:49.

      [4]HOWED,COSTANZOM,F(xiàn)EYP,etal.Bigdata:thefutureofbiocuration[J].Nature,2008(7209):47-50.

      [5]SRIVASTAVADK.Bigchallengesinbigdataresearch[J].Dataminingandknowledgeengineering,2014(7):283.

      [6]VIKTORMS,KENNETHCukier.Bigdata:arevolutionthatwilltransformhowweLive,workandthink[M].NewYork:JohnMurray,2013:6.

      [7]張茂月.大數(shù)據(jù)時(shí)代個(gè)人信息數(shù)據(jù)安全的新威脅及其保護(hù)[J].中國科技論壇,2015(7):117.

      [8]詹劍鋒,高婉鈴,王磊,等.Bigdatabench:開源的大數(shù)據(jù)系統(tǒng)評(píng)測基準(zhǔn)[J].計(jì)算機(jī)學(xué)報(bào),2016(1):196-199.

      [9]ELTABAKHMY,TIANYuan,ZCANF,etal.Cohadoop:flexibledataplacementanditsexploitationinHadoop[J].ProceedingoftheVLDBendowment,2011(9):575.

      [10]TAYLORRC.AnoverviewoftheHadoopMapreduceHBaseframeworkanditscurrentapplicationsinbioinformatics[J].BMCbioinformatics,2010(11):s1.

      [11]HAMPTONSE,STRASSERCA,TEWKSBURYJJ,etal.Bigdataandthefutureofecology[J].Frontiersinecologyandtheenvironment,2013(3):158-160.

      [12]BATESDW,SARIAS,etal.Bigdatainhealthcare:usinganalyticstoidentifyandmanagehigh-riskandhigh-costpatients[J].Healthaffairs,2014(7):1123.

      (責(zé)任編輯劉傳忠)

      Knowledge Mapping of the Comparative Study of Big Data at Home and Abroad

      Su Nan

      (CollegeofPublicAdministration,SichuanUniversity,Chengdu610065,China)

      TakingtheWOSandCSSCI,itusesvisualmethodstocarryoutcomparativestudyofbigdataathomeandabroad.Theresultsshowthatmapreduce,hadoopandcloudcomputingarethemaintechniques;finance,socialmediaandinformationservicesarethemainapplication.However,ourbigdataresearchisbackward,especiallyinbasictheoryandvalues.

      Bigdata;Athomeandabroad;Application;Hotspot;Comparativestudy

      2015-12-02

      蘇楠(1987-),男,河南安陽人,四川大學(xué)公共管理學(xué)院博士;研究方向:公共管理。

      D63

      A

      猜你喜歡
      數(shù)據(jù)挖掘圖譜可視化
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      繪一張成長圖譜
      基于CGAL和OpenGL的海底地形三維可視化
      “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      主動(dòng)對(duì)接你思維的知識(shí)圖譜
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      赤水市| 金寨县| 仙居县| 咸阳市| 游戏| 丹阳市| 菏泽市| 义乌市| 吉木萨尔县| 科技| 彩票| 惠来县| 封开县| 东莞市| 泸定县| 大竹县| 年辖:市辖区| 雷山县| 高碑店市| 农安县| 金溪县| 安岳县| 安西县| 姜堰市| 铁力市| 平舆县| 中江县| 仁寿县| 胶州市| 含山县| 厦门市| 诸暨市| 延津县| 承德县| 昭平县| 出国| 星子县| 任丘市| 洪湖市| 黄龙县| 长治市|