• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)可視化在大數(shù)據(jù)時代中的應(yīng)用探究

      2014-10-21 20:09:56沈杰
      電子世界 2014年23期
      關(guān)鍵詞:圖表可視化文本

      沈杰

      【摘要】隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)挖掘和分析的發(fā)展已具有相當(dāng)重要的現(xiàn)實(shí)意義。用戶對數(shù)據(jù)進(jìn)行分析的需求增長, 數(shù)據(jù)可視化的要求也會變得愈發(fā)強(qiáng)烈。能有效呈現(xiàn)出用戶需要的數(shù)據(jù), 并易于理解進(jìn)而幫助用戶做出決策的數(shù)據(jù)可視化技術(shù)將在當(dāng)前及未來大有作為。本文描述了當(dāng)前數(shù)據(jù)可視化的時代背景,主要應(yīng)用,并表明其作用與注意點(diǎn),揭開數(shù)據(jù)可視化在現(xiàn)代社會的作用。

      【關(guān)鍵詞】數(shù)據(jù)可視化;大數(shù)據(jù);商業(yè)智能;數(shù)據(jù)挖掘

      1.時代背景

      自21世紀(jì)以來,數(shù)據(jù)爆炸已是人類的重大挑戰(zhàn),人們淹沒在數(shù)據(jù)海洋中,卻對信息,知識極其缺乏,人類分析數(shù)據(jù)的能力與獲取數(shù)據(jù)的能力相差甚遠(yuǎn)。同時,數(shù)據(jù)的多態(tài)、高維、獲取的動態(tài)性、數(shù)據(jù)關(guān)系的異構(gòu)更增加了數(shù)據(jù)使用的難度。在傳統(tǒng)企業(yè)占據(jù)主流地位的關(guān)系型數(shù)據(jù)庫有越來越多無法進(jìn)行管理的數(shù)據(jù)。這類數(shù)據(jù)的量巨大,具有多樣性,如各類文本、圖像、視頻、傳感器信息,且數(shù)據(jù)產(chǎn)生和更新的頻率上升到一個新層次??偨Y(jié)下即為海量化(Volume),多樣化(Variety),快速化(Velocity),這三點(diǎn)為大數(shù)據(jù)的主要特征。人們要從海量非結(jié)構(gòu)化數(shù)據(jù)中挖掘有用信息的這種推力,使大數(shù)據(jù)技術(shù)正逐步代替?zhèn)鹘y(tǒng)信息管理技術(shù)。伴隨著推力巨大的互聯(lián)網(wǎng),大數(shù)據(jù)時代的大幕正逐步拉起。而在這發(fā)展過程中,能有效呈現(xiàn)多元化數(shù)據(jù), 便于決策的數(shù)據(jù)可視化便越來越引起關(guān)注。

      2.數(shù)據(jù)可視化的作用

      在信息科學(xué)與知識管理中,DIKW(Data,Information,Knowledge,Wisdom)體系作為最基礎(chǔ)的模型,在數(shù)據(jù)處理流程中完成從數(shù)據(jù)到智慧的轉(zhuǎn)化。人們急切的需要能展示演繹數(shù)據(jù)的工具,并且能夠傳達(dá)數(shù)據(jù)身后真正的知識與智慧的工具。在整個轉(zhuǎn)化過程中,可視化于溝通,傳遞,表達(dá)方面表現(xiàn)出明顯的優(yōu)勢。

      數(shù)據(jù)可視化運(yùn)用計算機(jī)圖形學(xué),圖像處理等技術(shù),并以其在視覺感知與人腦認(rèn)知上的優(yōu)勢使美學(xué)因素融合在數(shù)據(jù)分析中。優(yōu)秀的數(shù)據(jù)信息圖甚至可以達(dá)到藝術(shù)的層面,令人賞心悅目。其在數(shù)據(jù)處理流程中持續(xù)的優(yōu)勢,使數(shù)據(jù)可視化交互工具市場逐步做大。

      數(shù)據(jù)就是石油,傳統(tǒng)的各類領(lǐng)域中不被重視的數(shù)據(jù)重新歸納總結(jié)會釋放出巨大潛力。新聞中的數(shù)據(jù)信息可以歸納為信息圖表,再與其他新聞進(jìn)行分析整合,人們往往可以從中有收獲。政府機(jī)關(guān)的數(shù)據(jù)通過有效整理并進(jìn)行可視化,可以增加其透明度,民眾可以更容易獲取有效信息。企業(yè)數(shù)據(jù)可視化,可以對整個企業(yè)運(yùn)營流程有很好的掌控,便于管理與盈利。網(wǎng)絡(luò)數(shù)據(jù)及公共資源的潛在價值也極大,各類社交網(wǎng)站開放的API可以供開發(fā)研究人員挖掘人們生活消費(fèi)習(xí)慣,甚至可以通過文本分析并進(jìn)行可視化發(fā)現(xiàn)流行病的爆發(fā)趨勢,購物網(wǎng)站對用戶已購貨物記錄進(jìn)行地域偏好分析,也可獲得有價值的情報。

      3.主要應(yīng)用

      3.1 文本可視化

      將文本信息提取技術(shù)與可視化相結(jié)合的文本可視化可以輔助用戶將文本中的信息簡潔地呈現(xiàn)出來。原始文本經(jīng)過文本信息挖掘,視圖繪制和人機(jī)交互,這便是基本的可視化流程。在諸多網(wǎng)站上,文本可視化的標(biāo)簽云技術(shù)已越來越常見,其為基于關(guān)鍵詞的最簡單的文本可視化技術(shù),用顏色和字體的大小體現(xiàn)關(guān)鍵詞于文本中的分布差異,衍生的Wordle技術(shù)改進(jìn)了空間布局,提升了美學(xué)效果。在進(jìn)行信息檢索時,也可以使用TileBar,Sparkler等可視化方法來提升檢索效果。除此之外,文本信息中還包含了大量的人類主觀信息,可以在RSS新聞內(nèi)容,社交平臺中挖掘用戶情感傾向信息,幫助調(diào)查者從宏觀角度進(jìn)行分析并為決策提供依據(jù)。

      3.2 多媒體數(shù)據(jù)可視化

      大數(shù)據(jù)時代,人們早已對半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)充滿了好奇。圖像,視頻,音頻中的數(shù)據(jù)價值推動了多媒體數(shù)據(jù)的可視化。比如社交照片中群體成員之間的關(guān)聯(lián)多使用了海賽圖方法;視頻的可視化則經(jīng)常使用將圖像堆疊成立方的方法,為抽取視頻中的運(yùn)動信息提供方便;音樂的可視化如今也多是媒體播放工具的一個功能。

      3.3 商業(yè)智能的數(shù)據(jù)可視化

      如今的大量在線商業(yè)數(shù)據(jù)具有強(qiáng)烈的跨媒體特征與豐富的時空地理屬性,用戶的消費(fèi)日志包含了大量個人信息,這些都催生了該領(lǐng)域的可視化發(fā)展。當(dāng)前商業(yè)智能的數(shù)據(jù)分析大多借助于OLAP的多維分析模式實(shí)現(xiàn),采用可視化技術(shù)進(jìn)行數(shù)據(jù)探索。從最早的柱狀圖、餅圖、網(wǎng)狀圖等簡單圖表,發(fā)展到呈現(xiàn)公司狀態(tài)與商業(yè)環(huán)境的儀表盤、子彈圖,新成長的技術(shù)能有效地傳達(dá)數(shù)據(jù)背后的知識和思想。同時隨著Tableau,Spotfire等軟件的推廣,可視化極大推動商業(yè)智能的大眾化,降低了普通人進(jìn)行數(shù)據(jù)分析的門檻。

      3.4 Web端可視化

      Web端的可視化是通過HTML,CSS,Javas-cript技術(shù),在網(wǎng)頁上實(shí)現(xiàn)可交互的可視化作品及時全面顯示信息。Web端的可視化可以提升用戶效率,使選擇操作更加方便,感官更加舒服。D3.js就是一套面向Web的數(shù)據(jù)可視化的Javascript庫,具有極大的設(shè)計靈活性和可移植性。國內(nèi)開發(fā)的DataV.js同樣出色,可以便捷的調(diào)用且兼容各類瀏覽器。

      4.數(shù)據(jù)可視化的注意點(diǎn)

      可視化雖然是非常好的了解數(shù)據(jù)的方式,不過也很容易以錯誤的方式執(zhí)行從而背離了其價值所在。為充分展示信息而不顧圖表的整體協(xié)調(diào),想要包含更多的信息效果卻適得其反,這樣做很容易使圖表缺乏美感。有限的儀表盤空間要包含的是重要的且值得優(yōu)先考慮的數(shù)據(jù),且當(dāng)圖表顯示過多的信息時,過于緊密的布局很容易顯示出錯誤的信息。而另一種錯誤則是為了追求畫面的美觀,卻使數(shù)據(jù)內(nèi)容的表達(dá)不佳。所以在可視化的過程中,目標(biāo)的確立是最為基本的,專注于自己的目標(biāo)有助于更好地傳遞表達(dá)數(shù)據(jù),同時與圖表的美觀之間也能達(dá)到一種平衡。

      真實(shí)的數(shù)據(jù)往往需要占用大量時間進(jìn)行規(guī)范化,特征選擇,維歸約等預(yù)處理操作,數(shù)據(jù)集的清洗與規(guī)范化或許是實(shí)踐中占最多時間的部分,此點(diǎn)不容忽視。同時,數(shù)據(jù)可視化是一種輔助分析的工具,非分析工具,正常的處理流程還要借助傳統(tǒng)的統(tǒng)計手段及其他專業(yè)的知識。總而言之,數(shù)據(jù)可視化作為一種對數(shù)據(jù)信息進(jìn)行專業(yè)化處理的優(yōu)秀工具,其理論與技術(shù)將在未來獲得逐步提升,最終一定會對商業(yè)社會及科研領(lǐng)域的發(fā)展作出重大貢獻(xiàn)。

      參考文獻(xiàn)

      [1]涂子沛.正在到來的數(shù)據(jù)革命:大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.

      [2]陳為,沈則潛,陶煜波.數(shù)據(jù)可視化[M].北京:電子工業(yè)出版社,2013.

      [3][美]Nathan Yau著,向怡寧譯.鮮活的數(shù)據(jù)——數(shù)據(jù)可視化指南[M].人民郵電出版社,2012.

      猜你喜歡
      圖表可視化文本
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運(yùn)行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      基于CGAL和OpenGL的海底地形三維可視化
      在808DA上文本顯示的改善
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      基于doc2vec和TF-IDF的相似文本識別
      電子制作(2018年18期)2018-11-14 01:48:06
      雙周圖表
      足球周刊(2016年14期)2016-11-02 10:54:56
      雙周圖表
      足球周刊(2016年15期)2016-11-02 10:54:16
      雙周圖表
      足球周刊(2016年10期)2016-10-08 18:30:55
      圖表
      世界博覽(2016年16期)2016-09-27 18:25:26
      宜丰县| 庆城县| 平潭县| 海丰县| 榕江县| 石阡县| 遵义县| 江安县| 新安县| 镇平县| 玉山县| 长沙县| 万荣县| 万宁市| 阳春市| 略阳县| 阜阳市| 建昌县| 财经| 珲春市| 丹寨县| 华安县| 渑池县| 来宾市| 乐安县| 卢龙县| 扎囊县| 边坝县| 静海县| 安国市| 河池市| 安康市| 马尔康县| 高要市| 称多县| 云安县| 仙游县| 天全县| 沾益县| 新建县| 呼图壁县|