管新云
摘要:1987年,在美國(guó)國(guó)家科學(xué)基金會(huì)召開(kāi)的“科學(xué)計(jì)算可視化研討會(huì)”中首次提出”可視化”。隨著時(shí)間的發(fā)展,大數(shù)據(jù)已經(jīng)成為社會(huì)發(fā)展的重要生產(chǎn)因素,科學(xué)計(jì)算可視化已經(jīng)成為一個(gè)十分活躍的研究領(lǐng)域,對(duì)數(shù)據(jù)可視化的研究已經(jīng)普及到各個(gè)行業(yè)之中?!癢e Are Social”和“Hootsuite”發(fā)布了2018全球數(shù)字報(bào)告,報(bào)告指出全球互聯(lián)網(wǎng)用戶(hù)數(shù)已突破40億,這意味著全球有一半人口“觸網(wǎng)”。全球76億人中,約2/3已經(jīng)擁有手機(jī),且超過(guò)半數(shù)為“智能型”設(shè)備,因此人們可以隨時(shí)隨地、更加輕松地獲取豐富的互聯(lián)網(wǎng)體驗(yàn)。與此同時(shí),他們變成了龐大的信息數(shù)據(jù)來(lái)源,構(gòu)建了全球互聯(lián)網(wǎng)數(shù)據(jù)信息資源庫(kù)。在處理如此龐大數(shù)據(jù)量的時(shí)候,我們不得不使用各種各樣的分析模型,可視化正是模型分析最主要的表現(xiàn)形式。數(shù)據(jù)通過(guò)圖像展示在決策者眼前,使他們可以更加直觀、清晰了解數(shù)據(jù)分析的整個(gè)過(guò)程和結(jié)果,讓數(shù)據(jù)的規(guī)律變得有跡可循。
關(guān)鍵詞:數(shù)據(jù);可視化;計(jì)算機(jī);格式塔理論;信息設(shè)計(jì);可視化設(shè)計(jì)
一、視覺(jué)的感知與認(rèn)知
(一)視覺(jué)的感知與認(rèn)知
圖形化的感知必須提前到1912年由韋特海墨(M,Wetheimer)提出的格式塔(Gestalt)理論,也被稱(chēng)為完形心理學(xué)。Gestaltd是音譯詞,意思即是”完形”,格式塔強(qiáng)調(diào)的是整體的、有組織的心理學(xué)理論體系。人們?cè)谟^察事物時(shí),經(jīng)常會(huì)對(duì)事物進(jìn)行感性的分組,實(shí)際上單個(gè)事物本身并不具有分組的意義。格式塔的意思是感知的事物大于眼睛看到的事物,個(gè)體所感知到的對(duì)象不是孤立的,而是通過(guò)相關(guān)的關(guān)聯(lián)性和其他元素構(gòu)成了一個(gè)整體,局部過(guò)程取決整體的內(nèi)在特性。
格式塔理論的發(fā)明者把這些原則分為五類(lèi):
(1)Proximity(接近)原則
當(dāng)物品散落分布的時(shí)候,個(gè)體各自分布,不會(huì)當(dāng)成一個(gè)整體。當(dāng)這些個(gè)體有規(guī)律的排列,按照運(yùn)動(dòng)規(guī)律分布的時(shí)候,人眼的目光,自動(dòng)將它們視做一個(gè)整體看待。
在情報(bào)信息平臺(tái)中,圖1的信息的陳列正是采用了這種規(guī)律,相同的信息按照接近原則分組,被放置在同一個(gè)區(qū)域內(nèi)的信息自然會(huì)被看成一組信息。
(2)Similarity(相似)原則
相似原則指的是,在相同的經(jīng)驗(yàn)情況下,當(dāng)兩個(gè)物體看上去比較相似的時(shí)候,我們會(huì)主動(dòng)聯(lián)想成為同一類(lèi)事物。這種聯(lián)想是根據(jù)用戶(hù)的以往經(jīng)驗(yàn)來(lái)進(jìn)行判斷的,在這種情感認(rèn)知下,用戶(hù)首先看到的是一個(gè)形狀,其次才是構(gòu)成元素。
用詞云建模人物畫(huà)像時(shí),正是運(yùn)用了這種相似原則。首先看到的是一個(gè)人物的形象,再去仔細(xì)觀察構(gòu)成人物的形象具體詞匯,研究其中的特質(zhì)。在數(shù)據(jù)經(jīng)過(guò)一系列的分析、提取后,在由人物模型把背后的數(shù)據(jù)抽象展示出來(lái)出來(lái),替代為關(guān)鍵詞組建一個(gè)完整的、可感知的具體人物形象。
(3)Closure(閉合)原則
在人們觀察殘缺圖形時(shí)候,會(huì)主動(dòng)將殘缺部分補(bǔ)全,將缺失的一部分也作為一個(gè)整體來(lái)對(duì)待。圖3可見(jiàn),雖然圖形都有缺失,可是我們?nèi)匀荒芊直嫠且粋€(gè)幾何圖形。
(4)Continuity(連續(xù))原則
在信息平臺(tái)中,活動(dòng)軌跡和區(qū)域范圍,視線引導(dǎo)用戶(hù)將定位點(diǎn)連接成一個(gè)完整路徑。這是因?yàn)樵谟^察連續(xù)圖案時(shí),人們的視覺(jué)焦點(diǎn)會(huì)沿著散點(diǎn)分布形成的連續(xù)性曲線而追尋目標(biāo)方向。當(dāng)數(shù)據(jù)量過(guò)大時(shí),這種觀察方式會(huì)出現(xiàn)誤導(dǎo),需要借助顏色來(lái)區(qū)分多軌跡路徑的追尋。
(5)common fate(共勢(shì))原則
當(dāng)事物按照一定的規(guī)律組合排列的時(shí)候,人們會(huì)根據(jù)這種規(guī)律將事物自動(dòng)分組,這種分組方式就是共勢(shì)原則。圖6的文字按照字母的形狀進(jìn)行排練組合,但是用戶(hù)的眼睛,第一眼還是觀察到整個(gè)單詞和不是具體的一個(gè)組成文字。在圖7中,紅色和黑色的原點(diǎn)根據(jù)不同的運(yùn)動(dòng)軌方向,組成一條運(yùn)動(dòng)軌跡。
(二)顏色
在信息設(shè)計(jì)和視覺(jué)設(shè)計(jì)中,色彩是用來(lái)展示信息分類(lèi),表達(dá)情緒的最重要途徑。
顏色可以代表數(shù)據(jù)信息,展示數(shù)據(jù)分類(lèi),在多種數(shù)據(jù)匯聚的展示中,運(yùn)用顏色來(lái)區(qū)分信息層級(jí)。顏色和形狀結(jié)構(gòu)是最重要的視覺(jué)可視化手段,信息界面的展示也是依賴(lài)這色彩構(gòu)成的視覺(jué)美感,這都來(lái)自于設(shè)計(jì)者對(duì)于色彩和信息的理解與感受。
二、數(shù)據(jù)可視化的基礎(chǔ)
(一)數(shù)據(jù)可視化基本流程
數(shù)據(jù)可視化的處理包括:數(shù)據(jù)人庫(kù)、數(shù)據(jù)過(guò)濾、數(shù)據(jù)映射、數(shù)據(jù)繪制??梢暬淖罱K結(jié)果是由人機(jī)交互共同完成的。數(shù)據(jù)的人庫(kù)是整個(gè)流程的開(kāi)始,界面的交互成果是最終的處理成果。從數(shù)據(jù)到知識(shí)有兩個(gè)途徑:交互的可視化方法和自動(dòng)的數(shù)據(jù)挖掘方法。兩種結(jié)果分別是數(shù)據(jù)可視化交互和數(shù)據(jù)可視化建模,這兩種方式,用戶(hù)即參與了交互又可以調(diào)整數(shù)據(jù)輸入,獲得不同的結(jié)果。
(二)數(shù)據(jù)可視化中的數(shù)據(jù)
數(shù)據(jù)根據(jù)可視化展示的數(shù)據(jù),主要分為四類(lèi):
(1)類(lèi)別型的數(shù)據(jù)。例如:根據(jù)性別要求,可以將人分為男性和女性;水果可以分為西瓜和香蕉。這種分類(lèi)可以將事物進(jìn)行分組,但卻沒(méi)有辦法進(jìn)行數(shù)量的統(tǒng)計(jì)。西瓜和香蕉分了類(lèi),缺不知道西瓜的總量是多少,大小有多少。
(2)序列數(shù)據(jù)。用1.2.3…來(lái)進(jìn)行排名,1表示西瓜2表示香蕉,1的序列代表西瓜在最靠前以此類(lèi)推,往下進(jìn)行排序。這種排序方式可以得到事物的分落序列,但仍無(wú)法得出是按照量的多少進(jìn)行排列,還是按照大小進(jìn)行排列。
(3)區(qū)間型數(shù)據(jù)。區(qū)間型數(shù)據(jù)可以用來(lái)區(qū)分?jǐn)?shù)據(jù)間的定量比較,比如10°的水和30°水的差距,是與40°與50°一致的,因?yàn)樗麄兌际歉鶕?jù)一個(gè)數(shù)據(jù)起點(diǎn)值來(lái)進(jìn)行比較。
(4)倍數(shù)型的數(shù)據(jù)。用來(lái)進(jìn)行比例的比較,比如1:2的比例,4是2的倍數(shù),這樣成倍數(shù)進(jìn)行統(tǒng)計(jì)。
三、信息平臺(tái)中的可視化應(yīng)用分類(lèi)
在信息平臺(tái)中可視化的應(yīng)用場(chǎng)景主要有三類(lèi):(1)時(shí)空數(shù)據(jù)的可視化應(yīng)用;(2)地理信息;(3)非時(shí)空數(shù)據(jù)的可視化。非時(shí)空數(shù)據(jù)主要是文字編輯類(lèi)信息,例如:文本、表格,還有一些跨煤體的數(shù)據(jù)可視化、還有復(fù)雜多元數(shù)據(jù)的可視化展示。
時(shí)間是觀察和研究數(shù)據(jù)的重要構(gòu)成因素。根據(jù)時(shí)間的變化數(shù)據(jù)隨之改變,這種數(shù)據(jù)被稱(chēng)之為時(shí)變型數(shù)據(jù)。時(shí)變型數(shù)據(jù)數(shù)量大、變數(shù)多,而且種類(lèi)復(fù)雜多樣,分布的范圍也非常的廣泛。時(shí)變順序可以作為時(shí)變型數(shù)據(jù)的時(shí)間軸變量,時(shí)間抽上的每個(gè)變量都是針對(duì)具體的事件而產(chǎn)生。我們生活在一個(gè)三維場(chǎng)景之中,信息數(shù)據(jù)通常這些數(shù)據(jù)包括了地理位置信息,還有活動(dòng)時(shí)間信息。時(shí)空信息的數(shù)據(jù)是可視化研究的重要對(duì)象,現(xiàn)在移動(dòng)設(shè)備和電子產(chǎn)品的傳感器時(shí)刻都在傳輸數(shù)據(jù)信息,海量的數(shù)據(jù)匯聚,為數(shù)據(jù)可視化的研究提供了更多的可能和挑戰(zhàn)。
地理信息數(shù)據(jù)有一個(gè)邏輯層次,比如,北京市是屬于中國(guó),中國(guó)有若干個(gè)省市,這種層次具有包含關(guān)系,主要變現(xiàn)在包含和從屬。這種層次結(jié)構(gòu)是我們理解事物,對(duì)世界認(rèn)知的基礎(chǔ)。信息通過(guò)層次展示,有助于我們理解和接納大量多維度、多層次的知識(shí)。
文本和文檔信息在人們的工作之中無(wú)處不在,郵件、新聞、工作報(bào)告等都是日常工作中需要處理的文本信息。文本信息的增長(zhǎng)和加快是爆發(fā)式的,人們需要有更高效的處理方式,來(lái)讓文本閱讀和分析變得簡(jiǎn)單。文本信息的處理方式有三部分:文本信息的挖掘、可視化圖形的繪制和人機(jī)交互。文本信息的可視化是不具有空間屬性的科學(xué)可視化,把沒(méi)用空間結(jié)構(gòu)屬性的文本信息轉(zhuǎn)換為用戶(hù)可以接受的二維或者三維空間表達(dá)才是文本可視化的研究目的,也是一個(gè)極大的挑戰(zhàn)。
四、結(jié)語(yǔ)
“數(shù)據(jù)可視化”是一個(gè)十分活躍的研究領(lǐng)域,新的分支也在不斷的衍生,可視化的研究也永不會(huì)停止腳步??梢暬c應(yīng)用領(lǐng)域的結(jié)合才是對(duì)可視化重視,投入到生產(chǎn)工作,使其產(chǎn)生價(jià)值的最終方式。多源數(shù)據(jù)的分析應(yīng)用,才是推動(dòng)可視化發(fā)展的動(dòng)力,也為可視化提供了更多的可能,更大的挑戰(zhàn)。希望大家可以重視可視化、多做有用的研究,為可視化的發(fā)展提供更多更優(yōu)秀的展示方式。
參考文獻(xiàn)
[1]We Are Social[EB/OL].2018年全球數(shù)字報(bào)https://www.useit.com.cn/thread-17902-1-1.html.
[2]唐澤圣,陳為.可視化條目[M].中國(guó)計(jì)算機(jī)大百科全書(shū),2011.
[3]石教英,蔡立文.科學(xué)計(jì)算機(jī)可視化算法系統(tǒng)[M].北京科學(xué)出版社,1996.
[4]陳為,沈則潛,陶煜波等[J].數(shù)據(jù)可視化,2013(12).
[5]崔屹.圖像處理技術(shù)與應(yīng)用[M].電子工業(yè)出版社,1997.