• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      交互點值圖上的可視化抽象和探索

      2017-05-15 03:49:19肖子達朱立谷
      關鍵詞:密度估計分辨率可視化

      肖子達,朱立谷

      (中國傳媒大學 計算機學院,北京 100024)

      交互點值圖上的可視化抽象和探索

      肖子達,朱立谷

      (中國傳媒大學 計算機學院,北京 100024)

      多類離散數據在地理空間的分布,是地理相關可視化領域研究的熱點。作為此類數據基本可視化呈現方式,點值圖具有直觀、細節(jié)豐富的優(yōu)點,但是亦存在點重疊導致的可讀性差的問題。本文提出了一種按分辨率進行密度估計方法對點值圖進行優(yōu)化,靈活地調節(jié)當前分辨率下取樣參數,以期盡最大可能顯示細節(jié),同時保持各類屬性的相對密度特征;為了彌補取樣導致的離散特征的丟失,我們使用了一系列交互手段,能有效地提高可視分析的準確性并輔助整體的可視表達。本文最后通過實例分析和用戶研究證明了本方法的有效性。

      點值圖;密度估計;地圖信息;交互式數據分析

      1 引言

      多類離散數據在地理空間的分布,是從制圖學、地理信息系統(tǒng)到數據可視化、人機交互領域的學科交叉研究熱點。作為一種最基本的可視化呈現方式,點值圖(dot maps)按照離散數據的地理坐標值直接在地圖上繪制點,具有顯示方式直觀、細節(jié)丟失少的優(yōu)點。但在點數量極多或分布嚴重不均的情況下,該方法亦存在點重疊導致的可讀性差的問題。故而以點值圖為基礎存在多種變形呈現方式。如將離散點轉換成連續(xù)形式表現的等值線圖、熱力圖[1];

      描述區(qū)域內統(tǒng)計值的等值區(qū)域圖、統(tǒng)計地圖[2];以及把統(tǒng)計圖與地圖結合起來的圖表地圖[3]等。雖然這些方法提高了可讀性,但卻普遍存在丟失細節(jié)、忽視離群值的問題。因此在地理相關數據的可視分析領域,解決可讀性與細節(jié)呈現之間的矛盾依然是一大挑戰(zhàn)。

      為了應對這一挑戰(zhàn),需要強化視覺效果方法,目前主要有兩個研究方向[4]:其一是通過采樣和密度映射,重新定位(或移位)數據點,以解決地理空間中的圖元重疊等顯示問題。其二是通過建立數據抽象對象(例如,聚類或分類)以降低數據大小。再通過支持向下鉆取的交互操作以查看細節(jié)。

      受此啟發(fā),本文提出了一種按分辨率進行密度估計方法用以優(yōu)化點值圖?;诘乩頂祿奶攸c,使用核密度估計算法獲取離散數據的地理分布,通過藍噪聲取樣提升地圖密集區(qū)域的呈現水平;根據顯示分辨率的不同,靈活地調節(jié)當前分辨率下取樣參數,以期盡最大可能顯示細節(jié);在探索環(huán)節(jié)中優(yōu)化人機交互過程,使用縮放、選擇、焦點+上下文、更改視覺變量等交互方式輔助分析。本文主要貢獻如下:

      ?在地理空間上提出了一種按地圖分辨率進行密度估計的點值圖優(yōu)化方案

      ?在該方案的基礎上,設計了一個交互式可視化系統(tǒng),用以檢查和分析地理相關的離散數據

      ?通過實際案例說明該方法有效性

      2 相關工作

      地圖是生動描繪地理變化數據的主要方法,在過去30年中發(fā)展起來的地理信息科學將地圖理解為包含點、線和面積的空間模型[5]。對于離散的、地理空間上分布不均的數據,點值圖是一種基礎的、直觀的、細節(jié)豐富的可視化呈現方案。雖然可以將其理解為是2D散點圖在地理空間坐標系下的擴展,但由于地理空間的特殊性,點值圖的點繪制面臨著如下幾個問題:1)如何區(qū)別具有不同屬性值的點;2)如何避免密集的點與地圖背景之間的視覺混淆;3)如何確定點的密度權值,使密度小的地區(qū)能得到表示,而密度大的地區(qū)點子不產生連續(xù)、重疊現象。

      這三個問題是互相關聯的。因為地圖已經使用了位置和大小相關的視覺變量,可用的描述其他屬性的視覺變量就很有限了。首選方案是使用顏色分量,包括亮度、飽和度和色調,用以描述不同類別的數據[6]。次之是調節(jié)點的大小或形狀[7]。同時,地圖背景往往選用單色方案以避免視覺混淆。但是,以上方法并沒能解決點重疊問題,反而因為多種視覺變量的引入使得不同類別的離散數據相互擾亂[8],造成更嚴重的可讀性問題。

      為了優(yōu)化可讀性,現有的解決方案主要分為三類。第一類是更改視覺變量,典型方法如輪廓線、混、顏色交織。但是以上三類方法不能很好地捕捉離群值,并且都存在陳述性誤導[9],對于不同類別之間渲染的順序會導致重疊區(qū)域的變化,不能進行完好的定量分析。對此,Martin等人提出了對齊交織技術[10],將重疊區(qū)域的不同類型點對齊后均勻著色,在高分辨率的情況下具有很好的辨識度,但在低分辨率依然需要改進。

      第二類方案是使用空間變形方法。該方法將密集區(qū)域的點依某種算法移動到臨近的稀疏區(qū)域,以使密度大區(qū)域不出現點重疊。此類方法有Daniel A. 等人提出的Gridfit算法[11],Keim等人提出的廣義散點圖方法[12]等。但這一大類方法直接改變了點的實際分布,雖然可以在一定程度上解決點重疊的問題,但是在需要定量分析的場景是不合適的。

      第三類方案是采用密度估計方法。該方法通過計算地圖上可顯示的最大點數量與所有離散點數量之間的密度函數,以便將實際顯示的點數量控制在合理的范圍內。此類方法一定程度上損失了離群值,但有較好顯示效果。傳統(tǒng)制圖學中很早就提出了使用諾謨圖[13]進行密度估計。Bachthaler等人[14]提出了一個嚴謹、準確、通用的數學模型來創(chuàng)建連續(xù)散點圖。更進一步地,Zinsmaier等人[15]提出采用核密度估計方法來解決點重疊問題。然而,以上方法無法保持多類數據之間的相對密度特征。陳海東等[16]提出的一種基于多類藍噪聲采樣的密度估計方法,能夠減少顯示數據點的數目同時保持不同數據類之間的相對密度特征。

      除了以上三類方案之外,交互技術對改進離散數據的可讀性、增強用戶理解也有著不可忽視的作用。Ellis等人使用取樣鏡頭,一種焦點+上下文技術展示放大的局部取樣數據[17]。Leland等人則主要通過柵格圖特征排序的方式,探索散點圖的分布特征[18]。袁曉如等人[19]提出了一種綜合工具,通過選擇、縮放、拖拽和鏈接,交互地探索散點圖的局部特征??紤]到地圖空間的特殊性,選擇、縮放、概覽+細節(jié)是其中關鍵的交互方法。

      最后,一些混合方法也值得關注。Mayorga 和 Gleicher提出在使用密度估計方法的同時使用輪廓線或者顏色映射來標注離群值,同時用戶可以交互地選擇選舉范圍和呈現方式。雖然這種方法在可視化多類數據點時依然會遇到前文所述的陳述性誤導問題,不能很好地顯示各類屬性的相對密度特征。但是此方案依然很有啟發(fā),即新的研究可以在多種解決方案的綜合、密度估計算法的持續(xù)改進、交互方式的創(chuàng)新上做進一步探索。

      3 點值地圖的優(yōu)化方法

      為了解決點值圖在呈現地理空間上的離散數據分布時的視覺效果問題,我們提出了一種分辨率自適應取樣方法,根據地圖空間分辨率的不同,靈活地調節(jié)當前分辨率下取樣參數,以期盡最大可能顯示細節(jié)。

      此方法與縮放這一交互操作相綁定??s放會將整個視圖按空間分辨率縱向分割[20]。我們使用地圖不同的分辨率θ來限制密度估計的級別。當視圖區(qū)域放大時,更多的點被顯示出來;而當視圖區(qū)域縮小時,一些點就應該由于取樣原則不顯示在這個層級上。

      如前文相關工作一節(jié)所述,密度估計方法會在一定程度上忽略離群值。在本方法的默認情況下,只顯示在當前分辨率下有代表性的離群值。除此以外,還輔助以多種交互方式來輔助用戶探索細節(jié)。下文將從密度估計算法、取樣方法、交互方法三個方面,具體描述該方法。

      3.1 密度估計算法

      分辨率自適應取樣方法的首先要考慮的問題是,以什么樣的密度估計函數將實際顯示的點數量控制在合理的范圍內。核密度估計是依據當前樣本來估計其概率密度函數的經典方法。

      (1)

      其中(x-xi)表示估計點x到樣本點的距離,Kh稱為在帶寬h條件下的核函數,其公式為:

      (2)

      在密度估計中,帶寬h的選擇對于計算的結果影響很大,隨著h的增加,空間上點密度的變化更為光滑,但會掩蓋密度的結構。依據Jones分析幾種生成帶寬h的方法特性[21],我們采用Solve-the-EquationPlug-InApproach。這個方法的主要思想是通過減小漸近均方誤差來獲取最優(yōu)的h值[22]。首先通過插件估算器計算出一個初始密度,再通過迭代算法來求解最優(yōu)帶寬h。

      3.2 取樣方法

      通過對多元數據的密度估計計算,獲得取樣過程所需的區(qū)域估計密度后,就需要選擇取樣方法。

      在過去的幾年中,取樣方法被廣泛地應用在各種可視化技術中,尤其是對于產生擁有藍噪聲特性的取樣方法。藍噪聲的頻譜只擁有最小限量的低頻成分,也沒有能量峰值。藍噪聲的這種特性使得在取樣時沒有低頻導致的混淆現象和雜波導致的間隙,再加上支持重要度取樣、高效的計算特性使得藍噪聲取樣被廣泛研究和應用。Li-YiWei[23]等研究出了兩種針對多數據的藍噪聲采樣方法,這兩種方法一種嚴格控制點之間的距離,一種控制點的數量。

      3.3 交互方法

      結由于密度采樣方法終究會丟失一些細節(jié)和離群值,所以需要以交互方法進行補充,允許用戶探索細節(jié)。以分辨率自適應取樣方法為基礎,我們實現了一個探索離散數據地理分布的數據探索系統(tǒng),其支持的交互方式主要有如下幾類:

      (1)縮放

      在分辨率最小的頂層,點的覆蓋問題也比較突出,使用藍噪聲取樣的取樣率也最低,從而減少數據點提高可讀性。這樣能有效地幫助用戶人員洞察整張地圖的數據特征和分布模式。隨著放大倍數的提升,取樣率逐漸提升,用戶亦可觀察到更多的離散數據地理分布的細節(jié)。

      (2)選擇

      為了方便用戶對不同類別的數據進行定量分析,系統(tǒng)提供一個方形選擇刷,用戶可以通過它選擇數據集中感興趣的數據,如圖 1所示。同時,這個選擇刷還有類似魔術透鏡的功能,可以在選框上實時地顯示當前選擇區(qū)域內各類型數據的量和所占總數的百分比。選擇刷之所以是方形主要是為了方便計算,提示文字直接顯示在方形選擇刷的下方以減少用戶的交互延時。

      圖1 方形選擇刷和定量分析

      (3)焦點+上下文

      該方法一種將焦點視圖和關聯視圖結合在一個可視空間里的呈現。焦點能有效地減少用戶的短期記憶負擔,上下文則潛在地提高用戶的理解和處理信息的能力。我們提供類似取樣鏡頭的方式,當用戶的方形選擇刷停留在某個地理區(qū)域時,可以顯示更高分辨率下的細節(jié),如圖2所示同時提供快照Snapshot,允許用戶記錄當前選擇區(qū)域的細節(jié)視圖。多個快照以排序的柵格圖方式呈現,允許用戶對比不同區(qū)域的細節(jié)。

      (4)重繪圖

      為了更好地對比不同數據類型之間的差別,系統(tǒng)允許用戶將選定的數據類型用點值圖以外的方式展示,如餅圖、熱力圖、等值線圖。RossMaciejewski等人[24]設計了一種熱力圖改進方法能展示單類別的分布密度,這種方法可以輔助用戶獲得單類別的整體信息。等值線圖或者輪廓線則可以配合點值圖使用對比多類數據。在這一過程中,用戶還可以隱藏一些數據類型,專門對比選中的數據類型。

      圖2 在選擇刷中放大分辨率,顯示更多細節(jié)

      4 案例分析

      新案例數據集記錄了4年內北京市區(qū)6000臺ATM機警報設備的數據,每條記錄包括報警類型(3類報警:類型1為攝像頭的報警,類型2為人員手動報警,類型3為震動傳感器的報警)和地理位置的相關字段。

      圖3 低分辨率下北京市區(qū)報警數據,紅、藍、黃點分別為類型1、類型2、類型3報警數據。在密集區(qū)域的點覆蓋導致地理特征不明顯

      圖3是原始數據的地理分布圖。其中紅色代表類型1的報警,藍色代表類型2的報警,黃色代表類型3的報警??梢杂^察到直接投射出現密集地區(qū)點遮蓋問題。這種地圖也無法滿足如下定量分析的要求:不同種類的報警與不同區(qū)域是否相關聯系?

      圖4 低分辨率下取樣后的北京市區(qū)報警數據,可以看到其數據復雜度相對圖3已經有了很好的改善

      通過我們處理的結果(見圖4)可以看出報警類型對的地理分布依賴于城市繁榮度,而繁榮地區(qū)不同網點的ATM設備覆蓋現象又特別多。同圖中可以看到,市區(qū)西北區(qū)域的報警類型3出現更加頻繁,通過后期驗證分析出該區(qū)域報警的設備為同一批次的震動觸發(fā)器,該批次設備中出現故障報警的頻率更加突出。此外我們也發(fā)現取樣使得類型2在城區(qū)南部的分布更加明顯。

      當用戶進行放大操作時,地圖將進入更細致的層次。計算機將依據分辨率重新計算取樣參數以增加展示的樣本點(見圖5)。觀察重新取樣后的區(qū)域西北角,原先模糊的故障類型1(紅色圓點)在該地區(qū)已經形成一個聚合中心,這可能說明了該故障的原因與該區(qū)域有關。在這一層次下,其他零散的數據點依然被取樣過濾。

      5 用戶分析

      在用戶研究中,我們將三種解決地理數據點覆蓋的方法橫向比較:原始的點值圖方法,Ross等人改進的熱力圖方法以及我們的方法。通過兩個實驗評估這三種可視化方法在多類數據環(huán)境下的視覺識別率。

      (1)參與者

      我們從一所大學里召集22名人員參與測試,其中12名為男性,10名為女性??側藬抵杏?名為研究生,其余14名本科生,總體年齡分布在21至27歲之間。所有人都通過顏色辨識能力的測試。

      (2)設備

      測試設備為28寸的LCD顯示器,分辨率3840×2160像素??偣彩褂?0個數據集(包括真實的數據和人造的數據),其中10個數據集供測試1使用,另10個數據集為測試2使用。所有可視化結果的地圖大小都以850×750的像素展示。數據類別的顏色采用CIELAB顏色空間中的高對比度顏色組。

      (3)任務

      測試1通過用戶識別指定區(qū)域內的數據類別數目來衡量方法的準確率。我們將10個數據集隨機排序。每個測試人員進行4次測試。每次測試中識別正確的結果計分為1,識別錯誤的結果計分為0,最后統(tǒng)計累計分數。

      測試2讓用戶選擇指定區(qū)域的數據密度分布的順序,順序由4個備選答案提供。同測試1的評估方式一致,我們將剩余未使用的10個數據集隨機排序組合。同時也使用一致的評分策略。

      (4)過程

      在測試前,我們將向參與人員簡要描述測試內容以及系統(tǒng)的使用方法,并要求其完成一份測試前問卷調查。參與測試的人員在依此進行完兩個任務后,還需完成測試報告,其中包括可視分析和視覺認知相關的評估內容。

      (5)結果分析

      表1展示出測試中3種方法的平均識別成功率,我們的方法相比其他兩種方法有著顯著的提高。傳統(tǒng)的點值圖的方法在測試結果中得分最低。其隨后的人員報告也指出,原始地圖高密度區(qū)域的大面積覆蓋問題使得測試人員基本只能依據猜測來進行分析多類數據的分布。雖然熱力圖能夠有效地顯示密度特征,但是在多類數據探索上就出現了問題,其使用不同的可視變量來描述多元數據的方法使得多元數據在地圖上展示不一致,進而影響了不同類別的定量比較。

      表1 3種方法的平均分數

      6 總結和討論

      本文提供了一種多類離散數據的地理空間分布的可視化呈現方法。我們對傳統(tǒng)點值圖進行了視覺效果優(yōu)化,采用分辨率自適應取樣方法,根據地理空間分辨率的不同,靈活地調節(jié)當前分辨率下取樣參數,以期盡最大可能顯示細節(jié)。其中所采用的藍噪聲取樣法優(yōu)化了數據點的重分布過程,在有效地解決點覆蓋的問題的同時保持不同數據類之間的相對密度特征,不會因為不同類別的數據點的渲染順序問題導致呈現效果大相徑庭。為了彌補取樣導致的離散特征的丟失,我們使用了一系列交互手段,能有效地提高可視分析的準確性并輔助整體的可視表達。

      本方法也有很多值得改進的方面。首先是所采用基于藍噪聲采樣的密度估計方法,依然會損失離群值。因此算法方面依然可以繼續(xù)改進。其次,該方法只使用了顏色來區(qū)分不同的類別,配合其他視覺變量,如點的大小、形狀或透明度,或許可有更好的效果。最后,本系統(tǒng)所采用的交互操作還是較為簡單。如選擇操作只提供了方形選擇刷,限制了用戶選擇查看區(qū)域的方式。在未來的工作中,還可以在交互方面做進一步改進,例如允許用戶引入自定義的任意形狀的選擇工具,做進一步的細節(jié)分析。

      [1]Wilkinson L and M Friendly.The History of the Cluster Heat Map[J]. Zitiert auf,2012:7.

      [2]Dorling D.WORLDMAPPER:the world as you ve never seen it before[J]. IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS,2006,5(12):757-764.

      [3]Fuchs G and H Schumann.Visualizing abstract data on maps[J].IEEE,2004,139-144.

      [4]Diansheng Guo,J C A M.A Visualization System for Space-Time and Multivariate Patterns[J]. IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS,2006,6(12):1461-1476.

      [5]Kwakkel,J H,et al.Visualizing geo-spatial data in science,technology and innovation[J]. Technological Forecasting and Social Change,2014,81:67-81.

      [6]BREWER,C A.Chapter 7 - Color Use Guidelines for Mapping and Visualization[M].Academic Press,1994.

      [7]Li J,J Martens and J J van Wijk. A model of symbol size discrimination in scatterplots[J]. 2010:ACM.

      [8]Luboschik M,A Radloff and H Schumann.A new weaving technique for handling overlapping regions[J]. ACM,2010,25-32.

      [9]Mayorga A and M Gleicher.Splatterplots:Overcoming Overdraw in Scatter Plots[J]. IEEE Transactions on Visualization and Computer Graphics,2013,19(9):1526-1538.

      [10]Luboschik M,A Radloff and H Schumann.A new weaving technique for handling overlapping regions[J]. ACM,2010,25-32.

      [11]The Gridfit Algorithm:An Efficient and Effective Approach to Visualizing Large Amounts of Spatial Data[Z].

      [12]Keim D A,et al.Generalized scatter plots[J]. Information Visualization,2010, 9(4):301-311.

      [13]Evesham H A.Origins and development of nomography[J]. IEEE Annals of the History of Computing,1986(4):324-333.

      [14]Bachthaler S and D Weiskopf.Efficient and Adaptive Rendering of 2-D Continuous Scatterplots[A]. 2009,Wiley Online Library,743-750.

      [15]Zinsmaier M,et al.Interactive level-of-detail rendering of large graphs[J]. Visualization and Computer Graphics,IEEE Transactions on,2012,18(12):2486-2495.

      [16]Chen H,et al.Visual Abstraction and Exploration of Multi-class Scatterplots[J]. IEEE Transactions on Visualization and Computer Graphics,2014,20(12):1683-1692.

      [17]Ellis G,E Bertini and A Dix. The sampling lens:making sense of saturated visualisations[J]. in CHI '05 Extended Abstracts on Human Factors in Computing Systems,Portland,OR,USA:ACM.

      [18]Wilkinson L,A Anand and R Grossman.High-dimensional visual analytics:Interactive exploration guided by pairwise views of point distributions[J]. Visualization and Computer Graphics,IEEE Transactions on,2006,12(6):1363-1372.

      [19]Yuan X,et al.Dimension projection matrix/tree:Interactive subspace visual exploration and analysis of high dimensional data[J]. Visualization and Computer Graphics,IEEE Transactions on,2013,19(12):2625-2633.

      [20]Cockburn A,A Karlson and B B Bederson.A review of overview+detail,zooming,and focus+context interfaces[J]. ACM Comput Surv,2009,41(1):1-31.

      [21]Jones M C,J S Marron and S J Sheather.A brief survey of bandwidth selection for density estimation[J]. Journal of the American Statistical Association,1996,91(433):401-407.

      [22]Alexandre L A.A Solve-the-Equation Approach for Unidimensional Data Kernel Bandwidth Selection[Z]. 2008.

      [23]Wei L. Multi-class blue noise sampling[J]. in ACM SIGGRAPH 2010 papers,Los Angeles,California:ACM.

      [24]Maciejewski R,et al. Understanding syndromic hotspots - a visual analytics approach[J]. in Visual Analytics Science and Technology,IEEE Symposium on,2008.

      (責任編輯:馬玉鳳)

      Visual Abstraction and Exploration of Interactive Dot Map

      XIAO Zi-da,ZHU Li-gu

      (Computer Science School,Communication University of China,Beijing 100024)

      The distribution of multiclass discrete data in geographic space is a research hotspot in the field of geographic-related visualization. As a basic visual presentation of such data,the advantages of dot maps are perceptual intuition and abundant details,but there is also the problem of poor readability due to the points overlap. The approach of density estimation by resolution is proposed in this paper to optimize dot maps,and to flexibly adjust sampling parameters of the current resolution,so as to show the details to the maximum extent and maintain the relative density characteristics of various types of property. In order to compensate the missing discrete features caused by sampling,a series of interactive tools are used to effectively improve the accuracy of visual analysis and assist the overall visual representation. Finally,the effectiveness of this approach is proved through case analysis and user research.

      dot maps,density estimation,geographic information,interactive data analysis

      2016-6-13

      肖子達(1992-),男(漢族),湖南長沙人,中國傳媒大學計算機學院碩士研究生.E-mail:shawzida@gmail.com

      TP302.1

      文章編號:1673-4793(2017)02-0046-07

      猜你喜歡
      密度估計分辨率可視化
      中國人均可支配收入的空間區(qū)域動態(tài)演變與差異分析
      m-NOD樣本最近鄰密度估計的相合性
      面向魚眼圖像的人群密度估計
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      基于MATLAB 的核密度估計研究
      科技視界(2021年4期)2021-04-13 06:03:56
      基于CGAL和OpenGL的海底地形三維可視化
      EM算法的參數分辨率
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      原生VS最大那些混淆視聽的“分辨率”概念
      长泰县| 宝兴县| 阜宁县| 河南省| 香格里拉县| 达尔| 民县| 麟游县| 和硕县| 宝鸡市| 揭阳市| 泸州市| 永和县| 博乐市| 南雄市| 邳州市| 汽车| 张北县| 九龙县| 嘉兴市| 黄冈市| 囊谦县| 买车| 福海县| 江达县| 灯塔市| 固始县| 黑河市| 家居| 石阡县| 亳州市| 安宁市| 紫阳县| 西贡区| 尼玛县| 柳州市| 开封市| 金乡县| 繁峙县| 天全县| 东阿县|