魏麗麗 杜長海 徐立松 重慶市公安局
近年來,全球的數(shù)據(jù)量以每年58%的速度增長,在未來這個速度將會更快。如果按照現(xiàn)在存儲容量每年40%的增長速度計算,預計到2017年底需要存儲的數(shù)據(jù)量甚至會大于存儲設(shè)備的總?cè)萘?。IDC報告預計顯示,從2010年到2020年全球數(shù)據(jù)量將有50倍的增長,達到40ZB的數(shù)量級(相當于4.4萬億GB,相當于430億塊1TB硬盤),這一數(shù)據(jù)量將是2011年的44倍。如何利用大數(shù)據(jù)解決科學、醫(yī)療、能源、商業(yè)、政府管理、城市建設(shè)等領(lǐng)域的諸多問題,是全世界面臨的巨大挑戰(zhàn)。
大數(shù)據(jù)正在滲透到社會組織的每一個細胞,幾乎對所有行業(yè)產(chǎn)生顛覆性和革命性的影響。但僅僅擁有大數(shù)據(jù)是不夠的,特別是在數(shù)據(jù)質(zhì)量不高的情況下,海量數(shù)據(jù)產(chǎn)生的同時也產(chǎn)生了大量的數(shù)據(jù)噪音,如果不對大數(shù)據(jù)進行有效的管理和分析,那么將無法讓大數(shù)據(jù)真正發(fā)揮作用,這是學術(shù)界和業(yè)界共同面臨的重大課題,也是大數(shù)據(jù)真正從上層構(gòu)建到底層實現(xiàn)的關(guān)鍵問題。在云計算及大數(shù)據(jù)背景下,可視化技術(shù)作為一種有效的數(shù)據(jù)分析手段越來越受到重視,成為越來越多學者的關(guān)注焦點。
可視化(Visualization)是對數(shù)據(jù)及計算結(jié)果進行深入分析,以獲得對數(shù)據(jù)的理解和洞察,實現(xiàn)把計算中所涉及的和所產(chǎn)生的數(shù)字信息轉(zhuǎn)變?yōu)橹庇^的、以圖像或圖形信息表示的、隨時間和空間變化的物理現(xiàn)象或物理量呈現(xiàn)在專業(yè)人員面前,使其能夠觀察到模擬和計算過程,即看到傳統(tǒng)意義上不可見的事物或現(xiàn)象,并提供與模擬和計算的視覺交互的手段??梢暬哪康氖且揽咳说膹姶蟮囊曈X能力,促進對所觀察的數(shù)據(jù)更深一層的了解,培養(yǎng)出對新的潛在過程的洞察力。可視化技術(shù)是科學計算與圖形圖像技術(shù)的結(jié)合,它涉及到科學與工程計算、計算機圖形學、圖像處理、人機界面等多個學科和技術(shù)領(lǐng)域。作為一種新興的技術(shù),自面世以來獲得了飛速的發(fā)展,在各學科中得到了廣泛應用。隨著大數(shù)據(jù)時代的來臨,可視化技術(shù)產(chǎn)生了越來越多的研究方向,其中最有代表性的方向包括數(shù)據(jù)可視化、科學計算可視化、信息可視化、知識可視化等。
交通流數(shù)據(jù)的分析處理技術(shù)是智慧交通信息處理的核心內(nèi)容之一,支撐著交通各系統(tǒng)間的協(xié)同運作,其技術(shù)水平的發(fā)展決定了智慧交通系統(tǒng)服務水平。以交通管理與規(guī)劃為例,智慧交通在該領(lǐng)域主要包括三個方面:先進的交通管理系統(tǒng)、交通基礎(chǔ)設(shè)施智能監(jiān)控系統(tǒng)、交通運輸規(guī)劃決策支持系統(tǒng)。其中多手段、全方位的交通信息采集與路網(wǎng)狀態(tài)監(jiān)控系統(tǒng),自動化的卡口監(jiān)測系統(tǒng)以及各類先進的電子警察監(jiān)測系統(tǒng)等子系統(tǒng)回傳了海量動態(tài)交通流數(shù)據(jù)。以電子牌數(shù)據(jù)為例,截至2016年6月,重慶市主城區(qū)共有500余個采集點,每天約產(chǎn)生千萬條數(shù)據(jù)記錄,信息量每年將產(chǎn)生30多億條。又如在服務內(nèi)容豐富的出行者服務領(lǐng)域,實時交通數(shù)據(jù)流處理技術(shù)是智能交通流誘導系統(tǒng)與車載導航系統(tǒng)發(fā)布與接收實時路況、交通管制、動態(tài)路徑誘導的基礎(chǔ)。在傳統(tǒng)智能交通中,注重采用自動功能取代人工方式,如車輛的自動收費、車牌識別、圖像對比等功能。在新技術(shù)不斷涌現(xiàn)的背景下,顯然這些已經(jīng)不能滿足交通管理部門的需求,而現(xiàn)代的智慧交通則提供基于實時交通數(shù)據(jù)的交通信息服務,融入了物聯(lián)網(wǎng)、云計算等高新信息技術(shù)來匯集交通信息、大量使用數(shù)據(jù)模型、數(shù)據(jù)挖掘等數(shù)據(jù)處理技術(shù)。
傳統(tǒng)交通信息管理中粗略的信息發(fā)布及簡單的交通流量預測已經(jīng)不能滿足現(xiàn)代智慧交通的需求,需要一種更先進的技術(shù),可視化技術(shù)以其直觀明確的圖形優(yōu)勢受到越來越多的重視。交通可視化是可視化技術(shù)的重要應用領(lǐng)域?,F(xiàn)代智慧交通與傳統(tǒng)智能交通體系研究內(nèi)容如圖1所示。
交通信息數(shù)據(jù)具備大數(shù)據(jù)的四個基本方面:海量(Volume)、多樣性(Variety)、快速(Velocity)、價值(Value)。數(shù)據(jù)的量指交通信息數(shù)據(jù)是海量的;數(shù)據(jù)的多樣性指交通信息由大量的檢測設(shè)備和手段提供大量數(shù)據(jù),同時數(shù)據(jù)采集范圍遍布城市的各個角落,處處都在產(chǎn)生數(shù)據(jù);數(shù)據(jù)的速度指得益于現(xiàn)在的計算機信息系統(tǒng),獲得這些交通信息數(shù)據(jù)的速度是非??焖俚?;數(shù)據(jù)的價值指這些交通信息數(shù)據(jù)的價值是非常高的,從數(shù)據(jù)中可以挖掘出管理城市交通所需的信息??梢暬侵腔劢煌ǖ闹匾卣鳌Mㄟ^采用轉(zhuǎn)化為圖形、圖像的可視化方法,大量的交通數(shù)據(jù)形成人機交互,精度高、可靠、高效的可視化交通信息。進而了解其內(nèi)部的規(guī)律。交通流可視化仿真能夠?qū)⒔煌ǚ抡鏀?shù)據(jù)通過計算機系統(tǒng)和圖形顯示系統(tǒng)直觀的顯示出來,從而使交通管理控制人員能夠方便地獲取城市交通的運行狀況,及時準確地發(fā)出交通控制指令,保證城市交通的安全和暢通。
交通流數(shù)據(jù)可視化系統(tǒng)總體框架如圖2所示。
其中,基于降維映射的數(shù)據(jù)可視化是一類有效的多維數(shù)據(jù)可視化技術(shù),該類技術(shù)將多維數(shù)據(jù)集看做一個整體,采用最優(yōu)化方法在低維可視空間中對數(shù)據(jù)集的內(nèi)在結(jié)構(gòu)特征及拓撲關(guān)系進行直觀展現(xiàn),比如:主成分分析法(PCA)對維進行線性組合,抽取其中包含信息最多(具有最大分散性)且相互獨立的少數(shù)“優(yōu)勢維”表現(xiàn)多維數(shù)據(jù);多維尺度變換法(MDS)使用點間距離良好近似高維數(shù)據(jù)的相異度,在低維空間重建多維數(shù)據(jù);自組織映射法(SOM)采用神經(jīng)網(wǎng)絡(luò)鄰域?qū)W習方法重新組合產(chǎn)生“新維”,以表達原始多維數(shù)據(jù);等距映射法(ISOMAP)以及局部線性嵌套法(LLE)使用是流形學習算法以領(lǐng)域圖最短路徑的長度逼近全局測地距離作為MDS算法輸入等。雖然該類技術(shù)能有效解決“維數(shù)災難”(the curse of dimensionality)問題,在很多實際問題中得到了成功的應用,但由于其計算復雜度較高,不適合可視化海量數(shù)據(jù)流,而且該技術(shù)是在盡量保持數(shù)據(jù)集主要特征的基礎(chǔ)上降低維度,進而將多維數(shù)據(jù)在二、三維可視空間中進行展現(xiàn),因此其無法直觀體現(xiàn)數(shù)據(jù)流中多維對象在各維度上的分布情況。
由于交通運輸系統(tǒng)屬于離散事件系統(tǒng),系統(tǒng)的內(nèi)部狀態(tài)變化是隨機的,同一內(nèi)部狀態(tài)可以向多種狀態(tài)轉(zhuǎn)變,很難用函數(shù)形式來描述系統(tǒng)內(nèi)部狀態(tài)的變化,只能掌握系統(tǒng)內(nèi)部狀態(tài)變化的統(tǒng)計規(guī)律。
以城市交通領(lǐng)域的背景知識為基礎(chǔ),充分理解用戶對海量數(shù)據(jù)流動的實時決策需求;分析海量多維查詢結(jié)果集的整體結(jié)構(gòu)、各維的分布特征及聚類情況等信息,優(yōu)化原數(shù)據(jù)空間維與各維度起始面的對應關(guān)系、改善維度軸排列順序;加強對分類數(shù)據(jù)的處理能力,結(jié)合多維復雜數(shù)據(jù)的降維方法與最優(yōu)化層次關(guān)系設(shè)計,以動態(tài)交互的方式增強用戶對數(shù)據(jù)分析的認知能力,從而最終提高交通決策的準確性和實時性。交通數(shù)據(jù)流可視化整體研究方案邏輯結(jié)構(gòu)如圖3所示。
以用戶為中心,針對不斷變化的交通數(shù)據(jù)流查詢結(jié)果,采用靜態(tài)圖表和動態(tài)交互相結(jié)合的方法進行可視化分析,通過刺激用戶的視覺思維以輔助交通業(yè)務決策。通過對同一結(jié)果集多視圖展示,使用戶可以擁有多個單一結(jié)果集的同步視圖,并允許其以點擊或圈取的形式選擇特定的數(shù)據(jù)點,進行可視化分析。
通過海量交通數(shù)據(jù)流可視化分析,呈現(xiàn)交通數(shù)據(jù)流查詢結(jié)果集的內(nèi)涵,把握數(shù)據(jù)“全局”與“局部”的關(guān)系,合理劃分數(shù)據(jù)的重要程度,兼顧交互的層次感與時間維度的動態(tài)展示,進而挖掘出隱藏在大數(shù)據(jù)內(nèi)部的規(guī)律,為城市交通業(yè)務提供實時決策。
在海量數(shù)據(jù)環(huán)境下,多維交通數(shù)據(jù)流可視分析的可擴展性、多級層級的深度與復雜性也隨之增大。在繼承關(guān)系復雜且深度大的層次關(guān)系中巡游與搜索最優(yōu)解是其可擴展性分析的主要挑戰(zhàn);同時研究如何通過可視化來清晰地表示證據(jù)和數(shù)據(jù)的不確定性,充分考慮數(shù)據(jù)的分布情況,幫助用戶了解風險,從而幫助用戶選擇正確的參數(shù),減少產(chǎn)生誤導性結(jié)果。
采用高效的實時圖形可視化技術(shù),可改善人機交互過程中的用戶體驗、提高海量交通數(shù)據(jù)流直觀分析效率和準確度;海量交通數(shù)據(jù)流可視化分析,不僅能夠呈現(xiàn)交通數(shù)據(jù)流查詢結(jié)果集的內(nèi)涵,而且可以把握數(shù)據(jù)“全局”與“局部”的關(guān)系,合理劃分數(shù)據(jù)的重要程度,兼顧交互的層次感與時間維度的動態(tài)展示,進而挖掘出隱藏在大數(shù)據(jù)內(nèi)部的規(guī)律,為城市交通業(yè)務提供實時決策??梢暬夹g(shù)對智慧交通體系能夠帶來以下價值:
(1)降低惡性交通事故頻率,減少因事故造成死亡人數(shù),通過監(jiān)控系統(tǒng)收集車輛信息并且實時分析,能夠?qū)κ鹿矢甙l(fā)車輛進行行為監(jiān)控。
(2)降低道路擁堵率,通過路況監(jiān)控設(shè)備收集路況信息并實時處理,能夠精確繪制道路擁堵線圖,提供交管部門快速處理突發(fā)事故,并提供給大眾平臺供駕駛員參考從而疏導車流。
總之,交通是工業(yè)化進程中經(jīng)濟運行的動脈,智慧交通是智慧城市的重要組成部分。通過物聯(lián)網(wǎng)前端數(shù)據(jù)采集以及視頻監(jiān)控,采集各個道路視頻攝像頭信息,對比歷史記錄,對實時車流、人流進行分析,可以計算和預測該路段當前、未來的交通情況,也可以動態(tài)調(diào)整交通狀況并實時預警,體現(xiàn)了大數(shù)據(jù)可視化在智慧交通領(lǐng)域的應用價值和發(fā)展前景。
[1] Anwar A, Nagel T, Ratti C. A Simple Visualization Technique to Support Traffic Incident Analysis, Pacific Visualization Symposium(Pacific Vis), Yokohama, 2014, IEEE: 316-319.
[2] Zhang X, Li N, Cao C, et al. Traffic Flow Visualization Based on Line Integral Convolution. International Symposium on Optoelectronic Technology and Application 2014. International Society for Optics and Photonics, 2014: 930133-930133-6.
[3] O'Brien W J, Mandali Y, Goyat J, et al. An Integrated Visualization Technique for Transportation Management Planning in Highway Infrastructure Projects. Transportation Research Board 94th Annual Meeting. 2015 (15-3148).
[4] Song Y, Miller H J. Exploring Traffic Flow Databases Using Spacetime Plots and Data Cubes. Transportation, 2012, 39(2): 215-234.
[5] Zahran E S M, Smith M J, Bennett L D. 3D Visualization of Traffic-Induced Air Pollution Impacts of Urban Transport Schemes.Journal of Computing in Civil Engineering, 2012, 27(5): 452-465.
[6] Sewall J, Van Den Berg J, Lin M C, and et al. Virtualized Traffic:Reconstructing Traffic Flows from Discrete Spatiotemporal Data.Visualization and Computer Graphics, IEEE Transactions on, 2011,17(1): 26-37.
[7] Xu X, Hu X, He X. A Wargame Data Visualization Algorithm Based on Regular Radius and Constrained Random Direction.Proceedings of the 3rd International Conference on Multimedia Technology (ICMT 2013). Springer Berlin Heidelberg, 2014: 175-182.