郭宏曦
大數(shù)據(jù)時代的來臨,使得數(shù)據(jù)逐步透明化。2020年初,新型冠狀病毒肺炎疫情已成為世界焦點,從疫情初現(xiàn)端倪,政府和企業(yè)在此次疫情中的數(shù)據(jù)可視化,讓公眾直觀地掌握疫情動態(tài)。達到防控風(fēng)險,抑制疫情的再擴散的目的。
當(dāng)今世界已經(jīng)進入大數(shù)據(jù)時代,各國已將數(shù)據(jù)列為新的戰(zhàn)略資源。在經(jīng)濟高速運轉(zhuǎn)的今天,數(shù)據(jù)不再局限于小小的一個圈子,而是更加開放、包容,數(shù)據(jù)規(guī)模也更為客觀。數(shù)據(jù)不再是簡單的數(shù)字,如何從數(shù)據(jù)的背后挖掘出數(shù)據(jù)潛藏的價值成為國家和企業(yè)關(guān)心的熱點問題。
從初期的數(shù)據(jù)采集到后期的數(shù)據(jù)可視化,以數(shù)據(jù)為核心的產(chǎn)業(yè)鏈正走向完善,逐漸摒棄了單純售賣數(shù)據(jù)的單一盈利方式,轉(zhuǎn)而期望通過深度挖掘數(shù)據(jù)中潛在的價值獲得更高利潤。阿里云、百度云等以大數(shù)據(jù)為核心的人工智能科技企業(yè)已進入高速發(fā)展時期,大數(shù)據(jù)帶來的便利已走入我們生活。例如騰訊云通過分析春節(jié)前疫區(qū)流出人群去向得出該地區(qū)與其他地區(qū)聯(lián)系強度模型,提前分析出潛在高風(fēng)險地區(qū),百度地圖APP快速上線“遷徙地圖”和“發(fā)熱門診”功能。這些都是通過數(shù)據(jù)平臺采集數(shù)據(jù),并分析數(shù)據(jù)潛藏的價值。
當(dāng)然,數(shù)據(jù)只是數(shù)據(jù),如何將這些數(shù)據(jù)轉(zhuǎn)化為能被大多數(shù)人理解的內(nèi)容?這就要用到了數(shù)據(jù)可視化———將獲得的數(shù)據(jù)轉(zhuǎn)化為圖像的形式,直觀地展示在公眾面前。圖像比一串讓人看不懂的數(shù)據(jù)更容易理解,這就實現(xiàn)了數(shù)據(jù)的開放與共享。
中華人民共和國衛(wèi)生健康委員會(簡稱國家衛(wèi)健委)官網(wǎng)已成為此次疫情信息公開的前沿平臺,為社會公眾提供一手數(shù)據(jù),為疫情的發(fā)展態(tài)勢提供數(shù)據(jù)支持。從2019年末第一例發(fā)現(xiàn)不明原因肺炎患者,到2020年1月29日確診5 974例,疑似9 239例。短短1個月時間,新型冠狀病毒肺炎疫情已呈席卷之勢。春運加劇了疫情擴散速度,病毒疫情不僅是地區(qū)之事,隨著事態(tài)發(fā)展,各省逐步啟動突發(fā)公共衛(wèi)生事件Ⅰ級應(yīng)急響應(yīng)。
通過國家官方網(wǎng)站的大數(shù)據(jù)信息,驗證大數(shù)據(jù)開放與共享的原則:開放政府工作組“八項原則”。原則中提出完整、原始性、及時、可獲取、可機讀、非歧視、非專屬和免于授權(quán)。
完整性:數(shù)據(jù)的公開包含中國內(nèi)陸、港澳臺及海外地區(qū)的疫情情況。
原始性:數(shù)據(jù)從各省市地區(qū)衛(wèi)健委統(tǒng)計而來,未加工未修改。
及時:公眾通過網(wǎng)站能獲悉前一天的疫情確診人數(shù),甚至部分數(shù)據(jù)平臺能做到數(shù)據(jù)實時更新。
可獲取、可機讀、非專屬性、非歧視性、免于授權(quán):通過各地區(qū)的數(shù)據(jù)上報情況,各類平臺均能輕松獲得數(shù)據(jù),不用通過特殊授權(quán),即可使用數(shù)據(jù),并將非結(jié)構(gòu)化數(shù)據(jù)脫敏后轉(zhuǎn)化為機器可讀的結(jié)構(gòu)化數(shù)據(jù),可視化處理后公布給各界人士。
綜上所屬,對于此次新型冠狀病毒肺炎疫情數(shù)據(jù),政府做到了數(shù)據(jù)開放與共享,滿足了公眾對疫情的了解需求,達到消除恐慌、抑制謠言等目的,使公眾了解疫情嚴重性,服從國家安排,眾志成城、抗擊疫情。通過政府?dāng)?shù)據(jù)平臺的建設(shè),政府?dāng)?shù)據(jù)開放取得了實質(zhì)性的進展,但國家衛(wèi)健委平臺在開放數(shù)據(jù)上缺乏更詳盡信息,如要進一步了解部分地區(qū)疫情狀況就需要通過其他的網(wǎng)頁爬蟲,政府的數(shù)據(jù)共享有待進一步提高。
眾多企業(yè)大數(shù)據(jù)平臺也參與到了這場無硝煙的戰(zhàn)爭之中。經(jīng)過各類數(shù)據(jù)平臺的數(shù)據(jù)開放共享,加快了大數(shù)據(jù)在這場疫情中可視化探索的步伐。
通過可視化方法散點圖矩陣,可以分析出春運后隱含高風(fēng)險城市。隨著疫情地圖的實時更新,驗證了高維數(shù)據(jù)的可視化模型。而時空立方體技術(shù)模型在建模過程中,有層次離散化問題,還需進一步數(shù)據(jù)轉(zhuǎn)化。