李瑩瑩
(天津工業(yè)大學(xué) 天津 300387)
近些年,各種突發(fā)事件頻繁發(fā)生。2008年的四川大地震,2015年天津塘沽大爆炸,2019年四川涼山發(fā)生森林大火,導(dǎo)致31人遇難,以及2019年12月在武漢發(fā)生的公共衛(wèi)生突發(fā)事件,與其他突發(fā)事件不同,其存在更大的傳染性,蔓延速度快,這次疫情目前已經(jīng)在全球207個(gè)國(guó)家擴(kuò)散,而且有持續(xù)發(fā)展的趨勢(shì)。針對(duì)此次疫情,國(guó)內(nèi)人民積極響應(yīng)政府號(hào)召,自行在家隔離,同時(shí)各級(jí)政府部門(mén)以及媒體對(duì)疫情狀態(tài)進(jìn)行實(shí)時(shí)更新報(bào)道,做到了信息公開(kāi),情報(bào)通暢,將應(yīng)急情報(bào)體系融入到了公共衛(wèi)生突發(fā)的全程。
2015年3月5日,中華人民共和國(guó)第十二屆全國(guó)人民代表大會(huì)第三次會(huì)議開(kāi)幕,國(guó)務(wù)院總理李克強(qiáng)作政府工作報(bào)告,李總理著重強(qiáng)調(diào)了大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合等概念。隨著疫情的發(fā)展,積累了大量與病毒相關(guān)的數(shù)據(jù),滿足大數(shù)據(jù)特點(diǎn),本文利用大數(shù)據(jù)技術(shù)構(gòu)建新型的應(yīng)急決策情報(bào)體系,以提高應(yīng)對(duì)突發(fā)事件的科學(xué)性和高效性。
大數(shù)據(jù)是一個(gè)抽象概念,一般指超出常規(guī)數(shù)據(jù)庫(kù)軟件工具所能捕獲、儲(chǔ)存、管理和分析的超大規(guī)模數(shù)據(jù)集。大數(shù)據(jù)技術(shù)是一種大規(guī)模的分布式模型,通過(guò)網(wǎng)絡(luò)將抽象的、可伸縮的、便于管理的數(shù)據(jù)能源、服務(wù)、存儲(chǔ)方式等傳遞給終端用戶,是一種新型高效快速獲取有效信息的能力。目前大數(shù)據(jù)技術(shù)得到廣泛的使用,例如將大數(shù)據(jù)儲(chǔ)存技術(shù)運(yùn)用到煤礦應(yīng)急管理中,成功地提高了煤礦企業(yè)現(xiàn)有信息系統(tǒng)構(gòu)架的海量數(shù)據(jù)存儲(chǔ)及處理性能;此外,將大數(shù)據(jù)技術(shù)成功運(yùn)用到智能電網(wǎng)中,將模糊的電網(wǎng)數(shù)據(jù)清晰化,對(duì)數(shù)據(jù)進(jìn)行降維,并根據(jù)數(shù)據(jù)項(xiàng)彼此之間的關(guān)聯(lián)性有選擇地向業(yè)務(wù)部門(mén)或用戶提供有效信息,提高了智能電網(wǎng)的運(yùn)作速率。
公共衛(wèi)生突發(fā)事件指由于感染新型呼吸道病毒而引發(fā)的大規(guī)模的、具有傳染性的、需要緊急采取措施應(yīng)對(duì)的事件。目前已經(jīng)具有全球大流行的特征。2020年1月20日鐘南山做出判斷,該病毒具有人傳人的特性。2020年1月30日世界衛(wèi)生組織將新型呼吸道病毒疫情列為突發(fā)公共衛(wèi)生事件。
全球著名管理咨詢公司將大數(shù)據(jù)定義為:無(wú)法在一定時(shí)間內(nèi)使用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行獲取、管理和處理的數(shù)據(jù)集合。從技術(shù)方面來(lái)看,大數(shù)據(jù)技術(shù)在處理數(shù)據(jù)方面包括五個(gè)步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分布存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用。新冠肺炎突發(fā)事件應(yīng)急情報(bào)體系的建立需要從這五個(gè)方面出發(fā)進(jìn)行建立,每個(gè)步驟都涉及到相應(yīng)的大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)采集技術(shù)就是對(duì)數(shù)據(jù)進(jìn)行ETL操作,通過(guò)對(duì)數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換、加載,最終挖掘數(shù)據(jù)的潛在價(jià)值,然后提供給用戶解決方案或者決策參考。大數(shù)據(jù)采集通常利用以下三個(gè)系統(tǒng):(1)系統(tǒng)日志采集系統(tǒng)。對(duì)公司的業(yè)務(wù)平臺(tái)每天產(chǎn)生的大量的日志數(shù)據(jù)進(jìn)行采集、收集,常用的日志收集系統(tǒng)有Flume和Scribe,然后進(jìn)行數(shù)據(jù)分析,挖掘公司業(yè)務(wù)平臺(tái)日志數(shù)據(jù)中的潛在價(jià)值。(2)網(wǎng)絡(luò)數(shù)據(jù)采集系統(tǒng)。本文是通過(guò)爬蟲(chóng)技術(shù)從網(wǎng)站上獲取數(shù)據(jù)。(3)數(shù)據(jù)庫(kù)采集系統(tǒng)??梢允褂脗鹘y(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)MySQL和Oracle等來(lái)存儲(chǔ)數(shù)據(jù);也可以使用Redis和MongoDB進(jìn)行數(shù)據(jù)采集。
主要完成對(duì)已接收數(shù)據(jù)的辨析、抽取、清洗等操作。(1)抽?。阂颢@取的數(shù)據(jù)可能具有多種結(jié)構(gòu)和類(lèi)型,數(shù)據(jù)抽取過(guò)程可以幫助我們將這些復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為單一的或者便于處理的構(gòu)型,以達(dá)到快速分析處理的目的。(2)清洗:對(duì)于大數(shù)據(jù),并不全是有價(jià)值的,有些數(shù)據(jù)并不是我們所關(guān)心的內(nèi)容,而另一些數(shù)據(jù)則是完全錯(cuò)誤的干擾項(xiàng),因此要對(duì)數(shù)據(jù)通過(guò)過(guò)濾“去噪”從而提取出有效數(shù)據(jù)。本文基于新冠肺炎突發(fā)事件特點(diǎn),采用Wrapper技術(shù),由一個(gè)中間件和多個(gè)包裝器組成,每個(gè)數(shù)據(jù)源對(duì)應(yīng)一個(gè)包裝器,包裝器對(duì)特定數(shù)據(jù)源進(jìn)行了封裝,將其數(shù)據(jù)模型轉(zhuǎn)換為系統(tǒng)所采用的通用模型,并提供一致的訪問(wèn)機(jī)制。
大數(shù)據(jù)存儲(chǔ)與管理要用存儲(chǔ)器把采集到的數(shù)據(jù)存儲(chǔ)起來(lái),建立相應(yīng)的數(shù)據(jù)庫(kù),并進(jìn)行管理和調(diào)用。重點(diǎn)解決復(fù)雜結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化大數(shù)據(jù)管理與處理技術(shù)。主要解決大數(shù)據(jù)的可存儲(chǔ)、可表示、可處理、可靠性及有效傳輸?shù)葞讉€(gè)關(guān)鍵問(wèn)題。本文考慮到突發(fā)事件的緊急性和嚴(yán)重性,采用Ha-doop的分布式文件系統(tǒng)(HDFS),它能有效的優(yōu)化存儲(chǔ)、計(jì)算融入存儲(chǔ)。
大數(shù)據(jù)技術(shù)能夠?qū)㈦[藏于海量數(shù)據(jù)中的信息和知識(shí)挖掘出來(lái),為人類(lèi)的社會(huì)經(jīng)濟(jì)活動(dòng)提供依據(jù),從而提高各個(gè)領(lǐng)域的運(yùn)行效率,大大提高整個(gè)社會(huì)經(jīng)濟(jì)的集約化程度。本文采用可視化技術(shù)進(jìn)行數(shù)據(jù)應(yīng)用,數(shù)據(jù)可視化無(wú)論對(duì)于普通用戶或是數(shù)據(jù)分析專(zhuān)家,都是最基本的功能。數(shù)據(jù)圖像化可以讓民眾了解到事件帶來(lái)的直接結(jié)果,更利于事件向好的方向發(fā)展。在我國(guó),大數(shù)據(jù)將重點(diǎn)應(yīng)用于以下三大領(lǐng)域:商業(yè)智能、政府決策、公共服務(wù)。在此次的新冠肺炎事件中,該項(xiàng)技術(shù)得到很好的應(yīng)用。
隨著事件的發(fā)生,利用爬蟲(chóng)技術(shù)進(jìn)行信息采集,主要得到以下四個(gè)信息。首先是基本信息,關(guān)于事件的基本情況,其次是歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù),從數(shù)據(jù)庫(kù)查看是否有類(lèi)似的事件,患者數(shù)量,傳染率在數(shù)據(jù)上是否有相同之處。最后及時(shí)統(tǒng)計(jì)現(xiàn)場(chǎng)信息,患者的狀況,醫(yī)生給出的診斷進(jìn)行匯總。
利用信息資源層,將收集到的信息采用Wrapper技術(shù)進(jìn)行抽取凈化,以獲得有效數(shù)據(jù)。該層被稱為數(shù)據(jù)的凈化工廠。Wrapper技術(shù)可以將每一個(gè)數(shù)據(jù)源進(jìn)行識(shí)別,通過(guò)篩選除去重復(fù)多余、內(nèi)容無(wú)關(guān)的信息,填補(bǔ)格式殘缺的數(shù)據(jù),將形成的文字、聲音、視頻數(shù)據(jù)模型轉(zhuǎn)化為計(jì)算機(jī)系統(tǒng)識(shí)別的通用模型,同時(shí)將同類(lèi)型的二維碼數(shù)據(jù)源對(duì)應(yīng)包裝器進(jìn)行封裝形成數(shù)據(jù)塊,傳遞給數(shù)據(jù)儲(chǔ)存層。
經(jīng)過(guò)數(shù)據(jù)轉(zhuǎn)化層,利用HDFS儲(chǔ)存的數(shù)據(jù)分為三類(lèi):突發(fā)事件數(shù)據(jù)庫(kù)、應(yīng)急決策信息庫(kù)和實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)庫(kù)。突發(fā)事件數(shù)據(jù)庫(kù)用于儲(chǔ)存突發(fā)事件發(fā)生時(shí)產(chǎn)生的信息數(shù)據(jù),主要指突發(fā)事件發(fā)生時(shí)處于事件突發(fā)現(xiàn)場(chǎng)的患者及正常人員通過(guò)五官感受以及相關(guān)專(zhuān)業(yè)人員診斷進(jìn)行的數(shù)據(jù)收集,可為視頻、文字、聲音等內(nèi)容。應(yīng)急決策信息庫(kù)主要提供決策指揮的基本判斷模型和風(fēng)險(xiǎn)等級(jí)識(shí)別計(jì)算方法。實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)庫(kù)該數(shù)據(jù)庫(kù)每天隨時(shí)進(jìn)行更新,更新內(nèi)容包括安全系統(tǒng)監(jiān)測(cè)數(shù)據(jù)、監(jiān)控系統(tǒng)監(jiān)測(cè)數(shù)據(jù)、設(shè)備設(shè)施產(chǎn)生的數(shù)據(jù)、全國(guó)各省每天的確診及疑似數(shù)據(jù)。
決策構(gòu)建層在整個(gè)應(yīng)急決策情報(bào)體系構(gòu)建中十分重要,通過(guò)前面數(shù)據(jù)的收集、處理和存儲(chǔ)得到的有效數(shù)據(jù),利用先進(jìn)的Map Reduce數(shù)據(jù)挖掘技術(shù),分析出風(fēng)險(xiǎn)潛在的發(fā)生概率、風(fēng)險(xiǎn)潛在的破壞程度兩個(gè)方面信息。另一種是發(fā)生突發(fā)事件的特殊情況,通過(guò)MapReduce技術(shù)在短時(shí)間內(nèi)進(jìn)行風(fēng)險(xiǎn)識(shí)別并提供風(fēng)險(xiǎn)評(píng)估和提供應(yīng)急救援參考意見(jiàn),其中應(yīng)急救援參考意見(jiàn)包括現(xiàn)場(chǎng)預(yù)計(jì)傷亡人數(shù)及財(cái)產(chǎn)損失、相關(guān)專(zhuān)家人員、可采用的救援應(yīng)急物資料、相關(guān)負(fù)責(zé)部門(mén)機(jī)構(gòu)等應(yīng)急救援基本情況。在此次新冠肺炎事件中,專(zhuān)家們及時(shí)做出武漢封城的決策極大的降低了病毒的傳播和財(cái)產(chǎn)損失。
利用可視化技術(shù)及時(shí)進(jìn)行有效信息的傳遞以及采取措施應(yīng)對(duì)。有效信息傳遞主要指將風(fēng)險(xiǎn)識(shí)別等級(jí)數(shù)據(jù)、風(fēng)險(xiǎn)評(píng)價(jià)程度數(shù)據(jù)通過(guò)大數(shù)據(jù)可視化技術(shù)的人機(jī)交互界面,以圖像文字的形式出現(xiàn)在計(jì)算機(jī)顯示屏上,給決策構(gòu)建層領(lǐng)導(dǎo)人提供決策參考;并根據(jù)現(xiàn)場(chǎng)反饋信息進(jìn)行實(shí)時(shí)更新,便于制定最合理的應(yīng)急救援方案。這一過(guò)程極大的提高了決策的有效率以及應(yīng)對(duì)措施的準(zhǔn)確性。
經(jīng)過(guò)此次疫情,我國(guó)的國(guó)際地位得到認(rèn)可,各國(guó)在得到中國(guó)幫助的同時(shí)充分感受到了中國(guó)強(qiáng)大的危機(jī)管理能力。但是隨著社會(huì)的發(fā)展,國(guó)際合作也會(huì)越發(fā)頻繁,因此應(yīng)對(duì)突發(fā)事件的應(yīng)急決策情報(bào)體系將面臨更大的挑戰(zhàn)。通過(guò)一系列的突發(fā)事件應(yīng)急處置過(guò)程的效果可看出,目前的應(yīng)急決策情報(bào)體系存在諸多問(wèn)題,尋找新型高效的應(yīng)急情報(bào)體系迫在眉睫。本文根據(jù)新型冠狀肺炎突發(fā)事件特點(diǎn),基于當(dāng)下大數(shù)據(jù)背景環(huán)境,以大數(shù)據(jù)技術(shù)為基礎(chǔ),構(gòu)建了一套全新高效的應(yīng)急決策情報(bào)理念體系,解決了目前臨時(shí)性決策情報(bào)體系的不足。該應(yīng)急決策情報(bào)體系具有以下特點(diǎn):
(1)從各類(lèi)醫(yī)療網(wǎng)絡(luò)資源,醫(yī)學(xué)數(shù)據(jù)庫(kù)中收集各類(lèi)已發(fā)生的公共突發(fā)事件的特征,利用大數(shù)據(jù)技術(shù),科學(xué)準(zhǔn)確地判斷出事故風(fēng)險(xiǎn)等級(jí)并將最優(yōu)應(yīng)急預(yù)案提供給決策者。
(2)將各類(lèi)突發(fā)事件的信息,尤其和醫(yī)學(xué)相關(guān)的各種病癥錄入計(jì)算機(jī)系統(tǒng),從而改善信息傳遞過(guò)程中的不穩(wěn)定以及不準(zhǔn)確的情況。計(jì)算機(jī)和人直接匹配,例如,當(dāng)醫(yī)院出現(xiàn)大量此類(lèi)病例時(shí),計(jì)算機(jī)可以及時(shí)進(jìn)行統(tǒng)計(jì)給出數(shù)據(jù),方便醫(yī)生采取正確高效的應(yīng)對(duì)措施。
(3)利用大數(shù)據(jù)技術(shù)的高效收集與分析能力,避免了應(yīng)急情報(bào)信息收集不完整、不準(zhǔn)確的情況。當(dāng)下大數(shù)據(jù)發(fā)展迅速,我國(guó)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,利用大數(shù)據(jù)技術(shù)進(jìn)行應(yīng)急決策情報(bào)體系的建立,可以為應(yīng)急決策情報(bào)軟件系統(tǒng)的開(kāi)發(fā)提供理論參考依據(jù),同時(shí)更能為整個(gè)應(yīng)急管理工作尋找到新的方向與思路,使得我國(guó)應(yīng)急管理工作上新臺(tái)階。