于 洋,陳耿丞
(1.廣東警官學(xué)院,廣東 廣州 510000;2.深圳市公安局,廣東 深圳 518000)
我國地域遼闊,氣候和地理環(huán)境以及民族風(fēng)俗都存在較大的差異,使我國成為各類自然與公共突發(fā)事件頻發(fā)的國家之一。2002年,“非典”爆發(fā)后國務(wù)院專門成立了“突發(fā)公共事件應(yīng)急預(yù)案小組”,開始大規(guī)模制定我國相關(guān)的應(yīng)急管理機制。2007年,《中華人民共和國突發(fā)事件應(yīng)對法》正式施行,成為我國應(yīng)急管理層面的基本法律。2011年—2016年,國務(wù)院頒布了《國家自然災(zāi)害救助應(yīng)急預(yù)案》并廢除了2011年版本的《國家自然災(zāi)害救助應(yīng)急預(yù)案》。2018年3月,根據(jù)第十三屆全國人民代表大會第一次會議批準的國務(wù)院機構(gòu)改革方案,中華人民共和國應(yīng)急管理部成立,應(yīng)急管理部的成立標志著突發(fā)事件的處置在我國上升成為國家意志與政府責(zé)任。
在世界范圍內(nèi)從20世紀90年代以來,突發(fā)事件發(fā)生頻率迅速增加,影響不斷擴大,因而各國政府紛紛開始制定一系列的措施來應(yīng)對突發(fā)事件并盡可能降低其危害后果,日本于1995年成立了以綜合防災(zāi)減災(zāi)為主的“內(nèi)閣危機管理總監(jiān)”;“9·11”事件發(fā)生后,2002年美國總統(tǒng)在白宮簽署《2002年國土安全法》,宣布成立國土安全部(U.S.Department of Homeland Security,US DHS)以應(yīng)對各類突發(fā)事件,國土安全部的正式成立是美國自1947年成立國防部以來最大規(guī)模的一次政府應(yīng)急管理機構(gòu)調(diào)整??v觀世界范圍內(nèi)突發(fā)事件情報收集與整合的歷史,人類社會經(jīng)歷了從書信、無線電到網(wǎng)絡(luò)時代的發(fā)展歷程,大數(shù)據(jù)時代的到來使得突發(fā)事件中情報的收集與整合發(fā)生了革命性的變革,進而顛覆了突發(fā)事件指揮與處置的基本模式,引導(dǎo)突發(fā)事件由經(jīng)驗主導(dǎo)向數(shù)據(jù)驅(qū)動的方向不斷發(fā)展。[1]此次在2019年末世界范圍內(nèi)爆發(fā)的新型冠狀病毒肺炎(Corona Virus Disease2019,COVID-19)公共突發(fā)事件,再一次讓世界各國政府以及應(yīng)急管理部門認識到建立突發(fā)事件情報整合與共享機制的重要意義與核心價值。
圖1 大數(shù)據(jù)和突發(fā)事件文獻指數(shù)分析[2]
學(xué)界對大數(shù)據(jù)環(huán)境下突發(fā)事件的情報收集與整理也開展了不同維度的研究,通過在中國知網(wǎng)搜索“大數(shù)據(jù)”與“突發(fā)事件”,經(jīng)過指數(shù)分析得出如下結(jié)果,見圖1。通過圖1可以看出,突發(fā)事件相關(guān)內(nèi)容近十年來一直是研究關(guān)注的熱點,近兩年來雖略有回落但仍保持較高水平。而大數(shù)據(jù)作為新興的關(guān)鍵詞近五年來被關(guān)注和研究的頻率迅速上漲,成為突發(fā)事件情報整合與融合性領(lǐng)域中的研究熱點。其中具有代表性的研究包括:唐明偉等學(xué)者希望通過物聯(lián)網(wǎng)將互聯(lián)網(wǎng)數(shù)據(jù)進行儲存與分析,從而進行重新整理和輸出以達到預(yù)警作用,同時認為應(yīng)將突發(fā)事件預(yù)警的情報研究模型同情報監(jiān)測與分析相結(jié)合;[3]一些學(xué)者對突發(fā)事件發(fā)生的不同階段所需不同類型的情報信息進行了分別論述,以期使情報的收集和整理更加全面準確,其中徐健構(gòu)建了突發(fā)事件應(yīng)急知識庫,希望通過將相關(guān)信息儲存于知識庫之中,進而達到“信息海量而有用”的目標;[4]也有一些學(xué)者針對網(wǎng)絡(luò)突發(fā)事件提出了相應(yīng)的應(yīng)急管理機制,針對信息傳播和溝通不暢的問題提出了相應(yīng)的舉措,其中彭知輝則對當下公安情報收集提出了新的概念,擴大了數(shù)據(jù)收集的范圍和種類,同時強調(diào)了傳統(tǒng)情報收集方法的重要性。[5]
近年來,在互聯(lián)網(wǎng)不斷發(fā)展的背景下,突發(fā)事件有著影響人數(shù)、面積、地域、頻率以及危害后果不斷擴張與惡化的趨勢,其突發(fā)性、危害性、不確定性以及擴散性[6]對人類社會的政治、經(jīng)濟、文化等各方面都有不同程度的消極影響,在全球一體化趨勢的當下時代,各國政府都更加注重突發(fā)事件情報信息的有效整合與積極共享。與此同時,大數(shù)據(jù)時代的來臨使得情報整合系統(tǒng)更加智能與人性化,為相應(yīng)問題的解決提供了重要的技術(shù)支撐。構(gòu)建基于大數(shù)據(jù)驅(qū)動的突發(fā)事件情報整合與分析機制,是互聯(lián)網(wǎng)時代人類應(yīng)對突發(fā)事件的重要前提與基礎(chǔ)。本研究將通過文獻研究與數(shù)據(jù)分析的研究方法,以理論情報學(xué)和應(yīng)用情報學(xué)為基礎(chǔ),遵循情報學(xué)研究的客觀規(guī)律和原則,以多主體、多元數(shù)據(jù)、多維度進行交叉比對為研究視角,對大數(shù)據(jù)環(huán)境下突發(fā)事件情報整合機制的建設(shè)進行深入研究,進而探索多主體參與的情報體系與多元數(shù)據(jù)的情報挖掘與共享機制以及多維度情報資源整合方法之間的相互關(guān)系。
隨著大數(shù)據(jù)環(huán)境發(fā)展與科技手段的進步,突發(fā)事件的情報收集手段必然呈現(xiàn)數(shù)據(jù)化發(fā)展趨勢,通過融合創(chuàng)新實現(xiàn)情報收集手段的自動化與科學(xué)化,挖掘潛在數(shù)據(jù)信息之間的深度關(guān)聯(lián)關(guān)系,從而有助于將突發(fā)事件情報整合機制形成一套完整的工作體系,并使其在實踐中不斷通過檢驗而獲得完善。
構(gòu)建大數(shù)據(jù)背景下的情報整合機制體系,有利于應(yīng)急管理部門對突發(fā)事件發(fā)展態(tài)勢與情形的把握,有助于處置主體對突發(fā)事件進行快速反應(yīng)和快速處置,更有利于形成系統(tǒng)化的情報分享與分析體系。通過與社會情報源、其他政府部門的情報源相融合,打破情報壁壘,促進情報收集手段發(fā)展。在建立起科學(xué)的情報整合機制環(huán)境下,應(yīng)急管理部門可以對多元異構(gòu)數(shù)據(jù)進行有效清洗、歸納以及轉(zhuǎn)換,并形成相應(yīng)的數(shù)據(jù)庫,通過數(shù)據(jù)庫形成準確及時的數(shù)據(jù)源,在突發(fā)事件處置過程中可以為指揮者決策提供有力的數(shù)據(jù)化分析支持,為有效處置突發(fā)事件貢獻科學(xué)的應(yīng)對方案。
《中華人民共和國突發(fā)事件應(yīng)對法》對突發(fā)事件(Emergency)做出了如下界定:突然發(fā)生,造成或者可能造成嚴重社會危害,需要采取應(yīng)急處置措施予以應(yīng)對的自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會安全事件。[7]由于自然突發(fā)事件具有難以力抗、不可預(yù)測(如地震)等因素,本文所指的突發(fā)事件情報整合機制建構(gòu)更多地關(guān)注除自然災(zāi)害以外的其他類型突發(fā)事件?;ヂ?lián)網(wǎng)的加速發(fā)展促使網(wǎng)絡(luò)科技迅速扎根于政治、文化以及經(jīng)濟等各個領(lǐng)域,且影響不斷擴大。網(wǎng)絡(luò)的普及使得突發(fā)事件與非接觸性犯罪也呈現(xiàn)出高發(fā)的態(tài)勢,新型犯罪導(dǎo)致的突發(fā)事件不斷增加,例如因涉眾性的網(wǎng)絡(luò)詐騙與經(jīng)濟案件而引發(fā)的群體性沖突等。大數(shù)據(jù)背景下突發(fā)事件情報整合機制研究的重要目的在于從源頭對突發(fā)事件進行情報收集、控制乃至防范,進而做到對于突發(fā)事件的可防可控。在大數(shù)據(jù)背景下我國的突發(fā)事件呈現(xiàn)出如下發(fā)展特點:
第一,類型的多元化。傳統(tǒng)的突發(fā)性事件以接觸性為主要表現(xiàn)特征,例如人群的聚集以及由于人群聚集所導(dǎo)致的嚴重危害后果。在大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)科技的發(fā)達使得突發(fā)事件的蔓延后果可以通過網(wǎng)絡(luò)的方式得以傳播,例如造成民眾恐慌或者散布無端謠言等。因而對突發(fā)事件情報的收集以及整合工作提出了更多的挑戰(zhàn)。
第二,跨區(qū)域蔓延與區(qū)域化特征的交織。隨著全球一體化的趨勢不斷發(fā)展,突發(fā)事件也呈現(xiàn)出跨區(qū)域性的蔓延趨勢,例如,2019年在世界范圍內(nèi)爆發(fā)的新冠肺炎疫情,在很短的時間之內(nèi)就造成全球超過200萬人感染,蔓延速度之快遠遠超過了各國應(yīng)急管理部門的預(yù)期。與此同時地域性突發(fā)事件具有一定的規(guī)律性,如因征地拆遷補償而導(dǎo)致利益不均所產(chǎn)生的突發(fā)性群體聚集與上訪事件,因為經(jīng)濟利益而引發(fā)的非法聚集突發(fā)事件,等等,此類突發(fā)事件以地緣性為連接,通過鄰里關(guān)系或者血緣關(guān)系進行結(jié)伙,容易導(dǎo)致共同犯罪,由此引發(fā)的群體性突發(fā)事件具有典型的地域性特征。
第三,顯性化與隱形化危害后果交錯。傳統(tǒng)的突發(fā)事件通常會對經(jīng)濟、秩序等方面造成一定的直接影響與損失,然而隨著互聯(lián)網(wǎng)的發(fā)展,突發(fā)事件對于民眾的影響不僅僅表現(xiàn)在顯性方面,顯性化影響依然存在的前提下更多地表現(xiàn)為隱形化與長期化的影響,且隱形化的影響與顯性化影響相互交織而不斷擴大負面影響,例如,2019年末發(fā)生的新冠肺炎疫情對于全球的防控觀念、秩序理念以及民眾恐慌與不信任情緒等多方面都造成了長期的影響,并且將進一步改變?nèi)祟惿鐣南嗵幏绞脚c秩序模式。
在傳統(tǒng)的情報收集手段中,政府應(yīng)急管理部門在情報收集過程中針對的信息大多為實時信息,而深層次與預(yù)測性的情報產(chǎn)品偏少;同時存在顯性信息偏多而隱性信息不足的問題。傳統(tǒng)的情報收集方法通常具有如下缺陷:
第一,情報信息收集手段單一,情報信息分散。傳統(tǒng)的情報收集方法主要運用人力資源,而突發(fā)事件的突發(fā)性和不確定性是人力情報收集所不能預(yù)測的。首先,互聯(lián)網(wǎng)社會環(huán)境中所產(chǎn)生的巨量數(shù)據(jù)是難以通過人力方式進行全面收集的,因而無法滿足突發(fā)事件中情報儲備與分析需要。其次,受限于人力收集個體的敏銳性差異而無法識別潛在的信息,同時因為人力識別能力和資源的制約,導(dǎo)致許多信息無法及時掌控。
第二,情報信息收集時效的滯后性。傳統(tǒng)的人力情報收集模式通常局限于對已發(fā)事件的統(tǒng)計與記錄,缺乏對于實時發(fā)生信息的敏感性捕捉能力,更難以通過現(xiàn)有實時態(tài)勢進行預(yù)見性的情報收集與整理,因而情報的收集與整理工作往往具有一定的總結(jié)性,而喪失了情報本身具有預(yù)見性的實時輔助決策功能。
第三,缺乏開放性的情報共享機制。由于缺乏大數(shù)據(jù)與互聯(lián)性思維,傳統(tǒng)的情報收集僅限于不同專業(yè)以及不同系統(tǒng)內(nèi)部的信息統(tǒng)計,不同專業(yè)領(lǐng)域與系統(tǒng)的情報只能反映突發(fā)事件中某一維度的特性與情況,難以通過大數(shù)據(jù)理念對整個事件發(fā)展的態(tài)勢進行全面的掌控與預(yù)見。
綜上所述,傳統(tǒng)的缺乏互聯(lián)網(wǎng)思維的情報收集與整理使得情報資源利用率低下且質(zhì)量較差,情報工作投入資源重復(fù)消耗,造成了資源利用價值效率的極大損耗甚至產(chǎn)生錯誤指引。
突發(fā)事件的情報收集手段與方法在大數(shù)據(jù)環(huán)境下已經(jīng)明顯體現(xiàn)出其不適性,然而對于收集后的情報如何進行科學(xué)整合也同樣面臨一定的困局。傳統(tǒng)的情報整理方法主要依靠人力資源完成,形成的文字或圖像信息以物理方式存放于資料庫中,但由于情報采集環(huán)節(jié)的標準不統(tǒng)一,數(shù)據(jù)歸納整理的方式不一致,造成數(shù)據(jù)治理困難,極易導(dǎo)致應(yīng)用過程的模糊性與錯誤。與此同時,傳統(tǒng)的情報整理方法在異構(gòu)性情報方面的缺失較為突出。數(shù)據(jù)依據(jù)計算機的識別能力可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)三類。傳統(tǒng)的數(shù)據(jù)庫只能接受通過精準查找匹配其中5%的結(jié)構(gòu)化數(shù)據(jù),其余95%的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)都無法利用。容錯率低導(dǎo)致相似樣本無法匹配與對比,使突發(fā)事件的隱性深度關(guān)聯(lián)信息無法被發(fā)掘與對比,進而形成有效的情報產(chǎn)品。
相對于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)庫建設(shè),傳統(tǒng)的情報收集方法未能將相似突發(fā)事件相關(guān)案例形成相應(yīng)的數(shù)據(jù)庫。傳統(tǒng)的數(shù)據(jù)庫只能進行單一維度的信息查詢,無法將案件形成海量的、多維度對應(yīng)的案例庫以及模型庫。當突發(fā)事件發(fā)生時,應(yīng)用者無法從數(shù)據(jù)庫中獲得可比性的情報模型與處置經(jīng)驗,只能依據(jù)個體經(jīng)驗進行處置,因而難以避免因個人認知偏差或缺失所導(dǎo)致的決策錯誤與偏失。與此同時,缺乏有效的情報分享與互聯(lián)互通機制同樣制約了突發(fā)事件中情報的有效利用。突發(fā)事件的蔓延性使得應(yīng)對須依靠政府綜合力量進行,缺乏有效的情報整合與分享機制使得突發(fā)事件情報的收集與整合具有一定的片面性。情報整合的效果同樣制約了后期分析產(chǎn)品輸出的質(zhì)量,目前我國應(yīng)急管理部門在大數(shù)據(jù)的環(huán)境下缺乏專業(yè)的綜合性情報分析人才對大數(shù)據(jù)環(huán)境下的半結(jié)構(gòu)化與非結(jié)構(gòu)化情報進行歸納分類,情報信息難以體現(xiàn)分析人員的心智模型,因而無法為決策者提供有效的決策建議與預(yù)測性情報產(chǎn)品。
傳統(tǒng)的突發(fā)事件情報收集與整理流程是一個相對獨立與封閉的過程,情報收集、處理、分類與整合彼此孤立存在,使得突發(fā)事件情報的主觀性風(fēng)險大大增加,同時客觀性描述和利用率降低。大數(shù)據(jù)背景下的情報整合機制是根據(jù)用戶需求,針對海量與復(fù)雜形式數(shù)據(jù)進行動態(tài)性的監(jiān)測與整合,構(gòu)建多元化與開放性的情報應(yīng)用平臺,促進情報產(chǎn)品質(zhì)量與利用效率顯著提升。[8]針對我國現(xiàn)階段突發(fā)事件情報收集與整理的現(xiàn)狀評估,筆者認為應(yīng)當形成系統(tǒng)性與目標導(dǎo)向的情報整合機制,如圖2所示,包括應(yīng)急情報源模塊,應(yīng)急情報對象目標與需求模塊,應(yīng)急情報數(shù)據(jù)收集與清洗模塊以及應(yīng)急情報分析在智慧分析中的應(yīng)用模塊。在形成完善的系統(tǒng)閉環(huán)基礎(chǔ)上,應(yīng)當構(gòu)建多主體參與的情報體系,從而進行多維度情報資源整合以及多元數(shù)據(jù)情報的深度關(guān)聯(lián)與融合性研究。
圖2 大數(shù)據(jù)背景下的突發(fā)事件情報整合系統(tǒng)
大數(shù)據(jù)環(huán)境下,應(yīng)急管理部門中的“智慧應(yīng)急”迅速發(fā)展,應(yīng)急情報網(wǎng)絡(luò)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的緊密結(jié)合形成“三網(wǎng)互聯(lián)”。由此體現(xiàn)了情報收集源已經(jīng)不僅僅局限于應(yīng)急管理內(nèi)部力量,還包括了各政府部門的遙感信息采集系統(tǒng)、社會企業(yè)用戶資料數(shù)據(jù)庫等,多元主體參與的情報信息整合機制建構(gòu)有利于擴大情報信息的來源以及維度,為后期情報分析產(chǎn)品質(zhì)量的提升奠定了重要基礎(chǔ)。
1.政府公共信息資源庫。電子政務(wù)的發(fā)展促進了政府職能的轉(zhuǎn)變,政府正不斷從被動服務(wù)的角色逐漸轉(zhuǎn)變?yōu)閿?shù)據(jù)化服務(wù)型政府。這要求政府擁有自己的公共信息數(shù)據(jù)庫,其內(nèi)容包括:人口戶籍信息、出入境信息、企業(yè)信息、商務(wù)信息以及政府部門信息等。這些數(shù)據(jù)格式統(tǒng)一且信息精準,既方便其他內(nèi)部數(shù)據(jù)庫的信息調(diào)用,也便于政務(wù)公開滿足群眾需求。這些數(shù)據(jù)庫是政府參與應(yīng)急管理情報體系建設(shè)的重要憑證,在應(yīng)急管理資源調(diào)度過程中可以發(fā)揮非常重要的指導(dǎo)性作用。
2.公安業(yè)務(wù)數(shù)據(jù)庫。公安機關(guān)作為突發(fā)事件的主要處置力量,其數(shù)據(jù)庫的建設(shè)同樣不可忽視,其內(nèi)容主要包括:公安業(yè)務(wù)數(shù)據(jù)、治安與犯罪相關(guān)數(shù)據(jù)、應(yīng)急資源數(shù)據(jù)、警力部署數(shù)據(jù)以及以視頻為主的警務(wù)感知層數(shù)據(jù)。通過這些數(shù)據(jù)我們可以對當下社會的社情、輿情和危機事件發(fā)展的狀態(tài)進行實時監(jiān)控,由此生成危機事件處置策略與方案。目前,公安業(yè)務(wù)數(shù)據(jù)在跨省、跨市甚至跨區(qū)的數(shù)據(jù)庫仍然存在一定的信息壁壘,數(shù)據(jù)壁壘與信息孤島是當下公安業(yè)務(wù)數(shù)據(jù)庫的重要障礙,在應(yīng)急管理工作中破除數(shù)據(jù)庫間的信息壁壘是構(gòu)建大數(shù)據(jù)整合機制的首要任務(wù)。
3.社會公共數(shù)據(jù)。社會公共數(shù)據(jù)指的是散布在政府掌控體系之外的各類電子數(shù)據(jù),例如公司數(shù)據(jù)與民商用監(jiān)控數(shù)據(jù)等。此類數(shù)據(jù)在“三網(wǎng)結(jié)合”的趨勢下,發(fā)生了從人工方式調(diào)取紙質(zhì)情報到網(wǎng)絡(luò)調(diào)取與授權(quán)的革命性轉(zhuǎn)變。社會公共數(shù)據(jù)是應(yīng)急管理情報收集中涉及面最廣、內(nèi)容最多、存在形式最繁雜的部分。社會主體是情報體系建設(shè)的重要主體之一,突發(fā)事件處置過程中對于相關(guān)社會公共數(shù)據(jù)的掌控同樣對事態(tài)的發(fā)展與處置方案的生成具有重要的作用。
4.數(shù)據(jù)共享機制的建立?,F(xiàn)階段,無論政府、應(yīng)急管理系統(tǒng)、社會公共系統(tǒng)都有屬于自己的應(yīng)急情報數(shù)據(jù)庫,在突發(fā)事件來臨時難以及時形成聯(lián)動,容易導(dǎo)致事件處置滯后,因而建立多主體聯(lián)動的數(shù)據(jù)共享機制是大數(shù)據(jù)背景下突發(fā)事件情報整合的重要前提。在突發(fā)事件處置過程中通過多方的信息互通與共享將突發(fā)事件制止在初始階段,盡可能將處置成本降至最低。如現(xiàn)階段較為典型的因金融詐騙導(dǎo)致的被騙群眾沖擊政府或公共場所群體事件,對該類型的突發(fā)事件可通過公安系統(tǒng)和銀行系統(tǒng)共同實施轉(zhuǎn)賬凍結(jié)、資金流異常監(jiān)控等方式進行預(yù)防與干預(yù),也可以通過政府授權(quán)加強各數(shù)據(jù)庫融合,進而形成全數(shù)據(jù)鏈條對資金進行追蹤與安全保護,從而為事件的解決提供決策參考與有力的訴訟證據(jù)支持。因此,大數(shù)據(jù)背景下的情報收集與整理都需要多元主體參與以及多部門的協(xié)力共濟,同時建立與完善突發(fā)事件情報整合機制,形成主體明確、分工確切以及責(zé)任明晰的突發(fā)事件情報整合制度,通過制度化建設(shè)確保突發(fā)事件處置過程中情報收集的準確性以及情報利用的高效性。
1.多維度情報整合機制建構(gòu)的整體特性。
(1)廣泛覆蓋性。覆蓋范圍廣闊的信息感知網(wǎng)絡(luò)是構(gòu)建大數(shù)據(jù)背景下智慧應(yīng)急管理的基礎(chǔ)。智能化的情報整合機制及其信息感知網(wǎng)絡(luò)應(yīng)當覆蓋整個社會的時間、空間、對象等各種要素,能夠?qū)崿F(xiàn)情報信息采集與整合的不同屬性、不同形式以及不同密度的需求。當然廣泛的覆蓋性并不是對城市中所有的信息都進行囊括,情報整合的智能化應(yīng)當以系統(tǒng)的適度需求為導(dǎo)向,在標準統(tǒng)一性原則的架構(gòu)下構(gòu)建分層次的全方位、多領(lǐng)域以及廣覆蓋的立體化信息整合平臺,實現(xiàn)信息情報的統(tǒng)一配置監(jiān)控與管理。
(2)深度互聯(lián)性。智能化的情報信息整合機制要體現(xiàn)多維度情報之間的深度關(guān)聯(lián),從而發(fā)掘深層次關(guān)聯(lián)當中的情報價值。在情報整合機制的構(gòu)建過程中,情報網(wǎng)絡(luò)的價值同其網(wǎng)絡(luò)節(jié)點的數(shù)量通常構(gòu)成正比,因而加大多維度情報信息的深度互聯(lián)性可以有效地提升情報發(fā)掘的價值形成應(yīng)急情報網(wǎng)絡(luò)節(jié)點擴充與信息增值的正向反饋,進而構(gòu)建數(shù)據(jù)、平臺、應(yīng)用與終端四位一體的應(yīng)急情報聯(lián)動機制。
把數(shù)量關(guān)系的研究轉(zhuǎn)化為圖形性質(zhì)的研究,或者把圖形性質(zhì)的研究轉(zhuǎn)化為數(shù)量關(guān)系的研究,這種解決問題過程中“數(shù)”與“形”相互轉(zhuǎn)化的研究策略,就是數(shù)形結(jié)合的思想.
(3)協(xié)同共享性。在智能化情報整合機制構(gòu)建過程中應(yīng)盡可能避免資源孤島和信息孤島的現(xiàn)象,因而要增強各系統(tǒng)之間的協(xié)同性與共享性,使得各類資源可以根據(jù)系統(tǒng)的需要各司其職,發(fā)揮其最大的價值與作用,同時使得各子系統(tǒng)中所蘊含的資源性價值能夠按照整體協(xié)同的目標進行統(tǒng)一調(diào)配,加強其傳輸、集中、處理、共享和使用的動態(tài)管控,從而實現(xiàn)整個情報系統(tǒng)價值體系顯著高于各子系統(tǒng)簡單疊加的價值效能。
(4)智能處理性。在大數(shù)據(jù)乃至全數(shù)據(jù)的互聯(lián)網(wǎng)時代,應(yīng)急事件的處置現(xiàn)在面臨的更多的是數(shù)據(jù)的繁雜以及非智能化的篩選與鑒別。多維度情報整合機制建構(gòu)的重要目標之一還包括對所擁有海量信息進行智能化處理的能力,情報分析系統(tǒng)根據(jù)應(yīng)急事件發(fā)展過程中不斷觸發(fā)的各類需要對數(shù)據(jù)進行分析,從而產(chǎn)生所需知識并可以自主進行判斷與預(yù)測,進而實現(xiàn)智能化的決策。
2.多維度情報資源整合體系建設(shè)。突發(fā)事件情報資源維度較多,以突發(fā)事件情報數(shù)據(jù)庫為基礎(chǔ),通過儲存多元異構(gòu)情報并進行清洗、整合,使得數(shù)據(jù)庫與物聯(lián)網(wǎng)、互聯(lián)網(wǎng)連接,通過應(yīng)急管理系統(tǒng)加以綜合授權(quán),進而實現(xiàn)物聯(lián)網(wǎng)和互聯(lián)網(wǎng)收集情報信息反饋至數(shù)據(jù)庫進行處理,實現(xiàn)不同資源主體之間的綜合聯(lián)動應(yīng)用。在突發(fā)事件處置過程中可以實時調(diào)用數(shù)據(jù)庫尋找歷史相似數(shù)據(jù),并同時得到標準處置流程,及時為突發(fā)事件態(tài)勢感知與決策服務(wù)。通過多維度情報資源的綜合應(yīng)用,將突發(fā)事件情報收集與整理流程標準化,同時促進應(yīng)急情報系統(tǒng)在數(shù)據(jù)庫中通過機器學(xué)習(xí)不斷完成自身的智能化進步。
(1)物理情報的儲存。就數(shù)據(jù)發(fā)展與存儲的態(tài)勢而言,物理性情報信息的存儲并沒有完全被云存儲所替代。對于收集來的物理性情報,各機構(gòu)都應(yīng)進行妥善儲存。應(yīng)急管理情報部門應(yīng)建立有效的突發(fā)事件綜合情報存儲機制,將物理資料運用數(shù)據(jù)情報的編號方式進行編碼,并將內(nèi)容通過掃描等方式保存副本在云端,同時通過一定的技術(shù)手段將歷史性物理情報轉(zhuǎn)變?yōu)楝F(xiàn)代計算機可檢索的數(shù)據(jù)性情報,在突發(fā)事件處置過程中,既能快速調(diào)用原件,也能在線查看副本資料并與其他數(shù)據(jù)性資料進行交叉查詢與碰撞比對。
(2)建立突發(fā)事件情報數(shù)據(jù)庫。在大數(shù)據(jù)背景下構(gòu)建突發(fā)事件情報整合機制,從本質(zhì)而言最底層架構(gòu)應(yīng)當為多源數(shù)據(jù)的數(shù)據(jù)庫建設(shè),其基本建構(gòu)理念應(yīng)當包含如下模塊:
第一,數(shù)據(jù)清洗模塊。情報在收集后雖然經(jīng)歷了濾重,但大多數(shù)數(shù)據(jù)并非處于完全無污染狀態(tài),結(jié)構(gòu)不一致、數(shù)據(jù)殘缺不全、重復(fù)記錄甚至人工操作失誤等情況較為常見。因而情報在整理后還需要進行清理才能入庫存檔,其過程主要分為兩個步驟:清洗不規(guī)范的“非純凈”數(shù)據(jù)和統(tǒng)一數(shù)據(jù)格式。為了對非純凈數(shù)據(jù)進行數(shù)據(jù)清洗,首先需要規(guī)范情報信息的格式。在突發(fā)事件中,情報可以通過“關(guān)鍵詞、來源、時間、等級”等不同格式與維度進行規(guī)范。這樣既可以方便后續(xù)的情報數(shù)據(jù)調(diào)取,同時也兼顧數(shù)據(jù)清洗與跨庫交換。需要清洗的數(shù)據(jù)通常展現(xiàn)出不完整、不一致或相似重復(fù)的特點。針對不完整數(shù)據(jù),可以通過缺失參數(shù)填充的方式補全數(shù)值,并對缺失的數(shù)值結(jié)論進行估算,最終輸出完整的數(shù)據(jù)。針對不一致的數(shù)據(jù),在對數(shù)據(jù)進行檢測后需進行預(yù)處理以規(guī)范格式。如果出現(xiàn)了新的不規(guī)范,要對新的數(shù)據(jù)進行再次檢測與修復(fù)直至其符合入庫與檢索格式要求;針對重復(fù)數(shù)據(jù),在經(jīng)過濾重后還需要對重復(fù)數(shù)據(jù)進行合并,通過加權(quán)進行等級評估,最終按時間或類別序號進行歸檔。
第二,突發(fā)事件數(shù)據(jù)倉庫。數(shù)據(jù)庫的重要功能在于保存和運輸數(shù)據(jù)。而數(shù)據(jù)倉庫則可以集儲存、運輸、清洗、轉(zhuǎn)換、集成為一體,將應(yīng)急管理系統(tǒng)內(nèi)多源數(shù)據(jù)庫進行整合,通過將數(shù)據(jù)拆分、映射、濾重統(tǒng)一格式后進入數(shù)據(jù)倉庫。當情報需要被使用時,也可以運用統(tǒng)一格式將其輸出,無須再進行轉(zhuǎn)換處理,適應(yīng)多種數(shù)據(jù)應(yīng)用部門的專業(yè)數(shù)據(jù)庫以及社會數(shù)據(jù)子系統(tǒng)的需要。突發(fā)事件的情報收集與防控處置作為應(yīng)急管理部門情報建設(shè)的最基礎(chǔ)環(huán)節(jié),實時產(chǎn)生數(shù)量級龐大的各類數(shù)據(jù),因此,數(shù)據(jù)倉庫的建設(shè)也成為了數(shù)據(jù)庫建設(shè)中的最核心架構(gòu)之一。
第三,可視化檢索系統(tǒng)。為了方便在情報分析過程中對于信息的調(diào)取,對突發(fā)事件數(shù)據(jù)庫的檢索系統(tǒng)需要進行有序化規(guī)范。對突發(fā)事件情報相關(guān)信息進行統(tǒng)一,形成數(shù)據(jù)庫。數(shù)據(jù)庫內(nèi)的內(nèi)容不能以碎片化知識進行歸檔,必須對突發(fā)事件全貌加以理解并進行整合,最終形成知識鏈與知識圖譜。通過語義整合構(gòu)建突發(fā)事件演化特征,對突發(fā)事件處置過程進行過程構(gòu)建,厘清各階段與各特征及概念之間的關(guān)系,使得情報數(shù)據(jù)被調(diào)用時利于分析人員對突發(fā)事件的各個方面具有更為直觀的理解,通過可視化技術(shù)標注出關(guān)鍵詞與關(guān)鍵要素信息,幫助指揮者在決策中迅速找到相關(guān)關(guān)鍵點。在此基礎(chǔ)上可通過圖形可視化技術(shù)或社會關(guān)系網(wǎng)絡(luò)可視化技術(shù)將情報分析中的重點要素進行關(guān)聯(lián),以便將情報分析人員的心智模型轉(zhuǎn)化為易于復(fù)制與傳遞的可視化模型。
(3)物聯(lián)網(wǎng)信息化處理。物聯(lián)網(wǎng)連接著社會生活乃至應(yīng)急管理工作的方方面面,將網(wǎng)絡(luò)的服務(wù)延伸到物體層面,是對物體特征進行信息化處理的過程。無論是情報收集還是情報整理,都可以通過對物聯(lián)網(wǎng)的應(yīng)用進行信息化處理。物聯(lián)網(wǎng)不僅有自身的感知技術(shù),可以自行對情報進行收集,并通過自身的信息處理能力將獲得的信息轉(zhuǎn)化為有價值的情報,通過云計算平臺進行格式規(guī)范,最終將高效整合后的情報反饋給應(yīng)急管理分析系統(tǒng)。對于物聯(lián)網(wǎng)自動獲得和處理的信息,實時性的部分能上傳至云計算平臺直接使用,需要儲存的部分可以存到應(yīng)急管理情報數(shù)據(jù)倉庫進行儲備。
3.多元異構(gòu)數(shù)據(jù)的情報整合方法。大數(shù)據(jù)環(huán)境下的突發(fā)事件情報來源多種多樣,情報結(jié)構(gòu)也較為復(fù)雜,主體來源包括交通卡口以及治安卡口信息、移動終端與自助終端信息、數(shù)據(jù)工作站以及視頻監(jiān)控等信息,面對復(fù)雜多樣的突發(fā)事件情報信息來源,我們必須建立以數(shù)據(jù)驅(qū)動為理念的情報整合方式,通過突發(fā)事件情景建模、多源異構(gòu)信息的動態(tài)融合以及多維關(guān)聯(lián)可視化分析,實現(xiàn)分析結(jié)果的智能化解讀,最終實現(xiàn)突發(fā)事件處置過程中指揮、防控與處置的智能化,如圖3所示。
圖3 大數(shù)據(jù)背景下的多維度突發(fā)事件情報整合架構(gòu)
在大數(shù)據(jù)環(huán)境下突發(fā)事件情報從來源解讀可分為同型異源情報與同源異構(gòu)情報。同型異源情報通常是指運用相同的情報整理方法得到的情報,但由于學(xué)科、領(lǐng)域、部門等壁壘無法實現(xiàn)情報互通互聯(lián),由此形成了同型異源情報;同源異構(gòu)情報是指在同一信息源的情況下,對數(shù)據(jù)進行不同的處理,形成了表現(xiàn)形式為文字、圖片、錄音以及視頻等形式的結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。對于多元異構(gòu)信息,需要針對其多元表示、相關(guān)性原理以及意義構(gòu)建三個特點,運用數(shù)據(jù)記錄的濾重、要素映射與拆分以及異構(gòu)數(shù)據(jù)的加權(quán)三種方法進行情報整合。
(1)數(shù)據(jù)記錄的濾重。在數(shù)據(jù)融合整理的過程中情報分析人員通常會發(fā)現(xiàn)同型異源情報中有許多一致之處,因而需要對此類數(shù)據(jù)情報的一致性內(nèi)容進行濾重。通過數(shù)據(jù)記錄的去重首先可以減少相同的數(shù)據(jù)的干擾,進而降低情報分析和整理的負擔(dān)。在濾重的基礎(chǔ)上對相似信息進行歸類,并通過設(shè)定唯一格式進行儲存,方便后期檢索與分析利用。
(2)要素映射與拆分。在文字信息中大多數(shù)信息由字段組成,但由于中華文化語義表達的多元性,在數(shù)字字段融合的過程中,擁有相同標識的字段可以直接融合,而擁有差異與互補的字段,可以統(tǒng)一為其中的任一個字段的別名進行歸納整理,這樣通過關(guān)鍵詞標識其代號或別名就可以實現(xiàn)精準的查詢與檢索。對于包含要素的字段,整合過程中還可以通過拆分關(guān)鍵詞的方式實現(xiàn)檢索效率的提升,以“大數(shù)據(jù)環(huán)境下突發(fā)事件的情報收集與整理”為例,可將其拆分為“大數(shù)據(jù)、突發(fā)事件、情報收集、情報整理”四個關(guān)鍵詞進行整理,對涉及單位、作者、年份的信息同樣可以拆分檢索,以免相似的關(guān)鍵詞混肴了核心情報信息。
(3)異構(gòu)數(shù)據(jù)的加權(quán)。異構(gòu)數(shù)據(jù)的加權(quán)可以理解為對情報信息進行分級整理,當異構(gòu)數(shù)據(jù)分為文字、圖片、錄音、視頻后,對這些數(shù)據(jù)進行加權(quán)整合。加權(quán)方式通常分為積分法與統(tǒng)計實證法。在突發(fā)事件的情報整理中,積分法是一種較為基礎(chǔ)的手段,通過對數(shù)據(jù)信息進行積分分級,情報人員對需要審核分級的情報信息進行評分,以兩人為基準并取其平均分。若是兩人積分差距過大,則交由第三人或者交由專家進行積分,取較為接近的兩人平均分進行評級。得到等級后進行儲存,當需要對此類情報進行調(diào)取時,通過等級我們就能對情報的輕重緩急以及價值信息作出判斷。統(tǒng)計實證法是突發(fā)事件情報整理的另一種重要手段,通過圍繞一個或一類級別較高的情報,將級別較低的情報與其進行整理,例如,以一個或多個突發(fā)事件現(xiàn)場視頻為核心,將相應(yīng)的現(xiàn)場圖片、文字情報與視頻整理為一個更全面的情報知識關(guān)聯(lián)圖譜,這樣可以展現(xiàn)出突發(fā)事件多元的信息維度和一個較為完整的事實概貌,情報分析人員從而更加易于從中找尋隱含的線索,為突發(fā)事件處置與決策提供了思維模型。
1.多元異構(gòu)數(shù)據(jù)的全網(wǎng)發(fā)掘。大數(shù)據(jù)環(huán)境下針對數(shù)據(jù)的海量與復(fù)雜性特征,單一網(wǎng)絡(luò)以及單一形式的數(shù)據(jù)整合已經(jīng)難以滿足應(yīng)急處置決策需求,對于多元異構(gòu)的全網(wǎng)數(shù)據(jù)信息進行深度挖掘是突發(fā)事件情報整合的發(fā)展趨勢。全網(wǎng)信息挖掘是在已知情報對象樣本的情況下,提取情報特征進行分析研判,從各種網(wǎng)絡(luò)與系統(tǒng)中進行過濾和抓取信息,經(jīng)過歸納、儲存、加工以及碰撞等方法,抽取其潛在價值,挖掘出能夠幫助應(yīng)急管理系統(tǒng)進行人流管控、突發(fā)事件預(yù)警、社會面防控、領(lǐng)導(dǎo)層決策等的重要關(guān)鍵要素。全網(wǎng)內(nèi)容挖掘即通過搜索相關(guān)文字、圖片、地圖、音頻以及視頻等多類型數(shù)據(jù),從中發(fā)掘有價值信息。通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、應(yīng)急管理平臺、社會公共網(wǎng)絡(luò)等多種途徑獲得更多元的動態(tài)性信息,對正在發(fā)生的突發(fā)事件現(xiàn)場態(tài)勢(通過現(xiàn)場感知系統(tǒng))作出快速研判,由此生成及時精準的情報分析產(chǎn)品。
通過全網(wǎng)網(wǎng)絡(luò)結(jié)構(gòu)挖掘?qū)W(wǎng)絡(luò)中的組織結(jié)構(gòu)和鏈接中包含的隱藏信息進行深度關(guān)聯(lián),其實現(xiàn)途徑主要可分為Web挖掘、內(nèi)部結(jié)構(gòu)挖掘、URL挖掘三個方面。Web挖掘可以通過網(wǎng)頁主題與網(wǎng)頁內(nèi)容進行自動聚類和分類,對相似興趣用戶進行篩選,對網(wǎng)頁訪問日志進行識別。在突發(fā)事件中,可以通過Web挖掘?qū)ふ耶斒氯讼鄳?yīng)的關(guān)系人,收集當事人的相關(guān)情報,進而挖掘隱藏情報信息。內(nèi)部結(jié)構(gòu)挖掘可以獲取網(wǎng)絡(luò)內(nèi)部組織結(jié)構(gòu),通過可視化技術(shù)可以將網(wǎng)絡(luò)信息進行結(jié)構(gòu)分析,發(fā)掘關(guān)鍵要素之間隱藏的內(nèi)在關(guān)聯(lián)。其中較為著名的“六度分離理論”(最多通過五個人你就能夠認識世界范圍內(nèi)任何一個陌生人)就是一個經(jīng)典案例。在突發(fā)事件情報收集過程中,情報分析人員可以通過可視化技術(shù)將重點人員的通話記錄、人物關(guān)系等信息進行內(nèi)部結(jié)構(gòu)挖掘而得到隱藏信息。URL挖掘是指URL作為網(wǎng)絡(luò)資源的唯一地址標識,其具有時序、正交、長度等有效特征。利用此類特征分析人員可以對網(wǎng)頁進行實時信息讀取、網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化、網(wǎng)頁類別鑒別等信息整合工作。URL通過識別“首頁式、列表式、正文式”三大特征對后臺進行解構(gòu),解決人工分類和人工識別時間耗費的問題。在突發(fā)事件情報收集中,URL識別能對網(wǎng)絡(luò)突發(fā)事件進行最迅速的網(wǎng)絡(luò)數(shù)據(jù)層級分類,自動識別目錄信息等相關(guān)要素,使應(yīng)急管理部門可以在第一時間從源頭掌控與遏制信息流的傳播,防止突發(fā)事件不良影響的擴大。與此同時,在進行全網(wǎng)結(jié)構(gòu)挖掘的基礎(chǔ)上推進網(wǎng)絡(luò)用法挖掘,進而發(fā)現(xiàn)用戶在行為過程中產(chǎn)生有價值的信息,利用網(wǎng)絡(luò)用法發(fā)掘技術(shù)掌握用戶在網(wǎng)絡(luò)中的行為軌跡,包括服務(wù)器訪問、瀏覽器日志、注冊信息以及搜索內(nèi)容等,由此預(yù)測和分析用戶的偏好以及活動軌跡,從而掌握突發(fā)事件發(fā)展態(tài)勢。
2.多元異構(gòu)情報全網(wǎng)發(fā)掘的實現(xiàn)路徑。在大數(shù)據(jù)環(huán)境下,應(yīng)急管理部門通過全網(wǎng)信息挖掘的方法對突發(fā)事件進行情報收集,通過挖掘隱藏信息對事件發(fā)展態(tài)勢進行監(jiān)控和預(yù)測,具有代表性的發(fā)掘方法包括如下技術(shù):
(1)搜索引擎挖掘。通過應(yīng)急管理內(nèi)部平臺和互聯(lián)網(wǎng)搜索引擎之間的信息碰撞,對關(guān)鍵人員的通訊號碼、人員信息、涉案物品以及行動軌跡等數(shù)據(jù)信息進行碰撞、研判與比對而獲取隱藏情報,進而得到重要人員的關(guān)鍵線索。由于搜索引擎的多樣性,情報人員通過多引擎變換的方法搜索有關(guān)人員在衣食住行、言論自由方面的實時信息,實現(xiàn)了從傳統(tǒng)的人對人、人對物且以文字為主的基礎(chǔ)性情報收集到多要素整合、多結(jié)構(gòu)情報融合的實時性情報整合模式的轉(zhuǎn)變。
(2)綁定信息查詢。隨著大數(shù)據(jù)的發(fā)展,微信、支付寶和手機號碼已經(jīng)成為民眾日常生活不可或缺的生活應(yīng)用組成部分。在生活中,我們會習(xí)慣用手機號去注冊許多網(wǎng)站的賬號,用微信去綁定眾多應(yīng)用程序,用支付寶綁定淘寶賬號,通過這三個主要的注冊綁定信息,我們能清晰地查詢相關(guān)人員的身份、通訊地址、生活軌跡等信息,從而提高情報檢索效率。
(3)訪問日志。用戶在使用計算機時計算機會產(chǎn)生相應(yīng)的日志,而計算機訪問互聯(lián)網(wǎng)過程中也同樣會產(chǎn)生相關(guān)的痕跡。情報收集部門可以通過挖掘儲存的日志信息,對相關(guān)的網(wǎng)絡(luò)訪問痕跡進行挖掘而掌握異常動態(tài),并對其檢索的關(guān)鍵詞進行碰撞比對進而發(fā)現(xiàn)潛在信息關(guān)聯(lián)。還可以通過其IP地址查詢其登錄位置,通過URL地址分析其檢索信息,以印證已獲得情報與先前情報信息的符合程度。
(4)注冊登記信息。注冊登記信息是指網(wǎng)站用戶注冊信息以及網(wǎng)頁用戶注冊信息。用戶在網(wǎng)頁上注冊通常需要用到個人信息,當需要查找相關(guān)社交信息時可通過其在網(wǎng)絡(luò)上的實名登記信息進行調(diào)查,以最快掌握其真實身份信息。對于網(wǎng)站主體的相關(guān)認證,情報人員可以通過網(wǎng)絡(luò)監(jiān)管部門的注冊登記信息確認該網(wǎng)站的創(chuàng)建者、持有者、直接管理人員、服務(wù)器管理人員、服務(wù)器登記信息等情報,解決情報收集和固定證據(jù)定罪量刑問題。
(5)GPS定位信息。GPS定位信息包括導(dǎo)航用GPS定位和移動運營商網(wǎng)絡(luò)GPS定位。通過導(dǎo)航用GPS定位可以確定關(guān)鍵要素移動軌跡;整理車載GPS和道路監(jiān)控攝像頭的記錄,我們可以得到過去30天甚至更長時間的人員軌跡,從而分析其行為特征,進而預(yù)測突發(fā)事件發(fā)展態(tài)勢。通過運營商GPS網(wǎng)絡(luò)定位,我們能獲得車輛交通以及區(qū)域人流等信息,在一些人流密集的活動中可以起到人流管控與疏導(dǎo)的作用,盡最大可能減少因突發(fā)事件而產(chǎn)生的次生或衍生災(zāi)害。
3.多元性情報的可視化呈現(xiàn)??梢暬尸F(xiàn)與檢索同樣是情報整合的常用模式與手段之一。無論是結(jié)構(gòu)化、半結(jié)構(gòu)化還是非結(jié)構(gòu)化數(shù)據(jù),都可以通過可視化技術(shù)將信息展現(xiàn)出來,并通過不同信息間的關(guān)系形成關(guān)系鏈與證據(jù)鏈。以IBM公司研發(fā)的I2(Information to Image)可視化情報分析系統(tǒng)為例,該系統(tǒng)能針對不同來源、不同結(jié)構(gòu)的情報源和數(shù)據(jù)結(jié)構(gòu)形成信息網(wǎng)絡(luò),通過圖表、網(wǎng)格以及圖形等方式展現(xiàn),將情報中實體、時間以及空間關(guān)系通過網(wǎng)絡(luò)、層次、分組、時間序列、主體等布局方式直觀地展現(xiàn)出來。如圖4所示,利用I2 Analyst’s Notebook可視化分析軟件對于此次新冠肺炎疫情防控中的一名感染者軌跡進行可視化呈現(xiàn),通過可視化的直觀形式描繪出該人的出行史以及密切接觸人群,進而為下一步部署針對性的應(yīng)急解決方案提供精準的情報支撐與決策參考。
圖4 I2 Analyst’s Notebook可視化情報整合