袁薈嶺
(西安建筑科技大學(xué),陜西 西安 710311)
按照《中華人民共和國突發(fā)事件應(yīng)對法》中對突發(fā)事件的分類,頂層包括自然災(zāi)害、事故災(zāi)害、公共衛(wèi)生事件和社會安全事件4 個大類,各領(lǐng)域?qū)<覍W(xué)者對本學(xué)科范疇內(nèi)的特定事件進(jìn)行了大量研究。陶鵬等[1]通過建立聯(lián)防聯(lián)控機制的文本數(shù)據(jù)庫并開展內(nèi)容分析,歸納出現(xiàn)實場景下聯(lián)防聯(lián)控機制的功能圖景及特點;于浩恬等[2]運用結(jié)構(gòu)化方法分析歷史事件,構(gòu)建案例情景庫,為建立情景-應(yīng)對管理平臺打下基礎(chǔ),實現(xiàn)對軌道交通運營系統(tǒng)的安全動態(tài)監(jiān)管。
文獻(xiàn)中,突發(fā)事件有不同的分類體系。美國國土安全部將緊急情況分為生物威脅、化學(xué)威脅、干旱、地震、火災(zāi)、洪水、放射性和核事故等自然災(zāi)害。
在日本的“災(zāi)害應(yīng)對基本法”中,緊急情況分為自然災(zāi)害和人為災(zāi)害,前者包括天氣、地震和火山,后者包括技術(shù)災(zāi)害和綜合災(zāi)害。突發(fā)事件有不同的分類體系。根據(jù)國家質(zhì)量監(jiān)督檢驗檢疫總局和國家標(biāo)準(zhǔn)化管理委員會2017 年聯(lián)合發(fā)布的GB/T 35561—2017《突發(fā)事件分類與編碼》[3],將突發(fā)事件概括為4 個一級分類、37 個二級分類、171 個三級分類。本研究將突發(fā)事件分為4 類,即自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會安全事件。由于特大城市突發(fā)事件可能演化為多種類型的子事件,因此本文將特大城市突發(fā)事件演化描述為一個多標(biāo)簽分類問題。一些最先進(jìn)的方法包括多標(biāo)簽支持向量機、多標(biāo)簽集成分類器鏈、多標(biāo)簽邏輯回歸和多標(biāo)簽彈性網(wǎng)[4]。
20 世紀(jì)80 年代,有學(xué)者以東京和大阪等首都圈的發(fā)展為例指出,一個城市發(fā)展到一定階段必然會比其他中小城市的發(fā)展速度慢[5]。從此關(guān)于特大城市發(fā)展的理論研究開始從城市布局、經(jīng)濟結(jié)構(gòu)、基礎(chǔ)設(shè)施、城市交通系統(tǒng)發(fā)展到對綜合問題的探索。張鋒[6]指出隨著特大城市人口的流動性、集聚度和規(guī)模性加劇,以自然災(zāi)害、事故、公共衛(wèi)生事件及群體性事件為重點的特大城市應(yīng)急管理面臨嚴(yán)峻的風(fēng)險挑戰(zhàn)。余珂等[7]提出特大城市具有人口高度密集、資源要素高度集聚、輻射能力大等顯著特征,需要聚焦特大城市人口特征、公共衛(wèi)生防疫體系、城市治理等方面。
學(xué)習(xí)向量量化(Learning vector quantification,LVQ)是一種結(jié)構(gòu)簡單、性能有效的監(jiān)督學(xué)習(xí)方法。近年來,LVQ 神經(jīng)網(wǎng)絡(luò)被應(yīng)用在生活的各方面。李江等應(yīng)用模糊C 均值聚類對臺區(qū)負(fù)荷的用電類型進(jìn)行劃分,基于學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)建立LSF 預(yù)測模型;李建閩等[8]提出了一種基于雙分辨率S 變換和學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量擾動信號檢測方法;舒大松[9]利用LVQ 神經(jīng)網(wǎng)絡(luò)識別放射性核素。實驗結(jié)果表明,該模型具有良好的預(yù)測性能。
本節(jié)將介紹一種新方法,用于演化預(yù)測特大城市非常規(guī)突發(fā)事件。圖1 示意性描述了擬議方法的框架。首先,收集描述世界各地特大城市非常規(guī)突發(fā)事件的數(shù)據(jù),對原始數(shù)據(jù)進(jìn)行預(yù)處理生成可用分類算法處理的規(guī)則數(shù)據(jù)集;然后,用多標(biāo)簽LVQ 分類算法處理數(shù)據(jù),構(gòu)建預(yù)測模型;最后,通過比較測試數(shù)據(jù)集中已識別的類別標(biāo)簽和真實的緊急事件標(biāo)簽,評估預(yù)測模型的有效性。
圖1 非常規(guī)突發(fā)事件演變預(yù)測框架研究
LVQ 神經(jīng)網(wǎng)絡(luò)是一種基于距離的分類算法,屬于前向神經(jīng)網(wǎng)絡(luò)的一種類型。LVQ 由在地圖上規(guī)則排列的神經(jīng)元陣列組成。每個神經(jīng)元都與一個定義類區(qū)域的原型相關(guān)聯(lián)。LVQ 以競爭性的方式訓(xùn)練,通過計算輸入和每個原型之間的距離,只激活最佳匹配神經(jīng)元(BMU)。采用這種方式,以BMU 為特征的類邊界被相應(yīng)調(diào)整。當(dāng)輸入與BMU 具有相同的類標(biāo)簽時,它會對原型產(chǎn)生積極的影響。
為了適應(yīng)訓(xùn)練數(shù)據(jù)具有多標(biāo)簽的特點,提出了一種LVQm 算法。對于每個輸入x,計算x與每個神經(jīng)元之間的距離,得到BMU,就像在標(biāo)準(zhǔn)LVQ 中所做的那樣。類別匹配度由BMU 的標(biāo)簽集和范圍從0(表示完全不相交的標(biāo)簽集)到1(表示絕對相同的標(biāo)簽集)的輸入來度量。閾值δ∈[0,1]用于確定是否調(diào)整BMU。如果匹配度不小于閾值,則按照匹配度和學(xué)習(xí)率的比例向輸入調(diào)整Proto-265 型BMU。代替常用的多數(shù)投票原則,MAP 神經(jīng)元被分配了一個由所有不同的投影輸入實例的標(biāo)簽組成的集合。LVQm 算法的具體實現(xiàn)過程如下。
由于多標(biāo)簽分類的評價比單標(biāo)簽分類復(fù)雜,本文提出了一種基于績效評價的信息檢索和推薦方法。
具體步驟如下:①給定實驗數(shù)據(jù)集,進(jìn)行5 次交叉驗證,即將D分為5 次,其中4 次為訓(xùn)練數(shù)據(jù),其余為測試數(shù)據(jù)。②對于每個生成的訓(xùn)練數(shù)據(jù)集,使用提出的LVQm 算法構(gòu)建分類模型。閾值δ是根據(jù)標(biāo)準(zhǔn)的最佳值從預(yù)設(shè)列表{0,0.1,···,1}中選擇的,該標(biāo)準(zhǔn)可以是準(zhǔn)確率、召回率、精確度、F1 或HL,具體取決于應(yīng)用要求。③將測試數(shù)據(jù)輸入分類器,并根據(jù)預(yù)測度量對性能進(jìn)行評估。④隨機數(shù)據(jù)分割,重復(fù)10 次,計算平均結(jié)果。
演變既是突發(fā)事件發(fā)展擴大的結(jié)果,也是非常規(guī)突發(fā)事件最典型的特殊性?;趹?yīng)急管理的全生命周期,將非常規(guī)突發(fā)事件應(yīng)急管理過程分為減少、準(zhǔn)備、響應(yīng)和恢復(fù)4 個階段。
在約簡階段,對可能的子事件進(jìn)行預(yù)測后可阻止演化動因消滅在萌芽狀態(tài),避免損失。要采用德爾菲法等成熟、穩(wěn)健的專家調(diào)查方法來分析演變模式和對策,更要在事件的早期階段進(jìn)行演變預(yù)測。
在準(zhǔn)備階段,對事件演化預(yù)測結(jié)果的要求是及時預(yù)測和及早脫鉤。一旦預(yù)測到演變,就可以通過實時觀測和合理安排避讓和制導(dǎo)策略來應(yīng)對,提前阻斷、減緩、轉(zhuǎn)移和消除破壞性能量。
在響應(yīng)階段,演化子事件類型的預(yù)測結(jié)果強調(diào)決策的科學(xué)性和準(zhǔn)確性。決策主體應(yīng)根據(jù)驅(qū)動子事件的基本因素進(jìn)行綜合評價,確保決策的科學(xué)性。決策的實施、實踐的管理需要處置主體的保障。
在恢復(fù)階段,對非常規(guī)突發(fā)事件的演變預(yù)測有助于全面監(jiān)測和長期跟蹤。特大城市演化具有滯后性和多樣性,有必要及時跟蹤反饋結(jié)果,持續(xù)監(jiān)測和跟蹤可能的進(jìn)化路徑。
4 個功能(NA、AC、HE 和SE)表示主要事件的類型,類標(biāo)簽表示子事件的類型。圖2 概述了實驗數(shù)據(jù)的事件類型和子事件類型的分布。
圖2 事件類型和子事件類型的分布
非常規(guī)突發(fā)事件的演化預(yù)測可以歸結(jié)為一個多標(biāo)簽分類問題。
給定數(shù)據(jù)集D={(x1,c1),(x2,c2),…,(xN,CN)},其中xi是25 維的二進(jìn)制向量,Ci是預(yù)定義類別標(biāo)簽C={NA,AC,HE,SE}的子集,Ci≠?。該問題的目標(biāo)是設(shè)計一種學(xué)習(xí)算法,生成一個能夠準(zhǔn)確預(yù)測未知實例標(biāo)簽的分類器f:D→P(C)。
使用5 倍交叉驗證對各種大小的地圖的特大城市數(shù)據(jù)的10 個時期的預(yù)測結(jié)果。對于每個模型,性能在于準(zhǔn)確率(LVQm Acc 算法)、召回率(LVQm Rec 算法)、精確度(LVQm 預(yù)算法)、F1(LVQm-F1 算法)和HL(LVQm HL)算法。
圖3 顯示了使用LVQm-Accuracy 算法分別針對4種類型的子事件的誤拒率和誤警率。在2 種主要類型的子事件(即事故災(zāi)難AC 和社會安全事件SE)上的錯誤拒絕率和錯誤警報率都比在另外2種次要類型(即自然災(zāi)害NA 和公共衛(wèi)生事件HE)上好得多。建議采用抽樣、閾值、成本敏感分類等方法來解決不平衡問題。
圖3 4 類子事件的誤拒率和誤報率
在對比研究中,采用KNN(K近鄰)和SVM(支持向量機)2 種廣泛使用的多標(biāo)簽分類方法來預(yù)測突發(fā)事件的子事件類型。對于給定的K,計算未知實例與每個訓(xùn)練樣本之間的距離,并選擇K個近鄰。然后通過所有檢索到的鄰居的標(biāo)簽集對未知實例進(jìn)行分類。本實驗還使用5 次交叉驗證進(jìn)行10 個時期的實驗,如圖4 所示。在圖4 中,將KNN(分別取K=1、3、5、7)和支持向量機分別與中等大小的LVQm 的不同變體在準(zhǔn)確率、召回率、精確度、F1 和HL 方面進(jìn)行了比較。KNN 的K值越大,查全率越高,查準(zhǔn)率越低。LVQm 的所有變種在綜合測度F1 方面都優(yōu)于多標(biāo)簽KNN 和支持向量機。
圖4 多標(biāo)簽預(yù)測的性能比較
本文的工作建立在傳統(tǒng)LVQ 算法的基礎(chǔ)上,提出利用一種新的更新規(guī)則來處理多標(biāo)簽數(shù)據(jù)。提出的LVQ 分類器可以有效預(yù)測突發(fā)事件的演變。本文的貢獻(xiàn)表現(xiàn)在3 方面:首次嘗試通過對突發(fā)事件及其應(yīng)對活動的刻畫來預(yù)測非常規(guī)突發(fā)事件的演變;LVQ 分類器采用新的學(xué)習(xí)方案,能夠有效處理多標(biāo)簽數(shù)據(jù),預(yù)測次生災(zāi)害;利用世界各地特大城市非常規(guī)突發(fā)事件的真實數(shù)據(jù)集討論該預(yù)測模型效益。