王 琳,楊天青,邱 鵬,郝 婧
(1.貴州省工程防震研究院,貴陽 550001;2.中國地震臺網(wǎng)中心,北京 100045)
地震是人類共同面臨的突發(fā)性較強(qiáng)、致災(zāi)過程復(fù)雜的自然災(zāi)害之一,我國是世界上地震活動最強(qiáng)烈、地震災(zāi)害最嚴(yán)重的國家之一。傳統(tǒng)的震后應(yīng)急決策主要是根據(jù)現(xiàn)行的國家和地方地震應(yīng)急預(yù)案、條例、規(guī)范、標(biāo)準(zhǔn)結(jié)合決策者的個人經(jīng)驗等來部署現(xiàn)場工作隊的規(guī)模、結(jié)構(gòu)情況,這可能導(dǎo)致出隊方案并非最優(yōu),且由于不同工作任務(wù)對接存在的脫節(jié),決策部署效率低且人為因素影響較大,本文主要針對地震應(yīng)急工作實施過程中存在的這些問題進(jìn)行研究,擬采用支持向量機(jī)多屬性回歸計算模型,為決策者制定出隊方案提供一定參考。
目前數(shù)據(jù)挖掘和人工智能技術(shù)的快速發(fā)展,多種推薦算法在輔助決策、個性化智能推薦等方面得到了廣泛應(yīng)用,如我們所熟知的購物平臺商品智能推送,新聞媒體、公眾號的信息推薦、音樂播放平臺的每日歌單推薦等。遺傳算法是建立在遺傳學(xué)與自然選擇基礎(chǔ)上的自適應(yīng)搜索過程,作為解決復(fù)雜問題的一種有效手段,從一個初始化的群體出發(fā),選取性能優(yōu)良的個體,在這些優(yōu)良個體之間進(jìn)行生物化的繁殖,使它們一代代地進(jìn)化到解空間中越來越好的區(qū)域,從而最終得到最優(yōu)解。K 最近鄰分類算法(k-nearest neighbor,簡稱KNN 推薦算法)的原理是一個樣本在某一特征空間中,與其最相似的k 個樣本中的大部分屬于某一類,則該樣本也屬于這一類。
地震的發(fā)生隨機(jī)性強(qiáng),破壞性地震致災(zāi)范圍廣、強(qiáng)度大,給人民的生命財產(chǎn)安全、社會秩序的穩(wěn)定造成重大威脅,因此地震現(xiàn)場應(yīng)急工作時間緊任務(wù)重,對應(yīng)急現(xiàn)場工作隊員的應(yīng)急應(yīng)變能力,專業(yè)知識儲備情況等要求較高。本文依據(jù)應(yīng)急預(yù)案、條例等,對應(yīng)急現(xiàn)場隊成員的情況進(jìn)行分析后,發(fā)現(xiàn)應(yīng)急現(xiàn)場隊成員參與地震應(yīng)急工齡、實際現(xiàn)場應(yīng)急次數(shù)、到單位的最快集合時間為三個較為重要的,代表現(xiàn)場隊員地震應(yīng)急處置能力的屬性,本文利用遺傳算法全局最優(yōu)收斂的特性對支持向量機(jī)的上述三個屬性參數(shù)進(jìn)行尋優(yōu),采用支持向機(jī)回歸的方法擬合不同屬性,有效解決三個不同屬性之間的關(guān)聯(lián)性問題,再采用KNN 算法推薦得到最優(yōu)應(yīng)急團(tuán)隊[1-4],以得到最優(yōu)解的支持向量機(jī)推薦現(xiàn)場隊員。
(1)由于應(yīng)急團(tuán)隊不同屬性的性質(zhì)不同,通常具有不同的數(shù)量級,若各屬性間的水平相差很大時直接用原始屬性值進(jìn)行分析,就會突出數(shù)值較高的屬性在綜合分析中的作用,相對削弱數(shù)值水平較低屬性的作用。因此,為了保證結(jié)果的可靠性,需要對原始屬性數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,再利用標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。本文研究中的備選應(yīng)急隊員在工作年齡、應(yīng)急次數(shù)、應(yīng)急集合時間三種屬性之間關(guān)聯(lián)性較小,因此采用min-max 標(biāo)準(zhǔn)化處理方法,該方法稱之為離差標(biāo)準(zhǔn)化,對這三種屬性進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化線性變換,目的是將結(jié)果值映射到0 到1 之間[2],函數(shù)公式如下:
式(1)中:xmin為樣本數(shù)據(jù)最小值;xmax為樣本數(shù)據(jù)最大值;x為樣本數(shù)據(jù)。
(2)支持向量機(jī)的基本概念:首先通過非線性變換將輸入空間變換到一個高維空間,然后在這個新空間中求取最優(yōu)線性分類面,而這種非線性變換是通過定義適當(dāng)?shù)膬?nèi)積函數(shù)來實現(xiàn)的。支持向量機(jī)求得的分類函數(shù)形式上類似于一個神經(jīng)網(wǎng)絡(luò),其輸出是若干中間層節(jié)點(diǎn)的線性組合,而每一個中間層節(jié)點(diǎn)對應(yīng)于輸入樣本與一個支持向量的內(nèi)積,因此也被叫做支持向量網(wǎng)絡(luò)[5-8]。結(jié)構(gòu)如圖1所示:
圖1 支持向量機(jī)概念圖Fig.1 Concept diagram of support vector machines
SVM 應(yīng)用于回歸擬合分析時,不再是尋找一個最優(yōu)分類面使得兩類樣本分開,而是尋找一個最優(yōu)分類面使得所有訓(xùn)練樣本離該最優(yōu)分類面的誤差最小[9],概念圖如圖2。
圖2 回歸支持向量機(jī)概念圖Fig.2 Concept diagram of regression support vector machines
應(yīng)急團(tuán)隊的學(xué)習(xí)樣本集表示為{(x1,y1),(x2,y2),…,(xi,yi)}(xi∈Rn為輸入變量,yi為與xi對應(yīng)輸出變量),回歸問題是指從樣本中學(xué)習(xí)一個函數(shù),然后給定一個xi值,能夠預(yù)測yi的值,SVR 函數(shù)公式如下[10-11]:
式(5)中σ 為徑向基核帶寬的調(diào)節(jié)參數(shù),結(jié)合公式(4)得到支持向量機(jī)推薦模型。
式(6)可以看出,支持向量機(jī)模型的性能和泛化能力主要取決于參數(shù)c 和σ,常采用試驗法來確定參數(shù),但容易陷入局部解,因此考慮引入采用遺傳算法來確定參數(shù)c 和σ,遺傳算法具有全局最優(yōu)解的特點(diǎn),這樣能夠保證模型的有效性和準(zhǔn)確性。
地震現(xiàn)場應(yīng)急隊員的工齡、應(yīng)急次數(shù)、應(yīng)急集合時間,是決定應(yīng)急團(tuán)隊最優(yōu)解的關(guān)鍵,但這些屬性是非線性的,因此需要構(gòu)建一個SVR 多屬性回歸模型[5-6],以解決三個不同屬性之間的關(guān)聯(lián)性問題,回歸模型可構(gòu)建為:
式(7)中:ri應(yīng)急隊員的綜合評分,m(Aκ|i)是應(yīng)急隊員的工齡斷評分,K∈{0,1,2,… ,17},共18 個工齡。m(Bs|i)是應(yīng)急隊員參與過地震應(yīng)急的次數(shù)段評分,u∈{0,1,2,… ,8,},共9 個參與地震應(yīng)急救援次數(shù)。m(Cu|i)是應(yīng)急集合時間評分,v∈{0,1,2,…,9},共10個應(yīng)急集合時間。
支持向量機(jī)回歸通過核函數(shù)K(x,xi)將數(shù)據(jù)從空間非線性變換到高維空間,從而使得數(shù)據(jù)在該空間中被轉(zhuǎn)換成線性組合[11],用支持向量機(jī)回歸的方法構(gòu)建非線性回歸模型公式如下:
使用序列最小優(yōu)化方法求解該支持向量機(jī)回歸問題。
本文以貴州省地震局目前的地震應(yīng)急出隊分組作為參考,按地震應(yīng)急預(yù)案的要求將應(yīng)急隊伍分為ABCD 四類,其中A 為震情監(jiān)視跟蹤組,B 為通信與后勤保障組,C 為烈度評定與災(zāi)害評估組,D 為綜合協(xié)調(diào)組,按順序?qū)M員進(jìn)行編號A01、02... 09; B01、 01... 10; C01、 02... 18; D01、02...04,分別統(tǒng)計了每位成員的工齡、現(xiàn)場工作次數(shù)和集合時間(到單位的最快時間),將應(yīng)急團(tuán)隊的學(xué)習(xí)樣本集表示為{(x1,y1),(x2,y2),…,(xi,yi)}(xi為輸入變量,yi為與xi對應(yīng)輸出變量),使用SVM 工具訓(xùn)練基于支持向量機(jī)回歸的用戶多屬性推薦模型,嘗試尋求最優(yōu)的c 值,得到最優(yōu)分類面,計算出的各個應(yīng)急隊員在上述三個屬性條件下離最優(yōu)分類面最小值?結(jié)果詳見表1,?值越小,則表示該成員為最優(yōu)出隊選擇,反之則相反,根據(jù)計算得到的結(jié)果可以篩選出所需的應(yīng)急隊員,完成隊員的推薦。
表1 應(yīng)急隊員多屬性推薦表Table 1 Multi-attribute recommendation table for emergency team members
從表1 可以得出,若每個組只選擇一名成員。則A-震情監(jiān)視跟蹤組安排出隊的最佳人員是A01,B-通信與后勤保障組的最佳出隊人員是B02,C-烈度評定與災(zāi)害評估組的最佳出隊人員是C14,D-綜合協(xié)調(diào)組的最佳出隊人員是D01,在實際的出隊安排中,各隊選出的最佳人員可作為每隊的組長(副組長)候選人,供指揮決策者參考。
通過與傳統(tǒng)的貴州省地震應(yīng)急現(xiàn)場工作隊出隊情況相比,本文采用的基于支持向量機(jī)回歸的用戶多屬性推薦得出的最佳成員在發(fā)生在貴州省境內(nèi)的2019 年10 月沿河MS4.9 級地震與2020 年7 月赫章MS4.5 級地震中擔(dān)任隊長或副隊長的角色,是各組中地震應(yīng)急現(xiàn)場工作經(jīng)驗和技術(shù)知識最為豐富,熟知應(yīng)急工作的流程、內(nèi)容,綜合能力相對突出的成員,這也從側(cè)面映射出地震現(xiàn)場工作對應(yīng)急技術(shù)人員的專業(yè)知識儲備、應(yīng)急應(yīng)變能力要求較高。
經(jīng)過多年的經(jīng)驗積累與探索研究,我國已形成了一套適宜的應(yīng)急工作體系,但受人員專業(yè)知識背景、工作基本能力等的影響,在近年來的應(yīng)急工作中,具體實施的環(huán)節(jié)之間出現(xiàn)了不同程度的任務(wù)對接脫節(jié),導(dǎo)致決策部署效率低的現(xiàn)象。
本文采用支持向量機(jī)多屬性回歸計算模型,完善決策者安排出隊人員,實驗結(jié)果與隊員實際出隊能力相符,證明該方法用于篩選地震應(yīng)急出隊人員是可行的,實現(xiàn)應(yīng)急團(tuán)隊的智能推薦,不僅能提高地震應(yīng)急工作與人工智能的結(jié)合,推進(jìn)地震事業(yè)走向智能化、信息化,也能完善和彌補(bǔ)傳統(tǒng)決策模式導(dǎo)致的決策部署效率低、任務(wù)工作脫節(jié)等問題。因此通過不斷完善隊伍人員信息,增加人員屬性參數(shù),不斷優(yōu)化,可進(jìn)一步實現(xiàn)隊伍成員的篩選,從決策制定的角度出發(fā),可以為震后應(yīng)急現(xiàn)場工作快速高效部署、有序?qū)嵤┑奶峁┲匾A(chǔ)支撐。