夏旭
(湖南安全技術(shù)職業(yè)學(xué)院,湖南 長沙 410151)
我國是世界上自然災(zāi)害發(fā)生較多的國家之一,對災(zāi)害進(jìn)行提前預(yù)測和研判,并采取應(yīng)對措施,能在最大程度減少災(zāi)害帶來的損失。從研究現(xiàn)狀來看,對某一災(zāi)種進(jìn)行預(yù)警的技術(shù)已經(jīng)較為成熟,然而,在災(zāi)害發(fā)生時(shí),通常會(huì)發(fā)生多種相關(guān)次生災(zāi)害,并直接對災(zāi)害風(fēng)險(xiǎn)等級和危害程度產(chǎn)生較大影響,在此背景下,“多災(zāi)種”和“災(zāi)害鏈”的概念被相繼提出,其中,“多災(zāi)種”概念最早在1992年的聯(lián)合國環(huán)境與發(fā)展大會(huì)上被提出,認(rèn)為隨著人類行為活動(dòng)的日益豐富,所面對的風(fēng)險(xiǎn)和脆弱性劇增,應(yīng)開展全面的多災(zāi)種研究,“災(zāi)害鏈”概念則最早由郭增建等在1987年提出,之后眾多學(xué)者對“災(zāi)害鏈”開展了研究并闡述了不同理解,最近是由AGHAKOUCHAK等人提出全球極端災(zāi)害的爆發(fā)與災(zāi)害鏈關(guān)系密切,這種關(guān)系類似于多米諾骨牌的連鎖反應(yīng)。由此可見,對多災(zāi)種災(zāi)害鏈的作用機(jī)制和預(yù)警模型開展研究,能有效提高災(zāi)害預(yù)警的全面性和正確性,從而降低災(zāi)害影響。
機(jī)器學(xué)習(xí)目前已經(jīng)用于許多實(shí)際應(yīng)用,包括計(jì)算機(jī)視覺、生物信息學(xué)等,可用于解決復(fù)雜系統(tǒng)問題的建模和推理,通過對大量數(shù)據(jù)進(jìn)行訓(xùn)練,生成預(yù)警模型,從而對災(zāi)害以及造成的影響進(jìn)行提前預(yù)測,例如,哈斯等人利用機(jī)器學(xué)習(xí)中的貝葉斯網(wǎng)絡(luò)構(gòu)建草原干旱雪災(zāi)災(zāi)害鏈預(yù)警模型,對干旱造成的雪災(zāi)影響程度進(jìn)行預(yù)測。
但是,目前機(jī)器學(xué)習(xí)在災(zāi)害鏈中的應(yīng)用存在兩個(gè)方面問題,首先,大部分的研究是以單災(zāi)種為主體,未充分考慮多個(gè)災(zāi)害之間的關(guān)聯(lián),當(dāng)改變其環(huán)境數(shù)據(jù)后,這些預(yù)警模型無法使用;其次,多個(gè)災(zāi)害發(fā)生時(shí)相互關(guān)聯(lián)的數(shù)據(jù)集難以獲取,無法訓(xùn)練數(shù)據(jù)生成可用預(yù)警模型。針對上述情況,受到周志華教授所提出學(xué)件概念的啟發(fā),本文提出利用多個(gè)災(zāi)害之間內(nèi)在的領(lǐng)域知識(shí)和已有的單災(zāi)種預(yù)警模型,設(shè)計(jì)模型重用框架MRFA(Model Reuse Framework Algorithms),以解決現(xiàn)實(shí)問題。
在機(jī)器學(xué)習(xí)研究中,領(lǐng)域知識(shí)通常是指訓(xùn)練數(shù)據(jù)之外,與所在領(lǐng)域密切相關(guān)的較高層次知識(shí),它可以反映事物之間的內(nèi)在本質(zhì)關(guān)系,通常難以作為屬性特征在訓(xùn)練數(shù)據(jù)集中出現(xiàn)。但是,對領(lǐng)域知識(shí)的合理應(yīng)用能對機(jī)器學(xué)習(xí)建模產(chǎn)生較好的促進(jìn)作用,例如,趙鵬等人在聚類分析中通過對領(lǐng)域知識(shí)的運(yùn)用建模,獲得了較好效果。這種利用領(lǐng)域知識(shí)的方法,可以減少對數(shù)據(jù)集的依賴,提高預(yù)測效率,本文所設(shè)計(jì)的MRFA框架則是將災(zāi)害鏈中不同災(zāi)種之間的內(nèi)在關(guān)系抽象為領(lǐng)域知識(shí),并構(gòu)建一種較為通用的形式,從而實(shí)現(xiàn)單災(zāi)種預(yù)警模型的復(fù)用,并適應(yīng)不同的任務(wù)。
可以將MRFA框架簡單的描述為如圖1所示的示意圖。
圖1 MRFA框架簡易示意圖
由此,可以展示MRFA框架下的數(shù)據(jù)與模型之間的關(guān)系,如圖2所示,其中,數(shù)據(jù)用矩形表示,模型用六邊形表示,按照預(yù)期,f是經(jīng)過重新設(shè)計(jì)后的預(yù)警模型,由于它綜合考了領(lǐng)域知識(shí)以及其他單災(zāi)種預(yù)警模型,因此,它應(yīng)比初始預(yù)警模型f有更好的性能,具體驗(yàn)證將在第2節(jié)中實(shí)現(xiàn)。
圖2 MRFA框架中數(shù)據(jù)和模型的關(guān)系
利用領(lǐng)域知識(shí),將MRFA作為一種通用框架應(yīng)用在災(zāi)害鏈的預(yù)警模型中,損失函數(shù)、正則函數(shù)均可以靈活運(yùn)用,即使在訓(xùn)練數(shù)據(jù)較少的情況下,也可以有效避免過擬合帶來的問題。
假設(shè)領(lǐng)域知識(shí)可以表示為非負(fù)有權(quán)無向圖的形式,則先轉(zhuǎn)化為鄰接矩陣表示,然后,再使用經(jīng)典的弗洛伊德算法計(jì)算其距離矩陣,再轉(zhuǎn)化為計(jì)算相似度矩陣,最后利用式(2)進(jìn)行函數(shù)構(gòu)造。
本節(jié)將利用MRFA框架運(yùn)用到湖南省的山體滑坡、泥石流等山洪災(zāi)害,以及其帶來的堰塞湖、內(nèi)澇、房屋受損等災(zāi)害預(yù)警中,以驗(yàn)證該方法在訓(xùn)練數(shù)據(jù)量小、場景多、災(zāi)害多的情況下,與已有單災(zāi)種預(yù)警模型相比較的優(yōu)劣情況。
本研究的數(shù)據(jù)來源包括:中國地質(zhì)調(diào)查局地質(zhì)環(huán)境監(jiān)測院(www.cigem.cgs.gov.cn)、湖南省自然資源廳(zrzyt.hunan.gov.cn)和EM-DAT(The International Disaster Database),采集數(shù)據(jù)的時(shí)間段為2010—2019年,共產(chǎn)生有效信息5 382條,可以繪制災(zāi)害信息分布圖如圖3所示。將全部數(shù)據(jù)樣本分為兩個(gè)部分,其中80%作為訓(xùn)練樣本,其余作為實(shí)驗(yàn)樣本,利用訓(xùn)練樣本構(gòu)建預(yù)測模型,然后用實(shí)驗(yàn)樣本來對預(yù)測模型進(jìn)行準(zhǔn)確率評估。
圖3 湖南省災(zāi)害信息分布圖
查找Web of Sciences、知網(wǎng)等數(shù)據(jù)庫中,與滑坡、泥石流、山洪等單災(zāi)種預(yù)警模型和災(zāi)害之間關(guān)系為研究對象的文獻(xiàn),構(gòu)建領(lǐng)域知識(shí)關(guān)系,得到如圖4所示的知識(shí)領(lǐng)域關(guān)系圖。
圖4 多災(zāi)種知識(shí)領(lǐng)域關(guān)系圖
按照貝葉斯網(wǎng)絡(luò)預(yù)測的方法,結(jié)合專家經(jīng)驗(yàn),根據(jù)多種災(zāi)害之間的關(guān)系,按照災(zāi)害事件發(fā)生和不發(fā)生兩種狀態(tài)進(jìn)行計(jì)算,可以得到如表1所示先驗(yàn)概率。
表1 貝葉斯網(wǎng)絡(luò)預(yù)測多災(zāi)種發(fā)生的先驗(yàn)概率
假設(shè)降雨強(qiáng)度為200 mm/d、降雨歷時(shí)超過48小時(shí),利用MRFA框架和領(lǐng)域知識(shí)結(jié)構(gòu),構(gòu)造選擇函數(shù),對訓(xùn)練數(shù)據(jù)進(jìn)行5次實(shí)驗(yàn),并將均值作為最終結(jié)果,可以得到如表2所示的對比結(jié)果,可見在堰塞湖和公共交通上,有一定偏差,采用MRFA框架預(yù)測結(jié)果較實(shí)際情況嚴(yán)重。
表2 測值與實(shí)際值對比
當(dāng)訓(xùn)練數(shù)據(jù)不足時(shí),直接使用上述算法和模型將難以進(jìn)行預(yù)測,此時(shí),使用MRFA框架進(jìn)行計(jì)算,并利用常用指標(biāo)Hamming loss和F-measure作為評價(jià)標(biāo)準(zhǔn),對4個(gè)數(shù)據(jù)集進(jìn)行訓(xùn)練和計(jì)算,可以得到如表3所示的結(jié)果。
表3 實(shí)驗(yàn)結(jié)果
根據(jù)Hamming loss和F-measure的性質(zhì),前者的值越低越好,后者的值越高越好,從表3種可以看出,使用MRFA框架將能有效提升預(yù)警的準(zhǔn)確性,同時(shí),也提高了模型的通用性。
現(xiàn)有的災(zāi)害鏈預(yù)警模型多針對單一災(zāi)種,而且,對于環(huán)境數(shù)據(jù)變化、數(shù)據(jù)集較少的情況,適應(yīng)能力不強(qiáng)。而在實(shí)際應(yīng)用中,通常是多種災(zāi)害相繼發(fā)生,不同的災(zāi)害之間具有一定的內(nèi)在關(guān)系,因此,多災(zāi)種災(zāi)害鏈的預(yù)警模型研究十分必要。
本文提出的MRFA框架嘗試通過利用領(lǐng)域知識(shí)實(shí)現(xiàn)對現(xiàn)有單災(zāi)種災(zāi)害鏈預(yù)警模型的復(fù)用,在數(shù)據(jù)集難以獲取的情況下,完成預(yù)警任務(wù),利用湖南省滑坡、洪澇等災(zāi)害數(shù)據(jù)對該框架進(jìn)行測試,表面該框架能在一定程度上提升傳統(tǒng)模型的性能,在當(dāng)前任務(wù)上取得了較好效果。但是,本研究僅針對滑坡、洪澇等災(zāi)害的領(lǐng)域知識(shí)進(jìn)行了分析,因此,針對其他領(lǐng)域的應(yīng)用將是未來的研究方向。