唐 寧
(廣東省地質(zhì)災(zāi)害應(yīng)急搶險(xiǎn)技術(shù)中心,廣東廣州 510080)
地質(zhì)災(zāi)害是地球自然過(guò)程中產(chǎn)生的重大不利事件,如崩塌、滑坡、泥石流、地面塌陷、地面沉降等,造成重大生命損失和財(cái)產(chǎn)破壞。中國(guó)山地面積占國(guó)土總面積的65%左右,地質(zhì)條件復(fù)雜活躍,是世界上山地災(zāi)害最嚴(yán)重的國(guó)家之一。最受威脅的弱勢(shì)群體遭受著最嚴(yán)重的地質(zhì)災(zāi)害。2018 年,全國(guó)發(fā)生地質(zhì)災(zāi)害約3000起,直接經(jīng)濟(jì)損失達(dá)14.7 億元。地質(zhì)災(zāi)害區(qū)大多集中在在中國(guó)西部[1]。
易受地震斷裂帶、活火山、斜坡等影響的地區(qū),在強(qiáng)降雨的情況下,可確定為滑坡風(fēng)險(xiǎn)地區(qū)。目前,國(guó)家有關(guān)部門(mén)建立了疑似山體滑坡數(shù)據(jù)庫(kù),已確定的高風(fēng)險(xiǎn)地質(zhì)災(zāi)害區(qū)域超過(guò)30 萬(wàn)處,未來(lái)[2]發(fā)生的可能性很大。根據(jù)Brabb[3]的研究,如果能在滑坡事件發(fā)生前識(shí)別出問(wèn)題,至少90%的滑坡?lián)p失可以避免。國(guó)務(wù)院辦公廳強(qiáng)調(diào),需要充分利用遙感數(shù)據(jù)支持地質(zhì)災(zāi)害,包括災(zāi)害預(yù)防的各個(gè)階段和方面[1]。顯然,滑坡早期數(shù)據(jù)庫(kù)對(duì)于重大危機(jī)下的滑坡定位、災(zāi)害預(yù)防和對(duì)特定區(qū)域的高度關(guān)注具有重要意義。然而,由于《自然[4]》中高度隱蔽、突然性和破壞性的特征,一些潛在的滑坡尚未被確定。換句話(huà)說(shuō),與未知的滑坡趨勢(shì)相比,識(shí)別出的潛在滑坡數(shù)據(jù)庫(kù)只占非常有限的一部分。一般來(lái)說(shuō),我們對(duì)已知數(shù)據(jù)庫(kù)進(jìn)行的研究既不徹底也不完整。地質(zhì)災(zāi)害防治仍然是一項(xiàng)艱巨的任務(wù)。
一般來(lái)說(shuō),主流的地質(zhì)災(zāi)害檢測(cè)方法可分為兩類(lèi),一類(lèi)是基于專(zhuān)家知識(shí)的傳統(tǒng)方法,另一類(lèi)是基于遙感技術(shù)的方法。
大部分的研究都是建立在通過(guò)空間或統(tǒng)計(jì)數(shù)據(jù)分析,找出滑坡的制約因素和滑坡的發(fā)生。Pardeshi概述了傳統(tǒng)方法,如基于庫(kù)存的制圖、啟發(fā)式方法、概率評(píng)估、確定性方法、統(tǒng)計(jì)分析和多準(zhǔn)則決策方法,包括降雨閾值模型和其他基于物理的滑坡易感性模型[5-6]。與滑坡發(fā)生相關(guān)的滑坡制約因素的選擇方法很多。然而,這些方法嚴(yán)重依賴(lài)專(zhuān)家知識(shí),這往往是主觀(guān)的,耗時(shí)和費(fèi)力的。而提取的特征往往局限于淺層信息,無(wú)法表達(dá)人們經(jīng)常理解的語(yǔ)義信息。
遙感技術(shù)也被用于地質(zhì)災(zāi)害的測(cè)繪、監(jiān)測(cè)和探測(cè)[7-10]。衛(wèi)星干涉合成孔徑雷達(dá)(InSAR)可以提供從處理大量雷達(dá)衛(wèi)星圖像中獲得的地面位移估計(jì)。應(yīng)用小基線(xiàn)亞群InSAR 技術(shù)計(jì)算了金坪子滑坡[7]的時(shí)間序列變形。他應(yīng)用InSAR技術(shù)和地面專(zhuān)業(yè)監(jiān)測(cè)方法識(shí)別地質(zhì)災(zāi)害[8]。遙感光學(xué)圖像也可以看作是一種有用的工具。在文獻(xiàn)[9]中提出了一種基于多數(shù)投票和多尺度分割相結(jié)合的滑坡清單制圖框架。InSAR 和光學(xué)EO 數(shù)據(jù)被用于在應(yīng)急管理的所有階段(緩解、準(zhǔn)備、危機(jī)和恢復(fù)[10])的滑坡繪圖和監(jiān)測(cè)。
近年來(lái),隨著大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)方法應(yīng)運(yùn)而生并成功應(yīng)用于滑坡易感性評(píng)價(jià)領(lǐng)域,而將其應(yīng)用于地質(zhì)災(zāi)害檢測(cè)與預(yù)測(cè)的研究較少。
與之前的工作不同的是,考慮到目前防災(zāi)的現(xiàn)狀,我們?cè)诒狙芯恐性噲D回答以下兩個(gè)關(guān)鍵問(wèn)題:一是我們?nèi)绾卫萌斯ぶ悄軄?lái)探索和研究已確定的疑似滑坡數(shù)據(jù)庫(kù)?二是如何利用已知數(shù)據(jù)樣本的知識(shí),廣泛有效地預(yù)測(cè)和探測(cè)潛在的滑坡隱蔽點(diǎn)?為了找出這些問(wèn)題的答案,在本文中,我們的貢獻(xiàn)主要包括以下三點(diǎn):
首先提出了一種基于InSAR和高分辨率光學(xué)遙感影像綜合遙感技術(shù)的山體滑坡人工智能探測(cè)新框架。將這兩種機(jī)制結(jié)合起來(lái),通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)可以有效提高地質(zhì)災(zāi)害檢測(cè)的效率。該框架應(yīng)用現(xiàn)有數(shù)據(jù)庫(kù)知識(shí),擴(kuò)展了簡(jiǎn)化的滑坡預(yù)測(cè)方法,并在中國(guó)金沙江白格滑坡預(yù)測(cè)中得到了成功的應(yīng)用和驗(yàn)證。
其次詳細(xì)討論了如何通過(guò)對(duì)具有一定數(shù)據(jù)特征的樣本子數(shù)據(jù)庫(kù)進(jìn)行分類(lèi),逐步構(gòu)建包含異構(gòu)數(shù)據(jù)融合的樣本數(shù)據(jù)庫(kù)。
最后提出了一種確定地質(zhì)災(zāi)害隱患類(lèi)型、空間位置、活動(dòng)規(guī)律,形成地質(zhì)災(zāi)害隱患分布圖的綜合識(shí)別模型。
利用InSAR 和高分辨率光學(xué)遙感圖像,提出了一種綜合遙感技術(shù)的人工智能山體滑坡探測(cè)新框架。高分辨率遙感主要用于地表?xiàng)l件,包括地形、覆蓋和地面類(lèi)型等基本信息的獲取。然而,InSAR 通過(guò)測(cè)量表面位移來(lái)表征表面變形。兩者結(jié)合深度學(xué)習(xí)方法的應(yīng)用,分別從形態(tài)和變形的角度判斷是否是滑坡。所提出的方法有以下五個(gè)主要步驟,如圖1所示。
圖1 擬議架構(gòu)概述
隨著基于深度學(xué)習(xí)和大量樣本的智能地質(zhì)災(zāi)害識(shí)別方法的探索和研究,綜合利用遙感光學(xué)影像大數(shù)據(jù)、InSAR 產(chǎn)品等地理地質(zhì)相關(guān)服務(wù)數(shù)據(jù),可以對(duì)專(zhuān)家知識(shí)進(jìn)行總結(jié)和提取。同時(shí),高性能計(jì)算使大規(guī)模預(yù)測(cè)成為可能,提高了識(shí)別效率。同時(shí),基于人工智能的識(shí)別地質(zhì)災(zāi)害可以研究和探索通過(guò)廣域空間的變化范圍大的時(shí)間跨度下,結(jié)合地質(zhì)災(zāi)害樣本數(shù)據(jù)記錄的專(zhuān)家、地形數(shù)據(jù)和居民區(qū)、道路、橋梁、城鎮(zhèn)供水系統(tǒng)等?;镜乩頂?shù)據(jù),如土地利用、土地和空間規(guī)劃和其他數(shù)據(jù)、智能礦山地質(zhì)災(zāi)害的特點(diǎn)是相對(duì)一致,并進(jìn)一步自學(xué)來(lái)分析邊坡可能的運(yùn)動(dòng)方向,形式和影響地質(zhì)災(zāi)害的范圍可以提高早期滑坡識(shí)別的可靠性和準(zhǔn)確性。
具體來(lái)說(shuō),更多的研究基于以下領(lǐng)域的框架不需要進(jìn)一步開(kāi)展:
首先是影響因素與地質(zhì)災(zāi)害的相關(guān)模型。專(zhuān)業(yè)知識(shí)的指導(dǎo)下,我們能夠設(shè)計(jì)一個(gè)密集的深度學(xué)習(xí)模型,專(zhuān)家知識(shí)作為先驗(yàn)信息嵌入深度學(xué)習(xí)網(wǎng)絡(luò),或融合異構(gòu)信息設(shè)計(jì)不同類(lèi)型的網(wǎng)絡(luò)中提取一個(gè)真理的特征,然后通過(guò)多層感知集成它們。該模型加速了算法的收斂速度,減少了訓(xùn)練樣本的數(shù)量,最終提高了算法的性能。異構(gòu)信息包括關(guān)于地形、地貌、地質(zhì)、氣候、水文、人類(lèi)活動(dòng)和其他因素的信息。
其次是地質(zhì)災(zāi)害風(fēng)險(xiǎn)評(píng)估模型及關(guān)鍵因素的評(píng)估與監(jiān)測(cè)。在各種典型地質(zhì)條件下,不同因素對(duì)地質(zhì)災(zāi)害的影響不同?;谔卣鞣囱菁夹g(shù),研究了地質(zhì)災(zāi)害影響程度評(píng)價(jià)模型,確定了各種典型地質(zhì)條件下關(guān)鍵因素的閾值。
傳統(tǒng)的地質(zhì)災(zāi)害識(shí)別方法高度依賴(lài)主觀(guān)專(zhuān)家知識(shí),需要耗費(fèi)大量的人力和時(shí)間來(lái)逐一識(shí)別危險(xiǎn)區(qū)可能發(fā)生的地質(zhì)災(zāi)害。與傳統(tǒng)的框架相比,本文提出的基于人工智能的框架具有以下三個(gè)方面的優(yōu)勢(shì):
一是專(zhuān)家知識(shí)的總結(jié)和突出。在專(zhuān)家知識(shí)的指導(dǎo)下,通過(guò)對(duì)歷史地質(zhì)災(zāi)害樣本的研究,可以獲得地質(zhì)災(zāi)區(qū)發(fā)現(xiàn)和風(fēng)險(xiǎn)評(píng)估的模型。當(dāng)樣本很少或沒(méi)有樣本時(shí),建立一個(gè)基于語(yǔ)義信息的模型來(lái)實(shí)現(xiàn)專(zhuān)家知識(shí)的外顯語(yǔ)法表示。
二是專(zhuān)家知識(shí)的推廣和應(yīng)用。該框架采用了專(zhuān)家知識(shí)的綜合集成和一般規(guī)則與特殊場(chǎng)景的綜合考慮,提高了模型的適用性;此外,模型的客觀(guān)性和大數(shù)據(jù)處理能力的優(yōu)越性提高了框架的應(yīng)用價(jià)值。
三是發(fā)現(xiàn)新知識(shí),更新專(zhuān)家知識(shí)。機(jī)器學(xué)習(xí)/深度學(xué)習(xí)建立了影響因素與輸出結(jié)果的相關(guān)模型。通過(guò)與專(zhuān)家因果分析模型的比較,可以發(fā)現(xiàn)專(zhuān)家尚未掌握的新規(guī)則。經(jīng)過(guò)專(zhuān)家評(píng)估/實(shí)地調(diào)查,新知識(shí)將進(jìn)一步豐富具有原始認(rèn)知的專(zhuān)家知識(shí)庫(kù),并以另一種方式反饋優(yōu)化的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型。
異構(gòu)樣本數(shù)據(jù)庫(kù)的構(gòu)建主要包括兩個(gè)方面。一是地質(zhì)災(zāi)害相關(guān)要素?cái)?shù)據(jù)庫(kù),二是地質(zhì)災(zāi)害相關(guān)要素?cái)?shù)據(jù)庫(kù)算法數(shù)據(jù)庫(kù)的構(gòu)建。元素?cái)?shù)據(jù)庫(kù)是算法數(shù)據(jù)庫(kù)的基礎(chǔ)和前提,算法數(shù)據(jù)庫(kù)是元素?cái)?shù)據(jù)庫(kù)的價(jià)值體現(xiàn)。
這兩個(gè)數(shù)據(jù)庫(kù)需要逐步積累和完善,通過(guò)積累、有針對(duì)性的模型增強(qiáng)、專(zhuān)家知識(shí)的普適性、新知識(shí)的發(fā)現(xiàn)來(lái)增加基本要素的數(shù)量和類(lèi)型。元素?cái)?shù)據(jù)庫(kù)的內(nèi)容包括以下類(lèi)型:
地形要素:山、坡、脊、河、湖等。地被要素:雪、植被(森林、牧場(chǎng))、云等。人類(lèi)活動(dòng)要素:道路、橋梁、房屋等。
算法數(shù)據(jù)庫(kù)的設(shè)計(jì)是為了實(shí)現(xiàn)遙感大數(shù)據(jù)的各種任務(wù)的目標(biāo)。以地質(zhì)災(zāi)害識(shí)別為例,算法庫(kù)的建設(shè)主要包括:
基于InSAR地質(zhì)變形數(shù)據(jù)的地面沉降聚類(lèi)區(qū)識(shí)別模型;
基于高分辨率遙感影像的地面要素識(shí)別模型,包括邊緣分割和目標(biāo)識(shí)別模型;
基于元素分割與識(shí)別,高分辨率圖像校正模型實(shí)現(xiàn)了由于視角、光照、季節(jié)、地表覆蓋等因素的不同而導(dǎo)致的圖像不一致;
地貌要素的時(shí)變識(shí)別模型;
基于多源數(shù)據(jù)融合的地質(zhì)災(zāi)害識(shí)別模型;
地質(zhì)災(zāi)害風(fēng)險(xiǎn)評(píng)估模型和關(guān)鍵因素預(yù)警模型。
具體來(lái)說(shuō),示例數(shù)據(jù)庫(kù)的內(nèi)容包括以下四個(gè)方面類(lèi)別:
一是生成地質(zhì)遙感元素庫(kù)。輸入素材庫(kù)分為兩類(lèi):一類(lèi)是遙感影像公共服務(wù)數(shù)據(jù)集,如GF-1、GF-2、ZY-3等。這種類(lèi)型的數(shù)據(jù)庫(kù)包含各種類(lèi)型的地質(zhì)元素但需要算法如邊緣分割、對(duì)象識(shí)別、自動(dòng)貼標(biāo)實(shí)現(xiàn)識(shí)別、地質(zhì)元素的標(biāo)簽,以及標(biāo)準(zhǔn)化預(yù)處理過(guò)程,如數(shù)字化和編碼的特征描述,最后,形成一個(gè)元件庫(kù)。第二類(lèi)是單元素?cái)?shù)據(jù)庫(kù),但它可能不是遙感圖像。它需要通過(guò)尺度等各種圖像處理進(jìn)行數(shù)字化和編碼變換和透視變換,最后構(gòu)成一個(gè)元素庫(kù)(圖2)。
圖2 地質(zhì)遙感要素?cái)?shù)據(jù)庫(kù)
二是基于InSAR 數(shù)據(jù)的地質(zhì)災(zāi)害識(shí)別樣本庫(kù)建設(shè)。地質(zhì)災(zāi)害的典型特征是明顯的地面沉降變形,這與邊坡、地層等地質(zhì)特征密切相關(guān),歷史樣本的地質(zhì)特征和變形特征為隱患提供了參考價(jià)值。因此,設(shè)計(jì)相應(yīng)的算法模型,最終得到各種典型地質(zhì)條件下基于In-SAR地表變形聚類(lèi)的地質(zhì)災(zāi)害典型樣本(圖3)。
圖3 基于InSAR數(shù)據(jù)的地質(zhì)災(zāi)害識(shí)別樣本庫(kù)建設(shè)
三是基于遙感影像的地質(zhì)災(zāi)害識(shí)別樣本數(shù)據(jù)庫(kù)的構(gòu)建。基于時(shí)段遙測(cè)遙感圖像,圖像配準(zhǔn)后,通過(guò)邊緣分割、目標(biāo)識(shí)別相同的目標(biāo)和時(shí)間變化對(duì)表面覆蓋,結(jié)合梯度計(jì)算,和斜率識(shí)別的數(shù)字高程模型(DEM)數(shù)據(jù),積極的和消極的樣本構(gòu)造地質(zhì)災(zāi)害。負(fù)樣本包括道路、房屋等人工開(kāi)挖山體造成的土方堆積變化以及山體體積的時(shí)間變化如四季。我們可以借助地質(zhì)數(shù)據(jù)和歷史樣本識(shí)別和標(biāo)記地質(zhì)災(zāi)害級(jí)別(圖4)。
圖4 基于遙感影像的地質(zhì)災(zāi)害識(shí)別樣本數(shù)據(jù)庫(kù)
四是多源異構(gòu)信息融合的地質(zhì)災(zāi)害識(shí)別樣本庫(kù)建設(shè)。在更多類(lèi)型數(shù)據(jù)的基礎(chǔ)上,通過(guò)數(shù)據(jù)融合技術(shù),不僅構(gòu)建了地質(zhì)災(zāi)害類(lèi)型、等級(jí)及其影響因素的典型樣本,而且構(gòu)建了各種典型地質(zhì)條件下地質(zhì)災(zāi)害觸發(fā)的關(guān)鍵影響因素和閾值。數(shù)值樣本為識(shí)別和關(guān)鍵要素的關(guān)鍵監(jiān)測(cè)提供了基礎(chǔ)(圖5)。
圖5 多源異構(gòu)信息融合的地質(zhì)災(zāi)害識(shí)別樣本數(shù)據(jù)庫(kù)
一是數(shù)據(jù)采集、標(biāo)簽、標(biāo)準(zhǔn)化、存儲(chǔ)管理。首先,采集經(jīng)遙感處理的地質(zhì)、地形、地面覆蓋物(道路、橋梁、房屋、積雪等)的各類(lèi)圖像(遙感類(lèi)型)需要對(duì)圖像進(jìn)行傳感,并通過(guò)視角、照度、變形等對(duì)其進(jìn)行歸一化處理。然后通過(guò)邊緣檢測(cè)、目標(biāo)識(shí)別、分類(lèi)/聚類(lèi)、自動(dòng)標(biāo)注等,實(shí)現(xiàn)基本元素樣本的生成。最后,通過(guò)統(tǒng)一編碼、抽象生成等存儲(chǔ)和檢索處理,構(gòu)建樣本元素?cái)?shù)據(jù)集的文件存儲(chǔ)。
二是專(zhuān)家知識(shí)的正規(guī)化。在樣本庫(kù)建立的初期,專(zhuān)家知識(shí)具有極其重要的指導(dǎo)價(jià)值,有必要將專(zhuān)家知識(shí)轉(zhuǎn)化為可以被機(jī)器學(xué)習(xí)利用的規(guī)則。具體來(lái)說(shuō),它包括如下的設(shè)計(jì):
首先確定影響因素。當(dāng)樣本數(shù)據(jù)集較小時(shí),很難定量地分析影響因素與結(jié)果之間的相關(guān)性。同時(shí),機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型的收斂性難以保證。因此,有必要利用專(zhuān)家知識(shí)選擇影響因素,并進(jìn)行適當(dāng)?shù)念A(yù)處理和數(shù)字化,使模型具有快速迭代的適用性。
性能指標(biāo)設(shè)計(jì)和標(biāo)簽準(zhǔn)確性審查。機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的模型性能很大程度上取決于成本函數(shù)的設(shè)計(jì),性能的衡量取決于需求的應(yīng)用程序。這樣,將專(zhuān)家知識(shí)對(duì)結(jié)果的判斷和分級(jí)轉(zhuǎn)化為成本函數(shù)的設(shè)計(jì)。隨著樣本的增加,成本函數(shù)、性能指標(biāo)等也會(huì)相應(yīng)調(diào)整。
專(zhuān)家知識(shí)的整合與修正。針對(duì)不同的數(shù)據(jù)集,設(shè)計(jì)相應(yīng)的模型和訓(xùn)練算法,構(gòu)建算法庫(kù)。例如,在InSAR 數(shù)據(jù)集上,利用二維濾波模型識(shí)別地表變形群;結(jié)合DEM 高程數(shù)據(jù)、地層/地質(zhì)數(shù)據(jù)、歷史樣本數(shù)據(jù),設(shè)計(jì)并訓(xùn)練貝葉斯分類(lèi)器,實(shí)現(xiàn)地質(zhì)災(zāi)害風(fēng)險(xiǎn)等級(jí)的評(píng)估。在遙感影像數(shù)據(jù)集上,通過(guò)邊緣分割、目標(biāo)識(shí)別、時(shí)間變化規(guī)律識(shí)別、地質(zhì)災(zāi)害識(shí)別等模型,建立了地質(zhì)災(zāi)害正、負(fù)樣本算法庫(kù)和樣本庫(kù)。基礎(chǔ)上掌握更多類(lèi)型的異構(gòu)數(shù)據(jù),如InSAR 圖像數(shù)據(jù)集,時(shí)段遙測(cè)遙感圖像數(shù)據(jù)集,地質(zhì)/地層數(shù)據(jù)集,和DEM 數(shù)據(jù)集,我們需要設(shè)計(jì)集成學(xué)習(xí)和多源異構(gòu)融合的深度學(xué)習(xí)模型實(shí)現(xiàn)一個(gè)樣本庫(kù)構(gòu)建,包括關(guān)鍵因素和算法模型。
本文提出了一種基于綜合遙感的地質(zhì)災(zāi)害探測(cè)人工智能框架。該方法通過(guò)高分辨率遙感圖像變化檢測(cè),對(duì)滑坡形態(tài)、地表覆蓋變化進(jìn)行研究,研究災(zāi)害的形成、發(fā)展,揭示潛在的災(zāi)害情況。利用InSAR監(jiān)測(cè)獲取災(zāi)體地表變形,表征邊坡的運(yùn)動(dòng)變形狀態(tài),確定滑坡的大小、活動(dòng)階段和發(fā)展趨勢(shì);嵌入式深度學(xué)習(xí)算法從災(zāi)害情況、當(dāng)前變形情況和潛在災(zāi)害情況進(jìn)行全面判斷;自動(dòng)、高效地實(shí)現(xiàn)了災(zāi)害發(fā)生前的早期識(shí)別??蚣苤械闹饕绦?,如樣本數(shù)據(jù)庫(kù)的建立,面向?qū)ο蟮谋砻娓采w變化檢測(cè),智能綜合識(shí)別方法也在我們的研究中得到充分的研究。該框架將很快應(yīng)用于貴州省、西藏省、四川省的隱性災(zāi)害檢測(cè)項(xiàng)目。