摘 "要: 為解決當(dāng)前坡面泥石流預(yù)測(cè)中存在的多因素?cái)?shù)建模問(wèn)題,并提高預(yù)測(cè)的精確度,提出一種融合雙注意力機(jī)制、時(shí)間卷積神經(jīng)網(wǎng)絡(luò)和雙向門控循環(huán)單元(DA?TCN?BiGRU)的坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)方法。通過(guò)模擬平臺(tái)進(jìn)行坡面泥石流模擬實(shí)驗(yàn),采集多類傳感器數(shù)據(jù)得到風(fēng)險(xiǎn)度大小,并以此表征所處的風(fēng)險(xiǎn)階段。實(shí)驗(yàn)結(jié)果表明,所提模型短期預(yù)測(cè)的均方根誤差、平均百分比誤差和平均絕對(duì)百分比誤差分別為0.013 59、0.010 407和1.182 64,中期預(yù)測(cè)的均方根誤差、平均百分比誤差和平均絕對(duì)百分比誤差分別為0.019 01、0.015 17和1.729 46,優(yōu)于其他比較模型。
關(guān)鍵詞: 坡面泥石流; 風(fēng)險(xiǎn)預(yù)測(cè); 雙注意力機(jī)制; 時(shí)間卷積神經(jīng)網(wǎng)絡(luò); 雙向門控循環(huán)單元; 風(fēng)險(xiǎn)評(píng)估方法
中圖分類號(hào): TN927?34; P642.23 " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A " " " " " " " " " "文章編號(hào): 1004?373X(2024)06?0001?08
Research on slope debris flow prediction based on DA?TCN?BiGRU
WEI Kai, LI Qing, YAO Yi, ZHOU Rui
(National and Local Joint Engineering Laboratory of Disaster Monitoring Technology and Instrument, China Jiliang University, Hangzhou 310018, China)
Abstract: In order to improve the accuracy of slope debris flow prediction, a slope debris flow risk prediction method combining dual attention mechanism, temporal convolutional neural network, and bidirectional gated recurrent unit (DA?TCN?BiGRU) is proposed to address the multi?factor modeling problem in current slope debris flow prediction. By conducting slope debris flow simulation experiments on a simulation platform and collecting data from multiple sensors, the magnitude of risk is obtained, which represents the risk stage. The experimental results show that the short?term prediction of this model has a root mean square error, average percentage error, and average absolute percentage error of 0.013 59, 0.010 407, and 1.182 64, respectively. The mid?term prediction has a root mean square error, average percentage error, and average absolute percentage error of 0.019 01, 0.015 17, and 1.729 46, respectively, which outperforms other comparative models.
Keywords: slope debris flow; risk prediction; dual attention mechanism; temporal convolution neural network; bidirectional gated recurrent; risk evaluation method
0 "引 "言
坡面泥石流災(zāi)害對(duì)人們生命安全造成了極大的威脅。目前,國(guó)內(nèi)外研究者主要通過(guò)雨量預(yù)報(bào)泥石流發(fā)生的可能性,大多針對(duì)某一地區(qū)的降雨量臨界值來(lái)實(shí)現(xiàn)泥石流的預(yù)報(bào)[1]。疏杏勝等人基于對(duì)桓仁水庫(kù)流域歷史數(shù)據(jù)預(yù)測(cè)未來(lái)降雨數(shù)據(jù),提出人工神經(jīng)網(wǎng)絡(luò)(ANN)、極限學(xué)習(xí)機(jī)(ELM)以及支持向量機(jī)(SVM)預(yù)測(cè)模型[2],對(duì)桓仁水庫(kù)流域未來(lái)1~3天降雨進(jìn)行多模式集成預(yù)報(bào),驗(yàn)證了基于機(jī)器學(xué)習(xí)模型的多模式降雨集成預(yù)報(bào)方法可行,能夠提高短期降雨預(yù)報(bào)的精度。唐旺等采用長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)方法對(duì)短時(shí)降雨進(jìn)行預(yù)測(cè),并收集了研究區(qū)254條泥石流數(shù)據(jù)和日累計(jì)降雨數(shù)據(jù),采用統(tǒng)計(jì)分類的方法劃定了泥石流的降水預(yù)警閾值,將預(yù)測(cè)值和閾值進(jìn)行比對(duì),進(jìn)而給出預(yù)警等級(jí)和泥石流發(fā)生的可能性,形成一體化的預(yù)警方法[3]。P. Hewage等人基于時(shí)間卷積神經(jīng)網(wǎng)絡(luò)(TCN)和LSTM的結(jié)構(gòu),提出了一種新的輕量級(jí)天氣預(yù)測(cè)模型,它可用于對(duì)選定的細(xì)粒度地理位置進(jìn)行長(zhǎng)達(dá)9 h的天氣預(yù)報(bào)[4]。J. Hirschberg等利用瑞士阿爾卑斯山區(qū)域17年的降雨記錄和67次泥石流確定臨界降雨閾值,通過(guò)隨機(jī)森林模型(RF)進(jìn)行預(yù)測(cè),提高了數(shù)據(jù)中挖掘開發(fā)信息并用于提高預(yù)警性能的準(zhǔn)確性[5]。
綜合坡面泥石流方面預(yù)測(cè)的研究可知,僅根據(jù)降雨量往往不能得到坡面泥石流災(zāi)害的完整預(yù)測(cè)信息,多傳感器的綜合預(yù)測(cè)方法與合適的預(yù)測(cè)模型是實(shí)現(xiàn)更加準(zhǔn)確的坡面泥石流預(yù)測(cè)的有效途徑。同時(shí)坡面泥石流預(yù)測(cè)仍然存在相當(dāng)大的挑戰(zhàn),包括風(fēng)險(xiǎn)評(píng)估困難和多因素的非線性建模等[6]。面對(duì)以上挑戰(zhàn),本文提出一種基于DA?TCN?BiGRU的坡面泥石流預(yù)測(cè)方法??紤]注意力機(jī)制處理相同時(shí)刻數(shù)據(jù)之間的依賴性,時(shí)間卷積(TCN)的特征提取能力和在時(shí)間序列預(yù)測(cè)建模中的良好表現(xiàn),以及雙向門控循環(huán)單元(BiGRU)的長(zhǎng)期依賴關(guān)系的特點(diǎn),建立DA?TCN?BiGRU坡面泥石流預(yù)測(cè)模型,自動(dòng)提取坡面泥石流數(shù)據(jù)之間的預(yù)警特征和長(zhǎng)期依賴關(guān)系,并通過(guò)坡面泥石流模擬實(shí)驗(yàn)對(duì)預(yù)測(cè)模型進(jìn)行驗(yàn)證。
1 "DA?TCN?BiGRU模型
1.1 "時(shí)間卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)最常用于圖像處理,用于時(shí)序預(yù)測(cè)的CNN稱為時(shí)間卷積神經(jīng)網(wǎng)絡(luò)(TCN)。Bai Shaojie等人在2018年序列預(yù)測(cè)建模中成功使用卷積神經(jīng)網(wǎng)絡(luò),采用了空洞卷積,使得CNN具有因果卷積的時(shí)間約束模型能夠捕獲更長(zhǎng)的依賴關(guān)系[7],TCN因此有更大的感受野。TCN的模型結(jié)構(gòu)更簡(jiǎn)單、更有效,并且很多學(xué)者已經(jīng)將TCN擴(kuò)展到了多元時(shí)間序列預(yù)測(cè)領(lǐng)域[8]。
TCN是由多個(gè)殘差塊(Residual Block)[7]組成,每一個(gè)殘差塊中,卷積層的輸出將被添加到殘差塊的輸入中,并饋送到下一個(gè)殘差塊。為了調(diào)整殘差張量的寬度,添加了一個(gè)1×1卷積來(lái)完成此操作,此時(shí)TCN的感受野寬度是原來(lái)的基本因果層的2倍。因此,感受野大小r可以通過(guò)式(1)獲得。
[r=1+i=0n-12k-1bi=1+2k-1bn-1b-1] (1)
式中:k表示卷積核的大?。籦表示膨脹基的大小,且兩者滿足k≥b。
殘差塊的數(shù)量n與輸入張量的長(zhǎng)度l相關(guān),計(jì)算公式如下:
[n=logbl-1b-12k-1+1] " " " "(2)
1×1卷積在殘差塊的輸入和輸出之間保持相同的長(zhǎng)度,而膨脹的因果卷積保證輸出不會(huì)受到未來(lái)信息的影響[9]。
1.2 "雙向門控循環(huán)單元
門控循環(huán)單元(GRU)是LSTM神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)化,用于處理和預(yù)測(cè)序列數(shù)據(jù)[4]。GRU的結(jié)構(gòu)如圖1所示,圖中rt和zt分別表示重置門和更新門。
門控循環(huán)單元(GRU)公式如下:
[rt=SigmoidWrht-1,xt] " " " "(3)
[zt=SigmoidWzht-1,xt] " " " "(4)
[ht=tanhWrt⊙ht-1,xt] " " " "(5)
[ht=1-zt⊙ht-1+zt⊙ht] " " " "(6)
式中:[rt]是GRU的重置門;[zt]是GRU的更新門;Sigmoid為激活函數(shù);tanh表示雙曲正切激活函數(shù);Wr、[Wz]、W分別為對(duì)應(yīng)的權(quán)重矩陣。
在傳統(tǒng)的GRU中,每個(gè)時(shí)間步的輸出僅僅依賴于它之前的輸入和隱狀態(tài),而雙向門控循環(huán)單元(BiGRU)則考慮了輸入序列中每個(gè)時(shí)間步之前和之后的輸入以及隱狀態(tài)信息[4]。BiGRU中正向GRU按照時(shí)間步從前向后計(jì)算,而反向GRU則按照時(shí)間步從后向前計(jì)算,最終將兩個(gè)方向的輸出拼接在一起作為整個(gè)序列的輸出。BiGRU具體結(jié)構(gòu)如圖2所示。
BiGRU的公式和GRU類似,但需分別計(jì)算正向和反向GRU輸出,BiGRU的更新公式為:
[ht=GRUxt,ht-1] " " " " "(7)
[ht=GRUxt,ht+1] " " " " " (8)
[ht=[ht,ht]] " " " " " " " (9)
1.3 "注意力機(jī)制
注意力機(jī)制首先用于圖像任務(wù),以實(shí)現(xiàn)對(duì)圖像重要特征的加權(quán)。注意力機(jī)制實(shí)際上就是得到權(quán)重矩陣,計(jì)算注意力權(quán)重的過(guò)程可以看作是鍵值對(duì)中的查詢[10],具體步驟為:
1) 計(jì)算Q和K的相似度,可以通過(guò)求兩者的向量點(diǎn)積來(lái)得到。
2) 對(duì)權(quán)重進(jìn)行歸一化,以獲得直接可用的權(quán)重。
3) 對(duì)權(quán)重和值進(jìn)行加權(quán)求和,以獲得注意力值。
[αt=Softmax(QTK)=exp(QTK)jexp(QTK)] " "(10)
[α=tαtVt] " " " " " " (11)
[Q=WqiXt] " " " " " "(12)
[K=WkiXt] " " " " "(13)
[V=WviXt] " " " " " (14)
式中:[αt]是t時(shí)刻注意力權(quán)重;Softmax是激活函數(shù);[α]是權(quán)重與變量的加權(quán)求和的結(jié)果;Q、K、V分別表示注意力機(jī)制的查詢、鍵值和值;[Wqi]、[Wki]、[Wvi]分別是對(duì)應(yīng)的權(quán)重。
1.4 "DA?TCN?BiGRU模型架構(gòu)
融合雙注意力機(jī)制、時(shí)間卷積神經(jīng)網(wǎng)絡(luò)和雙向門控循環(huán)單元模型(DA?TCN?BiGRU)的整體框架如圖3所示。
DA?TCN?BiGRU模型的輸入是一個(gè)由坡面泥石流時(shí)間序列數(shù)據(jù)組成的數(shù)據(jù),輸入階段的注意力機(jī)制(I?Attn)的輸入為t時(shí)刻的n個(gè)傳感器數(shù)據(jù)和t-1時(shí)刻的隱含層,輸出為t時(shí)刻的注意力權(quán)重。I?Attn通過(guò)殘差塊框架經(jīng)過(guò)TCN,再通過(guò)Attention機(jī)制生成一個(gè)權(quán)重向量與TCN的輸出相乘,得出TCN輸出后的注意力機(jī)制(T?Attn);之后經(jīng)過(guò)BiGRU層,輸出最終的預(yù)測(cè)值。
由于實(shí)際坡面泥石流實(shí)驗(yàn)中,傳感器數(shù)據(jù)是以連續(xù)一串?dāng)?shù)組形式傳回給上位機(jī),因此本模型的動(dòng)態(tài)滑動(dòng)預(yù)測(cè)采用滑動(dòng)窗口實(shí)現(xiàn),以此處理動(dòng)態(tài)數(shù)據(jù),如圖4所示。圖4中,輸入為Ti長(zhǎng)度的6維傳感器數(shù)據(jù),輸出為未來(lái)To時(shí)間步的坡面泥石流風(fēng)險(xiǎn)度,滑動(dòng)窗口隨著時(shí)間步向前移動(dòng),同時(shí)輸出預(yù)測(cè)值。
2 "坡面泥石流模擬平臺(tái)及實(shí)驗(yàn)數(shù)據(jù)
2.1 "坡面泥石流模擬實(shí)驗(yàn)平臺(tái)
坡面泥石流是由水和固體物質(zhì)組成的混相流體,其產(chǎn)生過(guò)程較復(fù)雜。陡峻的地形和固體物質(zhì)的補(bǔ)給是坡面泥石流發(fā)生的內(nèi)在因素,強(qiáng)降雨是產(chǎn)生坡面泥石流的外界誘發(fā)因素[11]。
坡面泥石流模擬平臺(tái)的構(gòu)建是為了模擬真實(shí)的坡面泥石流,圖5為坡面泥石流模擬平臺(tái)實(shí)物圖。坡面泥石流模擬平臺(tái)的結(jié)構(gòu)包括降雨模擬裝置、傳感器測(cè)量裝置和載土試驗(yàn)箱。
在坡面泥石流模擬實(shí)驗(yàn)平臺(tái)中安裝了6個(gè)傳感器,分別是翻斗式雨量計(jì)、地表位移傳感器、土壓力傳感器、剪切波速傳感器以及2個(gè)土壤含水率傳感器,傳感器的安裝位置如圖6所示。
2.2 "坡面泥石流實(shí)驗(yàn)數(shù)據(jù)及分析
在坡面泥石流的整個(gè)模擬過(guò)程中,使用傳感器來(lái)監(jiān)測(cè)坡面泥石流過(guò)程,監(jiān)測(cè)量包括降雨量、淺層土壤含水率、深層土壤含水率、剪切波速、地表位移和土壓力。坡面泥石流模擬平臺(tái)將降雨工況設(shè)為前期降雨和強(qiáng)降雨擬定實(shí)驗(yàn)工況:
前期降雨:采用10 mm/h雨強(qiáng),共需降雨歷時(shí)60 min,分為2個(gè)階段,降1 h,停1 h。
強(qiáng)降雨:采用100 mm/h雨強(qiáng),共需降雨歷時(shí)30 min,分為2個(gè)階段,降0.5 h,停1 h。
模擬降雨期間載土箱通過(guò)液壓升降桿保持在30°,監(jiān)測(cè)系統(tǒng)每隔1 s采集一次數(shù)據(jù),實(shí)驗(yàn)最終獲得20 000組數(shù)據(jù),用于坡面泥石流數(shù)據(jù)建模。
根據(jù)得到的坡面泥石流數(shù)據(jù)集,繪制的坡面泥石流傳感器數(shù)據(jù)歸一化曲線如圖7所示。
分析坡面泥石流過(guò)程與不同傳感器數(shù)據(jù)之間的關(guān)系,得出如下結(jié)論:
1) 降雨量是坡面泥石流發(fā)生的誘發(fā)因素,它的變化直接影響土壤含水率的變化。
2) 隨著降雨的進(jìn)行,地表水逐漸入滲到地下,深層含水率會(huì)逐漸提高。在整個(gè)坡面泥石流形成到滑流再到穩(wěn)定的過(guò)程中,淺層含水率的增長(zhǎng)速率會(huì)逐漸減小,深層含水率的大小最后與淺層含水率相近。
3) 隨著土壤整個(gè)土層含水率發(fā)生變化,土壤抗剪強(qiáng)度也隨之發(fā)生變化。本文使用剪切波速表征土壤抗剪強(qiáng)度的大小,土壤含水率未達(dá)到臨界含水率時(shí),土壤抗剪強(qiáng)度與剪切波速存在正相關(guān)的關(guān)系;反之,土壤抗剪強(qiáng)度與剪切波速存在負(fù)相關(guān)的關(guān)系[12]。在地表位移發(fā)生之前,剪切波速有明顯的上升趨勢(shì),土壓力同樣增加,都可以作為坡面泥石流發(fā)生的前兆預(yù)警特征。
4) 當(dāng)坡體進(jìn)入滑流階段之前,土壤含水率達(dá)到飽和,不再出現(xiàn)明顯增加的趨勢(shì);隨著強(qiáng)降雨的進(jìn)行,土體進(jìn)入滑流階段,呈現(xiàn)流動(dòng)狀,地表位移急劇增加。
5) 進(jìn)入穩(wěn)定階段后,土體背坡面徑流影響減小,土壤表面的沖刷和侵蝕作用減弱。
坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練過(guò)程是使用滑動(dòng)窗口,關(guān)于DA?TCN?BiGRU方法,已在本文第1節(jié)中詳細(xì)闡述。
DA?TCN?BiGRU的輸入為過(guò)去時(shí)間步的5類傳感器數(shù)據(jù),坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)的目的是預(yù)測(cè)未來(lái)時(shí)間步的坡面泥石流風(fēng)險(xiǎn)度。因此,預(yù)測(cè)模型的輸出為下一時(shí)間步坡面泥石流風(fēng)險(xiǎn)度大小。訓(xùn)練集、驗(yàn)證集與測(cè)試集數(shù)據(jù)的比例為6∶3∶1。訓(xùn)練過(guò)程使用監(jiān)督學(xué)習(xí)的方法,并20次迭代訓(xùn)練DA?TCN?BiGRU的模型參數(shù)。
3 "風(fēng)險(xiǎn)評(píng)估方法與模型測(cè)試
3.1 "風(fēng)險(xiǎn)評(píng)估方法
由坡面泥石流模擬實(shí)驗(yàn)平臺(tái)得到的傳感器數(shù)據(jù)無(wú)法直接反映坡面泥石流過(guò)程的風(fēng)險(xiǎn)程度,因此需要對(duì)數(shù)據(jù)進(jìn)行特征提取,得到綜合評(píng)價(jià)指標(biāo),即坡面泥石流風(fēng)險(xiǎn)度,坡面泥石流風(fēng)險(xiǎn)度表征坡面泥石流即將發(fā)生的風(fēng)險(xiǎn)程度。觀察剪切波速和土壓力數(shù)據(jù)可知,第一次地表位移發(fā)生之前,剪切波速有一段明顯上升的趨勢(shì),之后每一次發(fā)生位移前,土壓力以及剪切波速都會(huì)有逐漸增大的預(yù)警特征,這點(diǎn)可以作為坡面泥石流風(fēng)險(xiǎn)度的重要特征。
對(duì)坡面泥石流傳感器數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)評(píng)估的方法眾多,本文采用TOPSIS熵值法得到坡面泥石流風(fēng)險(xiǎn)度,流程如圖8所示。
TOPSIS熵值法處理傳感器數(shù)據(jù)的流程為:首先將坡面泥石流傳感器數(shù)據(jù)進(jìn)行簡(jiǎn)單的預(yù)處理,之后利用歸一化的數(shù)據(jù)計(jì)算權(quán)重[pij]、熵值[ej],公式如下:
[pij=xiji=1Nxij] " " " "(15)
[ej=-1lnNi=1Npijlnpij, "ej∈[0,1]] " " "(16)
計(jì)算每個(gè)數(shù)據(jù)對(duì)應(yīng)的信息熵,并計(jì)算信息效用值,公式如下:
[dj=1-ej] " " " " " "(17)
信息效用值就是差異系數(shù),信息效用值越大,對(duì)應(yīng)的信息量也就越多。
然后確定傳感器數(shù)據(jù)的權(quán)重大小,公式為:
[ωj=djj=1Ndj] " " " " (18)
再對(duì)數(shù)據(jù)進(jìn)行歸一化和標(biāo)準(zhǔn)化,并構(gòu)造加權(quán)矩陣,公式如下:
[zij=xiji=1Nx2ij] " " " " " " (19)
[z*ij=zij?wj] " " " " " "(20)
尋找最優(yōu)方案[z*+ij]和最劣方案[z*-ij],并確定最優(yōu)距離[D+i]和最劣距離[D-i],構(gòu)造相似度Ci,公式如下:
[z*+ij=max(z+1,z+2,…,z+i)z*-ij=max(z-1,z-2,…,z-i)] " " " (21)
[D+i=j(z*ij-z*+ij)2D-i=j(z*ij-z*-ij)2] " " " " " " "(22)
[Ci=D-i(D+i+D-i)] " " " " " " " "(23)
最后按照相似度大小Ci進(jìn)行排序,得到最終的坡面泥石流風(fēng)險(xiǎn)度大小。本文改進(jìn)了最后的風(fēng)險(xiǎn)度大小,加大了土壓力和剪切波速的權(quán)重,改進(jìn)后的風(fēng)險(xiǎn)度計(jì)算公式如下:
[Ri=λSi+(1-2λ)Ci] " " " " (24)
式中:[Si]表示第i個(gè)時(shí)間步的傳感器土壤應(yīng)力和剪切波速的數(shù)據(jù);[Ci]表示第i個(gè)時(shí)間步的原坡面泥石流風(fēng)險(xiǎn)度大??;[λ]表示加權(quán)的權(quán)重大小;[Ri]表示第i個(gè)時(shí)間步的改進(jìn)后坡面泥石流風(fēng)險(xiǎn)度。具體權(quán)重大小可人為設(shè)定或根據(jù)智能優(yōu)化算法選取,此處人為設(shè)定[λ=0.3]。
圖9所示為坡面泥石流風(fēng)險(xiǎn)度曲線。對(duì)比坡面泥石流過(guò)程中的位移、土壓力、剪切波速以及改進(jìn)前后的坡面泥石流風(fēng)險(xiǎn)度可知:改進(jìn)前的坡面泥石流風(fēng)險(xiǎn)度更大程度上反映的是坡面泥石流位移量的變化情況,當(dāng)位移量增大時(shí),風(fēng)險(xiǎn)度迅速增加;改進(jìn)后的坡面泥石流風(fēng)險(xiǎn)度加大了土壓力和剪切波速的因素,不僅反映位移量的改變情況,也具有前兆預(yù)警特征。原因是剪切波速和土壓力具有預(yù)警先兆,剛開始發(fā)生位移變化的前一段時(shí)刻,剪切波速具有明顯上升的趨勢(shì);之后每次位移變化前,土壓力增大,反映了坡面泥石流即將發(fā)生較大滑流的特征。改進(jìn)后的坡面泥石流突出了具有先兆預(yù)警特征的傳感器數(shù)據(jù),能提前反映坡面泥石流即將遇到的風(fēng)險(xiǎn)情況。
3.2 "模型性能對(duì)比實(shí)驗(yàn)
為測(cè)試DA?TCN?BiGRU模型的性能,對(duì)比GRU、BiGRU、TCN、TCN?BiGRU和自注意力機(jī)制時(shí)間卷積和雙向門控循環(huán)單元(ATCN?BiGRU)。評(píng)價(jià)性能好壞的指標(biāo)為平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE),具體公式如下:
[MAE=1Ni=1Nyi-yi] " " " " " " (25)
[RMSE=1Ni=1N(yi-yi)2] " " nbsp; "(26)
[MAPE=1Ni=1Nyi-yiyi×100%] " " " "(27)
模型運(yùn)行環(huán)境為:R5?5600G CPU,Windows 11,NVIDIA GeForce GTX 3060 GPU,16 GB內(nèi)存,Python 3.6,Keras 2.6.0,TensorFlow 2.6.0。模型測(cè)試分為兩類滑動(dòng)窗口,分別是100?10和100?50,分別反映不同的輸入數(shù)據(jù)長(zhǎng)度與預(yù)測(cè)長(zhǎng)度。DA?TCN?BiGRU模型的參數(shù)設(shè)置為:濾波器filters=32,批次大小batch size=128,卷積核大小kernel size=8,單元數(shù)gru_units =16。其中注意力機(jī)制的激活函數(shù)為Softmax,TCN模型的參數(shù)設(shè)置為:濾波器filters=32,批次大小batch size=128,卷積核大小kernel size=8。LSTM、GRU、BiLSTM和BiGRU模型的參數(shù)設(shè)置為:?jiǎn)卧獢?shù)為16,深度為32層,激活函數(shù)為ReLU,優(yōu)化算法為Adam,初始學(xué)習(xí)率為0.001,后續(xù)會(huì)根據(jù)損失函數(shù)調(diào)整學(xué)習(xí)率。為防止過(guò)擬合,均采用正則化dropout=0.2。不同的模型分別測(cè)試20次,統(tǒng)計(jì)每個(gè)模型性能指標(biāo)的平均值,性能對(duì)比統(tǒng)計(jì)的結(jié)果如表1所示。
表1表明:當(dāng)滑動(dòng)窗口為100?10時(shí),DA?TCN?BiGRU的RMSE、MAE和MAPE指標(biāo)較低,相較于GRU分別下降了82.01%、75.71%和76.46%,相較于BiGRU分別下降了65.43%、51.42%和52.88%,相較于TCN?BiGRU分別下降了36.64%、37.34%和37.25%,相較于ATCN?BiGRU分別下降了13.05%、10.59%和10.23%;當(dāng)滑動(dòng)窗口設(shè)置為100?50時(shí),DA?TCN?BiGRU的RMSE、MAE和MAPE指標(biāo)相較于GRU分別下降了74.77%、71.03%和72.25%,相較于BiGRU分別下降了66.91%、56.92%和58.28%,相較于TCN分別下降了57.13%、46.81%和50.97%,相較于TCN?BiGRU分別下降了20.13%、24.11%和24.31%,相較于ATCN?BiGRU分別下降了7.14%、10.08%和11.39%。
對(duì)比不同預(yù)測(cè)長(zhǎng)度的模型性能,可知預(yù)測(cè)長(zhǎng)度越短,性能指標(biāo)越小,預(yù)測(cè)效果越佳。當(dāng)預(yù)測(cè)長(zhǎng)度較長(zhǎng)時(shí),注意力機(jī)制捕獲長(zhǎng)時(shí)間依賴特性愈發(fā)凸顯。對(duì)比ATCN?BiGRU和DA?TCN?BiGRU模型,DA?TCN?BiGRU中雙注意力機(jī)制可以最大程度上降低信息損失,進(jìn)一步提高模型的準(zhǔn)確性。
為更加直觀地展現(xiàn)出坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)的實(shí)際誤差情況,繪制出不同模型的誤差絕對(duì)值曲線,如圖10、圖11所示。
圖10和圖11直觀展現(xiàn)了模型預(yù)測(cè)2 000個(gè)時(shí)間步時(shí)坡面泥石流風(fēng)險(xiǎn)度的誤差情況。在窗口100?10中,誤差從高到低分別為GRU、BiGRU、TCN、TCN?BiGRU、ATCN?BiGRU和DA?TCN?BiGRU;在窗口100?50中,誤差從高到低分別為GRU、BiGRU、TCN、TCN?BiGRU、ATCN?BiGRU和DA?TCN?BiGRU。
圖10和圖11結(jié)果表明,DA?TCN?BiGRU模型的誤差最低,預(yù)測(cè)效果較好。對(duì)比兩種窗口可知:預(yù)測(cè)長(zhǎng)度越長(zhǎng)時(shí),模型的誤差越大,預(yù)測(cè)難度越大;有注意力機(jī)制的ATCN?BiGRU和DA?TCN?BiGRU效果較佳,其中DA?TCN?BiGRU的預(yù)測(cè)精度較高。
4 "結(jié) "語(yǔ)
坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)是巖土工程、計(jì)算機(jī)科學(xué)等學(xué)科的交叉研究領(lǐng)域。本文進(jìn)行了坡面泥石流模擬實(shí)驗(yàn),通過(guò)實(shí)驗(yàn)得到5類傳感器數(shù)據(jù),經(jīng)過(guò)改進(jìn)后TOPSIS熵值法得到客觀的坡面泥石流風(fēng)險(xiǎn)度,表征坡面泥石流發(fā)生的風(fēng)險(xiǎn)情況。為了提高預(yù)測(cè)準(zhǔn)確度,將TCN?BiGRU引入坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域,并融合雙注意力機(jī)制,考慮了重要信息對(duì)預(yù)測(cè)的影響,有效提取了傳感器數(shù)據(jù)的特征。由對(duì)比實(shí)驗(yàn)結(jié)果可知,DA?TCN?BiGRU模型在坡面泥石流風(fēng)險(xiǎn)預(yù)測(cè)方面具有有效性和可行性。
注:本文通訊作者為李青。
參考文獻(xiàn)
[1] 王子寒,張彪,景曉昆,等.土工格室防治坡面型泥石流啟動(dòng)機(jī)理研究[J].自然災(zāi)害學(xué)報(bào),2022,31(5):140?149.
[2] 疏杏勝,王子茹,李福威,等.基于機(jī)器學(xué)習(xí)模型的短期降雨多模式集成預(yù)報(bào)[J].南水北調(diào)與水利科技,2020,18(1):42?50.
[3] 唐旺,馬尚昌,陳銳.基于LSTM的川西北地區(qū)降雨型泥石流預(yù)警方法[J].桂林理工大學(xué)學(xué)報(bào),2020,40(4):719?725.
[4] HEWAGE P, BEHERA A, TROVATI M, et al. Temporal con?volutional neural (TCN) network for an effective weather forecasting using time?series data from the local weather station [J]. Soft computing, 2020, 24(21): 16453?16482.
[5] HIRSCHBERG J, BADOUX A, MCARDELL B W, et al. Limita?tions of rainfall thresholds for debris?flow prediction in an Alpine catchment [EB/OL]. [2022?12?11]. https://www.xueshufan.com/publication/3164977424.
[6] 熊江,唐川,陳明.泥石流早期識(shí)別與監(jiān)測(cè)預(yù)警研究進(jìn)展探討[J].自然災(zāi)害學(xué)報(bào),2021,30(1):165?173.
[7] BAI S, KOLTER J Z, KOLTUN V. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling [EB/OL]. [2023?01?14]. https://blog.csdn.net/LawenceRay/article/details/89789231.
[8] XU Y, HU C, WU Q, et al. Application of temporal convolu?tional network for flood forecasting [J]. Hydrology research, 2021, 52(6): 1455?68.
[9] WAN R, MEI S, WANG J, et al. Multivariate temporal convolu?tional network: a deep neural networks approach for multivariate time series forecasting [J]. Electronics, 2019, 8(8): 876.
[10] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. California: ACM, 2017: 6000?6010.
[11] 余國(guó)安.兩類泥石流形成機(jī)制的再討論[J].自然災(zāi)害學(xué)報(bào),2022,31(1):238?250.
[12] 吳鑫,李青.基于剪切波波速的土體抗剪強(qiáng)度測(cè)量裝置研制[J].科技通報(bào),2022,38(1):73?76.
[13] REN Yajie, ZHAO Dong, LUO Dan, et al. Global?local temporal convolutional network for traffic flow prediction [J]. IEEE transcation on intelligent transportation systems, 2022, 23(2): 1578?1584.