王曉玲,李 克,張宗亮,余紅玲,孔令學(xué),陳文龍
(1.天津大學(xué) 水利工程仿真與安全國家重點(diǎn)實(shí)驗(yàn)室,天津 300072;2.中國電建集團(tuán)昆明勘測(cè)設(shè)計(jì)研究院有限公司,云南 昆明 650051)
大壩滲流安全監(jiān)測(cè)是保證大壩安全穩(wěn)定運(yùn)行的重要手段,滲壓實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)是大壩運(yùn)行性態(tài)的直接表征[1-2]。目前常用的大壩滲壓預(yù)測(cè)模型主要注重滲壓效應(yīng)量和影響因子之間的非線性映射關(guān)系,缺乏對(duì)滲壓效應(yīng)量內(nèi)在影響機(jī)制的挖掘。因此,建立精確的滲壓預(yù)測(cè)模型并且探究滲壓變化的內(nèi)在原因,對(duì)于深入研究大壩滲流安全狀態(tài)具有重要的理論和現(xiàn)實(shí)意義。
近年來,隨著人工智能技術(shù)的不斷發(fā)展,越來越多的機(jī)器學(xué)習(xí)模型應(yīng)用到大壩滲流預(yù)測(cè)模型的研究中[3-4]。例如,Chen 等[5]建立了基于最小二乘支持向量機(jī)的大壩滲流預(yù)警模型。Qiu 等[6]利用小波神經(jīng)網(wǎng)絡(luò)和最大熵原理對(duì)某土石壩在暴雨影響下的滲流狀態(tài)進(jìn)行了研究。Roushangar 等[7]建立了基于小波互信息和高斯過程回歸的組合模型來預(yù)測(cè)土石壩的滲流流量值。Fernando 等[8]將回歸樹模型應(yīng)用到大壩異常檢測(cè)中去。繆長健等[9]、Zhang 等[10]和黃振東[11]針對(duì)傳統(tǒng)的統(tǒng)計(jì)模型難以反映大壩滲流與影響因子之間的非線性關(guān)系的缺點(diǎn),將反向傳播神經(jīng)網(wǎng)絡(luò)應(yīng)用于滲流預(yù)測(cè)模型,提高了模型的非線性映射能力。Chen 等[12]提出了基于核極限學(xué)習(xí)機(jī)滲流預(yù)測(cè)的數(shù)據(jù)挖掘與監(jiān)測(cè)框架。馮春燕等[13]建立了卡爾曼濾波回歸模型對(duì)測(cè)壓管水位進(jìn)行預(yù)測(cè)。Li 等[14]等基于灰色聚類分析方法對(duì)用于大壩健康監(jiān)測(cè)。
上述研究在大壩滲流安全監(jiān)控中發(fā)揮了重要的作用。隨著人工智能的快速發(fā)展,將深度學(xué)習(xí)模型應(yīng)用于大壩監(jiān)測(cè)領(lǐng)域已成為研究熱點(diǎn)[15-16]。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,深度學(xué)習(xí)模型可對(duì)滲流監(jiān)測(cè)數(shù)據(jù)進(jìn)行深度挖掘,能得到更加準(zhǔn)確的預(yù)測(cè)結(jié)果。在時(shí)序預(yù)測(cè)研究中,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)是一種常用的深度學(xué)習(xí)模型。然而,RNN 存在梯度消失和爆炸的問題,導(dǎo)致對(duì)長時(shí)間序列數(shù)據(jù)的預(yù)測(cè)精度不足[17]。LSTM 的提出解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的缺陷,它在RNN 的隱含層中引入“門”的概念來增強(qiáng)模型的長期記憶能力,可以有效避免時(shí)間序列中長期依賴的問題[18]。與其他神經(jīng)網(wǎng)絡(luò)模型一樣,LSTM 具有眾多超參數(shù)且難以通過人為選擇確定最優(yōu)超參數(shù)。此外,不同的超參數(shù)對(duì)模型的擬合優(yōu)度、收斂速度等都存在較大的差異性。蟻獅優(yōu)化算法(Ant Lion Optimizer,ALO)因其具有調(diào)節(jié)參數(shù)少、收斂速度快、魯棒性高等特點(diǎn),在工程領(lǐng)域應(yīng)用廣泛[19-20]。因此,本文采用ALO 算法對(duì)LSTM 的參數(shù)進(jìn)行自動(dòng)尋優(yōu)。
在大壩服役期間,壩體滲流壓力受到上下游水位、溫度、降雨以及壩體材料的時(shí)變特性等多種變量的耦合影響[2]。由于LSTM 為黑箱模型,故其對(duì)壩體滲流壓力與影響因子之間的可解釋性不高[21-22]。注意力機(jī)制是從人類視覺研究中衍生出來的智能算法,通過在關(guān)鍵信息上分配注意力權(quán)重來突出重要的特征信息[23]。本文在滲壓預(yù)測(cè)模型中引入一種特征注意力機(jī)制以增強(qiáng)模型對(duì)各個(gè)影響因子的可解釋性。值得注意的是,當(dāng)影響因子維數(shù)較多時(shí),會(huì)存在多重共線性,不僅會(huì)造成信息的冗余[5,24],還會(huì)影響注意力機(jī)制進(jìn)行特征學(xué)習(xí)時(shí)的準(zhǔn)確性。因此,在滲壓預(yù)測(cè)研究中需要對(duì)影響因子進(jìn)行降維處理以消除其多重共線性。常用的降維方法有皮爾遜相關(guān)分析法、主成分分析(Principal Component Analysis,PCA)、逐步回歸、關(guān)聯(lián)度分析方法等[25-26]。其中,PCA 方法是一種通過線性空間變換將多個(gè)輸入向量進(jìn)行降維的統(tǒng)計(jì)分析方法,其降維效果顯著,故本文選擇PCA 方法來對(duì)各影響因子數(shù)據(jù)進(jìn)行降維處理。
綜上所述,為深入探究滲壓效應(yīng)量變化的內(nèi)在影響機(jī)制,本文提出了一種耦合ALO-LSTM 和特征注意力機(jī)制的土石壩滲壓預(yù)測(cè)模型。首先,為了消除影響因子之間的多重共線性,采用PCA 方法對(duì)影響因子進(jìn)行降維;其次,由于滲壓監(jiān)測(cè)數(shù)據(jù)為時(shí)間序列數(shù)據(jù),為挖掘其在時(shí)間維度上的關(guān)聯(lián)性,構(gòu)建基于LSTM 的土石壩滲壓預(yù)測(cè)模型,并采用ALO 算法對(duì)LSTM 模型的超參數(shù)進(jìn)行自動(dòng)尋優(yōu);最后,采用特征注意力機(jī)制量化各個(gè)影響因子對(duì)滲流壓力的影響程度以增強(qiáng)模型的可解釋性。
2.1 ALO-LSTM 模型與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)借助其循環(huán)模塊可以幫助模型記憶歷史信息,這樣網(wǎng)絡(luò)可以更好地挖掘滲壓輸入變量和其影響因子中的時(shí)間信息。LSTM 模型是對(duì)傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的一種改進(jìn),它通過將門控制函數(shù)引入狀態(tài)動(dòng)力學(xué),解決了傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)中常見的梯度消失和爆炸問題[27]。LSTM 模型先通過遺忘門從記憶單元細(xì)胞中篩選滲壓輸入變量;其中重要信息的存儲(chǔ)由輸入門來確定;最后通過輸出門來輸出滲壓變量。LSTM 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖如圖1 所示。
圖1 LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
LSTM 結(jié)構(gòu)單元內(nèi)部的遺忘門、輸入門和輸出門的建模流程如下:
(1)遺忘門控制從前一刻的記憶細(xì)胞中可以積累多少滲壓監(jiān)測(cè)數(shù)據(jù)到當(dāng)前時(shí)刻的記憶細(xì)胞中,表達(dá)式如下式:
(2)輸入門將LSTM 的當(dāng)前記憶和長期記憶結(jié)合起來,形成一個(gè)新的單元狀態(tài)用來挖掘滲壓監(jiān)測(cè)數(shù)據(jù)中的時(shí)序特征:
當(dāng)前時(shí)刻單元Ct的狀態(tài)如下式所示:
(3)LSTM 的最終輸出由輸出門和單元狀態(tài)決定:
式(1)至式(6)中:ht-1和ht分別為上一時(shí)刻單元的輸出和當(dāng)前細(xì)胞的輸出;ft、it、、Ct、ot分別為遺忘門、輸入門、當(dāng)前時(shí)刻初始細(xì)胞狀態(tài)、當(dāng)前時(shí)刻細(xì)胞狀態(tài)以及輸出門的值;σ為Sigmoid 函數(shù);W和b分別為相應(yīng)的權(quán)重系數(shù)和偏置項(xiàng)。
由于LSTM 的超參數(shù)眾多,超參數(shù)的選取影響到模型的精度,因此需要合理選擇這些超參數(shù)。蟻獅優(yōu)化算法(Ant Lion Optimizer,ALO)是2015年澳大利亞學(xué)者M(jìn)irjalili Seyedali 受蟻獅捕食行為關(guān)系的啟發(fā)而提出的一種新型群智能優(yōu)化算法。相關(guān)研究表明蟻獅優(yōu)化算法具有比遺傳算法(Genetic Algorithm,GA)、花朵授粉算法(Flower Pollination Algorithm,F(xiàn)PA)和蝙蝠算法(Bat Algorithm,BA)等算法更優(yōu)的尋優(yōu)精度和更快的收斂速度[28]。
ALO 算法具體的操作流程如下:
(1)螞蟻隨機(jī)游走。在自然界,螞蟻通過隨機(jī)游走的方式來尋找食物,如式(7)所示:
式中:cumsum為累積和;t為螞蟻在隨機(jī)游走時(shí)的位置;n為最大迭代次數(shù);r(t)為螞蟻在游走過程中產(chǎn)生的隨機(jī)數(shù),可由下式生成:
(2)螞蟻游走范圍。蟻獅構(gòu)造的陷阱會(huì)影響螞蟻的隨機(jī)行走,其數(shù)學(xué)模型表示如下:
式中:Antlionjt為蟻獅在第t次迭代時(shí)第j只的位置;d it為所有輸入向量在第i個(gè)螞蟻中的最大值;c it為所有輸入向量在第i個(gè)螞蟻中的最小值;d t為所有輸入向量在第t次迭代時(shí)的最大值;ct為所有輸入向量在第t次迭代時(shí)的最小值。
(3)螞蟻掉落陷阱
式中I為比率。
(4)蟻獅重構(gòu)陷阱。為了使捕捉新螞蟻的機(jī)會(huì)增加,蟻獅需要通過改變自己的位置來適應(yīng)被捕食螞蟻所在的位置,由下式表示:
式中Ant it為第i只螞蟻在第t次迭代時(shí)的位置。
(5)精英化蟻獅。在每一次迭代的過程中,適應(yīng)度最好的蟻獅所在的位置會(huì)被留下來當(dāng)做精英蟻獅,精英蟻獅在迭代過程中能影響螞蟻的位置??筛鶕?jù)下式得到螞蟻的位置:
式中:R At是在第t次迭代中根據(jù)輪盤賭機(jī)制選擇蟻獅的隨機(jī)游走策略;R Et是第t次迭代中圍繞精英蟻獅的隨機(jī)游走策略。
ALO 算法具有調(diào)節(jié)參數(shù)少、收斂速度快、魯棒性高等特點(diǎn),該算法采用隨機(jī)游走以及輪盤賭方式等策略可有效避免陷入局部最優(yōu)等問題。本文使用ALO 算法優(yōu)化LSTM 模型超參數(shù),可以快速找到最優(yōu)超參數(shù)的組合,避免手動(dòng)調(diào)參帶來的不便,提高模型訓(xùn)練效率。
2.2 特征注意力機(jī)制特征注意力機(jī)制作為一種增強(qiáng)局部特征學(xué)習(xí)的思想,它不是一種固定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[29]。引入特征注意力機(jī)制目的在于通過調(diào)整注意力權(quán)重,從輸入向量的大量信息中快速提取有效信息。由于特征注意力機(jī)制能夠自適應(yīng)地集中于特征的有效部分,因此被廣泛應(yīng)用于圖像分類[30]、神經(jīng)機(jī)器翻譯[29,31]、時(shí)間序列預(yù)測(cè)[32]等研究領(lǐng)域。本文中引入特征注意力量化滲壓效應(yīng)量與各輸入變量之間的關(guān)聯(lián)關(guān)系。特征注意力機(jī)制的表達(dá)式如下:
式中:Wa為注意機(jī)制的權(quán)值矩陣,表示需要強(qiáng)調(diào)的信息;et為第一次加權(quán)計(jì)算結(jié)果;b為注意力機(jī)制的偏置項(xiàng);[X1,X2,…,XT]為輸入項(xiàng);at為輸入項(xiàng)得到的最終權(quán)重。
對(duì)于滲壓預(yù)測(cè)模型,通常的手段是選用高精度的機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型進(jìn)行預(yù)測(cè),但是卻忽略了哪些影響因素對(duì)滲壓效應(yīng)量的影響程度最大。本文所提的滲壓預(yù)測(cè)模型引入特征注意力機(jī)制計(jì)算隱含層單元狀態(tài)的特征權(quán)重,根據(jù)權(quán)重分配原則計(jì)算不同單元狀態(tài)的特征權(quán)重參數(shù)來表征滲壓效應(yīng)量與各個(gè)影響因子之間的相關(guān)關(guān)系,并通過softmax 函數(shù)得到和為1 的權(quán)重分布矩陣。
2.3 耦合ALO-LSTM 和特征注意力機(jī)制的土石壩滲壓預(yù)測(cè)模型建模流程本文所提模型的建模流程如圖2 所示,主要包括以下4 個(gè)步驟:
圖2 耦合ALO-LSTM 和特征注意力機(jī)制的土石壩滲壓預(yù)測(cè)模型建模流程
(1)將獲取的滲壓監(jiān)測(cè)數(shù)據(jù)和環(huán)境量監(jiān)測(cè)數(shù)據(jù)進(jìn)行異常數(shù)值檢測(cè)、缺失值插補(bǔ)和歸一化處理;
(2)對(duì)輸入變量進(jìn)行降維處理,并劃分訓(xùn)練集和測(cè)試集;
(3)通過LSTM 網(wǎng)絡(luò)構(gòu)建預(yù)測(cè)模型,其中輸入層和輸出層的神經(jīng)元數(shù)量使用ALO 優(yōu)化算法來自動(dòng)尋優(yōu);
(4)通過特征注意力機(jī)制對(duì)輸入變量賦予不同的權(quán)重量化滲壓與影響因子的關(guān)聯(lián)關(guān)系,并將輸出向量進(jìn)行反歸一化處理獲得滲壓最終預(yù)測(cè)結(jié)果。
本研究選用瀾滄江下游某礫石土心墻堆石壩工程的滲壓計(jì)監(jiān)測(cè)數(shù)據(jù)為研究對(duì)象,該工程壩頂高程821.5 m,建基面高程為560 m,具有防洪、發(fā)電等綜合效益。在本文中,選取滲壓計(jì)DB-C-P-01 處監(jiān)測(cè)點(diǎn)建立預(yù)測(cè)模型進(jìn)行分析,建模序列選取2014年7月15日至2018年7月31日,取值頻率為天。
圖3 表示該處測(cè)點(diǎn)在該時(shí)間段中滲壓觀測(cè)值,以及對(duì)應(yīng)的上游水位、降雨量的歷時(shí)過程線。
圖3 滲壓觀測(cè)時(shí)間歷程
3.1 初始輸入變量選擇大壩滲壓水頭主要受上下游水位、溫度、降雨以及壩體材料的時(shí)變特性等影響。大壩滲壓效應(yīng)量表示如下:
式中δ、δH、δT、δp、δθ分別為滲壓效應(yīng)量、水位分量、溫度分量、降雨分量和時(shí)效分量。
(1)水庫水位變化對(duì)壩體滲流影響較大,并有一定的滯后效應(yīng),其中等效水位可按照平均水位的方法計(jì)算,以表示滲流的滯后效應(yīng)[2,33]。水位分量可表示如下:
式中:hu為當(dāng)天的上游水位,m;為前1 ~3 天上游水位均值,m;為前4 ~7 天上游水位均值,m;hd為當(dāng)天的下游水位,m。
(2)溫度分量是指基巖和大壩壩體的溫度變化從而引起的滲流變化。壩體和基巖的溫度隨大氣溫度呈周期性變化,一般采用周期函數(shù)表示。本文中選擇多周期諧波函數(shù)作為溫度的表征因子,如下式所示:
式中:i=1,2;t為從起始日到實(shí)測(cè)日的累計(jì)天數(shù),d。
(3)降雨分量也是影響大壩滲流的一個(gè)主要因素,其對(duì)滲壓水頭的影響機(jī)制較為復(fù)雜。一部分由降雨入滲直接影響;一部分降雨直接形成地表徑流匯入河道使庫水位升高從而影響滲壓的變化[34]。本文中采用主成分分析方法進(jìn)行降維避免了降雨分量和水位分量之間的相互影響,所以這里的降雨分量主要集中在降雨入滲的影響上。降雨分量可由下式表示:
式中:p為當(dāng)天的降雨量, mm;為前1 ~3 天降雨量均值, mm;為前4 ~7 天降雨量均值, mm。
(4)時(shí)間分量是一個(gè)不可逆的分量,隨著時(shí)間的推移,它以不可逆的方向發(fā)展。主要反映了壩體材料蠕變、壩基巖石蠕變、巖體節(jié)理裂縫、軟弱結(jié)構(gòu)對(duì)滲壓的影響。一般情況下,時(shí)間分量的變化在開始時(shí)變化劇烈,在后期逐漸趨于穩(wěn)定。時(shí)效分量的一般變化規(guī)律可以用下式表示[2,35]:
式中θ為模型起始日至實(shí)測(cè)日的天數(shù)除以100。
綜上所述確定土石壩滲壓預(yù)測(cè)模型的初始影響變量為:
3.2 主成分降維PCA 通過空間變換將一組含有相關(guān)性的數(shù)據(jù)重構(gòu)成n個(gè)幾乎線性不相關(guān)的向量,可以解決大壩滲流預(yù)測(cè)中由于輸入向量維數(shù)過多而存在的多重共線性問題,進(jìn)而提高模型的預(yù)測(cè)精度。對(duì)3.1 節(jié)提到的影響因子進(jìn)行降維處理,得到如表1所示的方差累積貢獻(xiàn)率。方差累計(jì)貢獻(xiàn)率達(dá)到85%以上就可以認(rèn)為所得到的主成分可以解釋原始影響因子的大部分信息。
表1 方差累積貢獻(xiàn)率
經(jīng)PCA 計(jì)算得到表1的方差累積貢獻(xiàn)率,從表1可以看出前五個(gè)主成分的累積方差達(dá)到了87%,因此通過計(jì)算將原始數(shù)據(jù)為11 維的向量重構(gòu)成5 個(gè)主成分,即消除了多重共線性又大大降低了輸入向量的維度。表2為各主成分分量的得分系數(shù)矩陣。
表2 主成分分量得分系數(shù)表
3.3 ALO-LSTM 和特征注意力機(jī)制算法的土石壩滲壓預(yù)測(cè)
3.3.1 模型參數(shù)和預(yù)測(cè)性能指標(biāo)確定 首先LSTM 本身的參數(shù)有輸入層神經(jīng)元個(gè)數(shù)L1、輸出層神經(jīng)元個(gè)數(shù)L2、學(xué)習(xí)率ε、最大批數(shù)E、時(shí)間步長T,這些參數(shù)對(duì)模型的精度有重要的影響。其中ALO 算法對(duì)兩層的神經(jīng)元個(gè)數(shù)L1和L2進(jìn)行自動(dòng)參數(shù)尋優(yōu),其中ALO 算法種群規(guī)模設(shè)為50,最大迭代次數(shù)設(shè)為100,另外學(xué)習(xí)率設(shè)為0.01,時(shí)間步長設(shè)為6,最大批數(shù)設(shè)為32。
在本文中,引入平均絕對(duì)百分比誤差(MAPE)、均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)來反映模型的預(yù)測(cè)效果,以上三個(gè)指標(biāo)參數(shù)越小,表明模型的預(yù)測(cè)效果越好:
式中:n為樣本個(gè)數(shù);Ai為監(jiān)測(cè)值;Fi為預(yù)測(cè)值。
3.3.2 大壩滲壓預(yù)測(cè)結(jié)果和影響機(jī)制分析 運(yùn)用本文模型對(duì)壩體滲壓計(jì)DB-C-P-01 處監(jiān)測(cè)點(diǎn)進(jìn)行預(yù)測(cè),模型擬定測(cè)試集為2017年9月18日至2018年7月31日,預(yù)測(cè)結(jié)果如圖4 所示。
從圖4 中可以看出,預(yù)測(cè)值與實(shí)測(cè)值的擬合程度較高,其R2達(dá)到了0.98 以上。進(jìn)一步地,測(cè)試集的預(yù)測(cè)性能指標(biāo)MAPE、RMSE和MAE分別為0.28%、0.022 m、0.17 m。由此可見,本文所提模型的精度較高。
圖4 測(cè)點(diǎn)DB-C-P-01 實(shí)測(cè)值與預(yù)測(cè)值關(guān)系圖
通過特征注意力機(jī)制可以得到各個(gè)輸入向量即主成分分量的影響程度占比,結(jié)果如圖5 所示。
從圖5 可以看出,F(xiàn)1占比最大,為41.1%,F(xiàn)2占比最小,為6.31%。主成分分量是通過原始影響變量的線性變換得到的,所以可以通過主成分得分系數(shù)矩陣進(jìn)行歸一化計(jì)算得到各個(gè)分量的貢獻(xiàn)率。各影響分量的權(quán)重如圖6 所示。
圖5 各主成分權(quán)重計(jì)算結(jié)果
從圖6 中可以看出,該測(cè)點(diǎn)的滲壓水位分量影響較大,占比達(dá)到47.9%,其次是降雨分量,占比達(dá)到33.5%。溫度分量和時(shí)效分量對(duì)壩體滲壓水位的影響程度較小,比重都在10%以下。
圖6 各個(gè)影響分量的權(quán)重
為驗(yàn)證本文所提模型的優(yōu)越性,本文選擇BP 神經(jīng)網(wǎng)絡(luò)、LSTM 、LSTM-Attention 與本文所提模型進(jìn)行對(duì)比分析。圖7 顯示了上述4 個(gè)模型在DB-C-P-01 測(cè)點(diǎn)的預(yù)測(cè)結(jié)果。從圖7 中可以看出,本文所提模型預(yù)測(cè)結(jié)果更接近滲壓實(shí)測(cè)值。相比于其他三種基于LSTM 的預(yù)測(cè)模型,BP 神經(jīng)網(wǎng)絡(luò)的擬合精度較差,說明LSTM 算法更能挖掘滲壓監(jiān)測(cè)數(shù)據(jù)的時(shí)序信息。LSTM 模型在2018年4月到7月期間的精度要劣于其他模型,這是由于LSTM 模型本身為深度學(xué)習(xí)模型需要大量數(shù)據(jù)支持,當(dāng)數(shù)據(jù)量過少時(shí)會(huì)出現(xiàn)模型過擬合的現(xiàn)象。LSTM-Attention 和本文模型的穩(wěn)定性較高,由此可以看出加入注意力機(jī)制可以加強(qiáng)對(duì)局部特征信息的挖掘。
圖7 4 種模型的預(yù)測(cè)結(jié)果對(duì)比
圖8 所示的是4 種模型的預(yù)測(cè)性能指標(biāo)統(tǒng)計(jì)結(jié)果。從圖8 可以看出,本文提出的模型具有更高的預(yù)測(cè)精度,RMSE、MAE、MAPE值分別為0.28%、0.022 m、0.17 m。相比于LSTM-Attention、LSTM和BP 三種模型,其RMSE分別提高62.67%、91.36%和93.32%;MAE分別提高64.52%、91.06%和94.57%;MAPE分別提高62.5%、91.05%和94.69%。
圖8 4 種模型的預(yù)測(cè)性能指標(biāo)
大壩滲壓預(yù)測(cè)對(duì)大壩安全管控具有重要意義。本文綜合考慮大壩滲壓效應(yīng)量存在的時(shí)序特性和多因子影響特性,構(gòu)建了耦合ALO-LSTM 和特征注意力機(jī)制的土石壩滲壓預(yù)測(cè)模型,得到了如下成果:
(1)針對(duì)目前輸入向量構(gòu)建復(fù)雜,且存在嚴(yán)重的多重共線性,采用PCA 算法對(duì)影響因子進(jìn)行降維,將原始11 維輸入向量重構(gòu)成5 維向量,從而消除了原始輸入向量中存在的多重共線性。
(2)提出了耦合ALO-LSTM 和特征注意力機(jī)制的預(yù)測(cè)模型,通過ALO 算法對(duì)LSTM 的超參數(shù)進(jìn)行優(yōu)化有效解決了人工調(diào)參困難的問題,并通過特征注意力機(jī)制計(jì)算各個(gè)主成分分量的權(quán)重,增強(qiáng)了模型對(duì)輸入向量的可解釋性。
(3)以西南某土石壩為案例研究,預(yù)測(cè)結(jié)果顯示滲壓測(cè)點(diǎn)的水位分量占比最大,降雨分量次之,符合工程實(shí)際。對(duì)比分析表明,本文所提模型相比于LSTM-Attention、LSTM、BP 神經(jīng)網(wǎng)絡(luò)具有更高的預(yù)測(cè)精度,其RMSE、MAE、MAPE值分別為0.28%、0.022 m 和0.17 m。