李 昂,張 坤,桑宇婷,畢 婉
(1.無錫瀚瀾水利科技有限公司,江蘇 無錫 214024;2.太湖流域水文水資源監(jiān)測中心,江蘇 無錫 214024;3.蘇州市吳江區(qū)水利工程運行中心,江蘇 蘇州 215299)
可靠的水位預(yù)測對流域水資源調(diào)度、防汛防旱、河道管理、水利工程建設(shè)具有重要意義[1-3]。然而,隨著氣候變化、降水量及人類活動的影響,河流水位的非平穩(wěn)、非線性特性進一步加劇,從而導(dǎo)致高精度的水位預(yù)測仍較為困難。因此,如何對復(fù)雜性強,波動性大的河流水位進行有效準(zhǔn)確的預(yù)測,是目前亟待解決的問題。
水位預(yù)測常用方法為過程驅(qū)動模型,但過程驅(qū)動模型的使用過程較為復(fù)雜,受不同氣候條件限制,且需考慮降雨、下墊面等多種影響水位變化的因素。近年來,隨著大數(shù)據(jù)與人工智能的飛速發(fā)展,數(shù)據(jù)驅(qū)動模型憑借其只需模擬水位數(shù)據(jù)序列的變化規(guī)律進行水位預(yù)測的優(yōu)勢,被越來越多的學(xué)者用于水位預(yù)測。其中,人工神經(jīng)網(wǎng)絡(luò)通過模擬動物神經(jīng)網(wǎng)絡(luò)進行信息處理,具有自學(xué)習(xí)、高容錯性等特點[4-5],因此被更多地使用于水位預(yù)測并取得了較好的預(yù)測效果,顧乾暉等[6]建立基于PSO-SVR-LSTM適用于具有復(fù)雜特性的水位預(yù)測中,屠澤杰等[7]采用EEMD-BP模型對短期余水位進行預(yù)測,要震等[8]建立基于遺傳算法優(yōu)化的Elman網(wǎng)絡(luò)進行河流水位預(yù)測,王迎飛等[9]采用基于注意力機制的LSTM模型對長江汛期水位進行預(yù)測。而回聲狀態(tài)網(wǎng)絡(luò)(ESN)作為一種新型神經(jīng)網(wǎng)絡(luò),引入了儲備池代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)模型的隱藏層,解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的局部極小和收斂慢的問題,其簡單獨特的訓(xùn)練方式可在一定程度上提高預(yù)測的精度[10]。
然而,河流水位序列包含多種頻率信息的復(fù)雜特性,增大了單一模型的參數(shù)估計及數(shù)據(jù)學(xué)習(xí)困難,導(dǎo)致預(yù)測效果仍不理想。隨著希爾伯特-黃與小波變換的發(fā)展,出現(xiàn)了“分解-預(yù)測-重構(gòu)”模式的單次分解組合預(yù)測方法,即利用不同水文時間序列處理方法,如:小波變換(WT)、經(jīng)驗?zāi)B(tài)分解(EMD)、極點對稱模態(tài)分解(ESMD)等方法將復(fù)雜的水位序列分解為多個包含不同頻率信息的子序列,再通過單一預(yù)測模型進行預(yù)測重構(gòu),可比單一方法得到更為滿意的結(jié)果[11-13]。相比于其他水文時間序列處理方法,ESMD不僅能夠解決WT人為確定基函數(shù)的主觀性及EMD的模態(tài)混疊問題,同時具有更高的分解效率,能夠達(dá)到更好的平穩(wěn)化及簡化目的。但ESMD分解出的高頻分量仍具有波動強烈且絕對值大的特點,受預(yù)測模型預(yù)測機理和適用性約束,高頻分量的預(yù)測精度仍有不足,將會對整個水位序列預(yù)測效果產(chǎn)生影響。目前對于最高頻分量預(yù)測精度的處理方式大多是去除最高頻分量或重構(gòu)時更改分量權(quán)重,但這些方式并未從根本上解決高頻分量預(yù)測精度低的問題,且去除最高頻分量易出現(xiàn)主要信號缺失問題[14]。
因此本文借鑒序列處理方法對原始河流水位序列分解的思路,采用變分模態(tài)分解(VMD)對最高頻分量進行二次分解,VMD不僅可將較為復(fù)雜的最高頻分量進一步轉(zhuǎn)化為相對簡單的多個子序列,且在保證分解效果的前提下,可以分解出較少的分量;再與預(yù)測性能較好的ESN模型進行組合,構(gòu)成ESMD-VMD-ESN二次分解組合模型,同時以太浦河上游太浦閘月均水位序列為例進行預(yù)測,與單一ESN及一次分解ESMD-ESN模型進行對比,探究二次分解組合模型的適用性及有效性,提高太浦河入河水位預(yù)測精度,為沿線水利工程全年管護及水閘啟閉等規(guī)劃工作提供依據(jù)。
ESMD-VMD-ESN組合預(yù)測模型采用“一次分解-二次分解-預(yù)測-重構(gòu)”模式,首先采用ESMD將原始水位序列分解,得到有限個模態(tài)分量(Mode,M)及一個殘余分量(Residual,R),解決水位序列的復(fù)雜性對模型預(yù)測精度影響[15-17];再將這些M分量中的最高頻分量M1通過VMD進行二次分解,可通過分量中心頻率確定VMD最優(yōu)分解個數(shù),進一步提取分量主要信息,得到若干變分模態(tài)分量(VM),簡化M1分量[18-19];最后,由于ESN不同于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),將隱藏層替換為儲備池,儲備池內(nèi)包含大量神經(jīng)元,從而具有較好的記憶功能[20],因此采用ESN對上述兩次分解出的全部子序列進行預(yù)測并重構(gòu),得到最終預(yù)測值。通過兩次分解后再預(yù)測的組合模式,可以最大程度剖析水位序列的變化特性,從而綜合提高水位預(yù)測精度。ESMD-VMD-ESN組合預(yù)測模型具體計算流程見圖1。
圖1 ESMD-VMD-ESN組合模型預(yù)測流程
太浦河是流域泄洪骨干河道,也是太湖向下游供水的重要通道。近年來,受多次強降雨和長時間臺風(fēng)的影響,太浦河高水位頻現(xiàn),水位呈現(xiàn)逐年上漲趨勢,嚴(yán)重威脅沿河區(qū)域安全,因此能夠準(zhǔn)確預(yù)測太浦河入河水位情況,對及時采取防汛措施,保障地區(qū)及人民群眾安全有重要意義。太浦閘水文站位于太浦河入河口處,長期為流域骨干工程太浦閘提供水文信息服務(wù),其中水位數(shù)據(jù)在流域防汛抗旱、水資源調(diào)度與管理、水環(huán)境綜合治理及供水安全保障等工作中發(fā)揮了重要作用。為了驗證二次分解組合模型的在預(yù)測太浦河入河水位的適用性及有效性,針對近年來水位變化情況及趨勢,本文采用太浦閘站2011—2020年近10年的月水位資料進行模擬驗證,以期達(dá)到良好的月水位預(yù)測結(jié)果,為太浦河沿線汛期安全,水利工程管護及水閘啟閉等規(guī)劃工作提供數(shù)據(jù)支撐。
太浦閘月水位序列及其快速傅里葉變換(FFT)結(jié)果見圖2,月水位序列線性擬合表明,太浦閘水位近十年呈現(xiàn)緩慢上升趨勢,由于16年、20年太湖特大洪水,太浦閘16年及20年汛期水位明顯提高;月水位序列的FFT變換結(jié)果顯示,月水位序列包含多個主要的頻率信息,分別為0.04、0.06、0.08、0.16、0.22、0.3、0.32、0.36 Hz,較為復(fù)雜,這導(dǎo)致目前單一的水位預(yù)測模型精度較差。
a)月水位序列
為簡化月水位序列,提高水位預(yù)測模型精度,采用ESMD將復(fù)雜的原始月水位序列分解為若干包含不同尺度信息的M分量及一個包含趨勢信息的R分量,見圖3,所分解出的分量從M1~R頻率逐漸減小,波長逐漸變長。其中,M1頻率最高,波長最短,相比于其余分量波動更加劇烈,與原水位序列最為相似;M2~M3波動程度雖有所減小,但頻率仍較大;M4~M6可明顯看出頻率降低,波動程度減小,逐漸表現(xiàn)出一定的周期;R能夠呈現(xiàn)水位變化趨勢,即先上升再下降再緩上升趨勢,總體為上升趨勢,與水位線性擬合趨勢相同,但能更細(xì)致地看出11年至20年的水位變化情況。由于16年、20年太湖發(fā)生特大洪水,太浦閘站在太湖入太浦河口處,16年呈現(xiàn)水位大幅上升趨勢,后續(xù)17年至19年水量有所下降,20年又呈緩上升趨勢,R所呈現(xiàn)的趨勢符合實際情況,因此ESMD有著良好的水位信息分解提取能力。
a)M1
為了檢驗ESMD分解效果,對各分量進行FFT變換,結(jié)果見圖4:各分量所包含的頻率信息情況均不完全相同,即各分量可有效提取原始水位序列的不同信息,M1分量所包含的頻率信息仍較多且較為復(fù)雜,主要頻率為0.04、0.06、0.16、0.22、0.3、0.32、0.36Hz,與原始水位序列的頻率信息分布基本相似,仍包含了較多的原始水位序列信息;M2~M3序列相比于M1頻率降低,F(xiàn)FT變換曲線更為簡單,且所包含的頻率信息減少,分別為0.22、0.16、0.08 Hz;M4~M6的頻率進一步降低,分別為0.08、0.06、0.04,除M1外,其余分量均只包含一個或兩個水位序列中的主要頻率信息,則ESMD可有效分解出原序列的主要及次要信息,降低原始水位序列的復(fù)雜程度。
a)M1
由2.2中ESMD分解結(jié)果可知,ESMD分解出的最高頻分量M1仍包含較多的頻率信號,相比于其他分量更為復(fù)雜,因此本文采用VMD對M1進行二次分解,進一步提取最高頻分量中混雜的頻率信息,從而降低M1分量的復(fù)雜程度,進一步提高后續(xù)預(yù)測精度。同時為了能夠體現(xiàn)看出二次分解效果,對分解出的各VM分量進行FFT變換,結(jié)果見圖5:二次分解可有效將M1分量進一步分解為含有不同頻率信息的分量,其中VM1~VM5所包含的主要頻率分別為0.04、0.06、0.16、0.22、0.3、0.32、0.36,與M1所包含的頻率信息相一致,且各分量均只包含一個或兩個主要頻率信息,即VMD分解可進一步簡化并提取ESMD最高頻分量M1的頻率信息,為后續(xù)預(yù)測模型性能的提高奠定了基礎(chǔ)。
圖5 M1分量VMD分解結(jié)果及FFT變換曲線
本文采用太浦閘站2011—2020年共120個月水位數(shù)據(jù)進行模擬驗證,其中采用前108個月的數(shù)據(jù)作為模擬期對模型進行模擬訓(xùn)練,后12個月數(shù)據(jù)作為驗證期來驗證模型預(yù)測效果。得到各模型模擬期驗證期預(yù)測結(jié)果見圖6。
圖6 各模型驗證期預(yù)測結(jié)果對比
由圖6可知,基于二次分解組合模型ESMD-VMD-ESN與實測值擬合程度最高預(yù)測效果最好,一次分解組合模型ESMD-ESN次之,單一預(yù)測模型ESN最差。其中,ESN模型在汛期,尤其是在7、8月水位大幅增加的時期,預(yù)測效果較差,其他月份的預(yù)測效果相對較好;2種組合預(yù)測模型相比于單一預(yù)測模型在7、8月的預(yù)測精度明顯提高,且預(yù)測的水位變化趨勢與實測值基本一致,但ESMD-ESN模型在3、4月以及10月預(yù)測精度與實測值仍有較大偏差。
為了更準(zhǔn)確地分析這些模型的性能,本文采用威爾莫特一致性指數(shù)(WIA)、皮爾遜相關(guān)系數(shù)(PCC)、平均絕對誤差(MAE)、均方根誤差(RMSE)對驗證期預(yù)測結(jié)果進行精度評價,結(jié)果見表1。
表1 各模型驗證期預(yù)測指標(biāo)對比
由表1可知,各模型預(yù)測結(jié)果的WIA值均可達(dá)到0.6以上,具有實際預(yù)測價值。3個模型中ESMD-VMD-ESN模型預(yù)測精度最好,ESMD-ESN模型次之,單一ESM模型最差,由于原始水位序列復(fù)雜,單一模型不能準(zhǔn)確全面地學(xué)習(xí)水位序列中的信號特征,其WIA、PCC值最小,MAE、RMSE最大;一次分解模型ESMD-ESN能夠有效分解提取出原始水位序列的信號特征,相較于單一ESN模型,WIA、PCC分別提高51%、11%,MAE、RMSE分別減小14%、45%,預(yù)測精度明顯提高,但由于ESMD分解出的最高頻分量M1仍包含較多的信號特征,M1的預(yù)測精度相對較低(圖7),M1相比于其他分量,WIA及PCC最小,MAE及RMSE最大。而二次分解組合模型ESMD-VMD-ESN則能夠有效解決一次分解中最高頻分量M1精度仍較低的問題,進一步提高整體預(yù)測精度,相比于ESMD-ESN,WIA、PCC分別提高5%、10%,MAE、RMSE分別減小52%、50%,其中經(jīng)VMD分解處理之后的最高頻分量M1(VMD)與原最高頻分量M1的精度對比見圖8,與原最高頻分量M1相比,M1(VMD)分量的WIA、PCC分別提高26%、61%,MAE、RMSE分別減小48%、39%,因此二次分解組合模型ESMD-VMD-ESN具有更好的預(yù)測效果。
圖7 ESMD分解的各M分量預(yù)測指標(biāo)
圖8 M1分量與M1(VMD)預(yù)測指標(biāo)
本文構(gòu)建ESMD-VMD-ESN組合模型,探究“一次分解-二次分解-預(yù)測-重構(gòu)”二次分解組合模式的有效性。以太浦河上游太浦閘站2011—2020年月水位數(shù)據(jù)為例,并與單一ESN模型、一次分解組合模型ESMD-ESN進行對比分析,可知模型預(yù)測精度ESMD-VMD-ESN>ESMD-ESN>ESN,即ESMD可有效簡化并提取水位序列信息,但其最高頻分量M1的預(yù)測精度相比于其他分量仍較低,而通過VMD對M1進行二次分解后,預(yù)測精度可進一步提高。因此二次分解組合模式可以有效彌補單一預(yù)測模型及單次分解方法的缺點,是可行有效的,可根據(jù)預(yù)測結(jié)果及時了解短期水位變化趨勢,為沿線水利工程全年管護及河流下游水閘合理調(diào)度提供依據(jù)。