牛景太,周 華,吳邦彬,鄧志平,任長江
(南昌工程學院水利與生態(tài)工程學院,江西 南昌 330099)
近年來,我國特高拱壩建設發(fā)展迅速,先后建成小灣、錦屏、溪洛渡、白鶴灘等300 m級特高拱壩。鑒于高拱壩服役環(huán)境復雜且特高拱壩一旦失事會嚴重威脅下游人民群眾安全以及帶來巨大的社會經(jīng)濟財產(chǎn)損失,其安全穩(wěn)定問題已成為當前壩工界關注的熱點[1-3]。因此,構建基于原型監(jiān)測資料的特高拱壩時空監(jiān)控模型,對于保證特高拱壩安全穩(wěn)定運行與長效服役具有十分關鍵的現(xiàn)實意義。
變形是最能直觀反映混凝土壩運行性能的宏觀效應量[4]。大壩時空監(jiān)控模型克服了傳統(tǒng)單測點模型不能合理表征空間變形場內在聯(lián)系的缺陷,成為當前眾多學者競相研究的熱點。王少偉等[5]利用主成分分析法提取高拱壩空間變形場綜合效應量,有效融合了多測點變形監(jiān)測數(shù)據(jù),減少了監(jiān)控模型數(shù)量,并結合有限元模型對大壩變形性態(tài)進行計算分析,實現(xiàn)了對高拱壩變形性態(tài)的快速診斷;王娟[6]利用FastICA算法,對多個測點特征信息進行提取,再利用相關向量機進行回歸預測,建立了基于FastICA-RVM的大壩多測點監(jiān)控模型。但是,大壩時空監(jiān)控模型中因子數(shù)目眾多,各測點之間空間關聯(lián)性以及影響因子間存在嚴重的多重共線性,使得計算方程不能有效反映各因子對大壩位移造成的影響,很難保證時空模型的擬合精度與穩(wěn)健性,影響了模型預測結果的真實合理性[7]。特高拱壩是一個復雜的動態(tài)結構,與一般拱壩相比,其壩體結構特性和運行環(huán)境更復雜,由此決定了其變形性態(tài)更具復雜性、多樣性及相關不確定性[8-9],加之各影響因子之間的多重共線性,如何提高其時空監(jiān)控模型精度問題顯得尤為突出。目前常用的如多元線性回歸、逐步回歸等回歸方法,由于其計算簡單高效,常在實際工程建立預測模型時被采用[10],然而它們不能有效解決和詮釋變量中存在的多重共線性問題。近年來,隨著人工智能技術高速發(fā)展,眾多機器學習方法,如支持向量機(support vector machine,SVM)[11]、人工神經(jīng)網(wǎng)絡[12-13]、極限學習機[14]等在大壩時空監(jiān)控中得到應用,其中SVM通過引入核參數(shù)將非線性不可分的數(shù)據(jù)映射到高維空間,其泛化學習能力強,風險誤差小,能夠較好地處理高維、小樣本、非線性數(shù)據(jù)。但是,SVM模型的有效性關鍵在于參數(shù)的選取,因此需要找到合適的方法對SVM參數(shù)進行優(yōu)化。為了消除多重共線性對大壩監(jiān)控模型帶來的不利影響,部分學者對該問題開展了研究:Chen等[15]考慮拱壩變形數(shù)據(jù)之間的空間關聯(lián)性,提出一種多目標預測方法,用于拱壩變形的預測和異常檢測;Salazar等[16]提出了基于增強回歸樹的大壩變形和滲漏模型,探索了每個預測因子的相對影響;胡德秀等[17]建立改進的極限學習機大壩變形安全監(jiān)控模型,改進后的模型較好地解決了由于訓練數(shù)據(jù)存在共線性造成的計算結果較差的問題;歐斌等[18]應用長短期記憶網(wǎng)絡構建了混凝土壩變形預測模型,所建模型具有優(yōu)秀的非線性數(shù)據(jù)分析能力;劉斌等[19]基于五強溪水平位移原型監(jiān)測資料,利用獨立分量回歸方法對大壩多點位移進行回歸預測,相較于傳統(tǒng)的回歸方法,此方法有效解決了多測點回歸預測模型中影響因子多重共線性導致的病態(tài)問題;曹延明等[20]采用雙支持向量機對高拱壩位移數(shù)據(jù)進行預測分析,并使用人工免疫算法對雙支持向量機進行優(yōu)化,得到了精度更高、速度更快的大壩回歸預測模型,較好地處理了復雜的非線性問題?,F(xiàn)有的研究成果雖在一定程度上削弱了多重共線性問題的影響,但本身所存在的局限性也顯而易見,特別是對于高壩大庫,由于其監(jiān)測點眾多,數(shù)據(jù)處理量大,海量的測點之間空間關聯(lián)性與影響因子的多重共線性問題尤為突出,傳統(tǒng)時空模型無法綜合考慮各測點之間的相互影響,多重共線性消除不夠徹底,嚴重影響了模型的預測精度,因此難以全面掌握特高拱壩整體變形性態(tài)[21]。
為有效解決多重共線性問題,合理有效地表征混凝土特高拱壩的整體變形性態(tài),本文引入核獨立分量分析(Kernel independent component analysis,KICA)方法,實現(xiàn)對多個測點位移數(shù)據(jù)以及影響因子的非線性提取,提取出的位移獨立分量去除了冗余信息的干擾,包含了大壩多點監(jiān)測數(shù)據(jù)的綜合指標,可以通過對少量綜合數(shù)據(jù)的分析實現(xiàn)多個測點的同時監(jiān)控[22]。在上述研究的基礎上,利用灰狼優(yōu)化(grey wolf optimization,GWO)算法在參數(shù)尋優(yōu)方面具有良好收斂速度與求解精度的優(yōu)點,尋求SVM模型中參數(shù)的最優(yōu)解,將提取出的獨立分量代入GWO算法優(yōu)化的SVM模型,進一步對特高拱壩變形序列進行擬合與預測,從而可以獲得精度更高且非線性表達能力強的KICA-GWO-SVM特高拱壩時空監(jiān)控模型,降低多重共線性對大壩變形監(jiān)測的影響,以期更加準確全面地掌握大壩整體的時空變形性態(tài)。
特高拱壩位移量主要受水壓、溫度、時效3類因子的影響[23],在外部環(huán)境、材料特性以及荷載等因素共同作用之下,各影響因子之間存在較為明顯的多重共線性[24]。同時特高拱壩空間測點數(shù)量多,各測點之間也存在一定關聯(lián)性的影響。KICA方法在獨立分量分析方法的基礎上引入核參數(shù),基于整個非線性函數(shù)空間來解決問題,提高了對復雜非線性問題的求解精度[25]。因此,引入KICA方法可實現(xiàn)對多測點特征信息綜合提取,進一步降維去除各影響因子間的線性相關性,降低測點間的空間關聯(lián)性及影響因子間的多重共線性,為數(shù)據(jù)應用及預測分析奠定基礎。
假設大壩n個測點形成的監(jiān)測向量X=(x1,x2,…,xn),對監(jiān)測向量進行數(shù)據(jù)預處理,使監(jiān)測向量成為零均值和單位方差向量。源信號S=(s1,s2,…,sn),X與S滿足線性組合:
X=AS
(1)
KICA方法即是求解解混矩陣P,用已知的X輸出估計信號Y:
Y=PX
(2)
基于上述原理,結合特高拱壩變形原型監(jiān)測數(shù)據(jù),對變形信息進行降維融合處理提取出獨立分量,具體步驟如下:
a.給定KICA的核參數(shù)K(x,y),分別輸入環(huán)境影響因子以及大壩各測點效應量。
b.對輸入數(shù)據(jù)進行中心化和白化處理。
c.利用Cholesky分解計算初始獨立分量信號(y1,y2,…,yn)的中心化格萊姆核矩陣。
d.計算解混矩陣P的最小化對比函數(shù)。
e.給定合適的迭代步長,計算解混矩陣P。
f.若迭代收斂,則輸出環(huán)境影響因子、大壩各測點效應量對應的解混矩陣P以及獨立分量Y,否則重新計算。
SVM在解決小樣本、非線性以及高維數(shù)據(jù)時具有較大優(yōu)勢,且有良好的泛化能力[26],其具有的良好非線性分析能力能夠有效解決復雜的非線性回歸問題,避免過擬合現(xiàn)象,因此,SVM在處理大壩變形預測問題時具有較大的優(yōu)勢,對于大壩變形與環(huán)境量之間復雜的非線性關系,用SVM模型進行回歸能取得較好的預測結果[27]。
由于SVM在懲罰因子c、核參數(shù)σ等參數(shù)選擇方面具有較強的依賴性,且參數(shù)的選取對SVM的擬合效果影響較大,參數(shù)選擇的合理性決定了SVM的學習泛化能力與擬合精度問題。在處理非線性問題時,SVM核參數(shù)選取的合理性直接決定了非線性映射特征空間選取的合理性,影響計算精度。基于以上問題,在選取SVM參數(shù)時應選擇最優(yōu)參數(shù),使其能夠得到良好的計算結果。
GWO算法[28]基于狼群中的等級制度與灰狼捕食獵物活動,通過由上至下依次為α狼、β狼、δ狼以及最底層的ω狼4個等級構成的群狼協(xié)作機制達到優(yōu)化的目的,具備全局搜索能力強、參數(shù)少、精度高的優(yōu)點。考慮到SVM的學習能力和泛化能力受參數(shù)的影響較為顯著,鑒于GWO算法在參數(shù)尋優(yōu)方面調整參數(shù)少、全局搜索能力強的良好性能,通過GWO算法對SVM的懲罰因子、核參數(shù)等參數(shù)進行優(yōu)化,從而確定最佳參數(shù)。
進一步將提取出的降低多重共線性影響的獨立分量數(shù)據(jù)代入GWO算法優(yōu)化的SVM進行擬合預測分析,大壩獨立分量變形數(shù)據(jù)擬合預測主要步驟如下:
a.分別取前80%環(huán)境影響因子獨立分量和效應量獨立分量作為訓練集,后20%作為測試集。
b.設定灰狼數(shù)目、迭代次數(shù)以及初始化α、β、δ狼的位置,確定需要尋優(yōu)的兩個參數(shù)為懲罰因子和核參數(shù),并設置尋優(yōu)參數(shù)的上下界。
c.計算輸出最優(yōu)參數(shù)分別賦給懲罰因子和核參數(shù)。
d.使用上述得到的最優(yōu)參數(shù)建立優(yōu)化的SVM模型。
e.將測試集數(shù)據(jù)導入到優(yōu)化的SVM中進行回歸預測。
f.輸出預測結果,對比效應量預測值與特征信息測試集,并對其進行誤差分析。
本文基于上述方法,首先采用KICA方法實現(xiàn)對特高拱壩變形數(shù)據(jù)及環(huán)境影響因子的特征信息獨立分量提取,再利用GWO算法優(yōu)化的SVM模型對監(jiān)測數(shù)據(jù)進行非線性預測,最終構建融合KICA-GWO-SVM的大壩時空監(jiān)控模型。模型實現(xiàn)流程如圖1所示。
圖1 模型構建流程
某水電站位于四川省境內,總裝機容量840萬kW,混凝土雙曲拱壩最大壩高305 m,壩頂高程1 885 m,壩頂寬度16 m,水庫正常蓄水位1 880 m。該特高拱壩由26個壩段構成,選取2013年6月16日至2015年9月28日時段內第5、9、11、13、16、19壩段垂線的位移測點進行分析,共布置24個監(jiān)測點,各測點位置分布如圖2所示,該時段內共274個徑向位移監(jiān)測數(shù)據(jù),水位過程線及各測點實測位移值如圖3所示。
圖2 大壩垂線位移測點分布(單位:m)
圖3 研究時段庫水位過程線及各測點實測位移值
首先將24個測點的位移數(shù)據(jù)與上述10個環(huán)境量影響因子用KICA方法進行獨立分量提取,通過該模型的計算,提取出3個位移獨立分量,如圖4所示。經(jīng)計算得獨立分量一的貢獻率為95.12%,獨立分量二的貢獻率為3.36%,獨立分量三的貢獻率為0.99%,其余獨立分量貢獻率幾乎為0,由此可見,提取出的這3個分量消除了冗余信息的干擾且融合了多測點位移監(jiān)測數(shù)據(jù)99.3%的主要信息,便于后續(xù)通過分析這幾個包含大壩多測點數(shù)據(jù)的綜合信息指標,實現(xiàn)對多測點的同步監(jiān)測,從而掌握大壩整體的變形性態(tài)。經(jīng)此模型提取出的環(huán)境影響因子獨立分量的個數(shù)為6個,經(jīng)計算分析,6個分量也已包含了原始數(shù)據(jù)99.3%的特征信息,通過此方法合理地選取獨立分量個數(shù),可以降低數(shù)據(jù)維數(shù),減少噪聲影響,從而消除影響因子之間的多重共線性。
圖4 KICA方法所分離的位移獨立分量
將上述得到的3個獨立分量數(shù)據(jù)分別按貢獻率權重計算得一組綜合數(shù)據(jù)IIC。將環(huán)境影響因子獨立分量和效應量IIC分別作為模型的輸入與輸出代入模型進行擬合預測,選取監(jiān)測日序的前220個數(shù)據(jù)作為訓練樣本,后54個數(shù)據(jù)作為預測樣本,同時設置GWO算法參數(shù),設置狼群總數(shù)量為20,最大迭代次數(shù)為50,通過訓練SVM模型得到懲罰因子與核參數(shù)的一組最佳參數(shù)為c= 1.37,σ= 2.60。經(jīng)KICA-GWO-SVM時空監(jiān)控模型計算后得到一組綜合的擬合與預測結果,可以反映大壩整體的時空變形性態(tài),如圖5所示。
圖5 KICA-GWO-SVM模型擬合與預測
為評價KICA-GWO-SVM時空監(jiān)控模型的性能,將其擬合與預測結果同經(jīng)KICA處理后的多元回歸(MLR)模型、SVM模型,BP模型進行比較,結果如圖6所示,從圖中可以看出,本文所建立的模型相比其他模型對表征大壩整體性態(tài)的IIC值具有更好的擬合與預測效果。為評價KICA對該模型的貢獻,取測點PL11-2作為對照,未對其監(jiān)測信息進行核獨立分量提取,從而建立各類模型對其實測位移進行擬合與預測,結果如圖7所示。
圖6 IIC值擬合與預測曲線
圖7 PL11-2測點擬合與預測曲線
通過對上述各模型的預測結果進行分析,得到模型預測殘差如圖8所示,可以看出,與其他模型相比,KICA-GWO-SVM模型殘差曲線最平滑,整體預測殘差最小,由此可知,KICA-GWO-SVM時空監(jiān)控模型的預測效果最佳。
圖8 各模型殘差對比
通過最后一步分析對上述各模型的擬合與預測精度進行比較,采用復相關系數(shù)R2作為精度評價指標,采用均方誤差MSE、平均絕對誤差MAE、平均絕對百分比MAPE作為誤差評價指標。
各模型復相關系數(shù)擬合及預測誤差分析結果見表1。由表1可以看出,KICA-GWO-SVM時空監(jiān)控模型復相關系數(shù)為0.962 4,精度最高。KICA-GWO-SVM時空監(jiān)控模型擬合與預測的MAE分別為0.021 0和0.373 4,MSE分別為0.001 1和0.213 2,MAPE分別為1.34%和4.25%,與其他各模型相比,均為最小。未采用核獨立分量提取的PL11-2測點較組合模型相比,誤差較大,由此可驗證KICA方法可在一定程度上削弱多重共線性問題的影響。綜上,KICA-GWO-SVM時空監(jiān)控模型為特高拱壩最優(yōu)監(jiān)控模型,適于大壩時空監(jiān)控。
表1 各模型誤差及復相關系數(shù)計算結果
基于原型監(jiān)測數(shù)據(jù),利用KICA方法融合了壩體多測點位移監(jiān)測數(shù)據(jù),即用少數(shù)幾個可以反映大壩整體性態(tài)的綜合指標來代替包含冗余信息的多測點數(shù)據(jù)信息,減少了監(jiān)控模型數(shù)量,便于后續(xù)通過分析這幾個少量綜合信息實現(xiàn)對大壩整體的監(jiān)控,同時實現(xiàn)了對多個測點位移數(shù)據(jù)以及影響因子的非線性提取,達到消除各測點、各影響因子間相關性的目的。利用GWO算法優(yōu)化SVM模型,將提取的獨立分量代入SVM模型,對特高拱壩空間測點進行回歸預測,構建了KICA-GWO-SVM特高拱壩時空監(jiān)控模型。通過工程實例驗證了模型的有效性。與其他模型相比,KICA-GWO-SVM特高拱壩時空監(jiān)控模型非線性表達能力強且性能良好,能夠降低多重共線性對大壩變形監(jiān)測的影響,對特高拱壩變形序列進行擬合與預測精度高,可以更加準確全面地表征大壩整體的時空變形性態(tài)。