晏 周 鄭東健 張海龍 劉永濤
(1. 河海大學(xué) 水文水資源與水利工程科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室, 南京 210098; 2. 河海大學(xué) 水利水電學(xué)院, 南京 210098; 3. 河海大學(xué) 水資源高效利用與工程安全國(guó)家工程研究中心, 南京 210098; 4. 中國(guó)長(zhǎng)江三峽集團(tuán)有限公司, 湖北 宜昌 443000)
滲流量的大小反應(yīng)面板堆石壩防滲系統(tǒng)的防滲效果,是分析和評(píng)價(jià)面板堆石壩安全的重要依據(jù),也是大壩監(jiān)測(cè)的必測(cè)項(xiàng)目[1].面板堆石壩的滲流監(jiān)測(cè)分析有助于判斷大壩是否存在滲漏破壞,掌握面板堆石壩的運(yùn)行狀況,為大壩的安全運(yùn)行提供依據(jù).為了準(zhǔn)確、及時(shí)地監(jiān)測(cè)和分析面板堆石壩的滲流狀況,應(yīng)建立滲流量監(jiān)控模型.滲流量監(jiān)控模型能夠反映大壩效應(yīng)量監(jiān)測(cè)值的定量變化規(guī)律,確定滲流量與影響因素之間的確定性關(guān)系.目前對(duì)面板堆石壩的滲流監(jiān)控模型的研究還不多,常用的主要還是統(tǒng)計(jì)回歸模型,如多元線性回歸、逐步回歸等.傳統(tǒng)的統(tǒng)計(jì)回歸模型在處理復(fù)雜非線性的監(jiān)測(cè)數(shù)據(jù)時(shí)效果不理想,泛化能力弱[2].近年來,人工神經(jīng)網(wǎng)絡(luò)也有所應(yīng)用,但人工神經(jīng)網(wǎng)絡(luò)是基于啟發(fā)式模式的,其理論基礎(chǔ)還不十分完整,它的泛化效果差,有時(shí)只會(huì)記住訓(xùn)練數(shù)據(jù),很難歸納樣本外數(shù)據(jù).基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(SVM)具有很好的泛化能力,能較好地解決小樣本、非線性、高維等問題[3].SVM建模時(shí),懲罰參數(shù)C和核函數(shù)參數(shù)σ的選取會(huì)直接影響模型非線性能力,進(jìn)而影響模型精度.粒子群算法(PSO)在非線性函數(shù)優(yōu)化方面表現(xiàn)出良好的性能,經(jīng)常用于C和σ的尋優(yōu),但PSO在運(yùn)算初期收斂速度快,在運(yùn)算后期會(huì)出現(xiàn)粒子多樣性降低,搜索精度低,容易發(fā)散等問題[4].本文提出一種新的自適應(yīng)變異粒子群優(yōu)化算法(AMPSO),根據(jù)平均粒子間距的變化對(duì)慣性權(quán)重進(jìn)行非線性調(diào)整,在算法后期引入具有突變擾動(dòng)的速度更新公式增大種群多樣性.采用該改進(jìn)的粒子群優(yōu)化算法和支持向量機(jī),建立了AMPSO-SVM面板堆石壩監(jiān)控模型.通過實(shí)例的分析與比較,表明該模型具有簡(jiǎn)便、高效、擬合與預(yù)測(cè)精度高等優(yōu)勢(shì).
支持向量機(jī)(Support Vector Machine,SVM)被廣泛用作線性和非線性分類以及回歸問題簡(jiǎn)單而有效的工具,它是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的監(jiān)督機(jī)器學(xué)習(xí)算法.SVM是基于統(tǒng)計(jì)學(xué)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則來訓(xùn)練非線性關(guān)系的,它提供了更好的泛化能力,并且通過最小化泛化誤差的上界來估計(jì)函數(shù)[5].SVM回歸的基本思想是通過非線性映射將數(shù)據(jù)映射到高維特征空間,并在此特征空間中進(jìn)行線性回歸[6].SVM不僅有很好的理論基礎(chǔ),在實(shí)際應(yīng)用中也很有優(yōu)勢(shì).
假設(shè)有一組樣本集G={(x1,y1),(x2,y2),…,(xn,yn)},其中x∈Rd(i=1,2,3,…,n)為輸入向量以及對(duì)應(yīng)的輸出值yi∈{-1,+1}(i=1,2,3,…,n),n為樣本數(shù).
(1)
為了方便求解該優(yōu)化問題,引入拉格朗日函數(shù)
(2)
其中,αi為拉格朗日乘數(shù).若要求w、b的最小值,可分別對(duì)拉格朗日函數(shù)關(guān)于w、b求偏導(dǎo),而且要滿足KKT條件
(3)
問題被轉(zhuǎn)化成了對(duì)偶問題,可以在約束條件下求αi的最大值
(4)
f(x)=sgn{(w*·x+b*)}=
(5)
式中,sgn是符號(hào)函數(shù),b*為分類閾值.
對(duì)于線性不可分情況,需要引入松弛變量ξi>0(i=1,2,…,n),松弛的分離約束條件如下:
(6)
最優(yōu)分類超平面可通過下列公式得到:
(7)
式中,C是一個(gè)正則化參數(shù),用于在訓(xùn)練誤差和分類間隔之間進(jìn)行權(quán)衡.
SVM將輸入向量x從輸入空間Rd通過核函數(shù)非線性映射到更高維的希爾伯特空間,然后在高緯空間中進(jìn)行線性回歸,找出最優(yōu)分類超平面.對(duì)于一個(gè)給定的數(shù)據(jù)集,正則化參數(shù)C和核函數(shù)都被確定后,才可以指定一個(gè)支持向量機(jī).本文核函數(shù)選擇計(jì)算效果較好的徑向基核函數(shù)(RBF)
(8)
最初的粒子群算法(PSO)是由Kennedy和Eberhart于1995年提出,它是基于集群現(xiàn)象的一種隨機(jī)全局優(yōu)化算法,來源于對(duì)鳥群捕食等社會(huì)行為的研究[7],它具有控制參數(shù)少、收斂性好、易于實(shí)現(xiàn)等優(yōu)點(diǎn),自誕生以來在進(jìn)化計(jì)算領(lǐng)域引起了世界各國(guó)的廣泛關(guān)注.粒子群算法有兩個(gè)群體:一個(gè)群體是粒子S的個(gè)體最優(yōu)解(即Pbest),另一個(gè)群體是粒子S的群體最優(yōu)解(即Gbest).前者作為搜索空間中的候選解,后者用于指導(dǎo)前者的更新.在粒子群算法中,每個(gè)粒子根據(jù)自身的飛行經(jīng)驗(yàn)和搜索空間中其他粒子的飛行經(jīng)驗(yàn),通過動(dòng)態(tài)改變每個(gè)粒子的速度來調(diào)整搜索空間中每個(gè)個(gè)體的軌跡[8].
在D維空間中,第i個(gè)粒子的位置可用D維向量表示為Xi=(Xi1,Xi2,…,Xid)T,速度可表示為Vi=(Vi1,Vi2,…,Vid)T.根據(jù)用戶定義的適應(yīng)度函數(shù),假設(shè)時(shí)間t時(shí)每個(gè)粒子的最佳位置為Pi=(Pi1,Pi2,…,Pid)T,目前發(fā)現(xiàn)的最佳粒子為Pg=(Pg1,Pg2,…,Pgd)T.那么,下一次適應(yīng)度計(jì)算時(shí)粒子的新速度和位置可按以下兩個(gè)數(shù)學(xué)公式表示:
(9)
(10)
式中,c1、c2為加速度系數(shù),用它們對(duì)每個(gè)粒子飛向Pbest和Gbest位置的隨機(jī)加速項(xiàng)權(quán)重進(jìn)行修正;r1和r2表示在范圍[0,1]內(nèi)的兩個(gè)隨機(jī)數(shù);w是用于平衡全局和局部搜索的慣性權(quán)重,一般來說慣性權(quán)重較大時(shí)有利于全局搜索,較小時(shí)有利于局部搜索.
粒子群算法作為一種隨機(jī)優(yōu)化技術(shù),不能避免陷入局部最優(yōu)和收斂速度慢的問題.在上述分析的基礎(chǔ)上,提出了一種基于動(dòng)態(tài)非線性變慣性權(quán)重的自適應(yīng)變異粒子群優(yōu)化算法(AMPSO).采用平均粒子間距作為粒子群多樣性的評(píng)估依據(jù),根據(jù)平均粒子間距的變化對(duì)慣性權(quán)重進(jìn)行非線性調(diào)整,在算法后期引入具有突變擾動(dòng)的速度更新公式,使粒子群在后期依然能保持良好的種群多樣性.改進(jìn)后的粒子群算法能夠快速收斂,也可有效避免陷入局部最優(yōu)和過早收斂問題.
采用平均粒子間距(APS)來評(píng)估PSO的早熟收斂現(xiàn)象.APS能識(shí)別單個(gè)粒子之間距離的大小,可以描述單個(gè)粒子之間的分散程度,APS定義如下[9]:
(11)
慣性權(quán)重w對(duì)粒子群算法的性能有很大的影響,慣性權(quán)重w較大時(shí)有利于提高算法的收斂速度,慣性權(quán)重w較小時(shí)有利于提高算法的收斂精度.針對(duì)慣性權(quán)重w的特點(diǎn),一般改進(jìn)w時(shí)采用逐漸遞減的方法,保證在迭代初期由較大的w值,從而加速收斂,w值逐漸減小,避免陷入局部最優(yōu).在這些遞減策略中,w值只是逐漸的試探性下降,沒有任何因子做指導(dǎo)[10].本文采用一種基于APS新的非線性遞減策略,根據(jù)種群多樣性S(t)的變化來非線性調(diào)整慣性權(quán)重
(12)
式中,S(t)表示平均粒子間距.改進(jìn)后的慣性權(quán)重w與平均粒子間距S(t)的關(guān)系曲線如圖1所示.
圖1 慣性權(quán)重曲線
粒子多樣性的降低,會(huì)使粒子群算法在應(yīng)用中存在過早收斂問題.為了保持種群的多樣性,本文引入了慢變函數(shù),可以形成突變擾動(dòng),有效地避免陷入局部最優(yōu)的現(xiàn)象,使所有粒子都能在較大范圍內(nèi)搜索解空間.
在粒子群優(yōu)化的早期階段,粒子按照公式(9)相互靠近.粒子向彼此移動(dòng)會(huì)導(dǎo)致種群多樣性逐漸減少,當(dāng)S(t)小于某個(gè)特定值dmin時(shí),可采用加入擾動(dòng)的速度更新公式
(13)
在算法后期,粒子不再相互吸引,而是相互遠(yuǎn)離.采用加入擾動(dòng)的速度更新公式,能夠增加種群多樣性[11].種群粒子將一直處于這個(gè)階段,直到多樣性達(dá)到一個(gè)更高的值dhigh.一旦達(dá)到所需的更高值dhigh,群粒子又回到相互吸引階段,相同的過程不斷重復(fù),直到獲得全局最優(yōu).通過試驗(yàn)得到多樣性參數(shù)dmin和dhigh的值分別為5×10-6和0.25.
1)對(duì)監(jiān)測(cè)樣本進(jìn)行歸一化處理,確定出訓(xùn)練樣本數(shù)據(jù)和預(yù)測(cè)樣本數(shù)據(jù).
3)適應(yīng)度值計(jì)算.使用適應(yīng)度函數(shù)對(duì)每個(gè)樣本數(shù)據(jù)進(jìn)行適應(yīng)度計(jì)算,更新個(gè)體最優(yōu)解Pbest和群體最優(yōu)解Gbest,本文采用的適應(yīng)度函數(shù)為
(14)
4)使用公式(11)計(jì)算平均粒子間距S(t).
5)根據(jù)步驟4計(jì)算出的平均粒子間距,如果S(t)大于dmin,則轉(zhuǎn)到步驟6;如果S(t)小于dmin,則轉(zhuǎn)到步驟7,然后轉(zhuǎn)到步驟8.
8)計(jì)算適應(yīng)度函數(shù)F(x),更新個(gè)體最優(yōu)解Pbest和群體最優(yōu)解Gbest.
9)判斷是否滿足迭代終止條件,如果滿足則停止迭代,否則轉(zhuǎn)到步驟4繼續(xù)循環(huán).
某鋼筋混凝土面板堆石壩,最大壩體高度為120 m,壩頂所處高程為760 m,壩頂?shù)淖笥野堕L(zhǎng)度為259.8 m.該壩在下游河床中部壩下0+180的壩后截水墻上,在集水池的左、右兩邊各布置1個(gè)90°角的三角堰量水堰,共2個(gè).大壩總滲漏量通過左、右兩邊量水堰觀測(cè)值計(jì)算得到.選取2015年8月23日~2018年5月7日共120組數(shù)據(jù)用來擬合,取2018年5月15日~2018年10月29日20組數(shù)據(jù)用來預(yù)測(cè).
采用下列公式對(duì)樣本進(jìn)行歸一化處理,將樣本數(shù)據(jù)歸一化到[0,1]區(qū)間內(nèi)
(15)
其中,Xmax、Xmin分別為每組樣本數(shù)據(jù)的最大值和最小值.
初始化粒子種群:種群迭代次數(shù)設(shè)為500,種群數(shù)目設(shè)為20,加速度系數(shù)c1和c2的取值均為2,dmin=5×10-6,懲罰因子C和核函數(shù)參數(shù)σ的取值范圍分別設(shè)為[0.1,100]和[0.01,10].圖2為兩種模型適應(yīng)度的變化情況,從圖可以看出AMPSO-SVM的最佳適應(yīng)度要好于PSO-SVM模型,在迭代過程中AMPSO-SVM模型的適應(yīng)度值也基本一直優(yōu)于PSO-SVM模型.
圖2 兩種模型的適應(yīng)度比較
為了更方便比較兩個(gè)模型的精確度,將兩個(gè)模型的擬合結(jié)果與預(yù)測(cè)結(jié)果放在一起進(jìn)行比較,兩個(gè)模型的擬合結(jié)果如圖3所示,并利用復(fù)相關(guān)系數(shù)R、均方根誤差(RMSE)比較改進(jìn)前后兩模型的擬合精度,結(jié)果見表1.為了驗(yàn)證改進(jìn)模型的預(yù)測(cè)效果,利用改進(jìn)前后模型對(duì)20組監(jiān)測(cè)數(shù)據(jù)進(jìn)行了預(yù)測(cè),比較結(jié)果如圖4所示,其中10組監(jiān)測(cè)數(shù)據(jù)的實(shí)測(cè)值與預(yù)測(cè)值的比較見表2.采用均方根誤差、平均相對(duì)誤差(MRE)以及復(fù)相關(guān)系數(shù)R比較兩種模型的預(yù)測(cè)精度,兩種預(yù)測(cè)模型的主要統(tǒng)計(jì)參數(shù)見表3.
圖3 兩種模型的擬合曲線
模型RRMSE(L/S)AMPSO-SVM0.95360.2136PSO-SVM0.89760.2601
圖4 兩種模型的預(yù)測(cè)曲線
序號(hào)實(shí)測(cè)值A(chǔ)MPSO-SVM預(yù)測(cè)值 相對(duì)誤差/%PSO-SVM預(yù)測(cè)值 相對(duì)誤差/%14.324.494.173.55-17.6923.413.595.123.698.0833.393.31-2.543.482.4343.333.03-9.043.566.8453.283.21-2.233.434.7562.743.0812.223.3421.7073.503.685.413.767.5983.193.16-1.083.241.5994.233.96-6.334.12-2.60104.133.94-4.763.82-7.62
表3 預(yù)測(cè)段精度評(píng)價(jià)指標(biāo)
由圖3可以看出,兩種模型的擬合效果都不錯(cuò),但是AMPSO-SVM模型擬合曲線總體上更接近實(shí)測(cè)曲線,擬合效果要好于標(biāo)準(zhǔn)PSO-SVM模型.由表1可知,AMPSO-SVM模型擬合曲線的均方根誤差為0.213 6 L/S,PSO-SVM模型擬合曲線的均方根誤差為0.260 1 L/S,AMPSO-SVM模型復(fù)相關(guān)系數(shù)R為0.953 6,標(biāo)準(zhǔn)PSO-SVM模型復(fù)相關(guān)系數(shù)R為0.897 6,可以看出改進(jìn)的模型無論在擬合精度還是在擬合穩(wěn)定性上都要優(yōu)于標(biāo)準(zhǔn)PSO-SVM模型.
從圖4和表2、表3可以看出,運(yùn)用AMPSO-SVM模型求出的預(yù)測(cè)值更優(yōu),相對(duì)誤差最大值為12.22%,相對(duì)誤差平均值為5.28%,均方根誤差RMSE為0.296 L/S,復(fù)相關(guān)系數(shù)R為0.905,運(yùn)用PSO-SVM模型求出的預(yù)測(cè)值,相對(duì)誤差最大值為21.70%,相對(duì)誤差平均值為8.09%,均方根誤差RMSE為0.427 L/S,復(fù)相關(guān)系數(shù)R為0.791.通過對(duì)比可以看出,AMPSO-SVM模型的預(yù)測(cè)精度更高,對(duì)非線性的面板堆石壩滲漏量的預(yù)測(cè)更穩(wěn)定,泛化能力也更強(qiáng).
提出基于動(dòng)態(tài)非線性變慣量權(quán)重的自適應(yīng)粒子群算法(AMPSO),加入突變擾動(dòng)的速度更新公式,使粒子群在算法后期依然保持良好的種群多樣性,該算法有效避免易陷入局部最優(yōu)和收斂速度慢和過早收斂等問題.采用改進(jìn)的粒子群優(yōu)化算法對(duì)影響支持向量機(jī)(SVM)性能的懲罰參數(shù)C和核函數(shù)參數(shù)σ進(jìn)行優(yōu)化,建立了一個(gè)用于面板堆石壩滲流量監(jiān)控的AMPSO-SVM模型.該模型與標(biāo)準(zhǔn)PSO-SVM模型的比較結(jié)果表明,該模型對(duì)非線性的面板堆石壩滲漏量的擬合和預(yù)測(cè)能力明顯好于標(biāo)準(zhǔn)PSO-SVM模型.改進(jìn)后的模型可作為一種有效的面板堆石壩滲漏量監(jiān)控模型,具有很好的實(shí)用價(jià)值.