仲靜文,郝利朋,周 健
(南京市水利規(guī)劃設計院股份有限公司,江蘇 南京 210001)
據自然資源部發(fā)布2018年《全國地質災害通報》,2009_2018年的十年,泥石流等各種地質災害造成了約440億元的直接經濟損失,死亡或失蹤總人數達6000余人[1]。由此可見,我國仍是滑坡泥石流災害高發(fā)國。由于滑坡和泥石流在本質上都是邊坡失穩(wěn)的過程,所以做好邊坡的安全評價的工作尤為重要,從而做好危險邊坡的預警除險[2]。由于影響巖石邊坡穩(wěn)定性的因素眾多,對于邊坡的穩(wěn)定性研究,主要包括3大類[3~6]:理論計算法,比如傳統(tǒng)的極限狀態(tài)平衡分析法;通過軟件數值計算模擬的途徑,例如突變理論法;具體工程對比法,有SOFM神經網絡法、改進蟻群算法及支持向量機評價法等[7~10],其具有影響邊坡安全的復雜因素整體綜合分析的特性及運用快速簡易的特點。因此可采用聚類分析方法展開邊坡的工程類比,依據相似性對工程進行聚類研究,則可以根據工程的相似性方法對邊坡安全等級展開分析評價。
在前人研究的大量聚類算法中,其中由于K-Means聚類算法的優(yōu)點明顯,比如該算法實現操作簡單并可以解決大資料庫問題[11],所以K-Means算法是該領域分析應用深度較深的聚類算法之一。但同時K-Means聚類算法也存在對初值k比較敏感,使得聚類結果的不穩(wěn)定,而且易陷入局部最優(yōu)而非全局最優(yōu)的困境等缺陷。為了盡可能避免K-means聚類算法的這些劣勢,在實際運用時應對其優(yōu)化。在優(yōu)化算法中,粒子群優(yōu)化混合算法已經被廣泛地運用到水工建筑物的評價,例如呂蓓蓓等人[12]采用粒子群算法,對輸入大壩安全監(jiān)測數據進行聚類處理,驗證了混合算法的預測精度更高。王偉等人[13]將逐步模糊聚類和粒子群與模糊聚類混合算法應用于大壩安全監(jiān)控模型,結果表明結合智能算法的混合聚類算法能夠有效提高區(qū)間預報精度。由于粒子群算法具有全局尋優(yōu)能力和分布式隨機搜索特性能較好地解決K-Means算法的問題,并提高其結果精度。本文引入粒子群算法,給出改進K-Means聚類算法的實現過程,并結合實際工程進行計算。
K-Means算法是一種通過計算簇中對象平均值進而實現劃分的聚類算法,其中該算法為了能得到全局最優(yōu)的結果采用窮舉所有的劃分。K-Means算法的輸入為數據庫和劃分簇的數目k;輸出為滿足聚類準則最小的k個簇。該算法實現的基本步驟[14]:
(1)在整個數據庫樣本n中,隨機確定k個簇中心mi(i=1,2,…,k),通過式(1)可以得到信息庫中所有p與k個mi的距離d(p,mi)。
(1)
式中,i=(xi1,xi2,…,xin)與j=(ji1,ji2,…,,jin)均為n維的數組。
(2)把距離dmin的p劃進和族中心一樣的簇;接著依次處理每一個p,通過式(2)再次得到簇中心。
(2)
式中,mk—第k個簇中心,N—第k個簇中元素的數量。
(3)把信息庫中的對象給到最相近的簇,并要滿足式(3)的聚類準則。衡量簇內對象p的相似度采用平方誤差準則,即聚類準則函數:
(3)
式中,E—全部對象p的平方誤差和,mi—聚類簇Ci的中心值。
由于K-Means算法選取初始聚類的隨機性強,使得聚類結果隨著k不同而不穩(wěn)定。本文引進PSO優(yōu)化算法,通過PSO優(yōu)化改進后避免常規(guī)K-Means算法因局部最優(yōu)而陷入極值的缺點而得到較優(yōu)的初始聚類中心,從而結果全局最優(yōu)。Omran等人[15]于2002年為高效地解決圖像分類問題編寫了PSO優(yōu)化的聚類算法。其中,粒子的適應度函數Je:
(4)
式中,Nc—聚簇的個數,zp—數據向量,mj—簇Cj的中心。
PSO聚類算法首先隨機選擇簇中心,并幅值給各個粒子,隨機生成一批速度向量V,迭代過程中,粒子通過跟蹤全局極值Gbes與個體極值Pbestt以更新自己的速度與位置:
Vk+1=wVk+c1r1(Pbest-Xk)+c2r2(Gbest-Xk)
(5)
Xk+1=Xk+Vk+1
(6)
式中,k—當前迭代次數;V—粒子速度;X—粒子位置;粒子速度與位置由用戶自定義,在聚類中即為當前粒子所代表的聚類中心的位置;c1和c2—加速常數;w—慣性因子;r1、r2均是[0,1]均勻分布的隨機數。
由于K-Means聚類方法的結果不穩(wěn)定且對初值敏感度高,為了提高K-Means方法的穩(wěn)定性和精度,則利用具有全局性和隨機性強的粒子群算法對K-Means方法進行優(yōu)化[16]。從而可以將對邊坡安全評價的具體問題轉化為數學問題進行分析解決。基于PSO優(yōu)化K-Means法的實現步驟:
(1)首先選擇聚類族的數目,給出起始聚類中心矩陣以及或然給出粒子的V初始。
(2)得出所有粒子的隸屬度,再次確定聚類中心并求出粒子的適應值與極值。
(3)依據所有粒子的極值,確定全局極值及其位置。
(4)重新確定粒子的速度且要求其速度不超過Vmax,繼而通過位置關系再次確定粒子位置。
(5)假如不符合迭代條件,再次轉到(2)執(zhí)行;假如符合,即得到最優(yōu)粒子的位置。
基于粒子群算法優(yōu)化的K-Means聚類算法的流程圖如圖1所示。
圖1 基于粒子群的K-Means算法的流程圖
本文采用基于粒子群優(yōu)化的聚類算法對文獻[17]中提供的36個三峽庫岸邊坡數據展開研究計算,基本數據見表1。表1中資料數據是根據對影響邊坡穩(wěn)定安全的因子定量化分析確定的結果,采用10分制指標。為了和文獻中方法進行對比,也采用邊坡穩(wěn)定6級分類法,以Ⅰ-Ⅵ表示。
表1 三峽庫岸邊坡綜合評價指標
表2 邊坡穩(wěn)定性分析結果
表2列出了文獻中常規(guī)K-Means聚類法及PSO優(yōu)化聚類法的計算結果。由表2可以分析得到:粒子群優(yōu)化聚類算法的結果與傳統(tǒng)聚類方法結果總體一致,但與極限平衡法的結果[18]跟更為接近,且降低了計算結果的誤差。其中在36個邊坡中,有28個與傳統(tǒng)聚類方法結果一致,有1個邊坡穩(wěn)定級別比傳統(tǒng)聚類算法高一級,有7個邊坡穩(wěn)定級別比傳統(tǒng)聚類算法低一級。這表明粒子群聚類具有良好的處理局部極值的能力,提高了分析結果的穩(wěn)定性,且計算簡便、精度較高,可以用來作為巖石邊坡穩(wěn)定性分析的方法。
(1)本文建立了基于粒子群優(yōu)化K-Means聚類算法的邊坡評價方法,并針對三峽庫岸的監(jiān)測數據進行了粒子群優(yōu)化聚類分析,計算過程簡單,結果能夠較好擬合理論計算方法,表明聚類方法在水工領域中有著廣泛的應用與較大的潛力。
(2)該優(yōu)化算法快捷方便,結果可靠度高,能迅速對邊坡安全情況進行評價分級,可以推廣至其它類型的邊坡安全評價和監(jiān)控。
(3)如何將優(yōu)化聚類算法更好地結合大壩資料分析以及建立實時的監(jiān)控模型,是需要研究者進一步深入研究的。