裘明華
(浙江頤川科技有限公司,杭州 310000)
隨著科技進(jìn)步,全世界已經(jīng)步入信息時(shí)代,水利行業(yè)亦開始大規(guī)模應(yīng)用計(jì)算機(jī)網(wǎng)絡(luò)、現(xiàn)代通信、智能控制以及數(shù)據(jù)挖掘等新興技術(shù),來實(shí)現(xiàn)高效管理水利工程的目的[1-3]。
數(shù)據(jù)挖掘技術(shù)最早是應(yīng)用于商業(yè)管理領(lǐng)域,隨著信息化的發(fā)展,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于水利工程的研究成為未來水利行業(yè)信息化發(fā)展的一個(gè)重要趨勢。付曉旭、韓紅旗、李瓊等[4-6]展開對數(shù)據(jù)挖掘技術(shù)在水利工程信息化管理應(yīng)用中的可行性。許惠君、張弛等[7-8]深入探討數(shù)據(jù)挖掘技術(shù)在水庫調(diào)度與防洪過程中的應(yīng)用。此外,數(shù)據(jù)挖掘技術(shù)在我國水利工程安全管理中也逐漸得到重視。阿米娜古[9]指出,水利工程安全管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)數(shù)據(jù),能夠?qū)崿F(xiàn)水利工程中數(shù)據(jù)的高效篩選與合理分析,實(shí)現(xiàn)水利工程的科學(xué)化、專業(yè)化、信息化、高效化、自動(dòng)化。楊獻(xiàn)志等[10]深入探討了水利工程管理中數(shù)據(jù)挖掘技術(shù)應(yīng)用可行性及前景,并指出數(shù)據(jù)挖掘技術(shù)能夠使得水利工程項(xiàng)目管理更加科學(xué)化。
綜上所述,現(xiàn)有的關(guān)于我國水利工程安全監(jiān)測與管理的研究主要是從管理制度或方向方面提出,而缺乏對新型技術(shù)引用的研究。數(shù)據(jù)挖掘技術(shù)是基于某大數(shù)據(jù)庫發(fā)掘有效有價(jià)值的數(shù)據(jù)并加以利用的新型技術(shù),目前被廣泛應(yīng)用到各個(gè)領(lǐng)域中。因此,發(fā)展數(shù)據(jù)挖掘技術(shù)在水利工程安全維護(hù)管理中的應(yīng)用,對于促進(jìn)我國水利工程管理現(xiàn)代化、建設(shè)高效暢通的安全管理體系具有十分重要的意義。
田家灣水庫位于浙江省湖州市田家灣村,項(xiàng)目區(qū)冬季寒冷干燥,春季濕潤多風(fēng),夏季高溫多雨,秋季旱澇無常。水庫工程屬長江流域支流水利工程,水庫控制流域面積為97 km2,總庫容為942.5×104m3。根據(jù)現(xiàn)場調(diào)查結(jié)果,由于水庫大壩工程年久失修,因此部分溢洪道泄洪能力出現(xiàn)問題,不能滿足下游山西省高校新校區(qū)防洪的限泄要求。因此,展開對該水利工程的安全監(jiān)測、管理與風(fēng)險(xiǎn)評價(jià)具有重要意義。為合理布置實(shí)施田家灣水庫除險(xiǎn)加固工程,現(xiàn)需要對該水庫各溢洪道的實(shí)際情況展開監(jiān)測與安全管理。見圖1。
圖1 田家灣水庫
傳統(tǒng)的信息處理側(cè)重于關(guān)鍵詞查詢與關(guān)鍵信息統(tǒng)計(jì)分析,而對一些“次要”的指標(biāo)所隱含的信息則選擇忽略。數(shù)據(jù)挖掘即指從長時(shí)間所堆積的大量歷史數(shù)據(jù)中提取人們有興趣、有價(jià)值的數(shù)據(jù)知識的過程。這些數(shù)據(jù)不僅包括關(guān)鍵的、重要的信息,同時(shí)也包括大量數(shù)據(jù)中所隱含的信息,這些信息對管理措施決策可能具有重要意義。數(shù)據(jù)挖掘是通過對某個(gè)數(shù)據(jù)庫中的每個(gè)數(shù)據(jù)展開分析,從而探索獲得大量數(shù)據(jù)中基礎(chǔ)規(guī)律的技術(shù)。數(shù)據(jù)挖掘技術(shù)主要包括數(shù)據(jù)準(zhǔn)備、規(guī)律探尋以及規(guī)律確定這3個(gè)項(xiàng)目。數(shù)據(jù)挖掘技術(shù)主要方法見表1。
表1 數(shù)據(jù)挖掘技術(shù)主要方法
由于現(xiàn)場數(shù)據(jù)具有完整性差、噪點(diǎn)多等劣勢,從設(shè)計(jì)監(jiān)理單位所獲取的數(shù)據(jù)不全為有效數(shù)據(jù),因此需要對數(shù)據(jù)進(jìn)行預(yù)處理以獲得真實(shí)有效的數(shù)據(jù),使得試驗(yàn)研究樣本更加真實(shí),以保證數(shù)據(jù)挖掘的正確性。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)篩選、數(shù)據(jù)補(bǔ)充及數(shù)據(jù)整合標(biāo)準(zhǔn)化3個(gè)步驟。在對數(shù)據(jù)展開聚類分析時(shí),通常采用分類統(tǒng)計(jì)量距離來描述不同數(shù)據(jù)之間的相似度。常見的距離統(tǒng)計(jì)量有以下幾種:Manhattan距離、Euclidean距離以及Chebychev距離。本次研究采用Manhattan距離(也稱絕對值距離)進(jìn)行距離計(jì)算及相似度分析,假設(shè)某個(gè)樣本中具有n個(gè)樣品,其基本計(jì)算方法如下:
(1)
采用K-means聚類算法進(jìn)行計(jì)算,其基本原則是優(yōu)化初始聚類中心,使選取的初始聚類中心的距離盡量遠(yuǎn)[11-12]。本次研究采用“聚類-分級”的層次聚類分析方法(圖2)來處理水庫不同安全監(jiān)測點(diǎn)的分級管理問題。
圖2 AGNES層次聚類分析法
其具體實(shí)現(xiàn)過程主要分為4個(gè)步驟:
1)獲取水庫溢洪道安全相關(guān)監(jiān)測點(diǎn)的具體數(shù)據(jù)并進(jìn)行預(yù)處理,以得到真實(shí)、有效的數(shù)據(jù)。
2)認(rèn)為設(shè)定K值,基于改進(jìn)的K-means算法將安全因素分為K個(gè)簇(K即為期望劃分的等級數(shù)),計(jì)算簇間距離并得到劃分為K個(gè)簇的數(shù)據(jù)庫。
3)計(jì)算聚類后的每個(gè)簇內(nèi)數(shù)據(jù)的總均值Sj,Sj值可由下式計(jì)算:
(2)
式中:i為監(jiān)測點(diǎn)編號(1,2,…,n);j為簇?cái)?shù)編號(1,2…,k);Q為溢洪道在的安全效能值;R為監(jiān)測點(diǎn)風(fēng)險(xiǎn)因素修復(fù)率,%;N為監(jiān)測點(diǎn)沉降量,mm;E為監(jiān)測點(diǎn)偏移量,m。
4)根據(jù)Sj的值,按照大小順序?qū)⒈O(jiān)測點(diǎn)的效能劃分為k個(gè)等級。
經(jīng)過現(xiàn)場觀察和調(diào)查,田家灣水庫溢洪道存在一定的安全風(fēng)險(xiǎn),主要表現(xiàn)在溢洪道不同部位出現(xiàn)混凝土破裂,上覆土層位移變形,嚴(yán)重影響溢洪道工作效率。為合理分析溢洪道不同部位的安全運(yùn)行,本次研究選取田家灣水庫中溢洪道20個(gè)安全監(jiān)控點(diǎn)的數(shù)據(jù)作為樣本進(jìn)行研究,經(jīng)過預(yù)處理得到基本數(shù)據(jù),見表2。
表2 田家灣水庫20個(gè)安全監(jiān)測點(diǎn)數(shù)據(jù)
按照上節(jié)所述具體流程與步驟,選定分級簇總數(shù)k為4;再利用Matlab等數(shù)據(jù)分析軟件,最終得到基于數(shù)據(jù)挖掘技術(shù)的分級結(jié)果見表3。
表3 基于改進(jìn)K-means算法的分級結(jié)果
綜上可知,按照4個(gè)等級機(jī)制,則該水庫中按次序每個(gè)等級安全監(jiān)測點(diǎn)的數(shù)目分別為2、10、3和5個(gè)。由此可見,該水庫溢洪道安全監(jiān)測點(diǎn)中有8個(gè)監(jiān)測點(diǎn)反映出安全性較低(Ⅲ、Ⅳ級),需要進(jìn)行修復(fù)或更換。根據(jù)K-means算法輸出結(jié)果,可以得到Ⅲ、Ⅳ級需要修復(fù)的監(jiān)測點(diǎn)編號,其中Ⅲ級的有監(jiān)測點(diǎn)2號、4號和11號,Ⅳ級的有1號、7號、8號、10號和16號,因此需要采取措施針對對應(yīng)編號尤其是Ⅳ級簇內(nèi)的監(jiān)測點(diǎn)展開及時(shí)的修復(fù)。
為研究數(shù)據(jù)挖掘技術(shù)在水利工程安全監(jiān)測管理中的應(yīng)用,本文基于數(shù)據(jù)挖掘技術(shù)建立了水利工程溢洪道安全等級劃分基本方法,并以我國浙江省田家灣灣水庫為例開展了深入研究。主要結(jié)論如下:
1)基于數(shù)據(jù)挖掘技術(shù)中的聚類分析法,并采用改進(jìn)的K-means算法建立水利工程安全監(jiān)測管理等級劃分基本方法,該方法具有高效、可處理復(fù)雜數(shù)據(jù)的優(yōu)勢,能夠適用于我國水利工程安全監(jiān)測管理工作中。
2)基于水利工程溢洪道等級劃分基本方法,得到田家灣水庫溢洪道安全監(jiān)測點(diǎn)中按次序每個(gè)等級的監(jiān)測點(diǎn)數(shù)目分別2、10、3和5個(gè),且能夠快速確定每個(gè)等級的對應(yīng)序號。其中,等級為Ⅲ、Ⅳ級的安全監(jiān)測點(diǎn)反映出嚴(yán)重問題,需要及時(shí)進(jìn)行修復(fù)或更換,該區(qū)域需要修復(fù)的位置總數(shù)為8個(gè)。