楊承志 魏博文 徐鎮(zhèn)凱
摘要: 變形是最能直觀反映混凝土壩運行性能的宏觀效應(yīng)量。考慮到監(jiān)測數(shù)據(jù)異常值對監(jiān)控模型精度與大壩安全性態(tài)診斷的不利影響,提出了一種基于支持向量機的混凝土壩變形監(jiān)測數(shù)據(jù)異常值判定方法。在分析混凝土壩原型變形監(jiān)測數(shù)據(jù)顯性異常點的基礎(chǔ)上,通過構(gòu)建基于支持向量機理論(SVM)的高精度計算體系,充分利用結(jié)果效應(yīng)量與驅(qū)動環(huán)境量之間的映射交互關(guān)系,結(jié)合最小協(xié)方差矩陣(MCD)穩(wěn)健估計理論對殘差序列進行異常值判定,而后將其異常確定值進行有機性替代處理,解決了內(nèi)蘊復雜環(huán)境干預的監(jiān)測信息挖掘難點。工程實例分析表明:所建判定系統(tǒng)的精準性及泛化能力均得以提升,相比于傳統(tǒng)方法具有較好的實用性和魯棒性,能有效地避免變形監(jiān)測數(shù)據(jù)預處理中的誤判漏判等困擾。此外,所提出的判定方法經(jīng)一定的優(yōu)化和拓展,亦可推廣應(yīng)用于其他水工建筑物的數(shù)據(jù)異常值判定分析。
關(guān) 鍵 詞: 安全監(jiān)測; 異常值判定; 支持向量機; 最小協(xié)方差矩陣; 混凝土壩
中圖法分類號: ?TV698
文獻標志碼: ?A
DOI: 10.16232/j.cnki.1001-4179.2022.03.033
0 引 言
隨著大壩安全監(jiān)測自動化監(jiān)控水平的提高,測點增多、測頻加密,觀測數(shù)據(jù)量大大增加,對監(jiān)測數(shù)據(jù)的準確性和可靠性的要求也越來越高,在數(shù)據(jù)的采集、傳輸過程中,不可避免的會存在異常的數(shù)據(jù)? [1] 。這些異常值會對大壩安全監(jiān)測工作帶來諸多不良影響,一方面,如果這些異常測值是錯誤的,將會對大壩監(jiān)控模型有較大的干擾,影響大壩安全分析,甚至引發(fā)大壩安全事故誤報,導致巨大的經(jīng)濟安全資源浪費;另一方面,如果這些異常值是大壩工作運行狀態(tài)的實際反映,那么它蘊含著大量的大壩安全信息,需要對其進行詳細認真的分析,以尋找其異常原因? [2] 。因此,在大壩安全監(jiān)測數(shù)據(jù)預處理工作中,尋求一種可靠性較高的處理異常值方案具有重要意義。
傳統(tǒng)的異常值識別辦法主要有拉依達準則、羅曼諾夫斯基準則、格拉布斯準則及狄克松準則等? [3] 。這些準則都是基于統(tǒng)計數(shù)學理論,只是單純地對大壩觀測數(shù)據(jù)進行處理,并未涉及大壩環(huán)境量變化對觀測數(shù)據(jù)的影響,不能很好地區(qū)分異常值到底是錯誤值還是反映大壩安全實況的真實值,容易出現(xiàn)誤判? [4] 。因此,通過引入數(shù)學模型獲得殘差序列,再結(jié)合常用異常值識別方法對殘差序列加以識別,進而判斷原始監(jiān)測序列中異常值的方法? [5] ,能夠較好地解決混凝土壩監(jiān)測數(shù)據(jù)與外界環(huán)境脫離的問題。為此,何金平等? [6] 分析了白塞爾公式在大壩變形監(jiān)測中的適用條件,并將其應(yīng)用在異常值識別工作中;顧沖時等? [7] 利用程序設(shè)計語言,采用圖像處理技術(shù)對大壩監(jiān)測資料自動化識別;李明超等? [8] 針對野值識別問題,提出了以改進局部異常系數(shù)算法為基礎(chǔ)的密度分簇局部異常識別方法;陶家祥等? [9] 采用多元線性回歸、格拉布斯判別法與現(xiàn)場工況相結(jié)合的方法對監(jiān)測數(shù)據(jù)異常值加以判別;趙澤鵬等? [10] 將穩(wěn)健估計方法引入到粗差識別的建模工作中,使得識別結(jié)果更加可靠。但是由于回歸類方法本身存在的問題? [11] ,在建模擬合的過程中,原本的異常數(shù)據(jù)會導致擬合過程線靠近,影響結(jié)果的精確性;陶園等? [12] 借鑒人工免疫的工作模式,設(shè)計出基于該模式下的多層粗差檢驗法,可對大容量、長時間序列的數(shù)據(jù)進行快速的粗差識別,但是缺乏大量時間數(shù)據(jù)的論證和完善。
針對以上方法在運用過程中的不足,本文采用魯棒性和泛化能力更優(yōu)的支持向量機(Support Vector Machine,SVM)處理混凝土壩效應(yīng)量和環(huán)境量之間的交互關(guān)系,并利用抗差性能較好的最小協(xié)方差矩陣(Minimum Covariance Determinant,MCD)穩(wěn)健估計對殘差序列進行異常值判定,據(jù)此建立一套基于SVM-MCD的混凝土壩變形監(jiān)測數(shù)據(jù)異常值判定方案,以期提高混凝土壩原位監(jiān)測數(shù)據(jù)預處理工作中異常值檢測的可靠性。
1 混凝土壩監(jiān)測數(shù)據(jù)異常值判定方法
異常值通常分為隨機誤差、粗差和系統(tǒng)誤差,其中粗差是與混凝土壩實際情況無關(guān),在數(shù)據(jù)讀取或者傳輸過程中受外部環(huán)境干擾而意外失靈造成的誤差,包括缺失值、不變數(shù)據(jù)值、孤立噪聲值和短時郵編數(shù)據(jù)值,是大壩安全異常值檢測的主要內(nèi)容? [13] 。而異常值很難通過一般的檢測方法去識別它。因此,本文擬提出基于SVM和MCD穩(wěn)健估計方法對混凝土壩變形監(jiān)測數(shù)據(jù)異常值進行判定。
1.1 混凝土壩變形監(jiān)測數(shù)學模型
考慮到混凝土壩監(jiān)測數(shù)據(jù)異常值檢測受環(huán)境影響較大,通過建立混凝土壩監(jiān)測數(shù)學模型模擬環(huán)境量與效應(yīng)量之間的關(guān)系,消除因內(nèi)蘊復雜環(huán)境引起的混凝土壩監(jiān)測數(shù)據(jù)異常的情況。
混凝土壩變形的影響因素較多,根據(jù)經(jīng)典混凝土壩變形監(jiān)測模型可知,混凝土壩變形主要是由水位、溫度變化引起的可逆變形與筑壩材料隨時間響應(yīng)引起的不可逆變形組成? [14] ,因此,其數(shù)學模型可寫為
δ=δ H+δ T+δ θ (1)
式中: δ? H 為水壓分量;δ? T 為溫度分量;δ θ 為時效分量。
水壓分量 δ? H? 代表壩體和水庫地基在水庫水荷載和壩體重量作用下的變形,其變化主要與上游水深有關(guān)? [15] ,可表示為
δ H=? n ?i=1? α iH i (2)
式中: α? i 為統(tǒng)計系數(shù);H 為上游水深,m;對于重力壩而言, n=3;對于拱壩而言,n=4,5 。
溫度分量 δ? T? 描述了壩體和環(huán)境溫度變化引起的變形。大壩在服役多年后,其內(nèi)部溫度場可視為穩(wěn)態(tài)? [16] ,可用多周期諧波函數(shù)表示為
δ T=? 2 ?i=1? ?b? 1i? sin? 2 π it 365 +b? 2i? cos? 2 π it 365?? (3)
式中: t為監(jiān)測日至初始監(jiān)測日的時間, d ;i=1為年周期;i=2為半年周期;b? 1?? i ,b? 2?? i? 為統(tǒng)計系數(shù)。
時效分量 δ θ 是由大壩混凝土和基巖的蠕變和塑性變形引起的。大壩正常運行時,各組成部分在初期迅速變化,后期趨于穩(wěn)定? [17] 。通常用如下組合形式表示:
δ θ=c 1θ+c 2 ln θ (4)
式中: c? 1 ,c? 2 為統(tǒng)計系數(shù);θ=t/100。
所以,式(1)又可寫為
δ= α 0+? n ?i=1? α iH i+? 2 ?i=1? (b? 1i? sin? 2 π it 365 +b? 2i? cos? 2 π it 365 )+? c 1θ+c 2 ln θ (5)
式中: α? 0為常數(shù)項。
1.2 混凝土壩變形監(jiān)測異常值計算體系
混凝土壩變形與各環(huán)境因子之間的關(guān)系比較復雜,回歸方法在求解這種復雜關(guān)系的時候結(jié)果往往不盡人意。由于支持向量機在求解分類擬合問題上有較高的精度,且其最后的結(jié)果是由小部分的支持向量確定,消除了大量不必要的試料? [18] ,因而采用其來求解數(shù)學模型?;舅枷胫饕袃牲c:① 基于結(jié)構(gòu)最小化理論,尋找最優(yōu)超平面使得正、負向量間隔最大;② 用核函數(shù)將低維線性不可分問題轉(zhuǎn)化為高維空間線性問題,代替計算? [19-20] 。
假設(shè)一組混凝土壩環(huán)境量訓練樣本集? x ={x 1,x 2,…,x n},其中 x i = {x? i1 ,x? i2 ,…,x? in }?? T代表模型中的因子項(水位、溫度、時效因子的組合形式)。如圖1所示,其最優(yōu)超平面可以被定義為
f(x)= w ??T · x +b (6)
式中:? w 為權(quán)重向量,決定了超平面的方向;b 為常數(shù),決定了超平面與原子之間的距離。
考慮到混凝土壩變形監(jiān)測序列樣本中存在離群值,通過引入了松弛因子 ξ和懲罰系數(shù)C ,通過凸二次規(guī)劃將目標函數(shù)轉(zhuǎn)化為
min? 1 2 ?‖ w ‖? 2+C? n ?i=1? ξ i? s.t.y i? w ??T · x +b ≥1-ξ i, ξ i≥0? (7)
在低維特征空間中,通常難以找到一個合適的超平面對有效成分進行分割,即難以找到混凝土壩效應(yīng)量與環(huán)境量之間的交互關(guān)系。因此,通過引入Lagrange乘子 α? i 和核函數(shù)K x i·x j ?將各環(huán)境因子與大壩效應(yīng)因子變換到高維特征空間,上述目標函數(shù)轉(zhuǎn)化為
f x = sgn??? n ?i=1? y iα iK? x ?i· x ?j +b? (8)
式中: x? j 為待測樣本的特征向量,j=1,2,…,n。
由于核函數(shù)類型對SVM模型的性能影響較大,選擇合適的核函數(shù)極為重要。本文采用混凝土壩部分原位監(jiān)測數(shù)據(jù)進行擬合試驗,對比分析在相同數(shù)據(jù)條件下不同核函數(shù)的擬合結(jié)果,如圖2所示。對于不同的數(shù)據(jù)類型,核函數(shù)主要分為? [21]
線性核:
K? x ?i· x ?j = x ?i??? T? x ?j (9)
多項式核:
K? x ?i· x ?j =? ?x ?i??? T? x ?j ??n (10)
高斯徑向基核:
K? x ?i· x ?j = exp? - ‖x i-x j‖? 2/ 2σ 2?? (11)
Sigmoid核:
K? x ?i· x ?j = tanh? a? x ?i??? T · x ?j -b ,a>0,b>0 (12)
由圖2可以看出:高斯RBF核SVM模型擬合結(jié)果明顯優(yōu)于線性核和多項式核SVM模型,并且比Sigmoid核SVM模型擬合誤差低。因此,本文采用高斯RBF核作為SVM模型的核函數(shù)。因此,目標函數(shù)轉(zhuǎn)化為
f x = sgn??? n ?i=1? y iα i exp? - ?‖x i·x j‖? 2 2σ 2? +b? (13)
式中: σ 為核函數(shù)參數(shù)。
1.3 混凝土壩變形監(jiān)測數(shù)據(jù)異常值識別方法
3 σ 準則、Grubbs準則和Dixon準則等是數(shù)據(jù)異常值識別的常用統(tǒng)計檢驗方法。相關(guān)研究指出:格拉布斯準則和狄克松準則僅適用于混凝土壩監(jiān)測數(shù)據(jù)小樣本容量的異常數(shù)據(jù)鑒別,而3 σ 準則較為適用于樣本量較為豐富的數(shù)據(jù)異常值識別? [22-23] 。因此,在混凝土壩長期監(jiān)測資料異常值診斷中,格拉布斯準則和狄克松準則將不再適用,而3 σ 準則在使用過程中比較容易受到異常值的影響而向其偏移,這對處理粗差問題顯然存在矛盾,故在此引入最小協(xié)方差矩陣穩(wěn)健估計算法。
MCD穩(wěn)健估計算法是一種魯棒性很強的位置和分布估算法? [24-25] ,其主要是利用馬氏距離和迭代思想構(gòu)建一個穩(wěn)健的協(xié)方差行列式估計量? [26-27] 。對于一個 m×n維矩陣 X ??m×n? ,找到一個樣本量為 h 的子集,根據(jù)MCD均值和協(xié)方差估計公式計算 T? i 和S? i? ,而后得出樣本與中心之間的馬氏距離 MD ,通過不斷迭代,直至找到一個子集,使得它在所有大小為 h 的子集中,該子集的協(xié)方差矩陣的行列式是最小的。在異常值的探測中,為了得到盡可能高的崩潰點, h 常取? [28-29] :
h=? m+n+1 2? ≈ m 2? (14)
MD x = ??x- x? ???t S ??-1? x- x? ???(15)
MD x = X 2? n,0.975? ?(16)
式中: x? 為均值,? S ?是協(xié)方差矩陣, MD 是馬氏距離,用于反映一個數(shù)據(jù)點 x i 距離數(shù)據(jù)集整體的距離;本文采用PL6測點2018年1月1日至12月31日的混凝土壩變形原型監(jiān)測數(shù)據(jù),所以 m =365, n =1,則 h =183。計算得出 T?? MCD 和 S?? MCD ,構(gòu)建控制函數(shù),即:
T i=X i-T?? MCD? ≤3S?? MCD? ,i=1,2,…,n (17)
式中:? T i ≤3S?? MCD? 時,數(shù)據(jù)位于置信區(qū)間;反之,當 T i >3S?? MCD?? 時,此為小概率事件,則認為該數(shù)據(jù)異常? [26] 。
1.4 混凝土壩變形監(jiān)測數(shù)據(jù)異常值判定步驟
基于上述方法的介紹,本文融合支持向量機良好的分類準確性與最小協(xié)方差矩陣穩(wěn)健估計算法數(shù)據(jù)抗差能力強的特點,提出了一種基于支持SVM-MCD的混凝土壩變形監(jiān)測數(shù)據(jù)異常值判定方案,其流程如圖3所示,步驟如下。
步驟1:依據(jù)剔除顯性異常值后的混凝土壩變形監(jiān)測數(shù)據(jù)計算其水壓、溫度、時效分量值;
步驟2:利用支持向量機求解數(shù)學模型;
步驟3:計算數(shù)學模型的擬合值和實測值之間差值,得到殘差序列;
步驟4:初始化均值 T? i 和協(xié)方差S? i ,并計算出馬氏 距離d(i) ;
步驟5:利用最小協(xié)方差矩陣穩(wěn)健估計算法輸出最優(yōu)位置參數(shù) T?? MCD 和尺度參數(shù) S?? MCD ;
步驟6:對殘差序列進行異常值識別,重復該步驟直至篩選出所有異常值。
2 實例分析
2.1 混凝土重力壩
棉花灘碾壓混凝土重力壩壩頂高程179.0 m,最大壩高113.0 m,壩頂全長為308.5 m,水庫總庫容為20.35億m? 3 。為監(jiān)測該壩的水平變形,該壩布置了正垂與倒垂監(jiān)測儀器,如圖4所示。
與溢流壩段相比,非溢流壩段的監(jiān)測數(shù)據(jù)受外界環(huán)境如流激振動等干擾較小,其測值的可靠性和準確性相對較高。本文取PL6測點2018年1月1日至12月31日自動化監(jiān)測數(shù)據(jù)作為分析對象,每日監(jiān)測的環(huán)境變量(氣溫、庫水位)和實測變形的過程線如圖5所示。
由圖5可知,PL6測點上游水位變化與實測 變形規(guī)律一致,庫水位升高,大壩 向下游方向水平變形增大;氣溫與實測變形規(guī)律相反,溫度升高,壩頂向上游變形,符合大壩安全監(jiān)測的普遍規(guī)律。
2.1.1 混凝土重力壩內(nèi)蘊監(jiān)測信息挖掘
首先利用SVM構(gòu)建該重力壩水平變形監(jiān)控模型,為檢驗SVM模型的精度,同時采用逐步回歸方法建立了該測點的監(jiān)控模型,模型擬合結(jié)果如圖6所示,殘差序列如圖7所示。
由圖6可知,2種模型的擬合值與實測值變化趨勢大體一致,說明本次研究建立的模型是有效的。與逐步回歸模型后半段擬合值稍微偏離實測值相比,基于SVM-MCD的數(shù)學模型其擬合值更接近變形實測值,說明基于SVM所建模型的效果更佳。由圖7可知,基于SVM-MCD的重力壩變形監(jiān)測數(shù)據(jù)殘差序列表現(xiàn)出明顯的高頻特性,在0附近振動;而逐步回歸方法的殘差則是來回擺動,表現(xiàn)不如前述方法穩(wěn)定。
為進一步說明所建模型的擬合精度,分別計算了兩種模型的復相關(guān)系數(shù)( R?? 2 )、平均誤差百分比( MAPE )、均值(? X?? )和標準差( σ )(見表1)。
表1中的統(tǒng)計指標更進一步說明基于SVM-MCD的監(jiān)控模型相比于回歸模型的誤差更小,其模型精度更高。分析其原因,主要有兩點:① SVM算法因為有松弛因子 ξ 和懲罰系數(shù) C 的存在,抗干擾能力強,不易受異常值的影響,而傳統(tǒng)回歸模型擬合效果受到異常值的影響,回歸線向異常值發(fā)生偏離;② SVM算法在求解的過程中通過核技巧將低維的數(shù)據(jù)映射到高維空間,能夠更為有效地挖掘出混凝土壩的變形與各影響因素之間的的復雜非線性關(guān)系。
2.1.2 混凝土重力壩異常值判定
對回歸建模方法和支持向量機建模方法所得殘差序列分別使用3 σ 準則和MCD穩(wěn)健估計算法進行控制閾值的確定,結(jié)果如表2和圖7所示。
由表2可知,不管是回歸方法還是支持向量機方法所得殘差序列,用MCD穩(wěn)健估計算法改進后的控制域都比用3 σ 準則得到的更小,因為在計算過程中,MCD方法能夠抵抗監(jiān)測序列中原本異常值的影響,從而得到更加可靠的控制閾值。結(jié)合圖7中的控制閾值線,對于變化波動較大的監(jiān)測序列,3 σ 準則不能很好地識別異常點,甚至出現(xiàn)判別不了的情況。而不同方法模型所得殘差用同一種控制函數(shù)得到的控制域也不一樣,由于回歸方法的擬合效果不好,可以認為其挖掘混凝土內(nèi)蘊信息的能力差,即擬合線不能很好地反映大壩的安全監(jiān)測信息,雖然可以識別出異常值,但是和前述方法有一定的差別,其可靠性相對較低。與之相比,本文提出的基于SVM的穩(wěn)健估計方法控制閾更合理,能夠有效識別混凝土壩監(jiān)測數(shù)據(jù)的異常值,大幅減少誤判漏判的現(xiàn)象,使得混凝土壩安全監(jiān)測能夠安全的進行。
基于SVM算法得到的結(jié)果,利用MCD穩(wěn)健估計算法進行異常值判定,共計識別出11個粗差點,如表3所列。結(jié)合圖6可知,這些異常值并沒有出現(xiàn)在實測值序列的最大值或者最小值處,而是在某處的突變點,比較符合異常值的分布規(guī)律。通過分析工程實測資料,未發(fā)現(xiàn)這些值對應(yīng)的日期與鄰近幾天的天氣和水位有突變情況,而且也沒有大型工程施工。對識別出來的異常值用擬合值代替,再對修改后的重力壩變形監(jiān)測數(shù)據(jù)建立基于SVM-MCD的大壩變形監(jiān)測數(shù)據(jù)擬合數(shù)學模型,殘差分析時不再有新的異常值被識別出來,因此,所識別出來的11個點均為異常值。
2.2 混凝土拱壩
二灘混凝土拱壩最大壩高240 m,壩頂弧長 774.69 ?m,總庫容59億m? 3 ,該壩的垂線監(jiān)測儀器布設(shè)方案如圖8所示。
選取拱冠梁處PL08測點2017年5月1日至2018年4月30日變形監(jiān)測數(shù)據(jù),共365組,由于該數(shù)據(jù)實測精度較高,沒有明顯的異常值,所以本文在其中隨機加入6個粗差(見表4),加入粗差后的變形過程線如圖9所示。
對加入粗差后的數(shù)據(jù)分別建立SVM模型和逐步回歸模型,然后利用3 σ 準則和MCD穩(wěn)健估計算法對殘差序列進行異常值識別,結(jié)果如圖9所示。由于數(shù)據(jù)的規(guī)律性比較好,所以兩種方法建立的模型精度都較高,但是對比同樣是SVM模型的建模結(jié)果進行異常值判定發(fā)現(xiàn),3 σ 準則只能識別出2個異常值,而本文所用方法能夠把所有的異常值都識別出來,同時也沒有新的測值被判定為異常值,說明本文所用方法不容易造成誤判結(jié)果,性能優(yōu)越。
3 結(jié) 論
(1) 考慮到混凝土壩原型監(jiān)測數(shù)據(jù)中蘊含復雜環(huán)境干預的監(jiān)測信息挖掘難點,利用支持向量機良好的的求解分類擬合問題能力,有效探尋出結(jié)果效應(yīng)量與驅(qū)動環(huán)境量之間的映射交互關(guān)系。
(2) 本文提出了一種混凝土壩變形原位監(jiān)測資料異常值判定方法,發(fā)揮了MCD穩(wěn)健估計抗差能力強的優(yōu)勢,從而得出更合理的控制閾,解決了傳統(tǒng)回歸方法的漏判誤判現(xiàn)象,可有效判定原始序列中的異常值。實例分析可以看出,本文所建模型擬合精度得到較好的提升,異常值判定結(jié)果更可靠。
(3) 本文提出基于SVM-MCD的異常點判定方法,亦為其他水工建筑物數(shù)據(jù)(如滲流、應(yīng)力)的處理提供了一種新的思路。
參考文獻:
[1]? 謝中凱,王良,蘇玉杰,等.考慮不確定性的大壩監(jiān)測信息異常診斷方法及應(yīng)用[J].水電能源科學,2020,38(10):59-62.
[2] CHEN X Y,ZHANG B,WANG T,et al.Robust principal component analysis for accurate outlier sample detection in RNA-Seq data[J].BMC Bioinformatics,2020,21(1):1141-1152.
[3] NEZAM B,RICHARD J B.Bayesian model checking,comparison and selection with emphasis on outlier detection for geotechnical reliability-based design[J].Computers and Geotechnics,2019,116:71-79.
[4] LIU Q,WANG Z,LIU X D,et al.Outlier detection of time series with a novel hybrid method in cloud computing[J].International Journal of High Performance Computing and Networking,2019,14(4):39-46.
[5] 李嘯嘯,蔣敏,吳震宇,等.大壩安全監(jiān)測數(shù)據(jù)粗差識別方法的比較與改進[J].中國農(nóng)村水利水電,2011(3):102-105,112.
[6] 何金平,施玉群,張博.測值異常條件下變形監(jiān)測中誤差估計[J].水電能源科學,2010,28(7):67-69,22.
[7] 鄭森,顧沖時,邵晨飛.基于圖像處理技術(shù)的大壩監(jiān)測數(shù)據(jù)粗差識別[J].南水北調(diào)與水利科技(中英文),2020,18(5):123-129.
[8] 李明超,李明昊,任秋兵,等.基于密度分簇的長周期監(jiān)測數(shù)據(jù)異常識別方法[J].水力發(fā)電學報,2021,40(3):124-133.
[9] 陶家祥,熊紅陽,胡波.論大壩安全監(jiān)測數(shù)據(jù)異常值的判斷方法[J].三峽大學學報(自然科學版),2016,38(6):15-17.
[10]? 趙澤鵬,陳建康,張瀚,等.基于穩(wěn)健估計的大壩監(jiān)測數(shù)據(jù)粗差識別方法[J].水電能源科學,2018,36(12):68-71.
[11] WEI B,LIU B,YUAN D Y,et al.Spatiotemporal hybrid model for concrete arch dam deformation monitoring considering chaotic effect of residual series[J].Engineering Structures,2021,228:339-353.
[12] 陶園,劉曉青.基于人工免疫模式的大壩監(jiān)測數(shù)據(jù)粗差識別[J].水利水電技術(shù),2019,50(3):66-71.
[13] 高熠飛,王建平,李林峰.基于柯西分布的水文序列異常值檢測方法[J].河海大學學報(自然科學版),2020,48(4):307-313.
[14] 吳中如.水工建筑物安全監(jiān)控理論及其應(yīng)用[M].北京:高等教育出版社,2003.
[15] WEI B W,YUAN D Y,XU Z K,et al.Modified hybrid forecast model considering chaotic residual errors for dam deformation[J].Structural Control and Health Monitoring,2017,25(8):2188-2204.
[16] WEI B W,CHEN L J,LI H K,et al.Optimized prediction model for concrete dam displacement based on signal residual amendment[J].Applied Mathematical Modelling,2020,78:1441-1462.
[17] WEI B W,YUAN D Y,LI H K,et al.Combination forecast model for concrete dam displacement considering residual correction[J].Structural Health Monitoring,2019,18(1):232-244.
[18] 溫勇兵,徐鎮(zhèn)凱,魏博文,等.基于逐步回歸和GDCS-SVM的大壩變形預測組合模型[J].水電能源科學,2017,35(5):92-94.
[19] 郭保蘇,吳文文,付強,等.基于支持向量機分類策略的多晶硅電池片色差檢測[J].計量學報,2019,40(6):1013-1019.
[20] 蘇懷智,溫志萍,吳中如.基于SVM理論的大壩安全預警模型研究[J].應(yīng)用基礎(chǔ)與工程科學學報,2009,17(1):40-48.
[21] 王坤,侯樹賢,王力.基于自適應(yīng)變異PSO-SVM的APU性能參數(shù)預測模型[J].系統(tǒng)工程與電子技術(shù),2021,43(2):526-536.
[22] 張蓓,王順芳.基于MCD穩(wěn)健估計的PCA人臉識別算法[J].計算機工程與設(shè)計,2015(3):778-782.
[23] YOSHINAO I,MASAKI T.Low-cost unsupervised outlier detection by autoencoders with robust estimation[J].Journal of Information Processing,2019,27:1071-1097.
[24] MSAYIB Y,CRAIG M,SIMARD M A,et al.Robust estimation of quantitative perfusion from multi‐phase pseudo‐continuous arterial spin labeling[J].Magnetic Resonance in Medicine,2020,83(3):562-591.
[25] LIU J,DANIEL P P.Regularized robust estimation of mean and covariance matrix for incomplete data[J].Signal Processing,2019,165:38-61.
[26] 吳國慶,顏學峰.基于改進MCD的粗差判別方法及性能分析[J].華東理工大學學報(自然科學版),2008(2):267-272.
[27] 花勝強,李永紅,高磊,等.基于離差和改進的大壩變形監(jiān)測粗差判別方法[J].水電能源科學,2020,38(6):67-69.
[28] MIA H,MICHIEL D,PETER J R.Minimum covariance determinant and extensions[J].Wiley Interdisciplinary Reviews:Computational Statistics,2018,10(3):117-131.
[29] GUSRIANI N F.Linear regression based on Minimum Covariance Determinant(MCD)and TELBS methods on the productivity of phytoplankton[J].IOP Conference Series:Materials Science and Engineering,2018,332(1):321-339.
(編輯:胡旭東)
Abnormal values determination of concrete dam deformation monitoring ?data based on SVM-MCD
YANG Chengzhi,Wei Bowen,XU Zhenkai
( School of Civil Engineering and Architecture,Nanchang University,Nanchang 330031,China )
Abstract:
Deformation is the macroscopic effect that can most directly reflect the operation performance of concrete dams.Considering the adverse effects of abnormal monitoring data on the accuracy of monitoring model and diagnosis of dam safety state,this paper proposed a method for determining abnormal values of concrete dam deformation monitoring data based on support vector machine and minimum covariance matrix theory.Firstly based on the analysis of the dominant abnormal points in the deformation monitoring data,a high-precision calculation system based on the support vector machine theory (SVM) was constructed,and the mapping interaction between the result effect and the driving environment was fully utilized.Then combined with the minimum covariance matrix( MCD ) robust estimation theory,the abnormal values of the residual sequence were determined,and then the abnormal determined values were organically substituted,so as to solve the difficulty of monitoring information mining in the intervention of complex environment.The analysis of engineering examples showed that the accuracy and generalization ability of the judgment system constructed in this paper were improved.Compared with the traditional method,it has better practicability and robustness,and can effectively avoid the misjudgment and omission in the preprocessing of deformation monitoring data.In addition,the proposed method can also be applied to the determination and analysis of abnormal data of other hydraulic structures after certain optimization and expansion.
Key words:
safety monitoring;abnormal values determination;support vector machine;minimum covariance matrix;concrete dam