沈丹丹,包為民,劉可新,龔婷婷,張 乾,陳偉東(河海大學(xué)水文水資源學(xué)院,南京 210098)
馬斯京根匯流參數(shù)估計(jì)采用的是河段上下兩斷面的實(shí)測(cè)流量過程資料。若流量資料誤差為服從零均值正態(tài)分布或?qū)?shù)正態(tài)分布的隨機(jī)誤差時(shí),利用傳統(tǒng)的估計(jì)理論(如最小二乘法)可取得比較好的估計(jì)效果;但當(dāng)流量資料中存在異常值時(shí),用傳統(tǒng)的估計(jì)方法進(jìn)行參數(shù)估計(jì)常常會(huì)得出不合理的參數(shù)估計(jì)結(jié)果[1]。
抗差最小二乘法將抗差理論與最小二乘法相結(jié)合,利用抗差理論的特性抵御異常誤差對(duì)參數(shù)估計(jì)的影響,從而提高參數(shù)估計(jì)的精度和穩(wěn)定性。本文將附有條件的抗差最小二乘法運(yùn)用到馬斯京根匯流參數(shù)估計(jì)中,利用閩江流域沙縣河段21場(chǎng)實(shí)測(cè)入流資料構(gòu)建理想模型,并基于人工生成的零均值正態(tài)分布的隨機(jī)誤差和異常誤差這兩類誤差,分析檢驗(yàn)了用抗差最小二乘法進(jìn)行參數(shù)估計(jì)的有效性與穩(wěn)定性。
(1)
采用拉格朗日算子法,可導(dǎo)出最小二乘解:
(2)
利用抗差等價(jià)權(quán)原理,采用拉格朗日算子法,可導(dǎo)出抗差最小二乘估計(jì),為:
(3)
式中:W是對(duì)角元素為ωi的對(duì)角陣;ωi為抗差權(quán)函數(shù)。
根據(jù)文獻(xiàn)[2]的研究,本文使用如下三段權(quán)函數(shù)和函數(shù)變量:
(5)
式中:ωi為抗差權(quán);εi為權(quán)函數(shù)變量;k1和k2為待定的常數(shù),本文中分別取1和2.5;Qi和Qci分別為下斷面實(shí)測(cè)流量和計(jì)算出流;n為計(jì)算時(shí)段數(shù)。
(1)由式(5)和式(4)分別計(jì)算出εi和ωi的值;
污水的深度處理工藝的目的是進(jìn)一步去除污水中經(jīng)二級(jí)處理后剩余的污染物質(zhì),工藝的選擇取決于二級(jí)處理出水的水質(zhì)和所需達(dá)到的水質(zhì)標(biāo)準(zhǔn)。二級(jí)處理出水中污染物質(zhì)為有機(jī)物和無機(jī)物的混合體,有機(jī)物包括細(xì)菌、病菌、藻類及原始生物等。不論是有機(jī)物還是無機(jī)物,根據(jù)它們存在于污水中的顆粒的大小又可分 為 懸 浮 物 (>1μm)、膠 體 (1μm ~1nm)和 溶 解 物 (<1nm),一般來說通過混凝沉淀等常規(guī)工藝可以去除懸浮物和膠體粒子。溶解性雜質(zhì)必須通過某些非常規(guī)手段才能去除。
(2)計(jì)算等價(jià)權(quán)矩陣W;
本研究采用的匯流參數(shù)為C0=0.27,C1=0.50,C2=0.23,上斷面入流過程選用了閩江流域沙縣斷面1989-2001年21場(chǎng)不同量級(jí)和不同特點(diǎn)的實(shí)測(cè)洪水過程(21場(chǎng)洪水的洪峰流量和最小流量見表1),并用式(1)計(jì)算相應(yīng)的下斷面的出流過程作為理想系統(tǒng)的輸出。由此構(gòu)成的理想模型的參數(shù)、輸入和輸出都是已知且無任何誤差。
表1 21場(chǎng)洪水的洪峰流量和最小流量值 m3/sTab.1 The peak discharge and the minimum discharge of 21 floods
觀測(cè)誤差按絕對(duì)值大小分一般可分為小誤差、粗差和極值誤差。小誤差發(fā)生頻率高,且一般服從零均值正態(tài)分布或?qū)?shù)正態(tài)分布;而粗差和極值誤差發(fā)生頻率低、變化較大,一般不具有這些誤差統(tǒng)計(jì)特征。因此,本文采用如下兩種誤差生成模式:
δi~N(0,var)i=1,2,…,n
(7)
在1.1構(gòu)建的理想模型的下斷面計(jì)算出流過程上加上式(6)生成的隨機(jī)誤差,分別用最小二乘法和抗差最小二乘法估計(jì)河段馬斯京根匯流參數(shù),估計(jì)結(jié)果如表2。表2中Cl0,Cl1,Cl2為最小二乘法估計(jì)的匯流參數(shù);Cr0,Cr1,Cr2為抗差最小二乘法估計(jì)的匯流參數(shù)。隨機(jī)誤差情況下兩種估計(jì)方法的匯流參數(shù)估計(jì)結(jié)果(以參數(shù)C0為例)統(tǒng)計(jì)如圖1。
表2 隨機(jī)誤差的參數(shù)估計(jì)結(jié)果Tab.2 Parameter estimation results of random errors
圖1 隨機(jī)誤差參數(shù)(以C0為例)估計(jì)結(jié)果圖Fig.1 Parameter estimation results of random errors(take C0 as example)
分析表2可以發(fā)現(xiàn),當(dāng)實(shí)測(cè)資料的觀測(cè)誤差服從零均值正態(tài)分布時(shí),用最小二乘法和抗差最小二乘法估計(jì)出的參數(shù)值相差不大,且都非常接近真值。但比較而言,最小二乘法估計(jì)的參數(shù)均值更接近真值,說明此時(shí)最小二乘法的估計(jì)效果更好。
參數(shù)估計(jì)均方差從統(tǒng)計(jì)意義上反映了參數(shù)估值對(duì)于參數(shù)均值的偏離程度。因此,在同樣的樣本資料條件下,兩種不同方法的參數(shù)估計(jì)均方差可以反映兩種評(píng)價(jià)方法的穩(wěn)定性。從表中可以看出,最小二乘法和抗差最小二乘法的參數(shù)估計(jì)均方差都比較小,表明誤差服從零均值正態(tài)分布時(shí),兩種方法估計(jì)結(jié)果都比較穩(wěn)定。但比較而言,抗差最小二乘法的參數(shù)估計(jì)均方差更小,因此,抗差最小二乘法估計(jì)結(jié)果更穩(wěn)定。
由圖1參數(shù)估計(jì)結(jié)果統(tǒng)計(jì)圖也可以看出,隨機(jī)誤差情況下,兩種方法的估計(jì)效果和穩(wěn)定性相差無幾,與表2分析結(jié)果相吻合。
綜上所述,當(dāng)誤差服從零均值正態(tài)分布時(shí),兩種方法的參數(shù)估值都是有效的。最小二乘法估計(jì)結(jié)果更接近真值,而抗差最小二乘法的估計(jì)結(jié)果更穩(wěn)定。
在理想模型的下斷面計(jì)算出流過程上加上式(7)生成的異常誤差,這里時(shí)間間隔L取10 h,即本文采用的是崩潰率為10%的誤差資料。分別用最小二乘法和抗差最小二乘法估計(jì)河段馬斯京根匯流參數(shù),估計(jì)結(jié)果如表3。表3中Cl0,Cl1,Cl2為最小二乘法估計(jì)的匯流參數(shù);Cr0,Cr1,Cr2為抗差最小二乘法估計(jì)的匯流參數(shù)。異常誤差情況下兩種估計(jì)方法的匯流參數(shù)估計(jì)結(jié)果(以參數(shù)C0為例)統(tǒng)計(jì)如圖2。
由表3可以發(fā)現(xiàn),當(dāng)誤差為不滿足正態(tài)分布的粗差或極值誤差時(shí),雖然最小二乘方法估計(jì)結(jié)果的均值與真值很接近,但每場(chǎng)洪水的參數(shù)估值都嚴(yán)重偏離真值,例如890511號(hào)洪水,最小二乘估計(jì)的參數(shù)估值為0.040 4,0.716 4和0.243 2。此時(shí),最小二乘估計(jì)方法幾近崩潰,根本無法得出有效的參數(shù)估值。而抗差最小二乘法的估計(jì)結(jié)果,無論從次洪還是估值的均值來看都非常接近真值,且參數(shù)估計(jì)均方差較小,穩(wěn)定性較好。說明,在異常誤差的情況下,抗差最小二乘法利用抗差特性抵御了異常值對(duì)參數(shù)估計(jì)的影響, 能夠獲得有效且穩(wěn)定的估計(jì)結(jié)果。
分析圖2可以發(fā)現(xiàn),異常誤差情況下,最小二乘法估計(jì)結(jié)果嚴(yán)重偏離真值,且上下波動(dòng)非常大,估計(jì)結(jié)果極不穩(wěn)定;而抗差最小二乘法參數(shù)估值與真值非常接近,且穩(wěn)定性較好。這與表格分析結(jié)果一致。
表3 異常誤差的參數(shù)估計(jì)結(jié)果Tab.3 Parameter estimation results of abnormal errors
圖2 異常誤差參數(shù)(以C0為例)估計(jì)結(jié)果圖Fig.2 Parameter estimation results of abnormal errors(take C0 as example)
綜上所述,當(dāng)觀測(cè)資料受到異常值污染時(shí),最小二乘估計(jì)方法崩潰,不再適用。而抗差最小二乘估計(jì)方法能夠檢測(cè)出異常值,根據(jù)其大小采用剔除或降權(quán)處理的方式抵御其對(duì)參數(shù)估計(jì)的影響,從而獲得有效且穩(wěn)定的參數(shù)估值,值得推廣使用。
(1)最小二乘法在隨機(jī)誤差的情況下能獲得有效的參數(shù)估值,但在異常誤差的影響下,估計(jì)結(jié)果嚴(yán)重偏離真值,方法不再適用。
(2)抗差最小二乘法將抗差理論與最小二乘估計(jì)相結(jié)合,利用抗差理論所具有的抗差能力,有效地抵御了異常值對(duì)參數(shù)估計(jì)的影響,在隨機(jī)誤差和異常誤差的情況下都能得出有效且穩(wěn)定的參數(shù)估值。因此,抗差最小二乘法在隨機(jī)誤差和異常誤差情況下均適用。
(3)本文只研究了一種異常誤差的情況,抗差最小二乘法對(duì)不同頻率不同量級(jí)的異常誤差的抗差估計(jì)效果還有待進(jìn)一步研究。
□
[1] 趙超.流域?qū)崟r(shí)洪水抗差預(yù)報(bào)系統(tǒng)研究[D].南京:河海大學(xué),2006.
[2] 包為民,瞿思敏,黃賢慶,等.水文系統(tǒng)抗差權(quán)函數(shù)分析與檢驗(yàn)[J].清華大學(xué)學(xué)報(bào),2003,43(8):1 127-1 129.
[3] 瞿思敏,包為民,石 朋,等.降雨觀測(cè)誤差修正方法研究[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2005,(6).
[4] 趙 超,洪華生,包為民,等. 實(shí)時(shí)洪水抗差預(yù)報(bào)系統(tǒng)研究[J]. 水文,2008,(2).
[5] 包為民,嵇海祥,胡其美,等.抗差理論及在水文學(xué)中的應(yīng)用[J]. 水科學(xué)進(jìn)展,2003,(4).
[6] 郭麗君,趙 超.馬斯京根模型參數(shù)抗差估計(jì)方法風(fēng)險(xiǎn)分析[J]. 水電能源科學(xué),2012,(3).
[7] 瞿思敏,包為民,石 朋,等.降雨觀測(cè)誤差抗差估計(jì)方法比較研究[J]. 河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,(1).
[8] 包為民,瞿思敏,李清生,等.遙測(cè)系統(tǒng)降雨觀測(cè)誤差估計(jì)方法研究[J].水利學(xué)報(bào),2003.
[9] 包為民,林 躍,黃賢慶,等.水庫(kù)入庫(kù)河段洪水匯流參數(shù)抗差估計(jì)研究[J]. 武漢大學(xué)學(xué)報(bào)(工學(xué)版),2004,(6).
[10] 包為民,王 浩,趙 超,等.AR模型參數(shù)的抗差估計(jì)研究[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,(3).
[11] 趙 超,包為民,王葉琴,等.河段匯流參數(shù)抗差估計(jì)研究[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,(1).