邵 佳
(安徽省交通航務工程有限公司,安徽 合肥 235200)
涇河是黃河二級支流,始于寧夏涇源六盤山,流域總面積為45 421 km2,是渭河最大的支流之一,占渭河流域面積的33.7%,河道全長高達455.1 km。涇河流域屬于溫帶大陸氣候,降雨總量偏少,但過于集中。據初步統計,流域在1951—2019 年之間年均降水量約為517.9 mm,多集中在7~9 月之間,涇河流域年均流量為16.25 億m3,集水面積約為43 216 km2。
涇河流域的張家山水文站上游河段,作為黃河水沙聯合典型流域,流經黃土高原,具有河段比降明顯、河床沖刷嚴重、流速快、四周植被覆蓋率低等特點。參照張家山水文站監(jiān)測數據,獲取張家山上游涇河流域近一年徑流量及輸沙量,分析其變化過程??紤]該流域汛期徑流量占比大,且輸沙量多的問題,研究擇取汛期徑流量與輸沙量之和(6~10 月),作為水沙聯合分布模型數據依據,流域水系如圖1 所示。
圖1 涇河流域水系圖
廣義極值分布、對數正態(tài)分布、P-Ⅲ分布、Gamma分布是水文分析中的常用概率分布類型。用上述4 種分布擬合張家山水文站徑流量與輸沙量邊緣分布,以AIC準則選擇最優(yōu)的邊緣分布;基于Copula 函數建立水沙聯合分布模型,以AIC 準則選擇最優(yōu)的聯合分布?;诖耍嬎銖搅髁颗c輸沙量的聯合“或”重現期下的“最大可能組合”聯合設計值,應用蒙特卡洛方法評估樣本不確定性對水沙聯合設計值的影響,利用二維自適應核密度估計方法計算該聯合設計值的置信區(qū)間;為進一步分析該聯合設計值的不確定性隨重現期變化的關系,采用聯合熵量化不同重現期下該聯合設計值的不確定性。四種邊緣分布概率密度函數如下式:
式中:Γ(α)表示α 的伽瑪函數;α 為形狀參數;β 為尺度參數;x0表示分布函數的位置未知參數。
式中:α 為形狀參數;β 為尺度參數;ξ 表示分布函數的位置參數。
式中:α 為形狀參數,β 稱為尺度參數。
式中:μ 為函數的平均值;σ 為函數的標準差。
為便于研究,將X和Y設定為該流域年徑流量和年輸沙量,設計為x和y。參照上述四個密度函數,邊緣分布值假設為Fx(x)和Fy(y)。根據條件分布定理,X和Y聯合分布函數可用平面Copula 函數C指代。由此可列出算式:
F(x,y)=Cθ(θ 為Copula 函數的參數)(Fx(x),Fy(y))
重現期是水工領域的概念,是評估流域量級的重要指標。學術界將重現期分為“或”“且”和二次重現三種。限于篇幅,本文著重研究“或”重現期。
當給定重現期T時,臨界概率水平為p,求得值為唯一解,此方式被廣泛應用水工建設。針對兩種變量,求解相對復雜。當給定水沙聯合TOR時,理論上包含數種流量和沙量組合方式,并且滿足二維坐標標準,可用等值線描述。水沙聯合等值線所有點位均可代表一種組合方式,并且取相同的TOR值。但是,為讓研究數據貼近實際,需找尋一組最大可能組合,即聯合概率密度函數取值最大時的設計值。
為測定張家山水文站上游涇河流域水沙聯合序列之間的關系,上文采用Kendall 秩的相關檢驗法,將水文站監(jiān)測數據輸入水沙聯合分布模型,得出P值約為8.003×10-9。P值遠小于0.05,因此原假設不成立,初步認為該流域水沙聯合分布特征,在二維序列上具有顯著的相關性,有必要研究涇河流域水沙耦合關系,全面分析徑流量和泥沙量的內在關聯,健全水沙分布模型。
應用上文四個密度函數測試流域邊緣分布參數值,徑流量分布密度函數及概率密度函數見圖2。
圖2 徑流量分布密度函數及概率密度函數
輸沙量分布密度函數及概率密度函數見圖3。
圖3 輸沙量分布密度函數及概率密度函數
參照上圖,采用K-S 檢驗法對水沙聯合邊緣分布特征進行假設,擇取最優(yōu)邊緣分布數據。結果表明,該流域從預設的四種水沙聯合分布特征中的P值均大于0.05,與原假設設定相符,初步認為該結論驗證原假設,意味著徑流量和輸沙量最優(yōu)擬合狀態(tài)均屬于正態(tài)分布趨勢。
本研究采用蒙特卡洛統計理論,分析分布特征計算的不確定性。抽調多例樣本,采用重復抽樣法,判斷不確定性對水沙聯合設計的影響。具體流程為:基于Copula函數聯合分布模型總體架構,調取二維樣本,用蒙特卡洛統計法隨機模擬1 000 次;應用觀測值的水沙聯合分布模型相同估算參數方法,模擬樣本聯合分布模型,得到1 000 組數據,評估置信水平下的估計區(qū)間;所有數據中,以20 a 為重現期起始點,按照10 a 一梯度上升到100 a,判斷最大可能組合的水沙聯合設計值。
信息熵可描述隨機變量的分散程度,是信息最為基本的組成單位。常規(guī)條件下,信息熵可針對一維數據,也可應對多維情況,將測的數據定義為聯合信息熵。由于信息熵可作為判斷變量的重要依據,可認為信息熵越大隨機變量的分散程度越大,也就是不確定性越明顯。
測驗過程中,需解決識別問題。從本質上講,不確定性理論發(fā)展迭代了傳統優(yōu)參識別系統。為尋得最有可靠模型參數,不確定思想在統計學基礎上可通過大量參數分布獲取更具現實意義的結論。采用蒙特卡洛統計法研究不確定性,獲取模型參數置信水平下的參考范圍,為理解水沙聯合模型提供了技術支撐。
根據表1,張家山站水沙聯合分布模型存在明顯的不確定性,聯合分布參數變幅高達55.64%。據此繪制“或”重現期等值線圖(見圖4),根據圖中克制,涇河流域水沙聯合分布模型給出不同程度徑流量和輸沙量遭遇組合的重現期。工程中多選用“或”重現期作為風險控制參量,或安全評價標準。通過計算泥沙頻率和洪水頻率組合,確定流域不同時段的最大或最小淤積量。水沙聯合重現期與設計值是否準確決定著流域工程是否經濟、安全且科學,既關乎周邊生態(tài),還關乎工程社會效益。設計過程中需合理評估設計標準,降低誤差值,求解最優(yōu)解,為工程合理建設提供參考。
表1 水沙聯合分布模型參數估計區(qū)間
圖4 等值線圖
針對信息熵,可將其作為評價不確定性的指標,信息熵與不確定呈正相關關系。張家山站聯合設計值存在明顯的不確定性,在重現期影響下,聯合熵呈現明顯增加的趨勢(需要重現表述),意味著聯合設計值具有顯著的不可控性。
考慮到涇河流域水土流失嚴重的問題,建立了水沙聯合分布模型,對水沙組合潛在風險進行評估,從中尋求最優(yōu)解。隨后基于蒙特卡洛方法對分布模型的不確定性進行評估,計算百年內重現期的最大可能組合下的最優(yōu)設計值,并分析其信息熵。結果表明,涇河流域水沙聯合分布模型及水沙聯合設計值存在高度不確定性(需要重現表述),意味著涇河流域設計值面臨巨大挑戰(zhàn),在重現期年限增長的同時,設計值不確定性將進一步提升,將對水工建設提出更高的要求。