張 超 姜景山
(南京工程學院 建筑工程學院, 南京 211167)
流域水文模型是由描述流域降雨徑流形成過程的各函數(shù)構成的一種物理結構或概念性結構,或者說是通過一組耦合函數(shù)關系及相應參數(shù)來模擬流域降雨徑流形成過程的一種結構,模型結構的合理性和參數(shù)的優(yōu)化和選擇一定程度上決定了模型模擬和預報的精度[1-2].然而,水文模型一般是比較復雜的高維、非線性模型,模型參數(shù)存在自相關,互相關,模型的響應面是多峰的,目標函數(shù)在參數(shù)空間內(nèi)往往不連續(xù),且是非凸的,因此,概念性流域水文模型參數(shù)優(yōu)選一直是水文界的重點和難點問題[3-4].
目前流域水文模型參數(shù)優(yōu)選的方法主要有兩類:人工率定(如試錯法)和計算機自動優(yōu)選[5].由于人工率定方法缺乏客觀性且需足夠的經(jīng)驗,近年來,伴隨計算機技術的迅速發(fā)展,計算機自動優(yōu)選方法因其彌補了人工率定方法過程中工作人員缺乏經(jīng)驗、費時費力等不足,得到了廣泛應用,例如下降單純形法[6]、模式搜索法[7]等局部優(yōu)化算法,遺傳算法[8-9]、粒子群優(yōu)化算法[10-12]等全局優(yōu)化算法.另外,郭俊,周建中,周超,等[13]針對傳統(tǒng)單一目標水文模型參數(shù)優(yōu)化率定中存在的挖掘不充分缺陷,提出了一種多目標文化混合差分進化算法,用于解決水文模型參數(shù)多目標優(yōu)化的問題.Duan等[14-15]于1992年提出SCE(Shuffled Complex Evolution)方法,并于1993年對其進行了修正,稱為SCE-UA方法.該方法結合了單純形法、隨機搜索和生物競爭進化等方法的優(yōu)點,使其在解決全局優(yōu)化問題方面更加有效、靈活、穩(wěn)健,被認為是非線性復雜模型參數(shù)優(yōu)選最有效的方法之一,在國內(nèi)外連續(xù)型水文模型參數(shù)優(yōu)選中應用廣泛[16-18].因此,為了進一步探索概念性流域水文模型參數(shù)自動優(yōu)化率定和預報精度問題,本文基于三水源新安江模型,在給定理想徑流資料定義的基礎上,采用應用SCE-UA算法分別就理想徑流資料和實際徑流資料的情況下,資料長度選擇對新安江模型參數(shù)自動化率定優(yōu)選的影響進行研究.
SCE-UA算法就是將全局搜索看作為一個自然界中生物不斷進化的過程.隨機生成s個點構成一個群體,將這個群體分成幾個部落,然后各個部落單獨進化.部落里的每個個體都有可能成為繁殖下一代的父代個體,從部落里選取幾個父代個體構成一個父輩群體,這些父輩群體就像一對父母,唯一與父母不同的就是父輩群體里的成員個數(shù)可能多于兩個.為了保證繁殖進化過程的競爭性,在選取父輩群體時采用了概率分布的方法,使得較好的父代個體更容易加入到繁殖下一代的過程.之后用生成的較好的子代個體代替父輩群體中的最差的父代個體構成新的父輩群體,完成一次進化.每個部落在經(jīng)過幾次進化后,就重新混合構成新的群體.定時地將各個部落重新混合在一起,保證了各個部落間的信息共享及信息的不退化性,加強了群體的生存延續(xù)性.
1)初始化.假定待優(yōu)化問題是n維問題,選取參與進化的復合型個數(shù)p和每個復合型所包含的頂點數(shù)m,計算樣本點數(shù)目s.
2)生成樣本點.在可行的參數(shù)空間區(qū)域隨機產(chǎn)生s個樣本點x1,x2,…,xs,并分別計算每一點xi的函數(shù)值fi=f(xi),其中i=1,…,s.在未知全局最優(yōu)點的大體位置先驗信息的情況下,可采用均勻概率分布隨機產(chǎn)生樣本點.
3)樣本點排序.把s個樣本點(xi,fi)按函數(shù)值升序排列,排序后仍記為(xi,fi),其中,f1≤f2≤…≤fs,記D={(xi,fi),i=1,…,s}.
5)進化每個復合型.按照競爭的復合型進化算法(CCE)分別進化各個復合型Ak,k=1,…,p.
6)混合復合型.把進化后的每個復合型A1,…,Ap依序放入D中,表示為D={Ak,k=1,2,…,p},并將D中所有點按函數(shù)值升序排列,排序后仍記為D.
7)收斂性判斷.如果滿足收斂準則則停止,否則返回第(4)步.
在參數(shù)的可行域空間內(nèi)隨機生成樣本點,保證了樣本點選擇的全局性,同時也保證了優(yōu)化結果的全局性.由前述可知,優(yōu)化問題之所以復雜,原因之一就是“收斂區(qū)域”可能不止一個,而將所有樣本點劃分為多個組合,就恰好保證了在可行域空間的多個方向都可以進行自由搜索;將所有的組合重新混合使得各組合之間可以共享搜索路徑的信息,確保算法繼續(xù)生存.
選用長江三峽區(qū)間沿渡河流域作為研究區(qū)域,集水面積為601 km2.流域坡度較大,平均坡度為2.87‰,高程垂直落差達2 800 m,山高坡陡,人類活動影響較?。饔騼?nèi)降水豐沛,流域多年平降雨量為1 337 mm,全年雨量以5-9月最多,約占全年68%.流域內(nèi)最大年降雨量為2 448.2 mm,最小年降雨量為808.4 mm.流域內(nèi)徑流主要來自于降雨,每年4-10月為汛期,年最大洪峰流量多出現(xiàn)在5-7月,且頻率較高.流域內(nèi)山高坡陡,谷深河窄,洪水匯流迅速,洪水陡漲陡落,為典型的山區(qū)性河流.水文氣象資料選用1981-1987年的歷史資料,基本情況見表1~2.
表1 流域1981-1987年基本情況
表2 流域1981-1987年各年資料統(tǒng)計
根據(jù)流域水文模型參數(shù)的物理意義及研究流域的特征,在參數(shù)搜索空間內(nèi)(見表3)隨機生成參數(shù)組,將其作為沿渡河流域新安江模型的參數(shù)“真值”,然后利用該組真值及該流域的實測降雨、蒸發(fā)資料,采用新安江模型計算得出相應的徑流資料,即稱為該流域的理想資料,以此進行新安江模型參數(shù)優(yōu)化率定研究,可以排除輸入、輸出觀測誤差和模型結構誤差對參數(shù)優(yōu)化率定的影響.
表3 新安江模型參數(shù)物理意義及參數(shù)搜索區(qū)間
SCE-UA算法參量包括單個復合型包含的點數(shù)m、子復合型包含的點數(shù)q、每個子復合型產(chǎn)生的可執(zhí)行的后代個數(shù)α、單個復合型進化次數(shù)β、復合型個數(shù)p共5個.SCE-UA算法的有效性受到算法參數(shù)取值的影響,根據(jù)Duan[7]的研究,算法的4個參數(shù)均采用缺省值(Default values),即m=2n+1、q=n+1、α=1、β=2n+1(n為待優(yōu)化參數(shù)的個數(shù)),可以滿足算法高效全局性搜索的條件.
理想資料情況下,對SCE-UA算法參數(shù)p分別取值1、2、4和10進行新安江模型參數(shù)優(yōu)化率定的研究,結果見表4.
表4 算法參量p不同取值時的新安江模型參數(shù)優(yōu)選結果
由表4可以看出SCE-UA算法參量p的取值依賴于待優(yōu)化問題的維數(shù).應用該算法,當p=1或p=2時,基本上搜索不到參數(shù)真值.隨著p取值的增大,如當p=4或p=10時,除個別不敏感參數(shù)如C外,大部分參數(shù)可以搜索到真值.說明在所需優(yōu)化問題的維數(shù)較高的情況下,復合型的個數(shù)p的取值應適當加大.當采用理想資料進行參數(shù)優(yōu)化時,取p>4就基本可以滿足需要.
在參數(shù)搜索空間內(nèi)隨機生成1組新安江模型參數(shù),然后用這組參數(shù)及沿渡河流域1981-1985年連續(xù)5年的逐日面雨量生成連續(xù)5年的理想資料,以此分析理想資料情況下,資料長度對參數(shù)優(yōu)化率定的影響,結果見表5.
表5 采用1年、3年、5年理想資料的參數(shù)尋優(yōu)結果
從表5可以看出,除參數(shù)C外,對于多數(shù)參數(shù),無論采用1年、連續(xù)3年還是連續(xù)5年的理想資料,優(yōu)化率定的結果都與真值相符.說明在算法參量取值合理的情況下,若不存在模型結構及實測資料誤差的影響,則SCE-UA算法基本可以搜索到模型參數(shù)的真值,并且在理想資料情況下,SCE-UA算法的尋優(yōu)結果與資料長度無關.此處參數(shù)C難以搜索到真值,可能因為深層蒸散發(fā)系數(shù)C決定于深根植物的覆蓋面積,對于濕潤地區(qū)很少用到深層蒸發(fā),所以C值不敏感,反應遲鈍,難以搜索到參數(shù)真值,這說明不敏感參數(shù)會干擾參數(shù)的優(yōu)化率定.
為更清晰地展現(xiàn)各參數(shù)的尋優(yōu)過程,根據(jù)表5中1年、3年、5年理想資料的尋優(yōu)結果,作出部分參數(shù)的尋優(yōu)過程圖,如圖1所示.
圖1 SCE-UA算法理想資料情況模型部分參數(shù)尋優(yōu)過程圖
圖中參數(shù)值均進行如公式(x-xmin)/(xmax-xmin)=xnew的歸一化處理,使得參數(shù)均處于[0,1]區(qū)間,便于多參數(shù)統(tǒng)一顯示.
由圖1可以看出,采用SCE-UA算法率定新安江模型參數(shù)時,對于理想資料,不論資料年限長短,參數(shù)最終基本都能收斂,即排除資料的輸入、輸出觀測誤差和模型結構誤差的理想資料情況的參數(shù)尋優(yōu)結果與資料的長度無關.同時可看出,部分參數(shù)在目標函數(shù)的收斂過程中仍有較長時間的波動,較不容易達到穩(wěn)定,如WUM,WLM等.參數(shù)KI雖在中間一段較長時期內(nèi)一直趨于平穩(wěn),但到后期有波動跡象.參數(shù)C在尋優(yōu)過程中呈現(xiàn)不規(guī)則震蕩,始終未能收斂.再次說明,不敏感參數(shù)及參數(shù)間的相關性將是影響參數(shù)優(yōu)化率定的重要原因.
將SCE-UA算法結合實測資料優(yōu)化率定新安江日模參數(shù),采用沿渡河流域1981-1987年共7年實測水文氣象資料作為優(yōu)化率定所用資料系列,設定計算均循環(huán)10次,若10次均收斂至同組參數(shù),則認為算法收斂至最優(yōu)值,結果見表6.
不同長度的實測資料部分參數(shù)不及機率累積分布曲線如圖2所示,圖中縱坐標CDF(Cumulative Distribution Function)表示各參數(shù)不及機率累積值,橫坐標表示的是參數(shù)的取值.垂直的點線表示的是采用1981-1987年實際資料率定的最優(yōu)參數(shù)取值,“1年”表示采用1年資料率定的最優(yōu)參數(shù),“2年”、“3年”依次類推.
由表6可以看出,實際資料不同年限長度(如1年、2年或3年)的參數(shù)優(yōu)化率定結果各不相同,即使同樣年限長度資料的所有可能情況,如1年實際資料的7種情況、連續(xù)2年實際資料的6種情況或連續(xù)3年實際資料的5種情況所優(yōu)化率定的參數(shù)結果也各不相同.由圖2可以看出,部分參數(shù)不及機率累積分布曲線隨研究資料長度的增加有逐步趨向由7年資料率定的最優(yōu)參數(shù)值靠攏的趨勢,即實際資料情況下的參數(shù)優(yōu)化率定隨資料長度的增加逐漸趨于穩(wěn)定.
表6 采用1年、2年、3年實測資料的參數(shù)尋優(yōu)結果
圖2 對應于計算資料不同年限的部分參數(shù)不及機率累積分布曲線
概念性流域水文模型由于結構復雜參數(shù)眾多,在實際應用中的一個很大的問題就是模型參數(shù)的率定識別和預報精度的要求.本次將SCE-UA算法結合沿渡河流域三水源新安江模型,分析徑流資料的長度對新安江模型參數(shù)優(yōu)選的影響.發(fā)現(xiàn)理想徑流資料情況下,資料的長度對模型參數(shù)優(yōu)選沒有影響,不論徑流資料年限長短,除個別不敏感參數(shù)外,參數(shù)最終基本都能收斂;在實際徑流資料的情況下,參數(shù)優(yōu)化率定隨徑流資料長度的增加有向最優(yōu)值靠攏的趨勢,認為輸入、輸出觀測誤差和模型結構誤差是導致模型參數(shù)優(yōu)選不確定性的重要原因.