李小蘭,曾獻(xiàn)奎,王 棟,吳吉春
(南京大學(xué)地球科學(xué)與工程學(xué)院,江蘇南京 210023)
水文模型是定量描述水文過(guò)程和認(rèn)識(shí)水文要素響應(yīng)機(jī)制的重要工具。隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,分布式水文模型受到廣泛重視,已在全球范圍內(nèi)的水資源、水環(huán)境與水生態(tài)領(lǐng)域得到成功應(yīng)用[1]。隨著流域水安全問(wèn)題受到越來(lái)越多的關(guān)注,大尺度水文模擬成為流域水問(wèn)題綜合整治的重要工具。通常情況下,大尺度水文模擬是指研究空間尺度面積大于10 000 km2或長(zhǎng)度大于100 km的水文模擬[2],其具有水文過(guò)程復(fù)雜、模型運(yùn)行耗時(shí)長(zhǎng)、參數(shù)多等特點(diǎn)。參數(shù)識(shí)別是進(jìn)行水文模擬的重要環(huán)節(jié),通常需多次調(diào)用水文模型,如幾千至幾萬(wàn)次,而大尺度水文模擬運(yùn)行一次一般需幾小時(shí)至幾天,從而導(dǎo)致嚴(yán)重的計(jì)算負(fù)荷問(wèn)題[3]。
替代模型是指具有和原始模型幾乎相同的模擬精度并且運(yùn)行時(shí)間可以忽略不計(jì)的模型,用于替代原始的水文模型,是解決水文模擬參數(shù)識(shí)別計(jì)算耗時(shí)問(wèn)題的有效手段。替代模型方法已廣泛用于水文領(lǐng)域,如水文模型的校正、多目標(biāo)優(yōu)化、參數(shù)敏感性分析[4]、不確定性分析[5]。本次研究選擇當(dāng)前主要的3種替代模型方法,如稀疏網(wǎng)格(Sparse Grid,SG)、Elman-NN、RBF-NN,以長(zhǎng)江流域上游水文模擬為案例,從替代成本、替代精度等方面系統(tǒng)對(duì)比分析了不同替代模型方法的特點(diǎn)。研究成果可為大尺度水文模擬的替代模型的構(gòu)建及參數(shù)識(shí)別過(guò)程提供參考。
VIC(Variable Infiltration Capacity)模 型 是 由Liang 等[6]開(kāi)發(fā)的基于物理機(jī)制的大尺度分布式水文模型,已廣泛應(yīng)用于全球范圍內(nèi)的徑流模擬、氣候變化影響和水文變異性研究。該模型將空間分布網(wǎng)格化,每個(gè)網(wǎng)格具有對(duì)應(yīng)的地表高程、土壤性質(zhì)、植被覆蓋、降水、氣溫等信息。VIC 模型的模擬過(guò)程分為產(chǎn)流和匯流2 個(gè)階段,產(chǎn)流階段每個(gè)網(wǎng)格獨(dú)立計(jì)算天氣、土壤、地形、植被綜合作用下的徑流和基流,匯流階段將各個(gè)網(wǎng)格的徑流深轉(zhuǎn)化成流域出口斷面流量。
稀疏網(wǎng)格(Sparse Grid,SG)技術(shù)是一種基于Smolyak 規(guī)則的分層拉格朗日插值算法,最早由Smolyak在1963年提出[7]。SG的基本原理為在參數(shù)分布空間生成插值節(jié)點(diǎn),再進(jìn)行拉格朗日插值。
1.2.1 維數(shù)局部自適應(yīng)稀疏網(wǎng)格
維數(shù)局部自適應(yīng)稀疏網(wǎng)格(Dimensional Adaptive-Local Adaptive-SG,LA-DA-SG)是維數(shù)自適應(yīng)和局部自適應(yīng)的耦合技術(shù)[8]。維數(shù)自適應(yīng)的原理是不斷找出對(duì)替代對(duì)象有顯著影響的級(jí)數(shù)向量,并生成對(duì)應(yīng)的插值節(jié)點(diǎn),但當(dāng)目標(biāo)函數(shù)變化區(qū)域集中在較小參數(shù)空間區(qū)域時(shí)效率較低。局部自適應(yīng)的原理是不在已滿足替代精度的父節(jié)點(diǎn)生成子節(jié)點(diǎn),其對(duì)于線性程度高的區(qū)域效率高,但不能考慮不同維度級(jí)數(shù)向量的敏感性。因此,將兩種自適應(yīng)方法耦合可以顯著提高替代模型的構(gòu)建效率。DALA-SG 的應(yīng)用步驟是先對(duì)替代對(duì)象進(jìn)行維數(shù)自適應(yīng),再對(duì)生成的插值節(jié)點(diǎn)進(jìn)行局部自適應(yīng)。
1.2.2 優(yōu)化自適應(yīng)稀疏網(wǎng)格
優(yōu)化自適應(yīng)稀疏網(wǎng)格(optimized-DA-LA-SG,O-DA-LA-SG)是在DA-LA-SG 基礎(chǔ)上,將RPSO(斥力粒子群優(yōu)化)算法用于識(shí)別替代對(duì)象的關(guān)鍵區(qū)(如極值區(qū)),進(jìn)行針對(duì)性的SG插值節(jié)點(diǎn)分布,利用RPSO獲取的極值點(diǎn)來(lái)定義極值區(qū)域的范圍。
替代對(duì)象f(x)的極大值區(qū)域Γδ可表示為
式中:δ為閾值,一般取0.001;Γ為參數(shù)x的分布空間;maxx∈Γf(x)為f(x)的最大值。
使用O-DA-LA-SG 技術(shù)構(gòu)建替代模型的過(guò)程包括初期和后期2 個(gè)階段,在初期不啟動(dòng)優(yōu)化算法RPSO,即相當(dāng)于DA-LA-SG 技術(shù)。當(dāng)全局替代誤差超過(guò)某個(gè)閾值后進(jìn)入后期,開(kāi)始啟動(dòng)RPSO 程序并搜尋替代對(duì)象的極值區(qū)域,分區(qū)實(shí)行局部自適應(yīng)操作。在極值區(qū)域外設(shè)置較低的局部自適應(yīng)標(biāo)準(zhǔn),在極值區(qū)域內(nèi)設(shè)置較高的局部自適應(yīng)標(biāo)準(zhǔn),進(jìn)一步優(yōu)化SG替代模型的節(jié)點(diǎn)分布,從而提高替代效率。
神經(jīng)網(wǎng)絡(luò)(Neural Net,NN)是由大量神經(jīng)元即節(jié)點(diǎn)相互連接、相互傳遞構(gòu)成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),是一種模仿生物神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型。每個(gè)節(jié)點(diǎn)代表一個(gè)輸出函數(shù),稱為激勵(lì)函數(shù)。
1.3.1 拉丁超立方抽樣方法
采用拉丁超立方抽樣(Latin Hypercube Sampling,LHS)方法來(lái)獲取神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。LHS 是一種多維分層采樣方法,LHS 方法從變量x(x1,x2,…,xi,…,xn)(1≤i≤n)中抽取樣本的過(guò)程如下。
(1)根據(jù)各變量的分布區(qū)間以及概率密度函數(shù),將每個(gè)向量分量的子空間劃分為m個(gè)不相交的層空間;
(2)根據(jù)各個(gè)變量的概率密度函數(shù),從各個(gè)變量的獨(dú)立層空間中隨機(jī)抽取一個(gè)樣本,每個(gè)變量獲得m個(gè)樣本;
(3)各變量xi抽取的m個(gè)樣本之間隨機(jī)組成1個(gè)m組n維樣本,共獲得(m!)n-1種組合方式;
(4)從(m!)n-1種組合方式中以特定的方式篩選出指定數(shù)量的樣本組合。
1.3.2 Elman神經(jīng)網(wǎng)絡(luò)
Elman神經(jīng)網(wǎng)絡(luò)(Elman-Neural Net,Elman-NN)是一種動(dòng)態(tài)遞歸神經(jīng)網(wǎng)絡(luò),其包含4層結(jié)構(gòu),分別是輸入隱、隱含層、承接層和輸出層。其中輸入層和輸出層均為1 層,隱含層和承接層的層數(shù)一致且可設(shè)置為多層。承接層用來(lái)記憶隱含層前一時(shí)刻的輸出值,從而使網(wǎng)絡(luò)具有適應(yīng)變化的能力,增加了網(wǎng)絡(luò)的全局穩(wěn)定性。隱含層的輸出通過(guò)承接層自聯(lián)到隱藏層的輸入,使其對(duì)歷史數(shù)據(jù)具有記憶性,從而進(jìn)行動(dòng)態(tài)建模[9]。
1.3.3 RBF 神經(jīng)網(wǎng)絡(luò)
RBF神經(jīng)網(wǎng)絡(luò)(Radial basis function-Neural Net,RBF-NN)是一種高效多層前饋神經(jīng)網(wǎng)絡(luò),運(yùn)算速度快,具有較強(qiáng)的非線性映射能力。RBF-NN 可以進(jìn)行局部調(diào)整、相互覆蓋接受域的局部逼近,同時(shí)訓(xùn)練方法快速易行,克服了局部最優(yōu)問(wèn)題,這些優(yōu)點(diǎn)使得RBF 神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于很多領(lǐng)域,如分類、模型識(shí)別以及信號(hào)處理等領(lǐng)域。
RBF-NN結(jié)構(gòu)主要包含3層,即輸入層、隱含層和輸出層,輸入層到隱含層之間沒(méi)有權(quán)值連接,輸入向量直接被反饋到隱含層,通過(guò)激活函數(shù)進(jìn)行非線性映射。RBF-NN的激活函數(shù)是具有多變量插值功能的徑向基函數(shù)。徑向基函數(shù)是一種沿徑向?qū)ΨQ的標(biāo)量函數(shù),是表示樣本到數(shù)據(jù)中心之間的徑向距離的單調(diào)函數(shù),如高斯函數(shù)。隱含層到輸出層之間有權(quán)值連接,為線性映射關(guān)系,即輸出層的結(jié)果是隱含層結(jié)果的線性加權(quán)和。
(1)相對(duì)均方根誤差NRMSE
相對(duì)均方根誤差NRMSE的計(jì)算式為
式中:n為測(cè)試點(diǎn)的數(shù)量;yi和y?i分別為第i(i=1,2,…,n)個(gè)測(cè)試點(diǎn)的原始模型輸出值和替代模型輸出值;|f|max為所有測(cè)試點(diǎn)替代模型輸出的最大絕對(duì)值,NRMSE越小表示替代模型的精度越高。
(2)決定系數(shù)R2
決定系數(shù)R2的計(jì)算式為
式中:n為測(cè)試點(diǎn)的數(shù)量;yi和y?i分別為第i(i=1,2,…,n)個(gè)測(cè)試點(diǎn)的原始模型輸出值和替代模型輸出值;yˉ和y?ˉ分別表示測(cè)試點(diǎn)的原始模型和替代模型輸出值的平均值;R2值為0 到1 之間,越接近1 表示替代模型精度越高。
本次研究選擇長(zhǎng)江源頭至干流寸灘站的區(qū)域?yàn)檠芯繀^(qū),面積約95萬(wàn)km2,范圍約為90.5°E~108.5°E、25.0°N~36.0°E,屬于長(zhǎng)江流域上游區(qū)域。本研究將建立該區(qū)域的VIC 水文模型,進(jìn)行替代模型方法的對(duì)比研究。
高程數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云平臺(tái)的“SRTMDEMUTM 90M 分辨率數(shù)字高程數(shù)據(jù)產(chǎn)品”。氣象數(shù)據(jù)包括日降水量、最高氣溫、最低氣溫和風(fēng)速數(shù)據(jù)等4項(xiàng),本次研究使用區(qū)域內(nèi)氣象站(1961—1975年)氣象數(shù)據(jù)。土壤參數(shù)數(shù)據(jù)包括飽和導(dǎo)水系數(shù)、田間持水量、土壤水?dāng)U散系數(shù)等多個(gè)用來(lái)代表土壤質(zhì)地類型、土壤顆粒配比的參數(shù),本文中的土壤參數(shù)數(shù)據(jù)來(lái)自空間分辨率為5′的全球土壤數(shù)據(jù)庫(kù)。植被覆蓋數(shù)據(jù)包括植被類型數(shù)目、比例、根系分布和逐月葉面積指數(shù)(LAI),這些數(shù)據(jù)采用陸面覆蓋類型資料。
2.3.1 流域提取及網(wǎng)格剖分
根據(jù)研究區(qū)的數(shù)字高程數(shù)據(jù)和研究區(qū)內(nèi)的水文站點(diǎn)坐標(biāo),借助ARCGIS 軟件,依次通過(guò)填洼、流向計(jì)算、匯流累積、捕捉傾瀉點(diǎn)來(lái)提取研究流域范圍。模型單元格剖分大小設(shè)置為0.5°×0.5°,研究區(qū)總共被劃分為324個(gè)網(wǎng)格。
2.3.2 模型輸入
氣象輸入數(shù)據(jù)包括研究區(qū)內(nèi)每個(gè)網(wǎng)格1961—1975 年逐日的降水、最高氣溫、最低氣溫和風(fēng)速數(shù)據(jù)。采用反距離加權(quán)法將原始?xì)庀髷?shù)據(jù)插值到0.5°×0.5°網(wǎng)格單元。土壤數(shù)據(jù)輸入包含各網(wǎng)格的土壤參數(shù),其中大多數(shù)參數(shù)可以直接獲取或通過(guò)計(jì)算獲取,如水力系數(shù)、飽和導(dǎo)水率、田間持水量、凋萎含水率。其中,深層土壤深度、可變下滲曲線方程的冪指數(shù)、基流最大流速、非線性基流產(chǎn)生的因子值和非線性基流產(chǎn)生時(shí)最大土壤含水量因子等參數(shù)為待識(shí)別參數(shù)。植被覆蓋輸入數(shù)據(jù)包括各網(wǎng)格的植被覆蓋種類數(shù)目、各種類植被覆蓋比例、葉面積指數(shù)等信息。根據(jù)Maryland 大學(xué)全球1 km的陸面覆蓋類型資料,計(jì)算各個(gè)網(wǎng)格內(nèi)的植被類型及其在網(wǎng)格內(nèi)所占的比例。
本次案例分析中,VIC 模型的待識(shí)別參數(shù)包括可變下滲曲線方程的冪指數(shù)b、基流最大流速Dsmax、非線性基流產(chǎn)生的因子值Ds、非線性基流產(chǎn)生時(shí)土壤含水量因子Ws、第二層土壤厚度D2、第三層土壤厚度D3 共6 個(gè)參數(shù),參數(shù)的識(shí)別范圍如表1所示。
表1 待識(shí)別的VIC參數(shù)及其分布范圍
通過(guò)貝葉斯方法(如MCMC 等)識(shí)別模型參數(shù)的概率分布時(shí),需要計(jì)算參數(shù)的似然函數(shù)L,用于搜索參數(shù)的概率分布空間,計(jì)算式為
式中:y為觀測(cè)數(shù)據(jù);θ為模型的待識(shí)別參數(shù);f(θ)為模型模擬值;n為觀測(cè)數(shù)據(jù)的個(gè)數(shù);∑為觀測(cè)誤差的協(xié)方差矩陣;| |∑為其行列式。
因此,本次研究所建立的替代模型為6 個(gè)待識(shí)別參數(shù)θ與對(duì)應(yīng)似然函數(shù)L的響應(yīng)關(guān)系。傳統(tǒng)方法是通過(guò)運(yùn)行水文模型f(θ)獲得模型輸出,進(jìn)而計(jì)算L(θ),而替代模型是直接構(gòu)建L(θ)~θ關(guān)系,省去運(yùn)行模型的環(huán)節(jié),從而解決模型運(yùn)行計(jì)算耗時(shí)問(wèn)題。
DA-LA-SG 替代模型的插值級(jí)數(shù)設(shè)置為L(zhǎng)=9,采用500個(gè)樣本測(cè)試替代模型的精度。替代模型的NRMSE和R2隨樣本數(shù)量的變化如圖1 所示,其中樣本數(shù)量表示用于構(gòu)建替代模型所需的運(yùn)行原始水文模型的次數(shù)。隨著替代成本的增加,替代精度逐漸升高,當(dāng)樣本數(shù)量為1 998 個(gè)時(shí),R2=0.9920,對(duì)應(yīng)的NRMSE=0.0134。
圖1 DA-LA-SG替代模型的相對(duì)均方根誤差和決定系數(shù)隨樣本數(shù)量的變化
O-DA-LA-SG 替代模型的插值級(jí)數(shù)設(shè)為L(zhǎng)=9,全局NRMSE≤0.025 時(shí)開(kāi)始啟動(dòng)優(yōu)化程序。替代模型的NRMSE和R2隨樣本數(shù)量的變化如圖2 所示,隨著替代成本的增加,替代精度在不斷升高,當(dāng)樣本數(shù)量為1 469 個(gè)時(shí),R2=0.9945,對(duì)應(yīng)的NRMSE=0.0115。
圖2 O-DA-LA-SG替代模型的相對(duì)均方根誤差和決定系數(shù)隨樣本數(shù)量的變化
利用LHS 方法抽取神經(jīng)網(wǎng)絡(luò)替代模型的訓(xùn)練樣本,參數(shù)范圍中每次抽取10 個(gè)樣本點(diǎn),連續(xù)抽取200 次,總共抽取2 000 個(gè)點(diǎn)作為訓(xùn)練樣本。Elman-NN 替代模型的NRMSE和R2隨樣本數(shù)量的變化如圖3 所示,隨著替代成本的增加,替代精度在不斷升高。當(dāng)樣本數(shù)量達(dá)到790 個(gè)時(shí),R2= 0.9936,對(duì)應(yīng)的NRMSE=0.0143;當(dāng)樣本數(shù)量為1 205 個(gè)時(shí),R2=0.9971,對(duì)應(yīng)的NRMSE=0.0095;當(dāng)樣本數(shù)量為1 695 個(gè)時(shí),R2=0.9982,對(duì)應(yīng)的NRMSE=0.0075。
圖3 Elman-NN替代模型的相對(duì)均方根誤差和決定系數(shù)隨樣本數(shù)量的變化
RBF-NN 替代模型的樣本抽樣同Elman-NN,其NRMSE和R2隨樣本數(shù)量的變化如圖4 所示,隨著用于替代模型構(gòu)建的樣本增加,前期替代精度迅速升高,后期替代精度變化趨于平緩。當(dāng)樣本數(shù)量為850 個(gè)時(shí),R2=0.96628,對(duì)應(yīng)的NRMSE=0.0275;當(dāng)樣本數(shù)量為1 950 個(gè)時(shí),R2=0.9752,對(duì)應(yīng)的NRMSE=0.0236。
圖4 RBF-NN替代模型的相對(duì)均方根誤差和決定系數(shù)隨樣本數(shù)量的變化
圖5所示為DA-LA-SG、O-DA-LA-SG、Elman-NN和RBF-NNp這4種方法對(duì)于長(zhǎng)江流域上游水文模擬替代模型表現(xiàn)的對(duì)比。從圖5 中可以看出,當(dāng)樣本數(shù)較少時(shí)(如400 個(gè)),RBF-NN 替代模型的替代誤差降低最快,DA-LA-SG與O-DA-LA-SG替代模型的誤差相對(duì)RBF-NN 較大,Elman-NN 替代模型的誤差降低最慢。當(dāng)樣本數(shù)較大時(shí)(如1 000個(gè)),Elman-NN 替代模型的誤差快速降低,最先達(dá)到目標(biāo)精度NRMSE=0.01,所需的替代成本最少;O-DALA-SG 達(dá)到替代精度所需的成本小于DA-LA-SG,兩者達(dá)到目標(biāo)精度NRMSE=0.01 時(shí)的成本均小于RBF-NN。
圖5 4種替代模型的替代精度對(duì)比
本次研究以長(zhǎng)江流域上游大尺度水文模擬為案例,系統(tǒng)對(duì)比分析了DA-LA-SG、O-DA-LA-SG、Elman-NN、RBF-NN等4種常見(jiàn)的替代模型方法。
(1)在樣本數(shù)量相對(duì)較小的條件下,針對(duì)水文模擬替代模型的精度,隨著樣本數(shù)增加,RBF-NN替代模型的誤差降低最快,DA-LA-SG 與O-DA-LASG 替代模型的誤差下降速度居中,Elman-NN 替代模型的誤差降低最慢。
(2)在樣本數(shù)量相對(duì)較多的條件下,針對(duì)水文模擬替代模型的精度,RBF-NN 替代模型的誤差降低相對(duì)平緩,O-DA-LA-SG替代模型的誤差逐漸小于DA-LA-SG 替代模型,并優(yōu)于RBF-NN,Elman-NN替代模型的誤差降低相對(duì)最快。
(3)根據(jù)實(shí)際條件下水文模擬的計(jì)算耗時(shí)特征,判斷所能承擔(dān)的用于構(gòu)建替代模型的成本,從而選擇相應(yīng)最合適的替代模型方法,解決水文模擬參數(shù)識(shí)別中的計(jì)算耗時(shí)問(wèn)題。