李彬楠,樊貴盛
(太原理工大學(xué)水利科學(xué)與工程學(xué)院,太原 030024)
土壤水分特征曲線是土壤水吸力與含水率的關(guān)系曲線,反映土壤水?dāng)?shù)量與能量的關(guān)系。針對土壤水分特征曲線國內(nèi)外的專家學(xué)者們進(jìn)行了大量的研究,趙雅瓊[1]等研究了土體的粒徑狀況對土壤水分特征曲線的影響;譚霄[2]等分析土壤鹽分對水分特征曲線的影響,分析得到隨著含鹽量的增加偏移幅度減少且鹽分種類對土壤水分特征曲線的影響沒有明顯規(guī)律;高慧嫣[3]等對重土壤、中土壤和輕土壤等5種不同質(zhì)地土壤的水分特征曲線進(jìn)行比較分析,得到了其土壤水分特征曲線及其參數(shù)的變化規(guī)律。同時專家們也提出不少表征土壤水分特征曲線的模型,常用經(jīng)驗(yàn)?zāi)P陀蠫ardner模型[4]、Gardner-Russo模型[5]、Frdlund and Xing模型[6]、Van-Genuchten模型[7]等。目前由于Van-Genuchten模型適用于多種質(zhì)地的土壤、模型穩(wěn)定性強(qiáng)、預(yù)測精度高,因此被人們廣泛應(yīng)用。
1995年Cortes等人提出支持向量機(jī),是基于統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理。支持向量機(jī)有其特有的優(yōu)勢,因此在諸多領(lǐng)域中被廣泛應(yīng)用。李曉婷[8]等運(yùn)用支持向量機(jī)模型進(jìn)行土壤重金屬污染評價并與Hakanson指數(shù)法和內(nèi)梅羅綜合污染指數(shù)的評價結(jié)果進(jìn)行對比,得到支持向量機(jī)的評價結(jié)果更為準(zhǔn)確;劉文霞[9]等討論了基于相似日的支持向量機(jī)電動汽車日負(fù)荷預(yù)測方法,結(jié)果表明與其他預(yù)測方法相比,此法具有較高的預(yù)測精度和穩(wěn)定性;黃化堅[10]采用支持向量機(jī)計算高土石壩壩坡穩(wěn)定可靠度,結(jié)果表明該方法簡便,精確度高,實(shí)用性強(qiáng),結(jié)果具有較高的工程應(yīng)用價值。但是,鮮有文獻(xiàn)運(yùn)用支持向量機(jī)對土壤水分特征曲線進(jìn)行預(yù)測,因此本文借助此方法建立以黃土高原區(qū)土壤基本理化參數(shù)為輸入變量,以土壤水分特征曲線Van-Genuchten模型參數(shù)為輸出變量的支持向量機(jī)預(yù)測模型,為研究土壤水分特征曲線提供了更多的理論基礎(chǔ)。
試驗(yàn)區(qū)域位于山西省交城縣、臨縣及離石區(qū)等多個縣區(qū)。試驗(yàn)區(qū)的土壤質(zhì)地、干容重、有機(jī)質(zhì)、全鹽量等土壤理化參數(shù)指標(biāo)豐富多樣,建模的數(shù)據(jù)庫具有代表性,選取試驗(yàn)點(diǎn)的土壤理化參數(shù)見表1。
表1 試驗(yàn)區(qū)內(nèi)各項土壤理化參數(shù)表
(1)試驗(yàn)測定項目:土壤質(zhì)地、容重、有機(jī)質(zhì)含量、全鹽量、土壤水分特征曲線的測定。
(2)主要試驗(yàn)器械:1500F型壓力膜儀(美國制)、Rise-2022型激光粒度分析儀、化學(xué)試驗(yàn)器材。
(3)試驗(yàn)方法:土壤質(zhì)地使用激光粒度分析儀測定;人為配制1.0~1.7 g/cm310個不同梯度的密度;有機(jī)質(zhì)含量用重鉻酸鉀容量法進(jìn)行測定;鹽分用化學(xué)法進(jìn)行測定;土壤水分特征曲線使用壓力膜儀測定,將裝有土樣的環(huán)刀放到壓力膜儀中,加入水使土樣吸水飽和,24 h以后對進(jìn)行土樣飽和含水率的測定。然后按照0.3、0.6、1、3、6、8、12和15 bar壓力值對土樣進(jìn)行加壓,土樣由于受壓將水排出,并且每隔同樣的時間測定土樣的重量。8個壓力值完成后測定干容重值并計算體積含水率,最終獲得不同水吸力值下的土壤含水率得到土壤水分特征曲線的模型參數(shù)。
土壤水分特征曲線Van-Genuchten模型結(jié)構(gòu)如下:
(1)
式中:θ為體積含水率;θs為飽和含水率;θr為殘余含水率,m3/m3;h為壓力水頭,m;m、n是曲線形狀參數(shù),m=1-1/n。n表示曲線的坡度,當(dāng)n較小時曲線較緩;當(dāng)n較大時曲線較陡。α是與進(jìn)氣值有關(guān)的參數(shù),m-1,表示土壤進(jìn)氣值大小,一般黏土進(jìn)氣值較大,砂土的進(jìn)氣值較小,甚至接近于0。
通過土壤水分特征曲線試驗(yàn),研究土壤基本理化參數(shù)與模型參數(shù)之間的單因素影響,分析得知土壤質(zhì)地、容重、有機(jī)質(zhì)、全鹽量對Van-Genuchten模型參數(shù)α與參數(shù)n具有明顯的影響。
(1)參數(shù)α影響因素分析。參數(shù)α表示土壤初始排水的難易程度。土壤質(zhì)地的差異性表現(xiàn)在土壤體系孔隙狀況的不同,隨著黏粒含量的增加土壤水吸力增強(qiáng),土壤初始排水的難度逐漸增大;土壤密度的變化是由土壤孔隙和土壤固體決定的,大孔隙越少中小孔隙越多土壤的密度越大,則土壤初始排水的難度增大;土壤有機(jī)質(zhì)影響土壤膠體與結(jié)構(gòu)狀況,土壤吸水能力隨其含量的增加而增強(qiáng),導(dǎo)致土壤初始排水的難度增大;土壤鹽分影響著土壤水吸力的大小,鹽分含量越高水吸力越強(qiáng),使得土壤初始排水的難度增大。
(2)參數(shù)n影響因素分析。參數(shù)n表示土壤水分特征曲線的坡度情況。土壤質(zhì)地越重其黏粒含量越多,進(jìn)氣吸力值隨之減小,土壤水分特征曲線彎曲度小從而坡度變緩;土壤容重增加土壤的結(jié)構(gòu)更加緊實(shí),從而影響進(jìn)氣吸力值使得曲線坡度變?。煌寥烙袡C(jī)質(zhì)和鹽分的含量引起土壤水吸力的變化,水吸力越大土壤初始排水越難,最終導(dǎo)致土壤水分特征曲線的坡度變緩。
綜上可知,土壤質(zhì)地、干密度、有機(jī)質(zhì)和全鹽量對參數(shù)α、n都有影響,所以以黏粒含量、粉粒含量、干密度、有機(jī)質(zhì)含量、全鹽量5個因子作為預(yù)測模型的輸入?yún)?shù)。 根據(jù)上文所述可知Van-Genuchten模型有4個參數(shù),飽和含水率和殘余含水率可以通過室內(nèi)實(shí)驗(yàn)獲取,但經(jīng)驗(yàn)參數(shù)α、n不可以,從而采取土壤傳輸函數(shù)法獲得,由此確定輸出參數(shù)為參數(shù)α、n。
Xi(i=1,2,3,…,n),Xi∈Rm為輸入的訓(xùn)練樣本;Yi(i=1,2,3,…,n),Y∈R為輸出的對應(yīng)期望。兩類樣本被一個超平面徹底分開,最優(yōu)超平面的形式表示如下:
Y=f(x)=ωφ(X)+p
(2)
引入不敏感損失函數(shù)ε,運(yùn)用離差分析對最優(yōu)超平面進(jìn)行求解,當(dāng)ε大于誤差值時,則誤差小可忽略不計;引入松弛變量ξ與ξ*,目的是預(yù)防個別數(shù)據(jù)影響模型偏差;引入懲罰因子C,懲罰偏離模型的樣本數(shù)據(jù),因此最優(yōu)超平面可轉(zhuǎn)換成式(3)和式(4)求解最小值的問題:
(3)
(4)
(5)
(6)
將公式(6)聯(lián)立求解,引入非線性核函數(shù)得到支持向量機(jī)的回歸函數(shù)。常用的核函數(shù)包括Sigmoid核函數(shù)、多項式核函數(shù)和高斯核函數(shù),本文采取第三種即高斯核函數(shù)來建立預(yù)測模型,其形式表現(xiàn)如下:
(7)
結(jié)合式(6)和式(7),最終確定最優(yōu)超平面的形式如式(8)所示。
(8)
式中:K(x,xi)為支持向量機(jī)高斯核函數(shù)。
在支持向量機(jī)回歸算法中,參數(shù)取值的選擇十分重要,直接決定了模型的泛化能力和預(yù)測精度。懲罰因子C和核參數(shù)g是影響支持向量機(jī)學(xué)習(xí)能力的主要參數(shù)。
懲罰因子C的值和可容忍誤差相關(guān),是樣本誤差與結(jié)構(gòu)風(fēng)險的折中。C值愈大允許誤差愈小,且數(shù)據(jù)擬合度愈高但可能過擬合;C值愈小允許誤差愈大,則可能不符合訓(xùn)練與預(yù)測精度的標(biāo)準(zhǔn)。核參數(shù)g與學(xué)習(xí)樣本的輸入空間范圍相關(guān),其值隨輸入空間范圍的增大而增大。本文采用網(wǎng)格搜索法對兩個參數(shù)的取值進(jìn)行優(yōu)化。最終選取C=20,g=20。
以80組數(shù)據(jù)作為建模樣本進(jìn)行訓(xùn)練,利用支持向量機(jī)模型對參數(shù)α進(jìn)行預(yù)報訓(xùn)練, 其實(shí)測值與預(yù)測值對比分析見表2和圖1。
表2 模型參數(shù)α預(yù)測結(jié)果與誤差檢驗(yàn)
圖1 模型參數(shù)α擬合效果圖
從表2和圖1可知,參數(shù)α的實(shí)測值與預(yù)測值之間的誤差較小,相對誤差的最大值為24.74%,最小值為0.33%,平均相對誤差為3.94%,R2=0.985 3,除個別實(shí)測值有較大的誤差以外,其余的實(shí)測值均取得了理想的預(yù)測值,說明基于支持向量機(jī)建立的模型參數(shù)α具有較高的精確度。從擬合效果圖來看,參數(shù)α的建模樣本取得良好的預(yù)測效果。
對參數(shù)n的80組建模樣本采取同樣的程序進(jìn)行預(yù)測,其實(shí)測值與預(yù)測值對比分析見表3和圖2。
表3 模型參數(shù)n預(yù)測結(jié)果與誤差檢驗(yàn)
圖2 模型參數(shù)n擬合效果圖
從表3和圖2可以看出,參數(shù)n的實(shí)測值與預(yù)測值之間的誤差小,其中相對誤差的最大值僅為7.67%,最小值為0.13%,平均相對誤差為1.69%,R2=0.986 8。說明支持向量機(jī)模型對參數(shù)n的預(yù)測精度高。從擬合效果圖來看,參數(shù)n的建模樣本訓(xùn)練效果好,具有理想的預(yù)測效果。同時,對比參數(shù)α和參數(shù)n建模樣本的精確度和擬合效果,發(fā)現(xiàn)參數(shù)n精確度更高,模型擬合效果也更好。
(1)參數(shù)α檢驗(yàn)樣本精度分析。用預(yù)留的8組數(shù)據(jù)樣本檢驗(yàn)本文所建立的支持向量機(jī)預(yù)測模型的精確度,獲得Van-Genuechten模型參數(shù)α驗(yàn)證樣本的相對誤差分析見表4和圖3。
表4 參數(shù)α驗(yàn)證樣本相對誤差表
圖3 參數(shù)α驗(yàn)證樣本擬合效果圖
對參數(shù)α的檢驗(yàn)樣本進(jìn)行誤差分析,從表4和圖3可知,相對誤差的最大值為8.51%,最小值為1.61%,平均相對誤差為3.65%,R2=0.992,驗(yàn)證樣本比建模樣本的平均相對誤差3.94%還要小,結(jié)果說明建立的支持向量機(jī)模型具有較高的精確度以及良好的預(yù)測效果。因本文采用的建模樣本以及驗(yàn)證樣本均是小樣本數(shù)據(jù),且Van-Genuechten模型參數(shù)α與土壤基本理化參數(shù)之間有著高度的非線性關(guān)系,從而達(dá)到了高精確度和理想的預(yù)測效果。因此,在本文所建立的支持向量機(jī)模型下,參數(shù)α與土壤基本理化參數(shù)之間的土壤傳輸函數(shù)是可行的,且該模型用來預(yù)測小樣本及非線性問題具有很大的優(yōu)勢。
(2)參數(shù)n檢驗(yàn)樣本精度分析。同樣用預(yù)留的8組數(shù)據(jù)樣本檢驗(yàn)參數(shù)n在本文建立的支持向量機(jī)模型下的預(yù)測精度,最終預(yù)測結(jié)果與相對誤差分析見表5和圖4。
表5 參數(shù)n驗(yàn)證樣本相對誤差表
圖4 參數(shù)n驗(yàn)證樣本擬合效果圖
從表5中可以看出,參數(shù)n的驗(yàn)證樣本相對誤差的最大值為5.90%,最小值為0.30%,平均相對誤差為1.29%,R2=0.951 3,檢驗(yàn)樣本比建模樣本的相對誤差值要小,說明在建立的支持向量機(jī)模型下,參數(shù)n的預(yù)測精度高且驗(yàn)證結(jié)果良好。
通過比對參數(shù)n、α的預(yù)測精度,發(fā)現(xiàn)參數(shù)n具有更高的精確度。綜合分析原因可能是參數(shù)n的變化范圍相對較小,其均處于同一數(shù)量級即1~2之間,而參數(shù)α基本是小于1的數(shù),其最大值和最小值可相差一個數(shù)量級,容易受到輸入?yún)?shù)即土壤基本理化參數(shù)的影響,導(dǎo)致波動較為明顯,因此參數(shù)n的預(yù)測精度比參數(shù)α的高,穩(wěn)定性也更強(qiáng)。
(1)建立以土壤黏粒含量、粉粒含量、密度、有機(jī)質(zhì)、全鹽量為輸入?yún)?shù),Van-Genuchten模型參數(shù)α和n為輸出參數(shù)的支持向量機(jī)模型,同時對所建模型的精度和擬合效果進(jìn)行比較和分析,結(jié)果表明Van-Genuchten模型參數(shù)支持向量機(jī)的預(yù)測模型具有優(yōu)異的預(yù)測效果。其中,從建模樣本來看,參數(shù)α平均相對誤差為3.94%,參數(shù)n平均相對誤差為1.69%;從檢驗(yàn)樣本來看,參數(shù)α平均相對誤差3.65%,參數(shù)n平均相對誤差1.29%,結(jié)果表明Van-Genuchten模型參數(shù)α、n的預(yù)測精度均較高,說明運(yùn)用支持向量機(jī)模型預(yù)測小樣本和非線性問題是可行的。
(2)在支持向量機(jī)模型中,對樣本數(shù)據(jù)進(jìn)行預(yù)測時個別數(shù)據(jù)出現(xiàn)較大的誤差,綜合分析造成誤差的原因如下:樣本數(shù)據(jù)庫容量的大小,建立模型時對于支持向量機(jī)核函數(shù)的選擇等眾多影響因素有關(guān)。此后,在此基礎(chǔ)上對于支持向量機(jī)模型的建立進(jìn)行不斷的優(yōu)化已解決可能出現(xiàn)的問題,以便達(dá)到預(yù)期的預(yù)測效果,更加符合實(shí)踐活動中的實(shí)際狀況。