晏 凱, 吳佳曄, 張應(yīng)遷, 楊 露
(1.四川輕化工大學(xué)管理學(xué)院,自貢 643000;2.四川升拓檢測(cè)技術(shù)股份有限公司,自貢 643000;3.四川輕化工大學(xué)土木工程學(xué)院,自貢 643000;4.東北林業(yè)大學(xué)土木工程學(xué)院,哈爾濱 150000)
邊坡穩(wěn)定性問(wèn)題一直是邊坡工程的一項(xiàng)重要研究?jī)?nèi)容[1]。而邊坡工程是一個(gè)不確定的、非線性的復(fù)雜的系統(tǒng)[2],目前國(guó)內(nèi)外存在的邊坡安全監(jiān)測(cè)技術(shù)也是多種多樣。如2010年P(guān)ieraccini等[3]、Barla等[4]、Gischig等[5]最早采用了GB-In SAR對(duì)邊坡的變形進(jìn)行監(jiān)測(cè)研究;2012年阮志新等[6]利用測(cè)斜儀對(duì)高速公路邊坡進(jìn)行了監(jiān)測(cè)并證明了監(jiān)測(cè)的正確性;2013年王志勇等[7]利用In SAR技術(shù)對(duì)北京房山地區(qū)的滑坡進(jìn)行了監(jiān)測(cè);以及2015年徐茂林等[8]利用TM30對(duì)鞍山市某露天礦邊坡位移進(jìn)行了監(jiān)測(cè)實(shí)驗(yàn),實(shí)現(xiàn)了自動(dòng)化監(jiān)測(cè),等等。這些邊坡工程監(jiān)測(cè)方法大多都用于邊坡變形分析,由此推斷研究邊坡變形對(duì)分析邊坡穩(wěn)定性意義重大。
土體深層水平位移是邊坡變形監(jiān)測(cè)中的重要指標(biāo)之一。本文嘗試運(yùn)用ARIMA模型[9]和霍爾特-溫特斯方法[10],對(duì)土體深層水平位移的歷史數(shù)據(jù)進(jìn)行短期預(yù)測(cè)和實(shí)證研究,并對(duì)結(jié)果加以比較,分析兩種方法的優(yōu)劣。
在長(zhǎng)期的邊坡變形過(guò)程中,監(jiān)測(cè)的土體深層水平位移值是隨季節(jié)周期變化,并存在一定增長(zhǎng)(或降低)趨勢(shì)的非平穩(wěn)時(shí)間序列。傳統(tǒng)的預(yù)測(cè)方法如回歸模型、k-最近鄰分類的IBK模型等適用于平穩(wěn)時(shí)間序列,對(duì)該類值的預(yù)測(cè)結(jié)果并不理想[11]。而由Box和Jenkins提出來(lái)的自回歸求和滑動(dòng)平均模型(ARIMA模型),是將非平穩(wěn)時(shí)間序列先經(jīng)過(guò)d階差分平穩(wěn)化,再對(duì)得到的平穩(wěn)時(shí)間序列利用自回歸[autoregressive, AR(p) process]和滑動(dòng)平均過(guò)程[moving average, MA(q) process],并通過(guò)樣本自相關(guān)系數(shù)(autocorrelation coefficient, ACF)和偏自相關(guān)系數(shù)(partial autocorrelation coefficient, PCF)等數(shù)據(jù)對(duì)建立的模型進(jìn)行辨識(shí),同時(shí)還提出了一整套的建模、估計(jì)、檢驗(yàn)和控制方法[12];其次Holt-Winters預(yù)測(cè)方法,由于它可以同時(shí)處理趨勢(shì)和季節(jié)性變化[13],并能適當(dāng)?shù)剡^(guò)濾隨機(jī)波動(dòng)的影響。因此選用ARIMA模型和Holt-Winters預(yù)測(cè)方法來(lái)預(yù)測(cè)具有季節(jié)性波動(dòng)和趨勢(shì)性增長(zhǎng)(或減少)的非平穩(wěn)時(shí)間序列問(wèn)題,并對(duì)結(jié)果進(jìn)行比較分析。
實(shí)驗(yàn)的邊坡土體深層水平位移值數(shù)據(jù)來(lái)源于四川升拓檢測(cè)股份有限公司的SQLsever數(shù)據(jù)庫(kù),與之相關(guān)邊坡工程項(xiàng)目為茂縣石大關(guān)鄉(xiāng)拴馬村梯子槽滑坡監(jiān)測(cè)項(xiàng)目。SQLsever數(shù)據(jù)庫(kù)是美國(guó)Microsoft公司設(shè)計(jì)的一個(gè)為分布式服務(wù)器計(jì)算的、高性能的、可擴(kuò)展的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)。
由于數(shù)據(jù)采集設(shè)備故障和外界環(huán)境等原因,導(dǎo)致了部分時(shí)間點(diǎn)的采集數(shù)據(jù)出現(xiàn)缺失。因此為降低預(yù)測(cè)誤差,故選取監(jiān)測(cè)數(shù)據(jù)值連續(xù)而穩(wěn)定的時(shí)間段來(lái)進(jìn)行預(yù)測(cè)實(shí)驗(yàn)。
隨機(jī)選取監(jiān)測(cè)項(xiàng)目中某個(gè)土體深層水平位移監(jiān)測(cè)點(diǎn)的500~650個(gè)數(shù)據(jù)。之所以選500~650個(gè)有兩個(gè)原因:一是如果數(shù)據(jù)取的太少就無(wú)法充分挖掘原序列中的信息,而選取數(shù)據(jù)過(guò)多又會(huì)因序列前后間隔太長(zhǎng),使前期數(shù)據(jù)與后期預(yù)測(cè)數(shù)據(jù)關(guān)聯(lián)性變?nèi)?,而造成不必要的?jì)算量;二是查閱諸多相關(guān)的時(shí)間序列預(yù)測(cè)文獻(xiàn),若對(duì)季度數(shù)據(jù)(m=4,按1年4個(gè)季度循環(huán))實(shí)證分析的原始序列個(gè)數(shù)在50~100,月度數(shù)據(jù)(m=12,按1年12個(gè)月循環(huán))的個(gè)數(shù)在250~350,因此對(duì)時(shí)度數(shù)據(jù)(m=24,按1天24小時(shí)循環(huán))實(shí)證分析的原始序列個(gè)數(shù)可取在500~650。
最終選取從2018年8月15日0:00~2018年9月10日23:00的“X軸”方向的所有整點(diǎn)數(shù)據(jù)構(gòu)成“H”數(shù)據(jù)集及序列{Ht},數(shù)據(jù)量為648,見(jiàn)圖1。從圖1中可以發(fā)現(xiàn),“序列{Ht}是明顯的有確定性趨勢(shì)又有周期性的時(shí)間序列。
圖1 “H”數(shù)據(jù)集的序列圖Fig.1 The sequence diagram of the “H” dataset
設(shè){Ht}為平穩(wěn)時(shí)間序列且均值為零,則ARMA(1,1)的1階自回歸1階滑動(dòng)平均模型公式可表述為
Ht=φHt-1+et-θet-1
(1)
故ARMA(p,q)公式[14]表述為
Ht-φ1Ht-1-…-φpHt-p=et-θ1et-1-…-θqet-q
(2)
式(1)可簡(jiǎn)寫為
φ(B)Ht=θ(B)et
(3)
式(3)中:et表示白噪聲參數(shù),t=1, 2, …,p;φ表示自回歸系數(shù);θ表示回歸參數(shù)。在模型ARIMA(p,d,q)中,d代表差分階數(shù)。因?yàn)檫吰卤O(jiān)測(cè)項(xiàng)目中,土體深層水平位移的時(shí)間序列數(shù)據(jù)普遍都是不平穩(wěn)的,使序列平穩(wěn)的途徑有很多,差分就是其中之一,且ARIMA模型差分后的建模過(guò)程幾乎與ARMA相同。
表1 一階差分序列的單位根檢驗(yàn)
注:AIC全稱AIC信息準(zhǔn)則,于1973年由日本統(tǒng)計(jì)學(xué)家赤池弘次提出,又稱赤池(Akaike)信息準(zhǔn)則[15]; SC指的是施瓦茨(Schwartz)準(zhǔn)則,又稱貝葉斯信息準(zhǔn)則(BIC); HQ指的是漢南-奎因(Hannan-Quinn)準(zhǔn)則[16]。
依據(jù)上述“三準(zhǔn)則”,AIC、SC、HQ小的較優(yōu),則由表1的單位根檢驗(yàn)結(jié)果,判斷該序列為存在既無(wú)截距項(xiàng)又無(wú)趨勢(shì)項(xiàng)的單位根過(guò)程。
由表2可以看出一階差分的ADF檢驗(yàn)的T統(tǒng)計(jì)值的絕對(duì)值為18.577 4,遠(yuǎn)大于顯著性水平為0.05時(shí)的T統(tǒng)計(jì)值1.942,則存在一個(gè)單位根的原假設(shè)成立;其次P也很小。這均說(shuō)明原序列的一階差分序列是平穩(wěn)的,因此d=1。
表2 一階差分序列(無(wú)截距、無(wú)趨勢(shì))的ADF檢驗(yàn)
從圖2可以清晰地看到,DH的時(shí)序圖圍繞一個(gè)常數(shù)值上下波動(dòng),且波動(dòng)區(qū)間不大;又從圖3中可看出,自相關(guān)系數(shù)迅速衰減趨于0。綜合所述,一階差分后原序列是平穩(wěn)的,不再進(jìn)行二階差分檢驗(yàn)。
圖2 “H”數(shù)據(jù)集的一階差分時(shí)序圖Fig.2 The first-order difference sequence diagram of the “H” dataset
圖3 一階差分自相關(guān)圖Fig.3 The first-order differential autocorrelation graph
從圖3中可清晰地看到,P都小于0.05且接近于0,則原序列是非白噪聲的,存在一定相關(guān)性,并有規(guī)律可循。在滯后階數(shù)(lag)為4以后,偏自相關(guān)系數(shù)迅速趨近于0,初步判斷一階差分序列為偏自相關(guān)的4階截尾,可試著擬合AR(4)模型;在lag=5時(shí),偏自相關(guān)系數(shù)處于2倍標(biāo)準(zhǔn)差的置信帶邊緣,可嘗試擬合AR(5)模型。而在lag=1時(shí),自相關(guān)系數(shù)顯著不為零,在lag=2、8時(shí),它又處于2倍標(biāo)準(zhǔn)差的置信帶邊緣,則可試著去擬合MA(1)、MA(2)和MA(8)模型。因此可以初步擬合的模型有ARIMA(4,1,1)、ARIMA(5,1,1)等。最后由模型定階發(fā)現(xiàn),p可能等于4,q可能等于1、2、8,表3、表4分別是各個(gè)擬合模型的估計(jì)結(jié)果和預(yù)測(cè)參數(shù)對(duì)比情況。
依據(jù)P小于顯著性水平0.05且越小結(jié)果越顯著(模型較優(yōu))的判斷原則,比較表3中c、ar(p)、ma(q)的P大小,綜合得出ARIMA(3,1,1)模型最優(yōu)。
先根據(jù)“三準(zhǔn)則”,AIC、SC、HQ小的較優(yōu),對(duì)表4中各模型的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行比較,得出ARIMA(3,1,1)有兩項(xiàng)最小(SC、HQ);又依據(jù)F分布原則,F(xiàn)-statistics大的較優(yōu), ARIMA(3,1,1)的F統(tǒng)計(jì)量顯然最大,P也小于顯著性水平0.05。因此綜合判斷ARIMA(3,1,1)為最優(yōu)擬合模型。
表3 方程的P比較
注:c表示常數(shù);ar表示自回歸過(guò)程,括號(hào)內(nèi)表示滯后階數(shù);ma表示滑動(dòng)平均過(guò)程,括號(hào)內(nèi)表示滯后階數(shù)。
表4 各種模型的精度指標(biāo)對(duì)比
模型ARIMA(3,1,1)的公式推導(dǎo)[9,14]如下:
因?yàn)椋?/p>
(4)
又:
(5)
(6)
在式(1)兩邊同時(shí)乘以以(6)得:
(7)
系數(shù)代入式(7)得出ARMA(3,1)模型的公式為
Wt=0.000 061+0.381 209wt-1+0.147 211wt-2+
(8)
又令Wt=Ht-Ht-1,得ARIMA(3,1,1)模型的公式為
(Ht-Ht-1)+0.381 209(Ht-2-Ht-1)+
0.147 211(Ht-3-Ht-2)+0.127 094(Ht-4-
(9)
在確定ARMA模型參數(shù)的估計(jì)值后,為了驗(yàn)證擬合模型的適應(yīng)性,還需進(jìn)行診斷檢驗(yàn)。運(yùn)用Eviews時(shí)間序列分析軟件建立殘差的自相關(guān)圖,對(duì)殘差進(jìn)行純隨機(jī)性檢驗(yàn),圖4是ARIMA(3,1,1)的殘差自相關(guān)檢驗(yàn)結(jié)果。
圖4 ARMA(3,1,1)模型的殘差相關(guān)圖Fig.4 Residual correlation graph of the ARMA(3,1,1) model
從圖4中可以看到,自相關(guān)函數(shù)值幾乎都在0.95的置信區(qū)域內(nèi);其次,P都大于0.05,則表明殘差為白噪聲且是純隨機(jī)性的;又從ARIMA(3,1,1)模型擬合圖(圖5)中看出,擬合效果好。綜合判斷,擬合的ARIMA(3,1,1) 模型有效。
圖5 ARMA(3,1,1)模型的擬合圖Fig.5 The fitting graph of the ARMA(3,1,1) model
為驗(yàn)證擬合模型的適用性,現(xiàn)用模型ARIMA(3,1,1)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見(jiàn)圖6,可以看出該模型的預(yù)測(cè)效果較理想。
圖6 序列靜態(tài)預(yù)測(cè)圖Fig.6 The sequence static forecasting graph
又將預(yù)測(cè)值存放在DH序列中,作出DH和DHF預(yù)測(cè)擬合圖,見(jiàn)圖7。從圖7中可以看出,該模型的預(yù)測(cè)效果較好。
圖7 靜態(tài)預(yù)測(cè)擬合圖Fig.7 The static forecasting fitting graph
現(xiàn)由在DHF中已有的預(yù)測(cè)值,利用模型ARIMA(3,1,1)的公式可反推出第一期預(yù)測(cè)值,又將預(yù)測(cè)值整合到原序列,同樣的過(guò)程可得出第二期預(yù)測(cè)值,以此類推直到得出m(m=24)期,具體結(jié)果見(jiàn)表6。
Holt-Winters預(yù)測(cè)方法的基本思想是把具有線性趨勢(shì)、季節(jié)變動(dòng)和隨機(jī)波動(dòng)的時(shí)間序列進(jìn)行分析研究,并與指數(shù)平滑法結(jié)合,分別對(duì)長(zhǎng)期趨勢(shì)、趨勢(shì)的增量和季節(jié)波動(dòng)做出估計(jì),然后建立預(yù)測(cè)模型,外推預(yù)測(cè)值[17]。Holt-Winters季節(jié)模型包含加法模型、乘法模型[18]。
Holt-Winters乘法模型的預(yù)測(cè)外推公式為
y′t+h=(at+hbt)st+h-m
(10)
a、b、s的計(jì)算公式如下:
at=α(yt/st-m)+(1-α)(at-1+bt-1)
(11)
bt=β(at-at-1)+(1-β)bt-1
(12)
st=γ[yt/(at-1-bt-1)]+(1-γ)st-m
(13)
為了預(yù)測(cè)更小時(shí)間周期的數(shù)據(jù)集,在乘法模型的基礎(chǔ)上,添加延伸系數(shù)φ;再通過(guò)指數(shù)平滑法變換得到阻尼Holt-Winters模型的預(yù)測(cè)外推公式,如下:
y′t+h=[at+(φ+φ2+…+φh)bt]st+h-m
(14)
式中:a表示截距;b表示趨勢(shì);s表示阻尼模型的季節(jié)因子;t表示預(yù)測(cè)時(shí)間,且t=1,2,…,m;h表示平滑期數(shù),h>0;m表示周期長(zhǎng)度,例如,對(duì)于季度數(shù)據(jù)取4,月度數(shù)據(jù)取12。因?qū)嶒?yàn)數(shù)據(jù)間隔為小時(shí),循環(huán)一次要24個(gè)采集數(shù)據(jù),故取m=24。
a、b、s的計(jì)算公式如下:
at=α(yt/st-m)+(1-α)(at-1+φbt-1)
(15)
bt=β(at-at-1)+(1-β)φbt-1
(16)
st=γ[yt/(at-1-φbt-1)]+(1-γ)st-m
(17)
式中:α、β、γ為阻尼因子,也稱平滑系數(shù),在0~1之間取值。
為了檢驗(yàn)數(shù)據(jù)進(jìn)行預(yù)測(cè)研究的可行性,利用OriginPro,對(duì)“H”數(shù)據(jù)集進(jìn)行離散分析,得到如圖8的相鄰時(shí)刻數(shù)據(jù)散點(diǎn)圖。
圖8 “H”數(shù)據(jù)集的散點(diǎn)圖Fig.8 The distribution point diagram of the “H” dataset
利用WEKA數(shù)據(jù)挖掘軟件,讓?duì)痢ⅵ?、γ在[0,1]的區(qū)間內(nèi)進(jìn)行精度為小數(shù)點(diǎn)后兩位的等值迭代運(yùn)算,且預(yù)測(cè)誤差=|實(shí)際值-預(yù)測(cè)值|/實(shí)際值×100%,得出:當(dāng)α=0.03、β=0.03、γ=0.03時(shí),“H”數(shù)據(jù)集的平均預(yù)測(cè)誤差最小,為1.69%。
再分析平滑系數(shù)α、β、γ對(duì)預(yù)測(cè)誤差的影響大小(α、β、γ的系統(tǒng)默認(rèn)值都為0.2)。由表5可以發(fā)現(xiàn),對(duì)于“H”數(shù)據(jù)集,當(dāng)β為默認(rèn)值時(shí),平均預(yù)測(cè)誤差變化最大,約為0.75%,因此推斷改變?chǔ)伦钣锌赡芴岣哳A(yù)測(cè)精度。
表5 平滑系數(shù)的影響分析
根據(jù)以上分析結(jié)果,對(duì)“H”數(shù)據(jù)集,擬定α、γ為不變量,β為變量,分析預(yù)測(cè)結(jié)果得出:當(dāng)β=0.04時(shí),最小預(yù)測(cè)誤差約為1.68%,見(jiàn)圖9。
圖9 “H”數(shù)據(jù)集的預(yù)測(cè)誤差變化曲線Fig.9 The change curve in forecasting error of the “H” dataset
綜上所述,當(dāng)取α=0.02、β=0.03、γ=0.03時(shí),“H”數(shù)據(jù)集的平均預(yù)測(cè)誤差最小,為1.53%,具體預(yù)測(cè)結(jié)果見(jiàn)表6。
因?yàn)锳RIMA模型和Holt-Winters方法對(duì)長(zhǎng)期預(yù)測(cè)存在局限性,這里只給出24期真實(shí)值與預(yù)測(cè)值的比較情況,如表6所示。
表6 兩種方法的預(yù)測(cè)結(jié)果及誤差
注:預(yù)測(cè)時(shí)間為“2018-09-11:00~2018-09-11:23”;方法1=ARIMA模型、方法2=Holt-Winters方法;預(yù)測(cè)誤差=(|實(shí)際值-預(yù)測(cè)值|/實(shí)際值)×100%;實(shí)際值數(shù)據(jù)來(lái)源于四川升拓檢測(cè)股份有限公司的SQLsever數(shù)據(jù)庫(kù)。
(18)
式(18)中:h1i和h′1i分別表示方法1的實(shí)際值和預(yù)測(cè)值;h2i和h′2i分別別表示方法2的實(shí)際值和預(yù)測(cè)值;i表示預(yù)測(cè)期數(shù),i=1, 2, …, 24;n=24。
從表6可以看出,兩種方法預(yù)測(cè)誤差都偏小,且平均預(yù)測(cè)誤差只有1.73%和1.53%;又從圖11中不難看出兩種方法的預(yù)測(cè)結(jié)果曲線與實(shí)際值曲線的變化趨勢(shì)基本吻合;這都足以說(shuō)明兩種方法對(duì)“H”數(shù)據(jù)集的短期預(yù)測(cè)精度都很高。
現(xiàn)將兩種方法的預(yù)測(cè)誤差比較發(fā)現(xiàn):雖然Holt-Winters方法的最大預(yù)測(cè)誤差(5.05%)大于ARIMA模型(4.69%),但在總體上,ARIMA模型有11期預(yù)測(cè)誤差大于2.22%,Holt-Winters方法只有5期,因此Holt-Winters方法短期預(yù)測(cè)效果更好,如圖10所示。
圖10 比較兩種方法的預(yù)測(cè)相對(duì)誤差Fig.10 Comparing relative errors of the two methods
然而,根據(jù)實(shí)際值的95%置信度,計(jì)算預(yù)測(cè)區(qū)間,可以得到兩種方法的預(yù)測(cè)曲線效果圖,見(jiàn)圖11。
圖11 兩種方法的預(yù)測(cè)結(jié)果曲線Fig.11 The curvilinear in forecasting results of the two methods
在圖11中,Holt-Winters方法盡管平均預(yù)測(cè)誤差更小,但預(yù)測(cè)區(qū)間所包含真實(shí)值的概率小于ARIMA模型(圖11中綠色矩形框標(biāo)記的Holt-Winters方法預(yù)測(cè)點(diǎn)在預(yù)測(cè)區(qū)間外),因此ARIMA模型短期預(yù)測(cè)更穩(wěn)定。
綜上所述,對(duì)于土體深層水平位移的短期預(yù)測(cè),兩種方法各有特點(diǎn)。
邊坡土體深層水平位移預(yù)測(cè)是一個(gè)充滿挑戰(zhàn)性的問(wèn)題,但時(shí)間序列預(yù)測(cè)一直被認(rèn)為是對(duì)具有趨勢(shì)性增長(zhǎng)(降低)和時(shí)變性波動(dòng)序列進(jìn)行統(tǒng)計(jì)預(yù)測(cè)的有效手段。利用ARIMA模型和Holt-Winters方法對(duì)土體深層水平位移進(jìn)行了預(yù)測(cè),可以為邊坡變形監(jiān)測(cè)與預(yù)警提供一定的依據(jù)。
ARIMA模型和Holt-Winters模型都屬于短期預(yù)測(cè)模型,隨著時(shí)間的推移,它們的預(yù)測(cè)效果也會(huì)逐漸變差[19]。從兩種方法的預(yù)測(cè)結(jié)果來(lái)看,短期預(yù)測(cè)效果都很好。其次通過(guò)分析其預(yù)測(cè)誤差和結(jié)果曲線發(fā)現(xiàn),兩種方法各具特點(diǎn):Holt-Winters方法的短期預(yù)測(cè)效果更好;ARIMA模型的短期預(yù)測(cè)結(jié)果更穩(wěn)定。又從實(shí)際操作來(lái)講,Holt-Winters方法簡(jiǎn)便,而ARIMA模型的建模過(guò)程較為煩瑣,并且在p和q的選擇存在很多評(píng)判標(biāo)準(zhǔn)。
總之,通過(guò)兩種時(shí)間序列短期預(yù)測(cè)方法的比較研究,希望其結(jié)果對(duì)邊坡治理人員加強(qiáng)邊坡安全治理和預(yù)防邊坡事故發(fā)生有幫助。另外也可考慮融合其他預(yù)測(cè)方法,加強(qiáng)對(duì)各種影響因素的關(guān)注,如邊坡自身結(jié)構(gòu)、天氣變化、工程施工等,常常這些不穩(wěn)定的因素對(duì)邊坡土體深層水平位移的長(zhǎng)期走勢(shì)也有著重要的應(yīng)用價(jià)值。