張仕森,孫憲坤,尹 玲,李世璽
(上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海201620)
全球定位系統(tǒng)(GPS)能夠反映出時(shí)間與地理位置的變化信息.通過對(duì)GPS時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè)能為環(huán)境和災(zāi)害的監(jiān)控等各方面工作帶來極大方便. 對(duì)得到的預(yù)測(cè)結(jié)果中的異常波動(dòng)進(jìn)行分析,可以盡可能在地質(zhì)災(zāi)害尚未發(fā)生時(shí)發(fā)出預(yù)警,減少人員傷亡和經(jīng)濟(jì)損失.
傳統(tǒng)的時(shí)間序列預(yù)測(cè)方法如帶控項(xiàng)的自回歸模型(CAR)、滑動(dòng)平均模型(MA)以及自回歸滑動(dòng)平均模型(ARMA)[1]等都屬于統(tǒng)計(jì)學(xué)范疇的線性模型,適用于季節(jié)性、周期性等特征平穩(wěn)的線性時(shí)間序列預(yù)測(cè). 對(duì)于非線性、非平穩(wěn)的GPS時(shí)間序列,由于線性模型不能全面反映時(shí)間序列的復(fù)雜變化特征,導(dǎo)致傳統(tǒng)的線性模型難以適用于這一類問題的預(yù)測(cè)[2]. 文獻(xiàn)[3]將自回歸求和滑動(dòng)平均模型(ARIMA)用于對(duì)非線性的GPS時(shí)序進(jìn)行建模預(yù)測(cè),ARIMA模型是將非線性序列轉(zhuǎn)化為線性序列的一種預(yù)測(cè)方法.雖然ARIMA模型的預(yù)測(cè)效果相對(duì)于傳統(tǒng)方法較好,但是它計(jì)算復(fù)雜、運(yùn)算量大,并且需要大量先驗(yàn)知識(shí)的儲(chǔ)備.
人工神經(jīng)網(wǎng)絡(luò)(ANN)作為一種非線性的數(shù)據(jù)預(yù)測(cè)方法,具有良好的自適應(yīng)能力,不需要先驗(yàn)知識(shí)的積累,因此更適合于實(shí)際工作中非線性時(shí)間序列的預(yù)測(cè)[4]. 文獻(xiàn)[5]運(yùn)用反向(BP)神經(jīng)網(wǎng)絡(luò),采用Levenberg-Marquardt算法進(jìn)行訓(xùn)練,對(duì)電力負(fù)荷數(shù)據(jù)進(jìn)行了預(yù)測(cè)研究. 但是該預(yù)測(cè)方法受到BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單和學(xué)習(xí)泛化能力較差的影響,難以達(dá)到很高的預(yù)測(cè)精度. 文獻(xiàn)[6]的研究表明循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNs)作為一種包含循環(huán)結(jié)構(gòu)的ANN,能夠結(jié)合時(shí)間序列過去時(shí)刻的信息,預(yù)測(cè)效果相對(duì)于結(jié)構(gòu)簡(jiǎn)單的BP神經(jīng)網(wǎng)絡(luò)更好,但是在實(shí)際應(yīng)用中存在著“梯度消亡問題”,導(dǎo)致訓(xùn)練速度慢、耗時(shí)長(zhǎng). 文獻(xiàn)[7]提出的長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)則是一種特殊的RNNs,能夠?qū)W習(xí)時(shí)序數(shù)據(jù)之間的長(zhǎng)期依賴關(guān)系,解決了RNNs中出現(xiàn)的梯度消亡問題[8],對(duì)于處理時(shí)間序列相關(guān)的問題有很好的效果.
由于測(cè)量誤差、人為操作等原因, 實(shí)際獲得的GPS時(shí)序數(shù)據(jù)含有一定噪聲,噪聲會(huì)弱化時(shí)間序列數(shù)據(jù)之間的相關(guān)性從而影響預(yù)測(cè)結(jié)果. 單一的神經(jīng)網(wǎng)絡(luò)模型無法處理噪聲問題,將神經(jīng)網(wǎng)絡(luò)與去噪算法結(jié)合變得越來越重要. 平滑去噪處理法容易導(dǎo)致信號(hào)失真、傅里葉變換濾噪法計(jì)算量大并且在有用信號(hào)和噪聲頻譜重疊部分去噪效果不好、卡爾曼濾波法則需要準(zhǔn)確的系統(tǒng)運(yùn)動(dòng)規(guī)律、維納濾波法僅適用于處理平穩(wěn)信號(hào),而小波變換因其具有多分辨率、低熵性、去相關(guān)性等特點(diǎn),在分析處理非線性信號(hào)方面具有明顯優(yōu)勢(shì)[9-10]. 在基于小波變換的去噪算法中,模極大值去噪法對(duì)小波分解尺度的選取要求很高,容易產(chǎn)生偽極值點(diǎn)或丟失某些局部奇異性;相關(guān)性去噪算法在信號(hào)邊界去噪效果穩(wěn)定,但其需要估計(jì)噪聲的方差,計(jì)算量較大. 文獻(xiàn)[11]證明小波閾值去噪算法適用于信號(hào)中含有白噪聲的情況,能夠很好地保留原始信號(hào)的重要特征,并且計(jì)算速度較快. 上述小波變換方法在信號(hào)去噪時(shí)通常采用Mallat[12]算法,這種方法計(jì)算復(fù)雜、對(duì)內(nèi)存占用高,在自身構(gòu)造和對(duì)信號(hào)進(jìn)行時(shí)頻轉(zhuǎn)換時(shí)需要耗費(fèi)大量的系統(tǒng)資源. 文獻(xiàn)[13]用提升小波變換對(duì)多普勒雷達(dá)信號(hào)實(shí)現(xiàn)了去噪處理,取得了良好的效果. 提升小波變換被稱為第二代小波變換,相對(duì)于傳統(tǒng)小波變換依賴于復(fù)雜卷積計(jì)算,提升小波變換的算法更加簡(jiǎn)潔、計(jì)算速度快、內(nèi)存占用低、實(shí)現(xiàn)簡(jiǎn)單,并且繼承了小波變換的多分辨率特性[14].
參考上述文獻(xiàn),綜合考慮到GPS時(shí)序數(shù)據(jù)的自身特性和各種小波變換方法的計(jì)算速度、資源占用等因素,本文將提升小波閾值降噪技術(shù)與LSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合,以時(shí)序數(shù)據(jù)自身為訓(xùn)練數(shù)據(jù)和輸出標(biāo)簽,充分利用降噪后數(shù)據(jù)之間的相關(guān)性,通過迭代訓(xùn)練的方式,建立GPS高程時(shí)序數(shù)據(jù)單步預(yù)測(cè)模型. 實(shí)驗(yàn)結(jié)果表明該模型減少了原始數(shù)據(jù)中噪聲對(duì)于預(yù)測(cè)結(jié)果的負(fù)面影響,提高了預(yù)測(cè)精度,并且該方法計(jì)算速度快、資源占用較少.
為了增強(qiáng)時(shí)序數(shù)據(jù)之間的相關(guān)性,本文利用提升小波閾值降噪算法對(duì)原始數(shù)據(jù)中含有的噪聲進(jìn)行剝離.提升小波變換是由Sweldens提出的一種小波變換的簡(jiǎn)化計(jì)算方法,由于它的分解與重構(gòu)部分結(jié)構(gòu)相同,因此可以降低運(yùn)算復(fù)雜度,減少系統(tǒng)資源占用,快速實(shí)現(xiàn)小波變換[15].
提升小波變換對(duì)信號(hào)的分解包括分裂(split)、預(yù)測(cè)(predict)、更新(update)三個(gè)過程.
提升小波首先將原始信號(hào)Sj按序號(hào)奇偶分為倆部分:偶數(shù)序列ej-1與奇數(shù)序列oj-1. 由于信號(hào)之間具有局部相關(guān)性,這樣某一點(diǎn)的信號(hào)值可以通過與其相鄰的信號(hào)值和適當(dāng)?shù)念A(yù)測(cè)算子計(jì)算出來,同時(shí)計(jì)算出來的誤差就是高頻系數(shù)dj-1,這個(gè)計(jì)算過程稱為預(yù)測(cè)環(huán)節(jié). 預(yù)測(cè)環(huán)節(jié)得到的高頻系數(shù)再通過更新算子U來調(diào)節(jié)信號(hào)的下采樣過程獲得低頻系數(shù)sj-1,這個(gè)過程則是更新環(huán)節(jié). 通過預(yù)測(cè)環(huán)節(jié)與更新環(huán)節(jié)可以得到信號(hào)的高頻部分和低頻部分.
人們的研究發(fā)現(xiàn),在小波域中,有效信號(hào)和噪聲具有不同的特性,噪聲的能量一般集中于高頻部分[16],因此小波降噪的核心內(nèi)容是對(duì)信號(hào)的高頻部分進(jìn)行過濾,以達(dá)到信噪分離的目的.
提升小波閾值降噪的具體處理過程為對(duì)原始信號(hào)進(jìn)行提升小波變換分解,得到信號(hào)高頻部分和低頻部分后,通過設(shè)定閾值的方式對(duì)高頻部分進(jìn)行非線性閾值處理.
本文采用的是Donoho提出的全局閾值法[17],其定義為
(1)
式中:thr為閾值;N為每層小波高頻系數(shù)序列的長(zhǎng)度值;median(·)為求中值函數(shù);σ為噪聲估計(jì)的標(biāo)準(zhǔn)差.
常用的閾值函數(shù)分為硬閾值函數(shù)和軟閾值函數(shù)[18]. 硬、軟閾值函數(shù)的表達(dá)式為式(2)、(3),函數(shù)曲線如圖1(a)、(b)所示.
(2)
(3)
(a)硬閾值函數(shù)特性圖 (b)軟閾值函數(shù)特性圖
(c)平滑型閾值函數(shù)特性圖圖1 不同閾值函數(shù)的特性圖
由于硬閾值函數(shù)在小波域內(nèi)不連續(xù),會(huì)在(±thr)閾值處產(chǎn)生間斷,從而會(huì)導(dǎo)致重構(gòu)后的信號(hào)出現(xiàn)偽吉布斯現(xiàn)象. 軟閾值函數(shù)則在小波域的連續(xù)性較好,但在閾值處理過的系數(shù)與原系數(shù)之間總是存在一個(gè)偏差值,造成部分高頻系數(shù)損失,從而導(dǎo)致重構(gòu)后的信號(hào)存在一定誤差.
平滑型閾值函數(shù)是針對(duì)軟閾值函數(shù)的一種改進(jìn),在軟閾值函數(shù)的基礎(chǔ)上對(duì)閾值點(diǎn)處建立一個(gè)平滑過渡區(qū),減少了高頻系數(shù)的損失,使得閾值處理后的信號(hào)更加符合信號(hào)的自然連續(xù)性. 平滑型閾值函數(shù)的表達(dá)式為式(4), 函數(shù)曲線如圖1(c)所示.
(4)
式中:thr為閾值;k為提升小波對(duì)信號(hào)的分解層數(shù).
提升小波閾值降噪的過程如圖2所示.
圖2 提升小波閾值降噪的過程
高精度 GPS坐標(biāo)時(shí)間序列是將臺(tái)站的連續(xù)觀測(cè)數(shù)據(jù)經(jīng)過解算后得到的位置信息序列. 近幾十年來,國(guó)際上已建立了很多GPS臺(tái)站和網(wǎng)絡(luò). 我國(guó)的國(guó)家大型科學(xué)工程重大項(xiàng)目“中國(guó)地殼運(yùn)動(dòng)觀測(cè)網(wǎng)絡(luò)”包括多個(gè)分布在中國(guó)大陸上的 GPS 連續(xù)觀測(cè)基準(zhǔn)臺(tái)站,如圖3所示,具有很好的穩(wěn)定性,成為中國(guó)形變監(jiān)測(cè)的基準(zhǔn)框架.
圖3 中國(guó)地殼運(yùn)動(dòng)觀測(cè)網(wǎng)絡(luò)臺(tái)站分布
國(guó)內(nèi)GPS坐標(biāo)時(shí)間序列運(yùn)動(dòng)主要表現(xiàn)為板塊水平方向運(yùn)動(dòng)和板塊高程方向運(yùn)動(dòng). 符養(yǎng)[19]通過對(duì)GPS時(shí)間序列進(jìn)行計(jì)算分析,獲得了全球高程時(shí)間序列的振蕩特性;張鵬研究了中國(guó)地殼運(yùn)動(dòng)觀測(cè)網(wǎng)絡(luò)基準(zhǔn)站的坐標(biāo)位置變化規(guī)律,發(fā)現(xiàn)位于中國(guó)境內(nèi)的GPS時(shí)間序列在高程方向分量的周期性最為明顯[20]. 因此,研究GPS高程方向時(shí)間序列更加有利于分析大陸板塊運(yùn)動(dòng)規(guī)律,以及對(duì)地質(zhì)災(zāi)害的預(yù)測(cè).
GPS時(shí)間序列中若包含了非長(zhǎng)期趨勢(shì)項(xiàng)、階躍項(xiàng)、噪聲項(xiàng)以及季節(jié)項(xiàng),那么GPS時(shí)間序列就會(huì)表現(xiàn)出顯著的非線性變化,傳統(tǒng)的線性模型則難以適用于這一類問題的預(yù)測(cè).
本文使用LSTM對(duì)時(shí)間序列具有強(qiáng)辨別力和學(xué)習(xí)能力,通過學(xué)習(xí)相關(guān)數(shù)據(jù)之間復(fù)雜的非線性關(guān)系,克服了BP神經(jīng)網(wǎng)絡(luò)較差的學(xué)習(xí)泛化能力的影響以及RNNs的梯度消亡問題,對(duì)于處理非線性時(shí)間序列有很好的效果. 與傳統(tǒng)方法相比,LSTM神經(jīng)網(wǎng)絡(luò)更加靈活,不依賴于輸入數(shù)據(jù)的特性且大多不需要先驗(yàn)知識(shí)的儲(chǔ)備.
2.2.1 RNNs原理
RNNs是一種包含循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò). 相對(duì)于全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)(CNN), RNNs的各個(gè)隱藏層之間不再是相互獨(dú)立的,循環(huán)結(jié)構(gòu)可以將當(dāng)前時(shí)刻隱藏層的狀態(tài)傳遞到下一時(shí)刻的隱藏層[21].
圖4 RNNs隱藏層單元展開圖
如圖4所示,RNNs隱藏層的輸入不僅包括輸入層的輸出,還包括上一時(shí)刻隱藏層的輸出. 其中X為RNNs的輸入,h為RNNs的輸出,Ct為隱藏層的狀態(tài).U、V、W分別是輸入到隱藏層、隱藏層到輸出、隱藏層到隱藏層的權(quán)重. 在RNNs中,每一層的參數(shù)U、V、W都是共享的,這樣的訓(xùn)練方式降低了神經(jīng)網(wǎng)絡(luò)需要學(xué)習(xí)的參數(shù),縮短了訓(xùn)練時(shí)間.
2.2.2 RNNs的缺陷
在實(shí)際應(yīng)用中, RNNs存在這樣一個(gè)問題:若RNNs需要的幾個(gè)信息在時(shí)間序列上相隔較遠(yuǎn),那么較遠(yuǎn)的信息對(duì)輸出的影響要么衰減得很小,要么呈指數(shù)爆炸增長(zhǎng),這個(gè)問題通常被稱為“梯度消亡問題”[8].
2.3.1 LSTM原理
LSTM是一種特殊的RNNs,具有和RNNs相似的單元結(jié)構(gòu),但是它不再只是用一個(gè)單一隱藏層的狀態(tài)Ct,而是增加了三個(gè)相互作用的門結(jié)構(gòu),分別是遺忘門、輸入門和輸出門,如圖5所示.
圖5 LSTM的單元結(jié)構(gòu)
2.3.2 遺忘門
遺忘門會(huì)根據(jù)當(dāng)前時(shí)刻的輸入Xt和上一時(shí)刻的輸出ht-1來計(jì)算一個(gè)0-1之間的值ft作為上一時(shí)刻信息通過的比重,其中0表示全部舍棄,1表示全部保留:
ft=σ(Wf·[ht-1,xt]+bf) ,
(5)
2.3.3 輸入門
輸入門則會(huì)根據(jù)當(dāng)前時(shí)刻的輸入Xt和上一時(shí)刻的輸出ht-1來決定LSTM神經(jīng)網(wǎng)絡(luò)獲得哪些新信息:
it=σ(Wi·[ht-1,xt]+bi) ,
(6)
(7)
更新后的隱藏層狀態(tài)Ct為
(8)
2.3.4 輸出門
輸出門會(huì)根據(jù)上一時(shí)刻的輸出ht-1、當(dāng)前時(shí)刻的輸入Xt以及當(dāng)前時(shí)刻的隱藏層狀態(tài)Ct共同得出當(dāng)前時(shí)刻神經(jīng)網(wǎng)絡(luò)的輸出ht.
(9)
根據(jù)上述公式進(jìn)行前向計(jì)算得到神經(jīng)網(wǎng)絡(luò)的輸出后,利用時(shí)間反向傳播(BPTT)算法進(jìn)行迭代訓(xùn)練,最終獲得神經(jīng)網(wǎng)絡(luò)所需要的權(quán)重參數(shù).
由于測(cè)量誤差、人為操作等原因,在實(shí)際工作中獲得的GPS時(shí)間序列含有一定噪聲,這些噪聲會(huì)干擾數(shù)據(jù)預(yù)測(cè)的結(jié)果,造成不必要的誤差.
因此本文在訓(xùn)練前先對(duì)GPS時(shí)序數(shù)據(jù)進(jìn)行了閾值降噪處理,然后將降噪后的時(shí)序數(shù)據(jù)輸入LSTM神經(jīng)網(wǎng)絡(luò)使用,迭代訓(xùn)練的方法進(jìn)行單步預(yù)測(cè),并得到預(yù)測(cè)結(jié)果. GPS時(shí)序預(yù)測(cè)模型流程如圖6所示.
圖6 GPS時(shí)序預(yù)測(cè)模型流程圖
本文采用平均百分比誤差(MAPE)和均方根誤差(RMSE)作為評(píng)價(jià)預(yù)測(cè)結(jié)果好壞的兩個(gè)指標(biāo):
MAPE=
(10)
RMSE=
(11)
式中:observedt為第t天的真實(shí)值;predictedt為第t天的預(yù)測(cè)值;n為預(yù)測(cè)總天數(shù). 平均百分比誤差和均方根誤差越小,代表模型預(yù)測(cè)的結(jié)果越好.
本文程序運(yùn)行環(huán)境:Windows 10 64位操作系統(tǒng),Tensorflow1.4;CPU Intel Core i7 2.80 GHz, RAM 8.00 GB. 按照前人研究經(jīng)驗(yàn),將LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置為:Learning-rate、batch-size和time-step分別為0.0008、60和10.
實(shí)驗(yàn)數(shù)據(jù)采用中國(guó)地震局 GNSS 數(shù)據(jù)產(chǎn)品服務(wù)平臺(tái)下載的GAMIT解算的IGS基準(zhǔn)站SHAO的2007年9月29日到2014年4月18日的站心坐標(biāo)系高程數(shù)據(jù). 其中以2007年9月29日到2014年2月17日的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),以2014年2月18日至2014年4月18日的數(shù)據(jù)作為測(cè)試數(shù)據(jù).
降噪前后的GPS時(shí)序數(shù)據(jù)如圖7(a)、7(b)、7(c)、7(d)所示. 圖7(a)示出的是未經(jīng)過降噪處理的原始GPS高程時(shí)序數(shù)據(jù),由圖可以看出,原始數(shù)據(jù)的曲線形態(tài)較差,含有大量毛刺、波動(dòng)較大. 7(b)示出了經(jīng)過經(jīng)驗(yàn)?zāi)J椒纸饨翟牒蟮腉PS高程時(shí)序曲線.圖7(c),(d)則是分別使用軟閾值函數(shù)和平滑閾值函數(shù)對(duì)GPS高程時(shí)序數(shù)據(jù)進(jìn)行降噪處理后的時(shí)序曲線.與原始數(shù)據(jù)相比,經(jīng)過處理后的時(shí)序曲線更加圓滑,毛刺大量減少并且波動(dòng)范圍更小.
(a)原始GPS時(shí)序數(shù)據(jù)
(b)經(jīng)驗(yàn)?zāi)J椒纸?EMD)降噪后的GPS時(shí)序數(shù)據(jù)
(c)提升小波軟閾值函數(shù)降噪后的GPS時(shí)序數(shù)據(jù)
(d)提升小波平滑閾值函數(shù)降噪后的GPS時(shí)序數(shù)據(jù)圖7 GPS時(shí)序數(shù)據(jù)降噪效果圖
圖8為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差下降曲線圖,以同樣訓(xùn)練1000輪為例,可以看出時(shí)序數(shù)據(jù)采用EMD降噪法或提升小波降噪法后訓(xùn)練的收斂速度均快于原始數(shù)據(jù),并且在500輪左右基本完成收斂.
圖8 LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差下降曲線
經(jīng)過提升小波降噪后的GPS時(shí)序數(shù)據(jù)在最終1000輪完成后的訓(xùn)練誤差小于原始GPS時(shí)序數(shù)據(jù)和EMD降噪后時(shí)序數(shù)據(jù)的訓(xùn)練誤差,可見當(dāng)訓(xùn)練數(shù)據(jù)的相關(guān)性增強(qiáng)后,LSTM神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率也隨之提高.
圖9為原始的GPS高程時(shí)序數(shù)據(jù)通過ARIMA模型進(jìn)行建模預(yù)測(cè)得到的預(yù)測(cè)數(shù)據(jù)(點(diǎn)線)與原始數(shù)據(jù)(直線)的曲線圖.
圖9 ARIMA模型未降噪數(shù)據(jù)預(yù)測(cè)圖
圖10示出的是原始GPS高程時(shí)序數(shù)據(jù)未經(jīng)任何降噪處理直接送入雙層LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行建模訓(xùn)練得到的預(yù)測(cè)結(jié)果.
圖10 LSTM神經(jīng)網(wǎng)絡(luò)未降噪數(shù)據(jù)預(yù)測(cè)圖
圖11所示的是GPS高程時(shí)序數(shù)據(jù)經(jīng)過軟閾值函數(shù),將小于閾值的數(shù)值置零,大于閾值的數(shù)值保留,得到的時(shí)序數(shù)據(jù)曲線.圖12則是GPS高程時(shí)序數(shù)據(jù)經(jīng)過平滑閾值函數(shù)降噪后得到的時(shí)序數(shù)據(jù)曲線圖,再將上述兩種降噪方法得到的時(shí)序數(shù)據(jù)分別送入雙層LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行建模預(yù)測(cè),得到的預(yù)測(cè)結(jié)果圖.
圖11 軟閾值函數(shù)降噪的LSTM神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)預(yù)測(cè)圖
圖12 平滑閾值函數(shù)降噪的LSTM神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)預(yù)測(cè)圖
對(duì)比不同方法實(shí)驗(yàn)的結(jié)果如圖13和表1所示:
圖13 不同方法對(duì)比圖
模型MAPE%RMSEARIMA模型(時(shí)序數(shù)據(jù)未降噪)9.150.00482單一LSTM神經(jīng)網(wǎng)絡(luò)模型(時(shí)序數(shù)據(jù)未降噪)8.830.00435軟閾值降噪+LSTM神經(jīng)網(wǎng)絡(luò)模型2.070.00074平滑閾值降噪+LSTM神經(jīng)網(wǎng)絡(luò)模型1.660.00070
為驗(yàn)證所提出的高程GPS時(shí)序預(yù)測(cè)模型的適用性,將臨滄(YNLC)臺(tái)站2010-2016年測(cè)得的高程GPS時(shí)序數(shù)據(jù)用于訓(xùn)練本文提出的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,其模型參數(shù)設(shè)置完全相同. 以2017年7月9日至2017年9月8日的高程時(shí)序數(shù)據(jù)做測(cè)試,GPS高程時(shí)序預(yù)測(cè)模型得到的預(yù)測(cè)結(jié)果如圖14(a),(b),(c)所示.其中圖14(a)示出的是YNLC的高程時(shí)序數(shù)據(jù)未經(jīng)過任何降噪處理而得到的預(yù)測(cè)結(jié)果,圖14(b)則示出了將YNLC站高程時(shí)序數(shù)據(jù)通過平滑閾值降噪處理后再通過預(yù)測(cè)模型得到的預(yù)測(cè)效果. 圖14(c)則將原始數(shù)據(jù)與兩種預(yù)測(cè)方法得到的預(yù)測(cè)數(shù)據(jù)共同展示,從圖中可以看出,經(jīng)過降噪處理得到的預(yù)測(cè)曲線更加圓滑及貼合原始高程時(shí)序數(shù)據(jù)的走勢(shì).
(a)時(shí)序數(shù)據(jù)未降噪處理
(b)時(shí)序數(shù)據(jù)經(jīng)過降噪處理
(c)效果對(duì)比圖圖14 YNLC站不同方法對(duì)比圖
預(yù)測(cè)結(jié)果的好壞需參考預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)值和得到的預(yù)測(cè)序列的曲線形態(tài). 對(duì)比分析圖9~13以及表1可以看出,對(duì)未降噪數(shù)據(jù)進(jìn)行預(yù)測(cè)的ARIMA模型與單一LSTM神經(jīng)網(wǎng)絡(luò)模型,其預(yù)測(cè)結(jié)果的MAPE相近,分別為9.15%和8.83%. 同時(shí)兩種方法的RMSE也十分接近,分別為0.004 82與0.004 35. 其中ARIMA模型建模復(fù)雜,運(yùn)算量大,且需要大量先驗(yàn)知識(shí)的積累,而LSTM神經(jīng)網(wǎng)絡(luò)則具有良好的自適應(yīng)性,建模訓(xùn)練簡(jiǎn)單、資源占用較少. 提升小波軟閾值降噪技術(shù)或平滑閾值降噪技術(shù)分別與LSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合后,得到預(yù)測(cè)結(jié)果的平均百分比誤差以及均方根誤差均小于時(shí)序數(shù)據(jù)沒有經(jīng)過降噪處理的單一神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,表明噪聲是影響預(yù)測(cè)結(jié)果準(zhǔn)確度的一個(gè)因素. 其中基于提升小波平滑閾值降噪技術(shù)的LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的兩個(gè)評(píng)價(jià)指標(biāo)分別為1.66%和0.000 70,均小于傳統(tǒng)軟閾值函數(shù)降噪的方法,并結(jié)合圖14(a),(b),(c),證明該模型在使用效果上具有更好的準(zhǔn)確性與適用性.
本文利用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)GPS高程時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè),并借助提升小波閾值降噪技術(shù)對(duì)原始時(shí)序數(shù)據(jù)中的噪聲進(jìn)行剝離,解決了由于噪聲弱化了數(shù)據(jù)間的相關(guān)性而影響預(yù)測(cè)結(jié)果的問題. 實(shí)驗(yàn)結(jié)果表明,本文提出的基于提升小波平滑閾值降噪技術(shù)和神經(jīng)網(wǎng)絡(luò)的GPS高程時(shí)序預(yù)測(cè)模型結(jié)果的平均百分比誤差和均方根誤差分別為1.66%和0.000 7,均小于ARIMA模型、單一LSTM神經(jīng)網(wǎng)絡(luò)模型以及基于軟閾值函數(shù)降噪的神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果MAPE和RMSE,這表明本文模型對(duì)預(yù)測(cè)結(jié)果的準(zhǔn)確度較高. 預(yù)測(cè)時(shí)通過當(dāng)天的數(shù)值預(yù)測(cè)出下一天的數(shù)值,使得預(yù)測(cè)模型不需要保存之前大量的運(yùn)算數(shù)據(jù),大大降低了因?yàn)楸4鏀?shù)據(jù)帶來的額外花銷,減少了對(duì)系統(tǒng)資源的占用,具有良好的適用性.