孟品超,李學(xué)源,賈洪飛,李延忠
(1.長春理工大學(xué) 理學(xué)院,長春130022;2.吉林大學(xué) 交通學(xué)院,長春130022;3.北華大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,吉林省吉林市132013)
軌道交通中滑動平均法模型簡單易用,目前多用于對數(shù)據(jù)預(yù)處理,如裴益軒等[1]在實(shí)例應(yīng)用中用滑動平均法給出了濾掉高頻干擾信號的算法;胡松等[2]用滑動平均法濾波衰減了較高頻率的噪聲信號,達(dá)到提高信噪比的目的;何耀等[3]在所提出模型的基礎(chǔ)上,采用滑動平均濾波法削弱噪聲項(xiàng)干擾,起到了較好的估計(jì)效果。Hatchett等[4]鑒于較長移動平均效果差的狀況,重新給出了移動平均最佳長度的建議。Shih等[5]將N點(diǎn)滑動平均的方法應(yīng)用到普通示波血壓確定過程,從而在可接受精確度范圍內(nèi)非常方便且無創(chuàng)地獲得中樞主動脈收縮壓值。
軌道交通客流具有周期性,每天客流波動具有一定規(guī)律性??土鲿r(shí)間序列在每天同一時(shí)間段客流量具有相似性,其構(gòu)成的時(shí)間序列具有一定的平穩(wěn)性。因此,可采用滑動平均法對歷史客流數(shù)據(jù)在每天同一時(shí)間間隔內(nèi)構(gòu)成的時(shí)間序列進(jìn)行建模,并采用滑動平均法[6]來一步預(yù)測相同時(shí)間間隔內(nèi)的客流量?;瑒悠骄P秃唵?不需大量樣本,且計(jì)算速度快,具有較高的預(yù)測精度。故本文提出了一種基于滑動平均法的軌道交通短時(shí)客流預(yù)測算法。
總體上波動較為平穩(wěn)的離散時(shí)間序列{y t}可看成規(guī)律性成分的穩(wěn)定性部分{f t}和受噪聲因素影響的隨機(jī)性波動{e t}兩部分組成,故較為平穩(wěn)的離散時(shí)間序列{y t}可分成兩部分:
為減弱隨機(jī)誤差{e t}影響,通??蓪倶颖玖繛镹的原始時(shí)間序列數(shù)據(jù){y t}作滑動平均處理,即對非平穩(wěn)的時(shí)間序列{y t},在合適的樣本量為n的小區(qū)間上看作近似平穩(wěn)的,其中n為滑動平均參數(shù),然后在這個(gè)近似平穩(wěn)的區(qū)間上采用式(2)進(jìn)行平均處理,得到的值可以作為下一時(shí)刻的預(yù)測值。
對于時(shí)間序列{y t}逐一對各小區(qū)間內(nèi)數(shù)據(jù)進(jìn)行局部平均化處理,得到減弱了噪聲因素{e t}影響的預(yù)測時(shí)間序列。這樣滑動平均所得到的},隨機(jī)波動因受到平均的作用而比原時(shí)間序列{y t}減小了,也就是更加平滑了。
針對預(yù)測算法的精度,Dhuyvetter and Kastens[7]采用平均絕對誤差的方法衡量預(yù)測精度,Hatchett[8]考慮使用均方根誤差來衡量預(yù)測精度,這兩種衡量方法效果差別不大。本文擬采用消除量綱影響的平均相對誤差來比較不同滑動參數(shù)下的預(yù)測誤差。
取不同的滑動參數(shù)n就會有不同的滑動平均結(jié)果[9],滑動參數(shù)n過小,起不到抑制隨機(jī)波動的作用;滑動平均參數(shù)n過大,越顯均勻,但同時(shí)可能濾掉高頻變化的規(guī)律性部分,導(dǎo)致總體預(yù)測精度不好。因此,應(yīng)該選擇一個(gè)較為合理的滑動參數(shù)n值來做滑動平均。選擇較合理的滑動參數(shù)n的方法是,選取不同的滑動參數(shù)n值,計(jì)算不同n值對應(yīng)的預(yù)測序列后,計(jì)算各自平均相對誤差RME(n):
比較不同的RME(n),平均相對誤差最小時(shí)所對應(yīng)的滑動參數(shù)取值是合理的。RME(n)的值反映了取不同滑動參數(shù)時(shí)滑動平均預(yù)測的結(jié)果與歷史數(shù)據(jù)的擬合程度,所以這種挑選方法是合理的。
以每天為單位生成的原始客流時(shí)間序列受隨機(jī)因素影響,波動強(qiáng)烈,呈現(xiàn)出明顯的非平穩(wěn)特征,但歷史客流數(shù)據(jù)在每天同一時(shí)段內(nèi)的數(shù)據(jù)具有相似性,其組成的時(shí)間序列起伏變化不會太大,可被視為變化較平穩(wěn)的時(shí)間序列。所以,由歷史客流時(shí)間序列每天同一時(shí)刻數(shù)據(jù)構(gòu)成的時(shí)間序列,用滑動平均方法對下一天處于相同時(shí)間段數(shù)據(jù)進(jìn)行預(yù)測,可得到基于歷史數(shù)據(jù)的預(yù)測客流時(shí)間序列,接下來根據(jù)實(shí)時(shí)客流數(shù)據(jù)進(jìn)行實(shí)時(shí)預(yù)測[10]。其方法簡單、運(yùn)算速度快,又具有較好的預(yù)測精度。具體算法步驟如下:
步驟1 生成原始客流時(shí)間序列矩陣。
其中,N為每天生成的原始客流數(shù)據(jù)量,m為采集客流數(shù)據(jù)樣本的天數(shù)。m天歷史客流數(shù)據(jù)在每天同一時(shí)間段j的客流量所生成的新客流時(shí)間序列為:。
步驟2 確定用于滑動平均的參數(shù)n j。參數(shù)n j=2,3,…,m-1,計(jì)算n j取不同值時(shí)的滑動結(jié)果:
不同的滑動參數(shù)n j所對應(yīng)的預(yù)測平均相對誤差為:
步驟3 采用滑動平均法預(yù)測第m+1天各時(shí)刻的客流量數(shù)據(jù)。將取值最小時(shí)的滑動參數(shù)n j對應(yīng)的作為第m+1天時(shí)刻j的客流量預(yù)測值,同理,可以得到第m+1天的預(yù)測客流時(shí)間序列:
步驟4 基于實(shí)時(shí)客流數(shù)據(jù)對預(yù)測客流量進(jìn)行實(shí)時(shí)預(yù)測。實(shí)時(shí)預(yù)測結(jié)果為:
本文擬采用平均相對誤差(RME)和均方根誤差(RMSE)這兩種方法來對算法預(yù)測的誤差效果進(jìn)行評價(jià)[11]。
平均相對誤差用來評價(jià)預(yù)測客流數(shù)據(jù)與真實(shí)客流數(shù)據(jù)之間的相對誤差的平均值,其計(jì)算公式為:
式中:y i為真實(shí)客流數(shù)據(jù);為對應(yīng)的預(yù)測客流數(shù)據(jù);n為每天采樣的客流數(shù)據(jù)量。
RME越接近于0,說明客流預(yù)測精確度越高。
均方根誤差用于評價(jià)預(yù)測客流數(shù)據(jù)與真實(shí)數(shù)據(jù)誤差平方和的均值平方根,其公式如下:
RMSE越接近于0,說明客流預(yù)測算法越準(zhǔn)確。
基于本文提出的方法,針對2015年4月1日到29日上海地鐵一號線人民廣場站進(jìn)站和莘莊站進(jìn)站刷卡信息,分別采取5 min和15 min時(shí)間粒度采樣生成原始客流時(shí)間序列。由于運(yùn)營時(shí)間不同,5 min粒度時(shí),人民廣場站每一個(gè)完整運(yùn)營日將獲得212個(gè)進(jìn)站觀測值,莘莊站將獲得204個(gè)進(jìn)站觀測值;15 min粒度時(shí),人民廣場站每一個(gè)完整運(yùn)營日將獲得70個(gè)進(jìn)站觀測值,莘莊站將獲得68個(gè)進(jìn)站觀測值。共獲得29天的原始客流數(shù)據(jù)。
實(shí)驗(yàn)首先通過最小平均相對誤差檢驗(yàn)方法確定滑動平均參數(shù)n j,然后用式(5)得出最小平均相對誤差條件下第30天各時(shí)刻預(yù)測值。再根據(jù)實(shí)時(shí)客流數(shù)據(jù)用式(6)對預(yù)測結(jié)果處理,得到實(shí)時(shí)客流預(yù)測結(jié)果,并與支持向量機(jī)(SVM)、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)、小波神經(jīng)網(wǎng)絡(luò)(WNN)和小波組合支持向量機(jī)(WS)4種算法預(yù)測客流量誤差進(jìn)行比較。
2015年4月1日人民廣場地鐵站進(jìn)站客流經(jīng)過5 min和15 min采樣后得到客流時(shí)間序列如圖1所示。圖2為采用滑動平均方法預(yù)測4月30日5:45~5:50、6:00~6:15這兩個(gè)時(shí)間段內(nèi)客流量時(shí),選取不同的滑動參數(shù)n j進(jìn)行預(yù)測所對應(yīng)的平均相對誤差?;趯?shí)時(shí)交通客流數(shù)據(jù),通過滑動平均方法,得到4月30日的5 min粒度和15 min粒度預(yù)測客流時(shí)間序列,其結(jié)果如圖3所示。幾種不同預(yù)測方法的實(shí)驗(yàn)誤差見表1。
圖1 2015年4月1日人民廣場進(jìn)站客流5 min和15 min粒度時(shí)間序列Fig.1 Entrance passenger flow time series with 5 min and 15 min at People’square station on April 1st,2015
圖2 預(yù)測不同時(shí)間段客流量時(shí)不同n j對應(yīng)的RMEFig.2 RME corresponding to different n j while predicting the passenger flow between 5:45~5:50 and 6:00~6:15
圖3 2015年4月30日人民廣場站進(jìn)站實(shí)時(shí)預(yù)測客流5 min和15 min粒度時(shí)間序列Fig.3 Real-time forecast of entrance passenger flow time series with 5 min and 15 min at People’square station on 30th April,2015
表1 2015年4月30日人民廣場進(jìn)站客流預(yù)測結(jié)果比較表Table 1 Comparison between predicted entrance passenger flows at People’s square station on April 30th,2015
通過表1對人民廣場站進(jìn)站短時(shí)客流預(yù)測結(jié)果分析可以發(fā)現(xiàn),基于滑動平均法的實(shí)時(shí)客流預(yù)測精度最高,且計(jì)算耗時(shí)也遠(yuǎn)遠(yuǎn)少于其他方法。從圖1和2可以看出,采取15 min粒度采樣生成的原始客流時(shí)間序列更平滑,故預(yù)測15 min粒度的客流序列的平均相對誤差更小。從圖2可以看出,預(yù)測不同時(shí)間段的客流量所采用的滑動參數(shù)是依據(jù)預(yù)測RME最小標(biāo)準(zhǔn)自適應(yīng)選取的。對比圖3(a)(b)可知,在晚高峰時(shí)段客流數(shù)據(jù)波動強(qiáng)烈,導(dǎo)致擬合效果稍差。而本文提出的基于實(shí)時(shí)客流數(shù)據(jù)的滑動平均預(yù)測方法對晚高峰波動較強(qiáng)烈的數(shù)據(jù)具有較好預(yù)測效果。
圖4 2015年4月1日莘莊站進(jìn)站客流5 min和15 min粒度時(shí)間序列Fig.4 Entrance passenger flow time series with 5 min and 15 min at Xinzhuang station on April 1st,2015
圖5 預(yù)測不同時(shí)間段客流量時(shí)不同n j對應(yīng)的RMEFig.5 RME corresponding to different n j while predicting passenger flow between 6:00~6:05 and 9:15~9:30
2015年4月1日上海市地鐵一號線莘莊進(jìn)站客流經(jīng)5 min粒度和15 min粒度采樣得到原始客流時(shí)間序列如圖4所示。圖5(a)(b)分別為采用滑動平均方法預(yù)測4月30日6:00~6:05、9:15~9:30這兩個(gè)時(shí)段客流時(shí),取不同滑動參數(shù)n j進(jìn)行預(yù)測對應(yīng)的平均相對誤差。采用與實(shí)驗(yàn)1同樣方法得到4月30日5 min粒度和15 min粒度預(yù)測客流時(shí)間序列如圖6所示。幾種不同方法的預(yù)測誤差見表2。
圖6 2015年4月30日莘莊站進(jìn)站實(shí)時(shí)預(yù)測客流5 min和15 min粒度時(shí)間序列Fig.6 Real-time forecast of entrance passenger flow time series with 5 min and 15 min at Xinzhuang station on 30th April,2015
表2 2015年4月30日莘莊站進(jìn)站客流預(yù)測結(jié)果比較表Table 2 Comparison between predicted entrance passenger flows at Xinzhuang Station on April 30th,2015
通過表2對莘莊站進(jìn)站短時(shí)客流預(yù)測結(jié)果分析可以發(fā)現(xiàn),基于實(shí)時(shí)交通客流的滑動平均預(yù)測方法精度高于其他4種預(yù)測方法,且運(yùn)算時(shí)間優(yōu)于其他方法。從圖4可看出,15 min粒度采樣生成的原始客流時(shí)間序列更平滑,波動性減弱,預(yù)測精度比5 min粒度的提高很多。對比圖6(a)(b)可以發(fā)現(xiàn),在波動強(qiáng)烈的早高峰時(shí)段,預(yù)測算法的擬合效果也較好,故本文提出的基于實(shí)時(shí)交通數(shù)據(jù)的滑動平均方法對早高峰客流數(shù)據(jù)也具有較好的預(yù)測效果。
針對軌道交通客流歷史數(shù)據(jù)在每天相同時(shí)段內(nèi)具有一定相似性的特點(diǎn),以及當(dāng)前應(yīng)用于短時(shí)客流預(yù)測領(lǐng)域算法復(fù)雜、計(jì)算速度慢的不足,本文將算法簡單、計(jì)算速度快的滑動平均方法應(yīng)用于軌道交通短時(shí)客流領(lǐng)域。通過采用滑動平均算法對人民廣場站和莘莊站兩站點(diǎn)進(jìn)站客流進(jìn)行預(yù)測并驗(yàn)證。結(jié)果表明,本文提出的基于滑動平均算法的實(shí)時(shí)客流預(yù)測方法精度高于非線性預(yù)測方法支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò),也明顯高于小波和支持向量機(jī)的組合預(yù)測方法。同時(shí),滑動平均方法還具有算法簡單、計(jì)算速度快的優(yōu)點(diǎn),具有較好的預(yù)測效果。
[1]裴益軒,郭民.滑動平均法的基本原理及應(yīng)用[J].火炮發(fā)射與控制學(xué)報(bào),2001(1):21-23.Pei Yi-xuan,Guo Min.The fundamental principle and application of sliding average method[J].Gun Launch&Control Journal,2001(1):21-23.
[2]胡松,江小煒,楊光,等.滑動平均濾波在微弱脈沖信號檢測中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2007,35(10):169-172.Hu Song,Jiang Xiao-wei,Yang Guang,et al.Using of moving average filter in faint pulse signal detection[J].Computer and Digital Engineering,2007,35(10):169-172.
[3]何耀,劉興濤,張陳斌,等.基于動力電池組內(nèi)阻模型的絕緣檢測算法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2013,43(5):1165-1170.He Yao,Liu Xing-tao,Zhang Chen-bin,et al.Insulation detection algorithm for high-power battery system based on internal resistance model[J].Journal of Jilin University(Engineering and Technology Edition),2013,43(5):1165-1170.
[4]Hatchett R B,Brorsen B W,Anderson K B.Optimal length of moving average to forecast futures basis[J].Journal of Agricultural and Resource Economics,2009,35(1):18-33.
[5]Shih Y T,Cheng H M,Sung S H,et al.Application of the N-Point moving average method for brachial pressure waveform-derived estimation of central aortic systolic pressure[J].Hypertension,2014,63(4):865-870.
[6]潘紅宇.時(shí)間序列分析[M].北京:對外經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2015.
[7]Dhuyvetter K C,Kastens T L.Forecasting crop basis:practical alternatives[C]∥Proceedings of the NCR-134 Conference on Applied Commodity Price Analysis,Forecasting,and Market Risk Management,Chicago,USA,1998:49-67.
[8]Hatchett R B.Optimal length of moving averages to use when forecasting basis[D].Stillwater Ok:Department of Agricultural Economics,Oklahoma State University,2009.
[9]楊林泉.預(yù)測與決策方法應(yīng)用[M].北京:冶金工業(yè)出版社,2011.
[10]劉寒冰,李國恒,譚國金,等.基于時(shí)間序列的邊坡位移實(shí)時(shí)預(yù)測方法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2012,42(增刊1):193-197.Liu Han-bing,Li Guo-heng,Tan Guo-jin,et al.Real-time prediction method of slop displacement based on time series analysis[J].Journal of Jilin University(Engineering and Technology Edition),2012,42(Sup.1):193-197.
[11]楊軍.地鐵客流短時(shí)預(yù)測及客流疏散模擬研究[D].北京:北京交通大學(xué)電子信息工程學(xué)院,2013.Yang Jun.Research on metro passenger flow shorttime prediction and evaluation simulation[D].Beijing:School of Electronic and Information Engineering,Beijing Jiaotong University,2013.