劉 昶,吳君華,張鳳嬌,于多友
(南京林業(yè)大學(xué) 汽車與交通工程學(xué)院,南京 210037)
現(xiàn)如今,城市公共交通是城市基礎(chǔ)設(shè)施的重要組成部分。在中國(guó)的經(jīng)濟(jì)發(fā)展、城市建設(shè)和社會(huì)生活中發(fā)揮著重要作用,直接關(guān)系到城市的經(jīng)濟(jì)發(fā)展和居民的生活,對(duì)城市經(jīng)濟(jì)發(fā)展有主導(dǎo)性的影響。但是,隨著城市化進(jìn)程的推進(jìn),機(jī)動(dòng)車數(shù)量不斷增加,出現(xiàn)了道路擁堵、堵塞等城市交通問題。優(yōu)先發(fā)展城市公共交通,調(diào)整優(yōu)化城市交通結(jié)構(gòu),對(duì)解決城市交通問題具有重要意義。由于公共交通系統(tǒng)的復(fù)雜性和可變性,客運(yùn)量預(yù)測(cè)通常是不科學(xué)的,因此有必要更好地預(yù)測(cè)公交客流量,為城市規(guī)劃提供更好的參考。
然而,城市公交客運(yùn)量數(shù)據(jù)的收集存在大量未知、不確定因素和干擾。例如,人口密度、人口流動(dòng)等能夠真實(shí)反映客運(yùn)量、特征和分布規(guī)律的歷史數(shù)據(jù)很難獲得,也沒有形成有效的歷史數(shù)據(jù)。為此,許多專家學(xué)者對(duì)公交客流量預(yù)測(cè)方法進(jìn)行了大量研究,并采用了不同的研究方法進(jìn)行預(yù)測(cè),每種預(yù)測(cè)方法都各有優(yōu)缺點(diǎn)。因此,研究城市常規(guī)公交客運(yùn)量預(yù)測(cè)方法,選擇最合適的城市可持續(xù)發(fā)展方式,具有重要的理論和實(shí)踐價(jià)值。
本文在ARIMA預(yù)測(cè)模型和BP預(yù)測(cè)模型的基礎(chǔ)上,引入了基于方差倒數(shù)法的組合模型算法。以南京地鐵客運(yùn)量為例,首先利用訓(xùn)練樣本數(shù)據(jù)對(duì)兩種單一模型進(jìn)行預(yù)測(cè)訓(xùn)練,隨后基于兩種單一模型的預(yù)測(cè)結(jié)果,運(yùn)用方差倒數(shù)法,確定兩種單一預(yù)測(cè)結(jié)果各自的權(quán)重,得到加權(quán)組合模型,最后進(jìn)行預(yù)測(cè)試驗(yàn),并給出了相關(guān)結(jié)果及分析。
ARIMA模型是一種時(shí)間序列預(yù)測(cè)方法,其將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值進(jìn)行回歸所建立的模型。
ARIMA(,,)中,AR是“自回歸”;I為差分;MA為“滑動(dòng)平均”;為自回歸項(xiàng)數(shù);為使之成為平穩(wěn)序列所做的差分次數(shù)(階數(shù));為滑動(dòng)平均項(xiàng)數(shù)。自相關(guān)系數(shù)可決定的取值,偏自相關(guān)系數(shù)能夠決定的取值。
自回歸模型(AR)描述歷史值與當(dāng)前值的關(guān)系,用變量自身的歷史時(shí)間數(shù)據(jù)進(jìn)行預(yù)測(cè),必須滿足平穩(wěn)性的要求,并具有自相關(guān)性,只在自相關(guān)系數(shù)小于0.5的情況適用。階自回歸定義如式(1):
其中,y是當(dāng)前值;是常數(shù)項(xiàng);為階數(shù);y是自相關(guān)系數(shù);是誤差;y為y前的值。
移動(dòng)平均模型(MA)關(guān)注的是自回歸模型中誤差項(xiàng)的累加,能夠有效地消除預(yù)測(cè)中的隨機(jī)波動(dòng)。階回歸的定義如式(2):
自相關(guān)函數(shù)()反映了同義序列在不同時(shí)序取值之間的相關(guān)性,如式(3):
ARIMA(,,)模型的一般形式如式(4):
其中,?=(1)為高階差分;()1…-φ B為平穩(wěn)可逆模型的自回歸多項(xiàng)式系數(shù);()1…-θ B為平穩(wěn)可逆模型的移動(dòng)平滑系數(shù)多項(xiàng)式。式(4)可簡(jiǎn)化為:
其中,ε是白噪聲序列,是時(shí)間序列x的均值。
本文以2006~2014年南京客運(yùn)量為訓(xùn)練數(shù)據(jù),對(duì)2015~2018年的客運(yùn)量進(jìn)行預(yù)測(cè),與真實(shí)值進(jìn)行比較,并對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行比較分析。南京地鐵客運(yùn)量年度數(shù)據(jù)見表1。
表1 南京地鐵年度客運(yùn)量Tab.1 Annual passenger volume of Nanjing Metro
由訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)測(cè)訓(xùn)練,選用ARIMA(3,0,3)模型,如圖1所示。
圖1 ARIMA(3,0,3)模型Fig.1 ARIMA(3,0,3)model
預(yù)測(cè)結(jié)果如圖2所示。
圖2 ARIMA預(yù)測(cè)結(jié)果Fig.2 ARIMA model prediction results
BP(Back Propagation)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),是目前使用較為廣泛的一種參數(shù)學(xué)習(xí)算法。
BP神經(jīng)網(wǎng)絡(luò)分為兩個(gè)過程:工作信號(hào)正向傳遞子過程和誤差信號(hào)反向傳遞子過程。在BP神經(jīng)網(wǎng)絡(luò)運(yùn)算中,單個(gè)樣本有個(gè)輸入、個(gè)輸出。其輸出結(jié)果采用前向傳播,誤差采用反向傳播方式進(jìn)行,在輸入層和輸出層之間通常還有若干個(gè)隱含層。
Robert Hecht-Nielsen在20世紀(jì)90年代就已證明:對(duì)于任何閉區(qū)間內(nèi)的一個(gè)連續(xù)函數(shù),都可以用一個(gè)隱含層的BP網(wǎng)絡(luò)來逼近,這就是萬能逼近定理。所以一個(gè)3層的BP神經(jīng)網(wǎng)絡(luò)就可以完成任意的維到維的映射,即這3層分別是輸入層(Input)、隱含層(Hidden)和輸出層(Output)。輸入層接收數(shù)據(jù),輸出層輸出數(shù)據(jù),前一層神經(jīng)元連接到下一層神經(jīng)元,收集上一層神經(jīng)元傳遞來的信息,經(jīng)過“激活”把值傳遞給下一層。其工作模式如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)Fig.3 BP neural network
圖3中,是輸入層;是隱含層;是輸出層;、分別表示輸入和輸出;為權(quán)重;為偏置;每個(gè)圓圈表示一個(gè)神經(jīng)元。
通常用來估量模型預(yù)測(cè)值與真實(shí)值不一致程度的損失函數(shù)有兩種:函數(shù)和函數(shù)。
由于函數(shù)是一次函數(shù),并且隨著自變量的增大而增大,同時(shí)方便在求梯度時(shí)求導(dǎo),沒有值的大小限制,且求導(dǎo)較為容易,常用在回歸中使用。因此,本文選用函數(shù)作為激活函數(shù)。
同樣以2006~2014年的客運(yùn)量為訓(xùn)練數(shù)據(jù),對(duì)2015~2018年的客運(yùn)量進(jìn)行預(yù)測(cè),與真實(shí)值進(jìn)行比較,對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行比較分析。
由訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)測(cè)訓(xùn)練,得到的預(yù)測(cè)結(jié)果如圖4所示。
圖4 BP預(yù)測(cè)結(jié)果Fig.4 BP neural network prediction results
本章將在兩個(gè)單模型預(yù)測(cè)所得結(jié)果的基礎(chǔ)上,根據(jù)兩種結(jié)果與真實(shí)值的誤差,設(shè)計(jì)一種組合模型,對(duì)客運(yùn)量進(jìn)行預(yù)測(cè)。
本文提出的基于ARIMA模型和BP模型的組合模型的設(shè)計(jì)思路如圖5所示。
圖5 組合模型Fig.5 Combined model
求解兩種單個(gè)模型各自權(quán)重的方法如式(6):
其中,S為第年的客運(yùn)量真實(shí)值;R為ARIMA模型第年的預(yù)測(cè)值;D為第年ARIMA模型的預(yù)測(cè)誤差;R為ARIMA模型第年的預(yù)測(cè)值;D為第年ARIMA模型的預(yù)測(cè)誤差;w為ARIMA模型的權(quán)重;w為BP模型的權(quán)重。
本文利用誤差取平方的方式,將兩種單一模型的預(yù)測(cè)誤差程度放大,再將幾年的誤差平方取均值。以該平均值作為確定權(quán)重的依據(jù),根據(jù)公式求得兩種模型各自在組合模型中的權(quán)重,從而使組合模型的預(yù)測(cè)結(jié)果更加準(zhǔn)確。
使用上述組合模型,同樣以2006~2014的客運(yùn)量為訓(xùn)練數(shù)據(jù),對(duì)2015~2018年的客運(yùn)量進(jìn)行預(yù)測(cè),與真實(shí)值進(jìn)行比較,并對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行比較分析。
由訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)測(cè)訓(xùn)練,得到的預(yù)測(cè)結(jié)果如圖6所示。
圖6 組合模型預(yù)測(cè)結(jié)果Fig.6 Combined model prediction results
本節(jié)對(duì)ARIMA模型、BP模型以及組合模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,其結(jié)果如圖7所示。
圖7 預(yù)測(cè)結(jié)果對(duì)比Fig.7 Comparison of prediction results
得到3種模型預(yù)測(cè)結(jié)果的年均誤差率見表2。
表2 預(yù)測(cè)結(jié)果年均誤差率Tab.2 Annual average error rate of forecast results
由表2中結(jié)果可以看出,組合模型預(yù)測(cè)結(jié)果的年均誤差率明顯低于兩種單一模型。
本文基于ARIMA模型和BP模型,設(shè)計(jì)了一種組合模型預(yù)測(cè)城市地鐵客運(yùn)量的變化趨勢(shì),利用誤差取平方的方式,將兩種單一模型的預(yù)測(cè)誤差程度放大,再將幾年的誤差平方取均值,以該平均值作為確定權(quán)重的依據(jù),以進(jìn)一步使誤差相對(duì)較大的模型獲得一個(gè)相對(duì)較小的權(quán)重,而誤差相對(duì)較小的模型獲得一個(gè)相對(duì)較大的權(quán)重。本文以年均誤差率為標(biāo)準(zhǔn),通過實(shí)驗(yàn)結(jié)果的對(duì)比分析表明:組合模型相對(duì)于兩種單一模型具有更高的預(yù)測(cè)準(zhǔn)確度。