熊 洋,李淑慶,許 浩,劉 怡
(1.重慶交通大學(xué) 交通運輸學(xué)院,重慶 400074;2.西南交通大學(xué)交通運輸與物流學(xué)院,四川成都 610097)
隨著我國城市交通建設(shè)的推進(jìn),軌道交通的優(yōu)勢愈加明顯,雖然這種交通方式在很大程度上緩解了地面交通壓力,避免了高峰期交通堵塞等問題,但是它在使用中也存在一些問題。例如,不同換乘樞紐的客流擁擠程度不同,客流量在不同時間段呈現(xiàn)出階段性變化等[1]。當(dāng)客流量急劇增加時,需要增加列車數(shù)量或發(fā)車次數(shù),以緩解運營壓力;當(dāng)客流量減小時,需要減少列車數(shù)量或發(fā)車車次來控制交通運營成本[2]。對軌道交通的客流量進(jìn)行預(yù)測,有助于提高軌道交通的運營效率和資源調(diào)度能力[3]??紤]到軌道交通客流量的短時預(yù)測具有高度的非線性和不確定性,這次研究在BP 神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行改進(jìn),分別以LM 算法和GA 算法提升預(yù)測效率和預(yù)測精度,旨在為城市軌道交通運營提供有價值的參考。
BP 神經(jīng)網(wǎng)絡(luò)作為典型的前饋神經(jīng)網(wǎng)絡(luò),它會根據(jù)實際輸出值與期望輸出值的輸出誤差,逐層反向調(diào)整輸出層到隱含層的權(quán)值,因此它的學(xué)習(xí)過程包括正向傳播和反向傳播兩個部分[4-5]。圖1 為BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
設(shè)BP 神經(jīng)網(wǎng)絡(luò)的輸入值為xn,實際輸出值為Om,通過計算得到的期望輸出值為Ym,m、n、p分別表示輸出層、輸入層和隱含層的節(jié)點數(shù),則實際輸出與期望輸出的誤差值e由式(1)得到。
當(dāng)BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速率為η時,以H表示中間輸出值,網(wǎng)絡(luò)的連接權(quán)值根據(jù)式(2)調(diào)整。
在滿足網(wǎng)絡(luò)結(jié)構(gòu)要求時,BP 神經(jīng)網(wǎng)絡(luò)可以對非線性問題任意逼近,但是該方法的局限性也非常明顯[6]。隨著迭代次數(shù)的增加及誤差的減小,算法的收斂速度下降,學(xué)習(xí)效率逐漸降低,模型梯度逐漸消失,這將嚴(yán)重影響預(yù)測效果[7]。有鑒于此,研究選擇LM 算法對BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化。
LM 算法將高斯牛頓法和梯度下降法相結(jié)合,其誤差性能函數(shù)E(k)見式(3)。
設(shè)權(quán)值的誤差向量為e(w),則誤差和函數(shù)和梯度函數(shù)分別見式(4)、(5)。
在式(5)中,J為雅克比矩陣。當(dāng)誤差性能函數(shù)E(k)趨于最小值時,矩陣的元素可以忽略不計。因為JTJ并不總是可逆,所以這里引入微小增量μI,I表示n×n的單位矩陣,μ>0 。LM-BP 算法的更新權(quán)值見式(6)。
在式(6)中,JTJ恒為正,因此算法恒有解。當(dāng)μ→0 時,它表示高斯牛頓法;當(dāng)μ→∞時,它表示梯度下降法。LM 算法的優(yōu)化思路在提高模型收斂速度的同時,降低了計算難度[8]。
遺傳算法又稱GA 算法,它結(jié)合了達(dá)爾文進(jìn)化論的思想,通過模擬生物進(jìn)化過程,實現(xiàn)對可行解的全局尋優(yōu)[9]。在遺傳算法中,有3 個基本概念,分別是編碼、初始種群、適應(yīng)度。遺傳算法需要對可行解進(jìn)行編碼,以此產(chǎn)生初始種群,這一過程決定了問題的解決程度。初始種群是隨機產(chǎn)生的,它的隨機性與自然選擇的思想相吻合。適應(yīng)度是判斷種群能否遺傳的重要指標(biāo),在實際問題中,它表示目標(biāo)函數(shù)的值[10-11]。在遺傳算法中,種群會經(jīng)過復(fù)制、交叉、變異操作,在這些操作之后,適應(yīng)度高的算子得以保留,適應(yīng)度低的算子被淘汰。通過算法的多次迭代,最終可以得到全局最優(yōu)解。在BP 神經(jīng)網(wǎng)絡(luò)的優(yōu)化中,利用遺傳算法可以對初始值進(jìn)行優(yōu)化,屬于啟發(fā)式優(yōu)化技術(shù)。雖然LM-BP 算法解決了BP 神經(jīng)網(wǎng)絡(luò)模型中梯度消失的問題,但是這種算法模型仍舊存在非凸優(yōu)化問題,即容易陷入局部極值[12]。另一方面,與遺傳算法相比,LM-BP 算法的全局尋優(yōu)能力較弱。為了進(jìn)一步提高模型的預(yù)測精度,這里將遺傳算法與LM-BP 神經(jīng)網(wǎng)絡(luò)算法相結(jié)合,并以此構(gòu)建新的預(yù)測模型。
LM-BP 神經(jīng)網(wǎng)絡(luò)通過誤差的反向傳播,調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,以此得到滿足要求的輸出值。因此在這次的優(yōu)化中,將利用遺傳算法的全局尋優(yōu)能力,對網(wǎng)絡(luò)權(quán)值和閾值進(jìn)行初始化操作[13]。將這一結(jié)果作為LM-BP 神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,不僅極大地提高了算法的運算效率,而且保證了預(yù)測結(jié)果的全局性。在GA 遺傳算法中,有兩種編碼方式,分別是二進(jìn)制編碼和實數(shù)編碼。二進(jìn)制編碼需要解碼過程,這種方式在數(shù)據(jù)操作過程中接近生物學(xué)特性。實數(shù)編碼是類似自然語言的編碼方式,不需要解碼過程,操作過程和結(jié)果更為直觀,因此這里將采用實數(shù)編碼[14]。
圖2 為GA 算法優(yōu)化下的LM-BP 神經(jīng)網(wǎng)絡(luò)流程圖。流程圖分為兩個部分,分別是GA 算法部分和LM-BP 神經(jīng)網(wǎng)絡(luò)部分。在GA 算法部分,首先將樣本數(shù)據(jù)輸入,并進(jìn)行預(yù)處理操作;其次利用GA 遺傳算法對初始權(quán)值和閾值進(jìn)行編碼,構(gòu)成初始種群;然后使用蒙特卡洛法對初始種群個體進(jìn)行選擇,確定其遺傳可能性;接下來對選擇后的個體執(zhí)行單點交叉操作和均勻變異操作;最后根據(jù)預(yù)測值和實際值,對處理后的數(shù)據(jù)計算適應(yīng)度值,并進(jìn)行判斷[15]。若適應(yīng)度值未能滿足最大遺傳,則返回上述個體選擇步驟;若適應(yīng)度值滿足最大遺傳,則可以得到一組相對最優(yōu)的權(quán)值和閾值。將遺傳操作所獲得的權(quán)值和閾值代入LM-BP 算法模型中,計算輸出層和隱含層的校正誤差,并根據(jù)誤差調(diào)整權(quán)值和閾值。當(dāng)輸出誤差不滿足精度要求時,則返回計算輸出層和隱含層的校正誤差;當(dāng)輸出誤差滿足精度要求時,則輸出預(yù)測結(jié)果[16]。
圖2 基于GA算法優(yōu)化的LM-BP神經(jīng)網(wǎng)絡(luò)流程圖
在軌道交通的客流預(yù)測中,預(yù)測結(jié)果的準(zhǔn)確率并不能代完全反映預(yù)測模型的性能。在預(yù)測模型的性能評價中,有相對誤差、平均絕對誤差、均方誤差、平均絕對百分誤差等評價指標(biāo)[17]。這次研究將采用平均絕對誤差(MAD)、平均絕對百分誤差(MAPE)和均方誤差(MSE)這3 個指標(biāo)。在實際的模型預(yù)測中,會出現(xiàn)預(yù)測值為正或者負(fù)的情況。平均絕對誤差是一個描述預(yù)測結(jié)果偏離程度的統(tǒng)計量,由于離差被絕對值化,它不會出現(xiàn)正負(fù)相抵的情況,因此能更好地反映預(yù)測值誤差的實際情況。平均絕對百分誤差是衡量預(yù)測準(zhǔn)確程度的統(tǒng)計指標(biāo),它是百分比值,一般認(rèn)為當(dāng)MAPE<10%時,模型的預(yù)測精度較高。均方誤差是真實值與預(yù)測值之差的平方然后求和平均,與MAD 相比,MSE 可以放大預(yù)測偏差較大的值,且可以比較不同預(yù)測模型的穩(wěn)定性。式(7)~(9)分別表示模型預(yù)測的平均絕對誤差、平均絕對百分誤差和均方誤差。
為了驗證遺傳算法優(yōu)化的LM-BP 算法模型的預(yù)測性能,此次研究采集了S 市軌道交通的小時客流數(shù)據(jù),并對軌道交通客流短時預(yù)測模型進(jìn)行仿真測試。根據(jù)實驗開展的前期數(shù)據(jù)調(diào)查發(fā)現(xiàn),1 號線A站的全天客流呈現(xiàn)出典型雙峰型特征,2 號線B 站的全天客流呈現(xiàn)出典型單峰型特征。在2019 年11 月進(jìn)行客流數(shù)據(jù)采集,采集時間間隔為15 min,采集數(shù)據(jù)以時間序列進(jìn)行反映。以最后一周的數(shù)據(jù)集作為測試集,其余數(shù)據(jù)集作為訓(xùn)練集,采用優(yōu)化前和優(yōu)化后的3 種模型進(jìn)行仿真預(yù)測,并通過Matlab 平臺實現(xiàn)。在GA-LMBP 算法中,經(jīng)試驗設(shè)置種群數(shù)量為120,變異概率pc=0.95,η=0.01。
圖3 為不同預(yù)測模型的迭代效率統(tǒng)計。從圖3的統(tǒng)計結(jié)果可以看出,BP 神經(jīng)網(wǎng)絡(luò)算法在迭代80 次前收斂速度較快,此后收斂速度明顯降低,但在迭代200 次后仍舊無法滿足誤差精度要求;LM-BP 算法模型在迭代第4 次就已經(jīng)趨于誤差精度要求并逐漸穩(wěn)定;GA 遺傳算法在優(yōu)化LM-BP 模型時,其迭代次數(shù)為65 次。由此來看,研究所提出的LM 算法和GA算法優(yōu)化顯著提升了BP 算法的運算效率。由于篇幅限制,這里僅展示GA-LM-BP 算法模型的相對誤差統(tǒng)計結(jié)果。
圖3 不同預(yù)測模型的迭代效率
圖4 為兩個站點在GA-LM-BP 模型下的預(yù)測相對誤差。(a)為1 號線A 站的統(tǒng)計結(jié)果,GA-LM-BP算法的客流預(yù)測在前期將相對誤差控制在±40%左右,隨著訓(xùn)練數(shù)據(jù)的增加,預(yù)測的相對誤差逐漸減小,最終控制在±20%的范圍內(nèi)。(b)為2 號線B 站的統(tǒng)計結(jié)果,GA-LM-BP 算法的預(yù)測相對誤差控制在±10%的范圍內(nèi),有少量預(yù)測值誤差在±20%左右。采用相同的算法模型,兩個站點的預(yù)測誤差分布情況有所不同,這說明不同時間序列特征的數(shù)據(jù)集在算法模型中的預(yù)測效果不同。A 站點屬于雙峰型時間分布的客流特征,B 站點屬于單峰型時間分布,因此A 站點數(shù)據(jù)集中的數(shù)據(jù)變化頻率是B 站點的兩倍。由此分析,當(dāng)數(shù)據(jù)量較少時,算法模型對A站點的預(yù)測難度增加;隨著數(shù)據(jù)量的增加,預(yù)測精度逐漸提高。另一方面,B 站點的預(yù)測中存在少量的噪聲影響,這可能是由于樣本數(shù)據(jù)量不夠,降低了算法模型的預(yù)測精度。
圖4 GA-LM-BP算法預(yù)測的相對誤差統(tǒng)計結(jié)果
表1 為軌道交通客流短時預(yù)測模型的性能統(tǒng)計結(jié)果。根據(jù)表1 的統(tǒng)計結(jié)果可以發(fā)現(xiàn),在1 號線A 站的客流預(yù)測中,采用LM 算法優(yōu)化BP 算法模型,模型的MAD 值、MAPE 值、MSE值分別減小了131.55、23.42%、113.89;采用GA 算法優(yōu)化LM-BP 算法模型,模型 的MAD 值、MAPE 值、MSE值分別減小了7.86、1.73%、12.91。在2 號線B 站的客流預(yù)測中,采用LM 算法優(yōu)化BP 算法模型,模型的MAD 值、MAPE值、MSE 值分別減小了45.33、11.04%、36.78;采用GA 算法優(yōu)化LM-BP 算法模型,模型的MAD 值、MAPE 值、MSE 值分別減小了1.46、0.43%、1.04。根據(jù)統(tǒng)計結(jié)果可知,GA-LM-BP 算法模型的MAD 值最小,這說明模型預(yù)測結(jié)果與真實值之間的偏差最小;BP 算法模型的MAD 值最大,這說明BP 算法的預(yù)測結(jié)果與真實值存在較大偏差。在MAPE 值的計算結(jié)果中,BP 算法模型的評價結(jié)果大于10%,無法滿足預(yù)測模型的精度要求;LM-BP 算法模型和GA-LMBP 算法模型的評價結(jié)果均小于10%,且后者小于前者,這說明兩種優(yōu)化方式均達(dá)到了預(yù)測模型的精度要求,且GA-LM-BP 算法模型的預(yù)測精度更高。在MSE 的評價結(jié)果中,GA-LM-BP 算法模型的評價值最小,BP 算法模型的評價值最大,這說明前者的預(yù)測模型穩(wěn)定性優(yōu)于后者。整體而言,LM 算法對BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化效果十分顯著,GA 算法則進(jìn)一步提高了LM-BP 算法模型的預(yù)測精度和穩(wěn)定性。
表1 軌道交通客流短時預(yù)測模型的性能統(tǒng)計結(jié)果
城市人口的增加向城市交通運營提出了挑戰(zhàn),而軌道交通極大地緩解了城市交通的運營壓力,是目前很多城市的發(fā)展重點。這次研究提出了軌道交通的短時客流預(yù)測模型,并采用LM 算法和GA 算法對BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行優(yōu)化。為了驗證優(yōu)化模型的有效性,研究采用S 市客流實測數(shù)據(jù)進(jìn)行仿真實驗,并對預(yù)測模型的性能進(jìn)行評價。研究結(jié)果顯示,在GA 算法和LM 算法兩者的優(yōu)化下,A 站點預(yù)測 結(jié)果 的MAD 值、MAPE值、MSE值分別減小了139.41、25.15%、126.80,B 站點預(yù)測結(jié)果的MAD 值、MAPE 值、MSE 值分別減小了46.79、11.47%、37.82。研究結(jié)果說明優(yōu)化模型的預(yù)測精度和穩(wěn)定性有了大幅提高,優(yōu)化模型在客流短時預(yù)測上具有良好的適用性。這次研究為軌道交通的客流短時預(yù)測提供了新的優(yōu)化思路和數(shù)據(jù)參考,但研究尚且存在不足之處,如對于具有不同時間分布特征的客流數(shù)據(jù),未能對其在模型預(yù)測上的影響進(jìn)行深入研究,這將在后續(xù)工作中作出改進(jìn)。