肖少寧+郭欣
摘 要:給出了采用BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)和GRNN網(wǎng)絡(luò)進(jìn)行交通量預(yù)測(cè),并將這三種網(wǎng)絡(luò)預(yù)測(cè)的交通量結(jié)果進(jìn)行比較和分析的方法。研究表明,RBF網(wǎng)絡(luò)和GRNN網(wǎng)絡(luò)對(duì)交通量預(yù)測(cè)比BP網(wǎng)絡(luò)更準(zhǔn)確,收斂速度更快。研究的主要目的是為使用者選擇合適的高性能網(wǎng)絡(luò)結(jié)構(gòu)提供參考。
關(guān)鍵詞:交通預(yù)測(cè);預(yù)測(cè)模型;神經(jīng)網(wǎng)絡(luò);交通量;BP網(wǎng)絡(luò);徑向基函數(shù)算法(RBF);廣義回歸算法(GRNN)
中圖分類號(hào):U49 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2015)07-00-03
0 引 言
隨著我國高速公路的快速發(fā)展,高速公路交通事件的發(fā)生率在不斷上升,因此而導(dǎo)致的次生事件發(fā)生率也在逐年上升,如何快速處理交通事件、有效降低次生事件發(fā)生率,是解決該問題的當(dāng)務(wù)之急。本研究利用神經(jīng)網(wǎng)絡(luò)建立高速公路的交通量預(yù)測(cè)模型,預(yù)測(cè)事件情況下高速公路的交通量到達(dá)情況,為事件的快速處理及事件情況下的交通誘導(dǎo)提供理論依據(jù)。
本研究嘗試建立基于BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和GRNN神經(jīng)網(wǎng)絡(luò)的交通量預(yù)測(cè)模型,對(duì)高速公路事件情況下的交通量進(jìn)行預(yù)測(cè),并對(duì)三種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行比較分析,以得出預(yù)測(cè)效果較好的預(yù)測(cè)模型,可以幫助用戶選擇合適的高性能網(wǎng)絡(luò)結(jié)構(gòu)。
1 神經(jīng)網(wǎng)絡(luò)模型及其特點(diǎn)
1.1 BP網(wǎng)絡(luò)
BP(Back Propagation)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),在目前各研究領(lǐng)域具有較為廣泛的應(yīng)用[1],具體模型結(jié)構(gòu)如圖1所示,其拓?fù)浣Y(jié)構(gòu)包括輸入層、隱層和輸出層,同層節(jié)點(diǎn)之間不連接。BP網(wǎng)絡(luò)以Delta (δ)為學(xué)習(xí)規(guī)則,不斷調(diào)整網(wǎng)絡(luò)權(quán)值,使網(wǎng)絡(luò)的誤差平方和最小的模型,該模型具有較強(qiáng)的學(xué)習(xí)能力,并儲(chǔ)存輸入—輸出模式映射關(guān)系。
計(jì)算實(shí)際輸出yj的公式為:
(1)
其中:yj為第j個(gè)輸出值;xi為第i個(gè)輸入值;Wi為第i個(gè)輸入值對(duì)第j個(gè)輸出值的權(quán)值。
f(x)函數(shù)為Sigmoid函數(shù),常與單位階躍函數(shù)用于構(gòu)造人工神經(jīng)網(wǎng)絡(luò)[2],即:
(2)
其中:x為Sigmoid函數(shù)的輸入變量。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
按誤差反向傳播方向調(diào)整權(quán)值,從輸出節(jié)點(diǎn)開始返回到隱含層按式(3)修正權(quán)值:
(3)
其中:Wij(k+1)為第k+1次調(diào)整時(shí),第i個(gè)輸入值對(duì)第j個(gè)輸出值的權(quán)值;Wij(k)為第k次調(diào)整時(shí),第i個(gè)輸入值對(duì)第j個(gè)輸出值的權(quán)值;η為調(diào)整參數(shù),是一個(gè)常數(shù)。
δj為第j個(gè)輸出值yj的Delta(δ)學(xué)習(xí)規(guī)則的權(quán)值調(diào)整參數(shù),按式(4)計(jì)算:
,當(dāng)j為輸出點(diǎn)時(shí) (4)
,當(dāng)j為隱節(jié)點(diǎn)時(shí)1/2
其中:δj為第j個(gè)輸出值的Delta(δ)學(xué)習(xí)規(guī)則的權(quán)值調(diào)整參數(shù);Tj為第j個(gè)輸出值的期望輸出;Wkj為第k個(gè)輸入值對(duì)第j個(gè)輸出值的權(quán)值。
當(dāng)使用沖量項(xiàng)時(shí),權(quán)值按式(5)計(jì)算:
(5)
其中:α為給定的學(xué)習(xí)率;Wij(k-1)為第k-1次調(diào)整時(shí),第j個(gè)輸入值對(duì)第i個(gè)輸出值的權(quán)值。
訓(xùn)練目標(biāo)是使誤差函數(shù)E最小,E的定義如下:
(6)
其中:E為BP網(wǎng)絡(luò)訓(xùn)練目標(biāo)誤差;p為代表第P個(gè)樣本;tjp為輸出層第j個(gè)神經(jīng)元在模式P作用下的期望輸出;yjp為輸出層第j個(gè)神經(jīng)元在模式P作用下的實(shí)際輸出。
1.2 徑向基函數(shù)算法(RBF)
徑向基(Radial Basis Function, RBF)神經(jīng)網(wǎng)絡(luò)是具有單隱層的3層前饋網(wǎng)絡(luò),其結(jié)構(gòu)與多層前向網(wǎng)絡(luò)BP結(jié)構(gòu)類似,由輸入層、隱層、輸出層構(gòu)成,如圖2所示[3]。與BP網(wǎng)絡(luò)不同的是從輸入層到隱層的映射是非線性的,而隱層空間到輸出空間的映射是線性的。
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
高斯基函數(shù)是RBF神經(jīng)網(wǎng)絡(luò)隱層常用的激活函數(shù),網(wǎng)絡(luò)將根據(jù)訓(xùn)練數(shù)據(jù)自動(dòng)調(diào)整隱層結(jié)構(gòu)[4-7],其激活函數(shù)可表示為:
(7)
由圖2所示的徑向基神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可得網(wǎng)絡(luò)輸出為:
,其中 j=1,2,…,n (8)
其中:xp=(xp1,xp2,…,xpm)T為第p個(gè)樣本的輸入;P為樣本總數(shù);ci為網(wǎng)絡(luò)隱層節(jié)點(diǎn)的中心;‖xp-ci‖為歐氏范數(shù);c為高斯函數(shù)的中心;σ為高斯函數(shù)的方差。
設(shè)T是樣本的期望輸出值,那么基函數(shù)的方差可表示為:
(9)
求解基函數(shù)的中心c、方差σ以及隱層到輸出層權(quán)值Wij是RBF神經(jīng)網(wǎng)絡(luò)的核心部分。RBF有多種學(xué)習(xí)方法,其中包括隨機(jī)選取中心法、自組織選取法等。本研究采用的是自組織選取法,該方法分為兩個(gè)階段:自組織學(xué)習(xí)階段和有導(dǎo)師學(xué)習(xí)階段,第一階段自組織學(xué)習(xí)階段主要是求取基函數(shù)的中心c和方差σ,而第二階段主要是在第一階段的基礎(chǔ)上求解隱層到輸出層的權(quán)值Wij。
1.3 廣義回歸算法(GRNN)
廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)具有很強(qiáng)的非線性映射能力、柔性網(wǎng)絡(luò)結(jié)構(gòu)、高度的容錯(cuò)性和魯棒性,適用于解決非線性問題。與RBF網(wǎng)絡(luò)相比,GRNN在逼近能力和學(xué)習(xí)速度上較強(qiáng),結(jié)果最后收斂于樣本量積聚較多的優(yōu)化回歸面,并且其預(yù)測(cè)效果不受樣本容量的影響。
GRNN由輸入層、模式層、求和層和輸出層組成,如圖3所示。對(duì)應(yīng)網(wǎng)絡(luò)輸入X=[x1,x2,…,xn]T,其輸出為Y=[y1,y2,…,yk]T。
圖3 GRNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
(1)輸入層
輸入層各神經(jīng)元是簡(jiǎn)單的分布單元,將輸入變量傳給模式層,且輸入層神經(jīng)元個(gè)數(shù)與學(xué)習(xí)樣本中輸入向量的維數(shù)相等。
(2)模式層
模式層各神經(jīng)元對(duì)應(yīng)不同的樣本,且其神經(jīng)元數(shù)目等于樣本的數(shù)目n,神經(jīng)元傳遞函數(shù)為:
,i=1,2,…,n (10)
其中:X為網(wǎng)絡(luò)輸入變量;Xi為第i個(gè)神經(jīng)元對(duì)應(yīng)的學(xué)習(xí)樣本;pi為模式層神經(jīng)元i的輸出值。
(3)求和層
求和層中使用兩種神經(jīng)元進(jìn)行求和。
一類計(jì)算公式是對(duì)所有模式層神經(jīng)元的輸出進(jìn)行算術(shù)求和,其模式層與各神經(jīng)元的連接權(quán)值為1,傳遞函數(shù)為:
(11)
其中:SD為所有模式層神經(jīng)元輸出的算術(shù)求和值。
另一類計(jì)算公式是對(duì)所有模式層神經(jīng)元的輸出進(jìn)行加權(quán)求和,模式層中第i個(gè)神經(jīng)元與求和層中第j個(gè)分子求和神經(jīng)元之間的連接權(quán)值為第i個(gè)輸出樣本Yi中的第j個(gè)元素,傳遞函數(shù)為:
,其中j=1,2,…,k (12)
其中:Yij為輸出樣本Yi中的第j個(gè)元素;SNj為所有模式層神經(jīng)元輸出的加權(quán)求和值。
(4)輸出層
輸出層中的神經(jīng)元數(shù)目等于學(xué)習(xí)樣本中輸出向量的維數(shù)k,各神經(jīng)元將求和層的輸出相除,神經(jīng)元j的輸出yj對(duì)應(yīng)預(yù)測(cè)結(jié)果的第j個(gè)元素,即:
,其中j=1,2,…,k (13)
2 交通量預(yù)測(cè)模型設(shè)計(jì)
2.1 問題描述
隨著高速公路的快速發(fā)展,交通問題已成為影響各城市發(fā)展的瓶頸問題,國內(nèi)外的專家學(xué)者也對(duì)這一問題進(jìn)行了大量的研究。1978年Levin和Krause研究用貝葉斯算法,來判斷交通事件的嚴(yán)重性與否,該算法適用于常發(fā)性擁擠和偶發(fā)性交通擁擠的判別[8]。1990年P(guān)ersaudetal利用大量交通流數(shù)據(jù),生成“流量—占有率”關(guān)系模板[9]。將觀測(cè)的交通流數(shù)據(jù)具有的“流量—占有率”關(guān)系與模板進(jìn)行比較,可判斷是否發(fā)生了交通擁擠,且能進(jìn)一步判斷是偶發(fā)性還是常發(fā)性擁擠,并研究出其對(duì)交通事件的影響。神經(jīng)網(wǎng)絡(luò)用于交通流預(yù)測(cè)的優(yōu)點(diǎn)是其不需要建立復(fù)雜的數(shù)學(xué)模型而實(shí)現(xiàn)交通流預(yù)測(cè)的目的,其學(xué)習(xí)功能是智能化的重要體現(xiàn)。
2.2 模型建立
用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)交通量,是基于歷史交通數(shù)據(jù)的一種預(yù)測(cè)算法。預(yù)測(cè)實(shí)現(xiàn)的主要步驟如下:
(1)數(shù)據(jù)清洗及歸一化處理:歷史交通數(shù)據(jù)是預(yù)測(cè)的基礎(chǔ),而采集到的交通數(shù)據(jù)可能存在錯(cuò)誤、丟失、冗余現(xiàn)象,因此在將其作為模型的輸入數(shù)據(jù)之前,需要進(jìn)行清洗處理,并根據(jù)神經(jīng)網(wǎng)絡(luò)的特點(diǎn),需要將數(shù)據(jù)進(jìn)行歸一化處理;
(2)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè):選擇一定量的處理后的歷史數(shù)據(jù),將其作為輸入數(shù)據(jù),輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行交通量預(yù)測(cè);
(3)預(yù)測(cè)結(jié)果反歸一化處理:將神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)出的結(jié)果進(jìn)行反歸一化處理,得到常規(guī)單位的交通量,并與實(shí)際數(shù)據(jù)進(jìn)行對(duì)比校驗(yàn),得出交通量預(yù)測(cè)的結(jié)論。
交通量預(yù)測(cè)模型及其實(shí)現(xiàn)流程如圖4所示。
3 交通量預(yù)測(cè)實(shí)例及結(jié)果分析
3.1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練與預(yù)測(cè)實(shí)現(xiàn)
對(duì)BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)及GRNN網(wǎng)絡(luò)進(jìn)行了訓(xùn)練,并選擇部分實(shí)際數(shù)據(jù)作為樣本值,對(duì)預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比分析,三種神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)及對(duì)比結(jié)果如圖 5所示。
圖4 交通量預(yù)測(cè)模型及其實(shí)現(xiàn)流程圖
由圖5、圖6、圖7可以看出,RBF跟蹤效果較好,GRNN跟蹤效果次之,BP網(wǎng)絡(luò)跟蹤效果較差。
圖5 BP網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果 圖6 RBF網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果 圖7 GRNN網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果
3.2 預(yù)測(cè)效果分析
本研究使用如下性能指標(biāo)來評(píng)價(jià)和比較預(yù)測(cè)各個(gè)神經(jīng)網(wǎng)絡(luò)模型的結(jié)果:
(14)
(15)
(16)
(17)
其中:MAE——平均絕對(duì)誤差;
MRE——平均相對(duì)誤差;
MARE——平均絕對(duì)相對(duì)誤差;
max ARE——最大絕對(duì)相對(duì)誤差。
預(yù)測(cè)效果誤差分析的數(shù)據(jù)結(jié)果如表1所示。
表 1 預(yù)測(cè)結(jié)果誤 BP誤差值 RBF誤差值 GRNN誤差值
MAE -11.913 2 -7.455 7 -0.813 8
MRE -0.009 5 -0.029 5 -0.001 8
MARE 0.010 0 0.119 9 0.004 2
max ARE 0.601 3 0.119 9 0.252 1
為了使分析結(jié)果更加直觀,研究將表 1數(shù)據(jù)進(jìn)行了圖形化處理,如圖8所示。
圖 8 預(yù)測(cè)結(jié)果誤差分析圖
綜合分析可知,RBF網(wǎng)絡(luò)的最大絕對(duì)相對(duì)誤差maxARE最小,GRNN網(wǎng)絡(luò)的平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MRE)及平均絕對(duì)相對(duì)誤差(MARE)最小。
4 結(jié) 語
通過對(duì)結(jié)果的綜合比較分析,本研究認(rèn)為BP網(wǎng)絡(luò)不穩(wěn)定,根據(jù)訓(xùn)練次數(shù)的不同,預(yù)測(cè)結(jié)果有較大浮動(dòng),不宜用其預(yù)測(cè)交通數(shù)據(jù),若要使用,需進(jìn)行大量訓(xùn)練,標(biāo)定網(wǎng)絡(luò)的各類參數(shù),耗時(shí)較長(zhǎng);RBF網(wǎng)絡(luò)的跟蹤效果較好,基本可滿足交通預(yù)測(cè)的需求,且訓(xùn)練所需時(shí)間較短,可滿足短時(shí)段交通數(shù)據(jù)實(shí)時(shí)預(yù)測(cè)的需求;GRNN網(wǎng)絡(luò)預(yù)測(cè)的整體性較好,不會(huì)出現(xiàn)大的偏差,且預(yù)測(cè)效果也不錯(cuò),各類誤差均較小,但跟蹤效果不是很好,適用于較長(zhǎng)時(shí)段的整體交通數(shù)據(jù)的預(yù)測(cè)。由于研究者知識(shí)水平有限,研究的部分結(jié)論可能存在一定的片面性,有待進(jìn)一步的分析驗(yàn)證。
參考文獻(xiàn)
[1]劉金琨.智能控制(第2版)[M].北京:電子工業(yè)出版社,2009.
[2] Ito, Y. . Representation of Functions by Superpositions of A Step or Sigmoid Function and Their Applications to Neural Network Theory[J].Neural Networks,1991,4(3): 385-394.
[3] MATLAB中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010.
[4]周欣榮,柴干. RBF神經(jīng)網(wǎng)絡(luò)在短時(shí)段交通流預(yù)測(cè)上的應(yīng)用[J].公路交通科技,2007(8):8-10.
[5]周欣榮.高速公路短時(shí)段交通流預(yù)測(cè)方法研究[D].南京:東南大學(xué),2006.
[6]況愛武,黃中祥.基于RBF神經(jīng)網(wǎng)絡(luò)的短時(shí)交通流預(yù)測(cè)[J].系統(tǒng)工程,2004,22(2):63-65.
[7]胡浩民.基于 RBF 神經(jīng)網(wǎng)絡(luò)并行學(xué)習(xí)模型的數(shù)據(jù)分類及預(yù)測(cè)研[D].上海:上海師范大學(xué),2003.
[8] Levin,M,Krause,G.M.Incident Detection:A Bayesian Approach,Transportation[J]. Research Record ,1978:52-58.
[9] Persaud, B.N. , Hall , RL.Catastrophe Theory and Patterns in 30-second Freeway Traffic Data-Implication for incident detection[J].Transportation Research Part A,1990,23(2):103-113.