賈若 戴昇宏 黃霓 李水瀅 劉志遠(yuǎn)
(東南大學(xué) 交通學(xué)院,江蘇 南京 211189)
在國(guó)家、城市發(fā)展中,經(jīng)濟(jì)發(fā)展與交通建設(shè)一直密不可分。近年來(lái),我國(guó)經(jīng)濟(jì)的高速發(fā)展,使城市交通出行需求急劇增加,但城市基礎(chǔ)設(shè)施建設(shè)速度較為滯后,無(wú)法滿足快速增長(zhǎng)的出行需求,交通擁堵已成為城市交通運(yùn)輸中最常見(jiàn)的問(wèn)題之一。交通擁堵是一種車多擁擠且道路上車輛行駛速度緩慢的現(xiàn)象,國(guó)內(nèi)外每年因交通擁堵產(chǎn)生了大量的經(jīng)濟(jì)損失,且造成能源浪費(fèi)以及環(huán)境污染。為了有效地減少擁堵的危害,各國(guó)學(xué)者都致力于緩解以及消除交通擁堵的研究與實(shí)踐,而這其中關(guān)鍵的一步便是交通擁堵的判別與分析。
國(guó)外學(xué)者自20世紀(jì)50年代起,就開(kāi)始了對(duì)交通擁堵現(xiàn)象的系統(tǒng)研究。從傳統(tǒng)的交通流理論方法到新興的與計(jì)算機(jī)等學(xué)科交叉的機(jī)器學(xué)習(xí)方法,各國(guó)學(xué)者已經(jīng)進(jìn)行了許多有效的探索。國(guó)內(nèi)對(duì)于交通擁堵判別的研究雖然起步較國(guó)際落后,但我國(guó)學(xué)者根據(jù)國(guó)內(nèi)的實(shí)際情況進(jìn)行了拓展與創(chuàng)新,進(jìn)一步推動(dòng)了交通擁堵判別與分析理論的發(fā)展。
國(guó)外的研究通常采用研究交通異常事件的方法對(duì)交通擁堵進(jìn)行判斷,我國(guó)通常采用道路占有率、排隊(duì)車輛及交通流速度作為城市交通擁堵的檢測(cè)標(biāo)準(zhǔn),通過(guò)對(duì)道路通行能力、占有率等交通參數(shù)進(jìn)行閾值判斷,綜合評(píng)判城市道路是否產(chǎn)生了擁堵。在交通擁堵自動(dòng)檢測(cè)中,當(dāng)某路段在一定時(shí)間內(nèi),道路占有率、交通流速度和交通量等多個(gè)參數(shù)均超過(guò)閾值時(shí),才認(rèn)為存在交通擁堵[1]。傳統(tǒng)交通流理論的模型,通常使用傳統(tǒng)物理學(xué)、數(shù)學(xué)等基礎(chǔ)學(xué)科的理論描述交通行為。模型雖然合理簡(jiǎn)單、有明確的物理意義,但其限制條件多[2]。相比之下,機(jī)器學(xué)習(xí)使用數(shù)據(jù)驅(qū)動(dòng)方法,深入挖掘數(shù)據(jù)信息,對(duì)于異常特征及其特征變化十分敏感,同時(shí)更為注重模型的應(yīng)用價(jià)值和算法研究[3]。這類模型主要用于復(fù)雜交通流現(xiàn)象的研究,其中,一些機(jī)器學(xué)習(xí)方法能夠更好的檢測(cè)交通異常事件,并更好地獲取車流速度、道路占有率以及是否有擁堵車流等特征的變化,能夠被用于交通擁堵判別。
文中主要從傳統(tǒng)的交通流理論方法和機(jī)器學(xué)習(xí)方法中歸納總結(jié)交通擁堵判別方法。文中的主要內(nèi)容包括:交通流理論方法中的基于指標(biāo)方法、基本圖方法、元胞自動(dòng)機(jī)模型(CA Model)、元胞傳輸模型(CTM Model)以及二流理論(Two-fluid Model)。在機(jī)器學(xué)習(xí)部分,依次介紹了貝葉斯理論、馬爾科夫這兩種基于概率圖模型的方法,還介紹了支持向量機(jī)、K-近鄰、神經(jīng)網(wǎng)絡(luò)、聚類等非參數(shù)統(tǒng)計(jì)方法。最后對(duì)現(xiàn)有的傳統(tǒng)交通流理論方法和機(jī)器學(xué)習(xí)方法進(jìn)行總結(jié),并指出一些有待解決的研究方向。
交通擁堵最直接體現(xiàn)是出行時(shí)間的增加和車輛行駛速度的下降,但各國(guó)對(duì)交通擁堵尚無(wú)統(tǒng)一的定義,也沒(méi)有統(tǒng)一的衡量標(biāo)準(zhǔn)[4]。自20世紀(jì)50年代起,國(guó)外相關(guān)科研機(jī)構(gòu)開(kāi)始對(duì)交通擁堵評(píng)價(jià)體系進(jìn)行研究,提出了近百種用于評(píng)價(jià)交通擁堵?tīng)顟B(tài)的指標(biāo)。對(duì)于路網(wǎng)中交通流速度降低、交通瓶頸的出現(xiàn)及車輛占有率增加等情況,研究者們通常根據(jù)多次實(shí)驗(yàn)結(jié)果為各指標(biāo)設(shè)定某一闕值,將模型的實(shí)際運(yùn)行結(jié)果與闕值進(jìn)行對(duì)比,進(jìn)而判別擁堵?tīng)顟B(tài)。其中傳統(tǒng)擁堵?tīng)顟B(tài)判別的指標(biāo)可分為基于出行時(shí)間的指標(biāo)、基于排隊(duì)論的指標(biāo)、基于公路通行能力手冊(cè)(HCM)的指標(biāo)。不同指標(biāo)適用于高速公路或城市道路等不同場(chǎng)景下的交通擁堵判別。在此基礎(chǔ)上,研究人員對(duì)不同指標(biāo)進(jìn)行組合,衍生出許多更加有效的基于指標(biāo)的擁堵評(píng)價(jià)模型。
1.1.1 適用于高速公路的指標(biāo)
(1)行程時(shí)間與延誤
行程時(shí)間與延誤是評(píng)價(jià)高速公路是否擁堵的有效指標(biāo)。行程時(shí)間通常由地點(diǎn)車速或浮動(dòng)車法調(diào)查得到。延誤是指因道路條件、天氣、排隊(duì)或者交通管制等各種因素引起的行駛時(shí)間的損失,表現(xiàn)為車輛通過(guò)某一段路時(shí)實(shí)際行駛時(shí)間與理想行駛的時(shí)間差[5]。
美國(guó)國(guó)家高速公路合作研究項(xiàng)目根據(jù)行程時(shí)間定義交通擁堵,將其分為可接受擁堵與不可接受擁堵[6- 8];其中當(dāng)行程時(shí)間大于自由流下的正常行程時(shí)間,且所形成的延誤時(shí)間較大時(shí),即認(rèn)為發(fā)生擁堵,當(dāng)延誤超過(guò)民眾接受范圍時(shí)即為不可接受擁堵。
(2)占有率
占有率包括時(shí)間占有率與空間占有率。空間占有率表示某一時(shí)刻某一路段內(nèi),車輛總長(zhǎng)度與車道總長(zhǎng)度之比,表明道路實(shí)際占用情況;但道路的空間占有率很難直接得到,因此往往很少應(yīng)用。時(shí)間占有率代表任一道路上所有車輛通過(guò)該段的累計(jì)時(shí)間與所有車輛觀測(cè)總時(shí)間的比值,反映了該路段車輛的排隊(duì)時(shí)間。根據(jù)道路交通流理論,車流密度小時(shí)車速快,時(shí)間占有率低,車流密度大時(shí)車速慢,時(shí)間占有率高。
美國(guó)芝加哥交通管理部門規(guī)定,車道占有率高于30%并且該狀態(tài)維持的時(shí)間超過(guò)5min時(shí)即為交通擁堵。Koukis等[8]對(duì)比分析了多個(gè)臨近周期的占有率數(shù)據(jù),并將結(jié)果與閾值對(duì)比進(jìn)行擁堵判斷;國(guó)內(nèi)學(xué)者莊斌等[9]采用交通流量與占有率的增量變化率對(duì)交通擁堵?tīng)顟B(tài)進(jìn)行判別。
(3)服務(wù)水平
服務(wù)水平通常根據(jù)平均交叉口延誤及V/C比進(jìn)行判斷,美國(guó)交通管理部門根據(jù)V/C比將公路服務(wù)水平分為6級(jí),當(dāng)其大于0.9時(shí)處于不穩(wěn)定流狀態(tài),稍有干擾即處于擁堵?tīng)顟B(tài);日本與我國(guó)分別實(shí)行對(duì)應(yīng)的三級(jí)、六級(jí)公路服務(wù)水平分類方法。
除此之外,區(qū)間平均車速也用于高速公路交通擁堵的判斷,例如公路通行能力手冊(cè)(HCM)當(dāng)中使用區(qū)間平均車速計(jì)算高速公路交織區(qū)服務(wù)水平判斷擁堵。區(qū)間平均車速需要特定地區(qū)長(zhǎng)期的大量數(shù)據(jù)統(tǒng)計(jì)結(jié)果,不具有普適性,但不同地區(qū)可根據(jù)實(shí)際情況自行制定對(duì)應(yīng)標(biāo)準(zhǔn),判斷擁堵?tīng)顟B(tài)。
1.1.2 適用于城市道路的指標(biāo)
(1)區(qū)間平均車速
區(qū)間平均車速可以更好的體現(xiàn)出車輛在某一特定的時(shí)間及路段上的行駛狀態(tài)[10],該指標(biāo)不僅能夠反應(yīng)每輛車各自的交通行為,同時(shí)能夠隨著實(shí)際的交通供給與需求狀態(tài)改變而變化[11]。某一特定路段上的區(qū)間平均車速也可利用該區(qū)間長(zhǎng)度除以此路段上所有車輛的平均行程時(shí)間。
日本道路公路團(tuán)對(duì)城市快速路的擁堵定義為,當(dāng)某一城市快速路段上車隊(duì)以低于40 km/h的速度行駛或反復(fù)多次停駛,并持續(xù)該狀態(tài)15 min及行駛1 km以上即為擁堵[12];在2002年,我國(guó)公安部出臺(tái)規(guī)定,根據(jù)城市主干路的區(qū)間平均車速對(duì)交通運(yùn)行狀態(tài)進(jìn)行描述,定義區(qū)間平均車速低于30 km/h時(shí)的道路處于擁堵?tīng)顟B(tài),低于10 km/h時(shí)為交通嚴(yán)重?fù)矶隆5聡?guó)學(xué)者Kerner[13]基于經(jīng)典交通流理論提出了三相交通流理論,并以區(qū)間平均速度區(qū)分交通自由流與擁堵?tīng)顟B(tài),發(fā)現(xiàn)擁堵交通流中的車速低于自由流中的最低車速;北京工業(yè)大學(xué)交通工程北京市重點(diǎn)研究室[14]通過(guò)數(shù)據(jù)采集、利用默認(rèn)闕值降噪處理數(shù)據(jù),類比三相交通流理論,運(yùn)用統(tǒng)計(jì)分析方法得出交通流速度低于30 km/h時(shí)進(jìn)入擁堵?tīng)顩r。
(2)排隊(duì)長(zhǎng)度
排隊(duì)長(zhǎng)度指自交通間斷點(diǎn),排隊(duì)或低速行駛的車輛占有的道路長(zhǎng)度。排隊(duì)長(zhǎng)度越長(zhǎng),擁堵越嚴(yán)重,該指標(biāo)反映的擁堵情況直觀而易于理解。我國(guó)規(guī)定,3個(gè)信號(hào)周期車輛未能通過(guò)交叉口即為阻塞。當(dāng)交叉口進(jìn)口處排隊(duì)延長(zhǎng)到上游交叉口時(shí),此時(shí)車輛的排隊(duì)長(zhǎng)度不能準(zhǔn)確評(píng)價(jià)交通擁堵?tīng)顟B(tài)。
排隊(duì)長(zhǎng)度比表示停車線上游排隊(duì)長(zhǎng)度與停車線至上游交叉口停車線長(zhǎng)度之比。若排隊(duì)長(zhǎng)度比在低于0.5下的某一值附近浮動(dòng)時(shí),排隊(duì)長(zhǎng)度小,交通較為流暢;若排隊(duì)長(zhǎng)度比趨近于1,則排隊(duì)即將溢出,交通擁堵嚴(yán)重。
(3)流量比通行能力(V/C)
流量比通行能力指理想的道路交通條件下,最大服務(wù)交通量與基本通行能力之比,也稱道路負(fù)荷度,即V/C比。由于一個(gè)V/C比的值通常對(duì)應(yīng)兩種相反的交通狀態(tài),一般不單獨(dú)用于交通擁堵評(píng)價(jià),而是與其他參數(shù)共同組成評(píng)價(jià)體系。
20世紀(jì)80年代末,Lindley[15]將實(shí)驗(yàn)中獲取的高峰小時(shí)交通量擴(kuò)樣為日交通量,使用V/C比對(duì)交通擁堵進(jìn)行評(píng)價(jià),若該值大于0.77時(shí),認(rèn)為道路處于擁堵?tīng)顟B(tài);Cottrel[16]提出AADT/C的概念,美國(guó)加州35個(gè)城市規(guī)定了當(dāng)V/C比超過(guò)1.0或者AADT/C超過(guò)9.0時(shí)即發(fā)生了擁堵[17]。焦海賢等[18]提出虛擬路網(wǎng)容量均衡分析模型,考慮道路供需矛盾關(guān)系以V/C比為指標(biāo)判別城市交通網(wǎng)絡(luò)中的交通瓶頸,為緩解城市交通擁堵、保障城市交通資源供需平衡提供了新思路。
(4)平均交叉口延誤
平均交叉口延誤是高峰行駛期間,所有車輛在交叉口延長(zhǎng)度內(nèi)行駛的實(shí)際時(shí)間與在該路段內(nèi)以自由流速度行駛時(shí)間的差值的均值,該值能夠?qū)矶铝炕^為準(zhǔn)確地評(píng)價(jià)交叉口擁堵情況。
對(duì)于城市道路,流量比通行能力(V/C)在評(píng)價(jià)城市道路通行狀況、公共交通運(yùn)行狀況等方面有著廣泛應(yīng)用。在城市道路中,使用平均交叉口延誤及V/C比評(píng)價(jià)道路服務(wù)水平。但相比高速公路服務(wù)水平,城市道路服務(wù)水平尚且沒(méi)有統(tǒng)一理論,徐林等[19]定量劃分了北京的城市道路通行能力,初步探索了城市道路服務(wù)水平分級(jí)方法。
1.1.3 綜合指標(biāo)判斷擁堵
相比上述采用單一指標(biāo)對(duì)交通擁堵?tīng)顟B(tài)進(jìn)行判別,許多復(fù)雜情況下的擁堵判別需要采用多種參數(shù)進(jìn)行判斷,將各種不同的指標(biāo)組合在一起,通過(guò)系統(tǒng)的模型與算法對(duì)交通擁堵進(jìn)行判別。
2007年Hartgen等[20]通過(guò)對(duì)不同地區(qū)的大量歷史數(shù)據(jù)分析,提出了出行時(shí)間指數(shù)(TTI)與超負(fù)荷車道長(zhǎng)度(LMO)的擁堵指標(biāo)。其中出行時(shí)間指數(shù)(TTI)是由行駛時(shí)間與自由流下行駛時(shí)間的比值定義的擁堵判別指標(biāo),超負(fù)荷車道為流量通行能力比大于等于1.0的車道。Bertini等[21]在2004年,利用俄勒岡州過(guò)境交通區(qū)的公交調(diào)度系統(tǒng)數(shù)據(jù)與車輛自動(dòng)定位(AVL)數(shù)據(jù)獲取了行駛時(shí)間和速度兩種指標(biāo),以此分析交通運(yùn)行狀態(tài)。該研究有助于過(guò)境機(jī)構(gòu)或交通研究人員更好的進(jìn)行干線性能評(píng)估;Coifman等[22]在AVL數(shù)據(jù)中獲取了出行時(shí)間與平均速度,定量分析了交通流的情況;Bertin等[23]在2005年,利用倫敦附近環(huán)路探測(cè)器的數(shù)據(jù),進(jìn)行了高速公路車道縮減處的交通流特性研究,采用時(shí)間平均速度、占有率等指標(biāo),探討了排隊(duì)消散流量與排隊(duì)形成流量之前的關(guān)系,通過(guò)計(jì)算交通波的傳播速度,判斷交通擁堵開(kāi)始和持續(xù)的時(shí)間。
在道路服務(wù)水平的評(píng)價(jià)中,通常根據(jù)平均交叉口服務(wù)水平及V/C比兩個(gè)指標(biāo)進(jìn)行判斷。在交通流理論中,交通量由行駛速度及車輛密度共同確定,當(dāng)三參數(shù)均處于理想狀態(tài)時(shí),交通流處于臨界狀態(tài),一旦車的數(shù)量有所增大,交通流量便會(huì)減小,同時(shí)行駛速度減小,交通流密度增大,該段道路便被判定為擁堵?tīng)顟B(tài)。
不同單一指標(biāo)以不同方式組合在一起,可以衍生出許多種行之有效的擁堵?tīng)顩r綜合評(píng)價(jià)模型。與單一指標(biāo)下的擁堵判別相比,綜合判斷指標(biāo)適用范圍更廣,判斷判別的結(jié)果也更加可靠。上述指標(biāo)也常作為機(jī)器學(xué)習(xí)方法的參數(shù),利用機(jī)器學(xué)習(xí)模型與方法,能夠更準(zhǔn)確地捕捉指標(biāo)特征的變化,且更有效地利用交通數(shù)據(jù),從而更好地判別交通擁堵。基于指標(biāo)判別擁堵的重要參考文獻(xiàn)匯總?cè)绫?所示,將排隊(duì)論瓶頸值和交通流參數(shù)的變化進(jìn)行量化,通過(guò)單一指標(biāo)和綜合指標(biāo)對(duì)交通擁堵進(jìn)行判別。
上述基于指標(biāo)的方法,通常用于判別局部路網(wǎng)的擁堵情況,實(shí)際應(yīng)用中具有相對(duì)的局限性。隨著人們對(duì)交通擁堵的研究從局部區(qū)域逐漸轉(zhuǎn)移至整個(gè)路網(wǎng),宏觀基本圖方法也逐漸被提出。
宏觀基本圖(MFD)的概念最早由Daganzo和Geroliminis[24]提出,并且他們?cè)诤罄m(xù)的研究中給出了宏觀基本圖的定義,被認(rèn)為可以用于描述城市道路網(wǎng)中移動(dòng)車輛數(shù)量與道路網(wǎng)絡(luò)運(yùn)行水平之間的一般關(guān)系。宏觀基本圖模型通過(guò)統(tǒng)計(jì)分析路網(wǎng)的歷史數(shù)據(jù),得到不同參數(shù)之間的關(guān)系,從而得到宏觀基本圖模型。通常包括密度-速度模型、流量-速度模型和流量-密度模型。其中,最具代表性的密度-速度模型由Greenshields[25]在20世紀(jì)30年代提出。
根據(jù)MFD理論[26],現(xiàn)有兩種具有代表性的宏觀基本圖相關(guān)參數(shù)計(jì)算方法,其一為
(1)
式中:kw為城市路網(wǎng)范圍內(nèi)的加權(quán)密度;ow為其加權(quán)時(shí)間占有率;i為路網(wǎng)中路段編號(hào);li為路段i的長(zhǎng)度;qi為路段i的車流量;s為路網(wǎng)中行駛車輛的平均長(zhǎng)度;oi為路段i的時(shí)間占有率;ki為路段i的密度。
還有一種方法為
(2)
式中,N為分析的路段或者檢測(cè)斷面數(shù)量,k為路網(wǎng)的平均密度,v為路網(wǎng)的平均速度,q為路網(wǎng)的平均流量。
1.2.1 宏觀基本圖在城市道路擁堵判別中的應(yīng)用
Daganzo等[27]于2001年在日本橫濱,使用主干道上的固定傳感器與出租車載移動(dòng)傳感器,記錄車輛占有率及車輛行駛狀況,并于2007年提出了宏觀基本圖的概念。Buisson等[28]于2009年在法國(guó)圖盧茲市,利用線圈檢測(cè)器監(jiān)測(cè)路網(wǎng)中的交通流運(yùn)行數(shù)據(jù),根據(jù)得到的MFD顯示,路網(wǎng)中宏觀交通量隨密度的變化概率與路網(wǎng)中檢測(cè)器與停車線的距離成正比。賀正冰等[29]在2014年利用北京市快速環(huán)路上分布的交通監(jiān)測(cè)器,利用宏觀基本圖的思想,研究得到路網(wǎng)密度分布的不均勻性與網(wǎng)絡(luò)流量的函數(shù)關(guān)系有相同的變化趨勢(shì)。通過(guò)分析快速環(huán)路的交通擁堵變化規(guī)律,得出該特征的原因是北京市快速環(huán)路擁堵的傳播過(guò)程是中心向外輻射的過(guò)程。
1.2.2 宏觀基本圖在高速公路擁堵判別中的應(yīng)用
Saberi等[30],在2012年利用波蘭高速公路網(wǎng)的數(shù)據(jù),研究了擁堵判別中信號(hào)控制對(duì)宏觀基本圖造成的影響與滯后性。姬楊蓓蓓[31]在2013年研究采用Vissim仿真實(shí)驗(yàn),根據(jù)實(shí)測(cè)數(shù)據(jù)建立并標(biāo)定了阿姆斯特丹高速公路的仿真模型。通過(guò)對(duì)不同車道臨界密度的定量分析,量化了路網(wǎng)擁堵情況,并通過(guò)交通仿真使用MFD模型描述了路網(wǎng)交通擁堵的變化過(guò)程。Gavah等[32],于2011年提出,MFD模型只適用于高速公路網(wǎng)實(shí)施了交通管制措施的情況,如采取匝道控制、可變信息情報(bào)播報(bào)等。因?yàn)镸FD良好應(yīng)用或者得到光滑的宏觀基本圖的前提,是交通擁堵較為平均的分布在被測(cè)路網(wǎng)中,而這需要一定的交通管制措施。
運(yùn)用監(jiān)測(cè)手段獲取路網(wǎng)數(shù)據(jù),進(jìn)而繪制城市路網(wǎng)宏觀基本圖,雖然在宏觀基本圖與交通擁堵的研究中被廣泛適用,但通常因成本較高與數(shù)據(jù)缺失,難以得到完整宏觀基本圖,對(duì)深入分析有一定影響。因此目前大部分關(guān)于宏觀基本圖的研究均采用交通仿真獲得所需數(shù)據(jù)。交通流的基本圖方法能夠比較直觀地體現(xiàn)交通擁堵形成的原因與過(guò)程,但是由于閾值的難以界定,在實(shí)際使用中往往有較大的局限。宏觀基本圖的分析方法文獻(xiàn)整理如表2所示。
表1 基于交通擁堵指標(biāo)的重要文獻(xiàn)
表2 宏觀基本圖模型與應(yīng)用
元胞自動(dòng)機(jī)是粒子在一個(gè)由具有離散、有限狀態(tài)的元胞組成的空間上,按照某種局部規(guī)則在離散的時(shí)間維度上演化的動(dòng)力學(xué)系統(tǒng)模型[33]。元胞自動(dòng)機(jī)理論最初由“計(jì)算機(jī)之父”馮諾依曼提出,并在20世紀(jì)90年代起成為了道路交通流領(lǐng)域的熱點(diǎn)研究方向,可以用于擁堵的判別與評(píng)估。
最初用于交通研究的一維元胞自動(dòng)機(jī)模型模擬的是單車道的交通狀況,其中最具代表性的是在Wolfram[34]的元胞自動(dòng)機(jī)規(guī)則基礎(chǔ)上建立的一維模型(NS)[35]。
該模型將一條單車道用一個(gè)一維點(diǎn)陣表示,每個(gè)位置點(diǎn)代表一個(gè)元胞,其中空置或容納一輛車,運(yùn)行狀態(tài)取決于元胞是否空閑或者車速大小的不同,同時(shí)所有車輛按照特定的速度規(guī)則和位移規(guī)則運(yùn)動(dòng),模擬真實(shí)的交通狀況。
NS模型設(shè)置了一種較為理想的車輛運(yùn)行條件,能反映出車輛的啟動(dòng)和停止過(guò)程,表現(xiàn)出交通流的擁擠和非擁擠狀態(tài),對(duì)交通擁堵的判別有一定作用。但考慮到城市道路往往交錯(cuò)形成路網(wǎng),一維元胞自動(dòng)機(jī)模型無(wú)法更細(xì)致地表現(xiàn)其交通特性,因此基于二維元胞自動(dòng)機(jī)的模型(BML)[36]應(yīng)運(yùn)而生。
BML模型首先給出了一個(gè)二維周期性邊界的正方形網(wǎng)絡(luò),每個(gè)格點(diǎn)上空缺或者存在僅向東或僅向北行駛的車輛。不同方向的車流在奇偶時(shí)間步上錯(cuò)開(kāi)運(yùn)行,若某一輛車的前方格點(diǎn)上有車,則該車不運(yùn)行。
BML模型考慮了交通信號(hào)燈因素下的情況,但只模擬了交叉口情況而忽視了路段,并且車輛只能在兩個(gè)方向上行駛,仍然與實(shí)際的交通狀況有很大區(qū)別。
為了改正這些問(wèn)題,城市交通網(wǎng)絡(luò)模型[37](CS Model)在BML模型與NS模型結(jié)合的基礎(chǔ)上應(yīng)運(yùn)而生。并且在此之后,各國(guó)學(xué)者都致力于BML模型的擴(kuò)展與衍生。如Nagatani等[38- 40]分別在考慮了立交橋的設(shè)置、車輛的不對(duì)稱分布情形以及車輛的轉(zhuǎn)向情況后建立了新的元胞自動(dòng)機(jī)模型等。
總之,元胞自動(dòng)機(jī)模型形式簡(jiǎn)單,且易于在計(jì)算機(jī)上模擬、實(shí)現(xiàn)。該模型不僅能夠得到每一輛車的微觀特性,而且能表現(xiàn)交通流的宏觀特點(diǎn),從而進(jìn)行交通擁堵的判別。然而,元胞自動(dòng)機(jī)的研究雖然比較深入,理論也較為全面,但比較缺乏真正的應(yīng)用,因此在實(shí)際應(yīng)用中還需要進(jìn)一步的檢驗(yàn)。
LWR(Lighthill-Whitham Richards)模型是一個(gè)交通流一階流體動(dòng)力學(xué)模型,可以用以下方程來(lái)表示:
(3)
式中,Q為交通量,x為位移,k為密度,t為時(shí)間。
LWR模型從流體力學(xué)的角度較好地描述了交通流特性,但是由于其求解過(guò)程比較復(fù)雜,并沒(méi)有被很好地實(shí)際應(yīng)用,因此知名學(xué)者Daganzo[41- 43]在此基礎(chǔ)上提出了元胞傳輸模型。
元胞傳輸模型(CTM模型)在經(jīng)典的LWR方程的基礎(chǔ)上進(jìn)行了分段線性化處理,并將道路劃分為多個(gè)等距離的元胞,時(shí)間也同樣離散為多個(gè)時(shí)間間隔,原本的方程化簡(jiǎn)為如下的離散形式:
(4)
(5)
通過(guò)這樣的離散形式,LWR模型所描述的交通流現(xiàn)象得到了較好的數(shù)學(xué)解法。因此CTM模型能夠重現(xiàn)與實(shí)際交通流情況接近的現(xiàn)象,并進(jìn)行擁堵的判別與分析。
后來(lái),Daganzo又在考慮車流滯后效應(yīng)的因素后提出了遲滯元胞傳輸模型(LCTM),該模型具有更高的計(jì)算精度[44]。在此后的時(shí)間里,其他各國(guó)學(xué)者也在他的研究基礎(chǔ)上進(jìn)行了大量研究,先后提出了ELCTM模型、MCTM模型、SSM模型、ACTM模型、CCTM模型與LSCTM模型等[45],一步步提高了模型的普適性與準(zhǔn)確性,使其與真實(shí)的交通狀態(tài)特性越來(lái)越接近。
由于元胞傳輸模型與實(shí)際交通情況的良好擬合特性,其常常被用在交通擁堵機(jī)理的研究上,也在實(shí)踐中被用于交通擁堵的判別與分析。元胞自動(dòng)機(jī)模型和元胞傳輸模型的應(yīng)用整理后列于表3。
表3 元胞傳輸與元胞自動(dòng)機(jī)模型的應(yīng)用
除了LWR模型和CTM模型利用流體力學(xué)的理論知識(shí)進(jìn)行交通流的研究外,交通領(lǐng)域的研究者們從20世紀(jì)中期開(kāi)始一直都在嘗試著用動(dòng)力學(xué)理論描繪交通特性。
為了避免對(duì)不同的交通狀態(tài)下的細(xì)節(jié)進(jìn)行分類討論,Herman等[46]在動(dòng)力學(xué)理論的基礎(chǔ)上提出了二流理論,將交通流中存在的車輛分為運(yùn)動(dòng)和由于交通原因停止的兩類,并作出了如下兩個(gè)結(jié)論:①路網(wǎng)中車輛平均速度與運(yùn)動(dòng)車輛在整個(gè)交通流中所占的比重成正比;②路網(wǎng)中每單位距離的車輛行駛時(shí)間與單位距離的停車時(shí)間呈現(xiàn)線性相關(guān)趨勢(shì)。此后,Herman等[47]又在德克薩斯州的奧斯汀市進(jìn)行了一系列實(shí)驗(yàn),除了證明上述兩個(gè)結(jié)論的正確性外,還提出了:③路網(wǎng)中循環(huán)測(cè)試過(guò)程時(shí)測(cè)試車的平均停車時(shí)間與整個(gè)路網(wǎng)中的停車時(shí)間相一致的假設(shè)。
此后,這一理論被證明除了在路網(wǎng)中成立外,還在城市干道及其各部分、各時(shí)間段下成立[48],并且被用在了城市道路服務(wù)水平的評(píng)價(jià)上。張翛等[49]建立了基于二流理論的城市干道交通模型,并提出了一個(gè)評(píng)分函數(shù)來(lái)對(duì)其服務(wù)水平進(jìn)行評(píng)價(jià)。王殿海等[50]從二流理論出發(fā),對(duì)城市路網(wǎng)中宏觀層面的交通參數(shù)之間的關(guān)系進(jìn)行了推導(dǎo),由此建立了對(duì)宏觀交通狀態(tài)進(jìn)行評(píng)價(jià)的模型。
總之,二流理論由于其適用的廣泛性,在各種交通狀況下都可以直觀簡(jiǎn)單地使用,并且不需要考慮各個(gè)過(guò)程的細(xì)節(jié)問(wèn)題。因此,使用這一理論分析交通狀態(tài),進(jìn)行交通擁堵的判別往往能收到良好的效果。
傳統(tǒng)交通流理論模型運(yùn)用數(shù)學(xué)和物理學(xué)的定理來(lái)描述交通流特性,以分析的方法闡述交通現(xiàn)象及機(jī)理。但是數(shù)學(xué)和物理的模型并不能完全正確地描述現(xiàn)實(shí)復(fù)雜交通流。機(jī)器學(xué)習(xí)模型可以很好地克服此局限,它們沒(méi)有固定結(jié)構(gòu)約束,被證明與數(shù)據(jù)有更好的擬合[2]。利用機(jī)器學(xué)習(xí)方法判別擁堵的研究文獻(xiàn)整理于本章末尾的表4中。
建立概率圖模型也是常用的判別交通擁堵,預(yù)測(cè)交通流狀態(tài)的一類方法,其中具有代表性的模型包括貝葉斯網(wǎng)絡(luò)、馬爾科夫模型等。
2.1.1 貝葉斯網(wǎng)絡(luò)
(1)貝葉斯網(wǎng)絡(luò)簡(jiǎn)介
貝葉斯網(wǎng)絡(luò)從形式上看是一個(gè)有向無(wú)環(huán)圖,以結(jié)點(diǎn)表示變量,有向邊表示結(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,邊的權(quán)值為條件概率(設(shè)起點(diǎn)為A,終點(diǎn)為B,則有向邊的權(quán)值為P(A|B))。
(2)傳統(tǒng)貝葉斯網(wǎng)絡(luò)的構(gòu)造
構(gòu)造貝葉斯網(wǎng)絡(luò)的過(guò)程主要分為3步。
步驟1 確定變量集和變量域
步驟2 確定變量間拓?fù)潢P(guān)系,形成網(wǎng)絡(luò)結(jié)構(gòu)
建立網(wǎng)絡(luò)結(jié)構(gòu)最常見(jiàn)的方法就是從主觀的經(jīng)驗(yàn)出發(fā)(通常是依據(jù)專家知識(shí)),根據(jù)變量間的因果關(guān)系建立網(wǎng)絡(luò)結(jié)構(gòu),例如盛春陽(yáng)等[51]在使用貝葉斯網(wǎng)絡(luò)對(duì)交通狀態(tài)進(jìn)行預(yù)測(cè)時(shí),通過(guò)變量關(guān)系圖建立模型的網(wǎng)絡(luò)結(jié)構(gòu),直接獲得網(wǎng)絡(luò)結(jié)構(gòu),但缺陷是主觀成分較大?,F(xiàn)在也有學(xué)者從數(shù)據(jù)的相關(guān)性分析出發(fā),探索變量間的依賴關(guān)系,例如Liu等[52]學(xué)者在建立貝葉斯網(wǎng)路結(jié)構(gòu)時(shí),采用定向依賴式分析的方法,通過(guò)計(jì)算兩個(gè)變量之間的條件獨(dú)立性來(lái)確定兩個(gè)節(jié)點(diǎn)是否需要用邊來(lái)連接(即變量間是否存在關(guān)聯(lián)關(guān)系),然后再采用基于條件交互信息的碰撞判別來(lái)確定邊的方向。
步驟3 確定貝葉斯網(wǎng)絡(luò)的概率分布
如圖1所示,要想求得目標(biāo)——交通狀態(tài)的值,必須確定貝葉斯網(wǎng)絡(luò)的概率分布。確定概率分布的方式常常是從已有的數(shù)據(jù)和經(jīng)驗(yàn)出發(fā)得到先驗(yàn)概率,然后通過(guò)樣本訓(xùn)練得到后驗(yàn)分布,多次迭代,得到最終的概率分布。
圖1 判別交通狀態(tài)的貝葉斯網(wǎng)絡(luò)
(3)貝葉斯網(wǎng)絡(luò)的演變和發(fā)展
除了傳統(tǒng)的貝葉斯網(wǎng)絡(luò)以外,一些非傳統(tǒng)的貝葉斯網(wǎng)絡(luò)也開(kāi)始涌現(xiàn)。在一般情況下,交通流對(duì)時(shí)間敏感,具有明顯的高峰時(shí)段,因而在目前的研究中,常常使用含有時(shí)間序列的貝葉斯網(wǎng)絡(luò)來(lái)提高預(yù)測(cè)準(zhǔn)確度。張敬磊等[53]建立了基于時(shí)間序列的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò),為貝葉斯網(wǎng)絡(luò)增加了時(shí)間維度。
此外,由于單一模型的適用范圍小、普適性差,貝葉斯網(wǎng)絡(luò)通常與其它基本預(yù)測(cè)模型結(jié)合組成貝葉斯組合模型,通過(guò)貝葉斯網(wǎng)絡(luò)的后驗(yàn)概率計(jì)算得到各個(gè)基本模型的權(quán)重,從而實(shí)現(xiàn)對(duì)交通流的聯(lián)合預(yù)測(cè),提高模型的普適性。如王建[54]等利用貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)了多方案組合的交通流短時(shí)預(yù)測(cè),首先建立基于小波分析的BP神經(jīng)網(wǎng)絡(luò)算法、ARIMA算法等基本模型對(duì)交通流進(jìn)行預(yù)測(cè),然后將基本模型的預(yù)測(cè)結(jié)果和實(shí)際結(jié)果離散化處理后,利用貝葉斯網(wǎng)絡(luò)推理獲得在各個(gè)基本模型的預(yù)測(cè)結(jié)果組合下的聯(lián)合預(yù)測(cè)結(jié)果的概率分布,使得貝葉斯網(wǎng)絡(luò)成為多方法組合預(yù)測(cè)交通狀態(tài)的有效載體。
2.1.2 馬爾科夫模型在預(yù)測(cè)交通狀態(tài)方面的應(yīng)用
(1)馬爾科夫過(guò)程
馬爾科夫過(guò)程是一類隨機(jī)過(guò)程,它的特點(diǎn)在于未來(lái)的變化趨勢(shì)僅取決于現(xiàn)在的狀態(tài),而與過(guò)去的演變無(wú)關(guān)。Yu等[55]利用馬爾科夫過(guò)程的特性建立模型,對(duì)校園道路擁堵的預(yù)測(cè)進(jìn)行了研究。
(2)馬爾科夫鏈
鄭建湖等[56- 57],結(jié)合大量的交通狀態(tài)轉(zhuǎn)移數(shù)據(jù),利用馬爾科夫鏈完成了對(duì)交通狀態(tài)的預(yù)測(cè)。李軍懷等[58]將馬爾科夫鏈與指數(shù)平滑法相結(jié)合,兼顧了歷史數(shù)據(jù)的演變和當(dāng)前狀態(tài)對(duì)未來(lái)變化趨勢(shì)的影響,進(jìn)行交通狀態(tài)的預(yù)測(cè)。
(3)隱式馬爾科夫模型
隱式馬爾科夫模型較于傳統(tǒng)的馬爾科夫模型多了一個(gè)隱含的狀態(tài)鏈,即存在兩個(gè)隨機(jī)次過(guò)程。Zhu等[59]利用隱式馬爾科夫模型,不僅考慮特定道路區(qū)域本身的交通流狀態(tài)變化,還考慮到特定道路區(qū)域的交通流狀態(tài)變化與其它道路區(qū)域交通狀態(tài)的關(guān)系。這對(duì)于一個(gè)路網(wǎng)的交通擁堵預(yù)測(cè)具有重要的意義。
與參數(shù)統(tǒng)計(jì)方法相比,非參數(shù)統(tǒng)計(jì)方法對(duì)數(shù)據(jù)和模型的假定更少,適用范圍更廣,結(jié)果也更加穩(wěn)定,因此也更加適用于復(fù)雜的交通系統(tǒng)。
2.2.1 支持向量機(jī)模型(SVM)
傳統(tǒng)的統(tǒng)計(jì)模式判別方法在樣本量較大的情況下進(jìn)行研究,而支持向量機(jī)[60]卻能夠很好的解決小樣本問(wèn)題,在統(tǒng)計(jì)資料較少的交通問(wèn)題研究中具有良好的表現(xiàn)。它在20世紀(jì)90年代中期被提出,是一種有監(jiān)督的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法。最初的SVM理論只能用來(lái)解決二類分類問(wèn)題,隨著各國(guó)學(xué)者的不斷研究,多分類SVM算法以及與其他數(shù)據(jù)挖掘方法相結(jié)合的理論逐步建立并完善,支持向量機(jī)的應(yīng)用也更加廣泛,并被用于交通擁堵的模式判別。
SVM理論的核心思想是將輸入向量非線性地映射到一個(gè)高維度特征空間中,之后在這個(gè)空間中構(gòu)建一個(gè)決策超平面,將空間里的多個(gè)向量根據(jù)設(shè)定好的不同特征分為兩大類。每個(gè)分類中距離分隔平面最近的向量是該分類的邊緣向量,即支持向量。當(dāng)兩個(gè)分類的支持向量與平面的距離相等且取到最大時(shí),認(rèn)為該平面是最優(yōu)的決策超平面,距離和也稱為最優(yōu)間隔。圖2是一個(gè)二維空間下的例子,灰色部分選中的為支持向量,中間的虛線為最優(yōu)超平面,兩端實(shí)線間的距離即最優(yōu)間隔。
圖2 二維支持向量實(shí)例[57]
SVM算法在應(yīng)用時(shí)的兩大難點(diǎn)為超參數(shù)的選擇和核函數(shù)的確定,針對(duì)前者,Hong等[61- 62]將SVM模型結(jié)合模擬退火算法(SA)和蟻群優(yōu)化算法(ACO)進(jìn)行解決,較好地預(yù)測(cè)了交通流狀態(tài),為擁堵判別提供了基礎(chǔ)。而在針對(duì)核函數(shù)進(jìn)行的研究中,Wang等[63]采用小波函數(shù)構(gòu)造了一個(gè)新的核函數(shù),Cong 等[64]則將果蠅優(yōu)化算法(FOA)和最小二乘支持向量機(jī)模型(LSSVM)結(jié)合起來(lái),取得了較為理想的結(jié)果。
支持向量機(jī)有著小樣本、高泛化的優(yōu)點(diǎn),在交通狀態(tài)的劃分及交通擁堵的判別上有著較好的應(yīng)用,關(guān)鍵在于與其他數(shù)據(jù)挖掘方法或優(yōu)化算法的結(jié)合,來(lái)提高分類的精度,增大判別交通擁堵的準(zhǔn)確性。
2.2.2 K-鄰近算法(KNN)
KNN是非參數(shù)統(tǒng)計(jì)算法中一種較為簡(jiǎn)單的數(shù)據(jù)挖掘方法,其思路是:某個(gè)待測(cè)的數(shù)據(jù)在特征空間中有k個(gè)距離最近的已知類別的數(shù)據(jù),那么這k個(gè)數(shù)據(jù)中的大多數(shù)屬于哪一類,該待測(cè)數(shù)據(jù)也屬于這一類[65]。
原始的KNN模型僅采用時(shí)間序列作為計(jì)算標(biāo)準(zhǔn),而Cai等[66]改進(jìn)了KNN模型,用時(shí)空狀態(tài)矩陣描述路段的交通狀態(tài),更適于短期的交通狀態(tài)預(yù)測(cè)。Xu等[67]先提取比較具有代表性的交通流數(shù)據(jù)建立了道路交通狀態(tài)的參考序列,之后提取區(qū)域交通的吸引子序列構(gòu)造核函數(shù),得到當(dāng)前序列與參考序列的距離,最后獲得k個(gè)最小的距離,即利用核KNN算法(Kernel-KNN)判別了當(dāng)前序列的所屬交通狀態(tài)。
KNN算法通過(guò)多對(duì)象中的占優(yōu)類別進(jìn)行決策,而非單一決策,因此能更好地進(jìn)行交通擁堵?tīng)顟B(tài)判別。其對(duì)于樣本的要求高于SVM模型,但在實(shí)際應(yīng)用中,相較于支持向量機(jī)的非線性映射與構(gòu)建線性決策超平面,KNN算法又更加易于處理。與決策樹(shù)模型相比,KNN算法同樣易于理解和使用。
2.2.3 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)(ANN)是近40年來(lái)人工智能領(lǐng)域的研究熱點(diǎn)。它作為典型的監(jiān)督機(jī)器學(xué)習(xí)算法,已被廣泛用于交通狀態(tài)判別。目前應(yīng)用于交通擁堵判別預(yù)測(cè)領(lǐng)域的神經(jīng)網(wǎng)絡(luò)模型有:BP神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、多層反饋神經(jīng)網(wǎng)絡(luò)、徑向基RBF神經(jīng)網(wǎng)絡(luò)等。
最基礎(chǔ)的ANN架構(gòu)包括輸入層、輸出層和隱含層。含有多個(gè)隱含層的感知器即為深度學(xué)習(xí)結(jié)構(gòu)。如圖3所示。
圖3 最基礎(chǔ)的ANN架構(gòu)
式中,wi=[wi1,wi2,…,win]T是輸入和第i個(gè)隱含層節(jié)點(diǎn)的連接權(quán)重。而βi=[βi1,βi2,…,βim]T是第i個(gè)隱含層節(jié)點(diǎn)和輸出的權(quán)重。bi是第i個(gè)隱含層節(jié)點(diǎn)的偏置。
(1)BP神經(jīng)網(wǎng)絡(luò)
實(shí)際的交通系統(tǒng)是實(shí)時(shí)變化的,十分復(fù)雜,因此對(duì)于交通狀態(tài)的判別模型需要能反映動(dòng)態(tài)變化。Smith等[68]在BP神經(jīng)網(wǎng)絡(luò)模型與基于歷史數(shù)據(jù)的算法和時(shí)間序列模型等較傳統(tǒng)方法的比較中,發(fā)現(xiàn)BP模型在結(jié)果的準(zhǔn)確率上相對(duì)較優(yōu),更能反映動(dòng)態(tài)條件,并且沒(méi)有時(shí)間序列模型的滯后和過(guò)度預(yù)測(cè)特征;BP算法是神經(jīng)網(wǎng)絡(luò)中最具代表性的網(wǎng)絡(luò)訓(xùn)練方法,它通過(guò)梯度下降法求得隱含層節(jié)點(diǎn)參數(shù)的最優(yōu)取值[69]。
雖然BP算法檢測(cè)精度高,但是它學(xué)習(xí)速度較慢;因?yàn)槭翘荻认陆?,可能得到局部最?yōu)收斂而非全局最優(yōu)收斂,從而導(dǎo)致網(wǎng)絡(luò)訓(xùn)練失敗。
(2)遞歸神經(jīng)網(wǎng)絡(luò)
時(shí)間序列交通流量預(yù)測(cè)要求模型的輸入為序列數(shù)據(jù),而遞歸神經(jīng)網(wǎng)絡(luò)(RNN)模型可以用來(lái)處理序列數(shù)據(jù)。遞歸神經(jīng)網(wǎng)絡(luò)記憶歷史數(shù)據(jù)的輸出,并且隨著網(wǎng)絡(luò)的外部輸入作為下一時(shí)刻隱藏層單元的輸入,該屬性使網(wǎng)絡(luò)可以動(dòng)態(tài)記憶[70- 73]。
Ulbricht[74]介紹了解決短期交通預(yù)測(cè)任務(wù)的遞歸神經(jīng)網(wǎng)絡(luò)。在使用面向?qū)ο蟮纳窠?jīng)網(wǎng)絡(luò)進(jìn)行短期交通狀態(tài)預(yù)測(cè)的研究中,Dia等[75]發(fā)現(xiàn)5 min速度預(yù)測(cè)的延時(shí)遞歸神經(jīng)網(wǎng)絡(luò)(TLRN)非常準(zhǔn)確,精度達(dá)到90%~94%。
(3)多層神經(jīng)網(wǎng)絡(luò)
多層感知器包括至少一個(gè)隱藏層,可以判別線性函數(shù),也可以判別非線性函數(shù),對(duì)于非線性的交通參數(shù)預(yù)測(cè)具有非常好的效果。例如,Chen[76]介紹了多層前向神經(jīng)網(wǎng)絡(luò)在回路檢測(cè)站預(yù)測(cè)高速公路交通狀況的設(shè)計(jì)。結(jié)果表明,神經(jīng)網(wǎng)絡(luò)在低、中、高容量條件下(包括反復(fù)出現(xiàn)的擁塞和可能發(fā)生的事件期間)在體積、占用率和速度預(yù)測(cè)方面具有高精度;2005年,Vlahogianni等[77]提供了一種基于高級(jí)遺傳算法的多層感知神經(jīng)網(wǎng)絡(luò)交通流量預(yù)測(cè)模型,該模型不僅可以協(xié)助交通流數(shù)據(jù)的正確表示,也可協(xié)助時(shí)間、空間特征和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的選擇。
(4)徑向基神經(jīng)網(wǎng)絡(luò)RBF
RBF神經(jīng)網(wǎng)絡(luò)有全局近似與收斂的特性,所以使得它成為交通流判別預(yù)測(cè)的主要選擇之一。RBF神經(jīng)網(wǎng)絡(luò)的隱藏層空間是由徑向基函數(shù)作為隱單元的“基”構(gòu)成,隱節(jié)點(diǎn)被高斯函數(shù)定義:
(6)
式中,ci是第i個(gè)RBF隱藏集合的中心,xi是第i個(gè)RBF隱藏集合的寬度。
隱含層將低維的輸入矢量映射到高維特征空間。在該較高維空間中繪制最佳分離超平面,以將點(diǎn)分成不同的組,同時(shí)最大化線性決策邊界之間的邊界。其網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練簡(jiǎn)單,學(xué)習(xí)收斂速度快,具有接近任何非線性函數(shù)的能力,可以處理復(fù)雜的交通系統(tǒng)的擁堵判別問(wèn)題。Park等[78]比較了4種神經(jīng)網(wǎng)絡(luò)模型,如徑向基神經(jīng)網(wǎng)絡(luò)(RBF)等,得出以下結(jié)論:RBF神經(jīng)網(wǎng)絡(luò)模型效果最好,比BP神經(jīng)網(wǎng)絡(luò)需要更少的計(jì)算時(shí)間。雖然RBF神經(jīng)網(wǎng)絡(luò)優(yōu)于指數(shù)平滑法,但它比指數(shù)平滑法更復(fù)雜。
以上提及神經(jīng)網(wǎng)絡(luò)在交通狀態(tài)判別與預(yù)測(cè)問(wèn)題上表現(xiàn)優(yōu)異,但神經(jīng)網(wǎng)絡(luò)用于交通流預(yù)測(cè)也存在著一定的局限性。如訓(xùn)練需要大量數(shù)據(jù),若數(shù)據(jù)量過(guò)大則訓(xùn)練太耗時(shí),若數(shù)據(jù)量過(guò)小則結(jié)果不夠精確。另外,隱層節(jié)點(diǎn)的數(shù)量需要由經(jīng)驗(yàn)進(jìn)行確定,太多將導(dǎo)致計(jì)算時(shí)間過(guò)長(zhǎng),太少又難以達(dá)到實(shí)際問(wèn)題中計(jì)算精度的要求。
2.2.4 聚類
聚類是常見(jiàn)的無(wú)監(jiān)督的機(jī)器學(xué)習(xí)算法之一,可以在沒(méi)有任何先驗(yàn)知識(shí)的情況下對(duì)交通流量數(shù)據(jù)進(jìn)行分類。聚類旨在最小化類別內(nèi)的差異并使各個(gè)類別的差異最大化。
K-means聚類是最常見(jiàn)的聚類之一,2011 年,Montazeri等[79]提出了一種基于行駛路段聚類的交通狀況判別方法。使用k均值聚類算法判別駕駛特征并將其用于行駛路段聚類。結(jié)果表明,使用所提出的方法可以正確判別87%的交通狀況;2010 年,Azimi等[80]采用3種模式判別方法對(duì)高速公路交通流狀況進(jìn)行流動(dòng)特征分類。方法有K-means,F(xiàn)uzzy C-means和CLARA(聚類大應(yīng)用)。確定了與HCM分類一致的最佳聚類方法:K-means聚類。然后使用聚類方法補(bǔ)充HCM交通流狀況分類。此外,這些方法提供了合理分類過(guò)飽和流動(dòng)條件的手段;但K-means聚類對(duì)聚類數(shù)目和噪聲數(shù)據(jù)的初始化很敏感,系統(tǒng)聚類缺乏魯棒性,非唯一性且難以解釋,所以此算法不能通用。
因此出現(xiàn)了嵌套和SOM等聚類。嵌套聚類類別數(shù)由數(shù)據(jù)的統(tǒng)計(jì)特性來(lái)確定,不斷分組直到差異過(guò)小不能分組為止。如2007 年,Xia 等[81]介紹了一種嵌套聚類技術(shù)及其在高速公路運(yùn)行狀況分析中的應(yīng)用:利用探測(cè)器收集的交通數(shù)據(jù)(流量、速度、占有率)開(kāi)發(fā)了一個(gè)聚類模型,并以5 min為增量進(jìn)行聚合。
自組織映射(SOM)神經(jīng)網(wǎng)絡(luò)聚類是一種競(jìng)爭(zhēng)學(xué)習(xí)型的神經(jīng)網(wǎng)絡(luò),它能將高維輸入數(shù)據(jù)映射到低維空間,同時(shí)保持其拓?fù)浣Y(jié)構(gòu)不變,即將高維空間中相似的樣本點(diǎn)映射到輸出層相鄰的神經(jīng)元。它易于解釋和可視化,所以SOM在分析具有時(shí)變性和充滿噪音性質(zhì)的交通流數(shù)據(jù)方面具有優(yōu)勢(shì)。Andrienko等[82- 83]已經(jīng)在具有真實(shí)城市交通數(shù)據(jù)的大型數(shù)據(jù)集上得到驗(yàn)證,SOM能夠?qū)矶录捌鋾r(shí)空演變規(guī)律進(jìn)行有效判別。
通過(guò)分析交通狀態(tài)判別方法的研究現(xiàn)狀可以發(fā)現(xiàn),因現(xiàn)實(shí)中缺乏各種屬性參數(shù)和標(biāo)簽的數(shù)據(jù),聚類分析已成為判別交通擁堵的最重要方法。但是,聚類方法從大數(shù)據(jù)中提取特征通常需要花費(fèi)大量時(shí)間,所以可能無(wú)法滿足交通擁堵判別的實(shí)時(shí)性。于是,Chen等[84]提出了一種新的聚類算法,實(shí)時(shí)自動(dòng)監(jiān)測(cè)和分析交通狀況。以道路上的車輛為數(shù)據(jù)點(diǎn),提出了一種基于人工免疫網(wǎng)絡(luò)的K-means網(wǎng)格密度聚類算法,將車輛數(shù)據(jù)劃分為適當(dāng)?shù)拇?,并?biāo)記密度,以監(jiān)測(cè)和分析交通狀況。仿真實(shí)驗(yàn)結(jié)果表明,該算法比傳統(tǒng)方法具有更高的效率和穩(wěn)定性。
表4 機(jī)器學(xué)習(xí)模型與應(yīng)用
機(jī)器學(xué)習(xí)模型使用數(shù)據(jù)驅(qū)動(dòng)方法,能夠克服數(shù)學(xué)和物理模型描述復(fù)雜交通流的局限性,它們沒(méi)有固定結(jié)構(gòu)約束,被證明與數(shù)據(jù)有更好的擬合。從概率圖模型到支持向量機(jī)、K-近鄰算法、神經(jīng)網(wǎng)絡(luò)和聚類,這些機(jī)器學(xué)習(xí)方法,對(duì)于擁堵產(chǎn)生的異常特征及其特征變化十分敏感,能夠大幅提高擁堵判別的可靠性。
交通擁堵是諸多交通問(wèn)題中影響最大、持續(xù)時(shí)間最長(zhǎng)、出現(xiàn)頻率最高的問(wèn)題。如想解決此問(wèn)題,最先要做的就是能夠判別交通擁堵,然后利用各種信息平臺(tái)誘導(dǎo)車輛合理選擇行車路線。因此本文涵蓋傳統(tǒng)交通流理論與機(jī)器學(xué)習(xí)兩大類方法,系統(tǒng)綜述了國(guó)內(nèi)外擁堵判別的方法??傮w上,文獻(xiàn)的特點(diǎn)包括以下3點(diǎn):
(1)國(guó)外學(xué)者對(duì)于交通擁堵現(xiàn)象的系統(tǒng)研究起步較早,已經(jīng)進(jìn)行了許多較為有力的探索。國(guó)內(nèi)學(xué)者在交通擁堵判別方面的研究雖然起步較晚,但根據(jù)我國(guó)的實(shí)際情況進(jìn)行了很多創(chuàng)新與拓展。
(2)傳統(tǒng)交通流理論與機(jī)器學(xué)習(xí)兩大類方法并不是完全分開(kāi)的,只是它們所針對(duì)的應(yīng)用場(chǎng)景和采取的研究手段有所區(qū)別。傳統(tǒng)交通流理論物理意義明確但嚴(yán)謹(jǐn)、限制條件苛刻,機(jī)器學(xué)習(xí)方法注重實(shí)際應(yīng)用,但理解起來(lái)更困難。在研究不同的問(wèn)題時(shí)它們各有優(yōu)缺點(diǎn)。
(3)不可否認(rèn),使用機(jī)器學(xué)習(xí)方法來(lái)判別交通擁堵的趨勢(shì)愈加明顯。機(jī)器學(xué)習(xí)算法可以有效地分析利用數(shù)據(jù),一些機(jī)器學(xué)習(xí)方法能夠更好的檢測(cè)交通異常事件,并更好地識(shí)別車速的降低、道路占有率的增加以及擁堵車流的出現(xiàn)等特征,許多研究都證明機(jī)器學(xué)習(xí)的算法有著強(qiáng)大的能力和可靠性,算法本身也在不斷創(chuàng)新。并且,隨著數(shù)據(jù)處理相關(guān)設(shè)備的更新,科研工作者數(shù)據(jù)處理能力的提高與信息科技的進(jìn)步,交通領(lǐng)域積累了大量的數(shù)據(jù),這也給機(jī)器學(xué)習(xí)算法提供了廣闊的應(yīng)用空間。
國(guó)內(nèi)外學(xué)者在交通擁堵判別方面已經(jīng)獲得了較為豐富的成果,并逐步建立了相對(duì)完整的理論體系。然而已有研究還存在以下幾點(diǎn)不足:
(1)缺乏對(duì)交通擁堵的統(tǒng)一定義和衡量標(biāo)準(zhǔn)
判別擁堵時(shí)研究者們往往給參數(shù)設(shè)定某一閾值,當(dāng)達(dá)到這一閾值時(shí),就可以判定交通擁堵?tīng)顟B(tài)的形成。因?yàn)闆](méi)有統(tǒng)一定義和衡量標(biāo)準(zhǔn),不同地區(qū)閾值不一樣,因此各標(biāo)準(zhǔn)不具有普適性,大大增加了判別擁堵的工作量。
(2)缺少傳統(tǒng)交通流理論與機(jī)器學(xué)習(xí)方法的協(xié)同合作
機(jī)器學(xué)習(xí)方法作為交通擁堵判別的重要組成部分,隨著數(shù)據(jù)相關(guān)設(shè)備的更新,數(shù)據(jù)處理能力的提高與信息科技的進(jìn)步,應(yīng)用前景將更加廣闊。而傳統(tǒng)交通流理論作為交通領(lǐng)域的寶貴財(cái)富,曾指導(dǎo)許多交通擁堵判別問(wèn)題,但目前兩者的協(xié)同合作并不密切或深入。因此,為更好地完成交通擁堵判別,需要加強(qiáng)傳統(tǒng)交通流理論與機(jī)器學(xué)習(xí)方法協(xié)同使用,進(jìn)一步完善交通擁堵判別理論。
(3)應(yīng)用于擁堵判別的參數(shù)不足
首先,數(shù)據(jù)獲取困難,尤其是對(duì)于有高樣本量要求的參數(shù)統(tǒng)計(jì)方法,取得符合訓(xùn)練要求的數(shù)據(jù)不太容易。另外,交通流參數(shù)眾多,但現(xiàn)有研究中,每種方法只能關(guān)注幾個(gè)參數(shù),通過(guò)選取的部分參數(shù)進(jìn)行交通流狀態(tài)判斷,并進(jìn)而判別擁堵情況,這可能會(huì)導(dǎo)致解釋出的結(jié)果存在一定片面性。
總體而言,無(wú)論是傳統(tǒng)的交通流理論方法,還是新興的機(jī)器學(xué)習(xí)的方法,在進(jìn)行交通擁堵?tīng)顟B(tài)判別時(shí),往往都會(huì)以流量、密度、速度、占用率、車頭時(shí)距等交通流參數(shù)為基礎(chǔ)進(jìn)行交通狀態(tài)判斷,進(jìn)而再檢測(cè)擁堵。這些方法使用類似數(shù)據(jù)的區(qū)別在于:傳統(tǒng)的基于指標(biāo)的判別方法借助各類設(shè)備或信息平臺(tái)直接監(jiān)測(cè)路網(wǎng)內(nèi)的相關(guān)數(shù)據(jù),通過(guò)與閾值的比較來(lái)判斷是否擁堵。而傳統(tǒng)方法中的元胞傳輸模型與元胞自動(dòng)機(jī)模型由于數(shù)學(xué)理論較強(qiáng),大多通過(guò)純數(shù)學(xué)方法處理數(shù)據(jù)、進(jìn)行研究。機(jī)器學(xué)習(xí)方法則看重?cái)?shù)據(jù)特征的挖掘和樣本的訓(xùn)練,因此,即使采用的數(shù)據(jù)類似,處理方法也完全不同??紤]到已有研究的不足,未來(lái)的研究可基于(但不限于)以下幾個(gè)研究方向:
(1)考慮各國(guó)對(duì)擁堵的不同定義與衡量標(biāo)準(zhǔn),基于高速發(fā)展的信息搜取和整合技術(shù),收集整理實(shí)際常使用的擁堵衡量標(biāo)準(zhǔn),進(jìn)而建立簡(jiǎn)單通用的擁堵衡量標(biāo)準(zhǔn),完善擁堵判別的理論研究體系;
(2)針對(duì)難以理解的機(jī)器學(xué)習(xí)模型,在已知輸入輸出的情況下,采用其他方法如敏感性分析等反推變量?jī)?nèi)部聯(lián)系。這樣既可以保證判別預(yù)測(cè)的精確度,又可以幫助理解變量的影響;
(3)考慮傳統(tǒng)交通流理論與機(jī)器學(xué)習(xí)方法協(xié)同合作。利用機(jī)器學(xué)習(xí)中優(yōu)秀的算法及解決問(wèn)題的思路來(lái)優(yōu)化傳統(tǒng)交通流模型,小到可以考慮對(duì)排隊(duì)論、流體力學(xué)模型、動(dòng)力學(xué)模型等模型的某一步驟進(jìn)行改進(jìn),大到利用算法減少人為對(duì)交通流規(guī)律分析、交通問(wèn)題機(jī)理診斷判別的步驟。兩者互相配合,以期更好地判別交通擁堵。
(4)在未來(lái),在研究數(shù)據(jù)這一方面還可以展開(kāi)如下工作:首先,建立各省市完善統(tǒng)一的交通信息平臺(tái),形成完整的交通流參數(shù)數(shù)據(jù)庫(kù),便于各項(xiàng)擁堵判別的研究;其次,鑒于某些模型需采用特定參數(shù),為了更好的利用其它參數(shù)數(shù)據(jù),可以更多發(fā)掘不同參數(shù)之間的關(guān)聯(lián),以獲得方便可行、解釋全面、更具說(shuō)服力的結(jié)果。