潘義勇,管星宇
(南京林業(yè)大學(xué) 汽車與交通工程學(xué)院,江蘇 南京 210037)
速度-密度關(guān)系基本圖模型是交通流理論的基礎(chǔ),挖掘兩者之間的關(guān)系有利于在交通狀態(tài)識別、交通擁堵分析等領(lǐng)域發(fā)揮重要的作用[1-2]?,F(xiàn)有的研究主要集中在速度-密度關(guān)系確定基本圖模型,由于交通流具有固有的隨機(jī)特性和異質(zhì)特性,確定性的速度-密度關(guān)系限制了其表征實(shí)際交通流的能力,導(dǎo)致在交通控制策略建模中產(chǎn)生誤差[3]。因此需對交通流速度-密度關(guān)系隨機(jī)基本圖模型問題進(jìn)行研究。
針對速度-密度關(guān)系確定基本圖模型研究很多,自從Greenshields模型首次提出以來,其缺點(diǎn)是密度值較大或較小時(shí),模型擬合效果較差,在此基礎(chǔ)上改進(jìn)的模型有:Greenberg模型,Underwood模型,Northwestern模型,Newell模型,這些模型都是單階段確定性模型[4],多階段模型這里不再闡述。在對速度-密度確定關(guān)系模型參數(shù)進(jìn)行擬合過程中,主要存在兩個(gè)問題:數(shù)據(jù)點(diǎn)低密度狀態(tài)下的分布較為密集,導(dǎo)致均值回歸受異常點(diǎn)影響較大;實(shí)測的速度、密度值具有隨機(jī)性,在對數(shù)據(jù)進(jìn)行均值回歸時(shí),難以滿足方差齊性和正態(tài)性的假設(shè)要求[5]。
針對速度-密度關(guān)系隨機(jī)基本圖模型的研究非常少,S.E.JABARI等[6]、S.FAN[7]分別針對特定的交通流模型推導(dǎo)了速度概率分布函數(shù)和密度的關(guān)系模型,但是該方法不能推廣到其他交通流模型;X.QU 等[8]提出基于不同百分位的交通流速度-密度關(guān)系基本圖模型,根據(jù)不同的百分位點(diǎn)采用加權(quán)最小二乘法對不同的百分位點(diǎn)進(jìn)行參數(shù)擬合獲得關(guān)系模型,但是該方法從根本上還是采用最小二乘法進(jìn)行參數(shù)擬合,異常值對擬合效果影響較大。
針對以上問題,引入分位數(shù)回歸獲得速度-密度關(guān)系隨機(jī)基本圖模型[9],分位數(shù)回歸在計(jì)量經(jīng)濟(jì)學(xué)中已經(jīng)獲得了廣泛的應(yīng)用,分位數(shù)回歸采用最小一乘法進(jìn)行參數(shù)擬合,對異常值具有更好的魯棒性,更能反映數(shù)據(jù)整體的分布狀況,更全面的反映數(shù)據(jù)信息,適用性更廣,有利于對交通流數(shù)據(jù)的深度挖掘,這是筆者研究的出發(fā)點(diǎn)。首先,基于分位數(shù)回歸建立交通流速度-密度關(guān)系隨機(jī)基本圖模型;其次,利用分位數(shù)回歸對實(shí)際交通流數(shù)據(jù)進(jìn)行速度-密度曲線參數(shù)擬合,獲得不同分位數(shù)水平的速度-密度曲線簇;第三,對參數(shù)值進(jìn)行了假設(shè)檢驗(yàn)和置信區(qū)間的計(jì)算,并對擬合結(jié)果進(jìn)行數(shù)值分析;最后,總結(jié)了筆者的研究成果以及進(jìn)一步研究的方向。
分位數(shù)回歸在高級計(jì)量經(jīng)濟(jì)學(xué)中已經(jīng)獲得了廣泛的應(yīng)用,根據(jù)不同的分位點(diǎn)得到對應(yīng)的回歸方程,可以直觀的描述自變量對因變量分布的變化[10]。式(1)表示在第τ分位點(diǎn)下得到的回歸方程,即分位數(shù)回歸模型的基本定義為:
(1)
(2)
基于分位數(shù)回歸構(gòu)建交通流速度-密度關(guān)系隨機(jī)基本圖模型,充分挖掘數(shù)據(jù)中隱含的信息。以Greenshields模型為例,基于分位數(shù)回歸模型改進(jìn)的Greenshields模型可以表示為:
(3)
表1 基于分位數(shù)回歸的速度-密度關(guān)系隨機(jī)基本圖模型
文中的數(shù)據(jù)來源于美國德克薩斯州圣安東尼奧市的高級交通管理系統(tǒng)TransGuide,從中選取了2條公路進(jìn)行分析:東行單向三車道的I-10公路(中間車道,傳感器編號:L2-0010E-562.581)以及西行單向二車道的Loop-1604公路(第2條左車道,傳感器編號:L2-1604W-034.326),數(shù)據(jù)點(diǎn)在24 h內(nèi)每隔20 s統(tǒng)計(jì)一次。在非線性模型的擬合中,為了避免數(shù)據(jù)在對數(shù)轉(zhuǎn)化中出現(xiàn)無窮大值,保證數(shù)據(jù)分析的可靠性,對數(shù)據(jù)進(jìn)行了整理,刪去數(shù)據(jù)集中密度值為0的點(diǎn)(I-10公路第22和第628個(gè)觀測值),共獲取I-10公路3 526對樣本值、Loop-1604公路3 258對樣本值。整理后的數(shù)據(jù)情況如表2,表2中分位差偏態(tài)測量(QSK)用于分析數(shù)據(jù)的偏態(tài)特征,QSK>0表示右偏,QSK<0表示左偏,QSK=0表示正態(tài)分布。其公式為:
(4)
式中:QSK(τ)為第τ分位點(diǎn)的分位差偏態(tài)測量值;Q(τ)、Q(1-τ)分別為數(shù)據(jù)第τ和(1-τ)分位點(diǎn)處的分位值。
表2中數(shù)據(jù)顯示,I-10公路在[0.3,0.7]分位點(diǎn)區(qū)間的數(shù)據(jù)呈現(xiàn)近似正態(tài)分布的特點(diǎn)(QSK=0),整個(gè)數(shù)據(jù)點(diǎn)的分布則呈現(xiàn)左偏分布(QSK<0),說明收集到的低速數(shù)據(jù)較少。與I-10公路相比,Loop-1604公路的數(shù)據(jù)分布呈現(xiàn)出更為復(fù)雜的關(guān)系,但是2條公路從整體總體上都為左偏分布,圖1為2條公路速度觀測值的概率密度曲線,可以直觀地看出2個(gè)數(shù)據(jù)集的左偏特性。圖2、圖3表示基于馬氏距離的二維變量異常值檢測分布圖,考慮變量之間的相關(guān)性和數(shù)據(jù)之間的馬氏距離,根據(jù)圖形展示的信息,I-10公路的異常值為402個(gè)(占觀測值12.3%),主要集中于密度為[40,100]的區(qū)域;Loop-1604公路的異常值為125個(gè)(占觀測值3.8%),主要集中于密度為[60,120]的區(qū)域。結(jié)果顯示:2條公路在高密度區(qū)間產(chǎn)生了較多的異常值,在真實(shí)的交通狀況下,需要考慮這些異常值對速度變量的影響。結(jié)合分位數(shù)回歸模型以及均值回歸模型對異常值的魯棒性,采用分位數(shù)回歸模型更能反映速度與密度之間的關(guān)系。
表2 數(shù)據(jù)基本信息
圖1 概率密度分布
圖2 異常值分布(I-10)
圖3 異常值分布(Loop-1604)
結(jié)合R語言中quanterg包中的rq函數(shù)進(jìn)行線性擬合以及nlrq函數(shù)進(jìn)行非線性的擬合[11],對數(shù)據(jù)的0.05、0.1、…、0.95共計(jì)19個(gè)分位點(diǎn)進(jìn)行回歸分析,并對回歸系數(shù)進(jìn)行T檢驗(yàn)得到P值,P值表示回歸系數(shù)無效的概率值,用于驗(yàn)證回歸系數(shù)是否顯著(P<0.05,系數(shù)顯著)。
表3 Greenshields模型的擬合參數(shù)值(I-10公路)
圖4 Greenshields模型擬合(I-10)
圖5 Greenshields系數(shù)比較(I-10)
圖6 Northwestern模型擬合(I-10)
圖7 Northwestern系數(shù)比較(I-10)
圖8 Northwestern模型擬合(Loop-1604)
圖9 Northwestern系數(shù)比較(Loop-1604)
圖10 Newell模型擬合(I-10)
表5 Newell模型的擬合參數(shù)值(I-10公路)
擬合結(jié)果如圖11~圖14,對擬合結(jié)果進(jìn)行分析,得出:
圖11 Greenshields模型對比(0.5分位點(diǎn))
圖12 Greenshields模型誤差值(I-10)
圖13 Northwestern模型誤差值(I-10)
圖14 Newell模型誤差值(I-10)
表4 Northwestern模型的擬合參數(shù)值
針對交通流速度-密度關(guān)系基本圖問題,首次引入分位數(shù)回歸獲得交通流速度-密度關(guān)系隨機(jī)基本圖模型,利用分位數(shù)回歸對速度-密度曲線進(jìn)行參數(shù)擬合,獲得不同分位數(shù)水平的速度-密度曲線簇,對參數(shù)值進(jìn)行了假設(shè)檢驗(yàn)和置信區(qū)間的計(jì)算,并對擬合結(jié)果進(jìn)行數(shù)值分析。數(shù)值試驗(yàn)結(jié)果表明:相比于已有模型,筆者提出的模型可以反映不同分位數(shù)水平下交通流速度和密度的關(guān)系,更能反映數(shù)據(jù)整體的分布狀況,更全面的反映數(shù)據(jù)信息,其中Northwestern分位數(shù)回歸模型的誤差值最小,擬合效果在上述模型中效果最好;提出的方法能夠反映不同數(shù)據(jù)集的特點(diǎn),適用性更廣,有利于對交通流數(shù)據(jù)的深度挖掘;該模型可以應(yīng)用于對交通流的建模和仿真中,不同密度值在不同的分位點(diǎn)對應(yīng)不同的速度和加速度值,有利于提高仿真的維度和靈活性;所提出的方法為交通流基本圖隨機(jī)模型構(gòu)建提供了一個(gè)方法論,可以推廣到其他未來交通流模型。本研究只考慮了單一交通流狀態(tài)下模型參數(shù)的擬合,而不同交通流狀態(tài)對參數(shù)擬合結(jié)果存在很大影響,需要進(jìn)一步進(jìn)行研究。