陸振波 夏井新 焦恬恬 時(shí)幸飛 黃 衛(wèi)
(東南大學(xué)智能運(yùn)輸系統(tǒng)研究中心,南京210096)
智能化城市道路交通管理與控制的最終目的是緩解城市交通擁堵、提高行車安全,最終實(shí)現(xiàn)城市道路交通的可持續(xù)發(fā)展.作為實(shí)時(shí)把握城市道路交通運(yùn)行狀況的一種重要手段,城市道路交通流運(yùn)行狀況監(jiān)測一直是城市道路智能化交通管理與控制的核心和難點(diǎn)之一.其關(guān)鍵技術(shù)主要包括交通流數(shù)據(jù)的時(shí)間與空間匯集[1]、交通流數(shù)據(jù)預(yù)處理[2-3]以及交通流運(yùn)行狀態(tài)實(shí)時(shí)判別[4-6]等.目前,城市道路交通流原始數(shù)據(jù)采集間隔通常為15~30 s[7],這種原始數(shù)據(jù)呈現(xiàn)出的波定性影響了其在交通監(jiān)測方面的應(yīng)用性能.因此,需要確定一個(gè)更加合適的匯集時(shí)間間隔,以準(zhǔn)確地反映道路交通流真實(shí)運(yùn)行狀況,這就是交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔問題.
交通流數(shù)據(jù)的最優(yōu)匯集時(shí)間間隔是能否實(shí)時(shí)準(zhǔn)確反映城市道路交通運(yùn)行狀態(tài)的重要因素,也是后續(xù)交通狀況實(shí)時(shí)判別方法能否準(zhǔn)確判別城市道路交通擁堵程度的重要基礎(chǔ).匯集時(shí)間間隔過小,會導(dǎo)致交通流數(shù)據(jù)包含較多的噪聲而干擾交通狀態(tài)的識別;匯集時(shí)間間隔過大,則會造成交通流變化的過程被平滑.縱觀國內(nèi)外現(xiàn)有研究成果可知,對于交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔的分析主要包括交叉驗(yàn)證均方差法[8-10]、基于圖表的統(tǒng)計(jì)方法[11]、小波分析法[12-13]等.交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔問題的本質(zhì)是分析不同匯集時(shí)間間隔的交通流數(shù)據(jù)序列的離散程度,刻畫這種度量形式的理想統(tǒng)計(jì)量是方差,因此交叉驗(yàn)證均方差法是比較常用的方法.然而,傳統(tǒng)交叉驗(yàn)證均方差法主要用于高速公路的速度數(shù)據(jù)研究,并未綜合考慮交通流三參數(shù)的影響,同時(shí)也缺少對較為復(fù)雜的城市道路交通狀況的研究分析.
針對上述問題,本文提出了一種基于交通狀態(tài)矢量的交叉驗(yàn)證均方差模型,以衡量不同匯集時(shí)間間隔下交通流數(shù)據(jù)的優(yōu)劣性;并采用t檢驗(yàn)對不同匯集時(shí)間間隔所得的均方差均值進(jìn)行顯著性檢驗(yàn),以獲得城市道路交通流數(shù)據(jù)的最優(yōu)匯集時(shí)間間隔.
從一組數(shù)據(jù)序列中依次取出一個(gè)數(shù)據(jù),計(jì)算其與剩余數(shù)據(jù)均值的差值,取差值的二次方,交叉驗(yàn)證重復(fù)多次,得到差值的平方和即為該組數(shù)據(jù)的交叉驗(yàn)證方差.基于此,Gajewski等[8]提出采用交叉驗(yàn)證均方差模型來尋找交通流數(shù)據(jù)匯集的最優(yōu)時(shí)間間隔.假設(shè)原始交通流數(shù)據(jù)間隔為20 s,按照目標(biāo)匯集時(shí)間間隔,將原始交通流樣本數(shù)據(jù)分成多組,分別計(jì)算各組內(nèi)的交叉驗(yàn)證方差并進(jìn)行累加,便可得到樣本數(shù)據(jù)的交叉驗(yàn)證均方差.交叉驗(yàn)證均方差最小的匯集時(shí)間間隔即為最優(yōu)匯集時(shí)間間隔.
基于傳統(tǒng)的交叉驗(yàn)證均方差模型,可得出其在最優(yōu)匯集時(shí)間間隔研究方面的適用性:① 不同匯集時(shí)間間隔主要通過交叉驗(yàn)證均方差模型的分組個(gè)數(shù)來體現(xiàn).②根據(jù)交叉驗(yàn)證方差的定義,數(shù)據(jù)序列中各數(shù)據(jù)對應(yīng)的交叉驗(yàn)證方差值體現(xiàn)了該數(shù)據(jù)對該組數(shù)據(jù)均值的影響程度.交叉驗(yàn)證方差值越小,說明該數(shù)據(jù)對該組數(shù)據(jù)均值的影響越小,即該信息的重要性越低.由于交通流數(shù)據(jù)時(shí)間匯集的本質(zhì)是通過數(shù)學(xué)運(yùn)算來忽略一些次要交通流數(shù)據(jù)的過程,因此通過交叉驗(yàn)證均方差值的分析可以量化研究最優(yōu)匯集時(shí)間間隔.
在 Gajewski等[8]的研究基礎(chǔ)上,部分學(xué)者[9-13]又發(fā)展了基于不同目標(biāo)下的最優(yōu)匯集時(shí)間間隔研究,如基于路段行程時(shí)間估計(jì)、路線行程時(shí)間估計(jì)的最優(yōu)匯集時(shí)間間隔等.然而,這些研究同樣也是對高速公路交通狀況下的單一參數(shù)進(jìn)行分析,對較為復(fù)雜的城市道路交通狀況缺乏分析探討.
在Gajewski等[8]提出的交叉驗(yàn)證均方差模型研究中,不同匯集時(shí)間間隔數(shù)據(jù)序列的交叉驗(yàn)證方差可以視為各速度數(shù)據(jù)與剩余速度數(shù)據(jù)的均值在不同匯集時(shí)間間隔坐標(biāo)軸上的距離平方,并可以此作為衡量最優(yōu)匯集時(shí)間間隔的標(biāo)準(zhǔn).然而,城市道路的速度參數(shù)受外界因素影響較大,僅僅考慮速度并不能完全表征實(shí)際的道路交通狀況.鑒于以上因素,交通流運(yùn)行狀態(tài)的表征需要綜合考慮交通流三參數(shù)(即流量、時(shí)間平均速度和時(shí)間占有率)的影響,其中時(shí)間占有率由車輛檢測器采集,當(dāng)車型組成相對穩(wěn)定時(shí),與交通流密度成正比.基于此,本文提出了一種基于交通狀態(tài)矢量的交叉驗(yàn)證均方差模型,即采用交通流三參數(shù)來取代傳統(tǒng)的速度單一參數(shù),研究交通流數(shù)據(jù)的最優(yōu)匯集時(shí)間間隔問題.基于這3個(gè)交通流參數(shù)的不同匯集時(shí)間間隔的交通狀態(tài)交叉驗(yàn)證均方差模型如下:
考慮到原始數(shù)據(jù)中平均速度與交通流量的關(guān)系(即一定時(shí)間間隔內(nèi)通過檢測斷面的車輛數(shù)量之間的相關(guān)性),在進(jìn)行速度時(shí)間匯集時(shí)可以以交通流量作為權(quán)重來進(jìn)行加權(quán)平均,即
以3 600 s內(nèi)采集的原始交通流數(shù)據(jù)作為樣本,可以得到匯集時(shí)間間隔為T時(shí)單位小時(shí)交通流數(shù)據(jù)的交叉驗(yàn)證方差為
由于交通流三參數(shù)的量綱各不相同,因此在計(jì)算前需要對交通流各參數(shù)進(jìn)行無量綱化.通常可采用中心化、極差化、極大化、極小化、均值化等處理方法將指標(biāo)無量綱化[14].采用均值化處理時(shí),無量綱化后各參數(shù)的均值均為1,方差為參數(shù)變異系數(shù)的平方,即可有效保留各參數(shù)變異程度的信息.基于此,本文選取均值化法對原始數(shù)據(jù)進(jìn)行處理,進(jìn)而采用基于交通狀態(tài)矢量的交叉驗(yàn)證均方差模型對最優(yōu)匯集時(shí)間間隔進(jìn)行研究.針對車輛檢測器實(shí)時(shí)采集的某一交通流參數(shù),其均值化的具體計(jì)算公式如下:
式中,x1和x'1分別為某一交通參數(shù)的實(shí)際值和均值化后數(shù)值;ˉx為均值化前某一交通參數(shù)的檢測均值.
從理論上講,交叉驗(yàn)證均方差最小值所對應(yīng)的匯集時(shí)間間隔即為最優(yōu)匯集時(shí)間間隔.但是實(shí)踐證明,隨著匯集時(shí)間間隔的增大,交叉驗(yàn)證均方差的變化趨于平緩,從變化趨勢圖上難以確定其最小值.此外,匯集時(shí)間間隔的增大還會平滑交通流狀態(tài)在時(shí)間軸上的局部變化.鑒于此,本文在確定最優(yōu)匯集時(shí)間間隔時(shí),考慮對不同匯集時(shí)間間隔所對應(yīng)的交叉驗(yàn)證均方差進(jìn)行顯著性分析,通過確定均方差變化的拐點(diǎn),來確定最優(yōu)匯集時(shí)間間隔.
根據(jù)上述交叉驗(yàn)證均方差的特性,本文擬通過構(gòu)造t檢驗(yàn)來對不同匯集時(shí)間間隔所得的均方差進(jìn)行顯著性檢驗(yàn).t檢驗(yàn)的基本原理是用t分布理論來推斷差異發(fā)生的概率,從而判定2個(gè)平均數(shù)的差異是否顯著.假設(shè)有2個(gè)正態(tài)總體X~N(μ1,)和 Y ~N(μ2),其中 μ1,μ2分別為正態(tài)總體的均值和方差,X1,X2,…,Xn1為來自總體 X的 n1個(gè)樣本,Y1,Y2,…,Yn1為來自總體 Y 的 n2個(gè)樣本,且總體X與Y獨(dú)立.則可以構(gòu)建2個(gè)正態(tài)總體均值差的假設(shè)檢驗(yàn),即
其中,δ為已知常數(shù).
對于給定的顯著性水平α,由t分布分位點(diǎn)的定義可知,存在 tα/2(n1+n2-2),使得
因此,該假設(shè)檢驗(yàn)的拒絕域?yàn)?/p>
上述t檢驗(yàn)方法應(yīng)用的主要條件是檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布條件.同一個(gè)時(shí)間間隔不同日期的交叉驗(yàn)證均方差符合正態(tài)分布,因此可以采用上述t檢驗(yàn)方法來判斷基于交通流狀態(tài)矢量的交叉驗(yàn)證均方差均值的差異性.
鑒于城市不同等級道路交通流特征的差異性,本文基于江蘇省昆山市城市道路交通狀況實(shí)時(shí)監(jiān)測系統(tǒng),選取了昆山市3條不同等級的道路(長江路、同豐路及中山路)作為研究對象.3個(gè)不同等級道路交通狀況監(jiān)測選取斷面的基本信息見表1.
表1 采集的斷面信息
在昆山市城市道路交通狀況實(shí)時(shí)監(jiān)測系統(tǒng)中,微波車輛檢測器采集的原始交通流數(shù)據(jù)間隔為30 s.考慮到工作日和周末交通流特點(diǎn)的差異性,本文選取2010年7月5日至7月9日以及7月12日至7月16日共10個(gè)工作日的單向行駛斷面交通流數(shù)據(jù)進(jìn)行分析.
當(dāng)交通流數(shù)據(jù)匯集時(shí)間間隔較小時(shí),間隔增量的增大對交通流狀態(tài)的影響較大.因此,在匯集時(shí)間間隔較小時(shí),本文選取的匯集時(shí)間間隔增量也較小;隨著匯集時(shí)間間隔的增大,相應(yīng)的匯集時(shí)間間隔增量也增大.鑒于此,本文選取了 1,2,3,4,5,6,8,10,12,14,16,18,20,24,30 min 共 15 種數(shù)據(jù)作為匯集時(shí)間間隔.在此基礎(chǔ)上,基于交通狀態(tài)矢量的交叉驗(yàn)證均方差模型,分別計(jì)算每種匯集時(shí)間間隔下基于交通狀態(tài)矢量的交叉驗(yàn)證均方差.
圖1為選取的主干道(長江路)、次干道(同豐路)及支路(中山路)相應(yīng)斷面不同匯集時(shí)間間隔下的交叉驗(yàn)證均方差值折線圖.由圖可知,不同等級道路的交叉驗(yàn)證均方差折線走勢基本相同,這與交通流數(shù)據(jù)的周期性規(guī)律相一致;交叉驗(yàn)證均方差值隨匯集時(shí)間間隔的增大而逐漸變小,最后趨于平緩,說明匯集時(shí)間間隔的增大可以在一定程度上平滑交通流數(shù)據(jù)的波動性.就交通狀況實(shí)時(shí)監(jiān)測而言,當(dāng)匯集時(shí)間間隔達(dá)到某一值后,其交叉驗(yàn)證均方差值趨于穩(wěn)定,此時(shí)可認(rèn)為匯集時(shí)間間隔的增大對交通流數(shù)據(jù)的波動性影響較小.
圖1 不同匯集時(shí)間間隔下交叉驗(yàn)證均方差值折線圖
采用t檢驗(yàn)法對不同匯集間隔的交叉驗(yàn)證均方差均值進(jìn)行顯著性檢驗(yàn)的目的是尋找確定的交叉驗(yàn)證均方差均值在一定置信水平上變化的拐點(diǎn).由t檢驗(yàn)方法的原理可知,10個(gè)工作日內(nèi)所得到的相鄰間隔的交叉驗(yàn)證均方差均值滿足自由度為18的t分布.在一定的假設(shè)檢驗(yàn)顯著性水平上,若相鄰時(shí)間間隔的交叉驗(yàn)證均方差均值的t檢驗(yàn)統(tǒng)計(jì)值大于自由度為18的t分布值,則認(rèn)為相鄰時(shí)間間隔的交叉驗(yàn)證均方差均值具有顯著性差異;反之,則沒有顯著性差異.若前后匯集時(shí)間間隔對應(yīng)的均方差均值無顯著性差異,則可認(rèn)為該匯集時(shí)間間隔為最優(yōu)匯集時(shí)間間隔.對顯著性水平α=0.1(即t(18)=1.330 4)下的主干道、次干道及支路交通流數(shù)據(jù)所得不同匯集時(shí)間間隔的交叉驗(yàn)證均方差均值進(jìn)行t檢驗(yàn),結(jié)果見表2.
由表2可以看出,在顯著性水平α=0.1的情況下,對于主干道而言,匯集時(shí)間間隔為2,3,4 min時(shí)交通流數(shù)據(jù)的交叉驗(yàn)證均方差均值均有顯著性差異.此時(shí),可以認(rèn)為匯集時(shí)間間隔的變化對于交通流噪聲的消除是有顯著影響的.隨著匯集時(shí)間間隔的進(jìn)一步增大,t檢驗(yàn)結(jié)果顯示,匯集時(shí)間間隔的變化對基于交通狀態(tài)矢量的交叉驗(yàn)證均方差均值并沒有顯著性影響.因此,可以認(rèn)為主干道交通流數(shù)據(jù)的最優(yōu)匯集時(shí)間間隔為4 min.對于次干道而言,匯集時(shí)間間隔為2和3 min時(shí)交通流數(shù)據(jù)的交叉驗(yàn)證均方差均值均有顯著性差異;匯集時(shí)間間隔為5 min時(shí),t統(tǒng)計(jì)值出現(xiàn)突增,這與當(dāng)天交通流數(shù)據(jù)變化較大有一定的關(guān)系,盡管如此,其t值顯示無顯著性差異.因此,可以認(rèn)為次干道的交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔為3 min.對于支路而言,隨著匯集間隔的增大,t值總體呈現(xiàn)減小趨勢.當(dāng)匯集時(shí)間間隔大于4 min時(shí),匯集時(shí)間間隔的增大并不能顯著減小交通流數(shù)據(jù)的噪聲,因此可以認(rèn)為支路的交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔為4 min.
由此可見,不同等級道路的最優(yōu)匯集時(shí)間間隔存在差異,但差異性不大,這是不同的交通流特征導(dǎo)致的.對于交通流變化較頻繁的斷面,為了保留變化特征,匯集時(shí)間間隔不宜太大;對于交通流變化相對平穩(wěn)的斷面,其匯集時(shí)間間隔則可以適當(dāng)減小,在最大程度保留交通流原始特性的同時(shí)去除較多的噪聲和無用信息.在實(shí)際工程應(yīng)用中,由于整數(shù)匯集時(shí)間間隔在計(jì)算上的便利性,交通流數(shù)據(jù)的匯集時(shí)間間隔往往會取整,如5,15,60 min等.基于上述分析,本文建議將城市道路交通流數(shù)據(jù)的最優(yōu)匯集時(shí)間間隔取為5 min.
表2 不同等級道路的交叉驗(yàn)證均方差均值的t檢驗(yàn)表
以主干道長江路為例,7月5日時(shí)間間隔為30 s和5 min時(shí)的交通流量日變化圖分別如圖2(a)和(b)所示.由圖可知,當(dāng)交通流數(shù)據(jù)以5 min時(shí)間間隔進(jìn)行匯集時(shí),原始交通流數(shù)據(jù)(時(shí)間間隔為30 s時(shí))中的很多噪聲被消除,可以更好地反映交通流運(yùn)行狀況,因而可以應(yīng)用于城市道路交通流實(shí)時(shí)監(jiān)測中.
圖2 不同間隔交通流日變化圖
本文構(gòu)建了一種基于交通狀態(tài)矢量的城市道路交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔的交叉驗(yàn)證均方差模型,并對不同等級的城市道路交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔進(jìn)行了量化分析.提出了一種基于t檢驗(yàn)方法的城市道路交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔判別方法,通過判斷相鄰匯集時(shí)間間隔的交叉驗(yàn)證均方差均值有無顯著性差異,來確定交叉驗(yàn)證均方差均值變化的拐點(diǎn),即最優(yōu)匯集時(shí)間間隔.基于昆山市實(shí)測道路斷面的交通流數(shù)據(jù),對不同等級的城市道路最優(yōu)匯集時(shí)間間隔進(jìn)行分析研究.結(jié)果表明:城市主干道交通流和支路的交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔均為4 min;次干道的交通流最優(yōu)匯集時(shí)間間隔為3 min.實(shí)際應(yīng)用中,鑒于整數(shù)的匯集時(shí)間間隔在交通運(yùn)行狀況評價(jià)指標(biāo)計(jì)算上的便利性,建議選取5 min作為城市道路交通流數(shù)據(jù)最優(yōu)匯集時(shí)間間隔.本文針對每一等級城市道路類型僅選擇了1個(gè)斷面的交通流數(shù)據(jù)來進(jìn)行分析,因此下一步的研究可針對每一類型城市道路,選取多個(gè)斷面交通流數(shù)據(jù)進(jìn)行分析,以提高研究結(jié)論的普適性.
References)
[1]Guo J,Williams B M,Smith B L.Data collection time intervals for stochastic short-term traffic forecasting[J].Transportation Research Record,2008,2024:18-26.
[2]朱雷雷,張韋華,聶慶慧.干線公路交通流數(shù)據(jù)有效性檢驗(yàn)規(guī)則[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2011,41(1):194-198.Zhu Leilei,Zhang Weihua,Nie Qinhui.Traffic data screening rules for highways[J].Journal of Southeast University:Natural Science Edition,2011,41(1):194-198.(in Chinese)
[3]Ni D,Leonard J D,Guin A,et al.Multiple imputation scheme for overcoming the missing values and variability issues in ITS data[J].Journal of Transportation Engineering,2005,131(12):931-938.
[4]Xia J,Chen M.Defining traffic flow phases using intelligent transportation systems-generated data[J].Journal of Intelligent Transportation System:Technology,Planning,and Operations,2007,11(1):15-24.
[5]Xia J,Chen M.A nested clustering technique for freeway operating condition classification[J].Computer-Aided Civil and Infrastructure Engineering,2007,22(6):430-437.
[6]Xia J,Huang W,Qian Z D.A clustering approach to online freeway traffic state identification using ITS data[J].KSCE Journal of Civil Engineering,2012,16(3):426-432.
[7]Qiao F,Yu L,Wang X.Double-sided determination of aggregation level for ITS data[J].Transportation Research Record,2004,1879:80-88.
[8]Gajewski B J,Turner S M,Eisele W L,et al.ITS data archiving:statistical techniques for determining optimal aggregation widths for inductance loop detectors[J].Transportation Research Record,2000,1719:85-93.
[9]Park D,You S,Rho J,et al.Investigating optimal aggregation interval sizes of loop detector data for travel time estimation and prediction[C]//Proceedings of the 86th Annual Meeting of Transportation Research Board.Washington DC,2007:101-107.
[10]Park D,Rilett L R,Gajewski B J,et al.Identifying optimal data aggregation interval sizes for link and corridor travel time estimation and forecasting [J].Transportation,2009,36(1):77-95.
[11]Smith B L,Ulmer J M.Freeway traffic flow rate measurement:investigation into impact of measurement time interval[J].Journal of Transportation Engineering,2003,129(3):223-229.
[12]于雷,陳旭梅,耿彥斌,等.基于小波分解的智能交通系統(tǒng)數(shù)據(jù)集成方法[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2004,44(6):793-796.Yu Lei,Chen Xumei,Geng Yanbin,et al.Optimized aggregation level for ITS data based on wavelet decomposition[J].Journal of Tsinghua University:Science and Technology,2004,44(6):793-796.(in Chinese)
[13]劉夢涵,于雷,耿彥斌,等.基于小波變換的ITS數(shù)據(jù)雙側(cè)最優(yōu)化集成方法與應(yīng)用[J].交通運(yùn)輸系統(tǒng)工程與信息,2008,8(1):49-54.Liu Menghan,Yu Lei,Geng Yanbin,et al.A doublesided optimization of ITS data aggregation via wavelet transformation[J].Journal of Transportation System Engineering and Information Technology,2008,8(1):49-54.(in Chinese)
[14]張衛(wèi)華,趙銘軍.指標(biāo)無量綱化方法對綜合評價(jià)結(jié)果可靠性的影響及其實(shí)證分析[J].統(tǒng)計(jì)與信息論壇,2005,20(3):33-36.Zhang Weihua,Zhao Mingjun.The influence of undimensionalization on the reliability of comprehensive evaluation results and an empirical analysis[J].Statistics& Information Forum,2005,20(3):33-36.(in Chinese)