摘要:高速公路信息化建設(shè)日益完善,為了能夠更加詳盡地掌握高速公路的交通狀態(tài),以濟(jì)青高速為研究對(duì)象,通過(guò)挖掘門架數(shù)據(jù),設(shè)計(jì)了k均值聚類算法和基于密度的噪聲應(yīng)用空間聚類算法相結(jié)合的兩階段聚類方法來(lái)識(shí)別駛?cè)敕?wù)區(qū)車輛和異常行駛的車輛,再結(jié)合各車型流量占比加權(quán)的交通狀態(tài)指數(shù),從時(shí)間和空間維度分析高速公路路段交通狀態(tài)。研究結(jié)果表明,兩階段聚類算法有著很好的識(shí)別效果,通過(guò)交通狀態(tài)指標(biāo)發(fā)現(xiàn)在7:00—20:00時(shí)段高速公路存在3個(gè)交通狀態(tài)較擁堵的時(shí)段,精確地識(shí)別出高速公路中交通狀態(tài)較擁堵的路段,并且發(fā)現(xiàn)路段的大車混入率與交通擁堵程度呈現(xiàn)密切的正相關(guān)的趨勢(shì),最后依據(jù)交通狀態(tài)指數(shù)將濟(jì)青高速路段交通狀態(tài)劃分為4個(gè)不同的等級(jí),為交通管理部門提供了路段交通狀態(tài)評(píng)估的技術(shù)支持。
關(guān)鍵詞:門架數(shù)據(jù);交通狀態(tài);聚類算法;交通狀態(tài)指數(shù);大車混入率
中圖分類號(hào):U491文獻(xiàn)標(biāo)志碼:A文章編號(hào):1002-4026(2023)03-0100-08
Abstract∶To thoroughly investigate the traffic state of highways, Jiqing Highway was selected as the study case. By mining the gantry data, a two-stage clustering algorithm combining k-means and density-based special clustering of applications with noise (DBSCAN) algorithms were proposed. The method was used to identify vehicles entering the service area and driving abnormally. Subsequently, the filtered vehicle records were extracted to realize a traffic state index weighted by the vehicle type to analyze the traffic state of the highway in terms of spatiotemporal dimensions. Results indicate that the two-stage clustering algorithm performs very well in the identification. The traffic state index indicated three periods when the highway is defined as congested during 7:00—20:00. Furthermore, it accurately identifies the congested sections of the highway. Moreover, it shows out that the mixed rate of large vehicles and the degree of traffic congestion in a section have a close positive correlation. Finally, according to the evaluation index, the traffic state of the Jiqing Highway is divided into four levels, which provides technical support for the traffic authorities to evaluate and manage the highway sections.
Key words∶gantry data; traffic condition; clustering algorithm; traffic state index; mixed rate of large vehicles
截至2021年,我國(guó)高速公路里程數(shù)已經(jīng)達(dá)到16.91 萬(wàn)公里,但是隨著我國(guó)汽車保有量的增加,高速公路仍然會(huì)出現(xiàn)擁堵問(wèn)題。為更好地評(píng)估高速公路運(yùn)行狀態(tài),門架系統(tǒng)應(yīng)運(yùn)而生。目前,全國(guó)已建成了2.66 萬(wàn)套門架系統(tǒng),記錄了海量的行車感知數(shù)據(jù)。隨著數(shù)據(jù)挖掘技術(shù)逐漸成熟,通過(guò)智能化手段從海量的門架數(shù)據(jù)中挖掘出復(fù)雜的交通流變化態(tài)勢(shì)是當(dāng)前交通研究的熱點(diǎn)與難點(diǎn)。在建成交通強(qiáng)國(guó)、智慧高速等背景下,研究高速公路路段時(shí)空維度的交通運(yùn)行狀態(tài),對(duì)引導(dǎo)出行者出行、提高路段通行效率具有重要意義。
由于門架系統(tǒng)的建設(shè)周期較長(zhǎng),已有的高速公路交通管理研究對(duì)于大規(guī)模的門架數(shù)據(jù)仍少有涉及,劉群等[1]利用門架數(shù)據(jù)進(jìn)行了交通流預(yù)測(cè)的研究;邢麗峰等[2]利用門架數(shù)據(jù)進(jìn)行了高速公路各類車輛的交通量轉(zhuǎn)換的研究;曹波[3]在門架數(shù)據(jù)的基礎(chǔ)上提出區(qū)間擁堵指數(shù),用于估計(jì)路段交通狀態(tài)。在道路運(yùn)行狀態(tài)估計(jì)方面,現(xiàn)階段采用的數(shù)據(jù)大致分為固定式交通檢測(cè)技術(shù)采集的數(shù)據(jù)(感應(yīng)線圈、微波檢測(cè))[4-5],移動(dòng)式交通檢測(cè)技術(shù)采集的數(shù)據(jù)(全球定位技術(shù)(global positioning system,GPS)[6]、手機(jī)信令采集技術(shù)[7]),以及收費(fèi)站數(shù)據(jù)[8],無(wú)人機(jī)[9-10]、監(jiān)控視頻[11]檢測(cè)技術(shù)采集的數(shù)據(jù)。而門架數(shù)據(jù)相較這幾類數(shù)據(jù)具有如下優(yōu)勢(shì):固定式交通檢測(cè)設(shè)備往往只在特定的路段布置,無(wú)法大規(guī)模地應(yīng)用,而門架設(shè)備布置規(guī)模非常之廣;移動(dòng)式交通檢測(cè)技術(shù)往往會(huì)受到周圍環(huán)境的影響導(dǎo)致精確度大大下降,而門架數(shù)據(jù)精確度較高,幾乎不存在數(shù)據(jù)大批量缺失的現(xiàn)象;利用收費(fèi)站數(shù)據(jù)進(jìn)行交通狀態(tài)估計(jì)時(shí),由于數(shù)據(jù)中僅僅記錄車輛進(jìn)入和離開(kāi)高速路網(wǎng)的數(shù)據(jù),所以數(shù)據(jù)處理過(guò)程相當(dāng)復(fù)雜,而門架系統(tǒng)記錄車輛經(jīng)過(guò)每一個(gè)路網(wǎng)路段的數(shù)據(jù),可以更好地檢測(cè)車輛在每一個(gè)路段的行駛狀態(tài),計(jì)算過(guò)程相對(duì)容易;無(wú)人機(jī)、監(jiān)控視頻數(shù)據(jù)雖然精度高、靈活性強(qiáng),但是成本高、不利于推廣應(yīng)用,而門架數(shù)據(jù)獲取容易且維護(hù)成本也較低。綜上所述,門架數(shù)據(jù)具有應(yīng)用范圍廣、精度高、計(jì)算方便、成本低的特點(diǎn)。由于高速公路兩兩門架之間設(shè)有服務(wù)區(qū),在計(jì)算駛?cè)敕?wù)區(qū)的車輛平均行程速度時(shí)會(huì)偏低,根據(jù)梁奇[12]統(tǒng)計(jì),高速公路服務(wù)區(qū)客車、貨車駛?cè)肼示?0%,但現(xiàn)有研究方法對(duì)此問(wèn)題通常不予考慮,造成結(jié)果可靠性下降。賴見(jiàn)輝等[13]采用機(jī)器學(xué)習(xí)的方法對(duì)車輛是否駛?cè)敕?wù)區(qū)進(jìn)行預(yù)測(cè),而該方法存在一定的誤差,可解釋性差,并且還需進(jìn)行問(wèn)卷調(diào)查來(lái)獲取模型的訓(xùn)練數(shù)據(jù),增加了工作量。直接利用原始門架數(shù)據(jù),根據(jù)每個(gè)車輛的平均行程速度特性挖掘出駛?cè)敕?wù)區(qū)的車輛的方法準(zhǔn)確度高,可解釋性強(qiáng)。
研究本研究通過(guò)兩階段的聚類方法準(zhǔn)確地識(shí)別出路段中駛?cè)敕?wù)區(qū)的車輛和行駛異常的車輛,再利用交通狀態(tài)指數(shù)在時(shí)間和空間維度對(duì)濟(jì)青高速的交通狀態(tài)進(jìn)行評(píng)價(jià)分析,挖掘其時(shí)空規(guī)律。最后根據(jù)交通狀態(tài)指數(shù)將濟(jì)青高速各個(gè)路段劃分為4個(gè)擁堵等級(jí)。為高速公路管理部門準(zhǔn)確了解高速公路運(yùn)行狀態(tài),制定擁堵管理措施提供借鑒,進(jìn)而提升高速公路的通行能力。
1異常速度識(shí)別方法
1.1k均值聚類算法
k均值聚類(k-means)算法[14]作為一種經(jīng)典的聚類算法,已經(jīng)廣泛地應(yīng)用于各個(gè)領(lǐng)域。本研究將k-means算法用于識(shí)別駛?cè)敕?wù)區(qū)的車輛,以時(shí)間維度和各個(gè)車輛平均行程速度vi為聚類指標(biāo),利用是否駛?cè)敕?wù)區(qū)的兩類車輛在平均行程速度上存在較大差異的特點(diǎn)解決了k-means算法難以確定初始聚類中心的問(wèn)題,識(shí)別過(guò)程如下:
(1)指定聚類數(shù)目k和聚類中心(c1,c2,…,ci),由于本研究已經(jīng)非常明確地將數(shù)據(jù)集劃分為兩個(gè)類別,并且未進(jìn)入服務(wù)區(qū)車輛和進(jìn)入服務(wù)區(qū)車輛在平均行程速度上存在明顯的差異,所以將聚類數(shù)目k指定為2,聚類中心(c1,c2)指定為([t_,v_],[t_,s])。其中t_為目標(biāo)時(shí)段的中間時(shí)刻;v_為未駛?cè)敕?wù)區(qū)車輛的平均行程速度的經(jīng)驗(yàn)值,本研究選取90 km/h;s為駛?cè)敕?wù)區(qū)車輛的平均行程速度的經(jīng)驗(yàn)值,本研究選取20 km/h。
(4)重復(fù)(2)和(3)步驟,直到各個(gè)聚類中心ci不再發(fā)生變化,或者達(dá)到預(yù)設(shè)的迭代數(shù)。
1.2基于密度的噪聲應(yīng)用空間聚類算法
基于密度的噪聲應(yīng)用空間聚類算法(density-based special clustering of appliations with noise,DBSCAN)[15]可以在具有噪聲的數(shù)據(jù)集中發(fā)現(xiàn)任意形狀的簇。該算法最重要的兩個(gè)參數(shù)分別為鄰域密度閾值ρMinPts以及鄰域半徑REps。本研究利用該算法識(shí)別某一路段未進(jìn)入服務(wù)區(qū)車輛的平均行程速度集合中的偏大或者偏小的離群數(shù)據(jù),相對(duì)于傳統(tǒng)的閾值篩選的方法更加靈活,識(shí)別過(guò)程如下:
(1)定義某一路段未駛?cè)敕?wù)區(qū)車輛的平均行程速度集合D,給定鄰域密度閾值ρMinPts和鄰域半徑REps,計(jì)算各個(gè)車輛平均行程速度vi的鄰域?qū)ο髠€(gè)數(shù)NEpsvi,若NEpsvi≥ρMinPts,則vi為核心對(duì)象。
(2)判斷各個(gè)核心對(duì)象是否在其他核心對(duì)象所構(gòu)成的鄰域里面,若在其中則該兩個(gè)核心對(duì)象構(gòu)成密度可達(dá),密度可達(dá)的核心對(duì)象鄰域構(gòu)成的集合為一個(gè)簇,不在任何簇中的車輛平均行程速度則為異常數(shù)據(jù)。
2交通狀態(tài)評(píng)估指數(shù)
交通狀態(tài)指數(shù)(ITS)[16]可以用量化數(shù)值來(lái)表示道路交通狀態(tài),數(shù)值越大表示交通擁堵越嚴(yán)重,分為基本模型和加權(quán)模型。本研究使用各車型流量加權(quán)模型,計(jì)算公式如下:
式中,Tgij為路段i時(shí)間段j中g(shù)類車的ITS值,vgf為g類車的理想平均行程速度,vgij為路段i時(shí)間段j所有g(shù)類車的實(shí)際平均行程速度的平均值,Tij為路段i時(shí)間段j的ITS值。
交通狀態(tài)評(píng)估流程如圖1所示,首先利用兩階段聚類算法對(duì)車輛平均行程速度進(jìn)行篩選,避免駛?cè)敕?wù)區(qū)車輛對(duì)路段平均行程速度計(jì)算的干擾,提高計(jì)算的可靠性,最后計(jì)算各路段ITS來(lái)評(píng)估路段交通狀態(tài)。
3實(shí)例分析
3.1數(shù)據(jù)概況與預(yù)處理
本研究所使用的數(shù)據(jù)來(lái)自山東省濟(jì)青高速濟(jì)南章丘—青島機(jī)場(chǎng)北樞紐段共26個(gè)門架路段,路段全長(zhǎng)309.633 km,2021年9月6日至12日共一周的門架數(shù)據(jù)4 063 295條,刪除重復(fù)值和缺失值后還剩余4 051 105條數(shù)據(jù),字段信息如表1所示。
本研究以相鄰兩個(gè)門架組成的路段為研究路段,共25條,上游門架數(shù)據(jù)以trans_time和vehicle_plate字段為鍵,下游門架以last_gantry_time和vehicle_plate字段為鍵,進(jìn)行數(shù)據(jù)拼接,拼接后的數(shù)據(jù)即為路段行車數(shù)據(jù),包括車牌號(hào)、經(jīng)過(guò)上下游路段時(shí)間、路段長(zhǎng)度、車輛平均行程速度,其中某輛車經(jīng)過(guò)該路段的平均行程速度vi=lΔt,l為路段長(zhǎng)度,Δt為經(jīng)過(guò)上下門架的時(shí)間差。濟(jì)南章丘—青島藍(lán)村的研究路段編號(hào)0~24,每個(gè)路段的交通量周變化情況如圖2所示,可以看出在這一周內(nèi)高速公路周一交通量最大,周三交通量最小,并且路段越往青島方向交通量越小。
3.2異常速度篩選
本研究以1 h為時(shí)間間隔,對(duì)設(shè)有服務(wù)區(qū)的路段采用k-means聚類算法將駛?cè)敕?wù)區(qū)的車輛識(shí)別出來(lái)后,再將未進(jìn)入服務(wù)區(qū)的數(shù)據(jù)利用DBSCAN聚類算法進(jìn)行二次篩選,識(shí)別出速度偏大和偏小的異常數(shù)據(jù),其中k-means聚類算法初始聚類中心([12,90],[12,20])的最大迭代數(shù)設(shè)置為300,DBSCAN聚類算法的鄰域半徑REps設(shè)置為1 km/h,鄰域密度閾值ρMinPts設(shè)置為3,篩選結(jié)果如圖3所示。從圖4可以看出,經(jīng)過(guò)篩選后的數(shù)據(jù)更趨近于正態(tài)分布。
3.3交通狀態(tài)評(píng)估
以行程速度為基礎(chǔ)的交通擁堵評(píng)價(jià)指標(biāo)是用于評(píng)估交通狀態(tài)的常用手段,例如路段延誤、TTI(travel time index)等,但往往在理想行程速度的取值上選取道路的最高限速[17-18],而不同車型之間的理想行程速度是存在差異的,所以本研究選取交通量占比較高的3種車型,如表2所示。計(jì)算3種車型流量加權(quán)求和后的ITS指標(biāo)來(lái)判斷某一路段的交通狀態(tài),研究時(shí)段選取旅客出行活動(dòng)較為頻繁的上午7:00到晚上20:00,從時(shí)間和空間兩個(gè)維度對(duì)濟(jì)青高速進(jìn)行交通狀態(tài)的評(píng)估。在時(shí)間維度方面,計(jì)算濟(jì)青高速研究時(shí)段的日平均ITS指標(biāo)變化情況,從圖5可以看出,在研究時(shí)段中存在3個(gè)ITS指標(biāo)高峰時(shí)段,分別為9:00—10:00、14:00—15:00、19:00—20:00,其中19:00—20:00時(shí)段ITS指標(biāo)最高。
從空間維度分析各個(gè)研究路段7天中8:00—20:00的平均ITS指標(biāo)的日變化情況,從圖6可以看出濟(jì)青高速中交通狀態(tài)最擁堵路段為9,從濟(jì)南開(kāi)始的0~6路段較為擁擠,較為流暢的路段為12~14路段以及18~22路段,其余路段交通擁堵?tīng)顟B(tài)較為一般。大車(中大型貨車)在交通流中的混入率與交通擁擠程度有著重要的關(guān)系[19],如圖7所示。大車混入率與ITS呈現(xiàn)正相關(guān)趨勢(shì),并且兩者的皮爾遜系數(shù)為0.68,可見(jiàn)兩者線性關(guān)系十分密切,其中路段9為臨淄東—青州西路段,臨淄區(qū)為山東省重要的工業(yè)園區(qū),出入大車的數(shù)量會(huì)比較多,所以大車混入率較高,交通運(yùn)行狀態(tài)也較為擁堵??梢詫?duì)大車實(shí)行夜間時(shí)段通行費(fèi)用折扣的措施,錯(cuò)開(kāi)小客車出行高峰時(shí)段,以此降低路段擁堵?tīng)顟B(tài)。
根據(jù)以上情況將濟(jì)青高速線路的路段交通狀態(tài)劃分為4個(gè)等級(jí),各個(gè)等級(jí)日平均ITS指標(biāo)范圍如表3所示。
4結(jié)論
本研究提出了一種基于門架數(shù)據(jù)的兩階段聚類方法來(lái)識(shí)別高速公路駛?cè)敕?wù)區(qū)的車輛和行駛速度異常的車輛,再利用各車型流量占比加權(quán)的交通狀態(tài)指數(shù)ITS,有效地識(shí)別路段異常的行程速度數(shù)據(jù),評(píng)估了濟(jì)青高速25個(gè)路段的交通狀態(tài),發(fā)現(xiàn)大車混入率與ITS呈現(xiàn)密切的正相關(guān)的關(guān)系,即大車混入率越高交通狀態(tài)越擁堵,并且將濟(jì)青高速路段交通狀態(tài)劃分為4個(gè)等級(jí),本研究方法可以為交通管理部門發(fā)現(xiàn)高速公路瓶頸路段提供理論支持。但本研究所使用的的數(shù)據(jù)量較少,僅僅分析了交通狀態(tài)的日變化和周變化的情況,提取的交通參數(shù)數(shù)量以及精度方面也有待提高,在以后的研究中應(yīng)加大研究的數(shù)據(jù)量,分析更長(zhǎng)周期的交通狀態(tài),利用更為先進(jìn)的算法提取更多有意義的交通參數(shù)。
參考文獻(xiàn):
[1]劉群, 楊濯丞, 蔡蕾. 基于ETC門架數(shù)據(jù)的高速公路短時(shí)交通流預(yù)測(cè)[J]. 公路交通科技, 2022, 39(4): 123-130. DOI: 10.3969/j.issn.1002-0268.2022.04.014.
[2]邢麗峰, 邱廷銓, 邢宇鵬. 基于ETC門架數(shù)據(jù)的高速公路交通量轉(zhuǎn)換探究[J]. 中國(guó)交通信息化, 2022(4): 94-96. DOI: 10.13439/j.cnki.itsc.2022.04.004.
[3]曹波. 基于門架數(shù)據(jù)的道路運(yùn)行指數(shù)應(yīng)用研究[J]. 中國(guó)交通信息化, 2022(1): 110-113. DOI: 10.13439/j.cnki.itsc.2022.01.011.
[4]王光輝. 高速公路交通運(yùn)行狀態(tài)判別方法研究[D]. 長(zhǎng)春: 吉林大學(xué), 2015.
[5]NANTHAWICHIT C, NAKATSUJI T, SUZUKI H. Application of probe-vehicle data for real-time traffic-state estimation and short-term travel-time prediction on a freeway[J]. Transportation Research Record: Journal of the Transportation Research Board, 2003, 1855(1): 49-59. DOI: 10.3141/1855-06.
[6]趙千里. 基于車載GPS數(shù)據(jù)的城市交通狀態(tài)估計(jì)和出租車需求預(yù)測(cè)研究[D]. 上海: 上海交通大學(xué), 2016.
[7]劉超彪. 基于手機(jī)信令數(shù)據(jù)的交通路況預(yù)測(cè)的研究與實(shí)現(xiàn)[D]. 武漢: 華中科技大學(xué), 2019.
[8]YAO E J, WANG X W, YANG Y, et al. Traffic flow estimation based on toll ticket data considering multitype vehicle impact[J]. Journal of Transportation Engineering, Part A: Systems, 2021, 147(2): 04020158. DOI: 10.1061/jtepbs.0000488.
[9]KE R M, FENG S, CUI Z Y, et al. Advanced framework for microscopic and lane-level macroscopic traffic parameters estimation from UAV video[J]. Intelligent Transport Systems, 2020, 14(7): 724-734. DOI: 10.1049/iet-its.2019.0463.
[10]張新.基于無(wú)人機(jī)視頻的交通參數(shù)提取方法及應(yīng)用[D]. 上海:同濟(jì)大學(xué),2014.
[11]LI J L, XU Z G, FU L, et al. Domain adaptation from daytime to nighttime: a situation-sensitive vehicle detection and traffic flow parameter estimation framework[J]. Transportation Research Part C: Emerging Technologies, 2021, 124: 102946. DOI: 10.1016/j.trc.2020.102946.
[12]梁奇. 高速公路服務(wù)區(qū)滿意度與駛?cè)脒x擇行為研究[D]. 重慶: 重慶交通大學(xué), 2019.
[13]賴見(jiàn)輝, 齊悅, 王揚(yáng), 等. 基于收費(fèi)數(shù)據(jù)的交通運(yùn)行參數(shù)估計(jì)方法[J]. 中國(guó)公路學(xué)報(bào), 2022, 35(3): 205-215. DOI: 10.19721/j.cnki.1001-7372.2022.03.017.
[14]楊俊闖, 趙超. k-means聚類算法研究綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2019, 55(23): 7-14. DOI: 10.3778/j.issn.1002-8331.1908-0347.
[15]周玉, 朱文豪, 房倩, 等. 基于聚類的離群點(diǎn)檢測(cè)方法研究綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2021, 57(12): 37-45. DOI: 10.3778/j.issn.1002-8331.2102-0167.
[16]吉靜, 顧承華, 翟希, 等. 基于交通狀態(tài)指數(shù)的城市道路交通擁堵評(píng)價(jià)體系研究[C]//中國(guó)智能交通協(xié)會(huì)第十一屆中國(guó)智能交通年會(huì)大會(huì)論文集. 重慶:中國(guó)智能交通協(xié)會(huì),2016: 931-939.
[17]張南,黃正國(guó),葉彭姚,等. 基于車牌數(shù)據(jù)的行程速度特性及交通狀態(tài)評(píng)估[J]. 綜合運(yùn)輸,2019, 41(5):63-70.
[18]WANG Z J, ZANG C, YANG C L. Multi-indicator Road traffic state assessment based on path state[EB/OL].[2022-08-20]. http://dx.doi.org/10.12783/dtcse/icmsa2018/23259.
[19]胡建榮, 何磊. 基于尖點(diǎn)突變理論的高速公路交通流狀態(tài)判別方法[J]. 中國(guó)公路學(xué)報(bào), 2017, 30(10): 137-144. DOI: 10.19721/j.cnki.1001-7372.2017.10.017.