王殿海,郭佳林,蔡正義
(浙江大學(xué),建筑工程學(xué)院,智能交通研究所,杭州310058)
城市道路交叉口的交通流組織和控制,是城市交通研究中的重要課題。其中,飽和流率是計算交叉口通行能力、優(yōu)化信號控制方案的關(guān)鍵基礎(chǔ)參數(shù)。飽和流率的定義為:在連續(xù)綠燈時間內(nèi),某條進口道所能通過車輛的最大穩(wěn)定流率[1]。飽和流率的大小受車輛構(gòu)成類型,車道位置,排隊位置及車輛間相互關(guān)系等影響?;旌巷柡土髀适菫橛嬃砍鞘械缆飞辖M成成分、動力特性、外形尺寸和行駛行為不同的交通流飽和流率而提出的指標(biāo)。
針對混合飽和流率的測算已有大量研究。最經(jīng)典的是美國通行能力手冊[1](Highway Capacity Manual,HCM)提出的,在理想飽和車頭時距的基礎(chǔ)上乘以大車比例、車道寬度等影響因素的折減系數(shù)來計算飽和流率,各影響因素通過經(jīng)驗公式或者回歸模型標(biāo)定相關(guān)參數(shù)確定折減系數(shù)。目前,國內(nèi)外關(guān)于飽和流率的研究均在HCM法的基礎(chǔ)上對飽和流率影響因素進行分析并構(gòu)建回歸模型,如:NGUYEN H.D.[2]討論以摩托車為主要交通構(gòu)成的城市混合交通流飽和流率;SUSHMITHA R.[3]建立針對發(fā)展中國家無車道線交叉口的混合飽和流率回歸分析模型;SAHAA.[4]針對HCM法無法考慮交通流構(gòu)成的異質(zhì)性問題,基于克里金法對影響混合交通流飽和流率的因素進行分析,并構(gòu)建4種飽和流率模型。這類混合交通流飽和流率測算方法簡潔有效,但有以下不足:第一,在現(xiàn)有技術(shù)條件下主要靠人工調(diào)查確定混合交通流構(gòu)成比例并擬合相關(guān)參數(shù),同時需要討論不同環(huán)境條件帶來的影響,費時費力。第二,采用靜態(tài)調(diào)查方法標(biāo)定參數(shù),無法考慮混合交通流構(gòu)成的時空異質(zhì)性變化,使用時默認調(diào)查前后交通流構(gòu)成比例不變,與實際不符。第三,由于目前信號控制系統(tǒng)并不能檢測出車輛類型和混合交通流的車輛構(gòu)成比例,故不能直接用于實時生成或優(yōu)化交通控制信號方案。
部分學(xué)者假設(shè)某交通指標(biāo)可以“等價”混合交通流的飽和流率特征,從而建模計算混合流率。例如,敖谷昌等[5]提出基于時間占有率分析的車輛換算系數(shù)。WANG D.H.[6]提出車道有效寬度的概念,針對城市道路專門建立自行車換算系數(shù)的模型,這種方法需要針對不同交通流單獨建模分析,依賴其他交通指標(biāo)進行評價。
近年來,部分研究采用數(shù)據(jù)驅(qū)動的方法,利用收集的車頭時距數(shù)據(jù),提取相應(yīng)的統(tǒng)計學(xué)習(xí)特征,如排隊位置、車型等,建立數(shù)據(jù)統(tǒng)計特征與混合飽和流率之間的關(guān)系。例如,LI L.[7]針對不同車頭時距分布對宏觀、微觀交通流模型的影響進行分析。劉明君[8]通過對北京城市道路信號交叉口車頭時距分析,建立針對混合交通流車頭時距的SVM(Support Vector Machine)模型。嚴穎等[9]將車頭時距分為飽和狀態(tài)和非飽和狀態(tài),利用高斯混合分布模型識別車頭時距對應(yīng)的狀態(tài),提取飽和狀態(tài)車頭時距,但缺少對混合交通的建模討論。這類方法不依賴假設(shè),數(shù)據(jù)擬合精度高,但實際應(yīng)用困難,需要不斷進行模型的訓(xùn)練和預(yù)測。
綜上所述,雖然在估計混合飽和流率問題上研究方法相對豐富,但停留在事后對數(shù)據(jù)分析處理上,或者沒有考慮混合交通帶來的耦合影響,不能用于實時交通信號控制。
隨著城市大范圍電子警察和卡口監(jiān)控等基礎(chǔ)設(shè)施的廣泛布設(shè)應(yīng)用,實時獲取城市海量ALPR數(shù)據(jù)成為現(xiàn)實。本文提出利用數(shù)據(jù)實時估計信號交叉口混合交通流飽和流率的方法。首先,從ALPR數(shù)據(jù)中分信號周期提取車頭時距數(shù)據(jù),在當(dāng)前車和后車車輛類型確定時車頭時距滿足同一正態(tài)分布的假設(shè)基礎(chǔ)上,構(gòu)建車頭時距的高斯混合模型并應(yīng)用EM 算法求解;其次,基于AIC 準(zhǔn)則選取模型的最佳聚類數(shù)目,擬合數(shù)據(jù)得到高斯混合模型參數(shù);最后,根據(jù)車頭時距的高斯混合模型推算出混合交通流飽和流率。
自動車牌識別數(shù)據(jù)是基于布設(shè)在交叉口停車線處的高清攝像機捕獲的圖像進行圖像識別處理得到的,包含通過車輛的車牌信息、時間戳及車道信息??梢曰谧詣榆嚺谱R別數(shù)據(jù)的時間戳計算某車道上前后車的車頭時距,提取車頭時距的步驟如下。
Step 1 將第i車輛經(jīng)過的時刻ti減去前車經(jīng)過的時刻ti-1得到當(dāng)前車輛的車頭時距hi。
Step 2 根據(jù)當(dāng)前信號燈的信號狀態(tài)判定當(dāng)前車輛在綠燈相位啟動后的通過次序。
Step 3 以信號周期為單位提取各信號周期內(nèi)該車道所有離散車頭時距及其通過次序。
Step 4 選取高峰期飽和狀態(tài)下某一綠燈相位啟亮后的數(shù)據(jù),根據(jù)HCM[1]飽和車頭時距實測法的建議,以及文獻[8]指出的當(dāng)飽和釋放超過30 s 時,飽和流率計算值會降低且不穩(wěn)定,需要設(shè)置判斷規(guī)則對獲取的車頭時距數(shù)據(jù)進行篩選,以獲取飽和釋放的車頭時距。判斷規(guī)則為:首先,選取第5 輛車為穩(wěn)定車頭時距的起點,第10 輛車作為穩(wěn)定車頭時距的終點。結(jié)合實際經(jīng)驗,前10 輛車車頭時距極限情況下平均不超過3 s,在30 s 綠燈時間內(nèi),至少能通過10 輛車,則認為第5~10 輛車的飽和釋放車頭時距數(shù)據(jù)相對穩(wěn)定。其次,該車道應(yīng)處于飽和狀態(tài),則一個信號周期內(nèi)釋放的車輛數(shù)A滿足
式中:gs為該信號口該周期內(nèi)的有效綠燈時間,通過信號周期數(shù)據(jù)獲得;h*為預(yù)估的混合飽和車頭時距,根據(jù)經(jīng)驗預(yù)設(shè),根據(jù)調(diào)查經(jīng)驗取h*=2.5 s。當(dāng)時,認為該車道已處于飽和狀態(tài)。
自動車牌識別數(shù)據(jù)采集如圖1所示。
圖1 自動車牌識別數(shù)據(jù)采集示意Fig.1 Operational principles of automatic license plate recognition system
混合交通流的車頭時距示意如圖2所示,其中,Nαβ代表前車為第α種車,后車為第β種車時的車頭時距。本文假設(shè)當(dāng)同一車道前后車的車輛類型固定時,車頭時距是滿足同一分布的,即當(dāng)前車為小汽車(car),后車為公交車(bus)時,所有該類型的車頭時距Ncb滿足同一分布;前車為小汽車(car),后車為小汽車(car)時,所有該類型的車頭時距Ncc滿足同一分布。
圖2 混合交通流的車頭時距示意Fig.2 Diagram of headway of mixed traffic flow
針對車頭時距的分布,根據(jù)不同場景和交通流條件,可以建立不同的分布模型,如高斯分布、對數(shù)正態(tài)分布等[7],在實際應(yīng)用中可以對分布類型作假設(shè)檢驗,選取合適的模型。以常見的車頭時距分布——高斯分布[10]為例,假設(shè)某前后車固定車型的車頭時距數(shù)據(jù)滿足分布N(μα,β,σ2α,β),那么同類型前后車的車頭時距滿足同一高斯分布。在現(xiàn)實場景中,單從自動車牌識別數(shù)據(jù)無法判斷通過車輛的類型,因此,無法提取同一類型的車頭時距進行參數(shù)估計,此問題轉(zhuǎn)化為:估計一個由若干類車頭時距組成的高斯混合分布的參數(shù)。
假設(shè)車頭時距h1,h2,…,hn滿足類數(shù)為K0的混合高斯分布,表示為
式中:(π,μ,σ)=(π1,π2,…,πk;μ1,μ2,…,μk;σ1,σ2,…,σk),πk為混合系數(shù),表示選擇第k個高斯分布的概率,k=1,2,…,K0;N(x|μk,σk)為參數(shù)為μk,σk的高斯概率密度函數(shù),表示第k類高斯函數(shù);x,y分別為滿足混合高斯分布和滿足高斯分布的隨機變量分布模型,即
如果車頭時距滿足對數(shù)正態(tài)分布,則令y′=lny,將y′帶入式(1)即可。
對于未知類數(shù)的高斯混合分布模型參數(shù)估計問題,常見的做法是通過AIC(Akaike information criterion)和BIC(Bayesian Information Criterion)準(zhǔn)則判斷最佳的模型選擇。AIC 是衡量統(tǒng)計模型擬合優(yōu)良程度的一種標(biāo)準(zhǔn),由赤池弘次創(chuàng)立發(fā)展,在這里用EAIC表示,定義為
式中:χ為模型個數(shù);L為似然函數(shù),該準(zhǔn)則可以尋找最好地解釋數(shù)據(jù)但包含最小自由參數(shù)的模型。
一般在選擇高斯混合分布的最佳聚類數(shù)目時,選擇AIC指標(biāo)最小的模型對應(yīng)的類數(shù)K*。在確定最優(yōu)混合高斯分布的類數(shù)K*后,即可根據(jù)車頭時距與飽和流率關(guān)系計算混合飽和流率。
數(shù)據(jù)經(jīng)過混合分布估計參數(shù)后,對每個數(shù)據(jù)進行判別,當(dāng)模型認為其符合第k類分布的概率最大時,該數(shù)據(jù)便被歸為第k類,混合飽和流率S′為
式中:為屬于第k類的車頭時距數(shù)據(jù)數(shù);u′k為該類分布的均值。
假設(shè)真實情況下,符合某固定前后車型的車頭時距Ni,j的車頭時距數(shù)據(jù)有ni,j個,均值為μi,j。則在此混合比例下,真實的混合飽和流率S為
S′和S的差值即為高斯混合模型的估計混合飽和流率的誤差。
對于混合分布中含有的多個參數(shù)πk,μk,σk,直接應(yīng)用極大似然估計方法計算,復(fù)雜程度高,不易求解,故使用EM(Expectation Maximization)算法進行估計。EM 方法簡化了極大似然估計的計算,最大的優(yōu)點是簡單和穩(wěn)定[11]。
引入一個K維的二值型變量z=[]z1,…,zk,表示樣本由哪個分模型產(chǎn)生,zk∈{0,1} 且,即有且只有一個取值為1,其余為0。對樣本集{x1,…,xΩ},zk=1 表示該樣本x由分模型k抽樣得到,Ω代表樣本數(shù)量。第n個樣本xn對應(yīng)的隱變量zn=[zn1,…,znK],n=1,…,N,取初始值開始迭代,EM算法步驟如下。
Step 1 E步
式中:γ(znk)為當(dāng)前模型參數(shù)下第n個觀測數(shù)據(jù)來自第k個分模型的概率。
Step 2 M步
式中:μnkew,σnkew為新一輪迭代中第k個分模型的均值和方差;Ωk為被分配到第k個分模型的有效樣本數(shù)。
Step 4 對不同K值的混合分布模型利用AIC指標(biāo)進行評判,選取AIC指標(biāo)最小的模型作為最佳模型。
選取杭州市環(huán)城西路-體育場路(環(huán)城西路96號),豐潭路-萍水街(豐潭路566 號),花蔣路-余杭塘路(余杭塘路)3 個交叉口某條車道作為應(yīng)用案例,地理位置如圖3所示。
圖3 數(shù)據(jù)采集點位地理位置Fig.3 Geographical location of intersections
采用攝像機人工拍攝2019年11月某工作日晚高峰時的過車視頻,對視頻進行逐幀分析對比,記錄車輛車頭通過停車線的時刻信息和車牌信息,時刻信息精確到0.02 s。計算同車道內(nèi)連續(xù)2輛車通過時刻的時間差,得到車頭時距。將所得混合車流的車頭時距作為真實值,樣本數(shù)為2293個,數(shù)據(jù)統(tǒng)計如表1所示。
表1 車頭時距統(tǒng)計表Table 1 Statistics of headway
考慮到自動車牌識別數(shù)據(jù)的時間戳精確到秒,采樣時間的精度不夠。為模擬ALPR數(shù)據(jù),對采集的實測過車數(shù)據(jù)進行取整處理,分析自動車牌識別數(shù)據(jù)和真實數(shù)據(jù)由于數(shù)據(jù)采樣帶來的誤差,如表2所示。
表2 模擬采樣相對誤差表Table 2 Relative error table of analog sampling
采樣相對誤差在1.6%~4.0%之間,數(shù)據(jù)誤差在5%以內(nèi)即可接受[10],因此,自動車牌識別數(shù)據(jù)可以滿足作為實際數(shù)據(jù)輸入準(zhǔn)確性的要求。
按照統(tǒng)計檢驗方法對獲取的車頭時距數(shù)據(jù)分別進行高斯混合分布和對數(shù)正態(tài)混合模型擬合,對車頭時距數(shù)據(jù)分布在顯著性水平0.05 下進行K-S檢驗,計算頻率分布與理論分布兩條累計分布曲線之間的最大垂直差D 值,D 值越小,說明越符合分布假設(shè),結(jié)果如表3所示,3個測試路口的飽和車頭時距數(shù)據(jù)均通過高斯混合分布檢驗,相比對數(shù)正態(tài)混合分布取得更小的D值。
表3 車頭時距分布K-S檢驗顯著性水平Table 3 Significance level of K-S test for headway distribution
運用AIC判斷高斯混合模型的高斯分布個數(shù),AIC 指標(biāo)值最小的K值個數(shù)就是最佳個數(shù),例如,環(huán)城西路-體育場路模型的AIC分析,如圖4所示,隨著K值增大,AIC值先減小后增大,在K=2處取得最小值,其他兩個交叉口得到相同結(jié)果。
圖4 環(huán)城西路-體育場路高斯混合分布個數(shù)與AIC關(guān)系Fig.4 AIC analysis chart of Huancheng West Road Stadium Road
根據(jù)數(shù)據(jù)分布特點,模型將其分為純小型車組成的車頭時距和混入大車的車頭時距兩種分布,3 個交叉口分別得到的高斯混合分布參數(shù)如表4所示,數(shù)據(jù)分布直方圖和高斯模型擬合結(jié)果如圖5所示。
表4 高斯混合分布參數(shù)表Table 4 Parameters of gaussian mixture distribution
圖5 數(shù)據(jù)分布和高斯模型擬合結(jié)果Fig.5 Data distribution and Gaussian mixture model fitting results
根據(jù)擬合結(jié)果,由式(5)和式(6)分別計算HCM實測法和本文模型擬合的混合飽和流率,以HCM法為標(biāo)準(zhǔn),計算相對誤差如表5所示。
表5 HCM法和模型擬合的混合飽和流率對比Table 5 Comparison of HCM method and model fitted mixed saturation flow rates
通常做法是使用HCM手冊換算為標(biāo)準(zhǔn)小型車飽和流率用于配時,這一做法默認了調(diào)查數(shù)據(jù)與當(dāng)下交通組成一致。表5表明兩者計算結(jié)果非常接近,可以認為該方法的效果接近HCM法。但HCM法在目前技術(shù)手段下,只能通過人工調(diào)查數(shù)據(jù)計算,而本方法可以在檢測器上自動采集數(shù)據(jù)計算,故本方法實際應(yīng)用意義在于能在未知車型和交通組成條件下,合理地估計當(dāng)前交通狀態(tài),能夠自動化部署在檢測器上,取代人工調(diào)查。
利用本案例數(shù)據(jù),按城市道路工程設(shè)計規(guī)范[12]推薦的車輛折減系數(shù),將數(shù)據(jù)換算成標(biāo)準(zhǔn)車流飽和流率,將模型擬合的純小車車頭時距分布換算成標(biāo)準(zhǔn)車流飽和流率,計算結(jié)果如表6所示。模型擬合結(jié)果接近于結(jié)合了大量工程實際的規(guī)范換算,說明本方法結(jié)果上接近工程實踐。
表6 按規(guī)范和高斯混合模型計算所得標(biāo)準(zhǔn)車飽和流率Table 6 Saturated flow rate of standard cars calculated by Code and Gaussian mixture model method
為探討模型在不同流量條件下的適用情況,以15 min為一個時間段,分別選取晚高峰的4個時間段,計算不同高峰時間段本文方法所得的混合飽和流率,如表7所示。極差系數(shù)在10%以內(nèi),說明本文方法具有一定的魯棒性。
表7 不同高峰時間段混合模型計算所得混合飽和流率Table 7 Saturation flow rate of standard vehicle calculated by hybrid model at different peak periods
本文提出基于自動車牌識別數(shù)據(jù)的混合交通飽和流率的實時估計方法,該方法能夠自動部署,實時采集數(shù)據(jù)計算,案例計算結(jié)果與真實值相差在5%以內(nèi),效果接近于經(jīng)典的HCM 法,準(zhǔn)確性和可靠性高;同時,不同時間段內(nèi)極差系數(shù)結(jié)果表明方法具有良好的魯棒性,能取代人工調(diào)查,為未來交通信號控制系統(tǒng)的研究提供基礎(chǔ)。