郭亞娟,孫慶文,張萌萌,劉思昊
(山東交通學(xué)院交通與物流工程學(xué)院,山東濟(jì)南 250357)
隨著城市交通系統(tǒng)智能化建設(shè)的不斷完善,各種前端檢測(cè)設(shè)備如地磁檢測(cè)器、視頻檢測(cè)器、全球定位系統(tǒng)(global positioning system,GPS)浮動(dòng)車(chē)檢測(cè)器等得到了大面積普及,形成較為豐富的城市交通數(shù)據(jù)源。在云計(jì)算和大數(shù)據(jù)技術(shù)日臻成熟的前提下,如何從海量數(shù)據(jù)中及時(shí)、高效地提取有價(jià)值的信息,深入挖掘交通系統(tǒng)的運(yùn)行規(guī)律,用于指導(dǎo)交通管理決策,是當(dāng)今學(xué)術(shù)界研究的熱點(diǎn)問(wèn)題[1-2]。然而,海量原始交通數(shù)據(jù)存在常發(fā)性的缺失、錯(cuò)誤等質(zhì)量問(wèn)題,導(dǎo)致無(wú)法準(zhǔn)確描述真實(shí)的交通流運(yùn)行狀態(tài),致使由此產(chǎn)生的交通管理策略應(yīng)用效果不理想,故尋找合理、有效的交通數(shù)據(jù)修復(fù)方法迫在眉睫[3-6]。
國(guó)內(nèi)外學(xué)者針對(duì)交通數(shù)據(jù)修復(fù)問(wèn)題開(kāi)展了系列研究工作并取得了階段性的研究成果,關(guān)于錯(cuò)誤、缺失數(shù)據(jù)的修復(fù)方法大致可以分為3類(lèi):預(yù)測(cè)類(lèi)、插值類(lèi)和統(tǒng)計(jì)學(xué)習(xí)類(lèi)[7]。預(yù)測(cè)類(lèi)大多是基于短時(shí)交通流預(yù)測(cè)模型完成數(shù)據(jù)修復(fù)[8-10];插值類(lèi)是從時(shí)間維度出發(fā),利用已知相鄰數(shù)據(jù)的平均值或加權(quán)平均值修補(bǔ)缺失數(shù)據(jù),或者從空間維度考慮、利用同一路段上下游不同檢測(cè)橫截面的相關(guān)數(shù)據(jù)修補(bǔ)目標(biāo)檢測(cè)橫截面的數(shù)據(jù)[11-13];統(tǒng)計(jì)學(xué)習(xí)類(lèi)則是借助統(tǒng)計(jì)學(xué)理論描述交通流,通過(guò)擬合的概率分布模型計(jì)算缺失數(shù)據(jù)[14-16]。上述方法的共同特點(diǎn)是充分挖掘交通流的時(shí)空運(yùn)行規(guī)律,完成缺失、錯(cuò)誤數(shù)據(jù)的修復(fù),但現(xiàn)有方法大多是針對(duì)相鄰交叉口間的封閉路段而言,缺乏對(duì)道路兩側(cè)出入口交通流量的考慮,導(dǎo)致觀(guān)測(cè)路段的數(shù)據(jù)修復(fù)精度不足。
盡管城市智能交通系統(tǒng)發(fā)展較為完善,但仍存在較多的檢測(cè)盲區(qū),如道路兩側(cè)出入口處的交通流量無(wú)法直接獲取,嚴(yán)重制約著數(shù)據(jù)修復(fù)的精準(zhǔn)度;又考慮到城市土地利用與交通生成量(即交通發(fā)生與吸引)存在較為密切的聯(lián)系[17-18],故從土地利用的角度構(gòu)建合理有效的出入口交通量估計(jì)模型顯得格外重要。目前,學(xué)者們圍繞土地利用在交通需求方面進(jìn)行了系列研究,如:文獻(xiàn)[19]通過(guò)量化土地利用相關(guān)因素對(duì)交通生成的影響,構(gòu)建基于土地利用的城鎮(zhèn)交通生成預(yù)測(cè)模型;文獻(xiàn)[20]通過(guò)剖析城市人口、土地利用類(lèi)型與交通出行需求之間的關(guān)聯(lián)性,建立新城區(qū)交通生成預(yù)測(cè)模型;文獻(xiàn)[21]結(jié)合土地利用形態(tài)、居民出行活動(dòng)與城市交通的關(guān)系,提出基于出行鏈的出行分布量預(yù)測(cè)方法。
近年來(lái),以卡口/電警為主導(dǎo)的視頻設(shè)備已成為城市道路交通信息檢測(cè)的主要手段,如2017年濟(jì)南市城市道路上安裝的高清卡口視頻系統(tǒng)共計(jì)2 000多套,而卡口數(shù)據(jù)也成為城市交通系統(tǒng)的一種新興交通數(shù)據(jù)源。本文從卡口數(shù)據(jù)缺失問(wèn)題入手,結(jié)合土地利用性質(zhì),構(gòu)建一種改進(jìn)的道路出入口交通量估計(jì)模型,包括出行發(fā)生估計(jì)和出行吸引估計(jì);并以此為基礎(chǔ),深入挖掘交通流的時(shí)空運(yùn)行特性,提出基于土地利用的卡口缺失數(shù)據(jù)修復(fù)方法。
土地利用與城市交通系統(tǒng)有著密不可分的關(guān)系,兩者相互影響、相互促進(jìn)、共同發(fā)展。不同的土地利用性質(zhì)與利用強(qiáng)度,直接決定了居民的出行規(guī)律及交通需求量。傳統(tǒng)的土地利用模型存在參數(shù)繁雜、標(biāo)定不精準(zhǔn)等問(wèn)題,為了準(zhǔn)確估計(jì)道路兩側(cè)的出入口交通發(fā)生、吸引量,本文提出一種針對(duì)道路出入口的土地利用優(yōu)化模型,包括道路出入口出行發(fā)生估計(jì)模型和出行吸引估計(jì)模型。
出行發(fā)生量是以研究區(qū)域?yàn)槌霭l(fā)起點(diǎn)的出行總量,是土地利用模型的重要組成部分。觀(guān)測(cè)路段的總流量不僅包括從路段上游方向駛?cè)氲慕煌浚€包括路段兩側(cè)出入口駛?cè)氲慕煌?。由于道路兩?cè)出入口的內(nèi)部區(qū)域是以居住用地為主,其土地利用的強(qiáng)度極大影響了出入口交通量的時(shí)間序列分布,因此,本文以道路兩側(cè)的居住區(qū)為研究對(duì)象,建立道路出入口出行發(fā)生估計(jì)模型
Pin=NReCk,
式中:Pin為道路兩側(cè)出入口的出行發(fā)生估計(jì)量;N為道路兩側(cè)居住區(qū)住戶(hù)數(shù)量;R為城市平均每戶(hù)人數(shù);e為城市汽車(chē)保有率;C為機(jī)動(dòng)車(chē)平均日出行次數(shù),即機(jī)動(dòng)車(chē)日出行總量與汽車(chē)保有率的比值;k為修正系數(shù)。
出行吸引量是以研究區(qū)域?yàn)槌鲂心康牡氐慕煌偭俊T诮煌ǔ鲂猩深A(yù)測(cè)的研究文獻(xiàn)中,多是以小區(qū)交通出行發(fā)生量與吸引量相等為前提所構(gòu)建的出行發(fā)生與吸引模型。考慮到影響出行發(fā)生與出行吸引的因素不同,前者是以土地利用的開(kāi)發(fā)強(qiáng)度為主,后者以區(qū)域的經(jīng)濟(jì)效益為主,本文以道路出入口內(nèi)部區(qū)域的出行發(fā)生估計(jì)量為基準(zhǔn),采用調(diào)整系數(shù)法得到出行吸引估計(jì)模型
Aout=aPin,
式中:Aout為道路兩側(cè)出入口的出行吸引估計(jì)量;a為出行發(fā)生估計(jì)量與吸引估計(jì)量之間的比例系數(shù)。
目前,高清卡口視頻檢測(cè)系統(tǒng)發(fā)展較為成熟,并在國(guó)內(nèi)大多數(shù)城市得到推廣應(yīng)用,能夠?qū)崿F(xiàn)城市道路交通狀態(tài)的動(dòng)態(tài)連續(xù)監(jiān)測(cè)。但由于受到工作環(huán)境如天氣、光照、陰影、成像設(shè)備抖動(dòng)、傳輸鏈路噪聲、車(chē)輛行駛特性等因素干擾,使得檢測(cè)數(shù)據(jù)常出現(xiàn)缺失問(wèn)題,影響數(shù)據(jù)質(zhì)量。為了更好利用卡口數(shù)據(jù)源表征道路交通運(yùn)行狀態(tài),本文針對(duì)卡口數(shù)據(jù)缺失問(wèn)題,在道路出入口的土地利用優(yōu)化模型的基礎(chǔ)上,提出卡口數(shù)據(jù)缺失修復(fù)算法。
高清卡口視頻檢測(cè)設(shè)備布設(shè)在交叉口進(jìn)口道的停車(chē)線(xiàn)附近,記錄車(chē)輛的通過(guò)時(shí)刻、車(chē)牌號(hào)、所處車(chē)道等信息。本文將相鄰交叉口間車(chē)輛被連續(xù)記錄的時(shí)刻之差,視為觀(guān)測(cè)路段內(nèi)某車(chē)輛i的行程時(shí)間ti。由此,對(duì)每天同一時(shí)段的交通流數(shù)據(jù)進(jìn)行連續(xù)匹配,可得到此時(shí)段內(nèi)所有通過(guò)車(chē)輛的行程時(shí)間。因此,某缺失時(shí)段內(nèi)由上游交叉口南進(jìn)口道行駛至下游交叉口東進(jìn)口道的平均行程時(shí)間
式中:tSi為某時(shí)段內(nèi)從上游交叉口南進(jìn)口道駛?cè)胗^(guān)測(cè)路段的第i輛車(chē)的行程時(shí)間;n為某時(shí)段內(nèi)從上游交叉口南進(jìn)口道駛?cè)胗^(guān)測(cè)路段的車(chē)輛總數(shù)。
同理可得從上游交叉口東進(jìn)口道行駛至下游交叉口東進(jìn)口道的平均行程時(shí)間tE以及從上游交叉口北進(jìn)口道行駛至下游交叉口東進(jìn)口道的平均行程時(shí)間tN。
圖1 觀(guān)測(cè)路段示意圖
如圖1所示,觀(guān)測(cè)路段兩側(cè)存在出入口(這里以一個(gè)出入口為例研究),出入口的交通量匯入或匯出觀(guān)測(cè)路段,對(duì)下游交叉口進(jìn)口道的交通量產(chǎn)生一定的影響,因此對(duì)卡口缺失數(shù)據(jù)進(jìn)行修復(fù)時(shí)須考慮出入口區(qū)域所產(chǎn)生的交通量。由于出入口的出行發(fā)生量與吸引量在1 d不同時(shí)段內(nèi)存在分布差異性,故引入時(shí)段分布系數(shù),進(jìn)而得到出入口的交通量分布模型
假定t∈(Ta,Tb]為下游交叉口數(shù)據(jù)缺失的時(shí)段范圍,則下游交叉口東進(jìn)口道在t時(shí)段內(nèi)的交通估計(jì)量
通過(guò)對(duì)濟(jì)南市歷下區(qū)實(shí)地調(diào)研,獲得觀(guān)測(cè)路段兩側(cè)出入口區(qū)域居民住戶(hù)數(shù)量及平均日出行次數(shù)等參數(shù),即N=1 500,R=2.9,e=1/3,C=2.1。
為標(biāo)定修正系數(shù)k,首先將其默認(rèn)為1,根據(jù)實(shí)際交通量與默認(rèn)狀態(tài)下的道路出入口出行發(fā)生估計(jì)量的比值確定k=5.75,并基于此得到最終的道路出入口出行發(fā)生估計(jì)量。同時(shí),通過(guò)歷史交通流數(shù)據(jù)分析,確定出行發(fā)生量與吸引量之間的實(shí)際比例系數(shù)a=1.89。
選取指數(shù)平滑法、歷史平均法、移動(dòng)平均法與本文修復(fù)方法及實(shí)際交通量進(jìn)行對(duì)比分析,其中1 d的數(shù)據(jù)修復(fù)結(jié)果對(duì)比如圖2所示;4個(gè)研究時(shí)段的數(shù)據(jù)修復(fù)結(jié)果對(duì)比如圖3~6所示。圖2~6中的流量均表示每15 min的交通流量。
表1 時(shí)段分布系數(shù)
圖2 1 d的缺失數(shù)據(jù)修復(fù)結(jié)果對(duì)比
圖3 早高峰時(shí)段缺失數(shù)據(jù)修復(fù)結(jié)果對(duì)比 圖4 平峰時(shí)段(AM)缺失數(shù)據(jù)修復(fù)結(jié)果對(duì)比
圖5 平峰時(shí)段(PM)缺失數(shù)據(jù)修復(fù)結(jié)果對(duì)比 圖6 晚高峰時(shí)段缺失數(shù)據(jù)修復(fù)結(jié)果對(duì)比
為進(jìn)一步對(duì)比分析各種方法的準(zhǔn)確性,選取平均絕對(duì)百分比誤差(MAPE)進(jìn)行分析,具體結(jié)果如表2所示。
表2 缺失數(shù)據(jù)修復(fù)結(jié)果的MAPE誤差分析
由表2可知:
1)針對(duì)全天缺失數(shù)據(jù)修復(fù)效果而言,本文修復(fù)方法的MAPE誤差值明顯低于其它3種方法,分別比指數(shù)平滑法、歷史平均法、移動(dòng)平均法低39.0%、19.6%、49.2%,修復(fù)效果較為顯著;且本文修復(fù)方法在4個(gè)代表性研究時(shí)段的修復(fù)誤差均明顯低于全天誤差。
2)與其他修復(fù)方法相比本文修復(fù)方法早高峰時(shí)段的MAPE誤差均降低了60%左右,平峰時(shí)段(AM)的MAPE誤差均降低了30%左右,平峰時(shí)段(PM)的MAPE誤差分別降低了41.0%、52.6%和29.4%,晚高峰時(shí)段的MAPE誤差分別降低了50.0%、32.7%和61.1%。
因此,本文修復(fù)方法能夠充分考慮研究區(qū)域的土地利用性質(zhì),結(jié)合時(shí)間與空間相關(guān)性對(duì)缺失數(shù)據(jù)進(jìn)行精準(zhǔn)修復(fù),適用于各個(gè)代表性時(shí)段的卡口缺失數(shù)據(jù)修復(fù)。
1)針對(duì)城市交通卡口數(shù)據(jù)源存在的數(shù)據(jù)缺失問(wèn)題,在考慮道路兩側(cè)出入口土地利用性質(zhì)和利用強(qiáng)度的基礎(chǔ)上,提出一種改進(jìn)的出入口出行發(fā)生與吸引模型,并基于此模型提出基于土地利用的卡口缺失數(shù)據(jù)修復(fù)方法。
2)實(shí)際應(yīng)用表明,本文提出的土地利用卡口數(shù)據(jù)修復(fù)方法能夠有效提高數(shù)據(jù)修復(fù)的精度,優(yōu)于經(jīng)典的時(shí)間序列數(shù)據(jù)修復(fù)方法。
3)下一步研究中,將從城市交通卡口檢測(cè)設(shè)備夜間識(shí)別率低、魯棒性差、交通流運(yùn)行狀態(tài)不穩(wěn)定等問(wèn)題入手,結(jié)合城市道路地磁、浮動(dòng)車(chē)等數(shù)據(jù)源,深入挖掘融合,得到全天候、高質(zhì)量的交通量數(shù)據(jù)。