蘇躍江,龍小強(qiáng),吳德馨
(廣州市交通運(yùn)輸研究所 廣州市公共交通研究中心, 廣州 510635)
近年來(lái),大數(shù)據(jù)發(fā)展非常迅猛,其定義和內(nèi)涵在各行業(yè)也有不同的解釋?zhuān)顬槌S玫木謩?shì)大數(shù)據(jù)具有4V特征:即Volume(體量大)、Variety(多樣性)、Value(價(jià)值高)、Velocity(更新速度快). 在大數(shù)據(jù)快速發(fā)展的新形勢(shì)下,傳統(tǒng)交通規(guī)劃研究面臨技術(shù)革新的重大機(jī)遇與挑戰(zhàn). 很多學(xué)者嘗試通過(guò)大數(shù)據(jù)研究城市(含交通)規(guī)劃和管理,主要經(jīng)歷以下幾個(gè)發(fā)展階段:“大數(shù)據(jù)如何獲取以及帶來(lái)規(guī)劃新方法→大數(shù)據(jù)支持下的城鄉(xiāng)治理方法與實(shí)踐、大數(shù)據(jù)的獲取與分析技術(shù)研究→以大數(shù)據(jù)為主的新技術(shù)作支撐促進(jìn)規(guī)劃方案自下而上與自上而下的互動(dòng)”. 文獻(xiàn)[1-6]主要探索通過(guò)大數(shù)據(jù)分析與規(guī)劃業(yè)務(wù)邏輯之間的深刻關(guān)聯(lián),促進(jìn)大數(shù)據(jù)與規(guī)劃業(yè)務(wù)的結(jié)合與深化;文獻(xiàn)[7-12]主要探索通過(guò)數(shù)理方法和評(píng)價(jià)實(shí)例,如何將大數(shù)據(jù)與規(guī)劃業(yè)務(wù)相結(jié)合,實(shí)現(xiàn)數(shù)據(jù)分析作為決策的進(jìn)一步落地.
交通大數(shù)據(jù)主要分為3大類(lèi):①以人為對(duì)象的數(shù)據(jù),包含IC卡數(shù)據(jù)、軌道交通閘機(jī)數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、公路聯(lián)網(wǎng)售票數(shù)據(jù)、鐵路和民航客流數(shù)據(jù)以及社交網(wǎng)絡(luò)(媒體)數(shù)據(jù)等;②以車(chē)為對(duì)象的數(shù)據(jù),包含道路高清卡口數(shù)據(jù)、車(chē)載GPS數(shù)據(jù)、FRID電子牌數(shù)據(jù)、視頻監(jiān)控?cái)?shù)據(jù)、高速公路收費(fèi)流水?dāng)?shù)據(jù)、國(guó)省道流量觀測(cè)數(shù)據(jù)等;③以路為對(duì)象的數(shù)據(jù),包含線圈、微波、紅外線等流量檢測(cè)數(shù)據(jù)、停車(chē)誘導(dǎo)屏數(shù)據(jù)等. 本文主要介紹手機(jī)信令數(shù)據(jù)、GPS數(shù)據(jù)、道路卡口數(shù)據(jù)以及公共交通IC卡數(shù)據(jù)在交通規(guī)劃和管理中的應(yīng)用,并與廣州市為例進(jìn)行實(shí)證研究. 其目的是通過(guò)對(duì)大數(shù)據(jù)的分析,洞察和厘清車(chē)流、人流的出行規(guī)律,實(shí)現(xiàn)交通規(guī)劃和運(yùn)營(yíng)管理從“局部數(shù)據(jù)、經(jīng)驗(yàn)驅(qū)動(dòng)”向“多種數(shù)據(jù)、數(shù)據(jù)驅(qū)動(dòng)”轉(zhuǎn)變.
手機(jī)通信數(shù)據(jù)包括手機(jī)信息、信令信息和基站信息3部分,由于手機(jī)信令數(shù)據(jù)包含短信、通話(huà)、基站切換、開(kāi)關(guān)機(jī)、通信維護(hù)情況下與基站通訊的信令數(shù)據(jù),手機(jī)信令數(shù)據(jù)可獲得頻率較高的采樣點(diǎn),常用手機(jī)信令數(shù)據(jù)進(jìn)行分析,基本原理就是通過(guò)移動(dòng)通信網(wǎng)絡(luò)信號(hào)覆蓋與用戶(hù)進(jìn)行交互,然后利用數(shù)據(jù)預(yù)處理、數(shù)據(jù)清洗、數(shù)據(jù)質(zhì)量分析以及出行鏈技術(shù)等方法還原用戶(hù)的出行模糊軌跡. 一般手機(jī)數(shù)據(jù)主要用于4個(gè)方面:即交通調(diào)查的補(bǔ)充和校核分析、典型吸引點(diǎn)客流密度分析、軌道交通換乘分析、交通設(shè)施路徑分析、交通狀態(tài)識(shí)別分析,其中交通狀態(tài)識(shí)別分析由于基站模糊地址原因映射到道路網(wǎng)絡(luò)的精度相對(duì)較低.
圖1 手機(jī)信令數(shù)據(jù)在道路交通網(wǎng)絡(luò)中的位置電子腳印原理
表1 手機(jī)信令數(shù)據(jù)的基本格式
圖2 手機(jī)信令數(shù)據(jù)的應(yīng)用領(lǐng)域
廣佛地域有約200 km的接壤邊界,現(xiàn)有跨界交通設(shè)施為兩市開(kāi)展同城化合作奠定了基礎(chǔ),為廣佛兩地居民居住和就業(yè)提供方便. 分析以2016年6月以來(lái)22 d移動(dòng)手機(jī)信令數(shù)據(jù)為基礎(chǔ),限于篇幅,本次僅對(duì)廣佛同城化的職住特征和時(shí)空分布特征進(jìn)行分析.
圖3 廣佛“候鳥(niǎo)”居住地分布(左)和就業(yè)分布(右)特征
1.2.1 廣佛同城化“候鳥(niǎo)”職住特征
廣佛“候鳥(niǎo)”是指在佛山居住、廣州就業(yè);廣州居住、佛山就業(yè). 根據(jù)對(duì)廣佛兩市連續(xù)22 d的數(shù)據(jù)監(jiān)測(cè),廣佛“候鳥(niǎo)”居住地、工作地沿廣佛邊界分布,呈現(xiàn)“一心多點(diǎn)”等級(jí)集聚,同城化特征顯著. 在廣州工作、佛山居住的廣佛“候鳥(niǎo)”人數(shù)較多,約是佛山工作、廣州居住“候鳥(niǎo)”的1.5倍. 其中廣佛“候鳥(niǎo)”居住地主要集中在南海區(qū)的大瀝鎮(zhèn)(占比53.3%),工作地則相對(duì)較為分散;佛廣“候鳥(niǎo)”工作地集中在大瀝鎮(zhèn)、桂城街道,分別占比26.3%、20.9%,居住地較為分散,其中居住在南沙區(qū)的大崗鎮(zhèn)的“候鳥(niǎo)”最多,占比11.8%.
1.2.2 廣佛同城化居民出行時(shí)空分布特征
目前廣佛間城際出行主要通過(guò)廣佛地鐵、城際公路客運(yùn)(普通客運(yùn)、城巴、快巴)、廣佛公交、出租車(chē)、私人小汽車(chē)等方式. 從空間分布來(lái)講,客流呈現(xiàn)出“兩點(diǎn)放射、毗鄰區(qū)域密集”的特征,“兩點(diǎn)放射”以佛山南海、順德兩區(qū)向廣州毗鄰區(qū)縣連接,其中南海與荔灣、白云的出行需求最高,日均交換量均超過(guò)25萬(wàn)人次,毗鄰區(qū)域呈現(xiàn)一體化、網(wǎng)絡(luò)化特征. 從時(shí)間分布來(lái)講,工作日廣佛間出行交換量時(shí)變曲線基本符合雙峰分布,出行早高峰為07:00—08:00時(shí)段,相比于廣州出行早高峰提前約0.5 h,晚高峰出現(xiàn)在17:00—18:00時(shí)段. 非工作日無(wú)明顯的早高峰,晚高峰時(shí)段為18:00—19:00.
圖4 廣佛同城化居民出行空間分布特征
2.1.1 站點(diǎn)OD推斷
圖5 廣佛同城化居民出行時(shí)間分布特征
圖6 上下車(chē)客流推斷流程(左)和IC卡數(shù)據(jù)、報(bào)站數(shù)據(jù)字段(右)
公交OD推斷是以乘客長(zhǎng)時(shí)間的出行和換乘行為假設(shè)為基礎(chǔ),即假設(shè)乘客的起終點(diǎn)首次出行、回程、換乘均具有規(guī)律性,比如在同一天中連續(xù)2次乘車(chē)的上車(chē)時(shí)間間隔小于一定閾值時(shí),則判定該乘客的2次乘車(chē)為換乘出行,第2次乘車(chē)的起點(diǎn)為換乘站點(diǎn). IC卡交易數(shù)據(jù)是由乘客上車(chē)刷卡產(chǎn)生的交易流水?dāng)?shù)據(jù),該數(shù)據(jù)主要記錄IC卡進(jìn)行交易時(shí)的相關(guān)信息,主要包括卡片信息、交易時(shí)間、車(chē)輛屬性、公交線路以及乘坐地鐵等信息;公交車(chē)報(bào)站數(shù)據(jù)是車(chē)輛進(jìn)出站時(shí),公交車(chē)載終端在進(jìn)出公交站點(diǎn)周邊設(shè)置的電子?xùn)艡跁r(shí)會(huì)自動(dòng)報(bào)站,由此記錄了公交車(chē)在運(yùn)行過(guò)程中的時(shí)空信息,主要包含車(chē)輛屬性、公交站點(diǎn)名稱(chēng)、報(bào)站時(shí)間、線路行車(chē)方向等信息. 利用IC卡數(shù)據(jù)和公交GPS報(bào)站數(shù)據(jù)推斷上、下車(chē)客流,主要利用IC卡獲取的車(chē)輛編碼(交易終端公交車(chē)編碼)、交易時(shí)間(記錄IC卡當(dāng)次刷卡時(shí)間)、線路編碼(當(dāng)次刷卡車(chē)輛對(duì)應(yīng)的公交線路編碼)等信息與公交GPS報(bào)站數(shù)獲取的車(chē)輛編碼、報(bào)站時(shí)間、公交站點(diǎn)名稱(chēng)、公交線路方向等信息進(jìn)行匹配(圖6中深色字體),并結(jié)合多次IC卡刷卡時(shí)間的連續(xù)性數(shù)據(jù)、出行時(shí)間閾值、公交站點(diǎn)空間屬性、居民出行規(guī)律性以及換乘行為識(shí)別等特征推斷上、下車(chē)客流和換乘客流,從而得到公交站點(diǎn)OD.
2.1.2 站點(diǎn)OD推算小區(qū)OD
構(gòu)建公交站點(diǎn)OD映射到交通小區(qū)客流OD,主要有2點(diǎn):①梳理公交站點(diǎn)應(yīng)對(duì)交通小區(qū)的關(guān)系,引入距離系數(shù)統(tǒng)計(jì)公交站點(diǎn)周邊滿(mǎn)足條件的交通小區(qū)做選擇集,公交站點(diǎn)和交通小區(qū)是一對(duì)多的關(guān)系(見(jiàn)圖3);②統(tǒng)計(jì)分析小區(qū)內(nèi)人口和就業(yè)崗位數(shù)量,或交通小區(qū)內(nèi)用地性質(zhì)和土地面積(建筑面積),引入分配權(quán)重系數(shù)將公交站點(diǎn)客流分配到交通小區(qū);包含2種算法,即基于交通小區(qū)內(nèi)人口和就業(yè)崗位模型算法和基于交通小區(qū)內(nèi)用地性質(zhì)和土地面積或建筑面積的模型算法[13].
圖7 公交站點(diǎn)與交通小區(qū)關(guān)系(左)站點(diǎn)OD推算小區(qū)OD流程(右)
公交IC卡數(shù)據(jù)的應(yīng)用價(jià)值還體現(xiàn)在對(duì)公交系統(tǒng)的調(diào)度、運(yùn)營(yíng)和管理以及服務(wù)水平的評(píng)價(jià). 通過(guò)對(duì)廣州市中心6區(qū)705條公交線路(涉及線路站點(diǎn)31 996個(gè)、物理站點(diǎn)6 214個(gè))梳理,分析以2015年12月IC卡的數(shù)據(jù)為基礎(chǔ),從“點(diǎn)”“線”“面”3個(gè)層次刻畫(huà)廣州市常規(guī)公交客流情況,限于篇幅,本次僅以公交站點(diǎn)和用地關(guān)系進(jìn)行詳細(xì)分析. 根據(jù)公交站點(diǎn)周邊用地性質(zhì)和客流特點(diǎn),公交站點(diǎn)可分為居住主導(dǎo)型、商業(yè)主導(dǎo)型、混合型3種類(lèi)型. 同時(shí),有611個(gè)公交站點(diǎn)集散量大于0.5萬(wàn)人次,主要集中分布環(huán)城高速公路區(qū)域內(nèi)的主要干道;公交站點(diǎn)集散量大于4萬(wàn)人次的站點(diǎn)主要分布于地鐵線路未端覆蓋的大型居住片區(qū)和主要干道與地鐵線路交匯點(diǎn),如BRT棠下村站、同德鄉(xiāng)站、橫滘站、同和站、芳村站、和平新村站等. 大部分集散點(diǎn)客流與公交復(fù)線條數(shù)的資源配置基本適應(yīng),但部分站點(diǎn)資源配置不匹配,例如動(dòng)物園站、動(dòng)物園南門(mén)站,站點(diǎn)的??烤€路與和平新村站、新市墟站為1∶1的關(guān)系,但線路條數(shù)客流僅為這2個(gè)站的1/3.
表2 不同類(lèi)型公交站點(diǎn)的客流特征
圖8 公交站點(diǎn)集散客流(左)與??烤€路(右)關(guān)系
出租汽車(chē)GPS數(shù)據(jù)主要通過(guò)車(chē)輛終端和無(wú)線通信裝置以約每15~60 s不等的時(shí)間間隔上傳至后臺(tái)控制中心存儲(chǔ),其屬性數(shù)據(jù)包含車(chē)牌號(hào)、入庫(kù)時(shí)間、GPS時(shí)間、經(jīng)度、緯度、速度、行駛方向、車(chē)輛狀態(tài)以及數(shù)據(jù)有效性等,其中經(jīng)緯度位置數(shù)據(jù)詳細(xì)記錄出租車(chē)運(yùn)營(yíng)軌跡信息,包含了車(chē)輛或乘客的上、下車(chē)位置信息;出租車(chē)計(jì)價(jià)器是用于測(cè)量出租車(chē)運(yùn)營(yíng)持續(xù)時(shí)間以及依據(jù)里程傳感器傳送的信號(hào)測(cè)量里程測(cè)算乘客的支付費(fèi)用,數(shù)據(jù)包括載客的行程時(shí)間(含開(kāi)始時(shí)間、結(jié)束時(shí)間、慢速時(shí)間)、行程里程、費(fèi)用以及支付方式等信息. 通過(guò)對(duì)出租車(chē)GPS數(shù)據(jù)的挖掘,分析出租車(chē)出行空間分布、出行次數(shù)、出行距離、出行時(shí)長(zhǎng)、時(shí)間分布、到達(dá)時(shí)間分布等特征,結(jié)合城市土地利用關(guān)系分析居民出行行為特征.
表3 出租車(chē)GPS數(shù)據(jù)表結(jié)構(gòu)
圖9 出租車(chē)GPS數(shù)據(jù)的應(yīng)用領(lǐng)域
在廣佛同城化趨勢(shì)下,為使出租車(chē)回程時(shí)不空載,兩市交通主管部門(mén)協(xié)調(diào)確定設(shè)置出租車(chē)回程候客點(diǎn),即廣佛兩市的出租車(chē)搭客到佛山、廣州后,可前往出租車(chē)回程候客點(diǎn)配客回程. 但由于出租車(chē)回程配客點(diǎn)設(shè)置數(shù)量少、兩市收費(fèi)標(biāo)準(zhǔn)不統(tǒng)一(如佛山出租車(chē)超過(guò)12 km后加50%回程費(fèi),而廣州這個(gè)距離為35 km),難以滿(mǎn)足廣佛出租車(chē)客運(yùn)需求.
分析以廣佛兩市2015年11月以來(lái)1萬(wàn)的出租車(chē)GPS數(shù)據(jù)和計(jì)價(jià)器數(shù)據(jù)為基礎(chǔ),限于篇幅,本次僅結(jié)合需求和用地等規(guī)劃廣佛兩市出租車(chē)返程點(diǎn). 通過(guò)分析,目前出租車(chē)行程起訖點(diǎn)呈現(xiàn)出3個(gè)特點(diǎn):①出行需求集中在兩市毗鄰地區(qū),并且廣州市境內(nèi)出行需求總量高于佛山市;②局部出行需求呈點(diǎn)狀(如廣州南站)、帶狀分布(廣佛路、花地大道、龍溪大道)分布;③除毗鄰區(qū)域外,廣佛兩市出租車(chē)需求集中在客運(yùn)樞紐和地鐵站,如白云國(guó)際機(jī)場(chǎng)、廣州南站、廣州站、廣州東站、芳村客運(yùn)站以及潯峰崗地鐵站、黃沙地鐵站、西朗地鐵站等.
圖10 廣佛兩市出租車(chē)需求空間分布(左)和OD期望線路(右)
圖11 廣佛兩市出租車(chē)熱點(diǎn)區(qū)域分布(左)和返程點(diǎn)規(guī)劃(右)
利用道路卡口數(shù)據(jù)進(jìn)行車(chē)牌識(shí)別,使得對(duì)單個(gè)車(chē)輛軌跡的出行鏈進(jìn)行識(shí)別,對(duì)個(gè)體規(guī)律進(jìn)行跟蹤和預(yù)測(cè)分析. 道路卡口車(chē)牌識(shí)別獲取的數(shù)據(jù)字段包括抓拍時(shí)間、車(chē)牌號(hào)碼、車(chē)牌顏色、抓拍路段和方向等信息. 主要利用卡口捕獲和記錄過(guò)往車(chē)輛的號(hào)牌,通過(guò)對(duì)車(chē)牌號(hào)、時(shí)間、路段等信息繼進(jìn)行空間、時(shí)間以及車(chē)輛的三維匹配,精確定位車(chē)輛的車(chē)身屬性、時(shí)間分布、空間分布、出行軌跡等信息,為交通運(yùn)營(yíng)管理提供精細(xì)化的數(shù)據(jù)支持.
本次分析以2016年6月廣州市卡口(412個(gè))數(shù)據(jù)為基礎(chǔ),對(duì)廣州市大客車(chē)可疑對(duì)象進(jìn)行分析. 主要分為3步:①類(lèi)別特征分類(lèi). 通過(guò)對(duì)途經(jīng)廣州境內(nèi)道路卡口大客車(chē)車(chē)輛流水?dāng)?shù)據(jù)統(tǒng)計(jì)分析,結(jié)合運(yùn)政管理系統(tǒng)車(chē)牌庫(kù)等數(shù)據(jù)庫(kù),將大客車(chē)進(jìn)行類(lèi)別分類(lèi),篩選出疑似非法大客車(chē)7 359輛、占全部大客車(chē)比例的15%;②運(yùn)行特征分類(lèi). 針對(duì)疑似非法營(yíng)運(yùn)大客車(chē)運(yùn)行特征(包括出行頻率、規(guī)律性、運(yùn)營(yíng)速度和注冊(cè)時(shí)間),并考慮車(chē)輛的危險(xiǎn)程度進(jìn)一步分析運(yùn)行特征,得出可疑車(chē)輛主要分為頻繁且軌跡相對(duì)固定(被連續(xù)4個(gè)及以上卡口監(jiān)測(cè)到)、頻繁但軌跡不固定、不頻繁3大類(lèi)(并細(xì)分為11小類(lèi)),車(chē)輛數(shù)分別為1 159輛、219輛、5 981輛;③綜合分析. 統(tǒng)籌考慮類(lèi)別特征和運(yùn)行特征,重點(diǎn)對(duì)“頻繁規(guī)律+上高速+超過(guò)8a”“頻繁不規(guī)律+上高快速+超過(guò)8a”的車(chē)輛進(jìn)行重點(diǎn)監(jiān)測(cè)管理,并詳細(xì)分析這部分車(chē)輛的時(shí)空分布、出行軌跡等信息,做到執(zhí)法管理的精細(xì)化和有的放矢.
本文通過(guò)梳理大數(shù)據(jù)的特征、發(fā)展階段以及交通領(lǐng)域大數(shù)據(jù)類(lèi)別,分析手機(jī)、IC卡、GPS和道路卡口等大數(shù)據(jù)分析的基本原理和應(yīng)用領(lǐng)域,以廣州市為例進(jìn)行實(shí)證研究,為下一步交通大數(shù)據(jù)的應(yīng)用提供參考. 但交通數(shù)據(jù)不是數(shù)據(jù)和工程案例的簡(jiǎn)單整合,而是數(shù)據(jù)的充分融合共享和應(yīng)用強(qiáng)邏輯關(guān)聯(lián). 因此,在后續(xù)研究中應(yīng)關(guān)注幾個(gè)方面:①如何減少手機(jī)數(shù)據(jù)定位的漂移、加密采樣時(shí)間、獲取完整的出行鏈信息,進(jìn)一步挖掘交通方式、出行目的以及活動(dòng)類(lèi)型判斷、擴(kuò)樣技術(shù)等方面具有重要的意義;如何利用公交IC卡數(shù)據(jù),挖掘單個(gè)乘客的行為特征和出行模式,還原公交乘客的出行模式特征和整個(gè)出行鏈特征;如果可以對(duì)個(gè)體車(chē)輛的GPS軌跡數(shù)據(jù)和車(chē)牌識(shí)別數(shù)據(jù)的行為規(guī)律進(jìn)行把握,將微觀個(gè)體的規(guī)律性和機(jī)理集計(jì)到宏觀層面,實(shí)現(xiàn)對(duì)宏觀規(guī)律的再現(xiàn)和預(yù)測(cè). ②重視系統(tǒng)數(shù)據(jù)質(zhì)量評(píng)估與驗(yàn)證工作,數(shù)據(jù)驗(yàn)證和質(zhì)量驗(yàn)證是整個(gè)數(shù)據(jù)分析和應(yīng)用的基石. ③推動(dòng)建立行業(yè)數(shù)據(jù)標(biāo)準(zhǔn),規(guī)范數(shù)據(jù)定義、行業(yè)用語(yǔ)、采集要求等. ④如何利用各種數(shù)據(jù)所具有的優(yōu)勢(shì),做好大小數(shù)據(jù)融合技術(shù)攻關(guān),實(shí)現(xiàn)多元數(shù)據(jù)融合以及大數(shù)據(jù)與交通模型的及時(shí)融合,實(shí)現(xiàn)各種大數(shù)據(jù)之間、大數(shù)據(jù)與交通模型之間的相互補(bǔ)充和校核具有重要的意義.