孫舒淼,趙嘉偉,張 寧
(1. 南京地鐵建設(shè)有限責(zé)任公司,南京 210024;2. 東南大學(xué)智能運(yùn)輸系統(tǒng)研究中心軌道交通研究所,南京 210018)
現(xiàn)階段,許多城市的軌道交通進(jìn)入網(wǎng)絡(luò)化運(yùn)營(yíng)階段,同一起訖點(diǎn)(OD)對(duì)間乘客的出行選擇增多,而自動(dòng)售檢票系統(tǒng)只能記錄乘客的進(jìn)出站刷卡時(shí)間,并不會(huì)記錄乘客的具體出行路徑,為軌道交通的運(yùn)營(yíng)管理及票務(wù)清分帶來(lái)了困難。關(guān)于乘客的路徑選擇問(wèn)題,以往主要通過(guò)概率論的方法進(jìn)行研究[1-3],這些方法以隨機(jī)效用理論為基礎(chǔ),通常需要研究影響出行者路徑選擇的因素,根據(jù)影響因素構(gòu)建效用函數(shù),然后使用集計(jì)模型計(jì)算每條路徑被選擇的概率以完成客流分配。近年來(lái)隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,利用刷卡記錄還原乘客的路徑選擇成為軌道交通研究的熱點(diǎn)。Sun Yanshuo[4]、石俊剛[5]、高圣國(guó)等[6]認(rèn)為多路徑OD 對(duì)間的乘客旅行時(shí)間分布是由各條路徑旅行時(shí)間分布按照客流分配比例疊加而成。何宇[7]在此基礎(chǔ)上,以南京地鐵為例,論證了多路徑OD 對(duì)間乘客旅行時(shí)間服從混合高斯分布,并利用EM 算法對(duì)混合模型進(jìn)行求解,找出各條路徑的客流分配比例。然而上述方法均無(wú)法針對(duì)單個(gè)乘客進(jìn)行路徑匹配。Ling Hong 等[8]通過(guò)軌道交通刷卡數(shù)據(jù)及列車運(yùn)營(yíng)時(shí)刻表,推斷出乘客在車時(shí)間并利用基于旅行時(shí)間的比例進(jìn)行聚類分析,解析出每位乘客的出行路徑,然而該方法在進(jìn)行時(shí)刻表匹配時(shí),假定乘客不會(huì)由于擁堵等原因錯(cuò)過(guò)車次,未考慮到乘客在候車過(guò)程中出現(xiàn)二次等待的情況。Zhu Yiwen[9]等通過(guò)預(yù)估乘客的步行時(shí)間,結(jié)合列車發(fā)車時(shí)刻表,估計(jì)乘客無(wú)法登車的概率,并依據(jù)旅行時(shí)間,判斷乘客的路徑選擇,然而該模型參數(shù)對(duì)步行速度的敏感性較大。為解決上述不足,本文提出一種基于時(shí)刻表匹配的客流分配方法,首先根據(jù)乘客進(jìn)出站刷卡時(shí)間及列車時(shí)刻表,找到其所有可能乘坐的車次。并以只匹配到單條出行時(shí)間鏈的乘客作為參考乘客,對(duì)其余乘客的出行行為進(jìn)行分析、篩選,得到其最有可能的出行路徑及完整的出行時(shí)間鏈,為軌道交通票務(wù)清分及運(yùn)營(yíng)管理提供依據(jù)。
在軌道交通中,一條完整的出行記錄應(yīng)該包括乘客進(jìn)站刷卡時(shí)間、上車時(shí)間、下車時(shí)間及出站刷卡時(shí)間。然而,由于國(guó)內(nèi)軌道交通實(shí)行一票換乘制,乘客在上下車及換乘時(shí)并不需要刷卡,故自動(dòng)售檢票(AFC)系統(tǒng)能夠記錄的信息有限,以南京地鐵為例,AFC 系統(tǒng)記錄的乘客出行信息如表1 所示。在網(wǎng)絡(luò)化運(yùn)營(yíng)情況下,一個(gè)OD 對(duì)間可能存在多條有效路徑,僅僅依據(jù)AFC 系統(tǒng)記錄的信息往往難以準(zhǔn)確推斷出乘客具體的出行路徑。本文旨在利用列車時(shí)刻表信息,還原出每位乘客的完整出行時(shí)間鏈,以此確定乘客的路徑選擇。
表1 AFC交易數(shù)據(jù)Tab.1 AFC transaction records
列車時(shí)刻表記錄了列車在各個(gè)車站的到達(dá)和出發(fā)時(shí)間,定義線路集合L={1,2,…,l,…,N,},各線路上的車站集合Sl={1,2,…,i,…,M,},第j輛列車到達(dá)線路l上的車站i的時(shí)間為Ali
j,離開(kāi)線路l上的車站i的時(shí)間為Dli
j,則某一車站的列車時(shí)刻表信息可表 示 為乘客的出行時(shí)間鏈包括乘客進(jìn)出站刷卡時(shí)間以及在出行路徑上的上下車時(shí)間。在此,假定所有乘客均在列車離開(kāi)站臺(tái)時(shí)上車,在列車到達(dá)站臺(tái)時(shí)下車,則一條完整的出行時(shí)間鏈可表示為:
式中:
Checkin表示進(jìn)站刷卡時(shí)間;
Checkout表示出站刷卡時(shí)間;
Sli(Alij)列車j在線路l上的車站i的到達(dá)時(shí)刻;
Sli(Dlij)列車j在線路l上的車站i的出發(fā)時(shí)刻;中括號(hào)內(nèi)表示換乘過(guò)程,乘客在換乘站從一條線路換乘到另一條線路。
獲取乘客出行時(shí)間鏈的具體方法如下。
Step1:給定起訖點(diǎn),在路網(wǎng)中找出起訖點(diǎn)間所有有效路徑。每個(gè)OD 對(duì)間可能存在大量可達(dá)路徑,有效路徑定義為滿足以下條件的可達(dá)路徑[10]。
在同一換乘站,乘客最多進(jìn)行一次換乘;路徑中不存在相同的區(qū)間;以最短路徑的阻抗為標(biāo)準(zhǔn),其余路徑的阻抗不超過(guò)最短路徑阻抗的 (1+H) 倍,H>0。
Step2:對(duì)有效路徑進(jìn)行簡(jiǎn)化處理,使之僅包含起訖點(diǎn)及換乘站點(diǎn)。這樣將一條完整的出行路徑以換乘站為節(jié)點(diǎn)拆分為多條短路徑。規(guī)定第一條短路徑的進(jìn)站時(shí)間為乘客進(jìn)站刷卡時(shí)間,其余短路徑的進(jìn)站時(shí)間為上一條短路徑乘客的下車時(shí)間。
Step3:對(duì)每一段短路徑,根據(jù)進(jìn)站時(shí)間及設(shè)定的時(shí)間閾值,從列車時(shí)刻表中找出此段時(shí)間內(nèi)經(jīng)過(guò)起點(diǎn)站的列車車次,記錄列車的出發(fā)時(shí)間及到達(dá)時(shí)間。將到達(dá)時(shí)間作為下一條短路徑的進(jìn)站時(shí)間。時(shí)間閾值的設(shè)定由運(yùn)營(yíng)時(shí)間段、地鐵車站的換乘形式及列車的發(fā)車時(shí)刻表確定,在閾值設(shè)定時(shí),為了保證每位乘客在每條短路徑上都可以匹配到車次,閾值設(shè)定范圍應(yīng)該適當(dāng)擴(kuò)大。
Step4:將每一條路徑的時(shí)間點(diǎn)進(jìn)行拼接,形成完整的出行時(shí)間鏈。
如圖1 所示,如果一個(gè)OD 對(duì)間有多條有效路徑,根據(jù)OD 對(duì)間與終點(diǎn)站連通路徑數(shù)量的不同,有兩種基本形式。一條交易記錄在每條路徑上均可能會(huì)匹配到多條出行時(shí)間鏈,而在理想情況下,一條交易記錄只匹配到一條出行時(shí)間鏈,可以唯一確定該乘客的路徑選擇及乘坐車次,本文稱這部分乘客為參考乘客并基于其旅行時(shí)間鏈中的換乘等待時(shí)間和下車出站時(shí)間差,判斷其余乘客的路徑選擇。
換乘等待時(shí)間定義為乘客在換乘站下車換乘至換乘列車到達(dá)換乘站的時(shí)間,本文在獲取乘客出行時(shí)間鏈的過(guò)程中,為了保證一定可以匹配到出行時(shí)間鏈,設(shè)置了相對(duì)較寬泛的時(shí)間閾值,有了參考乘客在換乘站的換乘等待時(shí)間后,可以對(duì)該時(shí)間閾值做適當(dāng)調(diào)整,減少匹配時(shí)間鏈的數(shù)量。
圖1 乘客出行路徑中到達(dá)終點(diǎn)站的兩種形式Fig.1 Two arriving types at the terminal in passenger travel route
下車出站時(shí)間差定義為乘客出站刷卡時(shí)間與終點(diǎn)站下車時(shí)間的差值。一般情況下,乘客在到達(dá)終點(diǎn)站之后,會(huì)盡快找到對(duì)應(yīng)的出口刷卡出站,完成旅行,不會(huì)在終點(diǎn)站做長(zhǎng)時(shí)間停留。故乘客下車出站時(shí)間差波動(dòng)性較小。以參考乘客的下車出站時(shí)間差為樣本,擬合其分布規(guī)律,對(duì)匹配到多條出行時(shí)間鏈的交易記錄做篩選,可判斷出乘客最可能的出行路徑??紤]到從不同線路、不同的出口出站,乘客的平均步行時(shí)間可能會(huì)存在差異,而自動(dòng)售檢票系統(tǒng)記錄的數(shù)據(jù)中僅有乘客出站刷卡的閘機(jī)編號(hào)信息,缺乏閘機(jī)所對(duì)應(yīng)的出口信息,故在找到參考乘客后,依據(jù)其所選擇的線路及出站刷卡的閘機(jī)編號(hào)進(jìn)行分類,對(duì)每個(gè)類別,擬合其下車出站時(shí)間差分布。
對(duì)于圖1 中第一種路徑,因終點(diǎn)站為屬于換乘車站,乘客從各條線路到達(dá)各個(gè)出口的時(shí)間可能會(huì)存在差異,故需按車站所屬線路進(jìn)行分類。而對(duì)于圖1 中第二種路徑,因終點(diǎn)站不屬于換乘車站,故無(wú)需對(duì)線路做分類,直接針對(duì)各個(gè)出站口,擬合參考乘客的下車出站時(shí)間差分布。
之后,將旅行時(shí)間無(wú)顯著差異的閘機(jī)編號(hào)合并,認(rèn)為同一類閘機(jī)口對(duì)應(yīng)同一個(gè)出站口并對(duì)出站口重新編號(hào)。雙樣本K-S(Kolmogorov-Smirnov)檢驗(yàn)是一種基于累計(jì)分布函數(shù)的檢驗(yàn)方法,用于檢驗(yàn)一個(gè)分布是否符合某一理論分布或比較兩種經(jīng)驗(yàn)分布是否具有顯著差異。由于其對(duì)兩樣本的經(jīng)驗(yàn)分布函數(shù)的位置和形狀參數(shù)的差異都敏感,是比較兩樣本的最有用且最常用的非參數(shù)方法之一,故本文選擇雙樣本K-S 檢驗(yàn)進(jìn)行閘機(jī)口的合并。
最后,尋找合適的分布函數(shù)擬合參考乘客到各個(gè)出站口的下車出站時(shí)間差,得到概率密度曲線,對(duì)于匹配到多條時(shí)間鏈的出行記錄,由概率密度函數(shù)計(jì)算每條時(shí)間鏈被選擇的概率。將概率較大者對(duì)應(yīng)的路徑作為乘客最終的路徑選擇。
目前,南京地鐵已開(kāi)通10 條運(yùn)營(yíng)線路,包含159 個(gè)車站,13 個(gè)換乘車站,已進(jìn)入網(wǎng)絡(luò)化運(yùn)營(yíng)階段。
本文以龍華路-新街口為例,采用上述方法,確定乘客的路徑選擇。乘客從龍華路站出發(fā)去往新街口站,有兩條路徑可供選擇:1)經(jīng)元通站換乘2號(hào)線;2)經(jīng)安德門(mén)站換乘1 號(hào)線。如圖2 所示。
因新街口站為換乘車站,從龍華路-新街口的路徑屬于圖1 中的第一種情況。故參考乘客的下車出站時(shí)間差需按車站所屬線路進(jìn)行分類。選取2019年3 月1 日至28 日乘客的刷卡數(shù)據(jù),標(biāo)定參考乘客的下車出站時(shí)間差分布參數(shù)。如經(jīng)元通站換乘到達(dá)新街口站并通過(guò)編號(hào)為“33687830”閘機(jī)出站的參考乘客,其下車出站時(shí)間差分布如圖3 所示;經(jīng)安德門(mén)站換乘到達(dá)新街口并通過(guò)該閘機(jī)出站的參考乘客,其下車出站時(shí)間差的分布如圖4 所示。
圖2 南京地鐵線路圖(部分)Fig.2 Nanjing metro map (part)
圖3 選擇路徑1參考乘客下車出站時(shí)間差Fig.3 Time difference between alighting and departure is the references for selecting route 1
圖4 選擇路徑2參考乘客下車出站時(shí)間差Fig.4 Time difference between alighting and departure is the references for selecting route 2
收集所有出站口參考乘客的下車出站時(shí)間差數(shù)據(jù),采用雙樣本K-S 檢驗(yàn)的方法,對(duì)分布無(wú)顯著差異的閘機(jī)口進(jìn)行合并,形成新的出站口,并采用對(duì)數(shù)正態(tài)分布進(jìn)行擬合。擬合結(jié)果如表2、3 所示,其中經(jīng)2 號(hào)線元通車站換乘至新街口并且從編號(hào)為B1 出站口出站的參考乘客,其下車出站時(shí)間差概率分布如圖5 所示。
表2 2號(hào)線新街口站各出站口擬合參數(shù)Tab.2 Fitting parameters for each exit of the Xinjiekou Station of Line 2
表3 1號(hào)線新街口站各出站口擬合參數(shù)Tab.3 Fitting parameters for each exit of the Xinjiekou Station of Line 1
圖5 2號(hào)線新街口站B1出站口參考乘客下車出站時(shí)間差分布Fig.5 Distribution for time difference between alighting and departure is the references for Exit B1 at Xinjiekou Station of Line 2
選取2019 年3 月29 日南京地鐵AFC 記錄的乘客刷卡數(shù)據(jù),從中提取從龍華路-新街口站的出行記錄,共409 條,按上述方法確定乘客的路徑選擇,結(jié)果如表4 所示。選擇從2 號(hào)線元通車站換乘的乘客占79.22%,而選擇1 號(hào)線安德門(mén)站換乘的乘客占20.78%。根據(jù)兩換乘站的換乘步行距離,從元通站換乘步行距離為54 m,而從安德門(mén)站換乘,步行距離為193 m,上述分配結(jié)果符合乘客的日常出行習(xí)慣,有一定參考價(jià)值。
表4 龍華路至新街口站客流分配情況Tab.4 Passenger f low assignment of Longhua Road to Xinjiekou Station
本文利用AFC 記錄的交易信息及列車運(yùn)行時(shí)刻表信息,建立路網(wǎng)仿真模型,找到乘客所有可能的出行時(shí)間鏈,并參考乘客的出行時(shí)間特征,篩選出其余乘客最可能的出行路線,以此來(lái)完成多路徑OD 對(duì)間的客流分配。該客流分配方案以歷史客流數(shù)據(jù)標(biāo)定模型中的參數(shù),且能夠針對(duì)單個(gè)乘客判斷其具體出行路徑,克服了傳統(tǒng)分配模型中大量的基礎(chǔ)數(shù)據(jù)調(diào)查與只考慮群體路徑選擇的不足,其結(jié)果更具有可靠性。