肖 梅,王仲豪,顏建強(qiáng),邊浩毅
(1.長(zhǎng)安大學(xué)汽車學(xué)院汽車運(yùn)輸安全保障技術(shù)交通行業(yè)重點(diǎn)試驗(yàn)室,西安 710064;2.西安市交通信息中心,西安 710065;3.浙江鯤鵬建設(shè)集團(tuán)設(shè)計(jì)總院,杭州 311112)
近年來(lái),隨著我國(guó)機(jī)動(dòng)車的快速增長(zhǎng),道路交通基礎(chǔ)設(shè)施無(wú)法滿足日益增長(zhǎng)的交通需求,各種交通問(wèn)題日益凸現(xiàn),如交通擁擠、道路運(yùn)行效率低、交通事故頻發(fā)和交通污染嚴(yán)重等。大力發(fā)展城市公共交通是解決我國(guó)大中城市交通問(wèn)題的最佳的解決途徑之一。筆者通過(guò)近500個(gè)電話抽樣訪談發(fā)現(xiàn):公交運(yùn)行的準(zhǔn)時(shí)性和舒適性是乘客公交出行關(guān)注的焦點(diǎn)。通常,公交運(yùn)行時(shí)間主要耗費(fèi)在站間運(yùn)行、站臺(tái)停靠和信號(hào)路口等候,要提高公交車輛的準(zhǔn)時(shí)性,需要保障公交在各運(yùn)行階段的準(zhǔn)時(shí)性。分析乘客上車耗時(shí)的影響因素,建立乘客上車耗時(shí)模型,對(duì)公交運(yùn)營(yíng)調(diào)度、公交準(zhǔn)時(shí)運(yùn)營(yíng)、公交線網(wǎng)和站點(diǎn)的優(yōu)化等有著積極的作用。
據(jù)課題組的調(diào)研數(shù)據(jù),西安市的公交出行中90%左右的乘客通過(guò)IC卡或手機(jī)支付等方式來(lái)進(jìn)行付費(fèi),已經(jīng)逐漸代替了人工收費(fèi)和投幣式付費(fèi)。
國(guó)內(nèi)外學(xué)者就車輛在站臺(tái)的??繒r(shí)間預(yù)測(cè)[1-6]和乘客上車時(shí)間[7-10]開(kāi)展了大量研究。辛建霞等[1]基于歷史數(shù)據(jù)均值即 KNN(K-Nearest Neighbor)方法對(duì)公交停站時(shí)間進(jìn)行預(yù)測(cè),預(yù)測(cè)精度較高。王旭等[2]分析了上下車人數(shù)、車內(nèi)擁擠度、車門數(shù)及公交車臺(tái)階數(shù)等因素對(duì)公交??繒r(shí)間的影響,發(fā)現(xiàn)上下車人數(shù)是影響公交車在站點(diǎn)停靠時(shí)間的主要因素,為此,建立了考慮車門數(shù)、車內(nèi)擁擠等因素的公交站點(diǎn)??繒r(shí)間預(yù)測(cè)模型。Jaiswal等[3-4]研究發(fā)現(xiàn)公交車在大型停靠站的??繒r(shí)間與等待的乘客數(shù)呈正相關(guān)。Rajbhandari等[5]就公交車在站點(diǎn)的延誤開(kāi)展研究,發(fā)現(xiàn)公交車乘客的平均上、下車時(shí)間是影響公交車運(yùn)營(yíng)效率的主要因素。王鑫等[6]基于GPS數(shù)據(jù)分析了公交車??繒r(shí)間隨時(shí)間、空間和線路的分布特性,建立了基于時(shí)間序列的公交??空緯r(shí)間預(yù)測(cè)模型。以上對(duì)公交??繒r(shí)間預(yù)測(cè)的研究中側(cè)重于單一因素對(duì)公交??繒r(shí)間的預(yù)測(cè)分析。
曹守華等[7]結(jié)合乘客上車時(shí)間的分段特性,建立分段的乘客上車時(shí)間模型,考慮乘客分隊(duì)列上車模式和車門寬度,建立了車門寬度的乘客上車時(shí)間模型。吳鼎新等[8]檢驗(yàn)了乘客的性別、年齡和職業(yè)對(duì)上車時(shí)間的顯著性影響,結(jié)果表明:公交乘客的性別對(duì)上車時(shí)間影響不顯著,年齡和職業(yè)對(duì)乘客的上下車時(shí)間均有一定影響。王劍梅等[9]以跟車調(diào)查的方式對(duì)成都市抽樣公交線路的乘客上下車效率進(jìn)行統(tǒng)計(jì),運(yùn)用方差分析得出乘客上車效率受到客觀因素如車門數(shù)量和車門寬度、踏步級(jí)數(shù)和踏步高度、座位構(gòu)造等影響顯著的結(jié)論。Kraft等[10]對(duì)乘客的上下車時(shí)間的影響因素進(jìn)行分析,發(fā)現(xiàn)上下車時(shí)間受車門數(shù)量和車門寬度、公交踏步的級(jí)數(shù)和踏步高度、公交售票方式、公交車內(nèi)擁擠狀況、乘客攜帶行李情況、公交車的通道寬度、公交車座位構(gòu)造等諸多因素的影響。
這些研究雖然已經(jīng)在乘客上車影響因素的分析中取得了一定的成果,但由于獲取的數(shù)據(jù)采用實(shí)地調(diào)查的方法[2,8-10],結(jié)果受調(diào)查數(shù)據(jù)量的影響較大。其次,綜合考慮站點(diǎn)類型、刷卡類型、出行時(shí)段等客觀因素的研究還比較少,目前筆者只發(fā)現(xiàn)文獻(xiàn)[8]考慮了用戶類型的影響。最后,在互聯(lián)網(wǎng)+的信息時(shí)代下,各地域乘客上下車耗時(shí)的影響因素不盡相同。
鑒于公交IC卡數(shù)據(jù)具有信息量大、數(shù)據(jù)全面的優(yōu)點(diǎn)[11],不少專家開(kāi)展了乘客上下車站點(diǎn)判斷[12]、公交站點(diǎn)客流預(yù)測(cè)[13]等方面的研究,本文基于西安市公交IC卡出行大數(shù)據(jù),開(kāi)展了乘客上車耗時(shí)影響分析研究,探究包括用戶類型、站點(diǎn)類型、節(jié)假日、出行時(shí)段、天氣類型等對(duì)公交乘客上車耗時(shí)的影響。
采集到西安市8月的公交IC卡數(shù)據(jù),其數(shù)據(jù)格式如表1所示。據(jù)統(tǒng)計(jì),西安市公交一天上車總?cè)藬?shù)約為300萬(wàn)人次,刷卡數(shù)據(jù)量約為260萬(wàn)條/天,刷卡支付的比例占86.7%左右。
考慮到近90%的公交乘客通過(guò)刷卡上車,則計(jì)算連續(xù)2次乘客刷卡的時(shí)間差即可認(rèn)為是一位乘客的上車耗時(shí)。當(dāng)然,實(shí)際中常常存在投幣上車乘客、乘客先上車后刷卡或是一卡多刷等情況會(huì)造成連續(xù)2次乘客刷卡的時(shí)間差過(guò)大或過(guò)小,稱之為異常時(shí)間差,需要對(duì)其進(jìn)行剔除或修正處理。異常時(shí)間差包括零時(shí)間差和大時(shí)間差。
1)零時(shí)間差。實(shí)際情況中,有時(shí)會(huì)出現(xiàn)1卡多刷的情形,約占總出行的1.2%,使得2次連續(xù)刷卡的時(shí)間差等于0,因此對(duì)該類數(shù)據(jù)進(jìn)行修正處理。
2)大時(shí)間差。實(shí)際情況中,常常會(huì)出現(xiàn)乘客滯后刷卡,或2位刷卡乘客之間出現(xiàn)投幣乘客,公交同站臺(tái)多次停靠等,以上種種因素均會(huì)造成連續(xù)的刷卡時(shí)間差過(guò)大,需要對(duì)其進(jìn)行剔除處理。
異常時(shí)間差的預(yù)處理過(guò)程如下:
1)乘客的上車耗時(shí)。用n表示采集的刷卡數(shù)據(jù)總數(shù),Ti和 Ti+1分別表示第 i和 i+1個(gè)刷卡數(shù)據(jù)的記錄時(shí)刻。
2)乘客上車耗時(shí)的統(tǒng)計(jì)特性。統(tǒng)計(jì)乘客上車耗時(shí)的均值tm和標(biāo)準(zhǔn)差σ。
3)剔除大時(shí)間差的乘客耗時(shí)數(shù)據(jù)。若乘客的上車耗時(shí)大于2倍標(biāo)準(zhǔn)差,即滿足:ti>tm+2σ,則剔除之。
4)修正零時(shí)間差的乘客耗時(shí)數(shù)據(jù)。在剔除大時(shí)間差數(shù)據(jù)的基礎(chǔ)上,用同站點(diǎn)的乘客上車耗時(shí)的均值替換零時(shí)間差的乘客耗時(shí)數(shù)據(jù)。
正如已有的研究所表述的,乘客上下車的時(shí)間會(huì)受到車門數(shù)量和車門寬度、公交踏步的級(jí)數(shù)和踏步高度、公交售票方式、公交車內(nèi)擁擠狀況、乘客攜帶行李情況、公交車的通道寬度、公交車座位構(gòu)造等諸多因素的影響。由于研究地域采用了統(tǒng)一公交車型,車型對(duì)乘客上車耗時(shí)差別很小,本文從用戶類型、站點(diǎn)類型、出行時(shí)段、節(jié)假日和天氣類型等5個(gè)方面進(jìn)行影響因素分析。
1)用戶類型
公交IC卡用戶類型包括學(xué)生卡、普通卡和老年卡,年滿65歲的老年人可以辦理老年卡,乘車享受優(yōu)惠。與普通用戶及學(xué)生相比,老年人行動(dòng)能力和靈敏度上有著顯著的差距,這種差距可能給乘客上車時(shí)間帶來(lái)影響。
2)站點(diǎn)類型
公交站點(diǎn)類型和功能因所處的地理位置不同而異,有的公交站點(diǎn)可能有十幾條公交線路同時(shí)經(jīng)過(guò),而有的站點(diǎn)只有一兩條線路經(jīng)過(guò)。??烤€路較多的大型換乘站點(diǎn)較為擁擠,且乘客會(huì)由于攜帶行李或重物導(dǎo)致上車時(shí)間較長(zhǎng)。本文也考慮大型換乘站點(diǎn)對(duì)乘客上車耗時(shí)的影響。
3)出行時(shí)段
與出行低峰相比,在出行高峰時(shí)段出行乘客較多,造成車內(nèi)和站點(diǎn)等區(qū)域的乘客較多,此時(shí)車門處和車內(nèi)均比較擁擠、移動(dòng)困難,這些因素可能會(huì)帶來(lái)乘客上車耗時(shí)上的變化。
4)節(jié)假日
從出行目的來(lái)看,周內(nèi),乘客公交出行的主要目的是為了工作通勤,而節(jié)假日乘客出行目的則大多轉(zhuǎn)變?yōu)樾蓍e或游玩,不同的出行目的對(duì)于乘客的上車耗時(shí)應(yīng)該存在影響。
5)天氣類型
與晴朗天氣出行不同,惡劣的天氣出行常常會(huì)造成乘客的上車耗時(shí)更長(zhǎng),比如,雨天乘客需要攜帶雨傘出行,上車時(shí)需要收攏雨傘,通常會(huì)延長(zhǎng)乘客的上車時(shí)間,進(jìn)而會(huì)影響到公交在站臺(tái)的??繒r(shí)長(zhǎng)。
綜合考慮用戶類型、站點(diǎn)類型、出行時(shí)段、節(jié)假日及天氣類型這5個(gè)因素對(duì)乘客上車的影響分析。對(duì)影響因素進(jìn)行分類如下:①天氣類型分為晴天和雨天兩類,0為晴天,1為雨天;②節(jié)假日分為周內(nèi)和節(jié)假日兩類,0為周內(nèi),1為節(jié)假日;③出行時(shí)段分為高峰時(shí)段和低峰時(shí)段,0為非高峰期,1為高峰期;④ 站點(diǎn)類型分為大型換乘樞紐站和普通站點(diǎn)兩類,0為普通站點(diǎn),1為大型換乘站點(diǎn);⑤用戶類型分為老年用戶和普通用戶,0為普通用戶,1為老年用戶。分類數(shù)據(jù)如表2所示。
在本文的研究中,采取3.0T MRI檢查的25例矮小兒童中,有15例垂體前葉發(fā)育不良,2例垂體柄阻斷綜合征,2例顱咽管瘤術(shù)后垂體前葉薄小,6例垂體增生。而且,和正常兒童相比較,矮小癥兒童的矢狀高徑數(shù)據(jù)明顯更低,P值小于0.05。
在統(tǒng)計(jì)中,直方圖和統(tǒng)計(jì)描述可以直觀地顯示數(shù)據(jù)的分布情況,用于數(shù)據(jù)初始階段的定性分析。本文對(duì)總體樣本進(jìn)行統(tǒng)計(jì)分析,同時(shí)選取各影響因素(即雨天、節(jié)假日、高峰、大型換乘站點(diǎn)及老年用戶)對(duì)其進(jìn)行統(tǒng)計(jì)分析,繪制各影響因素的直方圖。各因素影響下的乘客上車耗時(shí)直方圖如圖1所示,對(duì)應(yīng)的統(tǒng)計(jì)描述如表3所示。
表2 分析數(shù)據(jù)
表3 各因素影響下乘客上車耗時(shí)統(tǒng)計(jì)描述
圖1 多因素影響下的乘客上車耗時(shí)直方圖
從直方圖和統(tǒng)計(jì)描述值(偏度和峰度)可以看出:①乘客上車耗時(shí)近似呈正態(tài)分布。②雨天狀況的乘客上車耗時(shí)直方圖分布與總體直方圖分布類似。究其原因如下:西安市屬于平原地區(qū),全年降雨量少,采集時(shí)間段內(nèi)的公交數(shù)據(jù)只有間斷性的小雨天氣出現(xiàn),對(duì)交通出行影響不大。③其他因素影響下的乘客上車耗時(shí)均與總體分布有差異,其中用戶類型的差異分布最大?;谥狈綀D的直觀分析結(jié)果,進(jìn)一步地對(duì)各影響因素分別進(jìn)行單因素方差分析和Logistic回歸,以定量檢驗(yàn)不同的因素對(duì)乘客上車耗時(shí)是否有顯著的影響。
方差分析(ANOVA)是一種常見(jiàn)的影響因素分析方法,在使用SPSS對(duì)各個(gè)因素進(jìn)行單因素方差分析時(shí),將5個(gè)因素作為影響因子,以對(duì)應(yīng)的乘客上車耗時(shí)作為因變量,逐一進(jìn)行單因素方差分析,方差分析結(jié)果見(jiàn)表4。
表4的分析結(jié)果表明:① 天氣類型的顯著性為0.728>0.05,說(shuō)明天氣因素不會(huì)對(duì)乘客上車產(chǎn)生影響,這與數(shù)據(jù)采集的城市本身降雨量很少有關(guān),故在后續(xù)的分析中不考慮天氣因素對(duì)乘客上車耗時(shí)的影響;②除天氣類型以外,其他4類因素的顯著性均小于0.05,說(shuō)明節(jié)假日、出行時(shí)段、站點(diǎn)類型和用戶類型會(huì)對(duì)乘客上車耗時(shí)產(chǎn)生一定的影響;③ 根據(jù)F值的大小,諸因素對(duì)乘客上下車耗時(shí)影響由大到小的順序?yàn)椋河脩纛愋停菊军c(diǎn)類型>節(jié)假日>出行時(shí)段。
Logistic回歸是一種廣義線性回歸(generalized linear model),本節(jié)運(yùn)用Logistic回歸分析各因素對(duì)乘客上車耗時(shí)的影響,并給出預(yù)測(cè)方程。采用二分類的Logistic回歸的因變量需要是一個(gè)二分類的分類變量,故對(duì)乘客上車耗時(shí)進(jìn)行二分類,以乘客上車耗時(shí)的平均值2.193 3 s(見(jiàn)表3)作為L(zhǎng)ogistic回歸因變量的二分類閾值,將小于平均值的耗時(shí)作為正常耗時(shí)記為0,將大于平均值的耗時(shí)作為較長(zhǎng)耗時(shí)記為1,并且根據(jù)單因素方差分析的結(jié)果排除天氣類型對(duì)乘客上車耗時(shí)的影響,得到如表5所示的Logistic回歸數(shù)據(jù)。
表4 各影響因素的單因素方差分析
表5 Logistic回歸數(shù)據(jù)
將表5數(shù)據(jù)導(dǎo)入SPSS軟件,利用SPSS對(duì)乘客上車時(shí)間間隔的數(shù)據(jù)進(jìn)行Logistic回歸分析,得到的結(jié)果如表6、7所示。表6為對(duì)Logistic回歸模型進(jìn)行Hosmer-Lemeshow檢驗(yàn)結(jié)果。P=0.158>0.05,認(rèn)為當(dāng)前數(shù)據(jù)中的信息已經(jīng)被充分提取,表明模型擬合優(yōu)度較高。表7為L(zhǎng)ogistic回歸的擬合結(jié)果,用于模型的建立和影響因素的分析。
在Logistic回歸擬合結(jié)果中,4種影響因素的顯著性P值均<0.05,表明4種不同的影響因素對(duì)乘客上車耗時(shí)均有影響。根據(jù)Wald值,各因素對(duì)乘客上車耗時(shí)影響的顯著性大小排序?yàn)椋河脩纛愋停菊军c(diǎn)類型>節(jié)假日>出行時(shí)段。該結(jié)論與通過(guò)單因素方差分析得出的結(jié)論是一致的。
表6 Hosmer-Lemeshow檢驗(yàn)表
當(dāng)P>0.5時(shí)表明乘客上車耗時(shí)較長(zhǎng),P<0.5表明乘客上車耗時(shí)為正常耗時(shí)。從Logistic回歸模型中,得出用戶類型、站點(diǎn)類型對(duì)乘客上車耗時(shí)呈正相關(guān),即老年人或者在大型換乘站點(diǎn)會(huì)加大乘客上車的耗時(shí)。出行時(shí)段、節(jié)假日對(duì)乘客上車耗時(shí)呈負(fù)相關(guān),即高峰出行或節(jié)假日出行會(huì)減少乘客上車耗時(shí)。
表7 Logistic回歸擬合結(jié)果
以西安公交IC卡大數(shù)據(jù)為研究對(duì)象,探索了天氣類型(雨天)、用戶類型、站點(diǎn)類型、節(jié)假日和出行時(shí)段等因素對(duì)乘客上車耗時(shí)的影響分析,并建立了多因素影響下的乘客上車正常耗時(shí)的概率預(yù)測(cè)模型。
1)從直方圖定性可知:乘客上車耗時(shí)近似呈正態(tài)分布,除了雨天情況下的乘客上車耗時(shí)直方圖分布與總體直方圖分布類似之外,其他因素對(duì)乘客上車耗時(shí)直方圖均有所影響。
2)基于方差分析法發(fā)現(xiàn):天氣類型的顯著性為0.728>0.05,說(shuō)明該因素對(duì)乘客上車耗時(shí)沒(méi)有顯著影響。除天氣類型以外,用戶類型、站點(diǎn)類型、節(jié)假日和出行時(shí)段對(duì)乘客上車耗時(shí)顯著性均小于0.05,這些因素對(duì)乘客上車耗時(shí)均有一定的影響。進(jìn)一步根據(jù)F值的大小,得到諸因素對(duì)乘客上下車耗時(shí)影響由大到小的順序?yàn)橛脩纛愋停菊军c(diǎn)類型>節(jié)假日>出行時(shí)段。
3)Logistic回歸擬合結(jié)果發(fā)現(xiàn):根據(jù)顯著性P值和Wald值顯示,用戶類型、站點(diǎn)類型、節(jié)假日和出行時(shí)段對(duì)乘客上車耗時(shí)均有影響,且影響顯著性排序一致。