蘇 敏,欒維新,馬 瑜,張 睿
(大連海事大學(xué) 交通運(yùn)輸管理學(xué)院,遼寧 大連 116026)
我國(guó)高速鐵路的快速發(fā)展對(duì)民航業(yè)主導(dǎo)的高速客運(yùn)市場(chǎng)形成競(jìng)爭(zhēng),客運(yùn)需求結(jié)構(gòu)也隨之發(fā)生著變化。目前,以高速鐵路或民航為主構(gòu)成的京滬高速客運(yùn)通道,已經(jīng)成為我國(guó)高速鐵路及民航客運(yùn)量最大、競(jìng)爭(zhēng)最為激烈的高速客運(yùn)市場(chǎng)。因此,分析京滬通道高速鐵路與民航競(jìng)爭(zhēng)環(huán)境下的旅客出行選擇影響因素,能夠更好地了解旅客出行現(xiàn)狀、提升高速鐵路與民航服務(wù)水平。
1970年,非集計(jì)理論走向?qū)嵺`并迅速在交通運(yùn)輸領(lǐng)域得到應(yīng)用[1],并且在旅客出行選擇影響因素方面的研究取得了一些成果。Thrane[2]的實(shí)證研究表明,年齡對(duì)出行方式選擇的影響并不是線性的,旅客選擇民航出行的概率隨出行人數(shù)的增加而降低;Georggi等[3]的研究表明,高收入群體對(duì)時(shí)間更為敏感,因而偏好選擇旅行時(shí)間短的飛機(jī)出行;王爽等[4]以SP 調(diào)查數(shù)據(jù)為基礎(chǔ),研究鐵路旅客對(duì)高頻率列車換乘模式和直達(dá)列車的選擇偏好;張迦南等[5]研究了旅客出行方式選擇行為隨出發(fā)時(shí)間和出行距離變化情況;許若曦等[6]分析了高速鐵路技術(shù)經(jīng)濟(jì)特性對(duì)客流分擔(dān)率的影響。在我國(guó)高速客運(yùn)通道旅客出行方式選擇行為方面,依據(jù)非集計(jì)理論進(jìn)行實(shí)證研究較少。葉玉玲等[7]以SP和RP數(shù)據(jù)為基礎(chǔ),研究了上?!贾萋每统鲂蟹绞竭x擇行為;張旭等[8]以武漢與廣州兩地調(diào)研數(shù)據(jù)為基礎(chǔ),構(gòu)建了描述高速鐵路和民航競(jìng)爭(zhēng)關(guān)系的Binary Logit模型。
這些研究探討了各影響因素如何對(duì)旅客出行方式選擇行為產(chǎn)生影響,但很難直觀呈現(xiàn)出各影響因素之間的交叉關(guān)系及其對(duì)旅客出行方式選擇行為的綜合影響。為此,在此基礎(chǔ)上,將非集計(jì)理論與決策樹方法相結(jié)合,以高速鐵路或民航為京滬高速通道旅客所選出行方式,在研究單個(gè)影響因素對(duì)京滬高速客運(yùn)通道旅客出行方式選擇行為影響程度的同時(shí),進(jìn)一步研究不同影響因素間的相互關(guān)系。采用Binary Logit模型能夠標(biāo)定各影響因素對(duì)旅客出行方式選擇行為的影響程度,而基于C5.0算法的決策樹模型可以直觀展示各影響因素對(duì)旅客出行方式選擇行為所產(chǎn)生的綜合影響,二者結(jié)合能夠?qū)β每统鲂蟹绞竭x擇行為影響因素有更為深刻的認(rèn)識(shí),從而在一定程度上為高速鐵路與民航設(shè)計(jì)符合不同類型旅客的客運(yùn)產(chǎn)品提供實(shí)證依據(jù)。
京滬高速客運(yùn)通道旅客出行選擇特征調(diào)研問(wèn)卷包含行為調(diào)研(RP)與意向調(diào)研(SP) 2部分內(nèi)容:RP調(diào)研屬性包括性別、年齡、職業(yè)、收入、旅費(fèi)來(lái)源、出行人數(shù)等;SP調(diào)研屬性包括首先出行時(shí)間、支付意愿等,選擇在北京、上海的機(jī)場(chǎng)和高速鐵路站、隨機(jī)選取北京—上海(上海—北京)線旅客進(jìn)行調(diào)研。京滬高速客運(yùn)通道旅客調(diào)研數(shù)據(jù)描述如表1所示。
根據(jù)調(diào)研數(shù)據(jù),男性旅客占比偏高,大多數(shù)為40歲以下公務(wù)出行的職員和經(jīng)理,而且總體來(lái)看男性旅客更傾向于選擇高速鐵路出行;年齡介于18 ~ 40歲之間的旅客占比高達(dá)82.5%;收入對(duì)旅客出行方式選擇行為存在較大影響,隨著收入的增加,選擇民航出行的旅客占比隨之增加;根據(jù)旅客偏好的不同,首選出行時(shí)間在16 ∶ 00點(diǎn)前并且呈現(xiàn)隨機(jī)分布的情況;相較于自費(fèi)的旅客,公費(fèi)出行的旅客更傾向于選擇民航出行。綜合數(shù)據(jù)內(nèi)容發(fā)現(xiàn),京滬高速客運(yùn)通道以公務(wù)出行為目的的中等偏高收入在職人員為主。
作為決策單元,旅客k對(duì)運(yùn)輸方式i(高速鐵路或民航)選擇的Binary Logit模型的效用函數(shù)如公式 ⑴ 所示 。
式中:為隨機(jī)變化部分;為效用函數(shù)的確定項(xiàng)目,目前對(duì)效用函數(shù)的確定項(xiàng)通常采用線性函數(shù)形式,如公式 ⑵ 所示。
式中:為旅客k選擇第i種出行方式的第j個(gè)影響因素;Bj為影響因素對(duì)應(yīng)的參數(shù)。
表1 京滬高速客運(yùn)通道旅客調(diào)研數(shù)據(jù)表Tab.1 Passenger survey data description
旅客選擇運(yùn)輸方式i的概率如公式 ⑶ 所示。其中,i= 0表示高速鐵路;i= 1表示民航;i-表示除運(yùn)輸方式i以外的其他運(yùn)輸方式。
當(dāng)P(i= 1) > 0.5時(shí),旅客選擇民航出行,否則旅客選擇高速鐵路出行;當(dāng)計(jì)算結(jié)果與調(diào)研數(shù)據(jù)一致時(shí),認(rèn)為模型預(yù)測(cè)正確,否則認(rèn)為模型預(yù)測(cè)錯(cuò)誤,最終通過(guò)準(zhǔn)確率查看模型預(yù)測(cè)效果。
基于C5.0算法的決策樹采用信息增益率為劃分標(biāo)準(zhǔn)來(lái)確定最優(yōu)分組變量及最優(yōu)分割點(diǎn),計(jì)算過(guò)程如下。
設(shè)P(i|t) 表示給定結(jié)點(diǎn)t中屬于類i(i= 1表示民航,i= 0表示高速鐵路)所有記錄的比例,則
(1)計(jì)算信息熵。結(jié)點(diǎn)t的信息熵Info(t)如公式 ⑸ 所示,第j個(gè)屬性X中第r個(gè)屬性值的信息熵Info(。
式中:m表示屬性值個(gè)數(shù);Nparent表示父節(jié)點(diǎn)上記錄的類總數(shù);Nchild()表示子女節(jié)點(diǎn)上屬性值為時(shí)記錄的類總數(shù)。
(3)計(jì)算屬性Xj的信息增益率Gain ratio(Xj)。
式中:Split Info(Xj)為劃分信息。
將京滬高速客運(yùn)通道旅客出行方式選擇行為的影響因素Xj分劃為旅客屬性與出行屬性2類[5],并在分析高速鐵路與民航客流出行特征的基礎(chǔ)上,設(shè)計(jì)了相關(guān)變量,定義模型變量如表2所示。
表2 定義模型變量Tab.2 Model variables
根據(jù)定義的變量,選取70%的數(shù)據(jù)作為訓(xùn)練樣本,剩余30%作為檢驗(yàn)樣本,以說(shuō)明分類模型的合理性。Binary Logit模型參數(shù)標(biāo)定如表3所示,Binary Logit模型準(zhǔn)確率如表4所示,其中訓(xùn)練數(shù)據(jù)總準(zhǔn)確率為90.1%,檢驗(yàn)數(shù)據(jù)總準(zhǔn)確率為89%,因而模型能很好地描述旅客出行方式選擇行為。
表3 Binary Logit模型參數(shù)標(biāo)定Tab.3 Binary Logit Model parameter calibration
表4 Binary Logit模型準(zhǔn)確率Tab.4 Binary Logit Model accuracy
根據(jù)表3得出各因素對(duì)京滬高速客運(yùn)通道旅客出行偏好的影響。
(1)B1= -3.224,說(shuō)明相較于男性,女性更傾向于選擇民航出行。調(diào)研數(shù)據(jù)中顯示男性中有39.6%的旅客選擇民航出行,而女性中有52.1%的旅客選擇民航出行。
(2)B2= 1.965,B3= 1.741,而B4= 0.801不顯著,說(shuō)明總體上40歲以下的旅客傾向于選擇民航。結(jié)合調(diào)研數(shù)據(jù)發(fā)現(xiàn)年齡對(duì)旅客選擇行為的影響為非線性,即18歲(含)以下旅客傾向于選擇高速鐵路,18 ~ 40歲之間的旅客選擇民航的比例最高,但41歲(含)以后的旅客更傾向于選擇高速鐵路。
(3)B5= -4.241,而B6= -2.829,說(shuō)明收入10 000元以下的旅客偏好高速鐵路出行,但隨著收入的增加旅客選擇高速鐵路出行的意愿開始減弱,部分高收入旅客開始轉(zhuǎn)向選擇民航出行。通過(guò)對(duì)對(duì)照組數(shù)據(jù)的分析發(fā)現(xiàn)當(dāng)收入高于10 000元時(shí),選擇民航出行的旅客人數(shù)約是選擇高速鐵路出行人數(shù)的3.7倍,可見收入是影響旅客出行的重要因素。
(4)B7= -0.856,說(shuō)明隨著出行人數(shù)的增加,旅客更傾向于選擇高速鐵路出行。調(diào)研中發(fā)現(xiàn)私密空間是獨(dú)自出行的旅客選擇民航的主要原因。非單獨(dú)出行的旅客在考慮出行成本的同時(shí)喜歡享受旅途,高速鐵路是多人出行時(shí)的最佳選擇。
(5)B8= 1.122,說(shuō)明與自費(fèi)旅客相比,公費(fèi)旅客非常樂(lè)意選擇民航出行。
(6)B9= -3.480,B10= -3.992,B11= -3.274,說(shuō)明16 ∶ 00前旅客更傾向于選擇高速鐵路出行,而且高速鐵路民航分配比例較為均有。不同的是,對(duì)照組,即16 ∶ 00點(diǎn)后出行的旅客有84.6%會(huì)選擇民航,可見16 ∶ 00點(diǎn)是旅客選擇出行方式的一個(gè)重要時(shí)間節(jié)點(diǎn)。
圖1 基于C5.0算法的旅客出行選擇決策樹Fig.1 Decision Tree of passenger travel choice based on C5.0 algorithm
表5 決策樹準(zhǔn)確性Tab.5 Decision Tree accuracy
為了進(jìn)一步研究各影響因素如何對(duì)京滬高速客運(yùn)通道旅客出行方式選擇行為交叉發(fā)揮影響,使用基于C5.0的決策樹分類方法對(duì)Binary Logit得出的概率結(jié)果進(jìn)行了分類,同樣隨機(jī)選取70%的數(shù)據(jù)作為訓(xùn)練樣本,剩余30%作為檢驗(yàn)樣本,基于C5.0算法的旅客出行選擇決策樹如圖1所示,決策樹準(zhǔn)確性如表5所示。模型訓(xùn)練組的準(zhǔn)確率為98.0%,檢驗(yàn)組的準(zhǔn)確率為96.4%,認(rèn)為基于C5.0算法的決策樹模型對(duì)旅客出行選擇影響因素的分類效果較好。
根據(jù)圖1可知,隨著月收入的增加,選擇民航出行的旅客比例不斷增加,調(diào)研過(guò)程中發(fā)現(xiàn)高收入旅客的時(shí)間價(jià)值很高,因而與票價(jià)相比,高收入旅客更看重時(shí)間。年齡未體現(xiàn)在決策數(shù)模型中,可見其對(duì)旅客出行影響的區(qū)分度最低,這是由于年齡的非線性影響造成的。不同收入水平下影響旅客出行方式選擇行為的因素各不相同。
(1)月收入低于5 000元的旅客中,男性旅客只會(huì)選擇高速鐵路出行,而女性旅客會(huì)受到費(fèi)用來(lái)源與出行人數(shù)的影響,除獨(dú)自公費(fèi)出行的女性旅客會(huì)選擇民航外,自費(fèi)出行的女性旅客、非獨(dú)自公費(fèi)出行的女性旅客均會(huì)選擇高速鐵路。調(diào)查中發(fā)現(xiàn)月收入低于5 000元的旅客對(duì)票價(jià)較為敏感、支付意愿低,因而會(huì)傾向于選擇較為便宜的高速鐵路出行。
(2)月收入在5 000 ~ 10 000元的旅客中,男性旅客會(huì)受到出行時(shí)間的影響,而女性旅客受到出行人數(shù)的影響。由于時(shí)間充裕,16 ∶ 00點(diǎn)前出行的男性旅客會(huì)選擇高速鐵路,而16 ∶ 00點(diǎn)后出行的男性旅客會(huì)選擇民航;非獨(dú)自出行的女性旅客為節(jié)省出行成本等原因傾向于選擇高速鐵路,而獨(dú)自出行的女性旅客會(huì)因舒適的候機(jī)環(huán)境而選擇民航。
(3)月收入在10 000元以上的旅客中,性別已不是影響旅客出行方式選擇行為最主要的因素,旅客更多受到出行人數(shù)與費(fèi)用來(lái)源影響。與收入10 000元以下的旅客不同的是,由于收入的增加,出行人數(shù)的最佳區(qū)分值達(dá)到2人,即出行人數(shù)≤ 2人時(shí)旅客更傾向于選擇民航;出行人數(shù)>2人時(shí)旅客會(huì)選擇高速鐵路。在出行人數(shù)≤2人旅客中,根據(jù)圖1分析得出女性旅客更傾向于選擇民航出行,而男性旅客在自費(fèi)雙人出行時(shí)才會(huì)選擇高速鐵路??梢?,收入10 000元以上的旅客更看重出行人數(shù)。
依據(jù)非集計(jì)理論,以京滬高速客運(yùn)通道調(diào)研數(shù)據(jù)為基礎(chǔ),結(jié)合Binary Logit模型與決策樹模型分析了各影響因素對(duì)旅客出行方式選擇行為的交叉影響,得出以下研究結(jié)論。
(1)Binary Logit模型的檢驗(yàn)數(shù)據(jù)準(zhǔn)確率為89.0%,基于C5.0算法的決策樹模型的檢驗(yàn)數(shù)據(jù)準(zhǔn)確率為96.4%??梢?,所構(gòu)建的2個(gè)模型均能較好地描述旅客出行方式選擇行為的影響因素。
(2)年齡對(duì)旅客出行方式選擇行為影響區(qū)分度較低,且為非線性影響。相較于年齡與首選時(shí)間,收入、性別、出行人數(shù)、費(fèi)用來(lái)源對(duì)旅客出行方式選擇行為影響較大,收入高、出行人數(shù)少、公費(fèi)出行的旅客更偏好選擇民航出行,且女性旅客選擇民航出行的比例遠(yuǎn)高于男性旅客的比例。因此,鐵路部門可以考慮通過(guò)開設(shè)女性候車室、在現(xiàn)有高速鐵路車廂基礎(chǔ)上增加女性高端旅客專用車廂等方式,提升女性旅客安全感與候車、乘車體驗(yàn)。
(3)隨著旅客收入的增加,選擇民航出行的旅客比例不斷增加。收入是旅客選擇出行方式最重要影響因素,不同收入水平下的男性、女性旅客受不同因素影響,如收入介于5 000 ~ 10 000元之間的女性旅客受出行人數(shù)影響,而男性旅客受出行時(shí)間影響。因此,為配合高速鐵路列車商務(wù)座、一等座等高端服務(wù),高速鐵路站可以開設(shè)VIP候車間等高端服務(wù),以吸引高收入群體,尤其是女性旅客。民航可以通過(guò)優(yōu)化跨期價(jià)格歧視吸引自費(fèi)出行的低收入旅客,尤其是16 ∶ 00點(diǎn)前出行的男性旅客。