劉建榮,黃 玲
(華南理工大學土木與交通學院,廣州510640)
公共交通中,車廂內(nèi)擁擠會增加出行者的壓力和不滿意度,是影響出行體驗的重要因素[1],車廂內(nèi)擁擠可能會影響出行者的時間價值.大部分學者利用陳述性偏好(Stated Preference,SP)方法獲取數(shù)據(jù),并利用Logit模型研究擁擠度的影響.分析文獻,本文認為以下方面有待改進.
(1)出行者的異質(zhì)性可能影響車廂內(nèi)擁擠度的支付意愿.但僅有 Haywood[2],Kroes[3],Batarce[4]等少量文獻考慮了出行者個體特征的影響.文獻根據(jù)出行者的某些特征,如出行目的、性別等,將數(shù)據(jù)樣本進行分類,進而分析不同子樣本的出行選擇行為.以上方法存在一定缺陷:當分類依據(jù)較多時,被劃分出來的樣本子集過多;數(shù)據(jù)樣本的劃分缺乏理論基礎.
(2)除蔣盛川[5],邵敏華[6]等的研究對象為中國公交系統(tǒng),其他研究基本為發(fā)達國家或地區(qū)的研究成果.但各國對擁擠度的感知并不一致[7],且由于生活水平、觀念、公交系統(tǒng)服務質(zhì)量的巨大差異,發(fā)達國家或地區(qū)的研究成果并不適用于中國.
考慮以上研究背景,本文選用潛在類別條件Logit模型(Latent-class Conditional Logit Model)研究出行者異質(zhì)性和地鐵擁擠度對時間價值的影響.潛在類別條件Logit模型能夠根據(jù)出行者的選擇行為對出行者進行類別劃分,分析出行者個人特征對類別劃分的影響,從而避免根據(jù)出行者某一特征進行盲目劃分的缺陷.潛在類別條件Logit模型是在傳統(tǒng)的Logit模型基礎上發(fā)展起來的,較為復雜且出現(xiàn)較晚,故采用潛在類別條件Logit模型進行出行行為分析的文獻較少.文獻利用潛在類別條件Logit模型研究了出行選擇行為,但均未涉及到擁擠度對出行行為的影響.
潛在類別條件Logit模型假定個人選擇行為依賴于可觀測的屬性及潛在的異質(zhì)性.潛在的異質(zhì)性受研究者不能直接觀測因素的影響.異質(zhì)性通過離散參數(shù)變異來分析.
假定有N個顧客,每個顧客面臨T個選擇集,每個選擇集有J個選項.如果在選擇集t中,顧客n選擇第j個選項,記ynjt為1,否則為0.每個選項由與選項相關的變量向量xnjt所表征,顧客n由一系列與顧客n相關的特征所表征.
潛在類別條件Logit模型假定N個顧客可以分為C個類別,每個類別的參數(shù)不一致,即β=(β1,β2,…,βC).如果顧客n屬于類別c,則觀察到他一系列選擇的概率為
式中:xnjt為顧客n在選擇集t中選項j的變量,其隨個體n而變,也隨選項j而變;βc為類別c的系數(shù).
因為顧客屬于哪個類別是未知的,因此需要指定顧客n的選擇的非條件似然值,其值等于式(1)在所有類別上的加權(quán)均值.n屬于類別c的概率可表示為
式中:θ是類別成員模型參數(shù),θ=(θ1,θ2,…,θC-1) ,θC為識別參數(shù)時,θC設定為0;θc為類別c相關的類別成員模型參數(shù);θl為類別l相關的類別成員模型參數(shù),l為整數(shù),取值范圍1~C-1;zn為顧客n的個人屬性,如性別,收入等.
樣本的對數(shù)似然值是所有顧客的log非條件似然值之和,即
通過最大化式(3)求解參數(shù)值.
樣本總體類別數(shù)C在開始時是未知的,故需要預先指定C的取值.C取不同值,模型的對數(shù)非條件似然值之和取值也不一樣.這就涉及到C的最優(yōu)取值問題.采用ICAIC(Consistent Akaike Information Criterion)和IBIC(Bayesian Information Criterion)兩個指標進行類別C的選擇.ICAIC和IBIC的計算公式為
式中:L為最大樣本對數(shù)似然值;m為模型的參數(shù)個數(shù).ICAIC和IBIC值越小,模型擬合度越高.
關于潛在類別Logit模型的更多內(nèi)容可見Bhat[8].
考慮不同類型地鐵車廂座位數(shù)和空間的差異,選用站立乘客密度表征車廂內(nèi)擁擠度.密度分為0.0,1.0,3.0,4.0,5.0,6.5人/m2這6個等級.
假定使用地鐵的出行者分為C個類別.借鑒BATARCE[4]等,第c類出行者i對于選擇集j的第k個選項的效用函數(shù)的可觀測部分表示為
式中:c為虛擬變量,有座時為1,無座時為0;Pijk為對于出行者i,選擇集j的第k個選項的地鐵車票票價(元);Tijk為對于出行者i,選擇集j的第k個選項的乘坐地鐵時間(min);Dijk為對于出行者i,選擇集j的第k個選項的地鐵車廂內(nèi)站立乘客密度(人/m2),取值范圍為[ 0.5,6.5 ;ηc、αc、βc、γc]為系數(shù).
根據(jù)效用函數(shù)式(5),出行者是在幾種地鐵系統(tǒng)中選擇最合意的方式,地鐵系統(tǒng)在車票價格、地鐵乘坐時間和車廂內(nèi)擁擠度等方面存在差異.
根據(jù)潛在類別條件Logit模型所需的數(shù)據(jù)格式,以及本文模型設定.問卷設計共包括3部分內(nèi)容:出行者選擇行為問卷,出行者個人統(tǒng)計學特征,出行者心理因素.
出行者選擇行為問卷,使用SP調(diào)查方法,利用正交設計,共設置16個情景,每位被調(diào)查者對4個情景中的選項做出選擇.
出行者個人統(tǒng)計學特征,對應式(2)中的zn設置具體的數(shù)據(jù),如表1所示.
表1 個人統(tǒng)計學特征Table 1 Demographic characteristics
出行者心理因素部分,參考文獻[9]等,結(jié)合我國地鐵實際情況,設置對于交通方式的舒適性要求(lcomfort)這一潛在變量,選用4個顯變量表征:Q1表示選擇出行方式時,在意這種出行方式是不是擁擠;Q2表示選擇出行方式時,在意環(huán)境舒適不舒適(如氣味、溫度、噪聲等);Q3表示如果某種出行方式不舒適,會選擇更舒適的出行方式,即使要多付出5元以上;Q4表示如果某種出行方式不舒適,會選擇更舒適的出行方式,即使要多付出15 min以上.顯變量采用李克特五級量表進行調(diào)查,即1、2、3、4、5分別表示“完全不贊同”“有點不贊同”“不確定”“基本贊同”“完全贊同”.
調(diào)查地點為南昌市地鐵站,調(diào)查時間為2018年8月早高峰.共640人完整了問卷,每人回答4個假定情境,共回答2 560個假定情境.調(diào)查樣本量符合要求,且出行者個體特征較符合使用地鐵的群體.
選用Rasch模型求解潛在變量comfort,主要基于以下原因:潛在變量comfort的4個顯變量的數(shù)據(jù)為定序數(shù)據(jù).若將以上數(shù)據(jù)當作定距數(shù)據(jù)進行處理,實際就強加了定序數(shù)據(jù)之間間距相同的假定.Rasch模型主要用于定序數(shù)據(jù)分析,能夠?qū)⒈欢ㄐ驍?shù)據(jù)轉(zhuǎn)化為定距和客觀的數(shù)據(jù).關于Rasch模型更詳細地分析可見BOONE[10].
Rasch模型假定某人i對某一問題項j評價為q的概率表述為
式中:Pijq為某人i對某一問題項j評分為q的概率;τjq為step difficulty;θi、bj分別為與個人i和問題項j相關的一維定距數(shù)據(jù),且為同一量綱(Logit).
利用極大似然估計對定序數(shù)據(jù)進行分析,得到Q1~Q4這4個問題項的IN MNSQ、OUT MNSQ、PTMEAS值信息如表2所示.IN MNSQ及Out MNSQ位于0.5~1.5,說明擬合度較好;PTMEAS介于0~1,顯著大于0,說明顯著性較好.故本文數(shù)據(jù)的擬合度較好.
表 2 Rasch模型統(tǒng)計參數(shù)信息Table 2 Estimation of item's difficulty and fit statistics
通過Rasch模型,還得到了與每位調(diào)查者相關的θ值.由于Q1~Q4這4個問題項均為出行者對于舒適性的要求,因此將θ值定義為出行者對于舒適性的要求(lcomfort),lcomfort為一維定距數(shù)據(jù),量綱Logit.由于每一位被調(diào)查者均有一個lcomfort,本文共調(diào)查640位出行者,有640個數(shù)據(jù),數(shù)據(jù)量太大,在此不列出.
使用stata中的lclogit工具包進行數(shù)據(jù)分析,關于lclogit工具包的更多細節(jié),可以見說明書[11].對于潛在類別條件Logit模型,需要確定樣本總體類別數(shù)量C.分別假定樣本可被劃分為2~5個子集,得到各子樣本數(shù)量情況下的ICAIC和IBIC值如表3所示.當類別為2時,ICAIC和IBIC的值最小,樣本可以分為2個子集.
表 3 模型ICAIC及IBIC比較Table 3 Comparison of values ofICAICandIBIC
將樣本總體的子集數(shù)量設定為2,對樣本總體進行潛在類別條件Logit模型回歸,并將兩個子類別分別定義為class1、class2.為對比潛在類別條件Logit模型是否能夠提高對數(shù)據(jù)的擬合度,同時對數(shù)據(jù)進行傳統(tǒng)的條件Logit回歸.最終,潛在類別條件Logit模型的log likelihood值為-1 415,PseudoR2為0.202;傳統(tǒng)的條件Logit模型的log likelihood值為-1 478,PseudoR2為0.166 8.因此潛在類別條件Logit模型對數(shù)據(jù)的擬合度優(yōu)于傳統(tǒng)的條件Logit模型.
潛在類別條件Logit模型的回歸系數(shù)如表4中的class1、class2.為與傳統(tǒng)方法進行對比分析,假定出行者不存在異質(zhì)性,對數(shù)據(jù)整體進行傳統(tǒng)的條件Logit模型回歸,得到系數(shù)如表4中的“整體”部分.表4中class1、class2、“整體”中的回歸系數(shù),對應式(5).樣本點的個體特征對分類的影響如表5所示.表5中是以class2為基準的,即將class2的各個系數(shù)設置為0,故在表中未列出.另外,表4中的“class1”“class2”,表5中的全部數(shù)據(jù)是同時估計的,但為了明顯起見,分別列出.class1和class2占總體的比例分別為41.8%和58.2%.
表 4 潛在類別條件Logit模型回歸系數(shù)Table 4 Regression coefficient of latent class conditional Logit model
表 5 出行者特征對類別的影響Table 5 Impact of demographic characteristics on classification
根據(jù)表4數(shù)據(jù),class1類別中,γ不顯著,即對于無座乘客,地鐵車廂內(nèi)站立乘客密度的增加不會對站立乘客的效用函數(shù)產(chǎn)生影響.class2中,γ顯著小于0,即對于無座乘客,地鐵車廂內(nèi)站立乘客密度的增加會導致站立乘客的效用減少.因此class1中的無座乘客不在意車廂內(nèi)擁擠度,而class2中的無座乘客極為在意車廂內(nèi)擁擠度.
根據(jù)式(5),有座、無座乘客的效用函數(shù)分別為
Vtime、分別表示乘客有座、無座時的時間價值(元/h),即
根據(jù)式(9)、式(10)及表4中數(shù)據(jù),對于class1中的出行者,有座乘客與無座乘客的時間價值分別為14.7元/h、16.9元/h.無座乘客的時間價值是有座乘客1.16倍.對于class2中的出行者,有座乘客與無座乘客的時間價值為23.1元/h、(20+8.6?D)元/h.class2中出行者的時間價值大于class1中出行者的時間價值.對于class2的站立乘客,車廂內(nèi)站立乘客的密度增加1人/m2,則時間價值增加8.6元/h,增加值極大.
對于class2的出行者及全部出行者,以有座乘客的時間價值為基準,將不同擁擠度情況下的無座乘客時間價值除以有座乘客的時間價值,得到不同擁擠度情況下的相對時間價值,具體如圖1所示.隨著車廂內(nèi)無座乘客密度的增加,相對時間價值逐漸增加.
圖1 不同密度情況下的相對時間價值Fig.1 Time multipliers under different standee densities
對于class2的出行者,當車廂內(nèi)無座乘客密度為0.5人/m2時(只有很少的站立乘客,乘客在車廂內(nèi)行動極為自由),相對時間價值為1.1,即站立乘客的時間價值為有座乘客的1.1倍;當車廂內(nèi)無座乘客密度為4人/m2時(有點擁擠,行動受到一定的限制),相對時間價值為2.4,站立乘客的時間價值為有座乘客的2.4倍;當車廂內(nèi)無座乘客密度為6.5人/m2時(極為擁擠,幾乎不能移動),相對時間價值為3.3,站立乘客的時間價值為有座乘客的3.3倍.分析圖1中的class2和整體可以發(fā)現(xiàn),當擁擠度超過2人/m2,同一擁擠度情況下,class2的相對時間價值大于整體的相對時間價值.因此若不考慮出行者的異質(zhì)性,會低估地鐵車廂內(nèi)擁擠度對重視擁擠度的出行者(class2)的影響,且會高估地鐵車廂內(nèi)擁擠度對不在意擁擠度的出行者(class1)的影響.
分析表5數(shù)據(jù),僅lcomfort的系數(shù)顯著,且為負值.即lcomfort越大,出行者屬于class2的概率越大.根據(jù)表5和式(2),可以確定lcomfort的比例為exp(-0.157)=0.855.因此,lcomfort的1Logit,出行者屬于class2的比例會減少14.5%,即1-0.855=0.145,因此lcomfort對出行者所有類別的概率具有很大影響.
本文研究了出行者異質(zhì)性和地鐵車廂內(nèi)擁擠度對地鐵出行時間價值的影響.通過研究,得到以下結(jié)論:相比傳統(tǒng)的條件Logit模型,潛在類別條件Logit模型對數(shù)據(jù)具有更高的擬合度;根據(jù)潛在類別條件Logit模型,出行者可以劃分為class1和class2兩個群體,占比分別為41.8%、58.2%,class1中無座乘客不在意車廂內(nèi)擁擠度,class2中無座乘客極為在意車廂內(nèi)擁擠度;class1中的出行者,有座乘客與無座乘客的時間價值分別為14.7元/h、16.9元/h,class2中無座乘客的時間價值分別為(20+8.6?D)元/h;出行者的舒適性需求對出行者類別劃分具有顯著影響,需求越高,出行者越有可能屬于class2.