邢玉玲,周慧娟,胡鈺琴,李 蓓
(北方工業(yè)大學(xué)城市道路交通智能控制技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100144)
軌道交通服務(wù)水平影響了乘客軌道交通出行體驗(yàn),進(jìn)而影響軌道交通在公共交通中的分擔(dān)率.近年來(lái)為有效研究軌道交通服務(wù)水平影響因素,國(guó)內(nèi)外學(xué)者更多地從乘客角度出發(fā),通過(guò)乘客問(wèn)卷調(diào)查來(lái)篩選評(píng)價(jià)指標(biāo).李洪旭[1]分析了設(shè)施服務(wù)水平的影響因素,通過(guò)對(duì)乘客問(wèn)卷調(diào)查結(jié)果的分析,得到城市軌道交通整體設(shè)施服務(wù)水平分級(jí)標(biāo)準(zhǔn).楊亦慧等[2]利用乘客感知-反應(yīng)的方法研究了地鐵車站通道服務(wù)水平標(biāo)準(zhǔn)及其劃分方法,利用問(wèn)卷調(diào)查和重要度指數(shù)法確定了評(píng)價(jià)指標(biāo).望愛(ài)詩(shī)[3]運(yùn)用系統(tǒng)分析方法構(gòu)建城市軌道交通綜合服務(wù)水平指標(biāo)體系,通過(guò)乘客問(wèn)卷調(diào)查運(yùn)用結(jié)構(gòu)方程模型對(duì)指標(biāo)體系構(gòu)建的合理性進(jìn)行驗(yàn)證,并以武漢市軌道交通為例進(jìn)行實(shí)證分析.高偉森[4]創(chuàng)設(shè)了地鐵運(yùn)營(yíng)服務(wù)質(zhì)量評(píng)價(jià)指標(biāo)體系,并以指標(biāo)體系作為框架,延伸出調(diào)查問(wèn)卷的具體內(nèi)容,通過(guò)Cronbach’sa系數(shù)檢驗(yàn)問(wèn)卷信度,根據(jù)指標(biāo)重要度來(lái)篩選指標(biāo).由此可見(jiàn),問(wèn)卷調(diào)查在軌道交通領(lǐng)域調(diào)查乘客需求和體驗(yàn)方面應(yīng)用越來(lái)越廣泛.問(wèn)卷設(shè)計(jì)是問(wèn)卷調(diào)查研究的前提工作,影響到整個(gè)研究的分析使用.一份科學(xué)合理的問(wèn)卷便于收集到有效的實(shí)驗(yàn)數(shù)據(jù),從而達(dá)到研究目的.目前軌道交通領(lǐng)域大多從統(tǒng)計(jì)數(shù)據(jù)質(zhì)量角度來(lái)評(píng)價(jià)調(diào)查問(wèn)卷設(shè)計(jì)質(zhì)量,即通過(guò)問(wèn)卷結(jié)果的信效度檢驗(yàn)來(lái)反映問(wèn)卷設(shè)計(jì)質(zhì)量的好壞.而問(wèn)卷選項(xiàng)設(shè)置對(duì)不同乘客來(lái)說(shuō),難易程度和合理性卻很少有人考慮[5].
Rasch分析是項(xiàng)目響應(yīng)理論(IRT)的一種特例,它主要通過(guò)被試者在試題上的作答來(lái)反映個(gè)體能力與該題目難度以及個(gè)體給出正確答案的可能性之間的關(guān)系,從而測(cè)試對(duì)不同答題者問(wèn)卷選項(xiàng)設(shè)置的合理性.現(xiàn)在醫(yī)藥衛(wèi)生、教育語(yǔ)言、經(jīng)濟(jì)管理、心理學(xué)、市場(chǎng)營(yíng)銷、社會(huì)科學(xué)等學(xué)科評(píng)估方面應(yīng)用廣泛.近兩年Rasch模型分析在交通領(lǐng)域評(píng)估方面的運(yùn)用也嶄露頭角.Junghwa Kim等[6]通過(guò)對(duì)3 970名受訪者進(jìn)行了隨機(jī)問(wèn)卷調(diào)查,并基于Rasch分析,根據(jù)出行目的區(qū)分乘客對(duì)問(wèn)卷項(xiàng)目的滿意度,來(lái)確定軌道交通設(shè)施服務(wù)水平以及不同服務(wù)指標(biāo)對(duì)不同出行目的的乘客的重要性.劉建榮等[7]基于Rasch模型,對(duì)地鐵服務(wù)質(zhì)量的影響因素及地鐵總體滿意度進(jìn)行研究,分析出行者個(gè)人屬性對(duì)地鐵服務(wù)評(píng)價(jià)的影響,為提升地鐵服務(wù)質(zhì)量提供了改進(jìn)意見(jiàn).喬相榮等[8]以城市軌道交通接駁過(guò)程中交通設(shè)備對(duì)出行者的影響作為研究對(duì)象,構(gòu)建了基于Rasch模型的城市軌道交通接駁感知評(píng)價(jià)模型.并通過(guò)對(duì)西安市城市軌道交通乘客的問(wèn)卷調(diào)查進(jìn)行實(shí)例分析,研究城市軌道交通不同接駁方式對(duì)不同年齡、性別、收入的乘客個(gè)體和對(duì)接駁過(guò)程滿意度出行感知的影響.
以上基于Rasch模型的問(wèn)卷分析研究都是針對(duì)軌道交通設(shè)施、服務(wù)質(zhì)量的評(píng)估,且在指標(biāo)選取環(huán)節(jié)就缺乏科學(xué)依據(jù),在軌道交通整體服務(wù)水平問(wèn)卷研究上還未應(yīng)用.為了解決以往研究中對(duì)城市軌道交通服務(wù)水平評(píng)價(jià)的不全面、標(biāo)準(zhǔn)不一、問(wèn)卷質(zhì)量檢測(cè)方法老套等問(wèn)題,本研究在現(xiàn)有國(guó)內(nèi)外相關(guān)文獻(xiàn)和法規(guī)的基礎(chǔ)上,從乘客軌道交通出行全過(guò)程的角度提取服務(wù)水平影響因素,設(shè)計(jì)調(diào)查問(wèn)卷,并基于Rasch模型通過(guò)問(wèn)卷調(diào)查結(jié)果,對(duì)問(wèn)卷進(jìn)行客觀分析和優(yōu)化,為建立系統(tǒng)全面的服務(wù)水平評(píng)價(jià)體系提供問(wèn)卷質(zhì)量檢測(cè)方法.
乘客作為軌道交通出行的直接參與者和被服務(wù)對(duì)象,其對(duì)軌道交通服務(wù)水平影響因素的評(píng)價(jià)十分重要.乘客選擇乘坐軌道交通一定會(huì)考慮以下幾點(diǎn):要去的地點(diǎn),乘坐幾號(hào)線,地鐵的前進(jìn)方向,何處換乘,哪個(gè)出口出地鐵站.基本乘車過(guò)程主要包括進(jìn)站、購(gòu)票、安檢、檢票、樓梯通道、候車、乘車、換乘或出站等幾個(gè)環(huán)節(jié),那么在其尋找地鐵出入口時(shí),就已經(jīng)涉及對(duì)軌道交通服務(wù)水平的評(píng)價(jià)了.而在乘車的整個(gè)過(guò)程中,由于乘客類型以及出行目的不同,乘客的出行心理和需求也不同,各環(huán)節(jié)對(duì)乘客服務(wù)水平高低的感知影響因素也不同.
該研究考慮乘客屬性,并基于馬斯洛需求原理,從安全、快速、方便、舒適、滿意性等幾個(gè)方面,結(jié)合2019年4月交通辦公廳出臺(tái)的《城市軌道交通服務(wù)質(zhì)量評(píng)價(jià)規(guī)范》,提取服務(wù)水平影響指標(biāo),設(shè)計(jì)調(diào)查問(wèn)卷,并基于Rasch模型對(duì)問(wèn)卷結(jié)果進(jìn)行擬合,從而檢測(cè)問(wèn)卷質(zhì)量.
問(wèn)卷分為2部分來(lái)設(shè)計(jì):第1部分是乘客個(gè)人屬性調(diào)查,便于后續(xù)對(duì)乘客屬性分類的研究,從而使問(wèn)卷涵蓋各類屬性乘客,保證問(wèn)卷樣本的普適性.此部分共包含6個(gè)選擇題,收集被試乘客的性別、年齡、職業(yè)、乘坐軌道交通的目的、乘坐軌道交通的出行頻率、乘坐軌道交通的出行時(shí)間;第2部分對(duì)于乘客感知的軌道交通出行全過(guò)程中各個(gè)指標(biāo)重要性進(jìn)行提問(wèn),即將Rasch模型定距數(shù)據(jù)轉(zhuǎn)化的各個(gè)變量,并遵循科學(xué)性、簡(jiǎn)明性、客觀性、系統(tǒng)性和可操作性原則,從乘客進(jìn)出站、購(gòu)票安檢、檢票、樓/自動(dòng)扶梯及通道、候車、乘車、換乘出行全過(guò)程的9個(gè)環(huán)節(jié)設(shè)置37個(gè)指標(biāo)重要性問(wèn)題,力求最后使用的指標(biāo)可準(zhǔn)確反映最主要和較全面的信息.其中各指標(biāo)重要性統(tǒng)一采用李克特量表法5級(jí)式:非常重要、很重要、重要、不太重要、不重要,分別賦值為5、4、3、2、1,此份問(wèn)卷預(yù)計(jì)完成用時(shí)為2 min.最終問(wèn)卷的指標(biāo)重要性問(wèn)題設(shè)置如表1所示.
表1 城市軌道交通服務(wù)水平評(píng)價(jià)指標(biāo)重要性問(wèn)卷選項(xiàng)設(shè)置
該問(wèn)卷通過(guò)問(wèn)卷星平臺(tái)于2019-12-11—2020-02-30發(fā)布,共收回270份問(wèn)卷,剔除答題時(shí)間過(guò)短、不完整、答案為同一選項(xiàng)等無(wú)效問(wèn)卷,共得到218份有效問(wèn)卷.在本次乘客的218份有效調(diào)查問(wèn)卷中,乘客分別來(lái)自北京、河南、廣東、黑龍江、上海、山東等全國(guó)28省市,其中男女比例分別為60.29%、39.71%.職業(yè)包含學(xué)生、企事業(yè)單位工作人員、外來(lái)務(wù)工人員、自由職業(yè)者等,其中學(xué)生和企事業(yè)單位工作人員分別占總?cè)藬?shù)的50%、36.76%.乘客年齡在20~30歲最多,占總?cè)藬?shù)的71.57%.此外還對(duì)其出行目的、出行頻率、出行時(shí)間等狀況進(jìn)行了調(diào)查.出行頻率在每周2次以上占53.43%,說(shuō)明大部分乘客對(duì)軌道交通出行比較熟悉.乘客出行屬性和特征的調(diào)查,表明了問(wèn)卷覆蓋的調(diào)查對(duì)象的全面性,從而保證了問(wèn)卷數(shù)據(jù)的可分析性和有效性.
Rasch模型是丹麥數(shù)學(xué)家、教育學(xué)家G.Rasch在1960年提出來(lái)的、用來(lái)測(cè)量潛在特質(zhì)的一個(gè)概率模型,通過(guò)在試題上的作答狀況來(lái)測(cè)量問(wèn)卷的潛在變量或潛在特質(zhì).Rasch模型在二元計(jì)分選項(xiàng)中(即個(gè)體對(duì)特定題目回答是或否),被試者的能力、問(wèn)題項(xiàng)的難度以及被試者給出正確答案的可能性之間的關(guān)系可由式(1)來(lái)表示:
(1)
式中:Pni為個(gè)體n對(duì)特定題i答對(duì)的概率;βn為個(gè)體能力(即乘客熟悉指標(biāo)的能力);δi為項(xiàng)目難度(問(wèn)卷選項(xiàng)難度)
對(duì)于多元計(jì)分項(xiàng),個(gè)體n對(duì)題目i評(píng)分為j的概率由式(2)來(lái)表示:
(2)
式中:Pnij為個(gè)體n對(duì)特定題i評(píng)分為j的概率;Sij為評(píng)分量表上相鄰分?jǐn)?shù)段對(duì)應(yīng)的階梯難度(j相對(duì)于j-1).
常用的Rasch模型分析軟件有Winsteps、Facets和ConQuest,該研究采用軟件Winsteps V3.74.0.Rasch模型分析結(jié)果包括整體質(zhì)量檢測(cè)圖、項(xiàng)目難度氣泡圖、項(xiàng)目難度與被試能力關(guān)系懷特圖.其中特征量主要包括均方差MNSQ、標(biāo)準(zhǔn)均方差ZSTD,信度Reliability、分離度Separation、難度、被試者及試題分布.MNSQ和ZSTD能反映觀察到的響應(yīng)與模型期望之間的一致性程度,MNSQ包含未加權(quán)擬合均方差(Outfit MNSQ)和擬合加權(quán)均方差(Infit MNSQ),因?yàn)榍罢吒资艿絺€(gè)別異常數(shù)據(jù)的影響,一般以后者作為判斷個(gè)體是否與模型擬合的標(biāo)準(zhǔn)[9].理想擬合情況下的MNSQ值為1,ZSTD值為0.當(dāng)MNSQ值在0.5~1.5之間、ZSTD值在-2~2之間時(shí),表示數(shù)據(jù)和模型的預(yù)期擬合程度能接受.特征量信度Reliability是對(duì)試卷測(cè)試結(jié)果的可靠性、一致性、穩(wěn)定性的描述,如果信度大于0.70,說(shuō)明問(wèn)卷具有較高的可信度;分離度Separation是對(duì)試題難易區(qū)分度的表述,分離度越高,表示試題對(duì)不同被試水平的被試者區(qū)分度越高,如果分離度大于2,表示問(wèn)卷題項(xiàng)有較高的區(qū)分度[11],具體特征量含義及區(qū)間范圍如表2所示.
表2 Rasch模型分析特征量含義及可接受區(qū)間范圍
由于條件限制,使用的軟件試用版處理數(shù)據(jù)有限,故將問(wèn)卷的結(jié)果拆為兩組:進(jìn)出站、購(gòu)票、安檢、檢票以及樓梯通道這5個(gè)環(huán)節(jié)14個(gè)問(wèn)題項(xiàng)為第1組;候車、乘車、換乘、運(yùn)營(yíng)管理這4個(gè)環(huán)節(jié)13個(gè)問(wèn)題項(xiàng)為第2組.將得到的兩組待處理數(shù)據(jù)依次在Winsteps軟件中與Rasch模型進(jìn)行擬合[10].
首先對(duì)問(wèn)卷整體質(zhì)量進(jìn)行分析,圖1、圖2分別是第1組以及第2組對(duì)回收到的218組數(shù)據(jù)進(jìn)行整體質(zhì)量分析后得到的結(jié)果.結(jié)果分為2欄,上半部分為Person(被試即乘客)分析情況,下半部分為Item(項(xiàng)目即問(wèn)卷選項(xiàng))分析情況.圖1和2中可看到,第1、2組數(shù)據(jù)得到的Person Reliability(被試乘客整體信度)都為0.83,Item Reliability(項(xiàng)目整體信度)分別為0.94、0.92,兩者的數(shù)值在0~1的范圍內(nèi),且均大于0.70,說(shuō)明項(xiàng)目得到的數(shù)據(jù)可靠程度高.此外,兩組數(shù)據(jù)得到的Item Separation(項(xiàng)目分離度)分別為3.86、3.48,均大于分離度最低限標(biāo)準(zhǔn)2.00,顯示問(wèn)卷中的所有項(xiàng)目可對(duì)不同能力水平的被試對(duì)象即乘客具有很好的區(qū)分度,代表性比較強(qiáng).同時(shí),兩組數(shù)據(jù)的分析情況顯示項(xiàng)目與被試者的MNSQ(均方差)都接近理想值1,ZSTD(標(biāo)準(zhǔn)均方差)都接近0,說(shuō)明數(shù)據(jù)與模型擬合情況比較好.
圖1 第1組問(wèn)卷數(shù)據(jù)整體質(zhì)量檢測(cè)
圖2 第2組問(wèn)卷數(shù)據(jù)整體質(zhì)量檢測(cè)
項(xiàng)目難度可通過(guò)氣泡圖進(jìn)行可視化表達(dá).1個(gè)項(xiàng)目會(huì)生成1個(gè)氣泡,氣泡的大小反映了標(biāo)準(zhǔn)誤差的大小,即氣泡越大,說(shuō)明項(xiàng)目難度對(duì)于被試者能力的估計(jì)誤差越大;反之,說(shuō)明誤差越小.氣泡的位置代表了項(xiàng)目的標(biāo)準(zhǔn)殘差的均方(InfitMNSQ)參數(shù)大小.在理想狀態(tài)下,所有產(chǎn)生的氣泡都應(yīng)該接近中軸線,呈縱向線性分布.氣泡重合則說(shuō)明項(xiàng)目難度比較接近(圖3、圖4).
圖3 第1組數(shù)據(jù)氣泡圖
圖4 第2組數(shù)據(jù)氣泡圖
以上2幅圖中,氣泡大小相近,2組數(shù)據(jù)項(xiàng)目加權(quán)均方擬合統(tǒng)計(jì)量 (Infit MNSQ)值在0.5~1.5之間,項(xiàng)目難度在-2~2之間;數(shù)據(jù)與模型預(yù)期擬合程度可接受,說(shuō)明對(duì)服務(wù)水平的評(píng)價(jià)誤差接近.少量氣泡重合在一起,表明項(xiàng)目難易結(jié)合,設(shè)計(jì)較為合理,項(xiàng)目順序較為清晰,但是仍有改進(jìn)的空間.
Rasch模型將問(wèn)題項(xiàng)難度與被試者能力(這里指乘客對(duì)問(wèn)卷選項(xiàng)的熟悉度)水平放在同一量尺上,用Logit值反映問(wèn)題項(xiàng)難度和被試者能力水平.在懷特圖中Logit值從上到下依次減小,對(duì)應(yīng)表示題目難度的降低、被試能力水平降低.此外項(xiàng)目之間的距離表示項(xiàng)目難度水平的差異,距離越近,難度越接近.
從懷特圖中可直接觀察出不同能力水平的被試者及不同難度試題是否呈正態(tài)分布或近似正態(tài)分布,不需要對(duì)特定參數(shù)進(jìn)行數(shù)值分析,這也是Rasch模型比較直觀可視的優(yōu)勢(shì)[11].圖5(a)、(b)分別為第1組數(shù)據(jù)(前20項(xiàng)指標(biāo))與第2組數(shù)據(jù)(后17項(xiàng)指標(biāo))項(xiàng)目難度與被試乘客水平的關(guān)系.
圖5 兩組項(xiàng)目的懷特圖
在第1組數(shù)據(jù)中,乘客能力自5Logit橫跨到-0.3Logit,分布的寬度為5.3Logit,均值在1.5Logit處;指標(biāo)項(xiàng)目難度從1.4Logit橫跨到-0.8Logit,分布寬度為2.2Logit,均值在0點(diǎn)處.在第2組數(shù)據(jù)中,乘客能力自4.6Logit橫跨到-1.4Logit,分布的寬度為6Logit,均值在2Logit處;項(xiàng)目難度自1.4Logit橫跨到-1Logit,分布的寬度為2.4Logit,均值在0點(diǎn)處.在這兩組數(shù)據(jù)表示的指標(biāo)項(xiàng)目難度與乘客能力關(guān)系中,最難項(xiàng)目難度均為1.4Logit,皆低于平均乘客能力.同時(shí)2組數(shù)據(jù)中的指標(biāo)項(xiàng)目難度集中在平均值附近,且低于平均難度的指標(biāo)項(xiàng)目占大多數(shù),說(shuō)明此份問(wèn)卷對(duì)于被試乘客而言難度較低.
此外,從懷特圖中可以看到縱軸右側(cè)項(xiàng)目與項(xiàng)目之間有的距離較近,分布較為平均,說(shuō)明項(xiàng)目的難度水平存在差異,在對(duì)路網(wǎng)服務(wù)水平進(jìn)行評(píng)估時(shí)產(chǎn)生的誤差較小,且不論是乘客能力還是項(xiàng)目難度的分布大致都呈現(xiàn)正態(tài)分布,但是乘客能力較項(xiàng)目難度跨度更大,前者約為后者的2倍.說(shuō)明被試乘客可以較好地對(duì)軌道交通服務(wù)水平進(jìn)行評(píng)價(jià).
綜上,基于Rasch模型,利用Winsteps軟件,對(duì)基于乘客軌道交通出行全過(guò)程的服務(wù)水平評(píng)價(jià)問(wèn)卷設(shè)計(jì)的合理性進(jìn)行了分析檢測(cè),無(wú)論是問(wèn)卷整體質(zhì)量、指標(biāo)項(xiàng)目難度以及項(xiàng)目難度與被試乘客能力(即乘客對(duì)指標(biāo)熟悉度)的檢測(cè)結(jié)果都表明,問(wèn)卷數(shù)據(jù)與模型擬合效果較好,項(xiàng)目難度合理,在被試乘客能力下能對(duì)問(wèn)卷進(jìn)行合理評(píng)判,為問(wèn)卷結(jié)果進(jìn)行后續(xù)分析提供了科學(xué)依據(jù).
本研究通過(guò)對(duì)已有相關(guān)文獻(xiàn)、條例和理論的學(xué)習(xí)研究,并結(jié)合實(shí)際情況,分析乘客軌道交通服務(wù)水平評(píng)價(jià)的影響因素,提取出行全過(guò)程各環(huán)節(jié)評(píng)價(jià)指標(biāo),創(chuàng)建問(wèn)卷調(diào)查.并詳細(xì)介紹了Rasch模型原理,創(chuàng)新性地將Rasch模型運(yùn)用于軌道交通領(lǐng)域問(wèn)卷設(shè)計(jì)質(zhì)量分析,將收集到問(wèn)卷結(jié)果定序數(shù)據(jù)轉(zhuǎn)化為定距數(shù)據(jù),從問(wèn)卷整體質(zhì)量、項(xiàng)目難度以及項(xiàng)目難度與乘客能力的適配度3個(gè)方面分析評(píng)價(jià)此問(wèn)卷的優(yōu)劣,結(jié)果表明:該問(wèn)卷與Rasch模型擬合情況較好,項(xiàng)目難度適中,且與乘客能力相匹配,問(wèn)卷質(zhì)量較優(yōu),能達(dá)到問(wèn)卷調(diào)查目的.該問(wèn)卷質(zhì)量檢測(cè)方法成功地解決了傳統(tǒng)調(diào)查方法中項(xiàng)目難度與被試者水平估計(jì)之間相互影響的難題,使問(wèn)卷調(diào)查不再只依賴于分析工具和樣本結(jié)果本身[11],為軌道交通問(wèn)卷評(píng)估類問(wèn)題提供了新的分析方法.