• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Logistic回歸模型的高鐵客運(yùn)市場(chǎng)細(xì)分

      2018-03-30 00:44:56李彥瑾羅霞劉悅朱海
      關(guān)鍵詞:細(xì)分客運(yùn)旅客

      李彥瑾,羅霞,劉悅,朱海

      (西南交通大學(xué),交通運(yùn)輸與物流學(xué)院,成都 610031)

      0 引 言

      市場(chǎng)細(xì)分有助于運(yùn)輸企業(yè)快速高效地確定目標(biāo)市場(chǎng),對(duì)改善客運(yùn)產(chǎn)品、提高運(yùn)營(yíng)效益具有積極意義。自市場(chǎng)細(xì)分概念提出以來(lái),國(guó)內(nèi)外學(xué)者對(duì)其進(jìn)行了大量研究。國(guó)外研究方面,Tony指出目前市場(chǎng)細(xì)分的研究主要分為兩個(gè)方向:消費(fèi)者導(dǎo)向型與產(chǎn)品導(dǎo)向型[1]。Tsai則提出以消費(fèi)者的最近一次消費(fèi)時(shí)間、消費(fèi)頻率、消費(fèi)金額3個(gè)變量進(jìn)行細(xì)分并識(shí)別最有價(jià)值的客戶[2]。國(guó)內(nèi)鐵路市場(chǎng)研究方面,趙娟等基于市場(chǎng)細(xì)分理論,運(yùn)用因子和聚類(lèi)分析方法對(duì)京滬高鐵旅客調(diào)研數(shù)據(jù)進(jìn)行研究[3]。錢(qián)丙益等結(jié)合武廣客運(yùn)專(zhuān)線旅客問(wèn)卷調(diào)查數(shù)據(jù),采用混合回歸模型,將市場(chǎng)細(xì)分為效率型、經(jīng)濟(jì)型、休閑型、體驗(yàn)型4個(gè)細(xì)分市場(chǎng)[4]。

      從現(xiàn)有研究來(lái)看,目前國(guó)內(nèi)對(duì)鐵路市場(chǎng)細(xì)分的研究以產(chǎn)品為導(dǎo)向的細(xì)分方法為主,變量一般包括安全、速度、準(zhǔn)點(diǎn)和價(jià)格等,而從復(fù)雜的旅客出行特征角度出發(fā),利用概率分類(lèi)法進(jìn)行市場(chǎng)細(xì)分的精確研究仍然較少。

      在渝利鐵路開(kāi)通運(yùn)營(yíng)之后,為使其具備優(yōu)良的客運(yùn)管理水平以及競(jìng)爭(zhēng)實(shí)力,需要研究出一套科學(xué)的、可操作性強(qiáng)的客運(yùn)市場(chǎng)細(xì)分方法,準(zhǔn)確應(yīng)對(duì)市場(chǎng)需求,設(shè)計(jì)合理的渝利鐵路運(yùn)輸產(chǎn)品。因此,本文以渝利鐵路客運(yùn)市場(chǎng)為實(shí)際案例,根據(jù)旅客出行行為特征,選取Logistic智能分類(lèi)算法對(duì)渝利鐵路客運(yùn)市場(chǎng)進(jìn)行細(xì)分,并對(duì)各細(xì)分市場(chǎng)的旅客特征進(jìn)行歸納總結(jié),具有一定的應(yīng)用意義。

      1 調(diào)查概述

      本次旅客出行調(diào)查分為預(yù)調(diào)查和正式調(diào)查兩個(gè)階段。預(yù)調(diào)查于2015年9月5日在重慶北站候車(chē)大廳進(jìn)行,受訪者為高鐵乘客和動(dòng)車(chē)組乘客,設(shè)計(jì)并采用了RP/SP組合的調(diào)查問(wèn)卷。正式調(diào)查于2015年9月12日在重慶北站候車(chē)大廳和重慶—利川涼霧站方向的渝利高鐵列車(chē)上進(jìn)行,并針對(duì)預(yù)調(diào)查存在的問(wèn)題對(duì)問(wèn)卷進(jìn)行了改進(jìn)。

      本次調(diào)研包含2個(gè)工作日和1個(gè)休息日,涉及重慶北站、復(fù)盛站、長(zhǎng)壽北站、涪陵北站、豐都站、沙子站和涼霧站7個(gè)車(chē)站。其中預(yù)調(diào)查在1個(gè)工作日內(nèi)進(jìn)行,正式調(diào)查分為1個(gè)工作日與1個(gè)休息日兩個(gè)階段進(jìn)行。

      選擇1個(gè)工作日(星期三)進(jìn)行前期預(yù)調(diào)查,回收與處理問(wèn)卷1 492份。各車(chē)站回收問(wèn)卷數(shù)量如圖1所示。由圖1可以看出,各個(gè)車(chē)站的受訪者數(shù)量分布并不均勻,利川站的受訪比重過(guò)多。這將影響我們對(duì)調(diào)查結(jié)果的分析處理,因此本文通過(guò)優(yōu)化問(wèn)卷結(jié)構(gòu)、簡(jiǎn)化問(wèn)題設(shè)置并選擇另一個(gè)工作日(星期二)開(kāi)始進(jìn)行正式調(diào)查。

      圖1 工作日內(nèi)預(yù)調(diào)查各站點(diǎn)回收問(wèn)卷數(shù)量Fig.1 Number of questionnaires collected at each station during weekdays

      正式調(diào)查采用改進(jìn)后的調(diào)查問(wèn)卷,回收與處理問(wèn)卷1 298份。由圖2可得,雖然各車(chē)站回收問(wèn)卷數(shù)量較改進(jìn)前更均勻,但利川站的回收份數(shù)依然是最高的。這表明可能有其他因素影響調(diào)查結(jié)果。因此,選擇1個(gè)休息日(星期六)再次進(jìn)行正式調(diào)查,以此來(lái)判斷調(diào)查時(shí)間因素是否會(huì)對(duì)調(diào)查結(jié)果產(chǎn)生重要影響。

      圖2 工作日內(nèi)正式調(diào)查各站點(diǎn)回收問(wèn)卷數(shù)量Fig.2 Number of valid questionnaires during weekdays

      在1個(gè)休息日進(jìn)行正式調(diào)查,回收與處理問(wèn)卷1 374份,各車(chē)站回收的問(wèn)卷數(shù)量如圖3所示。由圖3可得,在休息日內(nèi)各站點(diǎn)回收數(shù)量基本均勻,表明調(diào)查時(shí)間確實(shí)為影響調(diào)查結(jié)果的主要因素。

      圖3 休息日內(nèi)正式調(diào)查各站點(diǎn)回收問(wèn)卷數(shù)量Fig.3 Number of valid questionnaires during weekend

      因此,本文采用分層抽樣的方法,分車(chē)次隨機(jī)選取旅客進(jìn)行面對(duì)面問(wèn)卷調(diào)查,內(nèi)容包括年齡、職業(yè)、月收入、出行目的等旅客出行特征共計(jì)6個(gè)屬性。然后,分別選擇兩個(gè)數(shù)據(jù)集統(tǒng)計(jì)、處理來(lái)自工作日(星期二)與休息日(星期六)的調(diào)查數(shù)據(jù)。正式調(diào)查共回收4 890份調(diào)查問(wèn)卷,篩選除去信息殘缺的調(diào)查問(wèn)卷,得到4 164份有效問(wèn)卷。

      2 建模與算法

      Logistic回歸分類(lèi)作為概率分類(lèi)法的常見(jiàn)類(lèi)型,其分類(lèi)標(biāo)準(zhǔn)為使后驗(yàn)概率達(dá)到最大。通過(guò)這樣的分類(lèi)方法,可以在樣本數(shù)據(jù)可信度較低的時(shí)候不進(jìn)行強(qiáng)制分類(lèi),排除樣本中的“噪聲”干擾,從而避免分類(lèi)錯(cuò)誤。另外,這種基于概率的模式分類(lèi)算法還能夠?qū)Χ喾N屬性的樣本分類(lèi)問(wèn)題得到一個(gè)較顯著的分類(lèi)結(jié)果[5]。因此,本文選用Logistic回歸分類(lèi)進(jìn)行市場(chǎng)細(xì)分。

      2.1 基本原理

      假設(shè)渝利鐵路旅客市場(chǎng)上存在N個(gè)旅客,第n(n=1,2,3,…,4 164)個(gè)旅客對(duì)樣本中第i個(gè)屬性xi(i=1,2,3,…,6)的評(píng)價(jià)為xni,對(duì)產(chǎn)品的總體評(píng)價(jià)為yn。假設(shè)存在c個(gè)細(xì)分市場(chǎng),每個(gè)細(xì)分市場(chǎng)在整個(gè)客運(yùn)市場(chǎng)的占比分別為θ1,θ2,…,θc,滿足(即滿足概率總和為1的約束條件)。

      根據(jù)Logistic回歸,使用線性對(duì)數(shù)函數(shù)對(duì)分類(lèi)后驗(yàn)概率q(yj|xi)進(jìn)行模型化:

      式中,q(yj|xi;θ)為第i(i=1,2,3,…,6)個(gè)屬性xi影響第j(j=1,2,3,…,n)個(gè)總體評(píng)價(jià)樣本yj的概率,θ為待優(yōu)化參數(shù),表示分類(lèi)后的各個(gè)子市場(chǎng)比例;φj(x)為第j個(gè)樣本中各個(gè)屬性x的具體取值。

      2.2 模型求解

      利用對(duì)數(shù)最大似然函數(shù)法求解Logistic回歸分類(lèi)模型。其中,似然函數(shù)是將當(dāng)前樣本,i=1,2,…,6由式(1)分類(lèi)的概率看作是一個(gè)關(guān)于參數(shù)θ的函數(shù),而對(duì)數(shù)似然函數(shù)是指其對(duì)數(shù)。于是,作如下變換:似然→對(duì)數(shù)似然

      因此,可將該分類(lèi)問(wèn)題等價(jià)為下式的最優(yōu)化問(wèn)題來(lái)定義:

      上述目標(biāo)效用函數(shù)Q對(duì)于參數(shù)θ是可以微分的,故可利用概率梯度法來(lái)求解最大似然估計(jì)問(wèn)題的解,具體算法如下:

      ①給定θ以適當(dāng)?shù)爻踔?,本文?.25(假定初始有4個(gè)子市場(chǎng),所占市場(chǎng)份額均等為0.25),收斂精度η=0.01;

      ② 將隨機(jī)抽樣的有效樣本導(dǎo)入(xi,yj),i=1,2,3,…,6,j=1,2,3,…,4164;

      ③ 對(duì)于選定的訓(xùn)練樣本,以梯度上升的方向?qū)?shù)θ=(θ(1)T,…,θ(c)T)T,c=1,2,3,4按下式進(jìn)行更新:

      此處,ε為表示梯度上升幅度的正常數(shù),取0.001。?yJj(θ)是指順序?yàn)閖的訓(xùn)練樣本所對(duì)應(yīng)的對(duì)數(shù)似然函數(shù)Jj(θ)=logq(yj|xi;θ)關(guān)于θ(y)的梯度上升方向。

      2.3 求解結(jié)果

      本文將隨機(jī)抽樣獲取的4 164份有效調(diào)查問(wèn)卷,通過(guò)將問(wèn)卷中各個(gè)問(wèn)題選項(xiàng)進(jìn)行數(shù)據(jù)預(yù)處理并導(dǎo)入matlab中,采取Logistic回歸法進(jìn)行市場(chǎng)細(xì)分,再利用概率梯度算法進(jìn)行求解,得出算法收斂圖與市場(chǎng)細(xì)分圖如圖4、圖5所示。

      圖4 模型求解算法收斂圖Fig.4 Model convergence

      圖5 按旅客出行目的屬性維度方向投影的市場(chǎng)細(xì)分圖Fig.5 Market segments by trip purpose

      由圖4可以看出:算法初始階段在各個(gè)方向搜索最優(yōu)梯度,當(dāng)?shù)?2次時(shí)獲得可行的梯度方向并朝著效用函數(shù)值增大的方向收斂;當(dāng)運(yùn)行至第37次時(shí)開(kāi)始平穩(wěn),并在迭代第46次時(shí)獲得平穩(wěn)解,此時(shí)效用函數(shù)值為0.988。最后該平穩(wěn)解滿足收斂精度要求,從而終止算法將效用值歸0。

      由圖5可以看出:Logistic回歸分類(lèi)法最終將容量為4 164的調(diào)查數(shù)據(jù)樣本分為了3類(lèi),且絕大部分樣本細(xì)分后的效用函數(shù)值在0.932以上并在0.988左右到達(dá)穩(wěn)定極值點(diǎn),反映出客運(yùn)市場(chǎng)細(xì)分效果較好。

      3 子市場(chǎng)描述

      將分類(lèi)后其效用函數(shù)值分布于[0.932,0.992]區(qū)間的樣本數(shù)據(jù)進(jìn)行提取與計(jì)數(shù),可以得到細(xì)分后三個(gè)子市場(chǎng)的樣本容量大小,分別為:子市場(chǎng)1(1 822)、子市場(chǎng)2(891)、子市場(chǎng)3(1 134)。其余樣本數(shù)據(jù)經(jīng)分類(lèi)后,未分布在效用顯著區(qū)間,故不予統(tǒng)計(jì)。

      3.1 聚類(lèi)中心識(shí)別

      分別搜索各個(gè)子市場(chǎng)的類(lèi)中心,并以類(lèi)中心為圓心按子市場(chǎng)容量的55%為半徑,選擇各個(gè)子類(lèi)的代表性樣本數(shù)據(jù),如圖6所示。

      圖6 按代表性樣本數(shù)據(jù)的市場(chǎng)細(xì)分Fig.6 Clusters of the sub-markets

      3.2 子市場(chǎng)劃分

      將提取出的代表性樣本數(shù)據(jù)按出行目的進(jìn)行歸納,可總結(jié)為:外出務(wù)工型(子市場(chǎng)1)、非經(jīng)濟(jì)出行型(子市場(chǎng)2)、商務(wù)出行型(子市場(chǎng)3)。并按照年齡、月收入和職業(yè)3個(gè)旅客特征指標(biāo)進(jìn)行統(tǒng)計(jì)分析,分別對(duì)每個(gè)子市場(chǎng)進(jìn)行細(xì)分,得到經(jīng)濟(jì)實(shí)惠、中堅(jiān)力量和出行品質(zhì)注重三個(gè)子群體。故建立子市場(chǎng)細(xì)分模型,如表1所示。

      表1 子市場(chǎng)旅客容量統(tǒng)計(jì)表Tab.1 Population statistics of the submarkets

      3.3 子市場(chǎng)合并與描述

      由于需求模式最終反映為出行行為模式,同時(shí)為了便于進(jìn)行產(chǎn)品設(shè)計(jì),需要對(duì)市場(chǎng)采取一定的規(guī)則進(jìn)行合并,使之更貼合實(shí)際生產(chǎn)運(yùn)營(yíng)的需要。其中,合并規(guī)則包括以下兩個(gè)方面:①將市場(chǎng)容量明顯偏小的子市場(chǎng)合并;②合并性質(zhì)類(lèi)似的市場(chǎng)。故合并完成后的市場(chǎng)細(xì)分如表2所示。

      由此可見(jiàn),客運(yùn)市場(chǎng)被細(xì)分為如表3所示的A-E共計(jì)5個(gè)子市場(chǎng),且各個(gè)子市場(chǎng)具有顯著的差異化特征。

      表2 合并后子市場(chǎng)旅客容量統(tǒng)計(jì)Tab.2 Population statistics of regrouped submarkets

      表3 合并后子市場(chǎng)特征描述表Tab.3 Descriptive statistics of the regrouped submarkets

      4 結(jié) 論

      針對(duì)市場(chǎng)細(xì)分的旅客特征分析,本文得出如下結(jié)論:

      (1)利用Logistic回歸分類(lèi)法對(duì)隨機(jī)抽樣樣本數(shù)據(jù)分類(lèi)處理,可在較少迭代次數(shù)內(nèi)得到平穩(wěn)解,利用出行目的維度投影得到的二維圖,表明該方法分類(lèi)效果比較顯著。

      (2)通過(guò)對(duì)子市場(chǎng)的合并,發(fā)現(xiàn)在各個(gè)子市場(chǎng)內(nèi)旅客的年齡、月收入與出行目的是進(jìn)行高鐵客運(yùn)市場(chǎng)細(xì)分和市場(chǎng)特征描述的顯著影響指標(biāo)。

      (3)如何根據(jù)分析結(jié)果,對(duì)各細(xì)分市場(chǎng)的需求進(jìn)行預(yù)測(cè),并進(jìn)而制定科學(xué)的產(chǎn)品定價(jià)實(shí)現(xiàn)高鐵運(yùn)營(yíng)收益最大化,將是下一步的研究方向。

      [1] LUNN T. Segmenting and constructing markets[A].Robert Worcester and John Downham. Consumer market research handbook,Third revised and enlarged edition[C].Elsevier Science Pulishers B. V. ,1986,387-423.

      [2] TSAI C Y,CHIU C C. A purchase-based market segmentation methodology[J]. Expert Systems with Applications,2004,27(2):265-276.

      [3] 趙娟,任民. 京滬高鐵客運(yùn)市場(chǎng)細(xì)分與客票營(yíng)銷(xiāo)策略研究[J]. 鐵道經(jīng)濟(jì)研究,2014(6):13-17.

      [4] 錢(qián)丙益,帥斌,陳崇雙,等. 基于混合回歸模型的客運(yùn)專(zhuān)線旅客市場(chǎng)細(xì)分研究[J]. 鐵道運(yùn)輸與經(jīng)濟(jì),2014,36(1):60-65.

      [5] TITTERINGTON D M,SMITH A F M,MAKOV U E.Statistical analysis of finite mixture distributions[M].New York:Wilcy,1985.

      猜你喜歡
      細(xì)分客運(yùn)旅客
      非常旅客意見(jiàn)簿
      客運(yùn)索道設(shè)備運(yùn)行初期的管理與創(chuàng)新
      深耕環(huán)保細(xì)分領(lǐng)域,維爾利為環(huán)保注入新動(dòng)力
      我是人
      故事大王(2018年3期)2018-05-03 09:55:52
      大數(shù)據(jù)在鐵路站段客運(yùn)市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用探討
      提高客運(yùn)駕駛?cè)税踩庾R(shí)
      給小旅客的禮物
      空中之家(2016年1期)2016-05-17 04:47:43
      臺(tái)灣客運(yùn)業(yè):高鐵躲過(guò)破產(chǎn)危機(jī)?
      1~7月,我國(guó)貨車(chē)各細(xì)分市場(chǎng)均有增長(zhǎng)
      整體低迷難掩細(xì)分市場(chǎng)亮點(diǎn)
      竹北市| 肥城市| 台湾省| 石城县| 无锡市| 常州市| 正蓝旗| 黔江区| 东宁县| 吴桥县| 澜沧| 客服| 遵义市| 中山市| 沾化县| 南靖县| 建阳市| 永清县| 福清市| 深水埗区| 山东省| 班玛县| 虞城县| 涪陵区| 偃师市| 泰安市| 昌平区| 阳新县| 土默特右旗| 安平县| 浮山县| 凤翔县| 临颍县| 淅川县| 东宁县| 义乌市| 抚顺县| 临城县| 石家庄市| 大冶市| 临安市|