• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Map/Reduce的民航高價(jià)值旅客發(fā)現(xiàn)方法

      2015-05-04 08:07:20曹衛(wèi)東聶笑盈
      關(guān)鍵詞:航空公司均值旅客

      曹衛(wèi)東,白 亮,聶笑盈

      (1.中國民航大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津300300;2.中國民航信息技術(shù)科研基地,天津300300)

      0 引 言

      隨著民航信息化程度日益加深,各航空公司的訂票系統(tǒng)中都積累了大量的旅客訂座記錄 (passenger name record,PNR)數(shù)據(jù)信息[1]。面對(duì)這些寶貴的數(shù)據(jù)資源,很多航空公司并沒有進(jìn)行有效地?cái)?shù)據(jù)挖掘與數(shù)據(jù)分析。目前,航空公司都推出了常旅客計(jì)劃,但是,常旅客計(jì)劃只是根據(jù)飛行里程來發(fā)展VIP客戶,并通過積分兌換來提高客戶對(duì)本公司的忠誠度。顯然,根據(jù)飛行里程這一單一的數(shù)據(jù)指標(biāo)并不能準(zhǔn)確有效地識(shí)別高價(jià)值旅客。同一旅客可能是多家航空公司的VIP會(huì)員,由此可見,常旅客計(jì)劃并不能對(duì)旅客出行形成有效的吸引力。在激烈的市場(chǎng)競(jìng)爭(zhēng)中,如何運(yùn)用非常旅客的PNR數(shù)據(jù),快速準(zhǔn)確地識(shí)別高價(jià)值旅客,并結(jié)合有限的資源,在短期內(nèi)創(chuàng)造更大效益,是航空公司亟需解決的問題。

      高價(jià)值旅客經(jīng)常是因?yàn)楣ぷ餍枰x擇航空旅行,對(duì)時(shí)間、飛行服務(wù)、機(jī)艙環(huán)境等要求較高,對(duì)價(jià)格方面的優(yōu)惠往往并不看重。因此,高價(jià)值旅客的一個(gè)簡(jiǎn)單定義[2]即為:經(jīng)常選擇航空旅行,且訂票艙位等級(jí)較高的那部分客戶為高價(jià)值旅客。高價(jià)值旅客在一段時(shí)間內(nèi)選擇的航線往往比較固定,所以,在某條具體航線上對(duì)旅客短期價(jià)值進(jìn)行分析研究,將高價(jià)值旅客挖掘出來,并在他們?cè)俅卧谀硹l具體航行上出行之前,對(duì)其進(jìn)行一些針對(duì)性的推送服務(wù),以吸引他們乘坐本航空公司的航班,對(duì)航空公司來說,無疑會(huì)有很大幫助。

      目前,在挖掘航空公司高價(jià)值客戶方面,國內(nèi)大多數(shù)的研究都是在數(shù)據(jù)量較小的常旅客數(shù)據(jù)集進(jìn)行挖掘。對(duì)于挖掘結(jié)果,往往需要航空公司進(jìn)行長期投入,資源利用率很低。而航空公司寶貴的PNR數(shù)據(jù)集雖然十分具有挖掘潛力,但由于其數(shù)據(jù)量太大,使用常規(guī)方法很難處理[3]。目前較為先進(jìn)的 Map/Reduce作為一個(gè)可以將計(jì)算機(jī)進(jìn)行集群,并行處理計(jì)算任務(wù)的數(shù)據(jù)處理模型,處理海量數(shù)據(jù)資源快速準(zhǔn)確。因此,本文提出一種基于 Map/Reduce的民航高價(jià)值旅客發(fā)現(xiàn)方法。首先,對(duì)于海量的PNR數(shù)據(jù)資源,采用Hadoop分布式處理方式,利用Map/Reduce數(shù)據(jù)處理模型[4],快速有效地進(jìn)行過濾,篩選及預(yù)處理。根據(jù)改進(jìn)的RFD客戶價(jià)值模型,對(duì)客戶價(jià)值指標(biāo)進(jìn)行變換與確定,再利用AHP層次分析法,根據(jù)專家經(jīng)驗(yàn)值,確定各指標(biāo)權(quán)重。然后,根據(jù)客戶價(jià)值指標(biāo)與權(quán)重計(jì)算客戶價(jià)值,運(yùn)用優(yōu)化的K-Means聚類算法對(duì)經(jīng)過處理的數(shù)據(jù)集進(jìn)行聚類,并將聚類結(jié)果與數(shù)據(jù)集均值進(jìn)行比較,對(duì)旅客價(jià)值進(jìn)行識(shí)別,從而發(fā)現(xiàn)高價(jià)值旅客,并對(duì)客戶群特點(diǎn)進(jìn)行分析。最后,采用真實(shí)的PNR數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的方法準(zhǔn)確有效,能夠快速地識(shí)別出航空公司高價(jià)值旅客,從而為航空公司短期內(nèi)集中有限資源做出有效決策,并對(duì)高價(jià)值客戶進(jìn)行更優(yōu)質(zhì)的推送服務(wù)提供有利支持。

      1 Map/Reduce與客戶價(jià)值指標(biāo)及權(quán)重的確定

      1.1 Map/Reduce

      Hadoop是Apache軟件基金會(huì)開發(fā)的一個(gè)開源計(jì)算平臺(tái),它以Map/Reduce編程框架為核心,為用戶提供了底層細(xì)節(jié)透明的分布式基礎(chǔ)架構(gòu)。Map/Reduce作為Google公司的核心計(jì)算模型,可以對(duì)不同的計(jì)算任務(wù)進(jìn)行高效地調(diào)度以及準(zhǔn)確地計(jì)算。它將計(jì)算機(jī)集群上運(yùn)行的并行計(jì)算過程高度地抽象為了兩個(gè)函數(shù):Map函數(shù)和Reduce函數(shù)。Map函數(shù)接收一個(gè)形如<key,value>的輸入,產(chǎn)生一個(gè)形如<key,value-list>的中間輸出,所有具有相同key值的value值形成一個(gè)集合被傳遞給Reduce函數(shù),Reduce函數(shù)接收一個(gè)形如<key,value>的輸入,然后將這個(gè)value值集合打開并對(duì)里面的value值進(jìn)行處理。最后,Reduce函數(shù)產(chǎn)生一個(gè)形如<key,value>的輸出作為處理結(jié)果。由于擁有Map/Reduce這一高效的任務(wù)調(diào)度模型,所以Hadoop允許用戶在不了解分布式系統(tǒng)底層細(xì)節(jié)的情況下開發(fā)并行應(yīng)用程序,并組織計(jì)算機(jī)資源,搭建自己的分布式計(jì)算平臺(tái),充分利用集群的計(jì)算威力完成海量資源的處理[5,6]。

      Map/Reduce運(yùn)行機(jī)制如圖1所示。

      圖1 Map/Reduce運(yùn)行機(jī)制

      1.2 客戶價(jià)值指標(biāo)的確定

      在客戶關(guān)系管理中,RFM模型是衡量客戶價(jià)值的一種經(jīng)典模型。它有如下3種客戶價(jià)值指標(biāo):Recency(最近消費(fèi)時(shí)間),F(xiàn)requency(消費(fèi)頻率),Monetary(消費(fèi)金額)。Goodman等提出根據(jù)RFM模型將企業(yè)有限的資源應(yīng)用到高價(jià)值客戶身上,提高資源的使用效率。Hughes等通過RFM模型將客戶分為五類,并針對(duì)五類客戶采取不同的銷售策略。但是,鑒于航空公司的行業(yè)特殊性,傳統(tǒng)的RFM模型并不完全適合航空公司的旅客價(jià)值分析。所以,本研究對(duì)RFM這3個(gè)指標(biāo)作如下改進(jìn),并利用改進(jìn)的RFD模型對(duì)航空公司高價(jià)值旅客進(jìn)行數(shù)據(jù)分析[7,8]。

      R:旅客最近一次乘坐該航空公司某條航線的航班日期與統(tǒng)計(jì)日期的距離天數(shù);

      F:旅客在一段時(shí)間內(nèi)乘坐該航空公司某條航線的航班累計(jì)次數(shù);

      D:旅客在一段時(shí)間內(nèi)乘坐該航空公司某條航線的航班平均折扣;

      1.3 客戶價(jià)值指標(biāo)權(quán)重的確定

      層次分析法 (analytic hierarchy process,AHP)是一種將定性分析與定量分析相結(jié)合,對(duì)較為模糊或較為復(fù)雜的決策問題做出決策的方法,由匹茲堡大學(xué)的A.L.Saaty教授于1980年提出。它將專家的經(jīng)驗(yàn)和判斷量化為具體數(shù)值,展現(xiàn)了思維決策的發(fā)展過程及基本特征,具有簡(jiǎn)單成熟、思路清晰、系統(tǒng)性強(qiáng)等優(yōu)點(diǎn)。因此,使用AHP層次分析法確定客戶價(jià)值分析中各個(gè)指標(biāo)的權(quán)重。

      層次分析法計(jì)算權(quán)重的具體步驟請(qǐng)參見文獻(xiàn) [9-11]。

      2 基于優(yōu)化初始聚類中心的K-Means聚類算法的聚類分析

      2.1 數(shù)據(jù)標(biāo)準(zhǔn)化

      不同的客戶價(jià)值指標(biāo)具有不同的數(shù)量級(jí),如果數(shù)量級(jí)相差很大會(huì)使得3個(gè)因素對(duì)目標(biāo)值的影響嚴(yán)重不平衡。為了消除這種分布失衡及數(shù)量級(jí)不同產(chǎn)生的影響,在進(jìn)行聚類分析之前,數(shù)據(jù)集需要經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化處理。在本次研究中,采用的方法是對(duì)數(shù)據(jù)集進(jìn)行轉(zhuǎn)換,使數(shù)據(jù)集中的全部數(shù)據(jù)取值在0~1之間[12]。

      設(shè)X為R,F(xiàn)或D變量,XL為數(shù)據(jù)集中R,F(xiàn)或D變量的最大值,XS為數(shù)據(jù)集中R,F(xiàn)或D變量的最小值,X′為標(biāo)準(zhǔn)化后的X變量。

      對(duì)于R變量,它的值越大,旅客價(jià)值越小,所以R變量對(duì)旅客價(jià)值有負(fù)面影響,是負(fù)相關(guān)指標(biāo)。因此,用式(1)對(duì)其進(jìn)行標(biāo)準(zhǔn)化

      對(duì)于F和D兩個(gè)變量,它們的值越大,旅客價(jià)值越大,所以F和M兩個(gè)變量對(duì)旅客價(jià)值有正面影響,是正相關(guān)指標(biāo)。因此,用式 (2)對(duì)其進(jìn)行標(biāo)準(zhǔn)化

      2.2 優(yōu)化初始聚類中心的K-Means聚類算法

      K均值聚類算法是比較經(jīng)典和成熟的聚類算法,該算法的最大特點(diǎn)就是能夠使簇內(nèi)的數(shù)據(jù)具有較高的相似度,而簇間的數(shù)據(jù)則相似度較低。而且,K均值聚類算法還具有計(jì)算量小,收斂速度快等優(yōu)點(diǎn),在處理大數(shù)據(jù)集時(shí),與其它聚類算法相比,占用的內(nèi)存空間和計(jì)算時(shí)間較?。?2,13]。K均值聚類算法的具體應(yīng)用步驟如下:

      (1)輸入數(shù)據(jù)個(gè)數(shù)為N的數(shù)據(jù)集,并指定簇的數(shù)目K。令I(lǐng)=1,選取其中的k個(gè)點(diǎn)作為初始聚類中心Zj(I),j=1,2,3,…,k;

      (2)計(jì)算數(shù)據(jù)集中每個(gè)數(shù)據(jù)與k個(gè)初始聚類中心的距離D(xi,Zj(I)),i=1,2,3,…,n;j=1,2,3,…,k,若滿足D(xi,Zm(I))= min{D(xi,Zj(I)),j=1,2,3,…,k},則將xi歸入第m類;

      (3)根據(jù)式 (3)計(jì)算誤差平方和準(zhǔn)則函數(shù)Jc并判斷若|Jc(I)-Jc(I-1)|<ξ

      則算法結(jié)束;否則令I(lǐng)=I+1,根據(jù)式 (4)計(jì)算k個(gè)新的聚類中心,并返回 (2)步

      但是,數(shù)據(jù)集中必然會(huì)出現(xiàn)孤立點(diǎn),即少數(shù)一些數(shù)據(jù)點(diǎn)遠(yuǎn)離數(shù)據(jù)密集區(qū)的情況,由于初始聚類中心是隨機(jī)選取的,那么就有可能會(huì)將孤立點(diǎn)選為初始聚類中心,這樣會(huì)對(duì)聚類結(jié)果產(chǎn)生很大的影響。因此,這里對(duì)經(jīng)典K-Means聚類算法進(jìn)行改進(jìn),首先根據(jù)距離和的思想排除孤立點(diǎn),然后對(duì)初始聚類中心的選擇進(jìn)行優(yōu)化,之后再對(duì)數(shù)據(jù)集聚類,而孤立點(diǎn)在聚類算法之后單獨(dú)聚類[14]。

      根據(jù)距離和的思想,通過計(jì)算數(shù)據(jù)集中各個(gè)對(duì)象之間的距離,列出距離和矩陣 (見表1,其中:d(i,j)為歐式距離;D(i,j)為距離和;d=sqrt ((x2-x1)2+ (y2-y1)2+……+ (z2-z1)2);)篩選掉與其它數(shù)據(jù)距離之和最大的那些點(diǎn),根據(jù)要求的準(zhǔn)確度,篩選掉一定比例的數(shù)據(jù)對(duì)象,使孤立點(diǎn)不在初始聚類中心的選擇范圍之內(nèi),從而避免影響最終的聚類結(jié)果。

      表1 距離和矩陣

      在刪除一定比例的孤立點(diǎn)之后,將剩余的數(shù)據(jù)對(duì)象再次做出距離和矩陣,以找到距離最大的兩個(gè)點(diǎn)。本次研究所用數(shù)據(jù)集為三維數(shù)據(jù),這里將兩點(diǎn)連成線段,以線段中心為球心,以線段為直徑畫球。再以線段中心為球心,以線段的一半為直徑畫內(nèi)球。根據(jù)球心作三維直角坐標(biāo)系,在8個(gè)象限中分別取內(nèi)球每個(gè)弧面上的中心點(diǎn)作為初始聚類中心。選定初始聚類中心之后,根據(jù)經(jīng)典K-Means聚類算法進(jìn)行聚類。最后,計(jì)算各孤立點(diǎn)與聚類中心的距離,并進(jìn)行歸類。

      3 實(shí)驗(yàn)分析

      3.1 數(shù)據(jù)預(yù)處理

      在本次研究過程中,采用某信息公司提供的國內(nèi)旅客2010年1月1日至2011年2月28日的PNR數(shù)據(jù)集進(jìn)行分析研究,該數(shù)據(jù)集大小為48.6G,利用5臺(tái)PC機(jī)進(jìn)行集群處理,處理時(shí)間約為4個(gè)小時(shí)。設(shè)統(tǒng)計(jì)日期為2011年1月1日,則R變量所代表的距離天數(shù)為統(tǒng)計(jì)日期與客戶最近一次乘機(jī)的日期所相差的天數(shù)。對(duì)于實(shí)驗(yàn)所采用的大數(shù)據(jù)集,首先利用 Map/Reduce數(shù)據(jù)處理模型,對(duì)具有相同旅客ID和航線的PNR數(shù)據(jù)進(jìn)行計(jì)算:

      (1)對(duì)起飛日期取最大值;

      (2)統(tǒng)計(jì)具有相同客戶ID和航線的PNR數(shù)據(jù)個(gè)數(shù);

      (3)對(duì)航班折扣取平均值;

      因?yàn)樽R(shí)別高價(jià)值旅客的3個(gè)基本條件為經(jīng)常出行,選擇艙位等級(jí)較高且短期內(nèi)仍有出行記錄。所以,出行次數(shù)較少,選擇低折扣出行或短期內(nèi)沒有出行記錄的旅客不在研究范圍之內(nèi)。因此,過濾掉不符合以下3個(gè)條件的數(shù)據(jù):

      (1)2010年內(nèi)出行次數(shù)大于等于4次;

      (2)平均出行折扣大于等于4折;

      (3)最近60天內(nèi)有過出行記錄;

      經(jīng)過處理的PNR數(shù)據(jù)集見表2。

      表2 經(jīng)過處理的PNR數(shù)據(jù)集

      3.2 確定權(quán)重

      在確定航空公司客戶價(jià)值指標(biāo)時(shí),邀請(qǐng)多位民航領(lǐng)域內(nèi)經(jīng)驗(yàn)豐富的專家參與,采用問卷調(diào)查的方式并運(yùn)用AHP層次分析法,對(duì)客戶價(jià)值指標(biāo)的相對(duì)重要性進(jìn)行了分析。

      首先,讓每位專家使用9級(jí)標(biāo)度法兩兩比較3個(gè)客戶價(jià)值指標(biāo)的相對(duì)重要性,并做出判斷矩陣。然后,對(duì)這些判斷矩陣做出一致性檢驗(yàn),有8個(gè)判斷矩陣滿足一致性要求,這8個(gè)判斷矩陣為有效判斷矩陣。最后,對(duì)每個(gè)有效判斷矩陣的權(quán)重進(jìn)行計(jì)算,并對(duì)結(jié)果取算術(shù)平均值,即得到各個(gè)客戶價(jià)值指標(biāo)的最終權(quán)重[15]。判斷結(jié)果為:wR=0.1036,wF=0.3705,wD=0.5259。結(jié)果顯示,D變量的權(quán)重最大??梢钥闯觯瑢<覀円恢抡J(rèn)為影響旅客價(jià)值大小的最重要因素是旅客的航班平均折扣。

      數(shù)據(jù)處理如圖2所示。

      圖2 數(shù)據(jù)處理

      3.3 利用優(yōu)化初始聚類中心的K-Means聚類算法進(jìn)行聚類分析

      為使實(shí)例分析更具代表性,在本次聚類分析中,選擇某航空公司的北京-上海這條黃金航線上的PNR數(shù)據(jù)集作為研究對(duì)象。

      在進(jìn)行聚類分析之前,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。然后,根據(jù)判斷出的客戶價(jià)值指標(biāo)的權(quán)重以及標(biāo)準(zhǔn)化后的PNR數(shù)據(jù),利用式 (5)計(jì)算每個(gè)旅客的客戶價(jià)值

      式中:VR,VF,VD——客戶價(jià)值指標(biāo)R,F(xiàn),D標(biāo)準(zhǔn)化后的值。

      根據(jù)距離天數(shù),出行次數(shù),平均出行折扣這3個(gè)客戶價(jià)值指標(biāo),利用優(yōu)化初始聚類中心的K-Means聚類算法進(jìn)行聚類分析。該聚類算法必須事先給定聚類結(jié)果中簇的數(shù)目K,由于最后要將聚類結(jié)果中每簇的客戶價(jià)值指標(biāo)均值與整個(gè)數(shù)據(jù)集的客戶價(jià)值指標(biāo)均值相比較,而每個(gè)客戶價(jià)值指標(biāo)的比較只能有大于 (等于)或小于這兩種情況,其中,旅客價(jià)值是由其它3個(gè)客戶價(jià)值指標(biāo)經(jīng)過加權(quán)計(jì)算得出的。因此,在數(shù)據(jù)分布均勻的情況下,簇的數(shù)目應(yīng)為2*2*2=8個(gè),即K=8。

      得出聚類結(jié)果之后,將各簇的客戶價(jià)值分析指標(biāo)均值與整個(gè)數(shù)據(jù)集的客戶價(jià)值分析指標(biāo)均值作比較,以便能夠?qū)⒏鞔刂械目蛻籼攸c(diǎn)更清晰地顯示出來,從而為航空公司提供更加有利的參考依據(jù)。

      3.4 聚類結(jié)果特點(diǎn)分析

      由表3-聚類結(jié)果及表4-各簇均值與數(shù)據(jù)集均值比較結(jié)果中可以看出,第1簇中的客戶群R↓F↑D↑V↑且客戶價(jià)值是最高的。所以,對(duì)航空公司來說,這些客戶是最具商業(yè)價(jià)值的旅客,即星級(jí)客戶。他們經(jīng)常乘坐該航空公司的航班往返于兩個(gè)城市之間,且平均購票的票價(jià)很高,多集中在頭等艙,因此,這部分旅客創(chuàng)造的利潤相當(dāng)可觀,航空公司應(yīng)集中其有限資源最先服務(wù)于這部分旅客,以便留住他們,并與之建立起長期友好的客戶關(guān)系。

      表3 聚類結(jié)果

      第5簇中的客戶群R↑F↑D↑V↑且旅客價(jià)值相對(duì)較高。這部分旅客的R變量大于平均值,有可能是近期在這條航線上出行的時(shí)候,選擇了其它航空公司的航班。這部分客戶在出行的時(shí)候不固定選擇哪家航空公司的航班,因此,他們與哪家航空公司都有可能建立緊密客戶關(guān)系,具有很大的潛力成為航空公司的星級(jí)客戶。航空公司應(yīng)特別重視與這些客戶的進(jìn)一步發(fā)展,并對(duì)他們開展一些具有市場(chǎng)針對(duì)性的促銷活動(dòng),從而提高航空公司對(duì)他們的吸引力。

      表4 各簇均值與數(shù)據(jù)集均值比較結(jié)果

      第6簇和第7簇中的客戶群R↓F↑D↓V↑且旅客價(jià)值略高,這部分客戶的出行特點(diǎn)是這條航線上出行較為頻繁但平均出行折扣不高。針對(duì)這部分旅客,基于他們的消費(fèi)行為,航空公司應(yīng)多推出一些航班服務(wù)優(yōu)惠活動(dòng),例如若購票折扣達(dá)到1.2即可享受購票折扣1.5以上的頭等艙服務(wù)等,以刺激其消費(fèi)。

      其它簇的客戶群的客戶價(jià)值指標(biāo)均值均與整個(gè)數(shù)據(jù)集均值接近或小于整個(gè)數(shù)據(jù)集均值,他們對(duì)航空公司的商業(yè)價(jià)值較小,航空公司不應(yīng)把有限的資源用于吸引這些旅客。

      3.5 預(yù)測(cè)結(jié)果驗(yàn)證

      利用2011年前兩月的PNR數(shù)據(jù)對(duì)該方法挖掘出的高價(jià)值旅客在未來短時(shí)間內(nèi)繼續(xù)在某條航線上出行的概率進(jìn)行驗(yàn)證,驗(yàn)證準(zhǔn)確率結(jié)果如圖3所示,由2010年P(guān)NR數(shù)據(jù)集挖掘出的北京-上海航線上的高價(jià)值旅客在2011年1月繼續(xù)出行的概率為51.1%,2011年1-2月繼續(xù)出行的概率為63.9%,在北京-廣州,北京-深圳這兩條航線上2011年1月和2011年1-2月繼續(xù)出行的概率分別為47.2%,59.5%和53.1%,66.4%。可見,預(yù)測(cè)結(jié)果準(zhǔn)確率較高,該方法快速有效。

      4 結(jié)束語

      航空公司訂票系統(tǒng)中基于非常旅客的PNR數(shù)據(jù)是十分珍貴的數(shù)據(jù)源,從中可以挖掘出對(duì)航空公司價(jià)值很高的旅客。這些客戶大部分是某段時(shí)間內(nèi)由于工作原因頻繁往返于兩個(gè)城市之間,且平均購票價(jià)格較高。他們很可能不受具體航空公司的約束,因此,哪家航空公司能夠快速準(zhǔn)確地找到這部分高價(jià)值旅客并與之建立長期友好的客戶關(guān)系,哪家航空公司便能在激烈的市場(chǎng)競(jìng)爭(zhēng)中占得先機(jī)。本文提出這種基于 Map/Reduce的民航高價(jià)值旅客分析方法,并在某航空公司真實(shí)的PNR數(shù)據(jù)集上進(jìn)行了實(shí)例分析。分析結(jié)果表明,該方法即使面對(duì)具有海量數(shù)據(jù)的PNR數(shù)據(jù)集,也可以輕松處理,并且它能夠有效地識(shí)別航空公司高價(jià)值旅客,為航空公司在短期時(shí)間內(nèi)集中有限資源做出有效決策提供了參考依據(jù)。

      圖3 預(yù)測(cè)準(zhǔn)確率結(jié)果

      [1]Manyikaj,Chui M,Brownb Bughin J,et al.Big data:The next frontier for innovation,competition,and productivity[EB/OL].[2012-11-25].http://www.fujitsu.com/downloads/svc/Fla/03_M(jìn)ichael.Chui.pdf.

      [2]LIU Pan.Modeling of aviation customer value based on data mining [D].Guangzhou:South China University of Technology,2010 (in Chinese).[劉攀.基于數(shù)據(jù)挖掘的航空公司客戶價(jià)值建模 [D].廣州:華南理工大學(xué),2010.]

      [3]Gantz J,Reinsel D.THE digital universe decade are you ready[EB/OL]. [2010-03-10].http://viewer.media.bitpipe.com/938044859_264/1287663101_75/Digital_Universe.pdf.

      [4]DOU Meng,WEN Lijie,WANG Jianmin,et al.Parallel algorithm to convert big event log based on MapReduce [J].Computer Integrated Manufacturing Systems,2013,19 (8):1784-1793 (in Chinese).[竇蒙,聞立杰,王建民,等.基于MapReduce的海量事件日志并行轉(zhuǎn)化算法 [J].計(jì)算機(jī)集成制造系統(tǒng),2013,19 (8):1784-1793.]

      [5]White T.Hadoop:The definitive guide [M].O’Reilly Media,Inc,2009.

      [6]LU Jiaheng.Hadoop in action [M].Beijing:China Machine Press,2011 (in Chinese).[陸家恒.Hadoop實(shí)戰(zhàn) [M].北京:機(jī)械工業(yè)出版社,2011.]

      [7]XU Xiangbin,WANG Jiaqiang,TU Huan,et al.Customer classification of E-commerce based on improved RFM model[J].Journal of Computer Applications,2012,32 (5):1439-1442(in Chinese).[徐翔斌,王佳強(qiáng),涂歡,等.基于改進(jìn)RFM模型的電子商務(wù)客戶細(xì)分 [J].計(jì)算機(jī)應(yīng)用,2012,32(5):1439-1442.]

      [8]LIU Chaohua,MEI Qiang,CAI Shuqin.The model of customer classification and evaluation of customer value based on RFM [J].Technoeconomics & Management Research,2012,33 (5):33-36 (in Chinese).[劉朝華,梅強(qiáng),蔡淑琴.基于RFM的客戶分類及價(jià)值評(píng)價(jià)模型 [J].技術(shù)經(jīng)濟(jì)與管理研究,2012,33 (5):33-36.]

      [9]LUO Xiaofeng,REN Aihua,LI Meng,et al.Application of AHP and SPC in quantitative process management [J].Computer Engineering and Design,2010,31 (12):2749-2753 (in Chinese).[羅曉峰,任愛華,李萌,等.AHP和SPC技術(shù)在量化過程管理中的應(yīng)用 [J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(12):2749-2753.]

      [10]LIU Dongfei.Software process performance evaluation based on AHP and cloud mode [J].Computer Engineering and Design,2013,34 (3):894-898 (in Chinese).[劉東飛.基于AHP與云模型的軟件工程績(jī)效評(píng)價(jià)方法 [J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34 (3):894-898.]

      [11]WANG Feng,LIU Jingao,CHEN Yahua.Customers’value assessment model in AHP-based telecommunication [J].Computer Systems & Applications,2009,19 (1):26-28(in Chinese).[王峰,劉錦高,陳亞華.基于AHP的電信客戶價(jià)值評(píng)價(jià)模型研究 [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2009,19(1):26-28.]

      [12]ZHANG Wenxin.Research on frequent flyer segmentation of airlines [D].Nanjing:Nanjing University of Aeronautics and Astronautics,2009 (in Chinese). [張文欣.航空公司常旅客細(xì)分研究 [D].南京:南京航空航天大學(xué),2009.]

      [13]WANG Fudong,MA Yufang.Research of method for customer segment based on data mining [J].Computer Engineering and Applications,2011,47 (4):215-218 (in Chinese).[王扶東,馬玉芳.基于數(shù)據(jù)挖掘的客戶細(xì)分方法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2011,47 (4):215-218.]

      [14]ZHOU Aiwu,YU Yafei.The research about clustering algorithm of K-Means [J].Computer Technology and Development,2011,21 (2):61-65 (in Chinese). [周愛武,于亞飛.K-Means聚類算法的研究 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21 (2):61-65.]

      [15]LUO Liangsheng,ZHANG Wenxin.Research of method customer segment of airlines based on database of frequent flyer[J].Modernbusiness,2008 (23):54-55 (in Chinese). [羅亮生,張文欣.基于常旅客數(shù)據(jù)庫的航空公司客戶細(xì)分方法研究 [J].現(xiàn)代商業(yè),2008 ( 23):54-55.]

      猜你喜歡
      航空公司均值旅客
      航空公司的低成本戰(zhàn)略及其實(shí)施對(duì)策探討
      IATA上調(diào)2021年航空公司凈虧損預(yù)測(cè)
      大飛機(jī)(2021年4期)2021-07-19 04:46:34
      非常旅客意見簿
      我是人
      故事大王(2018年3期)2018-05-03 09:55:52
      FLIGHTRISK
      均值不等式失效時(shí)的解決方法
      航空公司客票直銷的現(xiàn)狀與分析
      給小旅客的禮物
      空中之家(2016年1期)2016-05-17 04:47:43
      均值與方差在生活中的應(yīng)用
      關(guān)于均值有界變差函數(shù)的重要不等式
      华蓥市| 侯马市| 张家界市| 新巴尔虎左旗| 无极县| 晋中市| 承德市| 丹巴县| 台中市| 汝南县| 宜丰县| 广宁县| 五家渠市| 长岛县| 安陆市| 个旧市| 东安县| 台北市| 靖宇县| 抚州市| 开原市| 从江县| 南丰县| 上饶市| 邛崃市| 锦屏县| 彰武县| 郓城县| 东至县| 深水埗区| 曲麻莱县| 合作市| 高青县| 汝州市| 大城县| 上栗县| 嘉善县| 阿尔山市| 聊城市| 滦平县| 工布江达县|