• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于模糊聚類(lèi)的客戶(hù)分類(lèi)評(píng)價(jià)方法

      2021-04-20 06:34:16楊曉峰
      電子技術(shù)與軟件工程 2021年3期
      關(guān)鍵詞:均值可視化乘客

      楊曉峰

      (山西建筑職業(yè)技術(shù)學(xué)院 山西省晉中市 030600)

      1 引言

      在競(jìng)爭(zhēng)激烈的商業(yè)環(huán)境下,取得商業(yè)成功的方法之一就是研究客戶(hù),通過(guò)客戶(hù)分類(lèi)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。本文以某航空公司客戶(hù)分析為基礎(chǔ)研究商業(yè)客戶(hù)分類(lèi)方法。

      目前客戶(hù)分類(lèi)經(jīng)典方法多采用RFM 方法,其中R 表示客戶(hù)消費(fèi)時(shí)間間隔、F 表示客戶(hù)消費(fèi)的頻率、M 表示客戶(hù)消費(fèi)能力。季杰[1],徐伶伶[2]基于Kmeans 聚類(lèi)算法利用改進(jìn)的RFM 模型對(duì)某航空公司客戶(hù)進(jìn)行了價(jià)值分析并將客戶(hù)分為五類(lèi),篩選出了最有價(jià)值客戶(hù)。覃玉冰[3]使用Kmeans 聚類(lèi)算法進(jìn)行某公司客戶(hù)分析,通過(guò)對(duì)比INCA 指數(shù)將客戶(hù)優(yōu)化分類(lèi)為4 類(lèi)。Kmeans 算法屬于硬聚類(lèi)算法,任何一個(gè)樣本對(duì)于某個(gè)類(lèi)別的概率只有兩種情況(0%和100%)。Kmeans 算法通過(guò)優(yōu)化類(lèi)內(nèi)誤差平方和最小化,通常樣本間相似度采用歐拉距離計(jì)算。模糊C 均值聚類(lèi)融合了模糊理論,將樣本屬于某個(gè)分類(lèi)的隸屬度修改為[0,1]區(qū)間,隸屬度表示樣本歸于某一類(lèi)別的概率,隸屬度可以很好的表示實(shí)際情況。因此,本文選用模糊C 均值聚類(lèi)分析研究商業(yè)客戶(hù)。

      2 數(shù)據(jù)準(zhǔn)備

      本文實(shí)驗(yàn)采用開(kāi)源某航空公司數(shù)據(jù)集,數(shù)據(jù)集抽取了某航空公司兩年內(nèi)所有客戶(hù)乘機(jī)的62988 條記錄。記錄中包括第一次飛行時(shí)間、性別、會(huì)員卡級(jí)別等客戶(hù)基本信息,乘機(jī)次數(shù)、平均折扣率、飛行總里程等乘機(jī)信息,積分兌換次數(shù)、總會(huì)員積分、促銷(xiāo)積分、總累計(jì)積分等積分信息。

      3 特征選取

      本文實(shí)驗(yàn)設(shè)計(jì)了RFM 的改進(jìn)模型PRIFEMD,PRFMDIE 模型中的特征中包含七個(gè)特征:(1)P 表示乘客入會(huì)的時(shí)間長(zhǎng)度,由時(shí)間窗的結(jié)束時(shí)間與入會(huì)時(shí)間的差表示;

      (2)R 表示乘客最后未乘機(jī)時(shí)間長(zhǎng)度,由時(shí)間窗的結(jié)束時(shí)間與最后一次乘機(jī)時(shí)間的差表示;

      (3)F 表示乘坐飛機(jī)的頻率,由時(shí)間窗內(nèi)總飛行次數(shù)表示;

      (4)M 表示乘客總飛行里程,由時(shí)間窗內(nèi)總飛行公里數(shù)表示;

      (5)D 表示飛機(jī)倉(cāng)位折扣系數(shù)均值,由時(shí)間窗內(nèi)乘坐倉(cāng)位對(duì)應(yīng)的折扣系數(shù)的平均值表示;

      (6)I 表示乘客消費(fèi)間隔,由時(shí)間窗內(nèi)乘機(jī)平均間隔表示;

      (7)E 表示乘客消費(fèi)總額,由時(shí)間窗消費(fèi)累計(jì)表示。

      從某航空公司開(kāi)源數(shù)據(jù)集中提取PRFMDIE 模型的七種特征,并畫(huà)出分布圖,如圖1-圖7 所示。P 特征的分布如圖1 所示,R 特征的分布如圖2 所示,F(xiàn) 特征的分布如圖3 所示,M 特征的分布如圖4 所示,D 特征的分布如圖5 所示,I 特征的分布如圖6 所示,E 特征的分布如圖7 所示,圖中橫坐標(biāo)和縱坐標(biāo)分別表示特征值和特征值的數(shù)量。從圖1-圖4 以及圖6-圖7 中可以看出,P、R、F、M、I 和E 六個(gè)特征不屬于正態(tài)分布,因此P、R、F、M、I 和E 六個(gè)特征歸一化采用離差標(biāo)準(zhǔn)化,如公式1。從圖5 可以看出,D 特征近似正態(tài)分布,因此本文采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,公式2。PRFMDIE模型的七種特征歸一化后的數(shù)據(jù)如表1 所示。

      圖1:P 特征分布

      圖2:R 特征分布

      圖3:F 特征分布

      圖4:M 特征分布

      圖5:D 特征分布

      圖6:I 特征分布

      圖7:E 特征分布

      表1:部分PRFMDIE 特征歸一化數(shù)據(jù)

      4 客戶(hù)分類(lèi)

      模糊C 均值聚類(lèi)簡(jiǎn)稱(chēng)FCM,F(xiàn)CM 融合了模糊理論,使用隸屬度表示每個(gè)樣本的類(lèi)別屬性。假設(shè)樣本集合為將樣本集X 其分成C 個(gè)子集,設(shè)為每個(gè)子集的中心,Jm是目標(biāo)函數(shù),如式3 所示。

      其中m 是模糊因子,i 是樣本索引,j 是聚類(lèi)中心索引,uij是樣本xi屬于聚類(lèi)中心cj的隸屬度,|| ||2是樣本與聚類(lèi)中心的距離。聚類(lèi)過(guò)程是:在優(yōu)化目標(biāo)函數(shù)Jm過(guò)程中,計(jì)算每個(gè)樣本的所有類(lèi)別的隸屬度,其中隸屬度高的類(lèi)別就作為樣本的類(lèi)別詳細(xì)過(guò)程描述如下:

      (1)確定類(lèi)別參數(shù)C,模糊因子m,隸屬度矩陣初始化,并滿足公式4。

      其中s 表示迭代更新次數(shù),

      將PRFMDIE 模型中的七種特征組成特征向量d,d∈R7。所有乘客的PRFMDIE 特征組成特征矩陣其中N 表示所有乘客數(shù)量。將特征矩陣作為模糊C 均值聚類(lèi)方法的輸入,可以得到乘客分類(lèi),乘客分類(lèi)結(jié)果TSNE 可視化結(jié)果如圖8 所示,其中五類(lèi)乘客由五種顏色表示,黃色表示最優(yōu)質(zhì)乘客。從圖8 中可以看出,聚類(lèi)結(jié)果只有少數(shù)離群點(diǎn),大部分同類(lèi)型乘客被歸為一類(lèi),說(shuō)明模糊C 均值聚類(lèi)方法在解決乘客分類(lèi)問(wèn)題中有效,可以很好的將乘客分為5 類(lèi)。本文實(shí)驗(yàn)還對(duì)比了Kmeans 聚類(lèi)結(jié)果,如圖9 所示。對(duì)比發(fā)現(xiàn),Kmeans 聚類(lèi)中不同類(lèi)型的樣本混雜要高于模糊C 均值聚類(lèi)的結(jié)果,如圖9 中實(shí)線標(biāo)注區(qū)域所示。

      圖8:模糊C 均值聚類(lèi)結(jié)果可視化

      圖9:Kmeans 聚類(lèi)結(jié)果可視化

      5 結(jié)論

      本文對(duì)某航空公司乘客PRIFEMD 特征進(jìn)行了可視化分析,確定了歸一化方法,D 特征采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,其他特征采用離差標(biāo)準(zhǔn)化。乘客分類(lèi)采用了模糊C 均值聚類(lèi)方法,將最有價(jià)值客戶(hù)分離出來(lái),結(jié)果采用TSNE 方法進(jìn)行可視化表示。

      猜你喜歡
      均值可視化乘客
      基于CiteSpace的足三里穴研究可視化分析
      嫦娥五號(hào)帶回的“乘客”
      基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      基于CGAL和OpenGL的海底地形三維可視化
      “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
      最牛乘客
      車(chē)上的乘客
      均值不等式失效時(shí)的解決方法
      高鐵丟票乘客索退款被駁回
      公民與法治(2016年2期)2016-05-17 04:08:24
      均值與方差在生活中的應(yīng)用
      扎兰屯市| 荣成市| 那曲县| 临城县| 岢岚县| 玉环县| 铜鼓县| 凉城县| 通辽市| 枣阳市| 修水县| 德钦县| 进贤县| 乐业县| 平果县| 桓仁| 民权县| 南宁市| 商河县| 额尔古纳市| 凤凰县| 白河县| 临西县| 井冈山市| 隆尧县| 阳春市| 类乌齐县| 六盘水市| 佛学| 靖宇县| 隆德县| 东乌珠穆沁旗| 富平县| 朔州市| 大英县| 郁南县| 宁都县| 宁安市| 米脂县| 商丘市| 蓬莱市|