劉萍
【摘要】隨著手機(jī)技術(shù)的發(fā)展,手機(jī)已經(jīng)成為大多數(shù)人不可或缺的一部分,但是對于手機(jī)資費(fèi)的關(guān)注還較少,本文對手機(jī)運(yùn)營商客戶相關(guān)數(shù)據(jù)進(jìn)行分析,首先利用聚類分析對數(shù)據(jù)進(jìn)行分類處理,再基于此對相關(guān)性較大的指標(biāo)進(jìn)行逐步回歸分析,最終找出了通話費(fèi)的主要影響指標(biāo)為WLAN、主叫次數(shù)、漫游費(fèi)。
【關(guān)鍵詞】聚類分析;逐步回歸;影響因素
一、引言
手機(jī)資費(fèi)在通訊發(fā)達(dá)的今天己經(jīng)成為人人關(guān)心的一個(gè)話題,了解自己的個(gè)人通訊開銷的具體情況與資費(fèi)高低的主要指標(biāo)是很重要的。但是,大部分用戶并沒有了解到自己的話費(fèi)使用情況,很容易導(dǎo)致資費(fèi)浪費(fèi)或者分配不合理的情況。因此本文將根據(jù)聚類分析以及逐步回歸,基于手機(jī)資費(fèi)數(shù)據(jù)研究話費(fèi)的影響因素,為個(gè)人資費(fèi)業(yè)務(wù)選擇、話費(fèi)控制提供參考。
二、方法介紹
本文首先利用聚類分析觀察數(shù)據(jù)各個(gè)指標(biāo)關(guān)系;然后利用多元回歸進(jìn)行分析?;趯哟蔚木垲愃惴ㄓ址Q為樹聚類算法。該方法使用數(shù)據(jù)的聯(lián)接規(guī)則,通過層次式架構(gòu)方式反復(fù)將數(shù)據(jù)進(jìn)行分裂或聚合,以形成一個(gè)層次序列的聚類問題的解。由于并不是所有解釋變量都能夠?qū)σ蜃兞坑酗@著的影響,因此在多元回歸的過程當(dāng)中,需要挑選對因變量影響較大的自變量,這就需要求出所有可能的2m-1個(gè)回歸方程進(jìn)行比較,進(jìn)而確定最終的回歸方程,在解決該問題的各個(gè)方法中,逐步回歸最受推崇。
(三)多重共線性檢驗(yàn)
對最終的模型方程進(jìn)行多重共線性檢驗(yàn),檢驗(yàn)得到的VIF值為48.65,說明存在較小的多重共線性,若此時(shí)為了消除多重共線性進(jìn)行變量的刪減,可能會(huì)影響各個(gè)自變量與因變量的真實(shí)關(guān)系,因此不作處理,方程(3)即為最終方程。
四、總結(jié)
本文運(yùn)用運(yùn)營商數(shù)據(jù)進(jìn)行聚類、回歸分析。經(jīng)過各項(xiàng)檢驗(yàn),最終得到了最為符合實(shí)際的線性回歸方程作為最優(yōu)方程。由最終方程(3):WLAN對通話費(fèi)影響最大,且是呈負(fù)相關(guān)的,主叫次數(shù)、漫游費(fèi)對通話費(fèi)的影響較大,且是呈正相關(guān)的。由此手機(jī)用戶可以根據(jù)自己的實(shí)際消費(fèi)情況進(jìn)行套餐傾斜,以此來降低通話費(fèi)用;對運(yùn)營商而言,也可以據(jù)此制定合適的消費(fèi)套餐,進(jìn)而更準(zhǔn)確的滿足手機(jī)用戶的需求,加大自身的品牌競爭力。