羅培韜
2018年3月5日,第十三屆全國(guó)人民代表大會(huì)第一次會(huì)議在人民大會(huì)堂開幕。政府工作報(bào)告送出“大禮包”,其中之一就是取消流量漫游費(fèi)、移動(dòng)網(wǎng)絡(luò)流量資費(fèi)年內(nèi)至少降低30%。這一承諾在會(huì)內(nèi)會(huì)外贏得一片叫好。三大電信運(yùn)營(yíng)商也先后回應(yīng),全力以赴、抓緊推進(jìn)。提速降費(fèi)的實(shí)在舉措,將給公眾帶來更多獲得感。我們應(yīng)該看到,提速降費(fèi)是中國(guó)移動(dòng)互聯(lián)大潮推動(dòng)下的必然選擇。
本次市場(chǎng)調(diào)查從“提速降費(fèi)”這一時(shí)政熱點(diǎn)問題出發(fā),以中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信三大運(yùn)營(yíng)商的用戶為調(diào)查對(duì)象,運(yùn)用抽樣技術(shù)、問卷調(diào)查和訪問、統(tǒng)計(jì)描述和推斷等數(shù)據(jù)收集和分析方法,統(tǒng)計(jì)目前三大運(yùn)營(yíng)商之間用戶的使用情況和變更情況,探尋用戶的變更原因,了解用戶的變更意愿,挖掘用戶的潛在需求,為三大運(yùn)營(yíng)商在激烈的市場(chǎng)競(jìng)爭(zhēng)中如何緊跟國(guó)家政策、把握機(jī)遇、揚(yáng)長(zhǎng)避短、留住舊戶、吸引新戶提供合理的意見和建議,讓運(yùn)營(yíng)商和用戶都成為加快建設(shè)網(wǎng)絡(luò)強(qiáng)國(guó)和制造強(qiáng)國(guó)時(shí)代下的受益者。
(一)調(diào)查對(duì)象:中國(guó)移動(dòng)、中國(guó)聯(lián)通、中國(guó)電信三大運(yùn)營(yíng)商的全國(guó)4G用戶,其中以東部沿海經(jīng)濟(jì)區(qū)用戶為主,以與其一階鄰接和二階鄰接的其他經(jīng)濟(jì)區(qū)用戶為輔。
(二)調(diào)查時(shí)間:從2017年3月5日至2017年3月31日共歷時(shí)27天。
(三)調(diào)查范圍:東部沿海經(jīng)濟(jì)區(qū)以及與其一階鄰接和二階鄰接的其他六大經(jīng)濟(jì)區(qū),分別包括北部沿海經(jīng)濟(jì)區(qū)、南部沿海經(jīng)濟(jì)區(qū)、長(zhǎng)江中游經(jīng)濟(jì)區(qū)、東北綜合經(jīng)濟(jì)區(qū)、黃河中游綜合經(jīng)濟(jì)區(qū)、大西南綜合經(jīng)濟(jì)區(qū)。
(四)調(diào)查內(nèi)容:此次市場(chǎng)調(diào)查的內(nèi)容主要分6部分:第一部分為用戶的基本信息,包括性別、年齡、所屬運(yùn)營(yíng)商;第二部分為用戶的變更意愿,包括是否變更、如何變更、變更原因;第三部分為用戶對(duì)其他運(yùn)營(yíng)商的看法,包括是否了解其他運(yùn)營(yíng)商套餐資費(fèi)、對(duì)各運(yùn)營(yíng)商優(yōu)惠活動(dòng)的了解途徑偏好、各運(yùn)營(yíng)商優(yōu)惠套餐對(duì)用戶變更意愿的影響;第四部分為攜號(hào)轉(zhuǎn)網(wǎng)政策對(duì)用戶變更意愿的影響;第五部分為用戶套餐使用情況和看法,包括用戶的每月套餐資費(fèi)、用戶最看重的套餐內(nèi)容;第六部分為用戶對(duì)提速降費(fèi)政策的看法。
關(guān)聯(lián)分析
關(guān)聯(lián)分析是指從大規(guī)模數(shù)據(jù)集中挖掘變量之間有趣關(guān)系的一種數(shù)據(jù)挖掘的基礎(chǔ)方法。數(shù)據(jù)挖掘的案例中有沃爾瑪發(fā)現(xiàn)購(gòu)買尿布的顧客通常也會(huì)購(gòu)買啤酒,于是把啤酒和尿布捆綁銷售同時(shí)提高了兩者的銷量的案例。
在關(guān)聯(lián)分析中主要要以下基本概念:
1.事務(wù)庫(kù):顧客購(gòu)買商品的行為的記錄。
2.事務(wù):事務(wù)庫(kù)的每一條記錄被稱為一筆事務(wù)。
3.項(xiàng)集:包含0個(gè)或者多個(gè)項(xiàng)的集合稱為項(xiàng)集。
4.支持度:包含項(xiàng)集的事務(wù)在所有事務(wù)中所占的比例。
5.頻繁項(xiàng)集:如果我們對(duì)項(xiàng)目集的支持度設(shè)定一個(gè)最小閾值,那么所有支持度大于這個(gè)閾值的項(xiàng)集就是頻繁項(xiàng)集。
6.置信度:表示使用包含A的事務(wù)中同時(shí)包含B事務(wù)的比例,即同時(shí)包含A和B的事務(wù)占包含A事務(wù)的比例。公式表達(dá):
(1)
7.提升度:表示“包含A的事務(wù)中同時(shí)包含B事務(wù)的比例”與“包含B事務(wù)的比例”的比值。公式表達(dá):
(2)
另外一般來說提升度超過1才認(rèn)為是有關(guān)聯(lián),并且提升度越大說明關(guān)聯(lián)性越強(qiáng)。
關(guān)聯(lián)分析中,關(guān)于生成頻繁項(xiàng)是一個(gè)難點(diǎn)。最簡(jiǎn)單的暴力搜索,在排除空集的前提下,那么一個(gè)保護(hù)有k個(gè)項(xiàng)的數(shù)據(jù)集可能產(chǎn)生個(gè)頻繁項(xiàng),這是一個(gè)這是一個(gè)指數(shù)階的算法,隨著k值的增大,計(jì)算量十分之大,所以采用apriori算法能夠提升它的速度。
Apriori算法
Apriori算法是一種用于關(guān)聯(lián)規(guī)則挖掘(Association rule mining)的代表性算法,它同樣位居十大數(shù)據(jù)挖掘算法之列。關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中的一個(gè)非常重要的研究方向,也是一個(gè)由來已久的話題,它的主要任務(wù)就是設(shè)法發(fā)現(xiàn)事物之間的內(nèi)在聯(lián)系。
在這里我們將所有收回的問卷作為事務(wù)庫(kù),那么每一份問卷則被稱為一筆事務(wù),項(xiàng)集就是問卷中問題的選項(xiàng)的各種組合的集合。我們問卷共收回大約650份問卷,支持度設(shè)置為0.3,即出現(xiàn)次數(shù)大于195的才認(rèn)為是頻繁項(xiàng),將置信度設(shè)置為0.9,并篩選出支大于1的關(guān)聯(lián)規(guī)則。
從分析結(jié)果看,主要分為“流量”和“沒有意愿”這兩個(gè)關(guān)鍵詞,因?yàn)椤霸际謾C(jī)聯(lián)系人較多,不易變更”以及“綁定手機(jī)號(hào),修改麻煩”這兩個(gè)原因,將會(huì)導(dǎo)致當(dāng)前用戶沒有意愿會(huì)轉(zhuǎn)網(wǎng),該置信度均達(dá)到100%。所以,攻克手機(jī)號(hào)綁定和手機(jī)通信記錄備份的相關(guān)技術(shù)難題顯得尤為關(guān)鍵。
其次,實(shí)行攜號(hào)轉(zhuǎn)網(wǎng)政策以后可能會(huì)轉(zhuǎn)網(wǎng)的用戶,目前來看,普遍沒有意愿更換運(yùn)營(yíng)商,這個(gè)置信度達(dá)到了93.20%。所以,這部分用戶我們可以稱其為潛在客戶,查詢其支持度為44.92%,也就是說同時(shí)選這兩項(xiàng)的人占這次調(diào)查的人數(shù)的45%。那么,我們有理由推測(cè),若推行攜號(hào)轉(zhuǎn)網(wǎng),潛在客戶數(shù)量還是很多的。
另一個(gè)值得關(guān)注的點(diǎn)就是流量,分析中顯示,選擇了“若攜號(hào)轉(zhuǎn)網(wǎng)政策實(shí)施會(huì)轉(zhuǎn)網(wǎng)”,“惠民政策,絕對(duì)支持選項(xiàng)”以及“綁定手機(jī)號(hào),修改麻煩的人”分別以置信度約為91.8%,90.36%,90.82%選了流量這個(gè)選項(xiàng)。這說明若運(yùn)營(yíng)商若想留住用戶,推出具有吸引力的流量套餐對(duì)于留住用戶有很大的作用,這一點(diǎn)在90后群體尤為明顯,其置信度顯示為93.7%。
在多項(xiàng)集對(duì)多項(xiàng)集的關(guān)聯(lián)中,第三條結(jié)果可以認(rèn)為“綁定手機(jī)號(hào),修改麻煩”的中國(guó)移動(dòng)用戶,目前沒有意愿更換運(yùn)營(yíng)商,并且看重運(yùn)營(yíng)商的是流量這一項(xiàng)業(yè)務(wù)。