• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于評論情感傾向和神經(jīng)網(wǎng)絡(luò)的客戶流失預(yù)測研究

      2018-07-24 09:46:54安海崗
      關(guān)鍵詞:星級詞典運營商

      馮 鑫,王 晨,劉 苑,楊 婭,安海崗

      (1.河北地質(zhì)大學(xué),河北 石家莊 100086; 2. 航天恒星科技有限公司,北京 0500031;3.石家莊市第二職業(yè)中專學(xué)校,河北 石家莊 050000)

      0 引 言

      在通信市場競爭角逐之下,初入市場的42家MVNO的業(yè)務(wù)發(fā)展也不平衡,用戶量多則達數(shù)百萬,少則月增量僅數(shù)十用戶,幾近虧損。大多數(shù)移動網(wǎng)絡(luò)虛擬運營商由于缺乏運營管理經(jīng)驗面臨用戶增長緩慢且客戶流失嚴(yán)重的雙重問題。部分研究表明新用戶的開發(fā)成本遠比存留客戶的挽留成本要多[1],因此幫助移動網(wǎng)絡(luò)虛擬運營商識別潛在流失客戶是值得關(guān)注的問題??蛻袅魇ьA(yù)測問題的研究大體可分為三類:客戶流失影響因素、預(yù)測模型及挽留研究。客戶流失預(yù)測的方法通常是識別其影響因素去構(gòu)建預(yù)測模型,預(yù)測出潛在流失客戶,并對其制定相應(yīng)挽留策略[2]?;谝延醒芯勘疚膶目蛻魸M意度、忠誠度、服務(wù)質(zhì)量及口碑傳播四方面考慮,運用BP神經(jīng)網(wǎng)絡(luò)預(yù)測流失客戶并提出針對性挽留措施及建議。

      1 國內(nèi)外研究現(xiàn)狀

      1.1 移動網(wǎng)絡(luò)虛擬運營商研究現(xiàn)狀

      移動網(wǎng)絡(luò)虛擬運營商指沒有自己的無線網(wǎng)絡(luò)設(shè)施,通過向傳統(tǒng)運營商購買網(wǎng)絡(luò)接入容量的方式,再進行轉(zhuǎn)售業(yè)務(wù)的新型通訊網(wǎng)絡(luò)運營商(Mobile Network Virtual Operator, MVNO)[3]。目前對MVNO的研究主要集中在發(fā)展困境、策略及業(yè)務(wù)模式等三個層面。肖清華等從MVNO發(fā)展初期必須要解決規(guī)模用戶以及規(guī)模化轉(zhuǎn)化為收入的問題入手提出其業(yè)務(wù)創(chuàng)新的必要性[4]。也有部分學(xué)者認為,與傳統(tǒng)運營商相比MVNO無需投資昂貴的基站硬件而避免了大規(guī)模資金投入[3]。MVNO的成本主要來自網(wǎng)絡(luò)容量租賃,且平均成本取決于用戶數(shù)量,故初期必須大力發(fā)展用戶來降低平均成本[5]。已有研究多較為宏觀,微觀量化研究較少,故本文利用文本挖掘和BP神經(jīng)網(wǎng)絡(luò)對其客戶流失進行預(yù)測以期對其發(fā)展提供量化的決策依據(jù)。

      1.2 客戶流失預(yù)測研究現(xiàn)狀

      本文將客戶流失定義為:現(xiàn)有客戶對產(chǎn)品發(fā)生情感變化選擇放棄繼續(xù)購買或使用該服務(wù)或產(chǎn)品[6]。目前國內(nèi)外學(xué)者對研究客戶流失問題的關(guān)注點在客戶流失影響因素、模型構(gòu)建以及挽留研究等方面。

      1.2.1 客戶流失的影響因素研究現(xiàn)狀

      客戶流失影響因素主要有:服務(wù)質(zhì)量、客戶滿意度、客戶忠誠度及口碑傳播四方面,而服務(wù)質(zhì)量是決定因素[7,8,9]。多數(shù)學(xué)者從消費數(shù)據(jù)出發(fā)研究客戶對運營山的滿意度和忠誠度情況,滿意度情況多從撥打客服次數(shù)、人工服務(wù)、GPRS業(yè)務(wù)、通話時長等方面進行;忠誠度情況多從用戶是否使用該運營商以外的運營商服務(wù)、聯(lián)系人是同個運營商的比例、轉(zhuǎn)網(wǎng)次數(shù)和轉(zhuǎn)網(wǎng)意愿等方面進行[10]。但因消費數(shù)據(jù)保密性強,單從已有數(shù)據(jù)較難得到滿意結(jié)果。此外也有通過調(diào)查問卷了解用戶對運營商滿意度、服務(wù)質(zhì)量的評價、忠誠度情況,但因調(diào)查問卷的局限性可能導(dǎo)致分析結(jié)果不全面。以往研究鮮有通過用戶情感去分析客戶流失問題的,在線評論能最直接體現(xiàn)用戶對購買和使用該產(chǎn)品的情感,通過識別評論特征與客戶流失之間的關(guān)系能夠有效預(yù)測客戶流失。

      1.2.2 評論特征對客戶流失影響研究

      從評論角度研究客戶流失問題,主要集中在滿意度方面,即對評論文本分為積極與消極兩類[11]。積極情感客戶是高滿意度客戶,有低流失風(fēng)險,且傳遞正向積極的口碑,而消極情感客戶是低滿意度的客戶,有高流失風(fēng)險。還有學(xué)者利用在線評論去研究客戶忠誠度,認為在線評論有用性與客戶忠誠度之間存在正相關(guān)[12]。而評論內(nèi)容特征及評論者特征,評論者特征包括專業(yè)性、等級、名聲地位等都對在線評論有用性有較強影響[13]。因此,本文通過在線評論特征去探索客戶流失是具有理論基礎(chǔ)與意義的。

      1.3 情感分析技術(shù)研究現(xiàn)狀

      因中文的復(fù)雜性,國內(nèi)情感分析研究起步較晚,常用情感傾向性分析有詞級、語句級和篇章級。文本情感值計算方面,有基于情感詞典和語料庫的兩種計算方法:周愛武等提出了基于How Net 詞典的情感傾向計算[14];邵其武等用知網(wǎng)詞典建立計算語料庫中的基準(zhǔn)詞表,計算查詢詞的情感傾向[15]。目前知網(wǎng)的詞典已比較完整,只缺乏一些新興的非規(guī)范用詞或網(wǎng)絡(luò)用詞等,但在詞語相似度辨別準(zhǔn)確度較差,特別是在處理句子級文本時誤差較大。除計算相似度外,有人提出在情感分析的基礎(chǔ)上,從短語角度分析情感性[16];Turney 提出了簡單模式匹配分析,將特定的短語進行模式匹配后進行情感性分析,研究效果尚可[17],其核心是將特定詞語分成消極和積極兩類后再與原文本匹配。

      2 評論文本的采集與預(yù)處理

      2.1 評論文本采集

      對MVNO篩選發(fā)現(xiàn),京東的評論文本量大且內(nèi)容豐富,涉及產(chǎn)品及服務(wù)等多方面。評論包含商品整體評價、名稱,內(nèi)容、時間、星級、用戶名、地點、來源、熱門標(biāo)簽幾部分。因此選取部分京東MVNO的電信手機卡號類商品,抓取其評論信息含:評論內(nèi)容、會員等級、星級、點贊、回復(fù)數(shù)等字段,時間跨度2016.10-2017.04,共10000余條。

      2.2 評論文本預(yù)處理

      2.2.1 基于知網(wǎng)How net情感詞典的分詞

      知網(wǎng)詞典的語料庫雖已經(jīng)相對完善,但一些新興的網(wǎng)絡(luò)用詞與非規(guī)范化用詞未被收錄,需要在知網(wǎng)情感詞典的基礎(chǔ)上,添加部分與電信詞匯相關(guān)的、評論文本詞頻較高的、非規(guī)范化用詞,達到基本的分詞需求,添加的部分詞匯含電信詞匯:先鋒卡,磅礴卡,號段 激活,實名認證等,以及網(wǎng)絡(luò)用詞:給力 杠杠的 棒棒的 抓狂 無敵等。

      2.2.2 評論文本停用詞過濾

      為提高分詞準(zhǔn)確率,在將停用詞忽略后使用ICTCLAS對評論文本進行中文分詞,該方法基于分詞詞典進行字符串匹配實現(xiàn)分詞,結(jié)果如表1。

      表1 分詞結(jié)果示例

      3 文本特征選擇及情感分類

      分詞后不能把每個詞都作為特征來研究,這樣計算負荷較大且低頻詞研究價值較低,因此用文本特征選擇來降維。

      3.1 基于情感詞典的文本特征選擇

      特征選擇需找出代表性且與研究內(nèi)容相關(guān)性強的詞語,去除相關(guān)性差的,可通過情感詞典標(biāo)注感情詞對整體情感進行分類來提高效率[18]。知網(wǎng)詞典已將情感詞分為積極與消極兩類,積極情感有:喜歡,滿意和贊賞等,消極情感有:后悔,不滿意,大失所望和價高等,只需將評論文本中的代表性情感詞與知網(wǎng)詞典匹配作為基準(zhǔn)詞即可。情感特征詞可反映客戶購買和使用該產(chǎn)品的滿意程度,通過特征選擇降維后也便于后續(xù)的情感分類處理。

      3.2 基于布爾算法的情感分類模型

      情感分消極和積極,用布爾算法構(gòu)建情感分類模型,將每個用戶評論表示為文檔數(shù)據(jù)集D= {d1,d2,d3,…,dn},而將抽取的特征項表示為集合V={t1,t2,…,tp}。數(shù)據(jù)集D作為文檔,數(shù)據(jù)集V作為查詢,各自為一組詞構(gòu)成,查詢數(shù)據(jù)集是否在文檔中只有兩種可能:出現(xiàn)和不出現(xiàn)(1或0表示)。以京東商城移動網(wǎng)絡(luò)虛擬運營商手機卡號用戶評論為例,見表2。

      表2 京東用戶評論文本情感分類示例

      4 基于BP神經(jīng)網(wǎng)絡(luò)的客戶流失預(yù)測模型建立流程

      4.1 BP神經(jīng)網(wǎng)絡(luò)理論

      神經(jīng)網(wǎng)絡(luò)通常含輸入層、輸出層及隱藏層。若未得到期望輸出,表示實際輸出值與期望輸出值存在誤差,然后誤差原路返回,通過不斷修改各層神經(jīng)元權(quán)值至誤差最小[19]。增加層數(shù)可降低誤差,但會增大訓(xùn)練時間與復(fù)雜度。因此本文選取三層 BP神經(jīng)網(wǎng)絡(luò)來構(gòu)建MVNO用戶的流失預(yù)測模型。

      圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖

      隱含層節(jié)點數(shù)的確定無固定計算公式,一般由大量實驗尋找最佳節(jié)點數(shù),已有研究發(fā)現(xiàn)最佳個數(shù)一般頻繁出現(xiàn)在如下區(qū)間內(nèi),如公式(1)所示:

      (1)

      4.2 模型數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)源于2016.10-2017.04京東運營商手機卡用戶的在線評論,將評論星級、會員等級、點贊數(shù)作為輸入層的變量,將評論內(nèi)容情感分類的布爾數(shù)值作為輸出層的變量。數(shù)據(jù)預(yù)處理包括:刪除有缺失值樣本和去掉重復(fù)數(shù)據(jù)。

      將建模數(shù)據(jù)分為兩個分布相同的互斥數(shù)據(jù)集。輸出變量含評論星級、會員等級、點贊數(shù)。評論星級A1和會員等級A2均分為5級,用數(shù)值1到5表示。點贊數(shù)A3用布爾數(shù)值表示,點贊為1,反之為0。輸出變量以情感布爾數(shù)值表示,積極為1,消極為0。由公式(1)計算最佳隱含層節(jié)點數(shù)區(qū)間為[2,12],并采用試錯法找到其最優(yōu)個數(shù)。首先,將數(shù)據(jù)按照70%、15%、15%分為訓(xùn)練集(training set),驗證集(validation)及測試集(testing set);其次,運用newf構(gòu)建BP神經(jīng)網(wǎng)絡(luò),其中,隱藏層和輸出層的傳遞函數(shù)分別為purelin和tansig;網(wǎng)絡(luò)訓(xùn)練和取值學(xué)習(xí)分別是trainlm和tranlm;最大訓(xùn)練次數(shù)、學(xué)習(xí)速率初始值和訓(xùn)練目標(biāo)精度分別設(shè)置為1000、0.1、0.001。

      4.3 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練

      由上述過程,得預(yù)處理的數(shù)據(jù)預(yù)處理和基本的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),經(jīng)多次網(wǎng)絡(luò)訓(xùn)練后,當(dāng)輸入層神經(jīng)元個數(shù)為 4,隱含層節(jié)點數(shù)為 10時,模型訓(xùn)練時間較短且效果最好。得到理想的神經(jīng)網(wǎng)絡(luò)模型,其誤差在8.5026e-08左右,小于模型構(gòu)建時所設(shè)的誤差精度0.0001,說明該訓(xùn)練誤差在實驗設(shè)定的誤差要求內(nèi),見誤差收斂圖2。

      圖2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤收斂圖

      5 實驗分析及結(jié)論

      為了判定流失情況以及評估流失預(yù)警分界線,隨機抽取部分樣本觀察預(yù)測結(jié)果。BP神經(jīng)網(wǎng)絡(luò)的輸入層到隱藏層的估算權(quán)值(Whi)和隱藏層到輸出層的估算權(quán)值(Wjh)分別如表3和表4所示,評論特征與客戶流失的相對強度值(Yji)如表5所示。

      表3 輸入層到隱藏層的權(quán)值Whi估算表

      表4 隱藏層到輸出層的權(quán)值WJh估算表

      表5 評論特征與客戶流失的相對強度Yji表

      由表5可知:評論星級、會員等級、點贊數(shù)對客戶流失影響較大,即評論星級、會員等級越高,點贊數(shù)越多,客戶流失的風(fēng)險越小。評論星級較高一般意味著客戶對企業(yè)的情感是積極正向的,其滿意度和忠誠度也相對較高。會員等級越高的用戶其轉(zhuǎn)網(wǎng)的沉沒成本也越高,因此流失風(fēng)險較小,但其一旦流失企業(yè)的損失也較大,因為這部分顧客的價值也較高,這是因為在京東商城星級和客戶消費金額是正相關(guān)的。因此當(dāng)出現(xiàn)會員等級較高,但評論星級較低的情況,也就意味著高價值客戶存在流失風(fēng)險,這時企業(yè)應(yīng)當(dāng)積極挽留。對應(yīng)地,會員等級低和評論星級低的客戶流失率較大,這部分屬于低價值并且滿意度和忠誠度不高的群體,企業(yè)應(yīng)當(dāng)酌情挽留?;貜?fù)數(shù)對客戶流失也有影響,由于大部分評論的回復(fù)都屬于消極的口碑傳播,企業(yè)應(yīng)當(dāng)加強售后管理,鼓勵這部分消費者傳播正向積極的口碑,從而預(yù)防客戶流失。

      從表6可知客戶流失的分界線在0附近,當(dāng)流失度大于0時,判定為未流失,小于0時,判定為流失。被判定為流失的客戶,其流失意向并非不可逆轉(zhuǎn),若采取適當(dāng)?shù)氖侄危訌娕c此類用戶的溝通,提升服務(wù),是有可能挽留住的,尤其是前文提到的客戶等級較高但有流失傾向的客戶。

      表6 客戶流失預(yù)測驗證表

      由模型預(yù)測結(jié)果可發(fā)現(xiàn)流失用戶常為兩種。第一種是評論星級高而評論內(nèi)容消極的用戶。此類用戶評論星級高,但是滿意度卻很低。這是由于用戶在購買過程中,由于物流體驗及客服服務(wù)相對較好,就會拋開產(chǎn)品本身的問題,給商家好評。這類客戶屬于被動流失型,是由于產(chǎn)品本身不能滿足自身的需求而發(fā)生流失。這類客戶追求較高的商品品質(zhì),當(dāng)其他供應(yīng)商提供更好品質(zhì)的商品時,這類客戶往往就會轉(zhuǎn)網(wǎng)流失。對此類客戶,應(yīng)當(dāng)在商品質(zhì)量上進行提升,才可以獲得挽留。第二種是會員等級低的用戶。會員等級不僅是一個人消費能力的體現(xiàn),而且是一個客戶穩(wěn)定與否的體現(xiàn)。此類用戶的忠誠度較低往往追求價格低廉的商品,可以通過推薦性價比較高的套餐或有吸引力的合約計劃來挽留。

      此外,點贊數(shù)與回復(fù)數(shù)高而內(nèi)容消極的客戶傳播的是負面的口碑,也會在一定程度上影響客戶流失,企業(yè)對于這類用戶應(yīng)當(dāng)及時作出官方的回復(fù),及時表示歉意給其購物帶來的不便,樹立良好的售后形象,降低客戶流失的風(fēng)險。點贊數(shù)與回復(fù)數(shù)高且內(nèi)容積極的用戶傳播的是正向的口碑,在一定程度上可以吸引更多的潛在消費者,對于此類用戶,應(yīng)當(dāng)酌情采取鼓勵政策,使其發(fā)表更好的評論內(nèi)容。

      總之,運營商可由模型輸出的流失度來判定客戶流失風(fēng)險,對具有流失傾向的用戶采用客戶挽留、價值提升等策略,以減少用戶流失的比例。對于不具有流失傾向的用戶也需要不斷關(guān)注其發(fā)展動態(tài),從而保障運營商能夠以最少的成本保留更多的客戶資源。

      猜你喜歡
      星級詞典運營商
      米沃什詞典
      文苑(2019年24期)2020-01-06 12:06:50
      “星級聯(lián)創(chuàng)”促進星光黨建的創(chuàng)新實踐
      唐DM 智聯(lián)創(chuàng)享型
      世界汽車(2019年2期)2019-03-01 09:00:08
      大指揮官 2.0T四驅(qū)臻享版
      世界汽車(2019年2期)2019-03-01 09:00:08
      評《現(xiàn)代漢語詞典》(第6版)
      詞典例證翻譯標(biāo)準(zhǔn)探索
      取消“漫游費”只能等運營商“良心發(fā)現(xiàn)”?
      消費者報道(2016年3期)2016-02-28 19:07:30
      第一章 在腐敗火上烤的三大運營商
      IT時代周刊(2015年9期)2015-11-11 05:51:43
      三大運營商換帥不是一個簡單的巧合
      IT時代周刊(2015年9期)2015-11-11 05:51:27
      三大運營商換帥
      IT時代周刊(2015年9期)2015-11-11 05:51:24
      武鸣县| 兴安县| 林甸县| 潞城市| 新闻| 尼玛县| 徐水县| 汾阳市| 那曲县| 宁化县| 乡宁县| 通道| 松阳县| 巴楚县| 竹溪县| 郧西县| 曲水县| 米泉市| 韶关市| 长春市| 武乡县| 岳阳市| 漳州市| 苗栗县| 德清县| 巴南区| 华池县| 龙游县| 东安县| 温宿县| 门头沟区| 章丘市| 远安县| 甘德县| 苗栗县| 北海市| 盐源县| 广安市| 师宗县| 当雄县| 滕州市|