• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      粗糙集屬性約簡在客戶流失預(yù)測(cè)中的應(yīng)用

      2021-08-06 14:53:11李惟肖
      關(guān)鍵詞:粗糙集特征選擇

      李惟肖

      【摘 ?要】客戶流失預(yù)測(cè)作為客戶關(guān)系管理的主要問題,一直受到研究學(xué)者們的關(guān)注。企業(yè)通過內(nèi)部和外部的數(shù)據(jù)信息,對(duì)客戶流失情況進(jìn)行預(yù)測(cè),針對(duì)還未流失但有流失傾向的客戶采取相應(yīng)的營銷策略。大數(shù)據(jù)時(shí)代使得數(shù)據(jù)信息爆炸式增多,如何處理高維數(shù)據(jù)信息成為客戶流失預(yù)測(cè)的難點(diǎn)。利用粗糙集理論進(jìn)行屬性約簡可以降低數(shù)據(jù)維度,并有效地實(shí)現(xiàn)客戶特征選擇,從而降低客戶流失預(yù)測(cè)的運(yùn)算難度,提高預(yù)測(cè)性能。

      【Abstract】Customer churn prediction, as the main problem of customer relationship management, has always been the focus of researchers. Based on internal and external data information, enterprises can forecast customer turnover and adopt corresponding marketing strategies for customers who have not yet lost but have a tendency to lose. The era of big data makes data information increase explodes, and how to deal with high-dimensional data information becomes the difficulty of customer churn prediction. The attribute reduction using rough set theory can reduce the data dimension and effectively realize the customer feature selection, so as to reduce the operational difficulty of customer churn prediction and improve the prediction performance.

      【關(guān)鍵詞】粗糙集;客戶流失預(yù)測(cè);屬性約簡;特征選擇

      【Keywords】rough set; customer churn prediction; attribute reduction; feature selection

      【中圖分類號(hào)】F274;TP18 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻(xiàn)標(biāo)志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號(hào)】1673-1069(2021)07-0120-02

      1 引言

      客戶關(guān)系管理理論是20世紀(jì)90年代由營銷管理理論衍生出的理論分支,一直備受從業(yè)者和學(xué)者的廣泛關(guān)注??蛻絷P(guān)系管理就是圍繞客戶,一個(gè)客戶為中心進(jìn)行的營銷過程,這一過程通過客戶獲得管理、客戶識(shí)別管理、客戶保持管理3個(gè)階段來實(shí)現(xiàn)客戶與企業(yè)之間長期的合作關(guān)系。這樣不僅有助于降低企業(yè)的交易成本和開發(fā)成本,也能提高營銷效率,增強(qiáng)營銷效果。

      客戶流失管理是客戶關(guān)系管理的重要組成部分,客戶流失一般來說就是指客戶不再消費(fèi)本企業(yè)的產(chǎn)品或服務(wù),也是每個(gè)企業(yè)都會(huì)面臨的問題??蛻袅魇且粋€(gè)不確定事件,客戶流失的形成非一朝一夕,但是往往又悄無聲息、無法察覺。因此,只能通過數(shù)據(jù)分析掌握這種不確定的流失規(guī)律,從而防范因客戶流失產(chǎn)生的經(jīng)營風(fēng)險(xiǎn)和收益損失。近年來,有許多因素都促成了客戶流失預(yù)測(cè)的快速發(fā)展,大數(shù)據(jù)、人工智能、云計(jì)算等互聯(lián)網(wǎng)技術(shù)和信息技術(shù)不斷發(fā)展,使得企業(yè)可以通過收集客戶信息,再運(yùn)用大數(shù)據(jù)計(jì)算、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù)手段處理數(shù)據(jù),建立客戶流失預(yù)測(cè)模型。通過模型可以提取客戶的特征信息,分析預(yù)示客戶流失的行為,計(jì)算客戶在未來流失的概率。但同時(shí),數(shù)據(jù)增多也造成了數(shù)據(jù)“維度災(zāi)難”,分析高維數(shù)據(jù)需要花費(fèi)大量的時(shí)間和成本。因此,需要在高維的數(shù)據(jù)中提取出與客戶流失相關(guān)的客戶特征,并對(duì)這些特征進(jìn)行屬性約簡,兼顧預(yù)測(cè)精度和預(yù)測(cè)效率。

      2 粗糙集理論

      粗糙集理論是1982年由波蘭Pawlak教授提出的,用來處理模糊、不確定、不完整信息和知識(shí)的工具,它能在保持分辨能力不變的情況下,通過知識(shí)約簡,實(shí)現(xiàn)決策或分類。與其他方法相比,粗糙集方法僅利用數(shù)據(jù)本身所提供的信息發(fā)現(xiàn)問題的規(guī)律。粗糙集理論可以與神經(jīng)網(wǎng)絡(luò)、遺傳算法等機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,實(shí)現(xiàn)更廣泛、更強(qiáng)大、更優(yōu)良的功能,在知識(shí)獲取、智能算法、知識(shí)的不確定性度量、數(shù)據(jù)挖掘等方面都有成熟的應(yīng)用。

      定義1:粗糙集理論的知識(shí)表達(dá)系統(tǒng)表示為S=(U,A,V,F(xiàn)),其中:U={u1,u2,…,u|U|}是研究對(duì)象的非空有限集合,稱為論域;A={a1,a2,…,a|U|}是屬性的非空集合;V=UVa,其中a∈A,Va是屬性a的值域;f:U×A→V是一個(gè)信息函數(shù),反映了每個(gè)研究對(duì)象每個(gè)屬性的信息,即?坌a∈A,x∈U,f(x,a)∈Va。知識(shí)表達(dá)系統(tǒng)也叫信息系統(tǒng),S=(U,A,V,f)可以簡化為S=(U,A)。

      定義2:當(dāng)集合A能被集合C和集合D表示,且滿足A=C∪D,C∩D=?覫那么稱集合C為條件屬性集,集合D為決策屬性集。

      屬性子集C'?哿C關(guān)于D的重要性被定義為:σCD(C')=γC(D)-γC-C'(D)。

      當(dāng)C'={a}時(shí),屬性a?哿C關(guān)于D的重要性被定義為:σCD(a)=γC(D)-γC-(a)(D)。

      定義3:對(duì)于給定的信息系統(tǒng)S=(U,A,V,f),若R?哿ind(K),X?哿U,則X的R上近似集和X的R下近似集被定義為:

      3 粗糙集屬性約簡

      粗糙集屬性約簡是粗糙集理論的一個(gè)核心內(nèi)容。大數(shù)據(jù)時(shí)代,數(shù)據(jù)信息量的增大讓學(xué)者們能更準(zhǔn)確真實(shí)地進(jìn)行知識(shí)發(fā)現(xiàn),但高維的數(shù)據(jù)也讓整個(gè)研究過程變得復(fù)雜和煩瑣。在信息系統(tǒng)中,并不是所有的信息都對(duì)人們作出決策或進(jìn)行預(yù)測(cè)有幫助,這其中包含了大量對(duì)目標(biāo)問題毫無貢獻(xiàn)的冗余屬性。因此,在保證信息系統(tǒng)分類不變的情況下,從眾多數(shù)據(jù)信息中去除冗余屬性,不僅可以保持結(jié)果的準(zhǔn)確性,還能降低運(yùn)算的難度和減少運(yùn)算的時(shí)間。這就是粗糙集屬性約簡的過程。

      給定一個(gè)信息系統(tǒng)S=(U,A,V,f),集合C為系統(tǒng)的條件屬性集,集合D為系統(tǒng)的決策屬性集。當(dāng)A滿足以下2個(gè)條件時(shí),稱A是條件屬性C關(guān)于決策屬性D的一個(gè)相對(duì)屬性約簡:

      ①posA(D)=posC(D)。

      ②對(duì)于A的任何一個(gè)真子集B,posB(D)=posC(D)。

      條件①保證了原有的相對(duì)正域不變,條件②說明了A這個(gè)相對(duì)屬性約簡中的屬性不可再減少。設(shè)條件屬性集C={ci|i=1,2,…,n},那么對(duì)于屬性ci來說,如果滿足posC=posC-{C},則說明屬性ci對(duì)于決策是不重要的,可以刪除。條件屬性集C中的每一個(gè)屬性都需要經(jīng)過這一判斷的過程,從而形成相對(duì)屬性約簡集合A。

      4 基于粗糙集屬性約簡的客戶流失預(yù)測(cè)

      客戶流失預(yù)測(cè)包含2個(gè)方面:一個(gè)是識(shí)別流失客戶;另一個(gè)就是客戶價(jià)值評(píng)估。識(shí)別流失客戶就是識(shí)別潛在的流失客戶,在客戶流失之前采取行動(dòng)挽留客戶,這可以看作是一種“防御性”的營銷方法。因?yàn)槲掠脩舻某杀颈韧炝衾嫌脩舻某杀疽?~8倍,但是老客戶的利潤貢獻(xiàn)是新客戶的10倍以上??蛻魞r(jià)值評(píng)估是客戶流失預(yù)測(cè)的另一關(guān)鍵任務(wù),不是所有的客戶都會(huì)給企業(yè)帶來利益。實(shí)際上,根據(jù)80/20法則,大多數(shù)情況下,20%的關(guān)鍵客戶為企業(yè)創(chuàng)造了80%的收入。那么這種情況下,企業(yè)就需要識(shí)別客戶并對(duì)客戶價(jià)值進(jìn)行評(píng)估,形成具有相似特征的多個(gè)客戶群體,向不同的客戶群體分配不同的資源,這樣才能以更少的成本支出獲得更多的經(jīng)濟(jì)收益。進(jìn)行客戶流失預(yù)測(cè)的主要目的是希望根據(jù)預(yù)測(cè)結(jié)果有針對(duì)性地進(jìn)行營銷挽留,如果只有準(zhǔn)確的預(yù)測(cè)而沒有個(gè)性化的營銷方案是不夠的,所以識(shí)別流失客戶和客戶價(jià)值評(píng)估對(duì)于客戶流失預(yù)測(cè)來說同等重要。粗糙集屬性約簡在客戶流失預(yù)測(cè)中的應(yīng)用也主要在這2個(gè)方面。

      粗糙集屬性約簡在識(shí)別流失客戶中的應(yīng)用主要體現(xiàn)在特征選擇。在海量的數(shù)據(jù)中選擇最有效的特征以降低數(shù)據(jù)維度,從而提高預(yù)測(cè)的性能。粗糙集屬性約簡常與機(jī)器學(xué)習(xí)方法結(jié)合進(jìn)行客戶流失預(yù)測(cè),但高維數(shù)據(jù)會(huì)使機(jī)器學(xué)習(xí)的算法大幅增加。而且粗糙集特別適用于處理不確定性的問題,能夠處理不完整、不確定的數(shù)據(jù)。粗糙集理論是在保證不丟失原始信息的情況下,對(duì)數(shù)據(jù)屬性進(jìn)行約簡,約簡過后的屬性特征是剔除了冗余特征后具有代表性的屬性特征,因?yàn)檫@些屬性特征包含了全部的信息,所以預(yù)測(cè)的結(jié)果還是有很高的可信度,卻可以大大降低機(jī)器學(xué)習(xí)的運(yùn)算時(shí)間和運(yùn)算量。

      粗糙集屬性約簡在客戶價(jià)值評(píng)估中的應(yīng)用主要體現(xiàn)在客戶畫像。通過粗糙集進(jìn)行特征選擇后,每個(gè)客戶在這些特征中的表現(xiàn)不一樣,因此可以得到全方位的客戶畫像。對(duì)于企業(yè)來說,看重客戶選擇自己的產(chǎn)品或服務(wù)時(shí)能給自己帶來多少收益,這也就是企業(yè)眼中的客戶價(jià)值,企業(yè)通常根據(jù)客戶畫像來評(píng)價(jià)和分析客戶價(jià)值。對(duì)于有流失傾向的客戶,需要通過客戶畫像才能制定出個(gè)性化的、精確化的、有針對(duì)性的客戶挽留營銷方法。有高流失風(fēng)險(xiǎn)同時(shí)又有高價(jià)值的客戶,企業(yè)可以花費(fèi)更多的成本進(jìn)行挽留。同時(shí)客戶畫像也反映了客戶需求、客戶偏好、客戶行為等信息,針對(duì)這些信息可以提前準(zhǔn)備營銷策略和產(chǎn)品配置,從而預(yù)防客戶流失,盡可能地延長客戶的生命周期,從而企業(yè)可以獲得更長遠(yuǎn)更持久的利益。

      5 結(jié)語

      本文指出了在客戶流失預(yù)測(cè)中采用粗糙集理論進(jìn)行屬性約簡,可以有效地處理不確定、不完整的數(shù)據(jù)信息,在保證信息完全的情況下降低數(shù)據(jù)維度,減少預(yù)測(cè)時(shí)間。通過粗糙集屬性約簡可以對(duì)數(shù)據(jù)集進(jìn)行特征選擇,幫助企業(yè)構(gòu)建客戶畫像、分析客戶價(jià)值。粗糙集屬性約簡去除了冗余數(shù)據(jù),保證了客戶流失預(yù)測(cè)的準(zhǔn)確性,讓企業(yè)可以有針對(duì)性地對(duì)有流失風(fēng)險(xiǎn)的客戶進(jìn)行挽留。

      猜你喜歡
      粗糙集特征選擇
      基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
      基于二進(jìn)制鏈表的粗糙集屬性約簡
      優(yōu)勢(shì)直覺模糊粗糙集決策方法及其應(yīng)用
      Kmeans 應(yīng)用與特征選擇
      電子制作(2017年23期)2017-02-02 07:17:06
      多?;植诩再|(zhì)的幾個(gè)充分條件
      雙論域粗糙集在故障診斷中的應(yīng)用
      基于GA和ELM的電能質(zhì)量擾動(dòng)識(shí)別特征選擇方法
      聯(lián)合互信息水下目標(biāo)特征選擇算法
      基于特征選擇聚類方法的稀疏TSK模糊系統(tǒng)
      兩個(gè)域上的覆蓋變精度粗糙集模型
      正安县| 宝鸡市| 辽宁省| 桐梓县| 南皮县| 天等县| 正宁县| 东莞市| 辽中县| 木里| 新河县| 团风县| 同德县| 修文县| 贺兰县| 鸡东县| 永平县| 长泰县| 高陵县| 兴业县| 潼关县| 保山市| 蓝山县| 桃园市| 湟源县| 阿巴嘎旗| 新密市| 龙江县| 潞西市| 景东| 蒲城县| 比如县| 湖北省| 巢湖市| 沽源县| 平阴县| 横山县| 抚宁县| 武威市| 龙胜| 齐齐哈尔市|