• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于云模型理論的群體用戶畫像模型①

      2018-06-14 08:48:38姚龍飛何利力
      計算機系統(tǒng)應用 2018年6期
      關鍵詞:云滴畫像定性

      姚龍飛,何利力

      (浙江理工大學 信息學院,杭州 310018)

      隨著計算機技術和網絡技術的飛速發(fā)展,各企業(yè)積累了用戶大量消費數(shù)據(jù),很多領域和行業(yè)開始意識到數(shù)據(jù)是貫穿整過營銷過程的始末,其對營銷的效果起著至關重要的作用,因此如何利用用戶的行為數(shù)據(jù)以及如何利用數(shù)據(jù)對用戶開展精細化營銷成為了企業(yè)在激烈的市場競爭環(huán)境下立于不敗之地的最強有力的后盾.用戶畫像伴隨著數(shù)據(jù)時代而來,旨在通過從海量用戶行為數(shù)據(jù)中練金挖銀,盡可能全面細致地抽出一個用戶的信息全貌,從而幫助解決如何把數(shù)據(jù)轉換為商業(yè)價值的問題.因此如何通過用戶的數(shù)據(jù)準確的刻畫用戶行為并給用戶構建畫像模型是突破當前營銷瓶頸的重要途徑.

      已有學者對如何準確刻畫用戶行為以及如何準確的給用戶構建畫像模型的問題開展了研究,如陳志明等[1]構建了基于用戶基本屬性、社交屬性、興趣屬性和能力屬性四個維度的動態(tài)用戶畫像模型,并對“知乎”網站PM2.5話題下1303位用戶進行了實證分析;姜建武等人[2]在大數(shù)據(jù)理論基礎上提出構建行為-主題、主題-詞匯及行為-詞匯三位一體的數(shù)學模型,來研究基于用戶畫像的信息本體提取方法.采用包含對象、時間、地點、內容、行為和重返次數(shù)六方面內容的事件描述法計算本體權重,以此構建用戶畫像;Chen等[3]建立個體指紋與基因之間的關聯(lián),使用基于MapReduce框架的圖形處理單元嘗試從基因的角度精確的反映用戶信息全貌,建立人體健康信息檔案.王丹[4]提出了一種結合主題模型和點互信息的用戶畫像提取(TM-PMI)方法.從LDA模型的思想、原理以及LDA求解方法—吉布斯采樣等全面描述了用戶文本信息建模的方法.將用戶文本信息主題模型和點互信息結合建立用戶個性化主題詞,得到個性化用戶畫像.

      已有研究方法雖然取得了一定的成果,但現(xiàn)有方案和算法主要是通過定量的標簽來給用戶畫像建立不同的模型,通過這些模型來判斷用戶的行為傾向,而對于用戶行為中出現(xiàn)的大量模糊性與隨機性的標簽無法做到直接建模.鑒于此,本文將引入云模型理論,對用戶群體畫像中基于RFM模型的定性標簽展開研究.

      1 云模型理論概述

      云模型理論是李德毅院士提出的定性與定量轉換模型,能夠實現(xiàn)定性概念與其數(shù)值表示之間的不確定性轉換.其中正態(tài)云是云模型中最重要的模型,具有普適性[5],已經在許多領域有很多成熟的應用[6,7].

      1.1 云和云滴

      設U是用數(shù)值精確表示的一個定量論域,C是U上的一個定性概念,若定量值 χ∈U,χ是定性概念C的一次隨機實現(xiàn),χ對C的確定度μ (χ)∈ [0,1]是有穩(wěn)定傾向的隨機數(shù)滿足:

      則 在論域U上的分布稱為云,每一個 χ稱為一個云滴[8].

      1.2 云的數(shù)字特征

      概念的整體特性可以用云的數(shù)字特征來反映,這是定性概念整體性定量特征,對理解定性概念的內涵和外延有重要的意義[9].

      云模型用期望Ex,熵En和超熵He,3個數(shù)字特征來整體表示一個定性概念.

      期望Ex:定性概念的基本確定性度量,是云滴在論域空間分布的均值(數(shù)學期望).通俗的說,就是最能夠代表定性概念的點.

      熵En:表示定性概念的不確定性度量,它是由概念的模糊性和隨機性共同決定.一方面,熵是定性概念隨機性的度量,反映了能夠代表這個定性概念的云滴離散程度;另一方面,又是隸屬于這個定性概念的度量,決定了論域空間中可被概念接受的云滴確定度.

      超熵He:表示熵的熵,指熵不確定的度量.對于一個定性概念,被普遍接受的程度越高,超熵越小,在云圖上云滴比較聚集;對于難以形成共識的概念,超熵則比較大,在云圖上云滴比較離散.

      1.3 云發(fā)生器

      云發(fā)生器分正向云發(fā)生器和逆向云發(fā)生器[10],它們是云模型核心算法.見算法1及算法2.

      輸入:表示定性概念C的3個數(shù)字特征(Ex,En,He),生成云滴的個數(shù)N.輸出:N個云滴的定量值,及其確定度μ.

      正向高斯云發(fā)生器的運行機理如圖1所示

      圖1 正向高斯云發(fā)生器

      算法步驟:xi1) 計算 的平均值Ex=1 n∑n i=1 xi(1)2) 計算樣本一階絕對中心矩1 n∑ni=1|xi-Ex| (2)3) 計算樣本二階中心矩S=1∑n n-1 i=1(xi-Ex)2 (3)4) 計算En=√π 2?1 n∑ni=1|xi-Ex|0

      逆向高斯云發(fā)生器的運行機理如圖2所示.

      圖2 逆向高斯云發(fā)生器

      2 研究與分析

      2.1 基于云模型用戶畫像設計方案

      為了給用戶制作全方位的精準畫像,本文采用客戶關系管理分析中的RFM模型,RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段,該機械模型通過一個客戶的近期購買行為、購買頻率和每次購買消費的金額3個指標來描述客戶的整體價值.本文從客戶的交易信息中提取RFM模型的3個指標進行分析,綜合運用云模型的理論來得出客戶類型聚類的結果,其具體過程(如圖3)如下:

      1) 采集用戶畫像數(shù)據(jù)并進行數(shù)據(jù)預處理;

      2) 把用戶畫像數(shù)據(jù)劃分為客觀屬性和行為屬性.其中客觀屬性數(shù)據(jù)代表的是用戶固有屬性,在這里把這類固有數(shù)據(jù)處理為用戶的唯一標識,在數(shù)據(jù)庫中作為token(ID)來存儲.行為屬性是用戶畫像建模的主要數(shù)據(jù)來源,這些屬性數(shù)據(jù)分別劃分為定量屬性與定性屬性;

      3) 為了消除數(shù)據(jù)帶來的影響,需要對數(shù)據(jù)進行標準化處理;

      4) 將標準化處理后的定量數(shù)據(jù)通過逆向高斯云發(fā)生器,將定量屬性轉換為定性屬性.定性屬性作為建模的起點,分為時間間隔云模型、消費頻率云模型、消費金額云模型,如表1所示;

      表1 用戶畫像指標

      5) 通過云模型聚類算法生成用戶畫像聚類云模型;

      6) 經過正向高斯云發(fā)生器將用戶畫像聚類云模型轉換為量化的用戶畫像數(shù)值區(qū)間;

      7) 由量化的用戶畫像數(shù)值區(qū)間分析得出用戶群體聚類模型.

      圖3 基于云模型用戶畫像設計流程

      2.2 基于云模型的聚類算法

      云模型聚類算法是將傳統(tǒng)的K-means算法引入到定性概念聚類的領域,是對K-means算法應用領域的一次拓展,該算法的核心是基于云模型理論,涉及云模型的相似度、綜合云等等.通過該算法可以對定性概念聚類分析.

      2.2.1 綜合云

      定義1.將兩個及以上具有相同屬性特征的云模型進行綜合,得到一個高層次的云模型,叫做綜合云[11].

      設在論域U中有b個同類型子云C1(Ex1,En1,He1),C2(Ex2,En2,He2),···,Cb(Exb,Enb,Heb)

      則綜合云表示為

      其中,E xk,E nk,H ek分別為各子云的數(shù)字特征.

      2.2.2 云模型相似度

      定義2.任意具有相同屬性特征的云模型的相似程度叫云模型相似度[12],采用余弦相似度來定量表示:

      設在論域U中任意2個同類屬性云為則有

      2.2.3 云模型聚類算法描述

      為了借助K-means算法來分析云模型,設計了算法3.

      算法3.基于云模型的聚類算法輸入:聚類的個數(shù)K,K個云模型聚類中心.輸出:K個聚類中心簇.1) 從用戶畫像云模型集合V={V1,…,Vm}中任意檢索出K個初始化云模型聚類中心,記作初始化聚類云模型集合U={U1,…,Uk};云模型指標集合記為C={C1,…,Cj};云模型相似度集合記為S.2) 計算用戶云模型集合元素與云模型聚類中心元素的定性相似度(先遍歷U,然后遍歷V).for each Uiin Udo for each Vjin Vdo//計算集合U中每一個元素Uik與集合V中每一個元素Vjk的云模 ;in Sdo S中.3) 根據(jù)相似度的最大值取出云模型聚類元素,放入到對應的Gi集合中(先遍歷V,然后遍歷U).for each Vjin Vdo for each Uiin Udoif //F大于聚類云模型集合Gi中最小值then 式(6),(7),(8)// 新的聚類中心4) 設定閾值F重復步驟2),3).end

      3 實驗分析

      本節(jié)的仿真實驗軟硬件以及編程平臺如下:Intel(R)Core(TM) i5 CPU,6 GB內存,操作系統(tǒng)為Windows 10,在MATLAB環(huán)境下進行仿真實驗.

      本節(jié)將對前文提出的聚類云模型算法進行場景模擬仿真分析,以驗證該算法在實際場景中的應用效果,從而達到指導商家開展相應的個性化促銷目的.

      本仿真數(shù)據(jù)來自于浙江中煙CRM系統(tǒng)中客戶交易的記錄,從中抽取2000位客戶(2016.7-2017.6的數(shù)據(jù))作為此次抽取的樣本對象.每位客戶的交易信息包括姓名,每一個自然月(從上個月最后一個非完整周的周一到本月最后一個完整周的周日)購買時間區(qū)間(T)、每一個自然月內距最近一次購買時間間隔(R)、每一個自然月內購買次數(shù)(F)、每一個自然月內消費總金額(C).

      3.1 數(shù)據(jù)處理與分析

      (1)數(shù)據(jù)預處理,即對2000位客戶的原始數(shù)據(jù)整理得到每一個客戶在2016.7-2017.6區(qū)間內的交易記錄結果(局部)如表2所示.

      表2 某郭姓客戶2016.7-2017.6區(qū)間內的交易記錄

      對表2的數(shù)據(jù)標準化處理,以消除數(shù)據(jù)之間的影響.

      (2)由公式(1)至(5)得到每一個客戶的3種云模型(局部),如表3所示.

      表3 用戶畫像云模型指標值(局部)

      (3)由聚類云模型算法得到每一類畫像聚類數(shù)和聚類中心.結果如表4所示.

      (4)客戶價值分析,即云模型的3個數(shù)字特征參數(shù)中,期望(Ex)代表用戶畫像某種行為特征的最可能取值,熵(En)反映了用戶畫像某種行為特征所有的取值相對于期望(Ex)的離散度,熵越大代表該用戶畫像所代表的某種行為屬性的穩(wěn)定性低.通過期望(Ex)和熵(En)可以近似的將云圖轉換為一個區(qū)間的取值.超熵(He)反映了熵的離散程度,超熵越小云滴越聚集在云圖的輪廓線附近.

      一個云圖是由許許多多的具有3個數(shù)字特征的云滴組成,所有的云滴對某種定性概念的形成都有貢獻,不同的云滴群對概念的貢獻是不同的[13],根據(jù)李德毅院士證明的高斯云“3En規(guī)則”(如圖4所示),即可以忽略[Ex-3En,Ex+3En]區(qū)間外的云滴對定性概念的貢獻.

      表4 云模型聚類結果

      圖4 論域中的元素對定性概念的貢獻

      由表4中云模型聚類的結果,得到了每一類群體畫像的云模型指標,將云模型的指標通過正向高斯云發(fā)生器得到每一個云模型的云圖,這里取云滴數(shù)為2000.云圖結果如圖5至圖8所示.通過云圖的分布,能夠比較清晰的看到各群體用戶基于RFM指標的分布情況.

      根據(jù)高斯云“3En規(guī)則”,由期望(Ex)和熵(En)可以近似的將云圖轉換為一個量化的區(qū)間范圍,得到如表5結果,該區(qū)間取值的范圍大致描述了對應的用戶畫像模型.

      為了從用戶畫像中分析得出各種類型畫像的映射群體及群體代表的用戶特征,取高斯云“3En規(guī)則”的區(qū)間中點代表該行為屬性的聚集點,得到客戶群特征圖,如圖9所示

      如上圖所示,通過縱向比較,消費頻率在畫像一所代表的群體中該特征比較明顯;消費金額在畫像一、畫像二、畫像三所代表的群體中該特征均表現(xiàn)明顯,在畫像四所代表的群體中該特征比較弱;時間間隔在畫像三、畫像四所代表的群體中特征比較明顯,在畫像一、畫像二所代表的群體中該特征比較弱.從圖中可以看出,每一類型的用戶畫像都具有顯著不同的特征,通過對不同類型的畫像和用戶行為特征的分析,將這四種畫像映射為四類群體:重要保持客戶、重要挽留客戶、重要發(fā)展客戶、低價值客戶[14].即如圖10所示.

      3.4 應用

      根據(jù)本節(jié)的實驗分析結果,得到基于云模型的RFM指標聚類的用戶畫像群體映射為重要保留客戶、重要發(fā)展客戶、重要挽留客戶、低價值客戶,針對這四類群體的特征來指導企業(yè)開展相應的商業(yè)營銷活動.

      (1) 重要保留客戶:該類客戶的特征是消費頻率高、消費的金額高、最近一次消費的時間離統(tǒng)計的節(jié)點比較近.這類客戶具有很高的消費能力,同時他們對該企業(yè)的產品具有很高的忠誠度,是企業(yè)最理想的客戶,對他們進行差異化管理和一對一營銷,不斷提高該用戶的忠誠度與滿意度,盡可能延長其高消費的水平.

      (2) 重要發(fā)展客戶:該類客戶的特征是消費頻率低、消費的金額高、最近一次消費的時間離統(tǒng)計的節(jié)點比較近.他們是企業(yè)潛在客戶,既是容易流失的客戶類型也是容易發(fā)展為企業(yè)忠臣客戶的類型,企業(yè)需要針對該類型的客戶制定相應的策略來提高該類客戶的滿意度,提高他們對企業(yè)產品消費的頻率,使他們逐漸成為企業(yè)的忠誠客戶.

      圖5 畫像一云模型

      圖6 畫像二云模型

      圖7 畫像三云模型

      圖8 畫像四云模型

      表5 用戶畫像區(qū)間取值范圍

      圖9 用戶畫像聚類特征圖

      圖10 客戶群體特征圖

      (3) 重要挽留客戶:該類客戶的特征是消費頻率低、消費金額高、最近一次消費的時間離統(tǒng)計的節(jié)點很久遠.該類客戶價值變化的模糊性和隨機性比較大,對這類客戶需要企業(yè)多方面掌握該客戶的信息,重點聯(lián)系,采取一定的營銷策略來延長該類客戶的生命周期.

      (4) 低價值客戶:該類的客戶的特征是消費頻率低、消費金額低、最近一次消費的時間離統(tǒng)計的節(jié)點很久遠.該類客戶可能只在企業(yè)做活動時才會消費.這類客戶是企業(yè)的邊緣客戶,在營銷上的成本比較大,但這類客戶在某種程度上是企業(yè)產品的宣傳大軍,是企業(yè)可以留意的的客戶群體.

      因此,通過云模型的聚類分析得到用戶畫像群體,有助于企業(yè)對客戶進行細分,根據(jù)客戶的不同特征,企業(yè)可以為每類群體制定個性化的營銷策略.提高企業(yè)在市場中的競爭力.

      4 結論與展望

      在大數(shù)據(jù)時代,如何利用海量的用戶數(shù)據(jù)來為企業(yè)創(chuàng)造價值是一個非常重要的課題,本文通過基于RFM模型的三個指標對用戶行為進行分析,構建了基于RFM模型的云模型,基于云模型的理論分析用戶不確定性與模糊性的行為,構建用戶畫像模型.不僅為企業(yè)實施精準營銷提供了借鑒,同時也為大數(shù)據(jù)時代研究精準營銷提供了一點思路.

      雖然本文用戶畫像構建不是很全面,有關模型的指標也僅僅是局限在RFM模型,但后續(xù)研究者可以針對企業(yè)的自身情況從RFM指標上拓展,使得該指標更全面的反映客戶關系管理各種要素.同時基于云模型的聚類算法的復雜度需要進一步優(yōu)化,本文僅僅是對2000位客戶分析,如果數(shù)據(jù)量非常大的話該算法效率就非常低,后續(xù)研究可以考慮通過Hadoop平臺的MapReduce[15]運算框架來處理大量的客戶信息數(shù)據(jù).

      1 陳志明,胡震云.UGC網站用戶畫像研究.計算機系統(tǒng)應用,2017,26(1):24-30.[doi:10.15888/j.cnki.csa.005543]

      2 姜建武,李景文,陸妍玲,等.基于用戶畫像的信息智能推送方法.微型機與應用,2016,35(23):86-89,92.

      3 Chen GC,Zhao JY,Cohen T,et al.Using ontology fingerprints to disambiguate gene name entities in the biomedical literature.Database,2015,2015:bav034.[doi:10.1093/database/bav034]

      4 王丹.基于主題模型的用戶畫像提取算法研究[碩士學位論文].北京:北京工業(yè)大學,2016.

      5 李德毅,劉常昱.論正態(tài)云模型的普適性.中國工程科學,2004,6(8):28-34.

      6 Wu AY,Ma ZG,Zeng GP.Set pair fuzzy decision method based on cloud model.Chinese Journal of Electronics,2016,25(2):215-219.[doi:10.1049/cje.2016.03.004]

      7 Du RX,Rong H,Xian M,et al.A measurement method of threat for co-residency detection based on cloud model.Proceedings of 2016 International Conference on Computer,Mechatronics and Electronic Engineering (CMEE 2016).Beijing,China.2016.8.

      8 崔天寶.基于云模型的短期電價預測的研究[碩士學位論文].保定:華北電力大學(河北),2008.

      9 李德毅,杜鹢.不確定性人工智能.2版.北京:國防工業(yè)出版社,2014.40-56.

      10 劉常昱,李德毅,杜鹢,等.正態(tài)云模型的統(tǒng)計分析.信息與控制,2005,34(2):236-239,248.

      11 李克潮,凌霄娥.云模型與用戶聚類的個性化推薦.計算機應用,2013,33(10):2804-2806,2826.

      12 陳平華,陳傳瑜.基于云模型的用戶雙重聚類推薦算法.計算機工程與科學,2015,37(7):1245-1251.

      13 李德毅.知識表示中的不確定性.中國工程科學,2000,2(10):73-79.[doi:10.3969/j.issn.1009-1742.2000.10.018]

      14 丁欣.東方航空公司機票營銷渠道優(yōu)化策略研究[碩士學位論文].上海:復旦大學,2013.

      15 Wang JY,Yao Y,Mao Y,et al.OMO:Optimize MapReduce overlap with a good start (reduce) and a good finish (map).Proceedings of the 34th IEEE International Performance Computing and Communications Conference.Nanjing,China.2015.1-8.

      猜你喜歡
      云滴畫像定性
      威猛的畫像
      分裂平衡問題的Levitin-Polyak適定性
      福建九仙山一次佛光的云滴粒子尺度分析*
      海峽科學(2021年12期)2021-02-23 09:43:28
      “00后”畫像
      畫像
      你不知道的雷雨知識
      當歸和歐當歸的定性與定量鑒別
      中成藥(2018年12期)2018-12-29 12:25:44
      云微物理特性及云滴有效半徑參數(shù)化:一次降水層狀云的飛機觀測資料結果
      云滴譜離散度對氣溶膠間接效應影響的研究進展
      共同認識不明確的“碰瓷”行為的定性
      天峨县| 宣城市| 息烽县| 珲春市| 密云县| 炉霍县| 宜阳县| 香港 | 漳浦县| 嘉禾县| 闽清县| 霍城县| 宝丰县| 江口县| 女性| 青田县| 翁源县| 永年县| 蚌埠市| 灵台县| 江都市| 枣阳市| 楚雄市| 屯门区| 称多县| 吉木乃县| 曲阳县| 稷山县| 闵行区| 麻城市| 焦作市| 雅江县| 南昌市| 怀宁县| 洛浦县| 玛沁县| 化德县| 密云县| 武穴市| 新晃| 朔州市|