• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)通信話務(wù)預(yù)測(cè)模型

      2015-07-03 09:43:56任君明
      關(guān)鍵詞:話務(wù)量話務(wù)數(shù)據(jù)挖掘

      任君明

      (中國移動(dòng)通信集團(tuán)廣東有限公司江門分公司,江門 529000)

      隨著4G網(wǎng)絡(luò)的快速發(fā)展,移動(dòng)通信業(yè)務(wù)的形態(tài)、結(jié)構(gòu)和客戶行為逐步發(fā)生轉(zhuǎn)變,如何基于歷史話務(wù)數(shù)據(jù)對(duì)未來業(yè)務(wù)量進(jìn)行準(zhǔn)確預(yù)測(cè),并以此指導(dǎo)網(wǎng)絡(luò)投資規(guī)劃、建設(shè)運(yùn)營和市場(chǎng)營銷,這是目前運(yùn)營商無線網(wǎng)絡(luò)規(guī)劃工作的一個(gè)重要研究課題。通過數(shù)據(jù)挖掘技術(shù),建立科學(xué)的預(yù)測(cè)模型,能為話務(wù)預(yù)測(cè)帶來更高的精度,相比傳統(tǒng)粗放的曲線擬合、趨勢(shì)外推等預(yù)測(cè)方法更精準(zhǔn)化,對(duì)運(yùn)營商網(wǎng)絡(luò)精準(zhǔn)規(guī)劃和市場(chǎng)精確營銷具有重要指導(dǎo)意義。

      話務(wù)預(yù)測(cè)是依據(jù)話務(wù)量歷史數(shù)據(jù)和現(xiàn)有信息,建立恰當(dāng)?shù)臄?shù)學(xué)模型對(duì)未來的話務(wù)量進(jìn)行預(yù)測(cè)。話務(wù)預(yù)測(cè)按時(shí)間周期可分為短期、中期和長期預(yù)測(cè);按業(yè)務(wù)類型可分為話音業(yè)務(wù)話務(wù)量預(yù)測(cè)和數(shù)據(jù)業(yè)務(wù)流量預(yù)測(cè)。話務(wù)預(yù)測(cè)流程包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、預(yù)測(cè)模型建立、預(yù)測(cè)誤差分析等步驟。

      數(shù)據(jù)挖掘(Data Mining)是數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database),基于大數(shù)據(jù)分析挖掘,從海量數(shù)據(jù)中揭示出隱含的有潛在價(jià)值的信息。數(shù)據(jù)挖掘通過遺傳算法、決策樹方法、模糊集方法和神經(jīng)網(wǎng)絡(luò)方法等,實(shí)現(xiàn)關(guān)聯(lián)分析、偏差檢測(cè)、聚類分析和趨勢(shì)及行為預(yù)測(cè)等功能。數(shù)據(jù)挖掘的基本過程主要有數(shù)據(jù)篩選、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)分析與同化等步驟。

      本文使用的主要建模工具:一是SPSS Statistics 19.0,用于話務(wù)統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理,以及回歸分析模型、ARIMA時(shí)間序列模型的建模和分析;二是MATLAB 7.0,用于BP神經(jīng)網(wǎng)絡(luò)模型的建模和分析。

      1 話務(wù)預(yù)測(cè)模型

      本文選取某市2010~2013年每月晚忙時(shí)月均話務(wù)量統(tǒng)計(jì)數(shù)據(jù),通過對(duì)2010~2012年話務(wù)量進(jìn)行數(shù)據(jù)挖掘,分別建立回歸分析預(yù)測(cè)模型、BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型以及ARIMA時(shí)間序列預(yù)測(cè)模型等3種預(yù)測(cè)模型,并以2013年的實(shí)際話務(wù)數(shù)據(jù)作為測(cè)試驗(yàn)證,探析3種模型預(yù)測(cè)數(shù)據(jù)與實(shí)際話務(wù)數(shù)據(jù)之間的誤差。本文采用的主要原始數(shù)據(jù)如表1所示。

      表1 某市2010~2013年月均晚忙時(shí)話務(wù)量數(shù)據(jù)表(單位:Erl)

      1.1 回歸分析預(yù)測(cè)模型

      回歸分析預(yù)測(cè)法是在分析自變量和因變量相關(guān)關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,并將回歸方程作為預(yù)測(cè)模型,根據(jù)自變量在預(yù)測(cè)期的數(shù)量變化來預(yù)測(cè)因變量。

      使用SPSS Statistics軟件的回歸分析模塊,對(duì)2010年1月至2012年12月的月均忙時(shí)話務(wù)量數(shù)據(jù)進(jìn)行回歸分析,從話務(wù)量分布圖來看,話務(wù)數(shù)據(jù)的變化趨勢(shì)并非呈線性變化,而是出現(xiàn)多個(gè)不同拐點(diǎn),故選擇SPSS的“曲線估計(jì)”功能建立非線性回歸分析預(yù)測(cè)模型,將話務(wù)量作為因變量,將日期序列作為自變量。通過對(duì)比分析,采用指數(shù)函數(shù)曲線擬合度較高,對(duì)2013年1~12月的話務(wù)量變化趨勢(shì)進(jìn)行預(yù)測(cè),得出指數(shù)回歸分析預(yù)測(cè)模型:

      y=60049.571e0.008x

      對(duì)回歸方程進(jìn)行相關(guān)性檢驗(yàn):回歸方程的方差分析表明,F(xiàn)=121.326,顯著水平為0.000,相關(guān)系數(shù)R2為0.771,該模型具有一定的擬合程度。

      1.2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型

      BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)屬于多層前饋網(wǎng)絡(luò),以誤差逆?zhèn)鞑ニ惴ㄟM(jìn)行訓(xùn)練,學(xué)習(xí)和存儲(chǔ)“輸入-輸出”模式映射關(guān)系,采用最快速下降法,通過反向傳播調(diào)整網(wǎng)絡(luò)權(quán)值,使誤差最小。BP神經(jīng)網(wǎng)絡(luò)模型包含輸入層、隱含層和輸出層。本研究應(yīng)用MATLAB編寫代碼,對(duì)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行建模和仿真。

      1.2.1 BP模型核心算法

      (1)采用2010、2011年月均話務(wù)量為訓(xùn)練集輸入數(shù)據(jù),2012年月均話務(wù)量為訓(xùn)練集輸出數(shù)據(jù)。

      (2)使用newff()函數(shù)創(chuàng)建BP神經(jīng)網(wǎng)絡(luò),隱含層設(shè)置17個(gè)神經(jīng)元,輸出層為1個(gè)神經(jīng)元,隱含層的傳輸函數(shù)為tansig,輸出層的傳輸函數(shù)為purelin,訓(xùn)練函數(shù)為traingdx,使用帶有動(dòng)量項(xiàng)的自適應(yīng)學(xué)習(xí)算法,網(wǎng)絡(luò)的權(quán)值學(xué)習(xí)函數(shù)為learngdm。相關(guān)核心代碼:net=newff(minmax(P),[17,1], {'tansig','purelin'},'traingdx','le arngdm')

      (3)調(diào)用train()函數(shù)進(jìn)行訓(xùn)練。

      (4)將2011、2012年月均話務(wù)數(shù)據(jù)用作測(cè)試集。

      (5)使用sim()函數(shù)對(duì)2013年月均話務(wù)量進(jìn)行仿真預(yù)測(cè),輸出結(jié)果。

      1.2.2 預(yù)測(cè)結(jié)果分析

      通過建立BP神經(jīng)網(wǎng)絡(luò)模型并進(jìn)行仿真預(yù)測(cè),在進(jìn)行201次迭代后,學(xué)習(xí)精度MSE就達(dá)到了0.004 814 2,達(dá)到低于0.005的目標(biāo),學(xué)習(xí)速度較快。BP神經(jīng)網(wǎng)絡(luò)模型對(duì)歷史話務(wù)數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)具有較好的擬合度,預(yù)測(cè)結(jié)果與實(shí)際值偏差不大,本模型中平均絕對(duì)百分誤差MAPE為2.99%,控制在5%以下,對(duì)于中短期話務(wù)預(yù)測(cè),該預(yù)測(cè)模型和預(yù)測(cè)結(jié)果可用。

      1.3 ARIMA時(shí)間序列預(yù)測(cè)模型

      ARIMA模型為自回歸求和移動(dòng)平均模型(Autoregressive Integrated Moving Average Model),用數(shù)學(xué)模型描述預(yù)測(cè)對(duì)象隨時(shí)間產(chǎn)生的數(shù)據(jù)序列的變化規(guī)律和行為,模型考慮季節(jié)變動(dòng)、隨機(jī)波動(dòng)、趨勢(shì)變動(dòng)和循環(huán)變動(dòng)等綜合因素,識(shí)別后的模型能通過時(shí)間序列過去值以及現(xiàn)在值進(jìn)行未來值的精確預(yù)測(cè)。

      本研究運(yùn)用SPSS Statistics建立ARIMA預(yù)測(cè)模型,應(yīng)用“時(shí)間序列建模器”,設(shè)置因變量為“話務(wù)量”,選擇模型為“ARIMA模型”并考慮“季節(jié)”因素,將評(píng)估日期設(shè)置為2013年12個(gè)月,設(shè)定預(yù)測(cè)值變量為“P_預(yù)測(cè)值”,選擇要顯示的R方擬合度量和統(tǒng)計(jì)量等圖表,建立ARIMA模型:ARIMA(0,0,0)(1,1,0)。MAPE為1.71%,對(duì)2013年各月份話務(wù)量的預(yù)測(cè)誤差如表2所示。ARIMA時(shí)間序列預(yù)測(cè)模型對(duì)歷史話務(wù)數(shù)據(jù)具有非常好的擬合度,預(yù)測(cè)結(jié)果與實(shí)際值誤差小,預(yù)測(cè)精度高,對(duì)于中短期話務(wù)預(yù)測(cè),該預(yù)測(cè)模型和預(yù)測(cè)結(jié)果可用。

      表2 ARIMA模型預(yù)測(cè)誤差對(duì)比表

      1.4 3種預(yù)測(cè)模型對(duì)比分析

      1.4.1 誤差對(duì)比

      3種模型預(yù)測(cè)值與實(shí)際值的對(duì)比如圖1所示,預(yù)測(cè)誤差MAPE對(duì)比如表3所示,由此可見,回歸分析模型平均絕對(duì)百分誤差MAPE最大,達(dá)到3.33%;BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)誤差次之,為2.99%;ARIMA時(shí)間序列模型預(yù)測(cè)誤差最小,僅為1.71%,ARIMA模型擬合度和預(yù)測(cè)精度在3種預(yù)測(cè)模型中最高。

      1.4.2 適用場(chǎng)景

      在話務(wù)量預(yù)測(cè)精度要求不高的場(chǎng)景,回歸分析預(yù)測(cè)模型方便快捷,但其考慮的因素不夠全面細(xì)致,雖能一定程度擬合歷史數(shù)據(jù)并對(duì)未來數(shù)據(jù)做出預(yù)測(cè),但誤差相對(duì)較大,不適用于預(yù)測(cè)精度要求較高的場(chǎng)景。

      BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度比回歸分析模型高一些,但BP模型也存在不足,對(duì)于隱含層神經(jīng)元數(shù)量的設(shè)置,需多次對(duì)比試驗(yàn)才能確定較合適值,并且傳輸函數(shù)、訓(xùn)練函數(shù)及相關(guān)參數(shù)的選取也需反復(fù)試驗(yàn)對(duì)比,另外BP模型由于其固有特性,每次仿真運(yùn)算后的預(yù)測(cè)結(jié)果都不盡相同,增加了研究難度和工作量。

      相比之下,ARIMA時(shí)間序列預(yù)測(cè)模型在這3種模型中預(yù)測(cè)誤差最小,對(duì)于預(yù)測(cè)精度要求較高的場(chǎng)景最合適。ARIMA模型對(duì)歷史數(shù)據(jù)具有很高的擬合度,特別能精確反映數(shù)據(jù)變化的拐點(diǎn)和波動(dòng),并且模型還考慮了季節(jié)等因素,具有很高的預(yù)測(cè)精度,在移動(dòng)通信行業(yè)話務(wù)量預(yù)測(cè)領(lǐng)域,具有較顯著的優(yōu)勢(shì),值得進(jìn)一步推廣應(yīng)用。

      表3 3種模型預(yù)測(cè)誤差MAPE對(duì)比表

      圖1 3種模型預(yù)測(cè)值與實(shí)際值對(duì)比圖

      2 智能話務(wù)預(yù)測(cè)管理平臺(tái)架構(gòu)

      將話務(wù)預(yù)測(cè)模型實(shí)現(xiàn)信息化、自動(dòng)化,能為話務(wù)預(yù)測(cè)管理工作帶來質(zhì)的飛躍。智能話務(wù)預(yù)測(cè)管理平臺(tái)面向運(yùn)營商網(wǎng)絡(luò)運(yùn)營、市場(chǎng)運(yùn)營,以及網(wǎng)絡(luò)規(guī)劃、分析和優(yōu)化人員,提供網(wǎng)絡(luò)規(guī)劃管理、話務(wù)預(yù)測(cè)管理和市場(chǎng)營銷管理支撐等功能。系統(tǒng)從整體分成3層:數(shù)據(jù)倉庫、業(yè)務(wù)邏輯層和應(yīng)用層?;跀?shù)據(jù)挖掘技術(shù)的智能話務(wù)預(yù)測(cè)管理平臺(tái)系統(tǒng)架構(gòu)如圖2所示。

      圖2 智能話務(wù)預(yù)測(cè)管理平臺(tái)系統(tǒng)架構(gòu)圖

      3 結(jié)語

      本文主要結(jié)合數(shù)據(jù)挖掘技術(shù),建立了回歸分析預(yù)測(cè)模型、ARIMA時(shí)間序列預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,通過對(duì)比發(fā)現(xiàn)ARIMA時(shí)間序列模型的平均預(yù)測(cè)誤差最小,預(yù)測(cè)精度最高,值得運(yùn)營商在話務(wù)預(yù)測(cè)工作中推廣應(yīng)用。隨著移動(dòng)互聯(lián)網(wǎng)以及4G業(yè)務(wù)的不斷豐富,話務(wù)量已不單單局限于傳統(tǒng)話音通話產(chǎn)生的業(yè)務(wù)量,手機(jī)上網(wǎng)等數(shù)據(jù)業(yè)務(wù)流量所占比重已日益加大,本研究提出的3種話務(wù)預(yù)測(cè)模型,同樣適用于數(shù)據(jù)業(yè)務(wù)流量的預(yù)測(cè)。本文還提出了基于數(shù)據(jù)挖掘技術(shù)的智能話務(wù)預(yù)測(cè)管理平臺(tái)架構(gòu)設(shè)想,為提升話務(wù)預(yù)測(cè)管理工作的高精度化、自動(dòng)化、智能化和信息化提供了有價(jià)值的參考。

      猜你喜歡
      話務(wù)量話務(wù)數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      淺析電信話務(wù)控制
      基于時(shí)間序列模型的異常話務(wù)量分塊建模和預(yù)測(cè)
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      S1240交換機(jī)實(shí)時(shí)話務(wù)量統(tǒng)計(jì)的分析與實(shí)現(xiàn)研究
      “互聯(lián)網(wǎng)+”高速公路客戶服務(wù)話務(wù)平臺(tái)研究
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      多基站調(diào)度網(wǎng)話務(wù)量模型
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      分段預(yù)測(cè)法在GSM網(wǎng)絡(luò)無線話務(wù)量預(yù)測(cè)中的應(yīng)用
      電子世界(2011年9期)2011-04-27 10:29:52
      高要市| 遂川县| 新和县| 宿州市| 永登县| 镇巴县| 呼和浩特市| 虎林市| 庆云县| 灯塔市| 双江| 屏东市| 静宁县| 册亨县| 当阳市| 瑞昌市| 江西省| 资兴市| 县级市| 金川县| 东丽区| 门头沟区| 蒙城县| 电白县| 介休市| 泉州市| 平谷区| 元江| 安仁县| 墨江| 遂溪县| 文成县| 胶南市| 大洼县| 宣威市| 青神县| 巢湖市| 区。| 安龙县| 晴隆县| 普安县|