朱立君 張瑞
一、引言
目前短消息業(yè)務與話音業(yè)務一樣,已經(jīng)成為移動通信網(wǎng)絡提供的基本電信業(yè)務之一。通常短消息業(yè)務可分為點對點短消息和夢網(wǎng)、行業(yè)短消息兩大類,這兩類短消息都與人們的日常生活密切相關,特別是點對點短消息,已經(jīng)成為人們?nèi)粘Mㄐ胖胁豢苫蛉钡囊徊糠帧?/p>
二、時間序列模型
2.1 時間序列模型的定義
時間序列是隨時間改變而隨機地變化的序列,時間序列預測模型的目的是找出它的變化規(guī)律,從而利用規(guī)律來預測將來的走勢,現(xiàn)有的時間序列預測模型通常包括三類:
(1)自回歸模型(AR):反映數(shù)據(jù)變量的當前值與其過去值的關系
其中p為AR(p)模型的階數(shù),ut為均值為0,方差為某值的白噪聲信號。
(2)移動平均模型(MA):反映數(shù)據(jù)變量當前值與當前及過去誤差項的關系
其中q為MA(q)模型的階數(shù),ut為均值為0,方差為某值的白噪聲信號。
兩者結合的模型(ARMA),如果時間序列Yt是它的當期和前期的隨機誤差項以及前期值的線性函數(shù),即可表示為:
則稱該序列為(p,q)階自回歸移動平均模型,ut為均值為0,方差為某值的白噪聲信號。記為ARMA(p,q)。
2.2 時間序列分析模型的識別
對于AR、MA、ARMA模型,在進行參數(shù)估計之前,需要進行模型的識別。識別的基本任務是確定時間序列樣本屬于哪種模型,并找出ARMA(p,q)、AR(p)、MA(q)模型的階。識別的方法是利用時間序列樣本的自相關函數(shù)和偏自相關函數(shù)進行判斷,判斷方法如表1所示。
拖尾是指函數(shù)值隨著自變量的增大以負指數(shù)速度趨向于0,截尾是指函數(shù)值在自變量為某值時不為0,在此值以后等于0。
三、某省短消息業(yè)務量預測示例
3.1 歷史數(shù)據(jù)分析
根據(jù)某省移動(簡稱A?。﹫蟊頂?shù)據(jù),統(tǒng)計該省從2005年1月起至2011年12月每月最忙天點對點短消息業(yè)務量,如圖1所示:
可以看出,A省點對點短消息話務量存在以下特點:(1)存在假日效應——即每逢“春節(jié)”、“中秋”、“圣誕”等節(jié)假日到來之際,業(yè)務量會呈現(xiàn)突發(fā)性增長,每年春節(jié)達到該年業(yè)務量峰值。(2)非節(jié)假日時點對點短消息業(yè)務量處于較低水平。(3)點對點短消息業(yè)務量歷年峰值呈逐年上升趨勢。
3.2 點對點短消息業(yè)務量預測
A省點對點短消息業(yè)務量可看作為時間序列,下面將利用時間序列預測模型,通過MATLAB軟件仿真,對A省點對點短消息業(yè)務量進行預測。
(1)統(tǒng)計A省點對點短消息業(yè)務量歷史數(shù)據(jù),如表2所示:
(2)由于除夕峰值數(shù)據(jù)較少,為了提高預測的準確性,在相鄰兩年除夕業(yè)務量間做3個點的插值,增加數(shù)據(jù)量,具體程序如下:
mtbf=xlsread('E:\000.xlsx','A1:A7');
length_of_x=length(mtbf);
x=1:4:length_of_x+3*length_of_x;
scalar_x=x(1):1:x(length_of_x);
length_of_sx=length(scalar_x);
for i=1:length(scalar_x);
mtbf_spline(i)=fix(interp1(x,mtbf,scalar_x(i),'spline'));
end
z=mtbf_spline;
(3)由于時間序列預測模型要求樣本為平穩(wěn)序列,所以判斷樣本數(shù)據(jù)序列是否為平穩(wěn)序列,若為非平穩(wěn)序列則對序列進行差分,轉化為平穩(wěn)序列,具體程序如下:
f=[];
for n=1:20;
H=adftest(z);
if H==1;
break;
end
f(n)=z(1);
z=diff(z);
end
得出n=5,即對原序列做4次差分后,序列轉化為平穩(wěn)序列。
(4)求平穩(wěn)序列的自相關和偏相關函數(shù),如圖2所示。
autocorr(z)
[a,b] = autocorr(z)
subplot(2,1,2);
parcorr(z)
[c,d] = parcorr(z)
可以看出自相關函數(shù)拖尾,偏相關函數(shù)截尾,所以該序列適用于AR模型。
(5)確定AR模型的階數(shù)及系數(shù),具體程序如下。
test=[];
for q=1:10
m=ar(z,q,'gl');
AIC=aic(m)
test=[test;q AIC];
end
for k = 1:size(test,1)
if test(k,2) == min(test(:,2))
q_test = test(k,1)
break;
end
end
m=ar(z,q_test,'gl');
MATLAB輸出模型為A(q)=1-0.4444q^-1,即AR模型為
Yt=0.4444Yt-1+ut
ut為均值為0,方差為某值的白噪聲信號。
(6)對平穩(wěn)序列進行預測,并對結果做反差分運算,得出樣本數(shù)據(jù)的預測數(shù)據(jù),具體程序如下。
m=ar(z,q_test,'gl')
z1= iddata([z 0 0 0 0 0]');
P1=predict(m,z1,1);
PreR=P1.OutputData;
for i=n-1:-1:1
PreR=[f(i);PreR];
PreR=cumsum(PreR);
end
得出預測序列統(tǒng)計表如表3所示:
3.3 與實際業(yè)務量的比較
根據(jù)2005年除夕至2012年除夕A省實際點對點短消息業(yè)務量數(shù)據(jù)及表3中預測值繪制曲線如圖3所示:
2012年除夕點對點短消息業(yè)務量預測值為629600000,實際值為643289929,預測誤差為2.1%,因此時間序列預測模型較準確地預測了2012年除夕點對點短消息業(yè)務量。
四、結束語
短消息業(yè)務量的預測可以采用多種方法,本文基于時間序列模型,通過MATLAB軟件仿真,對A省2012年除夕點對點短消息業(yè)務量進行了預測,取得了較好的預測結果,對后續(xù)短消息中心的建設具有一定的參考意義。
一、引言
目前短消息業(yè)務與話音業(yè)務一樣,已經(jīng)成為移動通信網(wǎng)絡提供的基本電信業(yè)務之一。通常短消息業(yè)務可分為點對點短消息和夢網(wǎng)、行業(yè)短消息兩大類,這兩類短消息都與人們的日常生活密切相關,特別是點對點短消息,已經(jīng)成為人們?nèi)粘Mㄐ胖胁豢苫蛉钡囊徊糠帧?/p>
二、時間序列模型
2.1 時間序列模型的定義
時間序列是隨時間改變而隨機地變化的序列,時間序列預測模型的目的是找出它的變化規(guī)律,從而利用規(guī)律來預測將來的走勢,現(xiàn)有的時間序列預測模型通常包括三類:
(1)自回歸模型(AR):反映數(shù)據(jù)變量的當前值與其過去值的關系
其中p為AR(p)模型的階數(shù),ut為均值為0,方差為某值的白噪聲信號。
(2)移動平均模型(MA):反映數(shù)據(jù)變量當前值與當前及過去誤差項的關系
其中q為MA(q)模型的階數(shù),ut為均值為0,方差為某值的白噪聲信號。
兩者結合的模型(ARMA),如果時間序列Yt是它的當期和前期的隨機誤差項以及前期值的線性函數(shù),即可表示為:
則稱該序列為(p,q)階自回歸移動平均模型,ut為均值為0,方差為某值的白噪聲信號。記為ARMA(p,q)。
2.2 時間序列分析模型的識別
對于AR、MA、ARMA模型,在進行參數(shù)估計之前,需要進行模型的識別。識別的基本任務是確定時間序列樣本屬于哪種模型,并找出ARMA(p,q)、AR(p)、MA(q)模型的階。識別的方法是利用時間序列樣本的自相關函數(shù)和偏自相關函數(shù)進行判斷,判斷方法如表1所示。
拖尾是指函數(shù)值隨著自變量的增大以負指數(shù)速度趨向于0,截尾是指函數(shù)值在自變量為某值時不為0,在此值以后等于0。
三、某省短消息業(yè)務量預測示例
3.1 歷史數(shù)據(jù)分析
根據(jù)某省移動(簡稱A?。﹫蟊頂?shù)據(jù),統(tǒng)計該省從2005年1月起至2011年12月每月最忙天點對點短消息業(yè)務量,如圖1所示:
可以看出,A省點對點短消息話務量存在以下特點:(1)存在假日效應——即每逢“春節(jié)”、“中秋”、“圣誕”等節(jié)假日到來之際,業(yè)務量會呈現(xiàn)突發(fā)性增長,每年春節(jié)達到該年業(yè)務量峰值。(2)非節(jié)假日時點對點短消息業(yè)務量處于較低水平。(3)點對點短消息業(yè)務量歷年峰值呈逐年上升趨勢。
3.2 點對點短消息業(yè)務量預測
A省點對點短消息業(yè)務量可看作為時間序列,下面將利用時間序列預測模型,通過MATLAB軟件仿真,對A省點對點短消息業(yè)務量進行預測。
(1)統(tǒng)計A省點對點短消息業(yè)務量歷史數(shù)據(jù),如表2所示:
(2)由于除夕峰值數(shù)據(jù)較少,為了提高預測的準確性,在相鄰兩年除夕業(yè)務量間做3個點的插值,增加數(shù)據(jù)量,具體程序如下:
mtbf=xlsread('E:\000.xlsx','A1:A7');
length_of_x=length(mtbf);
x=1:4:length_of_x+3*length_of_x;
scalar_x=x(1):1:x(length_of_x);
length_of_sx=length(scalar_x);
for i=1:length(scalar_x);
mtbf_spline(i)=fix(interp1(x,mtbf,scalar_x(i),'spline'));
end
z=mtbf_spline;
(3)由于時間序列預測模型要求樣本為平穩(wěn)序列,所以判斷樣本數(shù)據(jù)序列是否為平穩(wěn)序列,若為非平穩(wěn)序列則對序列進行差分,轉化為平穩(wěn)序列,具體程序如下:
f=[];
for n=1:20;
H=adftest(z);
if H==1;
break;
end
f(n)=z(1);
z=diff(z);
end
得出n=5,即對原序列做4次差分后,序列轉化為平穩(wěn)序列。
(4)求平穩(wěn)序列的自相關和偏相關函數(shù),如圖2所示。
autocorr(z)
[a,b] = autocorr(z)
subplot(2,1,2);
parcorr(z)
[c,d] = parcorr(z)
可以看出自相關函數(shù)拖尾,偏相關函數(shù)截尾,所以該序列適用于AR模型。
(5)確定AR模型的階數(shù)及系數(shù),具體程序如下。
test=[];
for q=1:10
m=ar(z,q,'gl');
AIC=aic(m)
test=[test;q AIC];
end
for k = 1:size(test,1)
if test(k,2) == min(test(:,2))
q_test = test(k,1)
break;
end
end
m=ar(z,q_test,'gl');
MATLAB輸出模型為A(q)=1-0.4444q^-1,即AR模型為
Yt=0.4444Yt-1+ut
ut為均值為0,方差為某值的白噪聲信號。
(6)對平穩(wěn)序列進行預測,并對結果做反差分運算,得出樣本數(shù)據(jù)的預測數(shù)據(jù),具體程序如下。
m=ar(z,q_test,'gl')
z1= iddata([z 0 0 0 0 0]');
P1=predict(m,z1,1);
PreR=P1.OutputData;
for i=n-1:-1:1
PreR=[f(i);PreR];
PreR=cumsum(PreR);
end
得出預測序列統(tǒng)計表如表3所示:
3.3 與實際業(yè)務量的比較
根據(jù)2005年除夕至2012年除夕A省實際點對點短消息業(yè)務量數(shù)據(jù)及表3中預測值繪制曲線如圖3所示:
2012年除夕點對點短消息業(yè)務量預測值為629600000,實際值為643289929,預測誤差為2.1%,因此時間序列預測模型較準確地預測了2012年除夕點對點短消息業(yè)務量。
四、結束語
短消息業(yè)務量的預測可以采用多種方法,本文基于時間序列模型,通過MATLAB軟件仿真,對A省2012年除夕點對點短消息業(yè)務量進行了預測,取得了較好的預測結果,對后續(xù)短消息中心的建設具有一定的參考意義。
一、引言
目前短消息業(yè)務與話音業(yè)務一樣,已經(jīng)成為移動通信網(wǎng)絡提供的基本電信業(yè)務之一。通常短消息業(yè)務可分為點對點短消息和夢網(wǎng)、行業(yè)短消息兩大類,這兩類短消息都與人們的日常生活密切相關,特別是點對點短消息,已經(jīng)成為人們?nèi)粘Mㄐ胖胁豢苫蛉钡囊徊糠帧?/p>
二、時間序列模型
2.1 時間序列模型的定義
時間序列是隨時間改變而隨機地變化的序列,時間序列預測模型的目的是找出它的變化規(guī)律,從而利用規(guī)律來預測將來的走勢,現(xiàn)有的時間序列預測模型通常包括三類:
(1)自回歸模型(AR):反映數(shù)據(jù)變量的當前值與其過去值的關系
其中p為AR(p)模型的階數(shù),ut為均值為0,方差為某值的白噪聲信號。
(2)移動平均模型(MA):反映數(shù)據(jù)變量當前值與當前及過去誤差項的關系
其中q為MA(q)模型的階數(shù),ut為均值為0,方差為某值的白噪聲信號。
兩者結合的模型(ARMA),如果時間序列Yt是它的當期和前期的隨機誤差項以及前期值的線性函數(shù),即可表示為:
則稱該序列為(p,q)階自回歸移動平均模型,ut為均值為0,方差為某值的白噪聲信號。記為ARMA(p,q)。
2.2 時間序列分析模型的識別
對于AR、MA、ARMA模型,在進行參數(shù)估計之前,需要進行模型的識別。識別的基本任務是確定時間序列樣本屬于哪種模型,并找出ARMA(p,q)、AR(p)、MA(q)模型的階。識別的方法是利用時間序列樣本的自相關函數(shù)和偏自相關函數(shù)進行判斷,判斷方法如表1所示。
拖尾是指函數(shù)值隨著自變量的增大以負指數(shù)速度趨向于0,截尾是指函數(shù)值在自變量為某值時不為0,在此值以后等于0。
三、某省短消息業(yè)務量預測示例
3.1 歷史數(shù)據(jù)分析
根據(jù)某省移動(簡稱A?。﹫蟊頂?shù)據(jù),統(tǒng)計該省從2005年1月起至2011年12月每月最忙天點對點短消息業(yè)務量,如圖1所示:
可以看出,A省點對點短消息話務量存在以下特點:(1)存在假日效應——即每逢“春節(jié)”、“中秋”、“圣誕”等節(jié)假日到來之際,業(yè)務量會呈現(xiàn)突發(fā)性增長,每年春節(jié)達到該年業(yè)務量峰值。(2)非節(jié)假日時點對點短消息業(yè)務量處于較低水平。(3)點對點短消息業(yè)務量歷年峰值呈逐年上升趨勢。
3.2 點對點短消息業(yè)務量預測
A省點對點短消息業(yè)務量可看作為時間序列,下面將利用時間序列預測模型,通過MATLAB軟件仿真,對A省點對點短消息業(yè)務量進行預測。
(1)統(tǒng)計A省點對點短消息業(yè)務量歷史數(shù)據(jù),如表2所示:
(2)由于除夕峰值數(shù)據(jù)較少,為了提高預測的準確性,在相鄰兩年除夕業(yè)務量間做3個點的插值,增加數(shù)據(jù)量,具體程序如下:
mtbf=xlsread('E:\000.xlsx','A1:A7');
length_of_x=length(mtbf);
x=1:4:length_of_x+3*length_of_x;
scalar_x=x(1):1:x(length_of_x);
length_of_sx=length(scalar_x);
for i=1:length(scalar_x);
mtbf_spline(i)=fix(interp1(x,mtbf,scalar_x(i),'spline'));
end
z=mtbf_spline;
(3)由于時間序列預測模型要求樣本為平穩(wěn)序列,所以判斷樣本數(shù)據(jù)序列是否為平穩(wěn)序列,若為非平穩(wěn)序列則對序列進行差分,轉化為平穩(wěn)序列,具體程序如下:
f=[];
for n=1:20;
H=adftest(z);
if H==1;
break;
end
f(n)=z(1);
z=diff(z);
end
得出n=5,即對原序列做4次差分后,序列轉化為平穩(wěn)序列。
(4)求平穩(wěn)序列的自相關和偏相關函數(shù),如圖2所示。
autocorr(z)
[a,b] = autocorr(z)
subplot(2,1,2);
parcorr(z)
[c,d] = parcorr(z)
可以看出自相關函數(shù)拖尾,偏相關函數(shù)截尾,所以該序列適用于AR模型。
(5)確定AR模型的階數(shù)及系數(shù),具體程序如下。
test=[];
for q=1:10
m=ar(z,q,'gl');
AIC=aic(m)
test=[test;q AIC];
end
for k = 1:size(test,1)
if test(k,2) == min(test(:,2))
q_test = test(k,1)
break;
end
end
m=ar(z,q_test,'gl');
MATLAB輸出模型為A(q)=1-0.4444q^-1,即AR模型為
Yt=0.4444Yt-1+ut
ut為均值為0,方差為某值的白噪聲信號。
(6)對平穩(wěn)序列進行預測,并對結果做反差分運算,得出樣本數(shù)據(jù)的預測數(shù)據(jù),具體程序如下。
m=ar(z,q_test,'gl')
z1= iddata([z 0 0 0 0 0]');
P1=predict(m,z1,1);
PreR=P1.OutputData;
for i=n-1:-1:1
PreR=[f(i);PreR];
PreR=cumsum(PreR);
end
得出預測序列統(tǒng)計表如表3所示:
3.3 與實際業(yè)務量的比較
根據(jù)2005年除夕至2012年除夕A省實際點對點短消息業(yè)務量數(shù)據(jù)及表3中預測值繪制曲線如圖3所示:
2012年除夕點對點短消息業(yè)務量預測值為629600000,實際值為643289929,預測誤差為2.1%,因此時間序列預測模型較準確地預測了2012年除夕點對點短消息業(yè)務量。
四、結束語
短消息業(yè)務量的預測可以采用多種方法,本文基于時間序列模型,通過MATLAB軟件仿真,對A省2012年除夕點對點短消息業(yè)務量進行了預測,取得了較好的預測結果,對后續(xù)短消息中心的建設具有一定的參考意義。