徐孝琳,周小偉,朱家明
(安徽財經(jīng)大學統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
?
基于時間序列模型的上海證券融券余額分析與預測
徐孝琳,周小偉,朱家明
(安徽財經(jīng)大學統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
摘要:針對上海證券融資融券當日融資余額的分析與預測問題,建立ARMA自回歸移動模型,搜集從2014-08-21到2015-06-16的數(shù)據(jù),對其進行編號處理,運用Eviews軟件,得到平穩(wěn)序列,觀察自相關、偏自相關系數(shù)及其圖形,利用最小二乘法及信息準則,建立合適的ARMA模型,并充分提取序列的相關信息,確定模型階數(shù),求出模型的表達式,并利用ADF等多種檢驗方法檢驗模型是否正確,最終利用此模型求出未來5 d的預測值。并與真實值進行比較,檢驗預測的準確性。
關鍵詞:ARMA模型;Eviews;上海融資融券;平穩(wěn)性;模型預測
0引言
中國自20世紀90年代成立證券市場,發(fā)展勢頭迅猛,而合理投資顯得尤為重要。證券投資分析方法主要有3大類:第一類是基礎分析,根據(jù)經(jīng)濟學、金融學、投資學等基本原理推導出結(jié)論;第二類是技術分析,根據(jù)證券市場自身變化規(guī)律得出結(jié)果的分析方法;第三類是證券組合分析法,以數(shù)量化分析為主。這三類分析方法都是以統(tǒng)計理論研究做支撐的,統(tǒng)計研究在證券市場的應用是研究證券市場從而進行合理投資的基礎。因而使用時間序列模型對證券數(shù)據(jù)進行分析與預測具有廣泛的適用性和推廣性。
1數(shù)據(jù)來源與假設
1)本文數(shù)據(jù)來自上海證券公司2014-08-21到2015-06-16的融資數(shù)據(jù),由于部分間隔數(shù)據(jù)缺失,假設缺失的數(shù)據(jù)與前一天數(shù)據(jù)相同。
2)當最后模型殘差項通過檢驗即認為原始數(shù)據(jù)序列信息已提取完全,不再對數(shù)據(jù)做進一步處理。
2時間序列模型
2.1研究思路
為簡化運算,將2014-08-21到2015-06-16的數(shù)據(jù)按數(shù)字編碼,假定遺失的數(shù)值與前一天保持一致,通過已知序列,判斷其平穩(wěn)性,如若不是,對其進行處理,得到平穩(wěn)性序列,觀察自相關、偏自相關系數(shù)及其圖形,利用最小二乘法及信息準則建立合適的ARMA模型;充分提取序列的相關信息,確定模型階數(shù),求出模型的表達式,利用ADF等多種檢驗方法檢驗模型是否正確,最終利用此模型求出未來5 d的預測值。并與真實值做比較。
2.2問題的理論基礎
(1)基礎時間序列模型
AR模型:AR模型也稱為自回歸模型。它的預測方式是通過過去的觀測值和現(xiàn)在干擾值的線性組合預測,自回歸模型的數(shù)學公式為:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+εt
式中:p為自回歸模型的階數(shù),φi(i=1,2,3,…,p)為模型的待定系數(shù),εt為誤差,yt為一個平穩(wěn)時間序列。
MA模型:MA模型也稱為滑動平均模型。它的預測方式是通過過去的干擾值和現(xiàn)在的干擾值的線性組合預測。滑動平均模型的數(shù)學公式為:
yt=εt-θ1εt-1-θ2εt-2-…θqεt-q
yt=εt-θ1εt-1-θ2εt-2-…-θqεt-q
式中:q為模型的階數(shù)θj(j=1,2,3,…q)為模型的待定系數(shù);εt為誤差;yt為平穩(wěn)時間序列。
ARMA模型:自回歸模型和滑動平均模型的組合,構(gòu)成用于描述平穩(wěn)隨機過程的自回歸滑動平均模型ARMA,數(shù)學公式為:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-q
(2)差分序列
差分:D算子被用來定義序列差分,定義一階差分,僅把序列名寫入D后的括號。更復雜的差分形式可以使用2個參數(shù)n、s。D(x,n)定義序列x的n階差分。
D(x,n)=(1-L)nx
其中L是滯后算子,D(x,n,s)定義序列x的n階普通差分,帶有滯后s階的季節(jié)差分。
(3)ADF檢驗
單位根檢驗是指檢驗序列中是否存在單位根,因為存在單位根就是非平穩(wěn)時間序列了。單位根就是指單位根過程,可以證明,序列中存在單位根過程就不平穩(wěn)。單位根檢驗是隨機過程的問題。定義隨機序列{xt},t=1,2…是一單位根過程,若xt=ρxt-1+ε,t=1,2…其中ρ=1,{ε}為一平穩(wěn)序列(白噪聲),特別地,若{ε}是獨立同分布的,且E(ε)=0,Var(ε)=σ<∞,則上式就變成一個隨機游走序列,因此隨機游走序列是一種最簡單的單位根過程。將定義式改寫為下列形式:
(1-ρL)xt=ε,t=1,2,…其中L為滯后算子,1-ρL為滯后算子多項式,其特征方程為1-ρz=0,有根z=1/ρ。當ρ=1時,時間序列存在一個單位根,此時{xt}是一個單位根過程。當ρ<1時,{xt}為。而當ρ>1時,{xt}為一類具有所謂爆炸根的非平穩(wěn)過程,它經(jīng)過差分后仍然為非平穩(wěn)過程,因此不為單整過程。一般情況下,單整過程可以稱作單位根過程。
2.3研究過程
2.3.1數(shù)據(jù)的預處理
(1)繪制序列時序圖判斷平穩(wěn)性
對搜集到的數(shù)據(jù)進行處理,將原始數(shù)據(jù)中的每一天用數(shù)字代替,簡化運算,并畫出趨勢圖,如圖1所示。由圖可知該序列為非平穩(wěn)序列,具有一定的周期性,但這個判斷比較粗糙,需要用統(tǒng)計方法進一步驗證。
圖1 初始數(shù)據(jù)圖
(2)繪制序列相關圖及ADF檢驗
進一步求其相關系數(shù),可得圖2,并對其進行單位根檢驗,可得圖3。
圖2相關系數(shù)檢驗圖3單位根檢驗
由上述相關系數(shù)和單位根檢驗均可看出,原始數(shù)據(jù)很不平穩(wěn),但最后一列白噪聲檢驗的Q統(tǒng)計量和相應的伴隨概率表明序列存在相關性,因此序列為平穩(wěn)非白噪聲序列。
(3)差分處理檢驗
嘗試對其進行一階差分處理,令y=x-x(-1),并畫出圖像(圖4)。
圖4 一階差分后的圖形
顯然此時數(shù)據(jù)大約在均值0上下浮動,數(shù)據(jù)已趨于平穩(wěn),為進一步判別數(shù)列的平穩(wěn)性,對其進行ADF檢驗以及相關系數(shù)比較,可得圖5和圖6。
圖5一階差分后的相關系數(shù)圖6一階差分后單位根檢驗
此時可看出一階差分后的數(shù)列是平穩(wěn)序列,下面對其新序列進行建模。
2.3.2模型的建立及檢驗
(1)模型的參數(shù)估計
由于上述序列已趨于平穩(wěn),下面建立ARMA模型,并估計其模型的參數(shù)。根據(jù)上面的相關系數(shù)檢驗,并不能直接看出它的截尾階數(shù)和拖尾階數(shù),故先建立ARMA(4,4),可得出模型檢驗。
圖7模型檢驗圖圖8模型檢驗系數(shù)
顯然上述模型建立的并不合理,根據(jù)相應位置的P值的大小,從大到小排列,逐個剔除對應的變量,并對剩下的變量進行檢驗,最終可得模型ARMA(2,1),
(2)ARMA(2,1)模型
圖9 模型殘差的白噪聲檢驗
建立ARMA(2,1)模型,各檢驗指標如圖8所示。
根據(jù)上述檢驗,所有的P值在5%的置信水平下均拒絕原假設,表明模型建立有效,并進一步對擬合模型的適應性進行檢驗,實質(zhì)是對模型殘差序列進行白噪聲檢驗。若殘差序列不是白噪聲,說明還有一些重要信息沒被提取,應重新設定模型??梢詫埐钸M行純隨機性檢驗,也可用針對殘差的x2檢驗。常有兩種方法進行x2檢驗。當一個模型估計完畢之后,會自動生成一個對象誤差項resid,它便是估計模型的殘差序列值,對其進行相關圖分析便可看出檢驗結(jié)果(圖9)。
由上可知,所有的P值均比較大,可看出殘差不再存在自相關,為白噪聲序列,說明模型擬合很好,通過檢驗,可以使用。其擬合效果圖如圖10。
(3)ARMA(2,2)模型
為找出更優(yōu)的模型,同時建立了ARMA(2,2)模型,其相關系數(shù)檢驗如圖11,其模型殘差檢驗如圖12。
可看出殘差不再存在自相關,說明模型擬合效果很好。模型殘差為白噪聲序列,可通過檢驗,模型有效。其擬合效果圖如圖13所示。
圖10 擬合效果圖
圖11模型檢驗圖圖12相關系數(shù)圖
圖13 擬合效果圖
最終可求得并建立模型ARMA(2,1),其表達式為:
yt=611391.8+0.926654yt-1-0.160592yt-2+εt-0.818318εt-1
模型ARMA(2,2),其表達式為:
yt=561872.5+1.395186yt-1-0.756161yt-2+εt-1.309017εt-1+0.646260εt-2
2.3.3模型的比較
(1)ARMA(2,1)模型
根據(jù)模型ARMA(2,1),得出動態(tài)預測(圖14)。
圖14 動態(tài)預測圖
圖14中實線代表的是x的預測值,2條虛線則提供了2倍標準差的置信區(qū)間??梢钥吹?,隨著預測時間的增長,預測值很快趨向于序列的均值。圖的右邊列出的是評價預測的一些標準,如平均預測誤差平方和的平方根(rmse)、Theil不相等系數(shù)及其分解??梢钥吹?,Theil不相等系數(shù)為0.185 526,表明模型的預測能力比較好,而對它的分解表明偏誤比例很小,方差比例較大,說明實際序列的波動較大,而模擬序列的波動較小,這可能是由于預測時間過長。
下面再利用靜態(tài)方法來預測,得到如圖15所示的結(jié)果。
圖15 靜態(tài)預測圖
從圖中可以看到,“Static”方法得到的預測值波動性要大;同時,方差比例的下降也表明較好的模擬了實際序列的波動,Theil不相等系數(shù)為0.034 381,其中協(xié)方差比例為0.999 6,表明模型的預測結(jié)果較理想。
(2)ARMA(2,2)模型
結(jié)合動態(tài)預測和靜態(tài)預測,預測效果圖如圖16和圖17所示,從圖中可看出Theil不相等系數(shù)分別為0.197 070和0.034 137,模型預測效果較好。最終通過比較AIC值,前者為38.262 28,后者為38.258 46,比較而言,ARMA(2,2)更優(yōu),但是DW統(tǒng)計量前者為1.990 49,后者為1.964 648,比較而言后者更好,綜合考慮表明ARMA(2,2)更優(yōu)。
圖16 動態(tài)效果圖
圖17 靜態(tài)效果圖
時間(d)預測值201520442338.7425079202526429875.8225933203541444658.1879128204558068353.2452165205570110727.2078691
2.4模型的預測
在此基礎上,求出未來5 d的預測值如表1所示。
最終求得原始值和預測值的對比圖(圖18)。
最終把兩次結(jié)果與原值進行對比(圖19)。
圖18 真實值與預測值對比圖
圖19 兩種模型預測值以及原始值對比圖
2.5結(jié)論與分析
根據(jù)模擬預測出的值第201 d即代表2015-06-17的上海證劵融資融券當日融券余額,經(jīng)查閱2015-06-17的融券余額的實際數(shù)據(jù)為528 983 150,其預測的絕對誤差為:
表明預測效果較好,此模型的可用性很強,進一步觀察接下來幾天的預測情況,預測結(jié)果表明當日融券余額在接下來的5 d里應該是處于上升趨勢,但是經(jīng)查閱真實情況,發(fā)現(xiàn)接下來幾天的預測誤差較大,這表明時間序列模型的局限性,只能做較短期的預測,長期預測可能誤差較大,運用此模型時要保證數(shù)據(jù)的時效性。
3結(jié)束語
本文根據(jù)時序圖判斷序列的平穩(wěn)性,觀察相關圖,初步確定移動平均階數(shù)q和自回歸階數(shù)p如何通過觀察自相關、偏自相關系數(shù)及其圖形,利用最小二乘法及信息準則建立合適的ARMA模型;并利用ARMA模型對接下來的數(shù)據(jù)進行短期預測,同時比較了不同的ARMA模型,選擇合適的模型進行預測,擇優(yōu)用之,具有很強的實用性;改變不同的真實值,能夠預測任意時間的數(shù)值,為證劵市場的研究提供了重要的研究手段。此模型還適用于其他時間序列數(shù)據(jù)的預測,具有非常強的推廣性。
參考文獻:
[1]上海證券公司網(wǎng)站數(shù)據(jù)[EB/OL].http://www.sse.com.cn/market/dealingdata/overview/margin/,2014-08-21/2015-06-16.
[2]李守麗.時間序列模型在地級市GDP預測中的應用.鄭州:鄭州大學,2013.
[3]安瀟瀟.ARMA相關模型及其應用.秦皇島:燕山大學,2008.
[4]榮趕丁.Cantor序列及其差分序列的Hankel行列式.武漢:華中科技大學,2013.
[5]陳麗江.基于ADF檢驗的中國出口集裝箱班輪運價隨機特性研究.武漢理工大學學報:社會科學版,2013,(01):15-20.
[6]鄒永杰.用非平穩(wěn)度量區(qū)分白噪聲過程與鞅差分序列.武漢:理工大學,2011.
[7]仉新.時間序列分析在經(jīng)濟投資中的研究與應用.沈陽:沈陽工業(yè)大學,2013.
[8]Vo thi thanh van.時間序列分析技術的研究.長沙:湖南大學,2013.
[9]孔威.時間序列分析在CPI中的應用研究.吉林:延邊大學,2014.
[10]袁磊磊.基于時間序列分析的商業(yè)企業(yè)銷售預測模型研究.重慶:重慶理工大學,2013.
[11]羅芳瓊,吳春梅.時間序列分析的理論與應用綜述.柳州師專學報,2009,(03):113-117.
[12]莫達隆.利用ADF檢驗對時間序列進行建模.時代金融,2010,(04):46-48.
[責任編輯:劉守義英文編輯:劉彥哲]
Analysis and Prediction of Shanghai Securities Margin Balance Based on Time Series Model
XU Xiao-lin,ZHOU Xiao-wei,ZHU Jia-ming
(School of Statistics and Applied Mathematics,Anhui University of Finance & Economics,Bongbu,Anhui 233030,China)
Abstract:Aiming at the analysis and prediction problems of Shanghai securities margin financing balance that day,we established ARMA auto regressive model.By using Eviews software for numbered data from 8/21/2014 to 6/16/2015,the stationary sequence was obtained,then appropriate ARMA model was established with observing autocorrelation coefficient,partial autocorrelation coefficient and graphics.The order and model expression were gotten through extracting related information of sequence and tested with ADF test methods.At last the forecast for the next 5 days was given and compared with real value to test the accuracy of prediction.
Key words:ARMA model;Eviews;margin trading in Shanghai Stationary;model prediction
DOI:10.3969/j.issn.1673-1492.2016.01.011
中圖分類號:F 832.51
文獻標識碼:A
作者簡介:徐孝琳(1993-),女,安徽安慶人,研究方向:應用數(shù)學。通訊作者:朱家明(1973-),男,安徽泗縣人,副教授,碩士,安徽財經(jīng)大學數(shù)學建模實驗室主任,研究方向:應用數(shù)學與數(shù)學建模。
來稿日期:2015-10-21