薛廣明,王 潔,盧若飛
(1.廣西財(cái)經(jīng)學(xué)院信息與統(tǒng)計(jì)學(xué)院,廣西 南寧 530003;
2.湖南省祁東縣第一中學(xué),湖南 衡陽 421600;
3.廣西民族大學(xué)理學(xué)院,廣西 南寧 530006)
關(guān)于阿里巴巴股票價(jià)格的實(shí)證研究*
薛廣明1,王 潔2,盧若飛3
(1.廣西財(cái)經(jīng)學(xué)院信息與統(tǒng)計(jì)學(xué)院,廣西南寧530003;
2.湖南省祁東縣第一中學(xué),湖南衡陽421600;
3.廣西民族大學(xué)理學(xué)院,廣西南寧530006)
基于時(shí)間序列分析理論研究基礎(chǔ)上,利用SAS統(tǒng)計(jì)軟件,系統(tǒng)地分析了2010年1月29日至2011年12月16日阿里巴巴港股價(jià)格的數(shù)據(jù)變化規(guī)律,擬合滯后變量及時(shí)間t模型,從而確定模型并進(jìn)行預(yù)測(cè),最后給出了日、周、月三種不同研究角度下的模型口徑及擬合圖對(duì)比.
阿里巴巴;ARCH模型;殘差;自回歸;時(shí)間序列分析
網(wǎng)絡(luò)的發(fā)展推動(dòng)了電子商務(wù)的進(jìn)程,目前,“淘寶”“58同城”“趕集”“聚劃算”風(fēng)正在席卷,經(jīng)濟(jì)的蕭條卻帶來了網(wǎng)上交易的熱潮.
阿里巴巴是全球企業(yè)電子商務(wù)的著名品牌,匯集海量供求信息,是全球領(lǐng)先的網(wǎng)上交易市場(chǎng)和商人社區(qū),旗下的淘寶網(wǎng)和支付寶,其點(diǎn)擊率更是近年的熱門.近年來,國(guó)內(nèi)外學(xué)者均從文學(xué)角度進(jìn)行了一系列的學(xué)術(shù)研究,筆者通過SAS統(tǒng)計(jì)軟件,系統(tǒng)地分析了2010年1月29日至2011年12月16日阿里巴巴港股價(jià)格的數(shù)據(jù)變化規(guī)律,擬合滯后變量及時(shí)間t模型,從而確定模型并進(jìn)行預(yù)測(cè),最后給出了日、周、月三種不同研究角度下的模型口徑及擬合圖對(duì)比.
一些時(shí)間序列,特別是金融時(shí)間序列,在使用ARIMA模型擬合非平穩(wěn)序列時(shí),對(duì)殘差序列有一個(gè)重要的假定——?dú)埐钚蛄校舤}均值為零的白噪聲序列,換言之,即要滿足零均值、純隨機(jī)及方差齊性.
若方差齊性假定不成立,即隨機(jī)誤差序列的方差不再是常數(shù),則被稱為異方差.
在這三個(gè)假定中,零均值通過對(duì)序列進(jìn)行中心化處理就可以實(shí)現(xiàn),純隨機(jī)假定,是為了說明殘差序列中信息是否提取充分,為了有效檢驗(yàn)這個(gè)假定,統(tǒng)計(jì)學(xué)家們構(gòu)造了許多適用于不同場(chǎng)合的自相關(guān)檢驗(yàn)統(tǒng)計(jì)量,例如Q統(tǒng)計(jì)量、LB統(tǒng)計(jì)量、DW統(tǒng)計(jì)量等.
第三個(gè)假定——方差齊性,在金融序列中往往是不滿足的,忽視異方差的存在會(huì)導(dǎo)致殘差被嚴(yán)重低估,從而參數(shù)顯著性檢驗(yàn)容易犯?jìng)渭{錯(cuò)誤,最終導(dǎo)致模型的擬合精度受影響.
實(shí)踐中,我們只能根據(jù)殘差圖及殘差平方圖所顯示出來的特點(diǎn),大致判定殘差是否滿足方差齊性,而對(duì)數(shù)變換通常只能使絕大多數(shù)金融時(shí)間序列的異方差程度得到改善,但無法真正實(shí)現(xiàn)方差齊性.
為對(duì)異方差函數(shù)進(jìn)行更準(zhǔn)確估計(jì),1982年Engle建立條件異方差的模型.
若ρk恒零時(shí),即異方差函數(shù)為純隨機(jī).當(dāng)存在某個(gè)ρk不為零時(shí),說明其自相關(guān)性存在,通過構(gòu)造殘差平方序列自回歸模型對(duì)其擬合即可.
該模型即為ARCH(q),完整結(jié)構(gòu)為:
當(dāng)殘差序列的異方差函數(shù)有長(zhǎng)期的自相關(guān)性,若進(jìn)行ARCH模型擬合將會(huì)有很高移動(dòng)的平均階數(shù),同時(shí)對(duì)參數(shù)估計(jì)增加難度,且影響ARCH模型擬合度,為改進(jìn)這一問題,Bollerslov在1985年提出了GARCH(p,q)模型,它的結(jié)構(gòu)如下:
對(duì)殘差序列{εt}擬合GARCH模型時(shí),有時(shí)回歸函數(shù)χt=f(t,χt-1,χt-2,…)不能充分提取原序列{εt}中的相關(guān)信息,殘差序列可能自相關(guān),而非純隨機(jī).此時(shí)需要先對(duì){εt}進(jìn)行自回歸擬合,再對(duì)自回歸殘差的序列{vt}進(jìn)行方差齊性檢驗(yàn),若{vt}為異方差,則應(yīng)擬合GARCH模型.這樣構(gòu)造的模型稱為AR(m)-GARCH(p,q)模型:
3.1數(shù)據(jù)收集及說明
選取2010年1月29日至2011年12月22日阿里巴巴港股(01688)每日收盤價(jià)周度數(shù)據(jù)進(jìn)行實(shí)證研究,數(shù)據(jù)從搜狐財(cái)經(jīng)網(wǎng)站上獲取.其中前99個(gè)數(shù)據(jù)用來建模,后幾個(gè)數(shù)據(jù)用來檢驗(yàn)?zāi)P偷臄M合程度.
3.2繪制序列時(shí)序圖
時(shí)序圖(圖1)顯示該序列有顯著的趨勢(shì),為典型的非平穩(wěn)序列,且看出序列的最大值為17.80,最小值為6.99,均值為13.5531.
圖1 2010年1月29日-2011年12月16日阿里巴巴收盤價(jià)趨勢(shì)圖Fig.1 On January 29,2010-December 16,2011 Alibaba's closing share price trend chart
3.3殘差序列異方差檢驗(yàn)
對(duì)原序列進(jìn)行一階差分,如圖2一階差分后的殘差序列具有均值平穩(wěn)性,而方差是否顯著并不明顯:觀察圖3可以從圖形上直觀地得到結(jié)論:殘差序列為異方差.
圖2 一階差分圖Fig.2 First order difference figure
圖3 殘差平方圖Fig.3 Residual square figure
因?yàn)闀r(shí)序圖顯示序列具有顯著線性遞減趨勢(shì),但波動(dòng)幅度隨時(shí)間的變化趨勢(shì)并不明顯,所以筆者嘗試{χt}關(guān)于時(shí)間t的線性回歸模型及延遲因變量回歸兩個(gè)模型,最終確定一個(gè)擬合度較高的模型,并進(jìn)行預(yù)測(cè).
模型1:因變量關(guān)于時(shí)間t的回歸模型
使用AUTOREG過程建立序列{χt}關(guān)于時(shí)間t的線性回歸模型,為了從理論上證明殘差序列是異方差,我們做了殘差序列的Q和LM檢驗(yàn),檢驗(yàn)殘差序列10階延遲的自相關(guān)性并輸出DW檢驗(yàn)的P值,同時(shí)對(duì)殘差序列進(jìn)行異方差檢驗(yàn).
DW檢驗(yàn)顯示出殘差序列具有顯著的自相關(guān)性,建立殘差自回歸模型,由殘差序列10階延遲自相關(guān)圖,顯示殘差序列至少具有1階顯著自相關(guān)性.表1給出了線性回歸模型參數(shù)估計(jì)結(jié)果,參數(shù)估計(jì)結(jié)果顯示回歸模型參數(shù)均顯著.
表1 線性回歸模型參數(shù)估計(jì)結(jié)果Tab.1 Linear regression model parameter estimation results
由Q及LM檢驗(yàn),結(jié)果顯示殘差序列具有顯著的異方差性,且具有顯著的長(zhǎng)期相關(guān)性,檢驗(yàn)結(jié)果如表2所示.
綜合考慮殘差序列自相關(guān)性和異方差性檢驗(yàn)結(jié)果,嘗試擬合GARCH(1,1)模型.模型最終擬合結(jié)果如表3所示.
最終模型口徑為:
最終輸出擬合效果圖及95%的置信區(qū)間預(yù)測(cè)圖如圖4所示:
表2 異方差檢驗(yàn)結(jié)果Tab.2 Heteroscedasticity testing results
表3 最小二乘估計(jì)結(jié)果Tab.3 Least squares estimate results
圖4 ARCH模型擬合效果圖Fig.4 ARCH model fitting renderings
模型2:延遲因變量回歸模型
使用AUTOREG過程建立序列{χt}關(guān)于延遲因變量的回歸模型,建立帶有延遲因變量的回歸模型:χt=a+χt-1+ut.
同模型1,為了從理論上證明殘差序列是自相關(guān)的,做了殘差序列的Dh檢驗(yàn),結(jié)果如表4所示:
表4 帶延遲因變量回歸分析結(jié)果Tab.4 With a delay due to variable regression analysis
此處Durbin h統(tǒng)計(jì)量的分布函數(shù)達(dá)到0.1810,這表示殘差序列不存在顯著的相關(guān)性,不需要考慮對(duì)殘差序列繼續(xù)擬合自回歸模型.
再注意參數(shù)檢驗(yàn)結(jié)果,如表5所示:
表5 參數(shù)估計(jì)結(jié)果Tab.5 Parameter estimation results
在顯著性水平默認(rèn)為0.05的條件下,由表6看出截距項(xiàng)不顯著(P值大于0.05),所以考慮在模型擬合命令中增加NOINT選項(xiàng),最后輸出擬合結(jié)果如表6、表7所示.
表6 普通二乘估計(jì)結(jié)果Tab.6 Ordinary least squares estimate results
表7 參數(shù)估計(jì)結(jié)果Tab.7 Parameter estimation results
從模型的擬合程度來說,模型2的擬合度明顯高于模型1,因而可以采用模型2進(jìn)行擬合及預(yù)測(cè).
圖5 延遲因變量回歸擬合效果圖Fig.5 Delay dependent variable regression renderings
用該模型對(duì)2011年12月23日至2012年1月27日進(jìn)行預(yù)測(cè),得到的擬合值見表8,然后用搜狐網(wǎng)中已統(tǒng)計(jì)的最新真實(shí)數(shù)據(jù)對(duì)該模型進(jìn)行檢驗(yàn),證明其可行性以及預(yù)測(cè)的可靠性較高.由表8可以看出相對(duì)誤差在8%以內(nèi),證明了模型短期預(yù)測(cè)的可行性.
表8 2011年12月23日至2012年1月27日預(yù)測(cè)值與真實(shí)值的相對(duì)誤差Tab.8 On December 22,2011-January 27,2012,The relative error of the predicted values and the real value
筆者對(duì)阿里巴巴港股的日數(shù)據(jù)及月數(shù)據(jù)也進(jìn)行了相應(yīng)的實(shí)證研究,得到了日、周、月數(shù)據(jù)模型建立的對(duì)比(如表9所示),并分別給出了它們的擬合效果及95%的置信區(qū)間圖(如圖6~8所示).
表9 日、周、月度數(shù)據(jù)模型的比較Tab.9 The comparison of daily,weekly,monthly data model
圖6 日度數(shù)據(jù)擬合效果及95%置信區(qū)間圖Fig.6 Daily data fitting effect and 95%confidence interval
圖7 周度數(shù)據(jù)擬合效果及95%置信區(qū)間圖Fig.7 Weekly data fitting effect and 95%confidence interval
圖8 月度數(shù)據(jù)擬合效果及95%置信區(qū)間圖Fig.8 Monthly data fitting effect and 95%confidence interval
由日、周、月數(shù)據(jù)擬合圖可以看出,當(dāng)數(shù)據(jù)越多時(shí),95%的置信區(qū)間相對(duì)越小,精度越高,因而人們?cè)诠善钡馁I賣過程中,需要全面地分析歷年數(shù)據(jù),不應(yīng)單純地將月度數(shù)據(jù)或周度數(shù)據(jù)的研究成果應(yīng)用于實(shí)際中,否則將導(dǎo)致不必要的損失.
筆者根據(jù)2010年1月29日至2011年12月16日阿里巴巴港股價(jià)格的數(shù)據(jù)變化規(guī)律,分別建立{χt}關(guān)于時(shí)間t的線性回歸模型及延遲因變量回歸兩個(gè)模型,最終由擬合度確定延遲因變量回歸模型,并進(jìn)行了預(yù)測(cè).此外還結(jié)合阿里巴巴港股的日收盤數(shù)據(jù)與月收盤數(shù)據(jù),可以給投資者一定的啟示,觀察數(shù)據(jù)量的多少能給投資者帶來不一樣的判斷角度,從而避免片面地觀察數(shù)據(jù),減少投資中不必要的人為損失.
[1]王燕.應(yīng)用時(shí)間序列分析[M].北京:中國(guó)人民大學(xué)出版社,2010.
[2]高惠璇,耿直,等.SAS系統(tǒng)·SAS/ETS軟件使用手冊(cè)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1998:66-78.
[3]鄧祖新.數(shù)據(jù)分析方法和SAS系統(tǒng)[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2006:411-423.
[4]謝佳利,楊善朝,梁鑫.我國(guó)CPI時(shí)間序列預(yù)測(cè)模型的比較及實(shí)證檢驗(yàn)[J].統(tǒng)計(jì)與決策,2008(9).
[5]杜普燕,宋向東,任文軍.ARCH模型在金融時(shí)間序列中的擬合應(yīng)用[J].佳木斯大學(xué)學(xué)報(bào):自然科學(xué)版,2009(2).
[6]梁鑫,龐麗,彭冬梅.桂林市汽車銷售量的時(shí)間序列預(yù)測(cè)模型[J].廣西科學(xué),2008(4).
[7]梁鑫,謝佳利,李朝.廣西GDP的統(tǒng)計(jì)預(yù)測(cè)模型及其應(yīng)用[J].經(jīng)濟(jì)數(shù)學(xué),2008(3).
[責(zé)任編輯 蘇 琴]
[責(zé)任校對(duì) 方麗菁]
An Empirical Study of Alibaba Stock Prices
XUE Guang-ming1,WANG Jie2,LU Ruo-fei3
(1.School of Information and Statistics,Guangχi University of Finance and Economics,Nanning530003,China;2.Hunan Province Qidong County First Middle School,Hengyang 421600,China;3.College of Science,Guangχi University for Nationalities,Nanning530006,China)
This article is based on time series analysis theory,by statistical software,systematically analyzed on January 29,2010-December 16,2011stock price data alibaba change rule,fitting lag variables and time t model to determine the model prediction,and finally gives the day,week,month three different research Angle of the model diameters and fitting contrast diagram.
alibaba;The ARCH model;Residual;autoregression;Time series analysis
F224
A
1673-8462(2015)01-0051-05
2014-09-20.
國(guó)家自然科學(xué)基金(11461008);教育部人文社科基金(13YJA910003);廣西自然科學(xué)基金(2013GXNSFAA019005);廣西高等學(xué)??茖W(xué)技術(shù)研究重點(diǎn)項(xiàng)目(2013ZD010).
薛廣明(1985-),男,黑龍江齊齊哈爾人,碩士,廣西財(cái)經(jīng)學(xué)院助教,研究方向:隨機(jī)分析、計(jì)量經(jīng)濟(jì)與金融工程.