查進(jìn)道
(江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院,南京 211168)
我國股市由于其歷史較短,在發(fā)展過程中還存在著一些問題。為此,國內(nèi)不少學(xué)者試圖找出影響股票價(jià)格指數(shù)的因素,通過研究這些因素的變化對股市的影響來預(yù)測股市未來走勢,一方面為規(guī)范股市健康發(fā)展的政策的制定提供參考,另一方面對投資者提供指導(dǎo)。因此,對股票價(jià)格指數(shù)變化規(guī)律的研究有著重要的理論意義和現(xiàn)實(shí)意義。由于支持向量機(jī)具有小樣本、無數(shù)據(jù)維數(shù)限制、泛化能力強(qiáng)和非線性處理能力強(qiáng)等特點(diǎn),本文在現(xiàn)有研究的基礎(chǔ)上,選取上證綜合指數(shù)為中國股市的代表,建立一種改進(jìn)的基于微分進(jìn)化算法的支持向量機(jī)的上證指數(shù)預(yù)測模型,實(shí)驗(yàn)證實(shí)該模型具有較高的預(yù)測精度。
支持向量機(jī)(SVM)用于回歸擬合分析時(shí),其基本思想是尋找一個(gè)最優(yōu)分類面使得所有訓(xùn)練樣本離該分類面的距離最小。設(shè)訓(xùn)練集S={(x1,y1),(x2,y2),…,(xl,yl)},其中l(wèi)為樣本數(shù);xi∈Rn,yi∈R,(i=1,2,…,l)。則基于訓(xùn)練集S的支持向量機(jī)回歸函數(shù)是:
上式中核函數(shù)的選擇必須滿足Merce條件,常見的核函數(shù)有多項(xiàng)式核函數(shù)、RBF核函數(shù)、Sigmoid核函數(shù)。根據(jù)上證指數(shù)預(yù)測的特點(diǎn),選擇RBF核函數(shù):
影響預(yù)測精度的主要有RBF核函數(shù)的參數(shù)γ、SVR模型中的懲罰因子c和不敏感系數(shù)常數(shù)ε。研究表明微分進(jìn)化算法的全局尋優(yōu)功能、收斂速度及穩(wěn)定性要優(yōu)于遺傳算法、粒子群算法等智能算法。本文引入微分進(jìn)化算法對SVR的參數(shù)c,γ,ε在參數(shù)空間中自動確定最優(yōu)或近似最優(yōu)參數(shù)。DE-SVR預(yù)測模型建立的具體步驟如下:
Step1確定參數(shù)組(c,γ,ε)的搜索范圍。令迭代的代數(shù)j=0,設(shè)置DE的最大迭代循環(huán)次數(shù)G、種群規(guī)模Np、放縮因子F及交叉常數(shù)CR等參數(shù)。
Step3迭代的代數(shù)j←j+1。
Step4 根據(jù)(1)、(2)、(3)式對種群進(jìn)行更新,并更新各個(gè)體極值lmse(i)、全局極值gmse和全局極值點(diǎn)gx。
Step5若未達(dá)到終止條件,則轉(zhuǎn)Step3繼續(xù)下一迭代。否則,輸出全局極值點(diǎn)(c*,γ*,ε*)。
Step6 利用參數(shù)c*,γ*,ε*建立SVR模型。
根據(jù)已有的研究,引起上證綜合指數(shù)波動的主要因素有:居民消費(fèi)價(jià)格指數(shù)x1、工業(yè)增加值增長速度x2(比上年同期增長百分比)、商品零售價(jià)格指數(shù)x3、宏觀經(jīng)濟(jì)景氣指數(shù)一致指數(shù)x4(1996年=100)、美元平均匯率一美元折合人民幣x5(平均數(shù))、x6貨幣供應(yīng)量(億元)M1、全國銀行間30天同業(yè)拆借加權(quán)平均利率(%)x7、自2007年8月起美國次貸危機(jī)和2010年2月起歐債危機(jī)x8等。本文采用2007年1月至2011年11月的59期的上證綜合指數(shù)及主要影響因素的月度數(shù)據(jù)作為59個(gè)樣本對上證綜合指數(shù)波動進(jìn)行實(shí)證分析,部分缺失的數(shù)據(jù)通過Hermite插值法進(jìn)行計(jì)算。(數(shù)據(jù)略)在實(shí)證研究中,所使用的上證綜合指數(shù)收盤價(jià)以及宏觀經(jīng)濟(jì)數(shù)據(jù)來自中國人民銀行(http://www.pbc.gov.cn)、國務(wù)院發(fā)展研究中心信息網(wǎng)(http://www.drcnet.com.cn/DRCNET.Channel.Web/)與中華人民共和國國家統(tǒng)計(jì)局(http://www.s tats.gov.cn)
雖然DE-SVR具有較強(qiáng)的揭示和表達(dá)多因素影響下非線性系統(tǒng)內(nèi)在規(guī)律的能力,但由于上證指數(shù)受多種不確定因素的影響,DE-SVR模型的預(yù)測精度不是很高,因此可通過利用DE-SVR對預(yù)測的殘差的內(nèi)在規(guī)律的挖掘來進(jìn)一步揭示系統(tǒng)內(nèi)在規(guī)律,從而實(shí)現(xiàn)對模型的修正,達(dá)到提高模型的預(yù)測精度的目的。具體算法如下:
Step1利用訓(xùn)練集S1建立DE-SVR模型,并對訓(xùn)練集S1、測試集T1的樣本進(jìn)行擬合、預(yù)測。
Step3利用訓(xùn)練集S2建立DE-SVR的殘差預(yù)測模型,對殘差Δ進(jìn)行預(yù)測。
Step4將兩次的預(yù)測結(jié)果相加,實(shí)現(xiàn)對DE-SVR的上證指數(shù)預(yù)測模型的修正,最終建立起一種改進(jìn)的基于DE-SVR的上證指數(shù)預(yù)測模型。
為方便起見,下面采用將第1~53個(gè)樣本作為訓(xùn)練集S1,第54~59個(gè)樣本作為測試集T1建立上述預(yù)測模型進(jìn)行實(shí)證分析。在Matlab環(huán)境下,利用Matlab及l(fā)ibsvm軟件包中的函數(shù)可方便地實(shí)現(xiàn)上述步驟。第1~53期上證指數(shù)預(yù)測結(jié)果及第54~59期上證指數(shù)預(yù)測結(jié)果分別見圖1、圖2,并與多元回歸、多維灰色模型、基于微分進(jìn)化算法的多維灰色模型、DE-SVR預(yù)測模型的預(yù)測效果與精度進(jìn)行對比分析,具體結(jié)果分別見表1、表2。由表中各模型精度指標(biāo)可知,改進(jìn)后的基于DE-SVR的上證指數(shù)預(yù)測模型所得結(jié)果精度優(yōu)于傳統(tǒng)的預(yù)測模型。
圖1
圖2
影響上證指數(shù)的因素很多,利用DE-SVR模型建立起各因素與上證指數(shù)波動之間基本規(guī)律。再利用DE-SVR模型進(jìn)一步挖掘上證指數(shù)波動規(guī)律,建立起各因素與殘差間的非線性函數(shù)關(guān)系,實(shí)現(xiàn)對殘差的有效預(yù)測,再與前一次上證指數(shù)預(yù)測的結(jié)果疊加,實(shí)現(xiàn)對DE-SVR模型的修正,從而提高模型的預(yù)測精度。通過實(shí)證分析,改進(jìn)后的基于DE-SVR的上證指數(shù)預(yù)測模型所得結(jié)果精度優(yōu)于多元回歸、多維灰色模型、基于微分進(jìn)化算法的多維灰色模型、DE-SVR預(yù)測模型,表明了新模型預(yù)測上證指數(shù)的合理性,是一進(jìn)行有效預(yù)測的新方法。
表1 第1-53期上證指數(shù)預(yù)測結(jié)果精度對比
表2 第54-59期上證指數(shù)預(yù)測結(jié)果精度對比
[1]段海濱.仿生智能計(jì)算[M].北京:科學(xué)出版社,2011.
[2]史峰.MATLAB智能算法30個(gè)案例分析[M].北京:北京航天航空大學(xué)出版社,2011.
[3]郭雪松.基于微分進(jìn)化算法的支持向量機(jī)預(yù)測模型及其在制造業(yè)發(fā)展預(yù)測中的應(yīng)用[J].科技進(jìn)步與對策,2008,(1).
[4]張滟.上證指數(shù)波動的影響因素實(shí)證分析[J].中小企業(yè)管理與科技(下旬刊),2009,(9).
[5]李艷.探索影響上證指數(shù)的因素[J].中國市場,2010,(14).