任鑫 韓旭
摘? 要:作為A股市場(chǎng)重要的股票指數(shù)之一,對(duì)滬深300股指的走勢(shì)進(jìn)行預(yù)測(cè)對(duì)于投資者進(jìn)行套期保值和風(fēng)險(xiǎn)轉(zhuǎn)移具有重要的意義。本文利用LSTM網(wǎng)絡(luò)具備的復(fù)雜非線性時(shí)序特征提取能力,設(shè)計(jì)了一個(gè)LSTM深度循環(huán)神經(jīng)網(wǎng)絡(luò)來對(duì)滬深300股指的走勢(shì)進(jìn)行預(yù)測(cè)。結(jié)果表明,LSTM能夠被成功地運(yùn)用于股票價(jià)格指數(shù)走勢(shì)的預(yù)測(cè)。
關(guān)鍵詞:股指期貨;神經(jīng)網(wǎng)絡(luò);非線性;時(shí)序特征
股票的發(fā)展到今天已經(jīng)有幾百年的歷史。股票市場(chǎng)的變化可以說是整個(gè)社會(huì)經(jīng)濟(jì)的“晴雨表”,它反映了社會(huì)經(jīng)濟(jì)的發(fā)展?fàn)顩r和公司的運(yùn)營狀況。股票價(jià)格指數(shù)被當(dāng)做一種指標(biāo),反映了股票市場(chǎng)上所有股票市場(chǎng)價(jià)格的總體水平和相應(yīng)的變化情況。股票指數(shù)的變化對(duì)于廣大投資者和社會(huì)經(jīng)濟(jì)都有十分重要的影響。研究股指的主要作用是為套期保值者規(guī)避和轉(zhuǎn)移風(fēng)險(xiǎn)。人們不斷進(jìn)行股指期貨的研究,可是大多數(shù)研究者對(duì)我國的股指期貨研究僅限于交易規(guī)則的制定和管理方式方法上。我們需要一種更加有效地方法對(duì)股指變化做出預(yù)測(cè)。
近年來以神經(jīng)網(wǎng)絡(luò)為基本構(gòu)造模塊的深度神經(jīng)網(wǎng)絡(luò)模型眾多領(lǐng)域取得了巨大的成功。股票價(jià)格指數(shù)數(shù)據(jù)往往蘊(yùn)含著大量的高噪聲和復(fù)雜的非線性,淺層學(xué)習(xí)方法無法對(duì)其進(jìn)行有效建模。由于深度神經(jīng)網(wǎng)絡(luò)能夠提取出數(shù)據(jù)中蘊(yùn)含的復(fù)雜非線性特征,因此本文通過長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)我國滬深300指數(shù)走勢(shì)進(jìn)行研究預(yù)測(cè),以此來為投資者規(guī)避股市風(fēng)險(xiǎn)和實(shí)現(xiàn)財(cái)富保增值提供預(yù)判。
一、長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)
長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(Long-Short Term Memory,LSTM)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),其獨(dú)特的門控設(shè)計(jì)使得其可以學(xué)習(xí)到時(shí)間序列中存在的多種長短期依賴信息。LSTM的每個(gè)神經(jīng)元都有4個(gè)門控制著信息在單元內(nèi)的流通,這4個(gè)門分別如下:
基于此本文設(shè)計(jì)了一個(gè)隱藏層大小為20的LSTM網(wǎng)絡(luò)作為模型的第一層來提取股指數(shù)據(jù)中的高度復(fù)雜非線性時(shí)序特征,LSTM接收大小為? 的一個(gè)矩陣,然后輸出一個(gè)大小為 的向量;然后設(shè)計(jì)了一個(gè)隱藏層大小為1的全連接層作為輸出層,其接收LSTM輸出 大小的向量,然后輸出大小為? 的標(biāo)量作為模型的輸出;最后通過誤差函數(shù)計(jì)算全連接層的輸出與樣本真實(shí)值之間的誤差,以此誤差進(jìn)行反向傳播更新模型參數(shù)以完成模型訓(xùn)練。
二、實(shí)驗(yàn)
(1)實(shí)驗(yàn)數(shù)據(jù)。本文選2018年1月1日至2018年12月30日共239個(gè)交易日的滬深300指數(shù)交易數(shù)據(jù)作為建模數(shù)據(jù),將前5個(gè)交易日的開盤點(diǎn)位、最低點(diǎn)位、最高點(diǎn)位、成交量、成交金額、收盤點(diǎn)和第6個(gè)交易日的收盤點(diǎn)位作為一對(duì)訓(xùn)練樣本,一共可獲得234對(duì)訓(xùn)練樣本作為訓(xùn)練數(shù)據(jù)。
(2)實(shí)驗(yàn)設(shè)置。本實(shí)驗(yàn)所設(shè)計(jì)的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)模型,使用python編程語言進(jìn)行實(shí)現(xiàn),運(yùn)行在內(nèi)存為8GB,顯存為3GB的Ubuntu18.04操作系統(tǒng)上。模型采用Xavier方法作為各權(quán)重矩陣的初始化方式,學(xué)習(xí)率設(shè)定為0.1,模型損失通過MSE均方誤差函數(shù)實(shí)現(xiàn),優(yōu)化方法為隨機(jī)梯度下降法,迭代次數(shù)設(shè)定為200次。
(3)實(shí)驗(yàn)結(jié)果。經(jīng)過200次迭代,模型平均誤差從最開始的2.4135逐漸下降收斂到0.0014,說明模型對(duì)于訓(xùn)練樣本之間的映射關(guān)系能夠進(jìn)行良好地學(xué)習(xí)。訓(xùn)練完成的模型的預(yù)測(cè)結(jié)果與真實(shí)值的比較如圖1所示,不難發(fā)現(xiàn)本文所訓(xùn)練的模型對(duì)于滬深300指數(shù)前五個(gè)交易日的交易數(shù)據(jù)同第六個(gè)交易日的收盤點(diǎn)位之間的復(fù)雜關(guān)系能夠進(jìn)行良好地建模。
本文通過構(gòu)建基于LSTM的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,將其用于滬深300指數(shù)的預(yù)測(cè)。實(shí)驗(yàn)表明,LSTM網(wǎng)絡(luò)能夠?qū)τ跍?00指數(shù)數(shù)據(jù)自身存在的高度復(fù)雜非線性時(shí)序特征進(jìn)行良好的學(xué)習(xí)建模。
參考文獻(xiàn)
[1]Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].Neural Computation,1997.9(08):1735-1780
[2]Xavier Glorot,Y.Bengio.Understanding the difficulty of training deep feedforward neural networks[J].Journal of Machine Learning Research,2010.01(09):249-256
作者簡介:任鑫(1995-),男,漢族,四川省南充市,碩士研究生,成都理工大學(xué)管理科學(xué)學(xué)院應(yīng)用統(tǒng)計(jì)專業(yè),研究方向:大數(shù)據(jù)統(tǒng)計(jì)。
韓旭(1994–),男,漢族,黑龍江省綏化市人,碩士研究生,單位:成都理工大學(xué)管理科學(xué)學(xué)院應(yīng)用統(tǒng)計(jì)專業(yè),研究方向:地學(xué)數(shù)據(jù)統(tǒng)計(jì)分析。