• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于EMD-LSTM模型的股指收盤價(jià)預(yù)測

      2022-01-13 01:37:34單玉瑩
      關(guān)鍵詞:收盤價(jià)成指股指

      劉 銘,單玉瑩

      (長春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,長春 130012)

      隨著經(jīng)濟(jì)水平的提高,人民的物質(zhì)生活極大豐富,越來越多的人選擇投資股票進(jìn)行理財(cái)。由于股票價(jià)格走勢復(fù)雜,沒有明確的規(guī)律,因此如何預(yù)測股指的走勢成為投資者的一大難題,能夠更好地預(yù)測股指的走勢非常重要。

      鑒于股價(jià)指數(shù)的波動性,如何透過復(fù)雜的現(xiàn)象了解股市的走勢和資產(chǎn)價(jià)格的變動,從而使投資者獲得理想的投資收益,是股票投資者特別是機(jī)構(gòu)投資者非常關(guān)心的一個重要課題,也是一個需要深入研究的課題。要想選擇合適的買入賣出期貨的時(shí)機(jī)來產(chǎn)生超額收益,就必須選擇一個合適的模型來有效地預(yù)測股價(jià)走勢或預(yù)測未來價(jià)值。股市受很多經(jīng)濟(jì)和社會因素的影響,是一個復(fù)雜的非線性系統(tǒng)。傳統(tǒng)的股票投資模型一般假設(shè)預(yù)測序列是線性或近似線性的,難以高效、準(zhǔn)確地預(yù)測股指的價(jià)格走勢,難以提供足夠的信息支持股票預(yù)測優(yōu)化投資決策。眾所周知,深度學(xué)習(xí)算法能夠從大量的原始時(shí)間序列數(shù)據(jù)中提取特征,無需依賴先驗(yàn)知識,非常適合金融時(shí)間序列預(yù)測,尤其是LSTM網(wǎng)絡(luò)由于其循環(huán)性結(jié)構(gòu),具有長期記憶性。但股市是一個隨著外部環(huán)境變化而變化的環(huán)境,隨機(jī)性強(qiáng),不同現(xiàn)象之間存在復(fù)雜的內(nèi)在非線性關(guān)系,而目前的時(shí)間序列預(yù)測模型依靠單一的方法直接識別序列,不能充分提取復(fù)雜的序列變化信息,所以組合預(yù)測方法被提出。

      通過現(xiàn)有文獻(xiàn)發(fā)現(xiàn)國內(nèi)外學(xué)者們較為關(guān)注股指金融問題[1-4],傳統(tǒng)預(yù)測金融數(shù)據(jù)的模型有例如ARMA模型、ARIMA模型和GARCH模型[5-10],隨著機(jī)器學(xué)習(xí)的興起,研究者們發(fā)現(xiàn)對于時(shí)序數(shù)據(jù)的預(yù)測LSTM模型具有較好的效果[11-14],后來對于單模型的不足,學(xué)者們發(fā)現(xiàn)可以在機(jī)器學(xué)習(xí)模型中加入優(yōu)化算法使預(yù)測效果變好[15-18]。賀毅岳等[19]對滬深300的5個具有代表性股指用CEEMDAN與LSTM模型進(jìn)行組合預(yù)測,結(jié)果表明模型具有較低的誤差和滯后性。閆洪舉[20]對于上證指數(shù)運(yùn)用CNN與GRU模型進(jìn)行組合預(yù)測,結(jié)果表明模型預(yù)測結(jié)果高于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)算法。于家斌等[21]用GF優(yōu)化算法搭建GF-LSTM網(wǎng)絡(luò)的藍(lán)藻水華預(yù)測模型,預(yù)測了水華發(fā)生。崔昊楊等[22]利用對遺忘門加權(quán)的方式改進(jìn)LSTM模型,運(yùn)用ARIMA模型和改進(jìn)的LSTM對2018年國內(nèi)某市區(qū)歷史負(fù)荷電力數(shù)據(jù)進(jìn)行預(yù)測,在數(shù)據(jù)缺失情況下的預(yù)測準(zhǔn)確率分別提高了44%和57%。而經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)與機(jī)器學(xué)習(xí)模型相結(jié)合具有較好的預(yù)測效果[23-26]:Bao等[27]主要貢獻(xiàn)在于首次嘗試引入SAEs方法提取金融時(shí)間序列的深度不變?nèi)仗卣?,?gòu)建WSAEs-LSTM、WLSTM、LSTM、RNN,其中WSAEs-LSTM具有最好的可預(yù)測性。Wang等[28]對紐約證券交易所、紐約證券交易所、富時(shí)指數(shù)和恒生指數(shù)構(gòu)建了EMD-STNN模型,與STNN、BPNN和SVM摸型相比,EMD-STNN模型對訓(xùn)練集和測試集的預(yù)測具有明顯的優(yōu)勢。

      梳理已有文獻(xiàn)發(fā)現(xiàn):對于股指預(yù)測方面國內(nèi)外學(xué)者已有一定研究成果,但鮮有提出股指波動對模型預(yù)測效果影響的文章?;诖吮疚奶岢隽私鹑跁r(shí)序數(shù)據(jù)波動大小對于EMD-LSTM模型與LSTM模型預(yù)測效果的對應(yīng)關(guān)系。數(shù)據(jù)波動越大,EMD-LSTM模型的預(yù)測效果越好。本文主要研究EMD-LSTM模型、EEMD-LSTM模型、LSTM模型和傳統(tǒng)的時(shí)間序列模型在滬深300、上證指數(shù)和深證成指的收盤價(jià)預(yù)測中的應(yīng)用并對其預(yù)測效果進(jìn)行對比,然后在股指波動性不同的情形下分析EMD-LSTM模型和LSTM模型的適用情形。

      1 研究方法

      在構(gòu)建EMD-LSTM模型對股指數(shù)據(jù)進(jìn)行預(yù)測研究之前,需對模型組合的各組成部分:EMD分解技術(shù)及LSTM長短期記憶神經(jīng)網(wǎng)絡(luò)進(jìn)行簡要介紹。

      1.1 LSTM深度神經(jīng)網(wǎng)絡(luò)

      長短期記憶網(wǎng)絡(luò)(long short term memory,LSTM),最早由Hochreiter和Schmidhuber(1997)引入,發(fā)展到后期有許多學(xué)者進(jìn)行了改進(jìn)。LSTM的結(jié)構(gòu)如圖1。

      圖1 LSTM結(jié)構(gòu)示意圖

      LSTM具有鏈?zhǔn)浇Y(jié)構(gòu),典型的LSTM網(wǎng)絡(luò)由輸入門、遺忘門和輸出門構(gòu)成。在t時(shí)刻時(shí),輸入數(shù)據(jù)xt以及之前時(shí)間步傳遞下來的更新,得到新的隱藏狀態(tài)和記憶狀態(tài),并繼續(xù)傳遞下去,利用這樣的方式完成長期記憶。具體的數(shù)學(xué)描述如下:

      輸入數(shù)據(jù)xt和隱層輸出ht-1經(jīng)過“忘記門”,得到狀態(tài)ft,表達(dá)式為:

      ft=σ[Wf·(ht-1,xt)+bf]

      (1)

      其中:σ為sigmod函數(shù),Wf為“忘記門”的權(quán)值向量,bf為“忘記門”的偏置值。

      (2)

      it=σ[Wi·(ht-1,xt)+bi]

      (3)

      輸入數(shù)據(jù)xt和隱藏狀態(tài)ht-1經(jīng)過輸出門,計(jì)算出待輸出結(jié)果ot,再經(jīng)過t時(shí)刻的細(xì)胞狀態(tài)Ct篩選ot中的信息作為最后輸出ht,表達(dá)式為:

      ot=σ[Wo·(ht-1,xt)+bo]

      (4)

      ht=ot*tanh(Ct)

      (5)

      ot、Wo和bo分別為輸出向量、權(quán)值向量和偏置值。ht為t時(shí)刻LSTM模型的輸出值。

      1.2 經(jīng)驗(yàn)?zāi)B(tài)分解

      經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD),是由黃鍔與其他學(xué)者提出的一種自適應(yīng)信號時(shí)頻處理方法。

      對于任意的時(shí)間序列數(shù)據(jù)x(t),EMD分解的計(jì)算流程如下:

      步驟1 找出x(t)中所有局部極大值與極小值的大小和位置。

      步驟2 極大值和極小值用上和下包絡(luò)線進(jìn)行擬合,并分別設(shè)U(t)和L(t)。

      步驟3 計(jì)算上下兩條包絡(luò)線在每個時(shí)間點(diǎn)的均值:

      m(t)=[U(t)+L(t)]/2

      (6)

      步驟4 令h1(t)=x(t)-m(t),如果h1(t)滿足IMF的判斷條件,則得到了一條IMF。否則,令x(t)=h1(t),將以上的步驟重復(fù)進(jìn)行。

      步驟5 上述步驟的運(yùn)算可以逐步分解出第1,2,…,n個本特征模量即IMFi(t),i=1,…,n,和一個殘差r(t)。

      此時(shí),原始信號x(t)可以表示為:

      (7)

      同一個模量態(tài)函數(shù)包含多個周期特征。

      2 實(shí)證分析

      2.1 模型假設(shè)

      在以上的討論基礎(chǔ)上,本文提出了基于EMD-LSTM算法的中國3個主要股指預(yù)測模型。該模型由2個部分組成,第一個部分是EMD算法,目的是將股指的日收盤價(jià)分解成IMF序列和殘差序列。接著將IMF序列和殘差序列分別構(gòu)建LSTM模型,最后相加求和。EMD-LSTM模型結(jié)構(gòu)如圖2。

      圖2 EMD-LSTM模型結(jié)構(gòu)框圖

      從圖2可以看出,EMD-LSTM預(yù)測模型所采用的EMD分解算法可以滿足金融數(shù)據(jù)的非線性、非平穩(wěn)的特征。經(jīng)過EMD分解后的數(shù)據(jù)輸入LSTM模型訓(xùn)練。EMD算法和LSTM模型的優(yōu)點(diǎn)在EMD-LSTM模型中體現(xiàn)。

      本文神經(jīng)網(wǎng)絡(luò)模型采用滑動時(shí)間窗來構(gòu)建樣本,滑動窗口的寬度為50,預(yù)測未來一天的收盤價(jià)。通過不斷后移,每次移動一個數(shù)據(jù)單位長度,形成一系列相互覆蓋的樣本數(shù)據(jù),這樣的方法在有效利用數(shù)據(jù)時(shí)序信息的同時(shí)降低了時(shí)變性。輸入數(shù)據(jù)t與預(yù)測數(shù)據(jù)t+1的滑動窗口結(jié)構(gòu)如圖3。

      圖3 滑動窗口結(jié)構(gòu)示意圖

      2.2 數(shù)據(jù)獲取與處理

      2.2.1數(shù)據(jù)獲取

      本文主要研究對象為中國具有代表性的3支股票:滬深300股指期貨、上證指數(shù)和深證成指2015年1月5日至2019年3月14日的日收盤價(jià)數(shù)據(jù),共1 022個數(shù)據(jù)。來自Market Point。選取的中國3個股指收盤價(jià)數(shù)據(jù)如圖4所示(其中橫軸為時(shí)間,縱軸為股指收盤價(jià)價(jià)格),收盤價(jià)數(shù)據(jù)的描述性統(tǒng)計(jì)如表1所示。

      圖4 股指收盤價(jià)數(shù)據(jù)

      表1 3個股指收盤價(jià)的描述性統(tǒng)計(jì)

      對3個股指的ADF檢驗(yàn)得到的結(jié)果是序列不平穩(wěn),因此不能直接使用多元線性回歸的方法。本文使用EMD算法可以去除收盤價(jià)數(shù)據(jù)的不平穩(wěn)性,從而可以將不平穩(wěn)數(shù)據(jù)分解為一些平穩(wěn)時(shí)間序列和趨勢項(xiàng)后,再將其作為輸入。其中3個股指的方差相差較大,而方差是衡量數(shù)據(jù)波動性大小的指標(biāo),由表1可以看出上證指數(shù)的波動性遠(yuǎn)小于滬深300和深證成指的波動性。

      2.2.2應(yīng)用EMD算法對數(shù)據(jù)進(jìn)行分解

      從圖5~7中可以看出:應(yīng)用EMD算法將不同的股指,分別按其波動的數(shù)據(jù)類型劃分為不同多個IMF序列和一個殘差序列。

      圖5 滬深300EMD分解結(jié)果,IMF1-5序列和殘差序列

      2.2.3數(shù)據(jù)歸一化

      圖6 上證指數(shù)EMD分解結(jié)果,IMF1-6序列和殘差序列

      圖7 深證成指EMD分解結(jié)果,IMF1-7序列和殘差序列

      在經(jīng)EMD算法分解后的數(shù)據(jù)首先需要進(jìn)行歸一化處理,公式如下:

      xnew=(xold-min(xi))/(max(xi)-min(xi))

      (8)

      式(8)中,xold為原始數(shù)據(jù),xnew為歸一化后的數(shù)據(jù)。

      為了還原數(shù)據(jù),還需要對預(yù)測的輸出進(jìn)行反歸一化處理,公式為:

      (9)

      2.3 模型評價(jià)指標(biāo)

      本文選取的評價(jià)指標(biāo)為均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)和確定系數(shù)(R2)。計(jì)算公式如下:

      (10)

      (11)

      (12)

      (13)

      2.4 傳統(tǒng)時(shí)序模型和EMD-LSTM模型對比實(shí)驗(yàn)

      本章采用滬深300、上證指數(shù)和深證成指的收盤價(jià)數(shù)據(jù),通過ARIMA、SVR、LSTM、EMD-LSTM、EMD-ARIMA、EMD-SVR和EEMD-LSTM這7種模型來測試股票收盤價(jià)的預(yù)測效果。

      本文的預(yù)測方式是利用前50 d的數(shù)據(jù)預(yù)測第51 d的收盤價(jià)數(shù)據(jù)。訓(xùn)練的方式主要是取前67%作為訓(xùn)練集,后33%為測試集。

      本文使用的軟件為Python,本文的其他對比模型:在SVR模型中,選取的是sklearn庫,核函數(shù)為rbf以及其他默認(rèn)參數(shù);在ARIMA模型中,選取的是statsmodels庫,選取模型為ARIMA(1,1,1);而LSTM模型中,選取的是keras庫,LSTM的神經(jīng)元個數(shù)為100,優(yōu)化算法為adam,誤差的計(jì)算方式使用均方誤差,模型訓(xùn)練的epoch為650,batch size為100,Dropout為0.4;在EEMD-LSTM模型中,EEMD為集成經(jīng)驗(yàn)?zāi)B(tài)分解,是將正態(tài)分布的白噪聲加入原始數(shù)據(jù)后,再進(jìn)行EMD分解,分解后的數(shù)據(jù)輸入LSTM模型訓(xùn)練。

      接著本文通過以上幾種傳統(tǒng)時(shí)序模型和EMD-LSTM模型對股指收盤價(jià)數(shù)據(jù)進(jìn)行實(shí)證分析。

      2.5 傳統(tǒng)時(shí)序模型和EMD-LSTM模型收盤價(jià)預(yù)測結(jié)果

      2.5.1滬深300股指基于各模型的預(yù)測結(jié)果

      通過比較7種模型中的RMSE、MAPE、MAE和R2值可以看出:EMD-LSTM模型的RMSE、MAPE和MAE值最小,R2值最大,可以認(rèn)為EMD-LSTM模型預(yù)測效果最好(表2)。預(yù)測結(jié)果如圖8所示。

      表2 滬深300基于各模型預(yù)測結(jié)果

      圖8 滬深300收盤價(jià)-EMD-LSTM模型預(yù)測曲線

      數(shù)據(jù)波動的大小對于模型的預(yù)測效果有一定的影響,滬深300的方差相對較大,波動較大,EMD-LSTM的預(yù)測效果最好,這也能體現(xiàn)出EMD對非平穩(wěn)波動大的數(shù)據(jù)預(yù)測效果良好。

      2.5.2上證指數(shù)基于各模型的預(yù)測結(jié)果

      通過比較7種模型的RMSE、MAPE、MAE和R2值可以看出,LSTM模型的RMSE、MAPE和MAE值最小,R2值最大,可以認(rèn)為LSTM模型預(yù)測效果最好(見表3)。預(yù)測結(jié)果如圖9所示。

      圖9 上證指數(shù)收盤價(jià)-LSTM模型預(yù)測曲線

      基于上述,上證指數(shù)的方差相對較小,波動較小,LSTM的預(yù)測效果最好,這也能體現(xiàn)出LSTM對于非平穩(wěn)波動小的數(shù)據(jù)預(yù)測效果良好(表3)。

      表3 上證指數(shù)基于各模型預(yù)測結(jié)果

      2.5.3深證成指基于各模型的預(yù)測結(jié)果

      通過比較7種模型的RMSE、MAPE、MAE和R2值可以看出,EMD-LSTM模型的RMSE和MAE值最小,R2值最大,只有MAPE值比ARIMA模型稍大,以多數(shù)服從少數(shù)原則可以認(rèn)為EMD-LSTM模型預(yù)測效果最好(見表4)。預(yù)測結(jié)果如圖10所示。

      圖10 深證成指收盤價(jià)-EMD-LSTM模型預(yù)測曲線

      基于上述,深證成指的方差相對較大,波動較大,EMD-LSTM的預(yù)測效果最好(表4)。

      表4 深證成指基于各模型預(yù)測結(jié)果

      3 結(jié)論

      金融時(shí)間序列所具有的不平穩(wěn)特性對其預(yù)測效果造成了極大的影響。為了緩解這種不利影響,本研究采用了EMD與LSTM相結(jié)合的模型。本文以歷史50 d數(shù)據(jù)預(yù)測第51 d的數(shù)據(jù),在滬深300股指和深證成指的預(yù)測中,數(shù)據(jù)波動較大,EMD-LSTM神經(jīng)網(wǎng)絡(luò)具有較好的效果;在上證指數(shù)的預(yù)測中,數(shù)據(jù)波動較小,LSTM模型具有較好的效果??梢钥闯鰯?shù)據(jù)波動的大小對于模型的預(yù)測效果有一定的影響,在非平穩(wěn)序列中方差越大,波動越大,方差大的數(shù)據(jù)EMD-LSTM的預(yù)測效果最好,而方差相對較小的數(shù)據(jù)LSTM的預(yù)測效果最好,這也能體現(xiàn)出EMD對非平穩(wěn)數(shù)據(jù)的處理的效果良好。該研究針對方差所體現(xiàn)的波動性,為未來深入研究找到確定的臨界值去選擇更合適的模型,從而進(jìn)一步對國內(nèi)外股指進(jìn)行有效預(yù)測提供了思路。

      猜你喜歡
      收盤價(jià)成指股指
      華夏戰(zhàn)略新興成指ETF劍指“風(fēng)口”布局未來
      投資有道(2018年6期)2018-07-10 18:01:26
      股神榜
      平安千億回購 股指觸底回升
      股指再度回落 機(jī)構(gòu)逢高減倉
      降杠桿引發(fā)股指沖高回落
      股指震蕩走高筑底之日可期
      基于GARCH族模型的深證成指波動特征實(shí)證分析*
      股神榜
      股神榜
      股神榜
      海丰县| 合作市| 文昌市| 合肥市| 扎鲁特旗| 贵南县| 阳春市| 金乡县| 贵南县| 湟中县| 建始县| 同江市| 聊城市| 陆良县| 虞城县| 奉贤区| 潞西市| 伊川县| 沧州市| 凤庆县| 宿松县| 浑源县| 夏河县| 抚州市| 太和县| 徐闻县| 八宿县| 龙陵县| 石家庄市| 青阳县| 阿克陶县| 辽中县| 抚松县| 海林市| 桐城市| 申扎县| 星子县| 马龙县| 玉山县| 黄石市| 息烽县|