• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多尺度核自適應(yīng)濾波的股票收益預(yù)測

      2023-05-24 03:18:26湯興恒徐天慧張彩明
      計算機應(yīng)用 2023年5期
      關(guān)鍵詞:時序股票尺度

      湯興恒,郭 強*,徐天慧,張彩明

      (1.山東財經(jīng)大學 計算機科學與技術(shù)學院,濟南 250014;2.山東省數(shù)字媒體技術(shù)重點實驗室(山東財經(jīng)大學),濟南 250014;3.山東大學 軟件學院,濟南 250101;4.山東省未來智能金融工程實驗室(山東工商學院),山東 煙臺 264005)

      0 引言

      股票時序預(yù)測是指利用股票市場歷史數(shù)據(jù)建立預(yù)測模型來捕捉潛在的交易模式,從而為投資者理性投資提供指導(dǎo)。精確穩(wěn)定的股票時序預(yù)測模型能夠為投資者制定合理投資策略、規(guī)避潛在投資風險提供幫助。然而,股票市場是一個受多種因素影響的復(fù)雜非線性動態(tài)系統(tǒng)[1],這使得根據(jù)獲取的歷史信息對股票時序數(shù)據(jù)進行預(yù)測成為一項非常具有挑戰(zhàn)性的任務(wù)。

      目前,眾多技術(shù)被應(yīng)用于股票時序數(shù)據(jù)預(yù)測領(lǐng)域,如:差分整合移動平均自回歸[2]、卡爾曼濾波[3]、長短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)[4]。這些方法雖然在平均絕對誤差(Mean Absolute Error,MAE)和均方誤差(Mean Square Error,MSE)等指標方面表現(xiàn)出較好的性能,但投資者在交易活動中往往更加看重投資行為能否獲得較高的回報率。針對這一問題,文獻[5]中使用核自適應(yīng)濾波(Kernel Adaptive Filtering,KAF)捕捉股票時序數(shù)據(jù)中潛在的交易模式,用以預(yù)測股票未來收益。實驗結(jié)果表明,該方法可以比較準確地捕捉潛在的交易模式,取得較高的回報率。然而,股票市場具有高波動性和非平穩(wěn)性的特點,這為準確捕捉潛在的交易模式增加了難度[6]。股票時間序列具有多尺度特征,對股票時間序列進行多尺度分解能夠?qū)⒎瞧椒€(wěn)的時間序列分解成若干個平穩(wěn)的子序列,且每個子序列具備不同的尺度波動特征[7],這便于進一步捕捉股票市場中潛在的多尺度交易模式,能有效增強股票收益預(yù)測模型的性能[8]。受此啟發(fā),本文提出了一種基于多尺度核自適應(yīng)濾波(Multi-Scale Kernel Adaptive Filtering,MSKAF)的股票收益預(yù)測方法。為準確刻畫股票時間序列的多尺度特征,該方法對股票時序數(shù)據(jù)利用平穩(wěn)小波分解得到具有不同尺度特征的子序列,并對各子序列分別使用核自適應(yīng)濾波方法進行序列學習,以得到不同尺度的波動規(guī)律,捕捉潛在的多尺度交易模式。此外,在處理多元時序數(shù)據(jù)時,為利用股票間的相互依賴關(guān)系[9],該方法對每只股票的預(yù)測不僅依賴于該只股票的交易模式,還會參考其所依賴股票的交易模式,從而進一步增強模型的預(yù)測能力。在公開數(shù)據(jù)集上的實驗結(jié)果充分說明了本文方法在股票時序未來收益預(yù)測問題上的有效性。

      1 相關(guān)工作

      統(tǒng)計預(yù)測模型主要基于統(tǒng)計理論對股票時序數(shù)據(jù)進行預(yù)測。針對金融時序預(yù)測問題,Sims 提出了向量自回歸(Vector Autoregression,VAR)模型[10-11]。該模型通過將系統(tǒng)中每一個變量作為所有變量的滯后值函數(shù)建模得到,從而將單變量自回歸模型推廣到由多元變量組成的向量自回歸模型。然而,VAR 模型僅能對平穩(wěn)的時序數(shù)據(jù)作出比較準確的預(yù)測,對于受多種因素影響的非平穩(wěn)數(shù)據(jù),VAR 模型的預(yù)測性能有所下降,這使它的應(yīng)用范圍受到限制。為此,Engle等[12]在VAR 的基礎(chǔ)上引入誤差修正項,提出了向量誤差修正模型(Vector Error Correction Model,VECM)。該模型常被用于具有協(xié)整關(guān)系的非平穩(wěn)時間序列建模。上述基于統(tǒng)計模型的預(yù)測方法一般采用線性形式建立相應(yīng)的數(shù)學模型對時序數(shù)據(jù)進行擬合,但股票時序數(shù)據(jù)受多種因素的影響一般呈非線性形式,這導(dǎo)致該類預(yù)測方法難以得到理想的預(yù)測結(jié)果。此外,統(tǒng)計預(yù)測模型在建模過程中依賴于數(shù)據(jù)滿足正態(tài)分布和平穩(wěn)性假設(shè),這對于具有非線性、非平穩(wěn)、非正態(tài)等特征的股票時序數(shù)據(jù)來說,假設(shè)條件難以滿足。故統(tǒng)計模型對非線性時序數(shù)據(jù)的擬合效果較差,這限制了該類方法在股票時序預(yù)測領(lǐng)域中的應(yīng)用。

      伴隨著非線性時序預(yù)測問題研究的深入,以支持向量機(Support Vector Machine,SVM)和核自適應(yīng)濾波為代表的核函數(shù)方法在時序預(yù)測領(lǐng)域得到廣泛使用[5,13-14]。SVM 以結(jié)構(gòu)風險最小化為原則,具有良好的泛化能力,但它的關(guān)鍵參數(shù)很難確定,這在很大程度上限制了它的應(yīng)用范圍。核自適應(yīng)濾波是一種記憶學習和糾錯相結(jié)合的方法,本質(zhì)是通過一個線性的自適應(yīng)濾波算法實現(xiàn)非線性函數(shù)映射。該類方法結(jié)合了神經(jīng)網(wǎng)絡(luò)的普適逼近特性和線性自適應(yīng)濾波方法的凸優(yōu)化特性[5],能夠很好地擬合非線性函數(shù)關(guān)系,被廣泛地應(yīng)用于時間序列預(yù)測領(lǐng)域。核最小均方(Kernel Least Mean Square,KLMS)算法[15]是一種典型的基于核自適應(yīng)濾波的時序預(yù)測方法,但它在進行時序預(yù)測時,計算復(fù)雜度會隨著樣本量的增加而增長。為此,Chen 等[16]提出了量化核最小均方(Quantized Kernel Least Mean Square,QKLMS)算法。該方法通過矢量量化技術(shù)壓縮輸入或特征空間,以抑制高斯核結(jié)構(gòu)的增長,降低模型計算復(fù)雜度。此外,文獻[17]將矢量量化技術(shù)與最近實例質(zhì)心估計方法相結(jié)合,提出了最近實例質(zhì)心估計核最小均方(Nearest Instance Centroid Estimation Kernel Least Mean Square,NICE-KLMS)算法,在一定程度上解決了核自適應(yīng)濾波方法隨樣本數(shù)量增加導(dǎo)致的計算復(fù)雜度增長的問題,并表現(xiàn)出良好的性能。

      近年來,基于神經(jīng)網(wǎng)絡(luò)的方法因具備優(yōu)秀的非線性映射能力,在時序預(yù)測領(lǐng)域得到了研究人員的廣泛關(guān)注[18-20]?;谇梆伾窠?jīng)網(wǎng)絡(luò)的預(yù)測方法通過動態(tài)調(diào)整網(wǎng)絡(luò)神經(jīng)元的互連權(quán)值來擬合時間序列數(shù)據(jù)內(nèi)在的映射關(guān)系[21],最終能夠獲得比統(tǒng)計模型更準確的預(yù)測結(jié)果。但基于前饋神經(jīng)網(wǎng)絡(luò)的預(yù)測方法并不能反映股票的時序依賴性。為解決這一問題,文獻[22]中提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的股票時序預(yù)測方法。RNN 可以通過保存并傳遞上一時刻的狀態(tài)信息來捕捉時序數(shù)據(jù)的依賴性。但該模型在訓練時會隨著隱藏層數(shù)量的增加而產(chǎn)生梯度消失或梯度爆炸問題,嚴重影響預(yù)測結(jié)果。為此,Hochreiter 等[23]在RNN 模型中引入細胞狀態(tài)和門結(jié)構(gòu)提出了LSTM,較好地緩解了長序列訓練過程中的梯度消失和梯度爆炸問題,并在捕捉長期時序依賴方面表現(xiàn)出良好的性能。

      盡管基于神經(jīng)網(wǎng)絡(luò)的預(yù)測方法在非線性數(shù)據(jù)處理方面表現(xiàn)出色,但在訓練時通常需要較強的硬件資源和大量的訓練數(shù)據(jù),并且存在易陷入局部最優(yōu)解和可解釋性較差等缺點,這在一定程度上限制了此類方法在股票時序預(yù)測領(lǐng)域的應(yīng)用。不同于神經(jīng)網(wǎng)絡(luò),核自適應(yīng)濾波不僅具有較低的計算復(fù)雜度和簡單的遞歸更新形式,而且具有較好的可解釋性,故本文專注于基于KAF 的股票時序預(yù)測方法。此外,由于股票時序數(shù)據(jù)具有多尺度特征,因此對它們進行多尺度分解有助于刻畫時序數(shù)據(jù)在不同尺度上的波動規(guī)律,捕捉潛在的多尺度交易模式,這對于提升股票預(yù)測模型的性能具有重要意義[8]。鑒于此,本文提出了一種基于多尺度核自適應(yīng)濾波(MSKAF)的股票收益預(yù)測方法。實驗結(jié)果表明,相較于其他對比方法,本文方法能夠獲得更高的回報率。

      2 本文方法

      股票是具有多尺度特征的時間序列。本文方法首先使用平穩(wěn)小波變換(Stationary Wavelet Transform,SWT)對股票數(shù)據(jù)進行多尺度分解,以獲得具有不同尺度特征的子序列;在此基礎(chǔ)上,對各子序列使用KAF 方法進行序列學習,刻畫股票時序數(shù)據(jù)在不同尺度上的波動規(guī)律,捕捉潛在的多尺度交易模式;最后,模型借助捕捉到的多尺度交易模式對股票未來收益作出預(yù)測,MSKAF 模型如圖1 所示。此外,為應(yīng)對KAF 方法的計算復(fù)雜度會隨樣本量的增加而增長的問題,本文采用分段學習策略和矢量量化技術(shù)抑制高斯核結(jié)構(gòu)的增長,實現(xiàn)降低模型計算復(fù)雜度的目的。

      圖1 MSKAF模型示意圖Fig.1 Schematic diagram of MSKAF model

      2.1 多尺度分解

      傳統(tǒng)的小波變換是進行多尺度分解常用的工具,但因其分解過程中存在下采樣操作,會使獲得的子序列長度縮減為原始序列長度的一半,導(dǎo)致子序列在時間維度上無法與原始序列相對應(yīng),不利于模型對時序數(shù)據(jù)的進一步分析。與傳統(tǒng)的小波變換不同,SWT 在對股票時間序列進行多尺度分解時,由于濾波器的延展,可使多尺度分解后的子序列與原始序列長度相同,保留原始序列中的時間維度信息。因此,本文采用SWT 對股票時間序列進行多尺度分解。

      SWT 的多尺度分解過程如圖2 所示。給定原始股票時序數(shù)據(jù)D={yt:t∈[1,2,…,n]},t為時間變量,yt∈R 為第t時刻的收益。SWT 分別通過高通濾波器H0和低通濾波器L0對D進行卷積運算得到子序列D0和D1'。在此基礎(chǔ)上,將濾波器H0和L0進 行插值補零得 到H1和L1,并利用H1和L1對D1'進行分解得到D1和D2'。依此類推,經(jīng)過k階分解后,可得到最終的高頻子序列Dk-1和低頻子序列Dk。

      圖2 多層級平穩(wěn)小波分解Fig.2 Multi-level stationary wavelet decomposition

      2.2 異常點檢測

      在時序預(yù)測過程中,核自適應(yīng)濾波方法會為每一個新樣本創(chuàng)建內(nèi)核單元,導(dǎo)致計算復(fù)雜度會隨樣本量的增加而增長[14]。針對上述問題,本文采用文獻[24]提出的異常點檢測算法對股票時序數(shù)據(jù)進行異常點檢測,并依據(jù)異常點對股票時間序列進行分段,通過分段學習策略實現(xiàn)降低模型計算復(fù)雜度的目的。如圖3 所示,對于時序數(shù)據(jù)D={yt:t∈[1,2,…,n]},圖中實線條代表D的數(shù)據(jù)波動情況,首先根據(jù)序列段{y1,y2,…,yt-1}(圖3 中陰影窗口)的概率密度pt-1計算yt的異常得分,然后依據(jù)異常得分判斷yt是否為異常點。異常得分通過式(1)計算:

      圖3 異常點檢測過程示意圖Fig.3 Schematic diagram of outlier detection process

      圖4 股票時間序列采樣過程Fig.4 Sampling process of stock time series

      式(1)被稱為對數(shù)損失分數(shù),表示yt相較于概率密度函數(shù)pt-1的預(yù)測損失[25]。當分數(shù)Score(yt) ≥δ時,表示yt為一個異常點,其中δ為異常點閾值;反之,yt為正常點。

      2.3 多尺度核自適應(yīng)濾波

      1)Score(yt) ≥δ:這表明時間序列在yt處出現(xiàn)突變,將增加一套新的字典。此外,為了避免序列學習過程中出現(xiàn)較大的不連續(xù)[17],會將最鄰近字典中的所有中心和系數(shù)復(fù)制到新增加的字典中。具體過程描述如下:

      2)Score(yt) <δ:這表明時間序列在yt處未出現(xiàn)突變,不需要創(chuàng)建新的字典。

      此外,本文采用矢量量化策略用以抑制核函數(shù)結(jié)構(gòu)的增長:

      不同于文獻[16]中的矢量量化策略,本文采用數(shù)據(jù)分布特征代替輸入空間中距離度量作為更新函數(shù)結(jié)構(gòu)的標準,提高了最鄰近中心的利用效率,使算法計算復(fù)雜度有所下降。算法1 給出了基于多尺度核自適應(yīng)濾波的序列學習過程。

      算法1 基于多尺度核自適應(yīng)濾波的序列學習算法。

      該方法需對n個樣本分別進行處理,時間復(fù)雜度為O(N);對于每一個樣本,在計算濾波輸出時均需要尋找其最鄰近的字典,該子過程的時間復(fù)雜度為O(N);在后續(xù)字典存儲過程中,還需尋找樣本的最鄰近內(nèi)核中心,此子過程的時間復(fù)雜度同為O(N)。因此,本文算法的時間復(fù)雜度為O(N3)。

      2.4 多元時序數(shù)據(jù)依賴模型

      為捕捉不同股票之間的相互依賴關(guān)系,提高模型的預(yù)測性能,本文將算法1 中的模型擴展為多元數(shù)據(jù)依賴模型。該模型在處理多元時序數(shù)據(jù)時,設(shè)Dstock={Dr:r∈[1,2,…,q]}為q只股票時序數(shù)據(jù),其中Dr={yt,r:t∈[1,2,…,n]}為第r只股票時序數(shù)據(jù)。如圖5 所示,對于每只股票分別使用算法1 進行多尺度序列學習,最終每只股票序列都會由子序列D1和D2分別得到高頻字典和低頻字典,即:

      圖5 多元時序數(shù)據(jù)依賴模型Fig.5 Multivariate time series data dependence model

      本文提出的多元時序數(shù)據(jù)依賴模型如算法2 所示。在進行股票收益預(yù)測任務(wù)時,多元時序數(shù)據(jù)依賴模型的任務(wù)是根據(jù)輸入向量x'∈RM去預(yù)測其標簽值∈R。如2.3 節(jié)中,首先需要尋找最鄰近的高頻字典i*h和低頻字典i*l,使用如下表達式:

      由上述公式可以看出,有多只股票會被同時考慮用于選擇最鄰近的高頻字典和低頻字典。在預(yù)測階段時,這些字典會被用于預(yù)測,如式(8):

      其中w1的設(shè)置如下:

      w1為預(yù)測階段低頻字典所占權(quán)重;var為訓練樣本收益日變化率的方差;υ和γ為超參數(shù)。

      由式(6)~(8)可知,當對第r只股票中樣本x'進行預(yù)測時,不僅依賴在該股票時序數(shù)據(jù)上捕捉的交易模式,還會參考從其他股票中捕捉到的交易模式,為將股票市場間的相互依賴關(guān)系融入模型提供了一種有效的方法,能進一步增強模型的預(yù)測性能。

      算法2 多元時序數(shù)據(jù)依賴模型。

      3 實驗與結(jié)果分析

      在公開數(shù)據(jù)集上進行實驗以驗證本文所提出的MSKAF方法在股票市場未來收益預(yù)測上的有效性。

      3.1 實驗數(shù)據(jù)

      本文實驗數(shù)據(jù)來源于公開數(shù)據(jù)集,該數(shù)據(jù)集中共包含來自德國(DE)、英國(UK)和美國(US)三個經(jīng)濟體的24 只股票(見表1)。本文使用調(diào)整后的收盤價計算每日收益[27],采用m=10 的滑動窗口對2006 年1 月17 日 至2016 年11 月30 日的股票時序數(shù)據(jù)進行采樣,并將獲得的10 880 組實驗數(shù)據(jù)作為訓練集;對2017 年1 月3 日至2018 年2 月28 日的股票收益數(shù)據(jù)以同種方式進行采樣,并將獲得的6 720 組實驗數(shù)據(jù)作為測試集。此外,該數(shù)據(jù)集中的股票收益數(shù)據(jù)是標準化的,所有收益數(shù)據(jù)的均值估計為0,標準差為1。

      表1 實驗過程中使用的股票信息Tab.1 Stock information used in experimental process

      3.2 對比方法及參數(shù)設(shè)置

      為評估MSKAF 的預(yù)測性能,將它與以下6 種常用的時序預(yù)測方法進行對比:

      1)基于神經(jīng)網(wǎng)絡(luò)的預(yù)測方法[4]。LSTM 是一種特殊的RNN 模型,可以有效地捕捉時序數(shù)據(jù)的依賴性并緩解訓練過程的梯度消失和梯度爆炸問題,是一種常用的神經(jīng)網(wǎng)絡(luò)時序預(yù)測方法。

      2)基于向量自回歸模型的預(yù)測方法[10-11]。VAR 是一種經(jīng)典的多元變量向量自回歸模型,可用于多元時序數(shù)據(jù)預(yù)測問題建模。

      3)基于向量誤差修正模型的預(yù)測方法[12]。VECM 在VAR 的基礎(chǔ)上增加了誤差修正項,常被用于具有協(xié)整關(guān)系的非平穩(wěn)時間序列建模。

      4)基于量化核最小均方算法的預(yù)測方法[16]。QKLMS 通過量化操作壓縮輸入數(shù)據(jù),有效地抑制了高斯核結(jié)構(gòu)的增長。

      5)基于最近實例質(zhì)心估計核最小均方算法的預(yù)測方法[17]。NICE-KLMS 采用矢量量化技術(shù)與最近實例質(zhì)心估計相結(jié)合的策略,有效降低了模型的計算復(fù)雜度。

      6)基于核自適應(yīng)濾波算法的預(yù)測方法TSKAF(Two-Stage KAF)[5]。該方法采用一種新的矢量量化策略,并將多元時序數(shù)據(jù)相互依賴關(guān)系有效地融入模型,表現(xiàn)出了較好的時序預(yù)測性能。

      如表2 所示,以上6 種對比方法均采用作者公開的源代碼以及默認的參數(shù)設(shè)置。此外,對基于LSTM 的預(yù)測方法,本文采用20 個神經(jīng)元的單隱層結(jié)構(gòu)進行訓練,使用Sigmoid函數(shù)作為激活函數(shù),并采用Adam 算法對模型進行優(yōu)化。對基于自回歸模型的預(yù)測方法的參數(shù)設(shè)置主要參考之前的研究[28-29],以保證它們可在測試數(shù)據(jù)集上獲得較好的性能。

      表2 比較方法的參數(shù)設(shè)置Tab.2 Parameter setting of comparison methods

      3.3 評價指標

      本文使用在時序預(yù)測領(lǐng)域中最為廣泛采用的平均絕對誤差(MAE)[30]、均方誤差(MSE)[31]以及夏普比率(Sharpe Ratio,SR)[32]作為模型預(yù)測性能評價標準。MAE 是樣本預(yù)測值與真實值的絕對平均誤差,值越小代表預(yù)測結(jié)果越接近于真實值,即預(yù)測方法的性能越好;MSE 是樣本預(yù)測值與真實值誤差平方的均值,用來衡量二者之間的差異程度,值越接近于0 代表預(yù)測方法的性能越好;SR 是風險調(diào)整后的收益率指標,用來衡量承擔單位風險所獲得的超額收益,值越高代表預(yù)測方法的性能越好。

      3.4 實驗結(jié)果與分析

      表3~5 分別給出了各預(yù)測方法實驗結(jié)果的MAE、MSE 以及SR,每個表格的最后兩行都給出了各預(yù)測方法的平均性能,且在該指標下用粗體標記最優(yōu)值。

      表3 測試階段各模型的MAE值Tab.3 MAE values of different models in test phase

      從表3 可以觀察到,基于LSTM 的預(yù)測方法實驗結(jié)果的平均MAE 值為0.012,這表明它的預(yù)測性能在MAE 指標上優(yōu)于其他方法。雖然該方法表現(xiàn)出了最好的性能,但其他對比方法的實驗結(jié)果也均取得了相對較低的MAE 值。此外,本文方法實驗結(jié)果平均MAE 值為0.018,略高于基于LSTM的預(yù)測方法。雖然MAE 可從預(yù)測精準度的角度衡量預(yù)測方法的性能,但投資者在交易活動中往往更看重投資行為能否獲得較高的回報率[5]。

      由表4 可以看出,對比方法都獲得了相同的平均MSE值,這表明在該指標下所有的預(yù)測方法都表現(xiàn)出了較好的預(yù)測性能。然而,基于LSTM 的預(yù)測方法在訓練時需要較強的硬件資源和大量的訓練數(shù)據(jù)[33],并且該類方法的可解釋性較差。不同于基于LSTM 和自回歸模型的預(yù)測方法,核自適應(yīng)濾波是一種基于記憶學習和糾錯相結(jié)合的方法,故該類預(yù)測方法可在未獲得完整訓練集的情況下即開始模型訓練。此外,本文模型在對多元股票時序數(shù)據(jù)進行預(yù)測時,不僅使用在該股票中捕捉的多尺度交易模式,而且會參考其所依賴股票的交易模式來進行預(yù)測,從而進一步提升模型的預(yù)測能力,為將股票間的相互依賴關(guān)系融入預(yù)測模型提供了一種有效的方法。

      表4 測試階段各模型的MSE值Tab.4 MSE values of different models in test phase

      盡管MAE 與MSE 可以從預(yù)測精準度的角度衡量模型的性能,但對于投資者而言,回報率是一項更為重要的衡量模型預(yù)測性能的評價標準。由表5 可看出,本文方法取得了最高的SR 值,優(yōu)于其他對比方法,這表明本文提出的MSKAF模型會為投資者提供回報率較高的投資策略。

      表5 測試階段各模型的SR值Tab.5 SR values of different models in test phase

      由表3 及表5 可知,本文提出的基于MSKAF 的預(yù)測方法相較于基于TSKAF 的預(yù)測方法在MAE 指標上降低了10%;在SR 指標上提升了8.79%。由此可知,對股票時序數(shù)據(jù)進行多尺度分解后,MSKAF 模型可以分離出具有不同尺度波動規(guī)律的子序列,進而更準確地捕捉不同尺度的交易模式,大幅提升了模型的預(yù)測性能。但是,如果內(nèi)核帶寬參數(shù)選擇不當,會對KAF 的收斂速度產(chǎn)生不利影響[5],對此可以使用Silverman 經(jīng)驗法則來選擇合適的參數(shù)值[34]。此外,本文方法利用再生和希爾伯特空間中的線性自適應(yīng)結(jié)構(gòu)來得到輸入空間中的非線性映射關(guān)系,在保持線性自適應(yīng)濾波結(jié)構(gòu)簡單特性的同時增強了模型的預(yù)測性能。

      為分析多尺度分解層數(shù)k對模型預(yù)測性能的影響,將時間窗口大小m固定為10,時間窗口滑動步長step固定為1,并選取分解層數(shù)k=1、2 與3 進行實驗,結(jié)果如表6 所示。

      表6 多尺度分解層數(shù)對實驗結(jié)果的影響Tab.6 Influence of multi-scale decomposition layers on experimental results

      由表6 可以看出,當分解層數(shù)k由1 上升至2 時,在SR 指標上,基于MSKAF 的預(yù)測方法取得了較大的性能提升,這表明隨著多尺度分解層數(shù)的增加,MSKAF 可以更為準確地捕捉隱藏在不同尺度子序列中的多尺度交易模式,使模型的預(yù)測性能得到了明顯提升。由于MSKAF 僅適用于處理兩個尺度的子序列,故當分解層數(shù)k由2 上升至3 時,本文僅使用子序列D2與D3進行字典學習。由表6 可看出,當分解層數(shù)k由2 上升至3 時,在SR 指標上,基于MSKAF 的預(yù)測方法性能大幅下降,這表明:一方面,由于只使用了子序列D2與D3進行字典學習,這會造成隱藏在多尺度子序列中信息的丟失,因此導(dǎo)致了MSKAF 性能的下降;另一方面,隨著多尺度分解層數(shù)k的增大,會產(chǎn)生k+1 個子序列,雖然MSKAF 可以更準確地捕捉多尺度交易模式,但不同子序列間字典權(quán)重的設(shè)置將會變得尤其復(fù)雜與困難。

      TSKAF 模型還包含兩個重要參數(shù),分別是時間窗口大小m和窗口滑動步長step。為分析m對該模型預(yù)測性能的影響,固定step為1,分別將窗口大小設(shè)置為m=8、9、10、11、12和13 在數(shù)據(jù)集上進行股票收益預(yù)測。圖6(a)給出了選取不同窗口大小時TSKAF 的預(yù)測性能(為展示方便,圖6 中的MAE 值均放大100 倍)。從中可以看出,盡管m=10 時,未取得最低的MAE 值,但擁有最高的SR 值3.909。這表明時間窗口大小為10 時,TSKAF 模型雖然沒有取得最優(yōu)的預(yù)測精確度,但可以取得最高的收益率,具有較高的綜合性能。因此,本文采用長度為10 的窗口對時序數(shù)據(jù)進行采樣。此外,由圖6(a)中MAE 的變化趨勢可以得知,隨著時間窗口的增大,TSKAF 模型的預(yù)測精確度將得到提升;但是,隨著時間窗口的進一步增大(m=13 時),窗口內(nèi)樣本點間的非線性映射關(guān)系將變得更加復(fù)雜,導(dǎo)致TSKAF 模型的預(yù)測性能下降。

      圖6 m與step對實驗結(jié)果的影響Fig.6 Influence of m and step on experimental results

      為分析step對該模型預(yù)測性能的影響,固定m為10,分別將窗口滑動步長設(shè)置為step=1、2、3、4 和5 進行實驗,結(jié)果如圖6(b)所示??梢杂^察到,隨著步長step的逐漸增大,模型的預(yù)測性能逐漸下降。這是由于步長step的增大,將會使訓練集數(shù)據(jù)規(guī)模減小(如step=2 時,訓練集數(shù)據(jù)規(guī)模將變?yōu)樵加柧毤?/2),從而導(dǎo)致模型的預(yù)測性能下降。

      4 結(jié)語

      本文針對股票時序數(shù)據(jù)的未來收益預(yù)測進行研究,首先介紹了未來收益預(yù)測問題的研究背景,然后回顧了基于統(tǒng)計模型的時間序列預(yù)測方法、基于核函數(shù)的時間序列預(yù)測方法和基于神經(jīng)網(wǎng)絡(luò)的時間序列預(yù)測方法,并對當前股票時序數(shù)據(jù)未來收益預(yù)測研究進行了簡要介紹。針對股票時間序列具有多尺度波動規(guī)律的特點,本文提出了一種多尺度核自適應(yīng)濾波(MSKAF)模型。該模型可以實現(xiàn)對股票時序數(shù)據(jù)多尺度交易模式的捕捉;而且模型采用分段學習策略和矢量量化技術(shù),能降低模型復(fù)雜度;模型在處理多元時序數(shù)據(jù)時,較好地利用了股票間的相互依賴關(guān)系,能有效提升模型的預(yù)測性能。實驗結(jié)果表明,本文提出的基于MSKAF 的股票收益預(yù)測方法取得了較好的預(yù)測性能,驗證了模型在股票未來收益預(yù)測問題上的有效性。

      猜你喜歡
      時序股票尺度
      時序坐標
      基于Sentinel-2時序NDVI的麥冬識別研究
      財產(chǎn)的五大尺度和五重應(yīng)對
      一種毫米波放大器時序直流電源的設(shè)計
      電子制作(2016年15期)2017-01-15 13:39:08
      本周創(chuàng)出今年以來新高的股票
      本周創(chuàng)出今年以來新高的股票
      本周連續(xù)上漲3天以上的股票
      近期連續(xù)漲、跌3天以上的股票
      宇宙的尺度
      太空探索(2016年5期)2016-07-12 15:17:55
      9
      巴马| 林周县| 突泉县| 遂宁市| 明光市| 长垣县| 恭城| 海南省| 兴山县| 宁陕县| 景德镇市| 城口县| 微博| 天柱县| 曲阳县| 积石山| 肇东市| 绍兴市| 长泰县| 偃师市| 闻喜县| 神池县| 克拉玛依市| 云南省| 建水县| 林芝县| 汶上县| 桃源县| 新宁县| 凤台县| 疏勒县| 徐汇区| 聂荣县| 泉州市| 镇远县| 潞城市| 西贡区| 宝兴县| 敦化市| 本溪市| 德兴市|