• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度森林的選股策略

      2019-11-09 13:41:33王倫
      經(jīng)濟研究導刊 2019年27期

      王倫

      摘 要:多因子模型一直是量化投資領(lǐng)域的重要方法,而如何選擇有效因子并確定因子權(quán)重從而構(gòu)建有效的投資組合是研究者重點討論的議題。以每只股票收益率作為分類標準,引入深度森林算法篩選股票,利用滬深300成分股進行選股回測,選取預測收益率大于0的概率排名靠前的30只股票進行實證分析。研究結(jié)果表明,深度森林算法比隨機森林算法具有更高的超額收益,且具有更低的回撤率,該模型對量化投資策略的設(shè)計具有重要的實際意義。

      關(guān)鍵詞:深度森林;量化選股;多因子分析

      中圖分類號:F830.91? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2019)27-0078-02

      預測股票市場價格走勢是一項非常具有挑戰(zhàn)性的任務,因為它涉及到許多不確定性和影響某一天市場價值的許多變量,如經(jīng)濟條件、投資者對某一特定公司的看法、政治事件等。這就使得股票市場易受快速變化的影響,造成股票價格的隨機波動。股票市場序列通常是動態(tài)的、非參數(shù)的、混沌的、有噪聲的,因此,股票市場價格的波動被認為是一個隨機過程,具有較大的波動性短時間窗口的發(fā)音。然而,一些股票往往傾向于發(fā)展線性趨勢超過長期的時間窗口。由于股票行為的混沌性和高度波動性,投資股票市場伴隨著高風險。為了把風險降到最低先進的知識未來的股價走勢是必要的。交易員更有可能購買其股票未來的價值預計會增加。另一方面,交易員可能會克制自己購買價值預計在未來會下跌的股票。所以,需要準確預測股票市場價格的趨勢,以使資本收益最大化,損失最小化。

      在預測股票價格行為的主要方法中,以下是特別的值得注意的:技術(shù)分析、時間序列預測、機器學習及數(shù)據(jù)產(chǎn)業(yè)(Hellstrom and Holmstromm,1998)和股票波動建模及預測使用微分方程(Saha,Routh和Goswami,2014)。本文主要研究的是第三種方法,是由于與股票市場預測問題相關(guān)的數(shù)據(jù)集太大而無法得到使用非數(shù)據(jù)挖掘方法處理。

      一、深度森林gcForest

      深度森林由南京大學周志華教授和馮霽博士2017年發(fā)表的論文中提出的,這是一種可以與深度神經(jīng)網(wǎng)絡相媲美的基于樹的模型。

      本文提出了一種新的模型gcForest(多粒度級聯(lián)森林),它是一種基于樹的集成方法,將樹集成到樹中,并將樹集成到樹中,以達到表征學習的效果。通過對高維輸入數(shù)據(jù)進行多粒度掃描,可以增強其表征學習能力。序列中的層數(shù)也可以自適應地確定,這樣模型復雜性就不需要是自定義超參數(shù),而是根據(jù)數(shù)據(jù)情況自動設(shè)置的參數(shù)。值得注意的是,gcForest的超參數(shù)比DNN少。更好的部分是gcForest對參數(shù)具有很好魯棒性,即使使用默認參數(shù)也是如此。換句話來說,gcForest相對于DNN,不僅超參數(shù)更少,而且對超參數(shù)的依賴性也更低。因為這樣,gcForest的訓練更為便捷,理論分析也更為清晰,這并不是說樹比神經(jīng)網(wǎng)絡更好去解釋,就單純從超參數(shù)來說,更少超參數(shù)意味著更少的主觀設(shè)定。

      二、實證分析

      在因子選擇方面,為了比較不同因子選擇方法的效果,本次研究盡可能多的篩選出有效因子。綜合分析了多家券商的研究報告和各類學術(shù)論文,運用通聯(lián)數(shù)據(jù)量化數(shù)據(jù)平臺,從估值因素、規(guī)模因素、交易量因素、動量因素、趨勢因素等方面篩選出了34個常用的有效因素。

      本次實驗數(shù)據(jù)為2010年1月1日至2018年12月31日滬深300指數(shù)各成分股選取最后一個交易日的所有交易的股票要素價值和收益率。將收益率大于0的標記為1,其他則標記為0,用于模型分類的目標值。用2010年1月1日至2017年3月31日的數(shù)據(jù)作為訓練集來訓練模型,回測用2017年4月1日到2018年12月31日的數(shù)據(jù),所有因子數(shù)據(jù)都通過中性化、去極值、標準化處理,并去掉了含有缺失值的股票。

      三、結(jié)語

      利用上述34個因子值,根據(jù)主成分分析結(jié)果,選取前20個主成分作為分類的解釋變量,構(gòu)建多因子模型。將股票收益率作為模型分析的解釋變量。首先采用隨機森林算法進行實驗,并利用優(yōu)礦平臺進行研究。

      從表1的回測檢驗結(jié)果可以看出,隨機森林多因子策略的年化收益率為26.5%,滬深300指數(shù)的市場收益率為15%,超額收益為11.8%,阿爾法超額收益說明了多因子模型的有效性。最大回撤率為8.9%,說明模型具有相當?shù)姆€(wěn)定性。

      從表2可以看出,深度森林多因子策略年化收益達到32.9%,并且獲得了18.2%的阿爾法超額收益,故而深度森林在多因子選股策略是明顯要優(yōu)于隨機森林的,且最大回撤只有7.9%,相比隨機森林,該模型具有更高的穩(wěn)定性。

      參考文獻:

      [1]? L.Breiman.Random forests.Machine Learning,2001,(1):5-32.

      [2]? Zhou Zhihua,Ji Feng.Deep Forest:Towards an Alternative to Deep onference on Artificial Intelligence,2017:3553-3559.

      瓮安县| 顺昌县| 陆丰市| 大同市| 上栗县| 修文县| 湖南省| 黎平县| 青海省| 林州市| 定结县| 社旗县| 石门县| 巨野县| 博野县| 永寿县| 陵川县| 邳州市| 西安市| 淮安市| 定结县| 镇康县| 板桥市| 甘谷县| 普安县| 隆安县| 新邵县| 鸡东县| 宜兰市| 历史| 安庆市| 临颍县| 民权县| 正安县| 德令哈市| 紫阳县| 五指山市| 咸丰县| 定南县| 枣强县| 左贡县|