晁夢(mèng)遙
(陜西省西安翻譯學(xué)院,陜西 西安 710105)
投資組合選擇的選擇是金融市場(chǎng)學(xué)中的一個(gè)關(guān)鍵問題。其基本思想在于回報(bào)和風(fēng)險(xiǎn)的均衡,即根據(jù)一個(gè)最優(yōu)化準(zhǔn)則選擇最好的投資組合。Markowitz 的投資組合選擇理論[1]為我們提供了如何推導(dǎo)出具有最小可能方差(最小風(fēng)險(xiǎn))的投資組合和生成位于有效邊界的投資組合的工具。基于這個(gè)理論框架,研究者們針對(duì)各種問題產(chǎn)生了大量的研究工作[2]-[10]。
這個(gè)方案及其變體理論使用統(tǒng)計(jì)模型進(jìn)行建模,捕捉到了淺層因素,而在金融領(lǐng)域,隨著事件復(fù)雜性的提升,即所有抽象級(jí)別可能看起來同樣可行,主要的深層因素往往與輸入數(shù)據(jù)呈非線性關(guān)系。這些需求激發(fā)了深層架構(gòu)的通用性,即深度投資組合選擇理論。深度學(xué)習(xí)工具具有極佳的使用價(jià)值[3],其極強(qiáng)的建模能力,其可以計(jì)算任何函數(shù)映射數(shù)據(jù)的最佳可用方法,以將可能回報(bào)以及風(fēng)險(xiǎn)數(shù)據(jù),轉(zhuǎn)化為價(jià)值。深度學(xué)習(xí)在金融市場(chǎng)領(lǐng)域有諸多研究[9]。
另外,組合投資學(xué)說的研究假設(shè)模型和漂移以及波動(dòng)的參數(shù)是已知的且為常數(shù),這使得參數(shù)需用以往數(shù)據(jù)估計(jì)且在此之后保持恒定。在實(shí)際變化的市場(chǎng)條件下,這個(gè)傳統(tǒng)的解決方案存在一定的不足[4][6]。將貝葉斯學(xué)習(xí)應(yīng)用到投資組合分析中能很好地解決這些問題。首先,貝葉斯方法將未知參數(shù)視作隨機(jī)變量并可以設(shè)置先驗(yàn)信息,從而可以將量化已知信息引入到建模中為學(xué)習(xí)提供參照而非決策。其次,貝葉斯模型很好地解釋了估計(jì)風(fēng)險(xiǎn)和模型不確定性[5]。本文中,我們將貝葉斯推斷引入到深層次因素的學(xué)習(xí)中。這些使得貝葉斯理論廣泛引用于金融領(lǐng)域[10][9]。
綜合以上考量以及思路,我們?cè)O(shè)計(jì)的深度變分貝葉斯投資組合最優(yōu)化方法分為學(xué)習(xí)和優(yōu)化部分。在學(xué)習(xí)階段中,(一)使用深度變分自編碼器網(wǎng)絡(luò)構(gòu)建的市場(chǎng)映射算法,其用于捕捉輸入數(shù)據(jù)的深層次表征;(二)基于深層次表征,使用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)多變量投資組合支出的監(jiān)督模型;在優(yōu)化部分,我們目的在于均衡學(xué)習(xí)階段的誤差。基于此,本文的貢獻(xiàn)主要有三點(diǎn),一是,針對(duì)投資配置中變量間復(fù)雜非線性關(guān)系進(jìn)行建模,并捕捉到深層影響因素;二是,將完全由數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)和貝葉斯理論引入到投資配置理論從而解決了傳統(tǒng)方法中存在的參數(shù)估計(jì)誤差以及模型依賴型算法在大數(shù)據(jù)情況下的不適定性;三是,設(shè)計(jì)了一個(gè)統(tǒng)一的學(xué)習(xí)框架,從而可以以監(jiān)督學(xué)習(xí)的方式端到端優(yōu)化投資配置模型。
本文的組織結(jié)構(gòu)如下。第二章,我們對(duì)深度變分貝葉斯投資配置算法進(jìn)行詳細(xì)的描述。第三章中,我們利用實(shí)驗(yàn)對(duì)算法的有效性進(jìn)行探討。第四章我們簡(jiǎn)述本文所得到的一般性結(jié)論。
在本文中,我們構(gòu)建變分自編碼和多變量投資組合輸出模型。首先,根據(jù)深度學(xué)習(xí)中的數(shù)據(jù)集分類思想,我們將市場(chǎng)數(shù)據(jù)劃分為訓(xùn)練集和驗(yàn)證集,表示為和,同時(shí)我們將目標(biāo)變量設(shè)為。給定具體目標(biāo),我們?cè)O(shè)計(jì)智能化投資組合方法,其在投資組合選項(xiàng)中進(jìn)行權(quán)衡以匹配目標(biāo)函數(shù)。
我們的投資組合結(jié)構(gòu)可以分為學(xué)習(xí)和權(quán)衡兩部分,表述如下:
針對(duì)市場(chǎng)數(shù)據(jù)以及相應(yīng)的目標(biāo)期望,學(xué)習(xí)部分主要進(jìn)行數(shù)據(jù)深層次因素的捕捉以及利用監(jiān)督學(xué)習(xí)模式來得到投資組合到目標(biāo)的映射函數(shù)。在深層次因素的捕捉中,我們使用變分自編碼器,其依據(jù)貝葉斯理論,能以無監(jiān)督的方式獲取隱藏變量以作為的優(yōu)化表征。公式如下:
此為變分自編碼器的變分下界,運(yùn)用重參數(shù)化技巧可得:
同時(shí),需要得到投資到目標(biāo)結(jié)果的映射函數(shù),其優(yōu)化公式如下:
其依據(jù)目標(biāo),從輸入信息創(chuàng)造一個(gè)非線性投資組合映射。
在理論上,深度學(xué)習(xí)可以捕捉變量間復(fù)雜和非線性的關(guān)系,以構(gòu)建性能極佳的回歸模型,這在大部分場(chǎng)景中均優(yōu)于傳統(tǒng)金融經(jīng)濟(jì)學(xué)的簡(jiǎn)單線性因子模型以及統(tǒng)計(jì)套利和其他定量投資管理技術(shù)。同時(shí),我們所提出的變分自編碼器將總信息減少到適用于大量輸入的信息子集,即隱層的編碼,并以編碼后信息與其自動(dòng)編碼版本的接近度作為衡量標(biāo)準(zhǔn),對(duì)投資組合進(jìn)行評(píng)判。
構(gòu)建數(shù)據(jù)到深層次因素(即隱層)以及從數(shù)據(jù)到投資組合目標(biāo)的映射網(wǎng)絡(luò)后,需要權(quán)衡上述誤差以平衡模型在深層次因素學(xué)習(xí)和目標(biāo)近似上的能力。則需要尋找最佳Lm和Lp:
從而我們需要找到φ,θ以及FW以確保上述條件的成立。為此,我們將檢查隱含的深層投資組合邊界以獲得感興趣的目標(biāo)作為正則化量的函數(shù),以提供可量化可訓(xùn)練優(yōu)化的度量函數(shù)。
我們的實(shí)驗(yàn)配置如下所述。
數(shù)據(jù)設(shè)置:本章實(shí)驗(yàn)部分所用的數(shù)據(jù)來自生物技術(shù)IBB指數(shù)的成分股,數(shù)據(jù)周期為2012年一月到2016年4月并按周計(jì)算回報(bào)數(shù)據(jù)。我們希望找到最優(yōu)策略從而可以擊敗由(see Merton,1971)給出的生物技術(shù)IBB指數(shù)。
數(shù)據(jù)劃分:對(duì)于本文所提出的學(xué)習(xí)和權(quán)衡兩個(gè)階段,我們采用2012年1月到2013年12月的數(shù)據(jù)用于學(xué)習(xí),用2014年1月到2016年5月的數(shù)據(jù)作為權(quán)衡階段的輸入。
實(shí)驗(yàn)設(shè)置:在網(wǎng)絡(luò)設(shè)置中,我們采用單隱層結(jié)構(gòu),即變分自編碼器中輸入通過一個(gè)10個(gè)神經(jīng)元的中間層和隱藏層相連,最終編碼層包含5個(gè)神經(jīng)元。而對(duì)于學(xué)習(xí)階段的目標(biāo)映射函數(shù),我們同樣采用包含10個(gè)神經(jīng)元的中間隱藏。以變分自編碼器的中間層編碼作為對(duì)股票的編碼,并考慮每個(gè)股票與其自動(dòng)編碼版本間的2范數(shù)差異,然后以此接近程度作為度量標(biāo)準(zhǔn)對(duì)股票進(jìn)行排名。我們將10個(gè)最多的公共股票和非大多數(shù)股票相加來增加深度投資組合中的股票數(shù)量。各模塊的訓(xùn)練batch size大小為10,而epoch 為500。
我們的實(shí)驗(yàn)結(jié)果如圖1所示:
Fig1.我們的深度變分貝葉斯投資組合理論在實(shí)驗(yàn)各階段的實(shí)驗(yàn)結(jié)果。其中(a)為深層次因素學(xué)習(xí)階段,即變分編碼階段,(b)為數(shù)據(jù)校準(zhǔn)階段,而(c)和(d)為優(yōu)化階段。
在學(xué)習(xí)階段,我們捕捉到了深層次因素即圖(a),在圖(b)的校準(zhǔn)階段,我們將所有小于□5%的回報(bào)替換為5%,這旨在創(chuàng)建一個(gè)在大幅度下降時(shí)具有反相關(guān)性的指標(biāo)跟蹤器,而修改后的目標(biāo)視為圖3(b)中的紅色曲線。在(c)(d)中,我們看到了學(xué)習(xí)的深層投資組合在優(yōu)化過程中如何實(shí)現(xiàn)卓越績(jī)效。驗(yàn)證表明,對(duì)于當(dāng)前模型,應(yīng)采用至少40種庫存的深度投資組合進(jìn)行可靠預(yù)測(cè)。
本文中所提出方法建立在傳統(tǒng)的Markowitz基礎(chǔ)上,即投資選擇問題。然而,不同于傳統(tǒng)方法,我們的理論基于對(duì)市場(chǎng)信息的變分編碼,從而校準(zhǔn)數(shù)據(jù)以形成一個(gè)針對(duì)其后獲取最優(yōu)投資組合的有效數(shù)據(jù)。深度變分貝葉斯投資組合理論將深度學(xué)習(xí)引入以學(xué)習(xí)數(shù)據(jù)從而在自動(dòng)編碼步驟中發(fā)現(xiàn)深層功能,同時(shí)對(duì)數(shù)據(jù)進(jìn)行校準(zhǔn)。在之后,我們同步優(yōu)化二者進(jìn)行權(quán)衡,從而展示如何查找投資組合來實(shí)現(xiàn)預(yù)先指定的目標(biāo)。這兩個(gè)程序都涉及優(yōu)化,需要選擇正規(guī)化量的問題。為此,我們使用了一個(gè)樣本驗(yàn)證步驟。具體而言,我們避免使用可能受模型風(fēng)險(xiǎn)影響的統(tǒng)計(jì)模型,并且,我們直接將目標(biāo)建模到正規(guī)化中以直接優(yōu)化,而不是事前的有效邊界。實(shí)驗(yàn)表明,我們所提出的理論在實(shí)際應(yīng)用中有很好的性能,且以直觀的網(wǎng)絡(luò)設(shè)計(jì)規(guī)避了可能受模型風(fēng)險(xiǎn)影響的統(tǒng)計(jì)模型。