傅欣羽
近年來,越來越多的投資者涌入基金市場,基金的收益率及投資策略是投資者關(guān)注的重點。在當(dāng)前震蕩的市場環(huán)境下,投資意愿降低是很正常的現(xiàn)象,收益率作為投資者最關(guān)注的指標(biāo)之一,其與基金業(yè)績評價指標(biāo)之間的內(nèi)在推理關(guān)系較少被深入研究,因此立足于研究基金業(yè)績評價重要指標(biāo)與基金收益率之間的可解釋性挖掘,研究出業(yè)績評價指標(biāo)到收益結(jié)果之間的指向關(guān)系。為挖掘基金各項指標(biāo)與收益率之間的內(nèi)在聯(lián)系,使用機器學(xué)習(xí)方法對基金收益率的結(jié)果(收益、虧損)與業(yè)績評價指標(biāo)間結(jié)構(gòu)關(guān)系進行研究,結(jié)果表明回撤控制更好的基金更容易獲得正向收益。
20世紀60年代以來,學(xué)者們先后提出一系列基金業(yè)績評價指標(biāo)和方法。從最早傳統(tǒng)的評價指標(biāo)圍繞基金產(chǎn)品進行,到后期考慮基金經(jīng)理的個人特質(zhì)、職業(yè)特質(zhì)和能力特質(zhì)等影響基金業(yè)績而研究出選股擇時能力指標(biāo)。還有學(xué)者基于開放式基金十年的面板數(shù)據(jù)量化五個維度基金經(jīng)理能力指標(biāo),進一步發(fā)現(xiàn)基金經(jīng)理的能力在不同市場環(huán)境下對基金業(yè)績的影響存在差異,且該影響隨著金融市場周期的波動存在一定的周期性。根據(jù)已有的研究同時考慮數(shù)據(jù)的可得性,在基金業(yè)績評價指標(biāo)中僅涉及基金收益評價指標(biāo)、基金經(jīng)理人維度指標(biāo)。
基金財務(wù)指標(biāo)有:晨星評級、夏普比率、卡瑪比率及波動率。經(jīng)理人維度指標(biāo)有:基金經(jīng)理學(xué)歷、從業(yè)時間、年均回報收益率、投資風(fēng)格及重倉板塊。
本文從天天基金網(wǎng)等基金信息平臺收集主動型基金收益率及相關(guān)評價指標(biāo)。
晨星評級離散化為1—5個級別。近一年的夏普比率被離散化為1、2兩個值,1為負值2為正值。將三年期及五年期的夏普比率與卡瑪比率,低于均值離散化為1,高于均值離散化為2。
風(fēng)險水平指標(biāo)中,分別以一年期和三年期波動率的均值為界限,波動率低于均值離散化為1,高于均值離散化為2。
基金經(jīng)理人維度中,基金經(jīng)理人個人特質(zhì)一級指標(biāo)下將本科畢業(yè)于國內(nèi)985及211院校或國外top200院校的經(jīng)理人離散化為1,其余為2。從業(yè)時間上,171位經(jīng)理人從業(yè)時間平均值為7年,從業(yè)大于7年離散化為2,從業(yè)時間在7年以下的離散化為1。個人業(yè)績?nèi)∷薪?jīng)理人的年均回報為基準,小于均值的離散化為1,大于均值的離散化為2。投資風(fēng)格以1代表價值型投資,2代表平衡型。在重倉板塊中,將研究基金分為五個板塊進行離散:1為制造業(yè)、2為科技產(chǎn)業(yè)、3為消費行業(yè)、4為金融、5為醫(yī)藥。
在衡量業(yè)績時,離散化2021年的收益率,以最終的收益結(jié)果區(qū)分,將2021年終負收益為1,正收益為2。
粗糙集理論作為一種處理不精確、不一致、不完整等各種不完備信息有效的工具,一方面得益于它的數(shù)學(xué)基礎(chǔ)成熟,不需要先驗知識;另一方面在于它的易用性。粗糙集理論創(chuàng)建的目的和研究的出發(fā)點就是直接對數(shù)據(jù)進行分析和推理,從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律。
建立條件屬性集,包含指標(biāo)如下:2021年12月末晨星評級,近1年夏普比率、近3年夏普比率、近5年夏普比率,卡瑪比率近3年、卡瑪比率近5年,波動率近1年、波動率近3年,本科畢業(yè)院校、從業(yè)時間、從業(yè)年均回報、投資風(fēng)格、重倉板塊。
以2021年末的基金收益率作為決策屬性。通過離散化處理,由此得出影響因素分析決策表。在決策表的基礎(chǔ)上,對13個條件屬性進行約簡。利用Matlab程序?qū)?3個指標(biāo)進行測算,篩選出對于基金收益影響最大的指標(biāo)。
用貝葉斯網(wǎng)絡(luò)模型訓(xùn)練各評價指標(biāo)及基金相關(guān)信息節(jié)點與基金收益率之間的條件概率關(guān)系,研究基金收益率與基金評價指標(biāo)的內(nèi)在邏輯推理關(guān)系。貝葉斯網(wǎng)絡(luò)是采用圖形化網(wǎng)絡(luò)結(jié)構(gòu)直觀表達變量的聯(lián)合概率分布及其條件獨立性。一個貝葉斯網(wǎng)絡(luò)是一個有向無環(huán)圖。貝葉斯網(wǎng)絡(luò)中每一個節(jié)點表示一個變量,變量間的線段表示因果關(guān)系,考慮實際情況加入評分函數(shù),避免出現(xiàn)最復(fù)雜的完全貝葉斯網(wǎng)絡(luò)導(dǎo)致的過擬合的發(fā)生?;谠u分選擇模型可得出與數(shù)據(jù)擬合且結(jié)構(gòu)合理的推理網(wǎng)絡(luò)。
將依賴度作為決策目標(biāo),條件屬性與決策屬性之間的依賴度越大,則條件屬性越重要,通過設(shè)計適應(yīng)度函數(shù),采用遺傳算法對條件屬性進行篩選。
將經(jīng)過離散化的條件屬性和決策屬性帶入粗糙集算法(Matlab中程序包)中,設(shè)置迭代次數(shù)20次,得到以下結(jié)果:
圖1?屬性約簡算法適應(yīng)度變化過程
經(jīng)過遺傳篩選,適應(yīng)度達到最大時,重要的條件屬性為:晨星評級、近一年夏普比率、近三年卡瑪比率,基金經(jīng)理本科畢業(yè)院校、從業(yè)時間、年均回報率、投資風(fēng)格、重倉板塊這八個條件屬性。
通過屬性約簡篩除了無相關(guān)或者相關(guān)性小的屬性后,最終確定晨星評級、近一年夏普比率、近三年卡瑪比率,基金經(jīng)理本科畢業(yè)院校、從業(yè)時間、年均回報率、投資風(fēng)格、重倉板塊和決策屬性(收益率)為貝葉斯網(wǎng)絡(luò)中的節(jié)點。
把關(guān)鍵指標(biāo)組合帶入貝葉斯網(wǎng)絡(luò)(Matlab中的程序包),通過貝葉斯網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu)的訓(xùn)練,得到以下貝葉斯網(wǎng)絡(luò)結(jié)構(gòu):
圖2?基金評價指標(biāo)模型的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
由近一年的夏普比率的條件概率可以得出,當(dāng)晨星評級處于較高級數(shù)(前30%左右的排名),獲得超額收益的概率為0.7958,遠大于沒有獲得超額收益的概率0.2042。因此在選擇主動型基金時,可以將晨星評級納入?yún)⒖挤秶⒈M量選擇評級結(jié)果在四星級以上的基金。晨星評級相對比較高的狀態(tài),基金組合每承擔(dān)一單位的風(fēng)險獲得超額收益的可能性更大。
從卡瑪比率的條件狀態(tài)可以得出,當(dāng)基金的晨星評級處于較低狀態(tài)時,卡瑪比率處于低水平的概率較大(0.6941),處于較高水平狀態(tài)的概率較?。?.1647)。
從基金收益狀態(tài)條件概率可以看出,卡瑪比率處于較低水平時,基金在年末虧損的概率為0.698,獲得正收益的概率為0.302;而卡瑪比率處于較高水平時,基金在年末虧損的概率為0.14,獲得正收益的概率為0.86。
從基金經(jīng)理年均回報層面來看,回撤控制不佳的基金經(jīng)理人年均回報處于平均偏上水平概率相對較?。?.896),只有極小的可能性基金的卡瑪比率低但是基金經(jīng)理人的年均回報處于平均偏上的狀態(tài)。
在分析最終收益狀態(tài)與重要的評價指標(biāo)之間的邏輯關(guān)系后,將預(yù)測集和訓(xùn)練集中隨機抽取的16只基金數(shù)據(jù)帶入運算,分組計算預(yù)測準確率后取平均值。該網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測準確性較高??梢缘贸鼋Y(jié)論:
在晨星評級處于較高評級的時候,基金的夏普比率較高的可能性更大。晨星評級在一定程度上對于基金的挑選有輔助作用。
在實際投資中,多關(guān)注回撤的控制,基金的綜合性價比高更容易獲得收益。卡瑪比率用最大回撤作為分母更貼合投資者們厭惡下跌的心理。若在其他指標(biāo)近似的情況之下,應(yīng)該優(yōu)先選擇卡瑪比率更高的基金。