摘要:近年來(lái),通過(guò)量化投資方法進(jìn)行科學(xué)選股成為許多證券公司的研究方向。隨著中國(guó)金融改革的不斷加深,如何深入理解量化投資模型逐漸成為了目前研究的重點(diǎn)。其中多因子量化投資模型是目前國(guó)際上的主流趨勢(shì),多因子模型是采用建立數(shù)學(xué)分析模型來(lái)對(duì)股票市場(chǎng)的股價(jià)變化的影響因子進(jìn)行建模和分析。目前,在實(shí)際應(yīng)用中多因子模型已經(jīng)對(duì)證券、基金公司的選股具有輔助性的作用。未來(lái),隨著學(xué)者們?cè)谶@一領(lǐng)域的深入研究,多因子量化選股模型勢(shì)必會(huì)對(duì)證券、基金公司產(chǎn)生深遠(yuǎn)的影響。本文選取的樣本數(shù)據(jù)為2019年第三季度財(cái)報(bào)中具有A股代表性的上證50大藍(lán)籌股票市場(chǎng)上的財(cái)務(wù)指標(biāo)和其他因子指標(biāo)。通過(guò)綜合考慮各股市場(chǎng)表現(xiàn)及因子對(duì)上市公司的代表性選出因子,并利用MATLAB軟件建立股票的基本面指標(biāo)、技術(shù)面指標(biāo)(共包含12項(xiàng)因子)模型,并通過(guò)逐步回歸法改進(jìn)相對(duì)收益率的多元線性回歸模型,并對(duì)所建立模型的多重共線性和異方差性進(jìn)行了適當(dāng)?shù)臋z驗(yàn)。
關(guān)鍵詞:回歸法;多因子選股模型;量化投資;MATLAB
1.多因子選股模型
多因子模型是目前量化選股模型方法中應(yīng)用最廣泛的,基本原理為:多因子模型會(huì)選出特定的某些因子作為投資股票的依據(jù),因子表現(xiàn)良好則買(mǎi)入股票,因子表現(xiàn)較差則賣(mài)出股票。多因子選股模型風(fēng)險(xiǎn)較低,因?yàn)橐蜃拥倪x取既關(guān)注基本面又包括技術(shù)面,所以選出的這一系列因子可以通過(guò)構(gòu)建量化選股模型來(lái)預(yù)測(cè)股票的收益率及走勢(shì)。
比如根據(jù)價(jià)值投資原理,認(rèn)為低PE(市盈率)的股票表現(xiàn)會(huì)更優(yōu)異,因此就同時(shí)買(mǎi)入低PE的股票,這就造成了股票價(jià)格的上漲,使得PE因子變得有效。但以PB(市凈率)為因子時(shí)A股票卻大于B股票的PB即A股票的基本面好于B股票。所以,A股票與B股票孰優(yōu)?這就需要用到多因子選股模型。
2.數(shù)據(jù)的選取與處理
建立多因子選股模型首先要確定候選因子,有效精準(zhǔn)的因子指標(biāo)可以使模型發(fā)現(xiàn)的股票規(guī)律最大化,有效提高模型的參考價(jià)值。本文的選取候選因子的參考標(biāo)準(zhǔn)如下:
(1)候選因子具有很強(qiáng)的代表性,同時(shí)對(duì)上市公司普遍適用;
(2)股票收益隨著因子取值的變化而變化;
(3)因子對(duì)于收益的影響在時(shí)間變化中較為穩(wěn)定;
(4)戰(zhàn)勝比率和盈利比率較高;
(5)單因子選股組合與股票池的收益差明顯大于零。
綜合考慮多方面因素,并結(jié)合以往的市場(chǎng)經(jīng)驗(yàn),本文最后選取了如下7類(lèi)指標(biāo),12個(gè)因子:
(1)成長(zhǎng)因子:總資產(chǎn)增長(zhǎng)率,凈資產(chǎn)增長(zhǎng)率,每股收益增長(zhǎng)率,營(yíng)業(yè)收入增長(zhǎng)率,凈利潤(rùn)增長(zhǎng)率;
(2)盈利因子:凈資產(chǎn)收益率ROE,資產(chǎn)凈利率ROA;
(4)估值因子:市盈率PE,市凈率PB;
(5)運(yùn)營(yíng)能力:總資產(chǎn)周轉(zhuǎn)率;
(6)流動(dòng)因子:換手率;
(7)其他因子:資產(chǎn)負(fù)債率。
選取2019年12月發(fā)布的上證50作為樣本,以2019年第三季度(Q3)財(cái)報(bào),共計(jì)50組數(shù)據(jù)為樣本。其中每組數(shù)據(jù)又包含12項(xiàng)選股因子,共計(jì)600組數(shù)據(jù)。
3.基于多元回歸分析的多因子選股模型構(gòu)建
首先以相對(duì)收益率為變量建立12個(gè)影響因子的多元回歸模型,計(jì)算后的具體模型如表1所示。
模型的可決系數(shù)R2=76.9%,說(shuō)明整體股票質(zhì)量因子相對(duì)收益率的擬合精度并不高,由表1可以看出,在置信度0.05的水平下,因子x2、x4、x5、x6、x7和x11對(duì)于相對(duì)收益率的影響顯著,也進(jìn)一步說(shuō)明再利用上述12因子進(jìn)行回歸法選股時(shí),凈資產(chǎn)增長(zhǎng)率、營(yíng)業(yè)收入增長(zhǎng)率、凈利潤(rùn)增長(zhǎng)率、市盈率PE、市凈率PB、換手率這6項(xiàng)因子賦予較大權(quán)重。
利用MATLAB將50支股票的歷史數(shù)據(jù)代入線性多元回歸模型,進(jìn)行檢驗(yàn)。紅色點(diǎn)是計(jì)算出來(lái)的數(shù)據(jù),藍(lán)色點(diǎn)是上節(jié)定義的相對(duì)收益率標(biāo)準(zhǔn)值(-1、0、1)??梢钥闯?0支股票被明顯的分為三部分,這說(shuō)明MATLAB模型能夠區(qū)分出好壞股票,說(shuō)明模型是成功的。
作者簡(jiǎn)介:谷思(1992.1-),女,漢族,遼寧省鐵嶺人,碩士研究生學(xué)歷,金融專(zhuān)業(yè)。