田凱 劉永睿
摘要:創(chuàng)業(yè)板成立以來,以其較高的成長性,吸引了廣大投資者,然而帶來的是風(fēng)險(xiǎn)逐漸增加,例如欣泰電氣成為創(chuàng)業(yè)板第一退市股,給投資者敲響了警鐘。面對風(fēng)險(xiǎn)逐漸增大,投資者對于量化投資的選擇尤為重要。針對創(chuàng)業(yè)板,為此,采用logistic模型量化選股,所提出的選股模型不僅能夠有效的提高股票組合的超額收益率,也能良好地規(guī)避投資者的風(fēng)險(xiǎn)。
關(guān)鍵詞:logistic模型;量化選股;回測分析;創(chuàng)業(yè)板
中圖分類號:F83
文獻(xiàn)標(biāo)識碼:A
doi:10.19311/j.cnki.16723198.2017.01.044
1引言
欣泰電氣于2016年9月6日宣布暫停上市,成為了創(chuàng)業(yè)板第一退市股,把創(chuàng)業(yè)板推到了風(fēng)口浪尖上。創(chuàng)業(yè)板又稱為第二股票交易市場,是專為暫時不滿足在主板上市條件的中小企業(yè)、創(chuàng)業(yè)型和高科技型企業(yè)等提供融資途徑的證券交易市場,是對主板的補(bǔ)充。創(chuàng)業(yè)板的特點(diǎn)是相對于主板來說,要求門檻不高,為了給予具有潛力的中小企業(yè)融資的機(jī)會。因?yàn)殚T檻低的特點(diǎn),在2015年逯東等研究導(dǎo)致頻頻出現(xiàn)公司在創(chuàng)業(yè)板上市之后業(yè)績變臉的原因。在2012年張顯峰提出了創(chuàng)業(yè)板面臨的一些問題以及相關(guān)解決方法,例如上市公司的創(chuàng)業(yè)概念不是很足和資金不明等,相應(yīng)的解決辦法有,上市企業(yè)規(guī)范篩選和完善信息披露制度。然而對于投資者來說,這些都是潛在的風(fēng)險(xiǎn)。雖然創(chuàng)業(yè)板存在潛在的風(fēng)險(xiǎn),但由于其具有較強(qiáng)的成長性,得到了廣大投資者的熱捧。創(chuàng)業(yè)板于2009年10月正式上市以來,到目前為止,已經(jīng)有534家公司在創(chuàng)業(yè)板上市,約占全部A股的18.3%。
在國內(nèi),相比創(chuàng)業(yè)板的熱度,量化投資同樣也越來越被接受。量化投資在國外已經(jīng)發(fā)展了40年,已經(jīng)是很成熟的階段,表現(xiàn)最突出的,莫過于被譽(yù)為“量化投資之王”的詹姆斯·西蒙斯(James Simons),其成立的有史以來最成功的對沖基金——大獎?wù)禄穑找媛矢哌_(dá)34%,遠(yuǎn)遠(yuǎn)超過“股神”沃倫·巴菲特(Warren Buffett)等。但相對于A股,量化投資處于起步的階段,采用量化投資技術(shù)的投資者,相比于投資者這個整體來說,還是一個非常小的集體,對量化投資者來說是個非常好的機(jī)會。于是2011年王冰和李想分別從量化投資的含義、量化投資的特點(diǎn)、量化投資的局限性和量化投資在中國這四個方面總結(jié)了量化投資的基本輪廓,以及在中國的發(fā)展。量化投資是一個非常完整的體系,包括量化選股、風(fēng)險(xiǎn)控制和量化擇時等。
量化選股是量化投資的一個非常重要的部分。近代國內(nèi)外研究學(xué)者提出的量化選股策略不勝枚舉,如支持向量機(jī)、人工智能、數(shù)據(jù)挖掘等。目前在國際上比較主流的量化選股模型是多因子選股模型,即在相信歷史會重現(xiàn)的基礎(chǔ)上,通過尋找這些有用的因子,來尋找投資的機(jī)會,這些因子包括公司的財(cái)務(wù)數(shù)據(jù)和技術(shù)指標(biāo),如市盈率、市凈率、股息、總市值、MACD、KDJ和動量反轉(zhuǎn)指標(biāo)等。2005年林松立和唐旭通過“追漲殺跌”的策略,來實(shí)證分析中國股市動量策略和反動量策略的投資績效分析,發(fā)現(xiàn)在中國股市中長期反動量策略表現(xiàn)出色。2010年戴軍基于滬深300指數(shù)為基準(zhǔn),通過logistic模型在滬深300成分股中選股,來實(shí)證分析所選取股票的預(yù)期收益。2013年孫守坤基于滬深300標(biāo)的股票作為股票池,并通過Alpha投資策略、多因子和行業(yè)輪動模型進(jìn)行選股分析,提供了獲得穩(wěn)定的Alpha收益的方法。
Logistic模型是廣義線性模型的一個特例。在1919年,著名的統(tǒng)計(jì)學(xué)家Fisher就首先對廣義線性模型進(jìn)行了研究,提出了Logistic模型,近百年的發(fā)展,模型更加豐富。1986年McCullagh和Nelder在其專著中進(jìn)行了詳細(xì)的介紹了廣義線性模型,從而在這領(lǐng)域的研究工作工作逐漸豐富起來。2015年廖福挺(Tim Futing Liao)通過研究解釋概率模型,整理了關(guān)于二分類Logistic模型、次序Logistic模型和多分類Logistic模型等之間的關(guān)系以及各自的特點(diǎn)。Logistic模型應(yīng)用也十分廣泛,包括醫(yī)學(xué)、信用評價和金融等方面。2014年阮承蘭通過Logistic模型研究了對肝衰竭預(yù)后的因素分類,分類出保護(hù)因素和危險(xiǎn)因素,對肝衰竭預(yù)后的判斷具有參考價值。2004年于立勇采用Logistic模型分析來預(yù)測違約概率,通過實(shí)證分析,該模型為理想的預(yù)測工具。
由于目前選股模型,都是選取能夠跑贏基準(zhǔn)的股票概率,以及獲取的超額收益,而Logistic模型是處理這些定量問題非常好的方法。本文將通過Logistic模型在創(chuàng)業(yè)板指數(shù)成分股中選擇符合條件股票,并以創(chuàng)業(yè)板指數(shù)為基準(zhǔn),結(jié)合數(shù)據(jù)的回測,來實(shí)證分析模型預(yù)期超額收益。
2模型分析
2.1模型的建立
在多元回歸模型中因變量為一個離散的變量,使用Y=0或者Y=1表示的二分變量,這時就不能用一般的線性回歸模型了,可以采用Logistic模型。
一般的廣義線性模型公式為
g(E(Y))=η=∑Kk=1βkxk+β0(1)
其中E(Y)為響應(yīng)變量Y的期望,g是單調(diào)函數(shù),稱為關(guān)系函數(shù)(link),βk為自變量xk的系數(shù),β0為常數(shù)項(xiàng)。
由于隨機(jī)成分服從二點(diǎn)分布,即y=0或者y=1的二分變量,此時y=1的條件概率為
E(y)=μ=P(y=1x1,x2,x3…xK)(2)
Logistic回歸模型的關(guān)系函數(shù)為:
η=log[μ/(1-μ)](3)
將式(2)和式(3)代入到式(1)中,可以求得y=1和y=0的條件概率分別為:
假設(shè)y=1為事情發(fā)生,通過上式可以算出事件發(fā)生概率。
μ=P(y=1x1,x2,x3…xK)=e∑Kk=1βkxk+β01+e∑Kk=1βkxk+β0
P(y=0x1,x2,x3…xK)=11+e∑Kk=1βkxk+β0
2.2變量確定
本文基于創(chuàng)業(yè)板指數(shù)成分股選擇適合的股票。由于創(chuàng)業(yè)板成分股在變化,我們選取2016年最新的成份股作為選股對象,以創(chuàng)業(yè)板指數(shù)為基準(zhǔn),研究個股的收益超過指數(shù)收益的概率,并篩選出概率排名前五的10只股票組合。最后采用日級別數(shù)據(jù)進(jìn)行回測分析。
我們令個股的收益與指數(shù)收益的大小作為響應(yīng)變量。設(shè)個股每日的收益為Rit(其中i為第i只個股,t為時間),令Rt為指數(shù)的收益率。如果個股當(dāng)日收益率大于指數(shù)收益率,即:Rit>Rt,此時令y=1。反之,如果個股收益小于指數(shù)收益率時,令y=0。此時就構(gòu)造出響應(yīng)變量y=0或者y=1的二分問題,這時我們就可以用到Logistic回歸模型進(jìn)行分類選股。
對于自變量的選擇,影響選股模型的因子眾多,在此本文從影響個股上選取3個典型的因子,分別是:日內(nèi)均價,換手率(動態(tài)),市盈率。日內(nèi)均價和換手率為技術(shù)面因子,市盈率為基本面因子,這三個因子在模型的回歸分析中都是顯著的。
從圖2和表3結(jié)果可以得到如下結(jié)論:由于回測開始時間2015年7月,此時牛市剛過去,市場不活躍,所以基準(zhǔn)年化收益率為-20.7%,但是模型選取的股票組合年化收益為16.0%,超額的年化收益率為36.7%,相比之下,效果明顯。β是由資本資產(chǎn)定價模型(CAPM模型)推導(dǎo)出,表示特定資產(chǎn)(或資產(chǎn)組合)的系統(tǒng)風(fēng)險(xiǎn)度量。此時β為0.97,非常接近1,說明該股票組合的波動接近基準(zhǔn)的波動,這點(diǎn)是因?yàn)檫x股模型本身是基于創(chuàng)業(yè)板成分股所選擇的,符合常理。α是超額收益和期望收益的差值,也表示超越比較基準(zhǔn)的能力。此時α為36.0%,說明該股票組合有較強(qiáng)的超額收益的能力。由上面的實(shí)證分析表明,對于創(chuàng)業(yè)板的選股,Logistic模型是有效的。
4總結(jié)
本文以創(chuàng)業(yè)板指數(shù)為基準(zhǔn),以其成分股為對象,對于采用logistics模型進(jìn)行定量選股,篩選出最優(yōu)股票組合,再利用等權(quán)買入回測分析,得到了股票組合跑贏基準(zhǔn)超額年化收益為36.7%,實(shí)證分析表明Logistic模型對創(chuàng)業(yè)板的選股是有一定效果。模型分析相比文獻(xiàn),本文具有補(bǔ)充性和實(shí)用性,由滬深300成分股基本是屬于大盤股,而創(chuàng)業(yè)板指數(shù)成分股,屬于成長性,中小盤股居多,更具有投資價值。
本文也存在一些不足,由于影響股市的因子眾多,本文只研究了三個因子,因子選擇不夠全面,不能表現(xiàn)出全部的實(shí)際情況,對選股模型的結(jié)果,有一定影響。對于選股模型來說,回測時間也會影響模型選股的效果。這些問題在以后的研究工作中加以適當(dāng)改進(jìn)。
參考文獻(xiàn)
[1]逯東,萬麗梅,楊丹.創(chuàng)業(yè)板公司上市后為何業(yè)績變臉?[J].經(jīng)濟(jì)研究,2015,(2):132144.
[2]張顯峰.基于成長性和創(chuàng)新能力的中國創(chuàng)業(yè)板上市公司價值評估研究[D].長春:吉林大學(xué),2012.
[3]王冰,李想.淺議量化投資在國內(nèi)市場的發(fā)展[J].經(jīng)濟(jì)視角:下,2011,(3):4647.
[4]林松立,唐旭.中國股市動量策略和反向策略投資績效之實(shí)證研究[J].財(cái)經(jīng)科學(xué),2005,2005(1):8187.
[5]戴軍.Logistic選股模型及其在滬深300中的實(shí)證.國信證券證券研究報(bào)告[R].201097.
[6]孫守坤.基于滬深300的量化選股模型實(shí)證分析——多因子模型與行業(yè)輪動模型的綜合運(yùn)用[D].上海:復(fù)旦大學(xué),2013.
[7]McCullaghP,Nelder J A.Generalized linear models[M].2ed.London:Chapman and Hall,1989.
[8][美]廖福挺.解釋概率模型[M].上海:格致(原漢大)出版社,2015.
[9]阮承蘭,張駿飛,宋海燕等.肝衰竭預(yù)后影響因素的Logistic回歸分析[J].中華疾病控制雜志,2014,18(6):537540.
[10]于立勇,詹捷輝.基于Logistic回歸分析的違約概率預(yù)測研究[J].財(cái)經(jīng)研究,2004,30(9):1523.