張曉芳,錢 蕊
(蚌埠學(xué)院 經(jīng)濟(jì)與管理學(xué)院,安徽 蚌埠 233000)
在以往的證券投資分析中,投資者經(jīng)常使用基本面分析和技術(shù)分析方法去分析股票的價(jià)格走勢.基本面分析主要從宏觀經(jīng)濟(jì)、行業(yè)和板塊以及公司財(cái)務(wù)的角度去幫助投資者對股票的投資價(jià)值進(jìn)行判斷,這種方法主要適合對股票進(jìn)行價(jià)值投資的中長期投資者,但對短線投資者的指導(dǎo)作用較弱.技術(shù)分析法以圖表、形態(tài)為基礎(chǔ),用邏數(shù)學(xué)方法分析股票市場過去和現(xiàn)在的行為,從而達(dá)到預(yù)測股價(jià)走勢的目的,其多用于短期預(yù)測.但股票市場中的機(jī)構(gòu)復(fù)雜,參與者較多,股票的價(jià)格走勢因此也受到很多因素的影響,基本分析法和技術(shù)分析法以及傳統(tǒng)的線性分析模型都很難將這眾多的影響因素考慮在內(nèi)對股票價(jià)格做出精準(zhǔn)的預(yù)測.
支持向量機(jī)(SVM)作為一種新興的統(tǒng)計(jì)模型,能夠高效率地處理回歸和分類的問題,而與一些機(jī)器學(xué)習(xí)方法不同的是,支持向量機(jī)通過“增維”的方式來處理分類和回歸問題,即通過使用合適的核函數(shù)向高維空間進(jìn)行映射來避免陷入“維數(shù)災(zāi)難”的困境.特拉法利斯(Trafalis)和因斯(Ince)用支持向量機(jī)模型對股票價(jià)格進(jìn)行預(yù)測,并與其他模型進(jìn)行比較,結(jié)果表明支持向量機(jī)對股價(jià)的預(yù)測效果較好[1].金(Kim)基于支持向量機(jī)模型對股價(jià)指數(shù)的變動(dòng)趨勢進(jìn)行預(yù)測,并和其他的模型進(jìn)行對比之后發(fā)現(xiàn)支持向量機(jī)在對股價(jià)指數(shù)的預(yù)測精度和性能方面具有顯著的優(yōu)勢[2].黃(Huang)等人采用支持向量機(jī)預(yù)測日經(jīng) 225 指數(shù)周線,并分別與其他分類模型進(jìn)行對比,結(jié)果表明支持向量機(jī)在預(yù)測股價(jià)指數(shù)走勢上比其他方法具有更高的準(zhǔn)確性[3].
國內(nèi)運(yùn)用機(jī)器學(xué)習(xí)方法研究股價(jià)變動(dòng)趨勢比國外晚,早期主要將支持向量機(jī)用于選股方面的研究,后期逐漸用于股票價(jià)格指數(shù)預(yù)測方面的研究.汪東運(yùn)用支持向量機(jī)回歸算法和分類算法對上證綜合指數(shù)的回歸問題和滬深A(yù)股市場選擇投資組合的問題進(jìn)行研究[4].萬岑通過選擇上證綜指交易日的最高價(jià)、最低價(jià)、收盤價(jià)、成交量和成交金額等6個(gè)指標(biāo)用支持向量機(jī)模型來回歸預(yù)測股市短期內(nèi)的開盤價(jià)[5].左飛運(yùn)用非線性支持向量機(jī)對上證50指數(shù)19個(gè)技術(shù)指標(biāo)進(jìn)行建模,驗(yàn)證了支持向量機(jī)模型對上證50指數(shù)的分類具有較高的準(zhǔn)確性[6].李崢嶸選取股票的價(jià)格、成交量、技術(shù)指標(biāo)等信息對上證指數(shù)的收盤價(jià)進(jìn)行預(yù)測,驗(yàn)證了支持向量機(jī)模型在對股價(jià)的預(yù)測上具有較高的準(zhǔn)確率[7].綜上所述,國內(nèi)關(guān)于應(yīng)用支持向量機(jī)預(yù)測股價(jià)方面的研究所選用的指標(biāo)大多是股票市場的交易變量和技術(shù)指標(biāo),而未將影響股票價(jià)格變化的宏觀經(jīng)濟(jì)指標(biāo)、行業(yè)和板塊因素以及公司財(cái)務(wù)狀況考慮在內(nèi),在一定程度上可能會(huì)降低模型預(yù)測的準(zhǔn)確性.
樣本選取上證180指數(shù)中的成分股股票數(shù)據(jù)作為研究對象,上證180指數(shù)的成分股來自不同行業(yè)具有代表性的樣本股票,樣本數(shù)據(jù)量充足,有效避免了樣本的局限性和實(shí)驗(yàn)結(jié)果的偶然性.上證180指數(shù)成分股分布的行業(yè)較多,有利于行業(yè)和板塊因素對股價(jià)預(yù)測的研究.由于上市公司的財(cái)務(wù)報(bào)表數(shù)據(jù)最短以季度進(jìn)行披露,為保證實(shí)驗(yàn)數(shù)據(jù)的可得性、時(shí)效性與各指標(biāo)數(shù)據(jù)的統(tǒng)一性,筆者選取2021年第二季度的行業(yè)、公司財(cái)務(wù)狀況和股票交易市場的相關(guān)指標(biāo)信息和數(shù)據(jù),樣本數(shù)據(jù)主要來源于上市公司官網(wǎng)、同花順軟件和大智慧軟件.
通過對影響股價(jià)的因素進(jìn)行分析,大多數(shù)的宏觀經(jīng)濟(jì)指標(biāo)短期內(nèi)對股價(jià)的影響不明顯,在總結(jié)以往研究文獻(xiàn)的基礎(chǔ)上,本文主要從股票基本面當(dāng)中的行業(yè)和公司財(cái)務(wù)狀況方面以及股票交易市場信息來選取股票價(jià)格預(yù)測的相關(guān)指標(biāo).從上市公司行業(yè)方面選取了行業(yè)市場結(jié)構(gòu)、行業(yè)經(jīng)濟(jì)周期、行業(yè)生命周期等行業(yè)特征指標(biāo).從反映上市公司財(cái)務(wù)狀況的償債能力方面選取了流動(dòng)比率和速動(dòng)比率;從營運(yùn)能力方面選取了存貨周轉(zhuǎn)率和應(yīng)收賬款周轉(zhuǎn)率;公司獲利能力方面選取了凈資產(chǎn)收益率和每股凈收益等財(cái)務(wù)比率指標(biāo).從股票交易市場的趨勢型指標(biāo)中選取180家上市公司股票的指數(shù)平滑異同移動(dòng)平均線(MACD)、離差值(DIF)、DIF的n期平滑移動(dòng)平均線(DEA);從超買超賣指標(biāo)中選取6日和10日的威廉指標(biāo)(WMS)、隨機(jī)指標(biāo)中的K值、D值和J值;從人氣型指標(biāo)中選取心理線指標(biāo)(PSY),為保證各指標(biāo)時(shí)間上的統(tǒng)一,以上指標(biāo)均選取季度指標(biāo)值.所構(gòu)建的股票價(jià)格影響因素的指標(biāo)體系如圖1-1所示.
圖1-1 股票價(jià)格預(yù)測指標(biāo)體系
支持向量機(jī)的基本思想是把輸入到空間的樣本通過一種非線性的變換映射到高維特征空間,使得最優(yōu)分類面在高維特征空間中成為線性可分的,并在特征空間中找到能夠把樣本線性分開的最優(yōu)分類面.如圖2-1所示,圖中的樣本集(xi,yi)i=1,2,…,n表示進(jìn)行股價(jià)預(yù)測的n只上市公司的股票,xi∈Rd表示影響每只股票價(jià)格的d維基本面和技術(shù)面指標(biāo)因素.yi∈{-1,1}表示第i只股票價(jià)格對應(yīng)的“漲”和“跌”類別標(biāo)簽.假設(shè)存在超平面x·w+b=0能將n只股票按照股價(jià)漲跌分成兩類:類別1和類別-1.類別1表示該季度股價(jià)上漲的股票,類別-1表示該季度股價(jià)下跌的股票.其中w是權(quán)重向量,表示給影響股價(jià)漲跌不同的屬性特征所賦予的權(quán)重,b是模型的參數(shù).
圖2-1 線性可分情況下的最優(yōu)分類線
所有“該季度股價(jià)上漲的股票”的樣本數(shù)據(jù)均滿足w·x+b≥1,所有“該季度股價(jià)下跌的股票”的樣本數(shù)據(jù)均滿足w·x+b≤-1.通過合并上述兩個(gè)不等式可以得到:
yi(w·xi+b)-1≥0(i=1,2,…,n)
(2.1)
分類目標(biāo)是使兩個(gè)平行的側(cè)面H1:w·x+b≥1與H2:w·x+b≤-1的距離2/∥w∥最大,這等價(jià)于使∥w∥2/2最小.通過SVM將找到在以下兩個(gè)約束條件下的優(yōu)化問題的解(w,b):
(2.2)
s.t.yi(w·xi+b)≥1,i=1,2,…,N
(2.3)
利用拉格朗日的優(yōu)化方法可以將上面的優(yōu)化問題轉(zhuǎn)化成它的對偶問題,在高維特征空間中的最終目標(biāo)是對λi求解下列函數(shù)的最大值,即:
(2.4)
(2.5)
其中,λi為每個(gè)約束條件對應(yīng)的拉格朗日乘子.求解后能夠得到的最優(yōu)的分類函數(shù)為:
(2.6)
2.2.1 數(shù)據(jù)預(yù)處理
在影響股票價(jià)格的因素中,行業(yè)因素中的行業(yè)市場結(jié)構(gòu)、行業(yè)經(jīng)濟(jì)周期、行業(yè)生命周期所對應(yīng)的指標(biāo)屬性為有限的文本集,而公司財(cái)務(wù)因素和市場因素所對應(yīng)的指標(biāo)數(shù)據(jù)相互之間差別較大,為了使指標(biāo)數(shù)據(jù)處于同一個(gè)數(shù)據(jù)量綱且易于編碼,采用如下的公式對財(cái)務(wù)指標(biāo)數(shù)據(jù)和市場指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理, 即:
(2.7)
其中x為樣本股票的財(cái)務(wù)指標(biāo)或市場指標(biāo)所對應(yīng)的屬性值,xmin和xmax為該屬性值中所對應(yīng)的最小值和最大值,x′為該指標(biāo)數(shù)據(jù)經(jīng)過歸一化后的屬性值.經(jīng)過歸一化處理后,樣本股票的所有財(cái)務(wù)指標(biāo)和市場指標(biāo)對應(yīng)的屬性值都將轉(zhuǎn)換到0—1的范圍內(nèi),不僅使得財(cái)務(wù)指標(biāo)和市場指標(biāo)的不同屬性值處于同一個(gè)量綱中,而且也有利于建模過程中的指標(biāo)編碼.
2.2.2 算法設(shè)計(jì)
首先將影響股價(jià)漲跌的18個(gè)指標(biāo)變量分別定義為X1、X2、…、X18,再將樣本的指標(biāo)數(shù)據(jù)根據(jù)對股價(jià)的影響依次進(jìn)行分類編碼,輸出變量依據(jù)股價(jià)的“漲”和“跌”分別編為“1”和“-1”.
運(yùn)用Clementine 12.0軟件選擇支持向量機(jī)模型進(jìn)行建模,隨機(jī)抽取上證180指數(shù)成分股中的90家上市公司的股票作為訓(xùn)練樣本,剩余90家上市公司的股票作為預(yù)測樣本.依次選擇支持向量機(jī)模型中的線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)、核Sigmoid核函數(shù)對數(shù)據(jù)進(jìn)行擬合,對股票價(jià)格的“漲”和“跌”進(jìn)行分類預(yù)測,具體步驟如下:
步驟1:將180家上市公司股票樣本數(shù)據(jù)組成的Excel文件導(dǎo)入軟件構(gòu)建源節(jié)點(diǎn),選擇一個(gè)Table節(jié)點(diǎn)附在源節(jié)點(diǎn)之后,類型節(jié)點(diǎn)附加到源節(jié)點(diǎn)之后,將類型節(jié)點(diǎn)中的字段值類型改為“集”,類別標(biāo)簽中的字段值類型改為“flag”,方向全部設(shè)為“output”,剩余字段的方向設(shè)為“input”.
步驟2:將180家上市公司股票樣本隨機(jī)抽取90個(gè)作為訓(xùn)練樣本,其余90個(gè)作為測試樣本,并通過抽樣節(jié)點(diǎn)設(shè)置好訓(xùn)練樣本和測試樣本.
步驟3:在支持向量機(jī)模型節(jié)點(diǎn)中選擇不同的核函數(shù)執(zhí)行操作,得到支持向量機(jī)模型分別對90個(gè)訓(xùn)練樣本分類結(jié)果和90個(gè)測試樣本預(yù)測結(jié)果的輸出模型,選擇分類準(zhǔn)確率最高的輸出模型class-line和SVM,將輸出模型分別附加到樣本節(jié)點(diǎn),并將一個(gè)Table節(jié)點(diǎn)和Analysis節(jié)點(diǎn)分別附加到兩個(gè)輸出模型后面,得到了整個(gè)支持向量機(jī)模型設(shè)計(jì)階段的數(shù)據(jù)流圖,如2-2所示.
圖2-2 SVM模型實(shí)施階段數(shù)據(jù)流
步驟4:執(zhí)行數(shù)據(jù)流圖中的Table節(jié)點(diǎn),得到支持向量機(jī)中線性核函數(shù)對每個(gè)股票樣本的分類結(jié)果;執(zhí)行Analysis節(jié)點(diǎn),得到支持向量機(jī)模型對于測試樣本和訓(xùn)練樣本數(shù)據(jù)的分類準(zhǔn)確率,如表2-1和表2-2所示.
表2-1 訓(xùn)練樣本準(zhǔn)確性
表2-2 測試樣本準(zhǔn)確性
從表2-1和表2-2中可以看出,運(yùn)用支持向量機(jī)中的線性核函數(shù)執(zhí)行操作,得到支持向量機(jī)中線性核函數(shù)對隨機(jī)抽取的90個(gè)訓(xùn)練樣本的分類準(zhǔn)確率為84.44%,而通過訓(xùn)練之后的模型對90個(gè)測試樣本的分類準(zhǔn)確率則達(dá)到了94.44%.
對數(shù)據(jù)流中的輸出模型選擇“瀏覽”選項(xiàng),得到各變量對股價(jià)預(yù)測的影響的權(quán)重圖,如圖2-3所示.
通過對圖2-3中支持向量機(jī)模型對樣本進(jìn)行訓(xùn)練時(shí)所得出的各指標(biāo)的相對重要性數(shù)據(jù)進(jìn)行統(tǒng)計(jì)得到的結(jié)果,如表2-3所示.
圖2-3 訓(xùn)練樣本在訓(xùn)練時(shí)各指標(biāo)的相對重要性
由表2-3中的數(shù)據(jù)可以看出,在短期內(nèi),技術(shù)指標(biāo)因素對股價(jià)漲跌的影響程度較大,如6日的WMS對股價(jià)漲跌的影響程度為0.417,其次是10日的WMS影響程度為0.117.DIF、DEA、MACD三個(gè)技術(shù)指標(biāo)對股價(jià)的影響程度相同,都為0.035.J和K指標(biāo)在本次實(shí)驗(yàn)中對股價(jià)的漲跌沒有明顯的影響.在市場特征方面,行業(yè)生命周期和行業(yè)經(jīng)濟(jì)周期在本次實(shí)驗(yàn)中對股價(jià)漲跌的影響程度分別為0.042和0.013,行業(yè)市場結(jié)構(gòu)對股價(jià)漲跌沒有明顯的影響.在公司的財(cái)務(wù)方面,流動(dòng)比率、凈資產(chǎn)收益率和速動(dòng)比率對股價(jià)漲跌的影響程度較大,分別為0.044、0.036和0.036,每股凈收益、應(yīng)收賬款周轉(zhuǎn)率和存貨周轉(zhuǎn)率則對股價(jià)的影響較小,分別為0.033、0.032和0.027.
表2-3 各指標(biāo)的相對重要性
根據(jù)以上得出的實(shí)驗(yàn)結(jié)果給出相應(yīng)的建議如下:
(1)投資者在進(jìn)行短期投資時(shí)可以參考技術(shù)指標(biāo)中的6日威廉指標(biāo)(WMS)和10日威廉指標(biāo)(WMS),在運(yùn)用威廉指標(biāo)時(shí),可以從威廉指標(biāo)的數(shù)值信號、背離信號和形態(tài)信號出發(fā)去進(jìn)行判斷,同時(shí)也可以將DIF、DEA、MACD等指標(biāo)所發(fā)出的買賣信號結(jié)合起來去對股價(jià)進(jìn)行短期預(yù)測.在運(yùn)用技術(shù)指標(biāo)進(jìn)行決策的同時(shí),也不可將技術(shù)指標(biāo)發(fā)出的信號當(dāng)成唯一的判斷準(zhǔn)則,還需要結(jié)合基本面和股票市場的交易信息去進(jìn)行判斷.
(2)投資者在對公司的股價(jià)進(jìn)行預(yù)測時(shí),可以通過該上市公司的財(cái)務(wù)報(bào)表從該公司的償債能力、經(jīng)營能力、盈利能力和成長能力方面分析該上市公司的股票價(jià)值,在對上市公司財(cái)務(wù)狀況進(jìn)行分析的同時(shí),可以著重關(guān)注該上市公司的償還債務(wù)的能力和賺取利潤方面的能力.這兩個(gè)方面的能力對公司未來的現(xiàn)金流有重要的影響,因而會(huì)較大程度地影響該公司未來股票的價(jià)值.
(3)在對投資行業(yè)進(jìn)行選擇時(shí),盡量選擇在行業(yè)生命周期中處于成長期和成熟期的行業(yè).增長型行業(yè)的特點(diǎn)是行業(yè)收入的增長速度快于整個(gè)國民經(jīng)濟(jì)的增長率,此時(shí)投資者對該行業(yè)進(jìn)行投資能夠享受到經(jīng)濟(jì)快速增長所帶來的行業(yè)利潤.生命周期中處于成長期和成熟期的行業(yè)在經(jīng)營過程中有較穩(wěn)定的收入和利潤,在給投資者帶來穩(wěn)定的收益的同時(shí)還可以使投資者承擔(dān)較小的投資風(fēng)險(xiǎn).
洛陽師范學(xué)院學(xué)報(bào)2022年5期