• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于隱馬爾科夫模型的市場指數(shù)量化擇時研究

    2018-06-12 02:59:02傅中杰吳清強(qiáng)
    關(guān)鍵詞:聚類交易狀態(tài)

    傅中杰,吳清強(qiáng)

    (廈門大學(xué)軟件學(xué)院,福建 廈門 361005)

    精準(zhǔn)預(yù)測金融市場是一件非常困難的任務(wù),但是預(yù)測市場在未來一段時間的趨勢或狀態(tài)依舊是可行的.國內(nèi)外許多文獻(xiàn)已經(jīng)指出,在金融市場尤其是股票市場和債券市場中,存在崩潰、緩慢成長、熊市和恢復(fù)階段[1].De Angelis等[2]提出了檢測市場穩(wěn)定和混亂狀態(tài)的框架模型,并且預(yù)測了兩種狀態(tài)之間的轉(zhuǎn)換.Salhi等[3]使用隱馬爾科夫模型(hidden Markov model,HMM)完成了金融危機(jī)和穩(wěn)定時期的分類任務(wù).與此同時,多種機(jī)器學(xué)習(xí)算法被應(yīng)用于股票市場預(yù)測,如支持向量機(jī)(support vector machine,SVM)[4-6],神經(jīng)網(wǎng)絡(luò)[7],集成學(xué)習(xí)[8],深度學(xué)習(xí)[9]等.Galeshchuk[7]發(fā)現(xiàn)了擁有最佳預(yù)測能力的神經(jīng)網(wǎng)絡(luò),并用于交易所數(shù)據(jù)預(yù)測.Bebarta等[8]應(yīng)用集成學(xué)習(xí)方法,組合人工神經(jīng)網(wǎng)絡(luò)、HMM和遺傳算法構(gòu)建了一個股票預(yù)測系統(tǒng).并且隨著深度學(xué)習(xí)的興起與成熟,越來越多的研究開始利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行股票漲跌預(yù)測[9].然而由于為股票價格序列做標(biāo)注難度較大,難以進(jìn)行有效的監(jiān)督學(xué)習(xí),故HMM等非監(jiān)督方法也被大量研究.Hassan等[10]利用HMM找到與預(yù)測當(dāng)天最相似的歷史數(shù)據(jù),用以預(yù)測下一天的股價,為股票預(yù)測提供了一種新范式.之后,Park等[11]使用連續(xù)HMM預(yù)測下一天收盤價的變化方向.Seethalakshmi等[12]利用HMM識別股價的危機(jī)期和穩(wěn)定期.但這些研究多數(shù)直接使用攜帶噪音更多的日內(nèi)開盤價、最高價、最低價和收盤價作為模型的輸入特征進(jìn)行訓(xùn)練,沒有在特征的選擇上進(jìn)行探究,并且沒有充分發(fā)揮HMM對隱狀態(tài)的刻畫能力,也缺乏策略層面的充分驗證.

    為了在環(huán)境多變、難以預(yù)測的股票市場中研發(fā)可靠的量化交易策略,取代主觀性較強(qiáng)的人工交易方式,有效地保障資產(chǎn)組合保值增值,本研究利用HMM自身特點(diǎn)來識別和預(yù)測市場狀態(tài),將可觀察的特征作為觀測值,將金融市場狀態(tài)作為預(yù)測目標(biāo)的隱狀態(tài).在此基礎(chǔ)上,生成指數(shù)基金的量化交易策略,對策略的有效性通過各個層面予以評估,且通過與當(dāng)前業(yè)內(nèi)較為常用的基于技術(shù)指標(biāo)以及基于無監(jiān)督聚類的擇時方法對比說明了該方法的有效性,同時也分析了這種方法的局限性和缺陷.

    1 股票市場的HMM算法

    圖1 HMM量化金融示例Fig.1 Example of HMM on quantitative finance

    股票市場周期可以粗略區(qū)分為牛市、熊市和震蕩市,還能分成更多細(xì)粒度的市場狀態(tài),這些市場狀態(tài)難以觀察,且轉(zhuǎn)換過程往往并非一蹴而就,存在一定的過渡期.圖1為HMM模型量化金融示例圖,HMM假設(shè)當(dāng)前交易日t的市場狀態(tài)st僅依賴于前一交易日狀態(tài)st-1,故市場狀態(tài)之間的轉(zhuǎn)移概率分布為

    P(st|st-1,st-2,…,s1,o1,o2,…,ot-1)=

    P(st|st-1),

    (1)

    其中ot為觀測狀態(tài),這里可觀測變量很多,一般表現(xiàn)為股價和成交量的波動,也可表現(xiàn)為一些技術(shù)指標(biāo)的數(shù)值變化.進(jìn)而,轉(zhuǎn)移概率矩陣A可表示為

    A=(aij)=(P(st=j|st-1=i)).

    (2)

    市場狀態(tài)st映射到觀測狀態(tài)ot的輸出概率分布為

    P(ot|st,st-1,…,s1,o1,o2,…,ot-1)=P(ot|st),

    (3)

    B=(bjk)=(P(ot=k|st=j)).

    (4)

    其中B為輸出概率矩陣.根據(jù)HMM,在上述轉(zhuǎn)移概率和輸出概率的基礎(chǔ)上,還需要有作為市場狀態(tài)序列開端的初始狀態(tài)概率分布π.

    π=(πi)=(P(s1=i)).

    (5)

    因此,股票市場可由一個完整的HMM模型θ=(A,B,π)的三元組描述.HMM的訓(xùn)練過程目前尚無最優(yōu)解方法,一般采用鮑姆-韋爾奇(Baum-Welch)算法,根據(jù)期望-最大化(EM)原理確定局部最優(yōu)的θ三元組.

    預(yù)測過程則使用維特比(Viterbi)算法,定義狀態(tài)空間為S={s1,s2,…st},令Vt,sk為在已有t個觀測值下以狀態(tài)sk為結(jié)尾的最可能狀態(tài)序列的概率如式(6)和(7)所示,則當(dāng)前狀態(tài)st可由式(8)得到.

    V1,sk=P(o1|k)·πk,

    (6)

    Vt,sk=maxs∈S(P(ot|sk)·as,sk·Vt-1,st-1),

    (7)

    st=argmaxs∈S(Vt,s).

    (8)

    HMM保留了與當(dāng)前交易日關(guān)聯(lián)最強(qiáng)的前一交易日的信息,簡化了建模過程,降低了模型復(fù)雜度;且HMM相較于神經(jīng)網(wǎng)絡(luò)等其他模型來說具有更好的可解釋性;另外HMM也假設(shè)每個觀測值僅依賴于當(dāng)前的隱狀態(tài),該假設(shè)符合人們對于市場的理解認(rèn)知.在牛市和熊市期間,市場的收益率和波動率分布具有顯著差異[13],因此有理由相信在不同市場狀態(tài)下觀測值擁有不同的分布.

    總的來說,HMM擁有結(jié)構(gòu)簡單、魯棒性強(qiáng)和可解釋性好的優(yōu)勢,它在手寫體識別[14-15]、體態(tài)識別[16]、自然語言處理[17-18]和語音識別[19]等時序相關(guān)領(lǐng)域的應(yīng)用已經(jīng)相當(dāng)成熟;其不足主要在于部分遠(yuǎn)期歷史信息的丟失以及缺乏對每個狀態(tài)的直接解釋.

    2 基于HMM的量化擇時模型

    模型整體流程如圖2所示.首先,通過開源數(shù)據(jù)接口獲取股票市場指數(shù)的原始日頻歷史行情數(shù)據(jù),并從中計算得到相關(guān)候選特征.其次,為了能夠找到擁有卓越盈利能力的特征,使用HMM對單個候選特征建模以進(jìn)行回測檢驗,并根據(jù)評估指標(biāo)選取有效特征.隨后,利用有效特征集合對給定狀態(tài)數(shù)的HMM模型進(jìn)行訓(xùn)練.最后在回測階段,模型被用于預(yù)測后一交易日的市場狀態(tài),并發(fā)出相應(yīng)的交易信號.通過上述步驟,得到模型的最佳參數(shù),并用于實際的量化交易中.

    圖2 模型流程圖Fig.2 Flow diagram of the model

    2.1 特征準(zhǔn)備

    文中使用經(jīng)過計算的特征取代前文所述的原始特征.在股票市場中,候選特征主要分為技術(shù)面特征和基本面特征兩類.技術(shù)面特征主要是一些常用的技術(shù)指標(biāo),如相對強(qiáng)弱指數(shù)(relative strength index,RSI)、平均真實波動率(average true range,ATR)等,在這些指標(biāo)的計算中往往對股價信息做了不同程度的平滑處理,在一定程度上減少了噪聲,且這些指標(biāo)在市場上被廣泛運(yùn)用多年,具有很強(qiáng)的可靠性.基本面特征主要是一些能夠反映國家宏觀經(jīng)濟(jì)狀態(tài)的指標(biāo).上述特征都從各自的特定角度揭示了當(dāng)前金融經(jīng)濟(jì)市場的狀態(tài).為了使模型更具通用性,本文中的主要研究對象為技術(shù)面特征.

    2.2 特征篩選

    特征篩選的主要任務(wù)是從所有候選特征中挑選高質(zhì)量的特征.不同特征從不同角度反映了市場狀態(tài),本文中將這些特征組合在一起以期能夠起到互補(bǔ)效果,提高模型表現(xiàn).

    根據(jù)圖2,在生成各個候選特征后,為每個特征構(gòu)建單獨(dú)的HMM模型并執(zhí)行單特征檢驗.訓(xùn)練集上的單特征時間序列作為HMM模型的輸入,可得到一個經(jīng)過單特征訓(xùn)練的HMM模型,隨后觀察該模型在回測驗證集上的預(yù)測表現(xiàn).由于訓(xùn)練過程還涉及到狀態(tài)數(shù)目的確定,本文中為每個單特征分別檢驗了狀態(tài)數(shù)n∈[2,13]的回測情況,并對各個狀態(tài)數(shù)下得到的回測結(jié)果的評估指標(biāo)計算平均值獲得該特征的綜合回測性能表現(xiàn).通過觀察每個單特征模型在數(shù)據(jù)集上的回測表現(xiàn),能夠比較這些特征,評估它們的效用.在量化金融領(lǐng)域,常用年化收益率、最大回撤、夏普比率、交易勝率和交易頻率等作為評估指標(biāo).年化收益率是衡量盈利能力的直接指標(biāo),而最大回撤是衡量模型可能遇到的最壞情況的有效指標(biāo),夏普比率衡量了單位風(fēng)險水平下可獲得的收益,交易勝率代表了盈利交易的比例,交易頻率則衡量了交易成本的數(shù)量.在由專家給出指標(biāo)的相對重要性后,評估指標(biāo)RSI、平滑異同移動平均線(MACD)、ATR、資金流指標(biāo)(MFI)、順勢指標(biāo)(CCI)、乖離率指標(biāo)(BIAS)的權(quán)重可由層次分析法獲得,層次分析結(jié)構(gòu)如圖3所示.

    圖3 層次分析圖Fig.3 Analytic hierarchy process diagram

    評估出指標(biāo)權(quán)重wi后,可計算每個特征的綜合得分,可以得到

    (9)

    其中,n為評價指標(biāo)數(shù)量,ei為評價指標(biāo)值.據(jù)此篩選得到表現(xiàn)靠前的K個特征,組合成訓(xùn)練特征集用于最終模型的訓(xùn)練.

    2.3 狀態(tài)識別

    HMM模型的輸出包含多個狀態(tài)區(qū)間如圖4所示,為了識別出盈利和非盈利狀態(tài),需要在訓(xùn)練集上為每種狀態(tài)執(zhí)行多頭策略(即在預(yù)測為該狀態(tài)的交易日買入持倉,在非該狀態(tài)的交易日賣出),并且統(tǒng)計它們各自的累積收益率曲線.

    圖4 狀態(tài)區(qū)間Fig.4 Interval of states

    一種簡單的方法是根據(jù)在訓(xùn)練區(qū)間上統(tǒng)計得到的狀態(tài)累積收益情況將狀態(tài)分為2類,累積收益為正,代表可盈利狀態(tài),累積收益為負(fù),代表不可盈利狀態(tài).根據(jù)狀態(tài)所屬類型,相應(yīng)的執(zhí)行多頭或空頭策略.若在考察期間共有T個交易日,第t個交易日的累積收益為rt,本文中識別可盈利狀態(tài)的判定條件為:

    rT>15%∨(rT>5%∧(?t≤T,

    ?rt>-3%)).

    (10)

    式(10)定義的判定條件實際上代表了兩類可盈利狀態(tài):第一類是具有明顯盈利能力的狀態(tài),其收益率顯著為正;第二類是微盈利、小波動的狀態(tài),多數(shù)出現(xiàn)在震蕩上行的行情.從長期來看,這兩類狀態(tài)都能夠帶來一定的利潤.

    一些盈利狀態(tài)在某個特定時期可能會變得失效,一些狀態(tài)也可能會從非盈利變?yōu)榭捎?這一方面是由于狀態(tài)的含義不精準(zhǔn),導(dǎo)致狀態(tài)識別存在一定的誤差,另一方面也是由于市場本身的不穩(wěn)定性造成的.尤其是當(dāng)所選擇狀態(tài)數(shù)量多、比例大的時候,更有可能引入“不準(zhǔn)確”狀態(tài).為了解決這個問題,采用一種直觀的方法來滿足需求——動態(tài)狀態(tài)池.對每個狀態(tài)在每個交易日進(jìn)行監(jiān)控,并根據(jù)式(10)條件進(jìn)行檢驗,一旦某個狀態(tài)滿足條件,則將其加入到候選狀態(tài)池中,相應(yīng)地在該狀態(tài)執(zhí)行多頭策略.相反,如果狀態(tài)不能滿足條件,則移出池子.

    在狀態(tài)識別的基礎(chǔ)上,綜合模型還需要確定最佳的狀態(tài)參數(shù).該步驟與單特征篩選的過程較為類似,主要通過分析一定范圍狀態(tài)數(shù)的綜合模型在數(shù)據(jù)集上的回測驗證結(jié)果,綜合國家經(jīng)濟(jì)運(yùn)行背景,選取其中狀態(tài)區(qū)分度大,且盈利狀態(tài)所獲累積收益加和最高的狀態(tài)數(shù)作為模型最終的狀態(tài)參數(shù).

    2.4 回 測

    訓(xùn)練后的模型能夠預(yù)測后一天的市場狀態(tài),根據(jù)預(yù)測得到的市場狀態(tài)在相對應(yīng)的指數(shù)交易所交易基金(exchange traded funds,ETF)上進(jìn)行交易.交易規(guī)則如式(11)所示,pt+1為下一個交易日倉位,st+1表示預(yù)測的下一個交易日的市場狀態(tài)類型,盈利狀態(tài)為1,其他狀態(tài)為0.

    (11)

    卓越的投資表現(xiàn)主要由以下3個因素構(gòu)成:

    1) 回報率衡量投資組合獲取絕對收益和超額收益的能力,也是一個交易策略的基本要求.通常用年化收益率和超額收益率來衡量回報率,它分別衡量投資策略獲取盈利的速度以及戰(zhàn)勝市場的能力.

    2) 風(fēng)險也是一個重要的指標(biāo).一個穩(wěn)定的策略能夠規(guī)避糟糕的市場環(huán)境帶來的巨大損失,低風(fēng)險的策略能夠做到低回撤.

    3) 交易成本也是需要考慮的因素之一.在大多數(shù)情況下,過量的交易會帶來大量的無效交易.在中國,證券公司會對每筆交易收取成交額的0.15%作為傭金手續(xù)費(fèi),從長期來看,這是一筆巨大的開支并且會侵蝕一部分的利潤.因此,保持相對高的勝率和控制合適的交易頻率是必要的.

    日頻數(shù)據(jù)的使用也意味著本文中的策略是日頻策略,策略模型監(jiān)控每天的市場狀態(tài)并且在下一個交易日做出相應(yīng)的交易決策.添加倉位控制、止盈止損措施可以在很大程度上進(jìn)一步將風(fēng)險控制在更低的水平.

    3 實 驗

    3.1 數(shù)據(jù)介紹

    為了簡化實驗,本文中選擇市場指數(shù)作為實驗對象,國內(nèi)市場選取滬深300(CSI 300)指數(shù),在國際市場選取標(biāo)準(zhǔn)普爾500(S&P 500)指數(shù)作為建模標(biāo)的,其中選取跟蹤C(jī)SI 300指數(shù)的300ETF(510300.OF)來模擬真實的交易場景.原始數(shù)據(jù)主要包含了交易日期、開盤價、最高價、最低價、收盤價、成交量、成交額信息.本研究選擇CSI 300作為跟蹤標(biāo)的主要原因為:CSI 300是我國股票市場最為重要的交易指數(shù)之一,其跟蹤標(biāo)的流動性好,不易受到操縱,且波動性適中;同時希望通過指數(shù)擇時,能夠為指數(shù)增強(qiáng)型基金產(chǎn)品提供一些新思路,以期獲得超過純被動型指數(shù)基金的超額收益.

    3.2 特征篩選

    如2.2節(jié)所述,本研究根據(jù)5個評價指標(biāo)對18個候選特征進(jìn)行綜合打分并篩選特征.在保證一定盈利水平、可控制風(fēng)險、維持一定的穩(wěn)定性的目標(biāo)下,由專家指導(dǎo)給出每個指標(biāo)的重要程度分值,可得如式(12)所示的評估指標(biāo)判斷矩陣C.

    (12)

    矩陣元素cij表示指標(biāo)i相對于指標(biāo)j的相對重要程度,矩陣自左向右和自上向下分別表示年化收益率、最大回撤、夏普比率、交易勝率、交易頻率.通過對式(12)中的C進(jìn)行特征向量分析,取最大特征值對應(yīng)的特征向量進(jìn)行歸一化,即可得到每個指標(biāo)具體對應(yīng)的權(quán)重,本研究中上述指標(biāo)最終權(quán)重向量W=(wi)=[0.30,0.25,0.20,0.15,0.10].其中最大回撤和交易頻率指標(biāo)是反向指標(biāo),因此在計算最終分值時需要給予負(fù)值處理.另外由于評價指標(biāo)存在量綱不一致問題,需要在計算前進(jìn)行標(biāo)準(zhǔn)化,主要依據(jù)各個評估指標(biāo)的含義,以及其在量化投資領(lǐng)域常見的取值范圍進(jìn)行最大最小標(biāo)準(zhǔn)化(max-min normalization),夏普比率主要取值范圍在(0,10),其余指標(biāo)取值范圍主要在(0,100),映射后可使所有指標(biāo)不會帶有額外的權(quán)重影響.

    表1 候選特征得分

    表2 所選特征的平均測試結(jié)果

    注:*表示單特征下表現(xiàn)最好的狀態(tài)數(shù),()表示擁有最高累計收益率的狀態(tài)數(shù),R表示累積收益率與最大回撤率比值,下同.經(jīng)過上述步驟并結(jié)合式(9),便可為每個候選特征打分,選取其中得分高于5分、最大回撤小于30%且夏普比率高于1的特征作為篩選后特征集.表1列出了各個候選屬性的得分,最終選出了6個特征:14日ATR、20日價格效率、每日收益率、MACD、意愿指標(biāo)和MFI.表2給出了這些特征作為單特征模型在2014—2016年間的表現(xiàn).表中的結(jié)果是狀態(tài)數(shù)分別為2~13時的測試結(jié)果統(tǒng)計平均值.一些特征在特定的狀態(tài)數(shù)上表現(xiàn)突出.以這些特征為輸入的模型的回測結(jié)果均獲得了正的年化收益率,勝率大多超過50%,且交易次數(shù)適中.

    3.3 狀態(tài)識別

    如圖5所示,將表2中選出的特征組合為每個交易日維度d=6的特征向量,作為綜合HMM模型的輸入.對于不同的市場,有不同的理想狀態(tài)數(shù).實驗結(jié)果表明,一些狀態(tài)可能從非盈利狀態(tài)轉(zhuǎn)換為盈利狀態(tài),意味著動態(tài)狀態(tài)池是必要的.實際上,在模型中隱狀態(tài)的含義是不確定的,隱狀態(tài)可能代表了某段時期的賺錢效應(yīng),也可能代表了市場的波動率.在一定程度上,可以通過輸入不同的特征集來控制隱狀態(tài)的內(nèi)在含義,這解釋了為什么在表2中“每日收益率”的回測結(jié)果能夠取得最高的累積收益率.

    圖5 組合特征Fig.5 Combined features

    表3第1行為配合動態(tài)狀態(tài)池并取得最佳回測表現(xiàn)的9狀態(tài)HMM模型得到的結(jié)果,在回測過程中,動態(tài)狀態(tài)池由3狀態(tài)增加到4狀態(tài),說明其檢測到了新的盈利狀態(tài).為了探索通過動態(tài)狀態(tài)池能夠獲得的利潤空間上限,引入未來函數(shù)對比實驗結(jié)果.訓(xùn)練集被定義在2005—2013年,回測驗證集定義為2014—2016年.通過直接觀察2005—2016年間滿足式(10)定義的條件的狀態(tài),得到一個包含未來信息的“未來狀態(tài)集”.

    圖6 CSI 300指數(shù)走勢圖(2014—2016年)Fig.6 Trend chart for CSI 300 index (2014—2016)

    表3 9狀態(tài)數(shù)HMM在CSI 300指數(shù)上的回測結(jié)果(2014—2016年)

    注:灰色表示使用了未來狀態(tài)集的結(jié)果,下同.

    表3中第2和3行分別展示了9狀態(tài)模型在靜態(tài)狀態(tài)集中的預(yù)測能力和獲取潛在更高累積收益的能力.對比靜態(tài)狀態(tài)集,對于大部分狀態(tài)數(shù)模型,隨著時間推移,在回測區(qū)間上至少出現(xiàn)一個能夠獲取收益的新狀態(tài),部分狀態(tài)數(shù)模型甚至出現(xiàn)2~3個新增的候選狀態(tài),且這些新狀態(tài)所帶來的收益是非常顯著的.從表3中可以看出,9狀態(tài)動態(tài)狀態(tài)池模型結(jié)果已經(jīng)非常接近9狀態(tài)下所能達(dá)到的最大潛在收益率105.14%,這說明動態(tài)狀態(tài)池是有效且必要的.圖6展示了CSI 300指數(shù)2014—2016年期間的市場運(yùn)行情況,CSI 300指數(shù)基準(zhǔn)收益率為43.95%,9狀態(tài)模型獲得了超過60%的超額收益.

    為了檢驗本文中模型狀態(tài)識別能力的通用性,也對模型在國際市場的表現(xiàn)進(jìn)行了測試.由于本文中的股票特征具有明確的市場意義,其有效性具有一定的跨市場通用性,因此在國際市場中,直接使用3.2節(jié)中在國內(nèi)市場上篩選得到的特征集.選取美國金融市場作為測試目標(biāo),實驗中使用S&P 500指數(shù)2000—2006年期間的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2007—2016年作為回測集.表4給出了4狀態(tài)HMM在S&P 500上的回測結(jié)果.狀態(tài)數(shù)為3時,得到了236.63%的最大潛在累積收益,而指數(shù)的基準(zhǔn)收益為140.27%.圖7分別展示了HMM預(yù)測結(jié)果在回測區(qū)間上的狀態(tài)轉(zhuǎn)移情況和各個狀態(tài)根據(jù)轉(zhuǎn)移情況得到的凈值曲線.從圖7可知,長期而言,狀態(tài)0,1代表了上升趨勢,狀態(tài)2代表市場反彈,同樣可以帶來利潤.另外,狀態(tài)1在開始階段經(jīng)歷了損失,直到2009年才成為一個候選狀態(tài),而后為整個資產(chǎn)組合帶來了利潤.狀態(tài)3代表了劇烈的下跌趨勢.可以看到訓(xùn)練后的HMM模型避免了2008年金融危機(jī)給股市帶來的劇烈下跌.受益于更加成熟的市場環(huán)境,在美國市場只需要更少的狀態(tài)就能夠充分描述市場變化,獲取穩(wěn)定收益.

    表4 S&P 500指數(shù)部分結(jié)果(2007—2016年)

    圖7 S&P 500指數(shù)4狀態(tài)HMM模型Fig.7 4-states HMM model for S&P 500 index

    3.4 結(jié)果分析

    文中將基于HMM的量化擇時模型與基于雙均線技術(shù)指標(biāo)、基于k-均值聚類算法的量化擇時模型進(jìn)行了性能對比.

    1) 基于雙均線技術(shù)指標(biāo)的量化擇時模型

    移動平均線是股票和期貨市場上歷史最為悠久、應(yīng)用最為廣泛的技術(shù)指標(biāo)之一,基于均線的擇時策略也因其簡單易懂而廣泛運(yùn)用.雙均線策略主要利用短期移動平均線和長期移動平均線之間的相對位置關(guān)系發(fā)出交易信號[20-21],短期均線運(yùn)行在長期均線上方則視為持倉信號,反之則視為空倉信號.均線模型主要涉及的參數(shù)為長短期均線的周期.

    2) 基于k-均值聚類算法的量化擇時模型

    近年來,已有研究將機(jī)器學(xué)習(xí)方法運(yùn)用在量化投資領(lǐng)域[22].本文中基于k-均值聚類算法將每天的特征向量作為對每個交易日的描述,并將歐式距離作為樣本間相似度的度量標(biāo)準(zhǔn),將擁有相似特征的相似交易日進(jìn)行聚類并預(yù)測為同一種市場狀態(tài),根據(jù)預(yù)測得到的狀態(tài)發(fā)出相應(yīng)交易信號.

    3種方法的比較結(jié)果如表5所示.通過組合長短期均線周期(5/10/20/30/60),對雙均線擇時模型共10個參數(shù)組合進(jìn)行了測試,MA10/MA60參數(shù)組合獲得了最佳表現(xiàn).在2014—2016年期間,該模型共發(fā)生6筆交易,獲得23.73%的年化收益率,此時最大回撤25.68%.從結(jié)果上看,雙均線策略的平均最大回撤率分別比HMM高出16.5個百分點(diǎn),比k-均值聚類算法高出13.56個百分點(diǎn),均線策略本身的延遲性造成了幅度更大的回撤區(qū)間.利用表2中的特征對基于k-均值聚類算法的量化擇時模型進(jìn)行測試.在沒有使用動態(tài)狀態(tài)選擇的情況下,5狀態(tài)k-均值聚類算法在2014—2016年期間取得了15.19%的年化收益率和對應(yīng)13.29%的最大回撤.通過使用動態(tài)狀態(tài)選擇,8狀態(tài)k-均值聚類算法能夠帶來84%的潛在收益,對應(yīng)最大回撤僅12.74%.不過在大多數(shù)情況下,其勝率都低于50%,且交易頻率偏高.

    表5 3種方法統(tǒng)計結(jié)果

    注:Avg表示平均值,Max表示最大值,Min表示最小值,SD表示標(biāo)準(zhǔn)差.

    綜合對比結(jié)果可知,HMM擁有參數(shù)少、魯棒性強(qiáng)和可解釋性強(qiáng)的優(yōu)勢.從最大回撤率的角度來看,基于HMM的策略的表現(xiàn)皆優(yōu)于k-均值聚類算法和雙均線策略,表明相較于其他常見策略,HMM在規(guī)避風(fēng)險的敏感性和在控制回撤的有效性上表現(xiàn)更佳.從期望收益率的角度看,基于HMM的策略的表現(xiàn)優(yōu)于k-均值聚類算法,與均線策略相當(dāng).這主要源于HMM合理的馬爾科夫性質(zhì)假設(shè).另外,HMM策略帶來了長期高于50%的交易勝率,以及更低的交易頻率.從平均意義上來說,它產(chǎn)生更少的交易費(fèi)用.

    均線策略的最大缺陷來源于均線的延遲性,這會在趨勢不明顯的震蕩市帶來長期的虧損.只有在趨勢明顯的牛市或熊市期間均線策略才能夠帶來大幅利潤或避免大幅損失.然而通常來說,在經(jīng)濟(jì)周期的影響下,市場每經(jīng)過7~8年才會有一輪趨勢明顯的牛市或熊市,因此均線策略所需回報周期更長.另外,找到合適的均線參數(shù)也是相當(dāng)困難的,很容易造成過擬合.而k-均值聚類算法則完全沒有考慮相鄰交易日之間的關(guān)系,導(dǎo)致了頻繁的狀態(tài)轉(zhuǎn)換和高昂的交易成本.

    4 結(jié) 論

    本研究圍繞量化投資領(lǐng)域的量化擇時問題,研究了HMM在該領(lǐng)域的應(yīng)用,給出了如何基于HMM構(gòu)建量化交易策略的完整流程.同時將基于移動平均線和k-均值聚類算法的量化擇時模型作為對比,對實驗結(jié)果進(jìn)行了分析,驗證了HMM具有識別市場中長期狀態(tài)的能力.HMM的主要原理在于馬爾科夫性質(zhì)的假設(shè),相鄰時序樣本之間的關(guān)聯(lián)信息能夠被有效利用,隱狀態(tài)的轉(zhuǎn)換存在一定的概率分布,因而它能夠選擇合適的交易時機(jī),并在市場迎來暴跌時有效保護(hù)資產(chǎn)組合.另外相較于其他兩種常見策略,它在敏感性和穩(wěn)定性上有更好的表現(xiàn).

    盡管HMM在量化擇時上有較為優(yōu)越的表現(xiàn),但是仍然存在一些不足,在后續(xù)的研究中將進(jìn)一步改進(jìn).

    1) 當(dāng)前模型的狀態(tài)選擇依然屬于靜態(tài)規(guī)則,不能有效監(jiān)控各個狀態(tài)的動態(tài)變化.當(dāng)某個狀態(tài)當(dāng)前不能滿足特定條件時,很容易錯過巨額的利潤空間,而滿足條件時,又很容易遭遇巨幅回撤,也即在動態(tài)狀態(tài)監(jiān)控上存在滯后.因此需要對動態(tài)狀態(tài)選擇機(jī)制進(jìn)行進(jìn)一步的智能優(yōu)化.

    2) 擇時往往只是一個量化交易系統(tǒng)的一部分,通過合理利用策略融合技術(shù),將隱馬爾科夫擇時模型與其他的策略組合使用,充分利用擇時模型對市場環(huán)境的預(yù)判能力,能夠更加有效地挖掘個股股價的利潤空間,規(guī)避市場風(fēng)險.

    3) 本文中提出的策略流程,尚未考慮任何倉位控制和止盈止損措施,如何合理通過添加風(fēng)險控制措施來提高策略的可控性也是重要的研究課題.

    4) 當(dāng)前針對的主要跟蹤交易對象為市場指數(shù),在后續(xù)研究中,將進(jìn)一步針對預(yù)測難度更大的個股以及期貨品種進(jìn)行模型研究.

    [1] GUIDOLIN M,TIMMERMANN A.Asset allocation under multivariate regime switching[J].Journal of Economic Dynamics & Control,2007,31(11):3503-3544.

    [2] DE ANGELIS L,PAAS L J.A dynamic analysis of stock markets using a hidden Markov model[J].Journal of Applied Statistics,2013,40(8):1682-1700.

    [3] SALHI K,DEACONU M,LEJAY A,et al.Regime switching model for financial data:empirical risk analysis[J].Physica a-Statistical Mechanics and Its Applications,2016,461:148-157.

    [4] 楊新斌,黃曉娟.基于支持向量機(jī)的股票價格預(yù)測研究[J].計算機(jī)仿真,2010,27(9):302-305.

    [5] 謝國強(qiáng).基于支持向量回歸機(jī)的股票價格預(yù)測[J].計算機(jī)仿真,2012,29(4):379-382.

    [6] CAO L,TAY F E H.Financial forecasting using support vector machines[J].Neural Computing & Applications,2010,10(2):184-192.

    [7] GALESHCHUK S.Neural networks performance in exchange rate prediction[J].Neurocomputing,2016,172(C):446-452.

    [8] BEBARTA D K,SUDHA T E,BISOYI R.An intelligent stock forecasting system using a unify model of CEFLANN,HMM and GA for stock time series phenomena[C]∥Emerging Ict for Bridging the Future.Berlin:Springer-Verlag Berlin,2015:485-496.

    [9] 李文鵬,高宇菲,錢佳佳,等.深度學(xué)習(xí)在量化投資中的應(yīng)用[J].統(tǒng)計與管理,2017,9(8):104-106.

    [10] HASSAN R,NATH B.Stock market forecasting using hidden Markov model:a new approach[C]∥5th International Conference on Intelligent Systems Design and Applications.Los Alamitos:IEEE,2005:192-196.

    [11] PARK S H,LEE J H,SONG J W,et al.Forecasting change directions for financial time series using hidden Markov model[C]∥Rough Sets and Knowledge Technology.Berlin:Springer,2009:184-191.

    [12] SEETHALAKSHMI R,KRISHNAKUMARI B,SAAVITHRI V.Gaussian kernel based HMM for time series data analysis[C]∥Conference Proceedings of 2012 International Conference on Management Issues in Emerging Economies.Thanjavur:IEEE,2012:105-109.

    [13] 李臘生,翟淑萍,關(guān)敏芳.證券市場收益率分布時變性的經(jīng)濟(jì)學(xué)分析及其我國的經(jīng)驗證據(jù)[J].統(tǒng)計研究,2011,28(11):66-78.

    [14] FIERREZ J,ORTEGA-GARCIA J,RAMOS D,et al.HMM-based on-line signature verification:feature extraction and signature modeling[J].Pattern Recognition Letters,2007,28(16):2325-2334.

    [15] 肖明,賈振紅.基于輪廓特征的HMM手寫數(shù)字識別[J].計算機(jī)工程與應(yīng)用,2010,46(33):172-174,211.

    [16] CHEN F S,FU C M,HUANG C L.Hand gesture recognition using a real-time tracking method and hidden Markov models[J].Image and Vision Computing,2003,21(8):745-758.

    [17] KHAN W,DAUD A,NASIR J A,et al.A survey on the state-of-the-art machine learning models in the context of NLP[J].Kuwait Journal of Science,2016,43(4):95-113.

    [18] 韓普,姜杰.HMM在自然語言處理領(lǐng)域中的應(yīng)用研究[J].計算機(jī)技術(shù)與發(fā)展,2010(2):245-248,252.

    [19] PARAMONOV P,SUTULA N.Simplified scoring methods for HMM-based speech recognition[J].Soft Computing,2016,20(9):3455-3460.

    [20] 譚磊.趨勢跟蹤類策略的內(nèi)在邏輯[J].當(dāng)代經(jīng)濟(jì),2017,27(6):144-145.

    [21] 景泰然.量化投資在期貨交易中的應(yīng)用[J].現(xiàn)代商業(yè),2015,12(18):152-153.

    [22] 張文俊,張永進(jìn).4種數(shù)據(jù)挖掘典型分類方法在股票預(yù)測中的性能分析[J].安徽工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2017,34(1):97-102.

    猜你喜歡
    聚類交易狀態(tài)
    狀態(tài)聯(lián)想
    生命的另一種狀態(tài)
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    熱圖
    家庭百事通(2016年3期)2016-03-14 08:07:17
    堅持是成功前的狀態(tài)
    山東青年(2016年3期)2016-02-28 14:25:52
    基于改進(jìn)的遺傳算法的模糊聚類算法
    交易流轉(zhuǎn)應(yīng)有新規(guī)
    上海國資(2015年8期)2015-12-23 01:47:28
    大宗交易
    《吃飯的交易》
    一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
    东乌珠穆沁旗| 麻江县| 永丰县| 永兴县| 英德市| 麻江县| 邻水| 晴隆县| 榆林市| 若羌县| 剑河县| 赤水市| 称多县| 洛浦县| 博乐市| 阿合奇县| 塘沽区| 天柱县| 徐汇区| 兴隆县| 旬阳县| 临桂县| 老河口市| 上犹县| 四子王旗| 南安市| 合川市| 凤台县| 武安市| 嘉黎县| 靖安县| 扶风县| 宁德市| 高雄市| 鲁山县| 班玛县| 东平县| 黎城县| 广昌县| 凤庆县| 丹江口市|