賈茹閣 張忠林
(蘭州交通大學(xué)電子與信息工程學(xué)院 甘肅 蘭州 730070)
隨著全球市場經(jīng)濟的發(fā)展,金融市場研究技術(shù)不斷涌現(xiàn),大大推動了市場偏好的預(yù)測期,但隨著市場波動加劇,市場偏好的預(yù)測準確性仍有待進一步提升,合理實現(xiàn)市場偏好的有效預(yù)測對防范金融市場危機具有重要意義,是當前研究的熱點之一[1,2]。近年,金融市場偏好和偏好風險的預(yù)測和分析受到金融機構(gòu)業(yè)務(wù)和行政機構(gòu)的關(guān)注和研究。同時,由于偏好風險的可能性小得多,曾經(jīng)出現(xiàn)投資者嚴重虧損,甚至是全球金融風險,對經(jīng)濟秩序造成嚴重影響。如何建立金融市場偏好預(yù)警模型的分析方法對于防范和控制財務(wù)管理風險和科學(xué)規(guī)劃以及投資決策具有重要意義[3]。中國金融市場的建立時間很短,因此市場秩序不夠規(guī)范,與防控相關(guān)的極端市場偏好風險技術(shù)還不夠成熟,使得防范和控制中國極端市場偏好風險的能力非常薄弱。事實上,隨著經(jīng)濟全球化的發(fā)展,國內(nèi)和國際金融市場的關(guān)系越來越密切,其中外國金融風險很容易加劇國內(nèi)市場的風險[4-6]。因此,優(yōu)化中國的金融風險預(yù)警分析領(lǐng)域,提升金融市場風險防控能力,是一項必須緊急進行的研究。到目前為止,已有不少學(xué)者設(shè)計了不同的財務(wù)偏好風險預(yù)警策略[7],如邏輯回歸策略、多判別分析法、決策樹算法、似然比回歸算法、支持向量機(SVM)算法和神經(jīng)網(wǎng)絡(luò)算法。其中,作為一種智能預(yù)測模型,支持向量機具有更高的分析預(yù)測精度和計算效率,并已在許多領(lǐng)域得到應(yīng)用和驗證。在本文中,支持向量機將成為研究如何提升極端市場偏好風險預(yù)測水平的主要工具。由于極端市場偏好和樣本數(shù)據(jù)非平衡性的樣本特征很小,SVM算法直接應(yīng)用于極端市場偏好風險預(yù)測中會得到不理想的結(jié)果和嚴重的風險預(yù)測傾向。因此,在預(yù)測極端市場偏好風險時,如何處理樣本數(shù)據(jù)的不平衡對于用SVM建立市場偏好預(yù)警模型至關(guān)重要[8]。
本文針對極端市場偏好風險預(yù)警相關(guān)問題,以深圳股票和上海股票綜合指數(shù)樣本數(shù)據(jù)為研究對象,以SVM算法為預(yù)測分析工具,針對SVM算法存在的問題,并基于灰度模型,自回歸模型和多核SVM,提高了算法的性能,結(jié)果驗證了算法的可用性[9-12]。
在市場i和時間t中,將會出現(xiàn)兩種極端偏好風險,即非極端偏好風險和極端偏好風險,前者定義為“-1”,后者定義為“+1”。樣本集中的樣本點將被分成兩部分[13-14]:
f(x)=sgn(w*·x+b)=
(1)
(2)
以上是本文應(yīng)用的市場極值偏好風險預(yù)警的SVM模型,如上所述,因為該模型可能在極端偏好的風險預(yù)測中“失敗”,并且可能將極端偏好風險錯誤地判斷為非極值偏好風險。本文旨在上述支持市場偏好風險的SVM預(yù)警模型的基礎(chǔ)上,改進算法優(yōu)化過程,提高預(yù)測精度。
灰度預(yù)處理是一種基于歷史數(shù)據(jù)構(gòu)造的樣本預(yù)處理算法,其中GM(1,1)是包含單變量微分方程最常見的灰色模型。
通過對市場極值偏好的原始數(shù)據(jù)進行累加計算,可以得到具有指數(shù)增長特征的數(shù)據(jù)序列模型和基于該序列的市場極值偏好風險微分模型,以及時間響應(yīng)數(shù)據(jù)遞減歸約法,我們可以得到如下市場極值偏好風險數(shù)據(jù)的灰度預(yù)處理模型[17]:
(3)
(4)
式中:x′(0)為市場極值偏好序列的滑動平均值,x0為市場極值偏好的原始序列,通過求解的滑動平均值,x0將增加數(shù)據(jù)權(quán)重并顯著減少數(shù)據(jù)波動,從而使數(shù)據(jù)擬合效果更好。
(5)
在確定AR模型的階數(shù)時,需要計算市場極端偏好數(shù)據(jù)的自協(xié)方差,形式如下:
(6)
那么,可以得到與市場極端偏好樣本存在相關(guān)的參數(shù)如下:
(7)
部分相關(guān)參數(shù)的形式如下:
(8)
其中的相關(guān)參數(shù):
(9)
(10)
(11)
(12)
然后只需要找出符合上述約束條件的mar來獲得自回歸SVM風險預(yù)測模型的階次數(shù)。
在高維空間中,計算核函數(shù)上點的內(nèi)積,并用多模簡單函數(shù)組合代替普通核函數(shù),如高斯核函數(shù)、傅立葉核函數(shù)、多項式函數(shù)內(nèi)核,其中多項式SVM內(nèi)核的格式如下:
K(x,x′)=((x,x′)+c)d
(13)
式中:c≥0,d=1,2,…,當參數(shù)c>0時,上述多項式SVM內(nèi)核將具有維度非均勻性,當參數(shù)c=0時,上述多項式SVM內(nèi)核將具有維度均勻性,其形式為K(x,x′)=(x,x′)d,d=1,2,…,高斯內(nèi)核是:
(14)
傅立葉內(nèi)核將是:
(15)
式中:當?x,x′∈R,γ是模型常數(shù);q是常數(shù)值,滿足0 多項式SVM內(nèi)核是一種基于單項內(nèi)核組合的新型SVM內(nèi)核,考慮使用這種組合來實現(xiàn)全局和局部內(nèi)核,這種方法的應(yīng)用可能實現(xiàn)這兩種SVM內(nèi)核的互補。根據(jù)Mercer理論,如果K3(θ,θ′)屬于Rm×Rm和θ(x)是X?Rn到Rm的數(shù)據(jù)映射,可以得到K(x,x′)=K3(θ(x),θ(x′))也是Rn×Rn上的內(nèi)核;如果f(·)是在x∈Rn上定義的實際映射函數(shù),那么可以得到該內(nèi)核K(x,x′)=f(x)f(x′)具有正定性。如果K1和K2是Rn×Rn上的SVM內(nèi)核,則可以得到以下SVM內(nèi)核: (16) 特別是如果p(x)是一個正值的多項式,我們可以得到下面的SVM內(nèi)核: K(x,x′)=ρ(K1(x,x′),K(x,x′)=exp(K1(x,x′))) (17) (18) 然后獲得以下SVM內(nèi)核: (19) 在0 假設(shè)回歸模型的訓(xùn)練集為: T={(x1,y1),(x2,y2),…,(xt,yt)}∈(X×Y)t (20) 式中:參數(shù)xi∈X=Rn是多項式AR-SVM核模型的輸入,參數(shù)yi∈Y=R是模型輸出,其中i=1,2,…,l,通過搜索Rn存在的實際值映射f(x),我們可以得到y(tǒng)=f(x)并推導(dǎo)出x和y的對應(yīng)關(guān)系,多項式AR-SVM核模型的計算是:將原始市場極值偏好的高維特征數(shù)據(jù)空間,實現(xiàn)最佳決策目標并建立: f(x)=wTφ(x)+b (21) 式中:參數(shù)φ(x)是變量x到高維空間的映射轉(zhuǎn)移,參數(shù)ω是單項SVM核的權(quán)重,b是模型的偏差。根據(jù)最優(yōu)理論,我們可以得到相同的上述模型的公式: (22) 式中:參數(shù)L為模型的損失因子,由于ε非敏感模型,這種損失因子可能使得SVM算法具有特定的稀疏性,因此我們在此選擇了非敏感模型損失因子ε: (23) (24) (25) 式中:模型輸入為x1,x2,…,xk,k是模型輸入的階數(shù),模型輸出是xk+1。本文多項式AR-SVM核模型的流程圖如圖1所示。 圖1 多項式AR-SVM核模型 為了驗證本文提出的SVM算法的效率,選擇sinC測試函數(shù)的形式如下: f(x)=sinc(x)+vx∈[-3,3] (26) 算法性能與預(yù)測結(jié)果比較如圖2和表1所示。 圖2 SVM算法性能比較 表1 預(yù)測結(jié)果比較 根據(jù)圖2和表1可以看出,與正交SVM和原始SVM相比,本文提出的改進的SVM算法需要最少量的SVM模型核,并且呈現(xiàn)出最低的預(yù)測誤差和訓(xùn)練誤差,對測試函數(shù)的預(yù)測更接近于原始樣本的預(yù)測。 參數(shù)設(shè)置后,選擇Torrubiano風險預(yù)測模型作為比較算法,對市場極端偏好風險預(yù)測過程進行了實證檢驗,并對內(nèi)外部樣本的預(yù)警誤差TEN1、TEW1進行了比較分析,k的值將在5~10以內(nèi),預(yù)警比較圖如圖3所示。 圖3 Torrubiano模型與本文算法內(nèi)外部預(yù)警誤差比較圖 由于模型特征的選擇可能會對市場極端偏好風險預(yù)測的準確性產(chǎn)生不利影響,因此合理選擇對于此類預(yù)測至關(guān)重要。本文根據(jù)目前研究結(jié)果選取特征,主要有指標:股指、馬克指數(shù)和終極波動指數(shù)(UOI),獲得了14組月度特征指標樣本,詳見表2。 表2 市場極端偏好風險預(yù)警特征指標 表3優(yōu)化指數(shù)為(ZB1-ZB2)/ZB1,其中ZB1是Torrubiano風險預(yù)測模型樣本的內(nèi)外部數(shù)據(jù)的平均值,ZB2是本文提出的風險預(yù)測模型樣本的內(nèi)外部數(shù)據(jù)的平均值。與Torrubiano風險預(yù)測模型相比,本文優(yōu)化指數(shù)具體如表3所示,指數(shù)值越大,該算法的優(yōu)越性越好。 表3 本文算法相比Torrubiano模型的優(yōu)化指數(shù) % 從表3可以看出,所提出的k為5~10的算法的跟蹤誤差均比Torrubiano風險預(yù)測模型的優(yōu)越。例如當k=5時,與Torrubiano風險預(yù)測模型相比,該算法的跟蹤精度了提高43.25%;當k=6時,提高43.62%;當k=7時,提高52.19%;當k=8時,提高了50.68%;k=9時,提高了49.82%;當k=10時,提高了45.82%。在k=7時提高的最多。以上結(jié)果表明,與Torrubiano風險預(yù)測模型相比,本文提出的算法的預(yù)測精度得到了顯著提升。 在風險預(yù)測SVM模型分析中,選取平均值設(shè)置精度G,極值偏好風險預(yù)測等級F和ROC曲線區(qū)域作為評價指標,選擇原始SVM算法和文獻[18]提出的支持向量機算法作為比較算法,選擇的三種市場偏好風險支持向量機預(yù)警算法的比較數(shù)據(jù)如表4所示。 表4 三種模型對兩類股指的比較 根據(jù)表4中的模型評估比較結(jié)果,可以看出:無論是深證指數(shù)還是上證指數(shù),本文提出的算法的三個指標G、F和AUC均優(yōu)于其他兩種算法,本文提出的算法能夠顯著提高市場極值偏好風險預(yù)測模型的準確性;本文提出的模型優(yōu)于文獻[18]中提出的模型,除上證指數(shù)的AUC指數(shù)略低于文獻[18],其余指標的擬合值都優(yōu)于文獻[18]。以上結(jié)果表明,本文提出的SVM模型的改進方法可以顯著提高算法性能。 本文以深證指數(shù)和上證指數(shù)為基礎(chǔ),構(gòu)建了基于灰度混合核AR-SVM模型的市場偏好預(yù)警分析模型,得出結(jié)論:本文提出的算法模型可以顯著提升市場極端偏好風險預(yù)測的準確性??梢钥闯?,本文提出的模型能夠準確預(yù)測市場極端偏好風險,得到更準確的市場極端偏好風險預(yù)測,能夠?qū)鹑谑袌霰O(jiān)管和宏觀調(diào)控有協(xié)助作用,具有一定的實際應(yīng)用價值。0.5,主導(dǎo)將是多項式SVM內(nèi)核;如果ρ<0.5,主導(dǎo)是基礎(chǔ)核;如果ρ=0.5,兩個單項SVM內(nèi)核將同樣重要。可以看到,在構(gòu)建多項式SVM核函數(shù)時,通過調(diào)整ρ的值可以得到單項SVM核函數(shù)的靈活組合,從而得到不同形式的多項式SVM核函數(shù)。
2.4 多項式AR-SVM核模型
3 實驗分析
3.1 算法性能測試
3.2 實證分析
3.3 SVM模型風險預(yù)測分析
4 結(jié) 語