熊志斌
(華南師范大學 數(shù)學科學學院,廣州 510631)
由于信用風險度量的復(fù)雜性與非結(jié)構(gòu)性,使得傳統(tǒng)的統(tǒng)計計量模型在風險評估中的效果往往不盡人意。近年來,神經(jīng)網(wǎng)絡(luò)以其靈活的學習能力和優(yōu)良的非線性建模等特性而受到研究人員的高度重視,并在信用評估領(lǐng)域中得到了廣泛運用[1]。然而神經(jīng)網(wǎng)絡(luò)存在“黑箱操作”、結(jié)果解釋性差等缺陷而讓人詬病。隨著研究的不斷深入,有研究者開始將具有邏輯推理功能,擅長處理不確定性、不精確信息的模糊邏輯與神經(jīng)網(wǎng)絡(luò)相結(jié)合起來,來改善上述缺陷,并在風險管理研究的實踐中取得了較好的效果[2,3]。不過上述模型中優(yōu)化模型參數(shù)的方法為BP算法或是基于梯度下降的尋優(yōu)算法,這種模型并未解決一般神經(jīng)網(wǎng)絡(luò)所存在的學習速度緩慢、易陷入局部最優(yōu)等缺陷。而以粒子群算法為代表的群智能優(yōu)化算法是用搜索空間中的點模擬自然生物中的個體,將生物的優(yōu)勝劣汰過程或覓食過程類比為可行解變換優(yōu)化的迭代過程,該算法相比BP等梯度算法而言具有全局性能良好、操作簡單且易于實現(xiàn)的優(yōu)點[4]。然而,粒子群算法也存在著不能兼顧收斂速度、全局探索能力和局部精細搜索能力的問題,在迭代后期易出現(xiàn)“早熟”現(xiàn)象[5],針對上述缺陷,一個改進思路就是綜合不同算法技術(shù),使得不同方法技術(shù)之間相互補充、相互促進,最終達到改善優(yōu)化算法的性能,提高模型預(yù)測效果的目的。
基于此,本文提出一種改進的粒子群算法——混沌小生境粒子群算法,來改善上述缺陷。首先基于混沌運動的遍歷性特點,在算法初始化時采用混沌迭代產(chǎn)生粒子的初始位置和速度以提高種群的多樣性;然后借鑒遺傳算法中的常用的小生境技術(shù)來改進粒子群算法在進化過程中的多樣性,提高算法的全局尋優(yōu)性能和收斂速度。通過這種改進算法對模型參數(shù)進行優(yōu)化,構(gòu)建了混沌小生境粒子群模糊神經(jīng)網(wǎng)絡(luò)模型,并運用該模型對我國上市公司信用風險狀況進行評估預(yù)測。
本文所采用的模型為四層網(wǎng)絡(luò)模型結(jié)構(gòu),具體結(jié)構(gòu)如圖1所示,其中n為輸入維數(shù),m為模糊子集的個數(shù),wj是模糊推理層第j個節(jié)點到輸出層節(jié)點的耦合權(quán)值。這里用分別表示第l層第i個節(jié)點的輸入和輸出。
圖1網(wǎng)絡(luò)模型結(jié)構(gòu)
每層的輸入和輸出具體表達如下:
(1)第一層(輸入層):這一層有n個節(jié)點,這些節(jié)點僅僅將輸入值傳遞到第二層。
(2)第二層(模糊化層):這一層共有mn個節(jié)點,共有n組。每個節(jié)點與輸入變量的一個語言變量標識相對應(yīng),隸屬值確定了輸入變量的模糊集程度。本文采用Gaussian隸屬函數(shù)。
其中 μij(xi)是模糊變量隸屬函數(shù),mij,σij分別為Gaussian函數(shù)μij的中心和寬度。
(3)第三層(模糊推理層):該層共有m個節(jié)點,其輸入輸出表達式為:
(4)第四層(去模糊化層):1個節(jié)點,該節(jié)點計算前一層輸出之和并將其作為總輸出。
其中wj是第三層第j個節(jié)點到第四層節(jié)點的耦合權(quán)值。
在標準的PSO算法中,其解的好壞是由適應(yīng)度函數(shù)值來評價,適應(yīng)度函數(shù)的設(shè)計與目標函數(shù)有關(guān),要根據(jù)實際研究問題來確定。種群中的每個粒子都代表一個可能解,它包括粒子自身所處位置及速度,粒子速度決定了其搜索的更新方向和距離。粒子在搜索過程中,是通過跟蹤個體最優(yōu)位置(即個體極值pbest)和全局最優(yōu)位置(即全局極值gbest)來更新自身的。在標準PSO算法中,粒子的位置和速度根據(jù)如下方程進行更新[4]:
一般來講,由確定性方程得到的具有隨機性的運動狀態(tài)都可稱為混沌,其中Logistic映射就是一個典型的混沌系統(tǒng)[7],其迭代公式如下:
其中,k=1,2,3,…,α為控制參數(shù),α∈(2,4]。在這里,本文主要是利用混沌運動的遍歷性,即通過混沌迭代產(chǎn)生大量的初始群體,從中選出較好的初始群體。
小生境技術(shù)是通過強迫個體分布在不同“生境”的方法,增加個體多樣性,避免算法陷入局部極值無法跳出。本文將基于限制競爭選擇策略(Restricted Competition Selection,RCS)的小生境技術(shù)與粒子群算法結(jié)合起來,構(gòu)建小生境粒子群算法(niche evolution PSO,NEPSO)來改進算法的搜索精度和尋優(yōu)性能。RCS策略的主要優(yōu)點是能夠?qū)⑿∩撤秶鷥?nèi)的兩個解中較差的淘汰掉,保證種群朝最優(yōu)解方向運動;另外,RCS策略是以種群最優(yōu)位置之間的距離作為小生境之間的距離,當兩個生境距離小于某一設(shè)定的閾值時,較好的生境予以保留,而對于較差的種群進行重置,即將種群內(nèi)最優(yōu)個體作為種群的最優(yōu)極值,并重新初始化種群內(nèi)的其他被選中粒子。這樣既保證了搜索朝著最優(yōu)方向進行,又使得每個小生境種群間的搜索是相互獨立的,保證了多樣性,而且當生境發(fā)生相互干擾時,該策略僅需對極少數(shù)幾個最優(yōu)個體粒子進行控制,極大減少了算法復(fù)雜度,提高了算法效率。RCS策略更詳細的介紹可參看文獻[8],這里不再贅述。
這里,本文引入RCS小生境技術(shù)來改進粒子群算法的尋優(yōu)性能,通過以下粒子狀態(tài)更新方程來對粒子狀態(tài)進行更新,既防止不同種群趨同,又保證種群的多樣性,粒子狀態(tài)更新方程如式(7):
混沌小生境粒子群算法(CNEPSO)的具體步驟如下:
步驟1:產(chǎn)生初始種群和若干小生境子種群;初始化算法參數(shù),包括慣性權(quán)重ω,隨機數(shù)ξ1、ξ2和ξ3,學習因子c1、c2和c3等;
步驟2:進行混沌初始化。對每個種群都隨機產(chǎn)生一個n維的每個分量數(shù)值都在0和1之間的向量yo=(y01,y02,…,yon),yi(i=1,2,…,N)由式(6)給出,其中N為種群規(guī)模;然后再根據(jù)式子 xij=xmin+yij(xmax-xmin),(i=1,2,…,N;j=1,2,…,n)計算粒子的位置,通過計算目標函數(shù),從N個初始群體中找出較好的m個解作為初始位置,隨機產(chǎn)生m個初始速度;
步驟3:對所選出的粒子,根據(jù)當前位置和速度產(chǎn)生出新的位置;
步驟4:對每個子種群中的每個粒子評價其當前的適應(yīng)值。這里使用誤差平方和(SSE)的倒數(shù)作為評價函數(shù),即,以自身當前位置作為每個粒子的個體極值,以每個子種群中的最優(yōu)粒子作為子種群的最優(yōu)極值,所有粒子中最優(yōu)粒子則被視為整個種群中的全局最優(yōu)極值
步驟5:執(zhí)行RCS小生境技術(shù)策略,確定每個小生境子種群中的最佳個體粒子,每個子種群中的最佳粒子被選中重新組成一個新的種群Newgroup;
步驟6:對每個子種群內(nèi)(不含Newgroup)的個體按式(7)進行更新(包括位置和速度);
步驟8:每個種群按小生境技術(shù)操作,不斷迭代,當?shù)欢ù螖?shù)時,對最差的子種群重新初始化;
步驟9:當?shù)欢ù螖?shù)后,計算種群Newgroup內(nèi)所有粒子適應(yīng)度值,并按標準PSO的粒子更新方程式(5)更新粒子位置和速度;
步驟10:檢查是否滿足算法終止條件。本文使用兩條學習終止準則:1)誤差平方和MSE;2)最大進化代數(shù)M。若MSE<ε(這里ε為事先設(shè)定好的值)或M達到預(yù)先設(shè)定的迭代次數(shù),則中止算法并輸出結(jié)果;否則,令k=k+1,轉(zhuǎn)到步驟6直到終止條件滿足。
本文以我國上市公司中ST公司(包括*ST公司)和非ST公司作為研究對象,根據(jù)唐振鵬等(2016)的觀點[9],雖然ST、非ST公司與公司信用好壞并不完全等同,但它們之間有著很強的相關(guān)性,在上市公司信用研究中可以把ST公司視為信用差(危機)公司,非ST公司視為信用好(正常)公司,本文采用了這種觀點。本文樣本數(shù)據(jù)來源于Wind數(shù)據(jù)庫和同花順財經(jīng)數(shù)據(jù)庫,由于公司t年被宣布ST處理和該公司公布t-1年度財務(wù)報表幾乎是同時發(fā)生的,故本文采用t-2年的財務(wù)數(shù)據(jù)來預(yù)測t年是否會被ST,例如2014年被宣布ST的公司,則采用2012年財務(wù)數(shù)據(jù)來進行分析。本文在借鑒國內(nèi)外有關(guān)文獻的基礎(chǔ)上,并結(jié)合指標的可比性、同趨勢性原則,選取了10個指標,即:資產(chǎn)凈利率(X1),主營業(yè)務(wù)利潤率(X2),凈資產(chǎn)利潤率(X3),資產(chǎn)負債率(X4),速動比率(X5),已獲利息倍數(shù)(X6),經(jīng)營現(xiàn)金總債務(wù)比(X7),總資產(chǎn)周轉(zhuǎn)率(X8),應(yīng)收賬款周轉(zhuǎn)率(X9),主營業(yè)務(wù)收入增長率(X10)。
對于原始指標數(shù)據(jù),本文進行了歸一化處理,歸一化函數(shù)如式(8)所示:
這里,X代表輸入矩陣,max x和min x分別為X中的最大和最小值。由此可知,該網(wǎng)絡(luò)模型的輸入層節(jié)點為10,模糊子集數(shù)設(shè)為3,網(wǎng)絡(luò)模糊化層節(jié)點數(shù)則為30,去模糊化層節(jié)點數(shù)設(shè)為3,輸出變量為單變量y,即輸出層為一個節(jié)點,若y=1則代表信用差(ST公司),y=0則代表信用好(非ST公司)。因此,該模型的結(jié)構(gòu)為一個10-30-3-1網(wǎng)絡(luò)結(jié)構(gòu)。
為了盡量減少隨機劃分訓練樣本集和測試樣本集所可能帶來的偏差,同時也為了提高模型的泛化能力,更有效地檢驗?zāi)P偷臏蚀_性和可靠性,本文采用n重交叉驗證(n-fold cross-validation)方法來評估模型對信用風險分類的有效性。具體方法為:初始樣本集合(300家公司)被劃分成5組互不相交的子集,每組樣本數(shù)都為60家(14家ST和46家非ST公司)。每一次模型在除了一個子集之外的其他子集上進行訓練,而未被訓練的子集則用來作為測試集。整個過程被重復(fù)5次試驗,每次使用一個不同的子集進行驗證,所構(gòu)建模型總的分類準確度是通過這5次試驗中所得到的分類準確度加總后的簡單平均值求得。
在本文中,種群大小被設(shè)定為60,初始子種群數(shù)為3,ξ1、ξ2和ξ3為[0,1]區(qū)間內(nèi)均勻分布的隨機數(shù);慣性權(quán)重ω取值區(qū)間為[0.4,0.9];學習因子 c1=1.5,c2=0.2,c3=0.5;xmin=-10,xmax=10;vmax=8;樣本學習中止條件:①MSE<0.001;②最大迭代數(shù)為5000。
本文通過5重交叉驗證的方法來驗證所構(gòu)建的混沌小生境粒子群模糊神經(jīng)網(wǎng)絡(luò)(CNEPSO-FNN)的有效性,具體結(jié)果見表1。
表1 CNEPSO-FNN模型交叉驗證結(jié)果
表1中,0代表信用好的公司,1代表信用差的公司。0-0表示正確區(qū)分出信用好的公司的準確率或樣本數(shù),1-1表示正確區(qū)分出信用差的公司的準確率或樣本數(shù)。從表1可看出,模型對5組平均分類準確率分別達到93.33%、95.00%、93.33%、93.33%和91.67%,對整個樣本的平均分類準確率達到了93.33%,效果相當不錯。
作為對比,本文在構(gòu)建CNEPSO-FNN模型同時,還另外分別構(gòu)建BPNN和SPSO-FNN(采用標準PSO算法優(yōu)化模糊神經(jīng)網(wǎng)絡(luò))兩種模型。表2給出了這三種模型對總體樣本預(yù)測準確率的對比結(jié)果。
表2 三種模型的測試對比結(jié)果
與表1一樣,表2中0-0表示正確區(qū)分出信用好的公司的準確率或樣本數(shù),1-1表示正確區(qū)分出信用差的公司的準確率或樣本數(shù)。正如表2所示,BPNN和SPSO-FNN模型在300個樣本中預(yù)測正確的樣本數(shù)分別為228和251,預(yù)測準確率分別為76.00%和83.67%,而CNEPSO-FNN模型預(yù)測準確的樣本數(shù)為280個,準確率達到了93.33%,遠高于前兩個模型,也說明構(gòu)建的CNEPSO-FNN模型的有效性和可靠性。
本文提出了一種改進的粒子群算法,即將混沌技術(shù)、小生境技術(shù)與粒子群算法結(jié)合構(gòu)建了混沌小生境進化粒子群優(yōu)化算法。首先利用混沌遍歷性特點,采用混沌迭代初始化粒子的位置和速度,接著在一般小生境技術(shù)的基礎(chǔ)上,為了避免小生境的相互重疊,采取了淘汰策略對距離太近的小生境進行淘汰,通過淘汰策略使得過于接近以至重疊的小生境重新分化與組合,以便各個小生境保持獨立的搜索空間。通過這種改進,改善了種群的多樣性,提高了算法的全局尋優(yōu)能力。將這種改進的粒子群算法與模糊神經(jīng)網(wǎng)絡(luò)模型相融合,構(gòu)建了改進的粒子群模糊神經(jīng)網(wǎng)絡(luò)——混沌小生境粒子群模糊神經(jīng)網(wǎng)絡(luò),并利用中國上市公司數(shù)據(jù),進行了信用評估預(yù)測,實證檢驗結(jié)果也表明了該評估模型的有效性和可靠性,該研究成果也為探索符合我國實際的信用評估技術(shù)方法提供了一些參考和借鑒。