金明+寇莉+俞高
摘 要:Bootstrap方法是一種利用樣本信息來估計總體的非參方法,聚類分析方法是將樣本或變量進行歸類評價的一種多元統(tǒng)計方法。基于bootstrap抽樣法和系統(tǒng)聚類技術對我國部分商業(yè)銀行的資產(chǎn)負債況進行分析,聚類結果將各個商業(yè)銀行的資產(chǎn)負債情況分為3類。
關鍵詞:bootstrap;聚類分析;商業(yè)銀行;資產(chǎn)負債
中圖分類號:F83 文獻標識碼:A doi:10.19311/j.cnki.1672-3198.2016.33.104
1 引言
自Efron首次提出Bootstrap以來,在眾多統(tǒng)計學家貢獻下,bootstrap統(tǒng)計方法得到了充分的發(fā)展,尤其是在計算機技術發(fā)達的今天,bootstrap變得更加容易實現(xiàn)。就bootstrap方法的基本原理,Efron、Tibshirani、DiCiccio等曾作詳細的論述。國內學者對bootstrap的研究也取得一定的成績,施錫銓在上世紀九十年代論述過獨立同分布數(shù)據(jù)的bootstrap逼近方法。更多的國內學者是運用bootstrap方法做實證分析,如趙亮、程錦秀等把bootstrap運用到生物學研究上,孫佳美、段白鴿利用該方法做死亡模型檢驗的研究,劉勤、金丕煥推廣了bootstrap法在醫(yī)學統(tǒng)計上運用。
國內學者對商業(yè)銀行的研究主要集中于銀行的效率分析,如魏煜、張建華、姚樹潔、朱南、鄭錄軍等對此作有詳細的論述,詳見參考文獻。另外一些學者重點研究了我國商業(yè)銀行的信用風險的評估問題,沈沛龍、王春峰、唐國儲等在這個方面作出貢獻。后來的學者也在繼續(xù)關注著這些領域。涉及商業(yè)銀行收益研究的國內文獻并不多見,張鐵鑄曾從銀行貸款的多元化角度研究銀行風險、收益與之的關系;于研、孫磊運用SFA方法探索銀行收益結構與銀行效率的相關性;蒲勇健、李紹芳考察研究了金融衍生品對商業(yè)銀行收益的影響;王連則運用了非參數(shù)統(tǒng)計手段研究了信用卡的信用額度變化與銀行收益的關系;黃陳曾將我國商業(yè)銀行收益水平作國際比較并歸納出商業(yè)銀行收益的四個層次。銀行的收益水平是投資者關注的重要指標之一,而銀行資產(chǎn)負債情況正能反映銀行經(jīng)營狀況,所以繼續(xù)對此進行深入研究有著重要的現(xiàn)實意義。本文,筆者嘗試利用多元統(tǒng)計技術并借助bootstrap方法來剖析我國商業(yè)銀行的資產(chǎn)負債,分析各銀行經(jīng)營收益。
2 銀行資產(chǎn)負債評價方法
2.1 BOOTSTRAP
Bootstrap方法是一類非參數(shù)Monte Carlo方法,其基本思想是根據(jù)樣本的經(jīng)驗信息(分布),通過又放回的簡單隨機抽樣獲得B個bootstrap樣本,進而利用這些Bootstrap樣本信息進行統(tǒng)計推斷。其中Bootstrap樣本容量依然和原樣本一致,且觀測值被抽到的概率相等。當目標總體未指定的情況下,Bootstrap方法經(jīng)常被使用,此時樣本為唯一已有的信息。
Bootstrap方法的基本步驟為,假設x=(x1,x2,…,xn)為已知的一個樣本,來自未知分布F。X*為從x中隨機抽取的一個樣本,通過有放回的抽樣得到樣本X*1,…,X*n,顯然X*1,…,X*n服從{x1,…,xn}上的均勻分布,P(X*=xi)=1n,i=1,…,n。我們抽取簡單子樣本X*=(X*1,X*2,…,X*n),該樣本為一個Bootstrap子樣本。進行B次抽樣,就可以得到B個Bootstrap樣本。
另外,Bootstrap方法需借助計算機完成大量的模擬計算,通過足夠多的重復抽樣可以把樣本均值的Bootstrap分布找出來,進而進行統(tǒng)計推斷。
2.2 聚類分析
聚類分析思想是根據(jù)已知數(shù)據(jù),觀察各樣品或變量之間親疏關系的相似程度,依照某種準則,把一些相似程度較大的樣品或變量聚合為一類,把另外一些相似程度較大的樣品或變量聚合為另外一類,使同一類內差別較小,而類與類之間的差別較大,最終將觀察樣品或變量分為若干類。
聚類分析中需要進行相似性度量,通常用距離來衡量哪些樣本應該聚為一類。我們假設有n個樣本單位,每個樣本測有p個指標(變量),每個樣本都可以看成p維空間中的一點,n個樣本就是p維空間中的n個點,第i個樣本與第j個樣本之間的距離記為dij,聚類過程中,相距較近的點歸為一類,相距較遠的點歸為不同的類。其中dij滿足條件:
dij≥0對一切的i和j成立,且僅當i=j時dij=0;
dij=dij對一切的i和j成立;
dij≤dik+dkj對于一切的i和j成立。
聚類中常用的距離有明氏(Minkowski)距離,馬氏距離,具體的聚類的方法有系統(tǒng)聚類、模糊聚類、K均值聚類等等,其中系統(tǒng)聚類中常用的方法有最短距離法、最長距離法、中間距離法、重心法、離差平方和法等。綜合考慮到數(shù)據(jù)是跨時間的面板數(shù)據(jù),本文選用離差平方和法聚類。
3 實例分析
3.1 數(shù)據(jù)描述
商業(yè)銀行的收益情況可以由其資產(chǎn)負債表反映出來,考慮到數(shù)據(jù)的可得性,本文選取了包括五大國有商業(yè)銀行、中興(CITIC)、光大(CEB)、興業(yè)(IBC)、浦發(fā)(SHANG)、招商(CMB)、寧波商業(yè)銀行(NCB)、深發(fā)展(SHENG)、華夏(HXB)、民生銀行(CMBC)在內的14家銀行作為研究對象,選取了2002年至2008年間銀行的其他收入財產(chǎn)、總收入財產(chǎn)、固定資產(chǎn)、無收益資產(chǎn)、總資產(chǎn)、存款及短期資金、其他債券、其它免息財產(chǎn)、資產(chǎn)凈值、總負責及股東權益、資產(chǎn)負債平衡、壞賬準備金、流動性資產(chǎn)等13個指標考察各商業(yè)銀行的收益水平情況。為消除部分數(shù)據(jù)缺失造成的影響,筆者在原有數(shù)據(jù)基礎上采用Bootstrap方法,對原始數(shù)據(jù)進行重抽樣計算得到各商業(yè)銀行的13個指標的均值,簡記指標名依次為COL1-COL13,具體數(shù)據(jù)見圖1。
3.2 結果分析
我們采用和離差平方和法利用SAS軟件將14個商業(yè)銀行的資產(chǎn)負債結構進行聚類分析,最終將其分為三個類別。運行以下SAS語句可以得到聚類的樹狀圖以及分類結果。
proc cluster data=banks method=ward ccc pseudo;
var col1-col13;
id banks;
run;
proc tree horizontal ncl=3 out=out;/*out為分類結果輸出數(shù)據(jù)*/
id banks;
run;
聚類樹狀圖如圖2所示:
對比聚類結果,可以發(fā)現(xiàn)部分的指標有減少的趨勢。其中中國工商銀行大部分指標都高于其他商業(yè)銀行,一定程度說明了工行的優(yōu)勢地位。1類商業(yè)銀行較工行存在不小差距,需要完善其資產(chǎn)負債的合理性。本文基于Bootstrap-聚類分析對商業(yè)銀行的資產(chǎn)負債進行初步的分類,必須意識到各個商業(yè)銀行都在發(fā)展中,該分類不是一勞永逸的。在此分類基礎上,我們還可以進一步挖掘資產(chǎn)負債與銀行盈利能力、金融穩(wěn)定性等的關系。而且,隨著時間的發(fā)展,我們還可以引入時間序列分析方法,進行多指標時間序列聚類。
參考文獻
[1]Efron Bradley.Bootst rap methods : another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.
[2]Efron Bradley,Tibshirani Robert.An introduction to the bootstrap[M].New York:Chapman & Hall Ltd,1993.
[3]Thomas J.DiCiccio and Bradley Efron.Bootstrap Confidence Intervals[J].Statistical Science,1996,(11).
[4]施錫銓.獨立非同分布情況的光滑Bootstrap逼近[J].數(shù)學物理學報,1990,(10).
[5]趙亮,程錦秀.Bootstrap方法及其在生物學研究中的應用[J].四川動物,2010,(29).
[6]孫佳美,段白鴿.Bootstrap方法在死亡模型中的應用[J].統(tǒng)計研究,2010,(6).
[7]劉勤,金丕煥.Bootstrap方法及其在醫(yī)學統(tǒng)計中的應用[J].中華預防醫(yī)學雜志,1998,1(32):1.
[8]謝益輝,朱鈺.Bootstrap方法的歷史發(fā)展和前沿研究[J].統(tǒng)計與信息論壇,2008,(2):90-96.