陳 侃 馬松林
(巢湖學(xué)院數(shù)學(xué)系,安徽 巢湖 238000)
基于主成分分析的安徽省各地區(qū)綜合評價探討
陳 侃 馬松林
(巢湖學(xué)院數(shù)學(xué)系,安徽 巢湖 238000)
全面科學(xué)的分析地區(qū)綜合經(jīng)濟(jì)實(shí)力是合理制定地區(qū)發(fā)展政策和促進(jìn)地區(qū)經(jīng)濟(jì)協(xié)調(diào)發(fā)展的基礎(chǔ).本文構(gòu)建測度地區(qū)綜合經(jīng)濟(jì)實(shí)力的指標(biāo)體系,并運(yùn)用主成分和系統(tǒng)聚類法分析了安徽省各地區(qū)綜合經(jīng)濟(jì)實(shí)力,為科學(xué)制定地區(qū)發(fā)展政策提供了理論支撐.
綜合評價;主成分分析;系統(tǒng)聚類;累積貢獻(xiàn)率
安徽作為華東地區(qū)的重要組成部分,經(jīng)濟(jì)一直保持著持續(xù)、快速的發(fā)展勢頭,經(jīng)濟(jì)實(shí)力顯著增強(qiáng),人民生活水平明顯提高,但各地區(qū)間經(jīng)濟(jì)發(fā)展的不平衡性也進(jìn)一步加大,如何準(zhǔn)確地為安徽省各地市的經(jīng)濟(jì)發(fā)展程度定位,也是一個關(guān)系到安徽省實(shí)施經(jīng)濟(jì)發(fā)展戰(zhàn)略的重要問題.本文運(yùn)用多元統(tǒng)計中的主成分分析法對全省各個地市的綜合經(jīng)濟(jì)實(shí)力進(jìn)行分析評價,系統(tǒng)、客觀地反映出安徽省地區(qū)間經(jīng)濟(jì)實(shí)力的差距,希望能為促進(jìn)地區(qū)間的優(yōu)勢互補(bǔ)和良性競爭,為全面協(xié)調(diào)發(fā)展和提升安徽省綜合經(jīng)濟(jì)實(shí)力,可以縮小地域差距,促進(jìn)安徽經(jīng)濟(jì)社會全面協(xié)調(diào)可持續(xù)發(fā)展.
地區(qū)綜合經(jīng)濟(jì)實(shí)力是一個具有多角度、多層次、系統(tǒng)性的概念,隨著社會經(jīng)濟(jì)的發(fā)展也在不斷發(fā)展和完善,評價一個地區(qū)綜合經(jīng)濟(jì)實(shí)力的強(qiáng)弱需要通過多個指標(biāo)的綜合分析和比較,因此,挑選的指標(biāo)必須要全面反映所研究對象的主要特征,具有一定的評價和解釋功能,同時指標(biāo)數(shù)據(jù)要從可信度大的機(jī)構(gòu)或權(quán)威性刊物上獲得.基于以上分析,本文根據(jù)相關(guān)文獻(xiàn)選取了反映地區(qū)經(jīng)濟(jì)發(fā)展水平、對外貿(mào)易水平、人民生活水平等情況共8個指標(biāo),構(gòu)成評價綜合經(jīng)濟(jì)實(shí)力的指標(biāo)體系,見表1.
表1 綜合經(jīng)濟(jì)實(shí)力指標(biāo)體系
本文利用多元統(tǒng)計分析中主成分分析方法和聚類分析法把以上多個錯綜復(fù)雜的指標(biāo)糅合成幾個正交的指標(biāo),再通過客觀賦權(quán)計算綜合得分,把各個地區(qū)分類加以分析.
2.1主成分分析的基本思想:是將彼此相關(guān)的一組指標(biāo)變量轉(zhuǎn)化為彼此獨(dú)立的一組新指標(biāo)變量,并且其中較少的幾個新指標(biāo)變量就能綜合反映原來多個指標(biāo)變量中所包含的主要信息,又各自帶有獨(dú)特的專業(yè)含義.它是一種數(shù)學(xué)變換方法,即把給定的一組變量通過線性變換,轉(zhuǎn)換一組不相關(guān)的變量(兩兩相關(guān)系數(shù)為0),在這種變換中,保持變量的總方差-方差之和不變,同時具有最大方差,稱為第一主成分;具有第二方差,稱為第二主成分,依次類推.
2.2 主成分分析基本步驟:
2.2.1 原始數(shù)據(jù)處理
根據(jù)指標(biāo)屬性需要正向化處理,設(shè)原始變量指標(biāo) x1,x2,…,xi,…,xp的樣本觀察矩陣為 X,
2.2.2 建立變量的相關(guān)系數(shù)矩陣
假定標(biāo)準(zhǔn)化后的矩陣仍設(shè)X,求X的相關(guān)陣R=XTX, 求矩陣 R 的特征值 λ1≥λ2≥…≥λp≥0和單位正交化的特征向量 V=(V1,V2,…,Vp),令F=VTX=(F1,…,F(xiàn)i,…,F(xiàn)p),稱 F 為主因子矩陣,F(xiàn)i=VTXa(1,…,p)為 i個樣本主因子觀測值.
2.2.3 確定主因子的個數(shù)m,建立因子模型,一般選取使得,這m個主因子將矩陣 V 分解為由 F=VTX 可得,X=VF=V(1)F(1)+V(2)F(2),其中V(1)F(1)為 m 個主因子所能解釋的部分,V(2)F(2)為含信息很少的殘余部分,設(shè)為ξ,這時有X=V(1)F(1)+ξ,上式稱為因子模型,V(1)稱為因子載荷陣,V(1)稱為主因子.
2.2.4 為了對主因子的實(shí)際意義有明確的分析和解釋,可對因子載荷陣V(1)進(jìn)行最大方差正交旋轉(zhuǎn)或斜交旋轉(zhuǎn).
系統(tǒng)聚類方法是實(shí)踐應(yīng)用中最為廣泛的一種聚類方法,它的基本方法是首先按照被評價的評價指標(biāo)體系特征,分別確定樣本(點(diǎn))距離和類間距離,然后按照以下步驟進(jìn)行分類.
(1)將被評價的n個個體看成n個類,這時類間距離與樣本間距離是相等的;
(2)按照預(yù)先確定的類間距離作為不相似性度量,并求出最小類間距離;
(3)將最小距離的兩類并為一類,并求出新類與其余類之間的距離,并選出最小類間距離;
(4)重復(fù)(3)步驟,直至所有類歸為一類;
(5)在所取類距離意義下,畫出按相似或相近程度的譜系圖;
(6)按綜合評價的精度要求,選出閾值,確定聚類結(jié)果并給出綜合評價的結(jié)果;
本文在聚類過程中,選用歐氏距離來度量類與類之間的相似程度,聚類方法采用最小距離法.
4.1本文選用2010年安徽省統(tǒng)計局公布的各指標(biāo)的有關(guān)數(shù)據(jù)資料,對安徽省16個地市綜合經(jīng)濟(jì)實(shí)力進(jìn)行對比分析.首先對原始數(shù)據(jù)正向化處理,計算8個指標(biāo)的無量綱數(shù)據(jù)相關(guān)系數(shù)矩陣(見表 2).
表2 指標(biāo)間相關(guān)系數(shù)矩陣
從上表可以看出,指標(biāo)間相關(guān)性較大,經(jīng)KMO和Bartlett’s檢驗(yàn)證明可以進(jìn)行因子分析.
4.2 利用主成份分析綜合評價
對選取的8個指標(biāo),采用因子分析中的主成分分析法對相關(guān)系數(shù)矩陣進(jìn)行初始因子求解,確定公因子數(shù).得相關(guān)矩陣R的特征值、方差貢獻(xiàn)率和累計方差貢獻(xiàn)率(見表3).利用軟件對量化后的8個指標(biāo)進(jìn)行處理,得到8個主成分Zi(i=1,2,…,8).從表3可以看出,從第2個主成分起,已含原始數(shù)據(jù)的信息總量的94.44%,因此我們確定主成分個數(shù)為2個,且主成分具有典型經(jīng)濟(jì)意義,Z1在各項(xiàng)指標(biāo)上的載荷值均為正且相差不大,反映了地區(qū)經(jīng)濟(jì)綜合實(shí)力,在此主成分上的得分越高,表明該地區(qū)的綜合經(jīng)濟(jì)實(shí)力越強(qiáng);主因子Z2在指標(biāo)x4、x5和x6上的載荷值較大,這三個指標(biāo),反映了地區(qū)人民生活水平,這2個主成分較好的總括了原來的8項(xiàng)指標(biāo)。用特征值歸一化后作為權(quán)值進(jìn)行多指標(biāo)綜合:綜合指標(biāo)將主成份表達(dá)式代入,綜合指標(biāo)的表達(dá)式:
表3 各指標(biāo)的主成分、方差貢獻(xiàn)率以及累計方差貢獻(xiàn)率
利用綜合指標(biāo)算出安徽省16個市的綜合得分,見表4。
表4 安徽省各地區(qū)綜合得分表
銅陵 0.15968蚌埠 0.12829黃山 -0.0876宣城 -0.0979滁州 -0.1404安慶 -0.1655六安 -0.291毫州 -0.3444宿州 -0.4036池州 -0.4279阜陽 -0.5369
從表4的綜合分析來看,明顯發(fā)現(xiàn)合肥作為安徽省省會城市,是全省政治、經(jīng)濟(jì)、文化、信息、金融和商貿(mào)中心,全國重要的科研教育基地,擁有比相鄰城市更加優(yōu)越獨(dú)到的區(qū)位資源優(yōu)勢,因此在綜合得分方面遠(yuǎn)遠(yuǎn)超過了其它的城市.蕪湖、馬鞍山、淮南、淮北及銅陵名列安徽省前茅,它們由于自身發(fā)達(dá)的工業(yè)帶動著社會快速進(jìn)步,正在加速前進(jìn)著.安徽省的其它城市的綜合發(fā)展水平要遠(yuǎn)遠(yuǎn)低于前面這幾個城市,關(guān)鍵還是區(qū)位優(yōu)勢不明顯,政策支持力度不夠.工業(yè)增長不夠強(qiáng)勁.經(jīng)濟(jì)、政治、文化等方面要明顯落后于前面幾座城市.
筆者認(rèn)為要想縮小安徽各個地區(qū)經(jīng)濟(jì)發(fā)展差距,應(yīng)著眼于加快在經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)推進(jìn)重大基礎(chǔ)設(shè)施建設(shè),打通制約其發(fā)展瓶頸硬件與軟件問題,并根據(jù)其區(qū)域特點(diǎn)切實(shí)加強(qiáng)產(chǎn)業(yè)布局的調(diào)整,走新型工業(yè)化道路;合馬蕪等經(jīng)濟(jì)較發(fā)達(dá)地區(qū)在經(jīng)濟(jì)儲備充裕的優(yōu)勢條件下,加快從傳統(tǒng)工業(yè)產(chǎn)業(yè)向信息、服務(wù)外包、高科技科技產(chǎn)業(yè)轉(zhuǎn)型,注重生態(tài)建設(shè)與環(huán)境保護(hù)的同時能在政策上給經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)幫助.這樣有利于實(shí)施全省發(fā)展總體戰(zhàn)略,通過加快安徽省各地區(qū)的經(jīng)濟(jì)發(fā)展,協(xié)調(diào)地區(qū)布局,提升了全省整體發(fā)展水平.
[1]林震巖.多變量分析——SPSS的操作與應(yīng)用[M].北京:北京大學(xué)出版社,2007.
[2]余建英,何旭宏.數(shù)據(jù)統(tǒng)計分析與SPSS應(yīng)用[M].北京:人民郵電出版社,2003.
[3]劉學(xué)家,陳世國.基于主成分分析的投資決策[J].運(yùn)籌與管理.2006,(2).
[4]雷欽禮.經(jīng)濟(jì)管理多元統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,2002.
[5]韓娟.因子分析在評價綜合中心城市發(fā)展水平上的應(yīng)用[J].北京統(tǒng)計,1998,(8).
[6]田曉文.中國地區(qū)經(jīng)濟(jì)差距變化的三大趨勢及其成因初探[R].北京大學(xué)中國經(jīng)濟(jì)研究中心討論稿系列.No.C1999017,1999-8.
0213
A
1672-2868(2011)06-0014-04
2011-09-26
巢湖學(xué)院院級自然科學(xué)研究資助項(xiàng)目(項(xiàng)目編號:XLZ-201005)
陳侃(1985-),男,安徽巢湖人。巢湖學(xué)院數(shù)學(xué)系教師,研究方向:多元統(tǒng)計
責(zé)任編輯:陳 鳳