盧榮偉
[摘 要]文章選取地區(qū)生產(chǎn)總值等8項反映經(jīng)濟狀況的指標為評價指標體系,利用多元統(tǒng)計分析中的因子分析和聚類分析,對桂林市16區(qū)縣2015年的經(jīng)濟發(fā)展狀況進行綜合比較和評價。通過因子分析得出桂林市各區(qū)縣經(jīng)濟發(fā)展水平的綜合排名,說明各地區(qū)經(jīng)濟發(fā)展存在比較明顯的差異。通過對16區(qū)縣進行聚類,進一步分析各地區(qū)經(jīng)濟發(fā)展存在差異的原因。這既為各區(qū)縣制訂符合本地區(qū)利益的發(fā)展計劃提供理論依據(jù),又為桂林市政府進行重點幫扶提供參考。
[關鍵詞]因子分析;聚類分析;經(jīng)濟評價;桂林市
[DOI]10.13939/j.cnki.zgsc.2017.32.038
1 引 言
隨著西部大開發(fā)的深入推進以及“一帶一路”倡議布局的實施,廣西各個地市迎來了前所未有的發(fā)展機遇。桂林市是廣西的桂北經(jīng)濟區(qū)中心,更應抓住此次發(fā)展機遇,讓桂林的經(jīng)濟騰飛。本文利用多元統(tǒng)計分析中的因子分析和聚類分析,對桂林市13個區(qū)縣2015年的經(jīng)濟指標數(shù)據(jù)進行挖掘處理,得出桂林市各個區(qū)縣經(jīng)濟發(fā)展狀況及存在的差異后結合實際分析其原因。
2 相關多元統(tǒng)計分析原理
因子分析(FactorAnalysis)是由CharlesSpearman于1904年首次提出的。與主成分分析類似,它們都是要找出少數(shù)幾個新的變量來代替原始變量。不同之處是主成分分析中的主成分個數(shù)與原始變量個數(shù)是一樣的,即有幾個變量就有幾個主成分,只不過最后我們確定了少數(shù)幾個主成分而已。而因子分析則需要事先確定要找?guī)讉€成分,也成為因子(factor),然后將原始變量綜合為少數(shù)的幾個因子,以再現(xiàn)原始變量與因子之間的關系。[1]
聚類分析是根據(jù)對象之間的“相似”程度將對象進行分類。這里的“相似”是指對象之間關系或距離的遠近。在聚類分析中,根據(jù)樣本觀測數(shù)據(jù)測度變量之間的相似性可以使用夾角余弦、Pearson相關系數(shù)等工具,也稱為相似系數(shù)。變量間的相似系數(shù)越大,說明它們越相近。[2]根據(jù)變量來測度樣本之間的相似程度則使用距離。分類時把距離得比較近的歸為一類,而離得比較遠的放在不同的類。
3 指標體系及數(shù)據(jù)
本文的數(shù)據(jù)來源于2016年廣西統(tǒng)計年鑒,從中筆者獲取了桂林市2015年各個區(qū)縣的經(jīng)濟指標數(shù)據(jù)。本文綜合相關學者的研究成果,在選取指標時遵循全面性和相關性的原則,選擇了能反映經(jīng)濟綜合發(fā)展狀況的8項指標作為評價指標體系。[3]所選取的8項指標如表1所示。
4 數(shù)據(jù)分析過程及經(jīng)濟綜合評價
4.1 因子分析過程
運用SPSS13.0forWindows軟件對表3中的數(shù)據(jù)進行處理。首先對數(shù)據(jù)進行KMO和球形Bartlett檢驗,得到KMO統(tǒng)計量的值為0.676,Bartlett檢驗的P值小于0.01的顯著水平,說明各個變量間的信息重疊程度較高,適合做因子分析。然后運用主成分法對高維數(shù)據(jù)降維處理,根據(jù)特征根大于1的原則提取主因子。選取的主因子的累計貢獻率達到了84.8%,說明兩個主因子已經(jīng)能較好地解釋原始變量的信息。最后,根據(jù)式(1)計算各區(qū)縣的兩個主因子得分,根據(jù)式(2)計算各區(qū)縣的綜合得分。計算結果如表2所示。
4.2 聚類分析過程
根據(jù)各區(qū)縣在兩個主因子上的得分,利用系統(tǒng)聚類法及平方歐氏距離對桂林市16個區(qū)縣進行分類,[4]結合各區(qū)縣的綜合排名,將16個區(qū)縣分為4類的結果,見表3所示。
5 結 論
本文將多元統(tǒng)計分析中的因子分析和聚類分析結合,運用于桂林市16個區(qū)縣經(jīng)濟發(fā)展的綜合評價,為桂林市的經(jīng)濟發(fā)展綜合評價建立了一個依據(jù)經(jīng)濟數(shù)據(jù)的客觀評價機制。首先,通過因子分析得到桂林市16區(qū)縣的經(jīng)濟發(fā)展綜合排名為:象山區(qū)>臨桂區(qū)>七星區(qū)>疊彩區(qū)>興安縣>靈川縣>陽朔縣>荔浦縣>全州縣>永??h>平樂縣>恭城縣>雁山區(qū)>龍勝縣>資源縣>灌陽縣。然后,結合因子分析的結果,利用聚類分析將16區(qū)縣分成4類:第一類為疊彩區(qū)、象山區(qū)、七星區(qū),這三個地區(qū)為桂林市區(qū)的核心區(qū)域,人口密集,經(jīng)濟相對較為繁華。第二類為臨桂區(qū),近年來,隨著桂林市區(qū)的擴大發(fā)展,臨桂縣地廣而平坦并且靠近桂林市區(qū),已經(jīng)被納為桂林的新區(qū),桂林市區(qū)的發(fā)展中心正往臨桂轉移,臨桂區(qū)的經(jīng)濟有很大的發(fā)展?jié)摿?,因此,臨桂區(qū)的經(jīng)濟綜合水平相對良好。第三類為陽朔縣、靈川縣、興安縣、荔浦縣,這四個縣中,陽朔縣和興安縣是旅游名縣,靈川縣地鄰桂林市區(qū),荔浦縣地廣且農產(chǎn)品豐富,因此這四個縣相對于其他縣更有優(yōu)勢,經(jīng)濟發(fā)展水平比其他幾個縣要好一些。第四類為雁山區(qū)、全州縣、永福縣、灌陽縣、龍勝縣、資源縣、平樂縣、恭城縣,這8個地區(qū)經(jīng)濟發(fā)展相對落后,但也各自有自己的地理文化資源優(yōu)勢,這需要更深層次地發(fā)掘和利用各個地區(qū)的優(yōu)勢,使桂林市的經(jīng)濟得到全面高效發(fā)展。
參考文獻:
[1]賈俊平.統(tǒng)計學[M].北京:中國人民大學出版社,2008.
[2]楊善朝,張軍艦.SPSS統(tǒng)計軟件應用基礎[M].桂林:廣西師范大學出版社,2010.
[3]夏國恩,蘭政海.基于因子分析的廣西區(qū)各城市綜合經(jīng)濟實力評價[J].特區(qū)濟,2009(12):211-213.
[4]張朝元,陳麗,吳琢了,基于主成分聚類分析的大理州經(jīng)濟發(fā)展綜合評價[J].安徽農業(yè)科學,2012,40(10):5727-5729.endprint