摘要:本文以2013江蘇統(tǒng)計(jì)年鑒中的市縣經(jīng)濟(jì)發(fā)展各項(xiàng)指標(biāo)為依據(jù),收集整理了十個(gè)能夠反映國(guó)民經(jīng)濟(jì)發(fā)展的指標(biāo),利用多元統(tǒng)計(jì)聚類分析法中的離差平方和法和多維標(biāo)度法得出江蘇各城市經(jīng)濟(jì)競(jìng)爭(zhēng)力的地域劃分。聚類分析的結(jié)論表明,根據(jù)江蘇各城市經(jīng)濟(jì)競(jìng)爭(zhēng)力的聚類分析所得出的地域劃分結(jié)論,和一般意義上我們認(rèn)為的江蘇經(jīng)濟(jì)發(fā)展的地域劃分,即蘇南、蘇中和蘇北的地域劃分大體上是吻合的。由兩種聚類法作出的聚類分析譜系圖和多維標(biāo)度圖可以大致了解各地區(qū)經(jīng)濟(jì)競(jìng)爭(zhēng)力的水平。
關(guān)鍵詞:聚類分析 Ward法 多維標(biāo)度法
一、引言
按照傳統(tǒng)的江蘇經(jīng)濟(jì)發(fā)展的地域劃分方法,一般可以分為蘇南、蘇中和蘇北三個(gè)主要區(qū)域,由于長(zhǎng)期以來(lái)經(jīng)濟(jì)基礎(chǔ)、交通運(yùn)輸、政府投入等方面存在差異,三個(gè)地域的經(jīng)濟(jì)發(fā)展?fàn)顩r有一定的差異,從而導(dǎo)致三個(gè)地域所在城市國(guó)民經(jīng)濟(jì)發(fā)展的相關(guān)數(shù)據(jù)指標(biāo)存在一定的差距。根據(jù)2013年江蘇統(tǒng)計(jì)年鑒中的有關(guān)數(shù)據(jù),本文以江蘇十三個(gè)地級(jí)市按國(guó)民經(jīng)濟(jì)發(fā)展的一些數(shù)據(jù)指標(biāo)為依據(jù),利用多元統(tǒng)計(jì)聚類分析法中的離差平方和法(WARD)和多維標(biāo)度法(MDS),對(duì)江蘇各城市的經(jīng)濟(jì)競(jìng)爭(zhēng)力水平的差異情況作出一個(gè)地域劃分,以驗(yàn)證江蘇各城市的經(jīng)濟(jì)競(jìng)爭(zhēng)力水平是否符合我們一般意義上認(rèn)為的地域劃分:即蘇南、蘇中和蘇北的地域劃分。
二、基本分析思路
(一)兩種分析方法的原理
離差平方和法(WARD)屬于一種常用的系統(tǒng)聚類的分析方法,其基本思想是先將多個(gè)樣品各自看成一類,然后規(guī)定類與類之間的距離,選擇距離最小的一對(duì)合并成新的一類,計(jì)算新類與其他類的距離,再將距離最近的兩類合并,這樣每次減少一類,直至所有的樣品都成為一類為止。[1]
多維標(biāo)度分析(MDS)則是另外一種聚類分析方法,它是以空間分布的形式表現(xiàn)對(duì)象之間相似性或親疏關(guān)系的一種多元數(shù)據(jù)分析方法。其主要結(jié)果可以用多維標(biāo)度圖形象直觀的表示出來(lái)。
多維標(biāo)度法的計(jì)算實(shí)現(xiàn)步驟主要包括以下幾步: 首先確定研究目的,選擇需要進(jìn)行比較分析的樣品和變量,然后計(jì)算樣品間的距離矩陣并分析樣品間的距離矩陣;選擇適當(dāng)?shù)木S數(shù),得到距離陣的古典解,將各個(gè)樣品直觀的表現(xiàn)出來(lái)并對(duì)結(jié)果進(jìn)行解釋,最后再驗(yàn)證模型的擬合效果。[2]通常要通過(guò)兩步來(lái)完成:首先,構(gòu)造一個(gè)f 維坐標(biāo)空間,并用該空間中的點(diǎn)分別表示各樣品, 此時(shí)點(diǎn)間的距離未必和原始輸入次序相同,通常把這一步稱為構(gòu)造初步圖形結(jié)構(gòu);其次,逐步修改初步圖形結(jié)構(gòu),以得到一個(gè)新圖形結(jié)構(gòu),使得在新結(jié)構(gòu)中,各樣品的點(diǎn)間距離次序和原始輸入次序盡量一致。[3]
(二)兩種分析方法的優(yōu)缺點(diǎn)
本研究中所使用的兩種分析方法中,離差平方和法(Ward)能夠比較清晰直觀地用譜系圖的形式表示出結(jié)果,但難以得到結(jié)果之間的差異。而多維標(biāo)度法(MDS)不僅能夠在圖中直觀地表示出結(jié)果,而且能夠得出維度上的坐標(biāo)值,從坐標(biāo)值能夠得出各分析對(duì)象之間的距離。但多維標(biāo)度法選用的維度不宜過(guò)多,最多用二維或者三維的空間分布圖表示,如果維數(shù)過(guò)多,將很難在圖中表示出來(lái)。綜合以上兩種方法進(jìn)行研究和分析,能夠更好地得到最終的分析結(jié)論。
三、實(shí)證分析過(guò)程
(一)指標(biāo)體系的選擇
為了對(duì)江蘇十三個(gè)地級(jí)市的經(jīng)濟(jì)競(jìng)爭(zhēng)力進(jìn)行分析評(píng)價(jià),對(duì)于聚類分析統(tǒng)計(jì)指標(biāo)的選擇,以2013年江蘇統(tǒng)計(jì)年鑒中的市縣經(jīng)濟(jì)發(fā)展指標(biāo)為標(biāo)準(zhǔn),收集了十個(gè)能夠反映國(guó)民經(jīng)濟(jì)發(fā)展的相關(guān)指標(biāo)。[4]在作具體分析時(shí),可分別用x1、x2、x3、x4、x5、x6等變量名表示,各項(xiàng)指標(biāo)如下:
X1——人均地區(qū)生產(chǎn)總值:按各地區(qū)常住人口計(jì)算人均數(shù)值,因各地區(qū)人口基數(shù)不一樣,人均指標(biāo)更加能夠反映經(jīng)濟(jì)競(jìng)爭(zhēng)力。
X2——第三產(chǎn)業(yè)占GDP的比重:第三產(chǎn)業(yè)屬于新興產(chǎn)業(yè),對(duì)經(jīng)濟(jì)的可持續(xù)發(fā)展有著重要的作用。
X3——公共財(cái)政預(yù)算收入占GDP的比重:公共財(cái)政預(yù)算收入高占GDP比重高,表明政府在保障和改善民生、維持國(guó)家行政職能正常運(yùn)轉(zhuǎn)、保障國(guó)家安全等方面投入更多。
X4——外貿(mào)依存度:即進(jìn)出口總額、出口額或進(jìn)口額與國(guó)民生產(chǎn)總值或國(guó)內(nèi)生產(chǎn)總值之比,是開(kāi)放度的評(píng)估與衡量指標(biāo)。
X5——城鎮(zhèn)非私營(yíng)單位在崗職工年平均工資:在崗職工的年平均工資是一項(xiàng)反映經(jīng)濟(jì)競(jìng)爭(zhēng)力的重要指標(biāo)。
X6——城鎮(zhèn)居民人均可支配收入:指反映居民家庭全部現(xiàn)金收入能用于安排家庭日常生活的那部分收入。它是家庭總收入扣除交納的所得稅、個(gè)人交納的社會(huì)保障費(fèi)以及調(diào)查戶的記賬補(bǔ)貼后的收入。
X7——城鎮(zhèn)居民人均生活消費(fèi)支出:通過(guò)居民平均每人全年消費(fèi)支出指標(biāo)來(lái)綜合反映城鎮(zhèn)居民生活消費(fèi)水平。
X8——城鎮(zhèn)居民恩格爾系數(shù):是食品支出總額占個(gè)人消費(fèi)支出總額的比重。系數(shù)低表明更加富裕。
X9——城鎮(zhèn)居民人均住房建筑面積:是指按居住人口計(jì)算的平均每人擁有的住宅建筑面積。
X10——人均居民儲(chǔ)蓄存款:年末人均儲(chǔ)蓄存款余額。
(二)實(shí)證分析
由于本研究中所使用的兩種分析方法的原理和計(jì)算過(guò)程較為復(fù)雜,如用手工計(jì)算,其計(jì)算過(guò)程將會(huì)十分繁瑣。為了便于研究的進(jìn)行,采用數(shù)據(jù)分析軟件R語(yǔ)言進(jìn)行研究和分析。
使用離差平方和法(WARD)進(jìn)行聚類分析時(shí),首先需要確定聚類過(guò)程中類的個(gè)數(shù)。Bemirmen(1972年)提出了應(yīng)根據(jù)研究目的來(lái)確定適當(dāng)?shù)姆诸惙椒?,并提出了一些根?jù)聚類圖來(lái)分析的準(zhǔn)則[5]。在這里為了驗(yàn)證江蘇傳統(tǒng)經(jīng)濟(jì)地域的劃分,即一般意義上蘇南、蘇中和蘇北區(qū)域的劃分,把類的個(gè)數(shù)也確定為三個(gè),這樣便于驗(yàn)證江蘇十三個(gè)地級(jí)市根據(jù)國(guó)民經(jīng)濟(jì)發(fā)展的指標(biāo)所統(tǒng)計(jì)出的競(jìng)爭(zhēng)力水平是否也符合蘇南、蘇中和蘇北的地域劃分。在R中根據(jù)聚類分析的譜系圖顯示,南京、蘇州、無(wú)錫和常州被劃歸為一類,南通、鎮(zhèn)江、揚(yáng)州和泰州被劃歸為一類,剩余的城市被劃歸為另外一類,如圖1中左圖所示。
在進(jìn)行多維標(biāo)度(MDS)分析時(shí),將研究數(shù)據(jù)轉(zhuǎn)換為距離數(shù)據(jù)后,生成兩種相互聯(lián)系的結(jié)果——對(duì)象的空間分布圖與對(duì)象在各維度上的解為坐標(biāo)值。前者以后者為基礎(chǔ)。依據(jù)空間分布圖進(jìn)行聚類發(fā)生困難或可能產(chǎn)生偏差時(shí),就需要運(yùn)用研究對(duì)象在各維度上的坐標(biāo)值進(jìn)行聚類分析[6]。本文在維數(shù)中選擇了二維,因?yàn)槎S平面圖能夠比較直觀的表示出各地區(qū)的位置,在R語(yǔ)言中根據(jù)二維坐標(biāo)值繪制出江蘇十三市經(jīng)濟(jì)競(jìng)爭(zhēng)力的二維標(biāo)度圖,結(jié)果顯示無(wú)錫和蘇州在圖中的坐標(biāo)值位置很近,并且和其他地區(qū)的差異非常大,可以劃歸為一類;南京和常州的坐標(biāo)值位置相近,可以劃歸為一類;鎮(zhèn)江和南通的坐標(biāo)值數(shù)據(jù)所反映出的經(jīng)濟(jì)競(jìng)爭(zhēng)力處于上升的勢(shì)頭;揚(yáng)州和泰州的坐標(biāo)值很近,大致反映了兩市的經(jīng)濟(jì)競(jìng)爭(zhēng)力水平相似;徐州、鹽城、連云港、淮安和宿遷屬于最后的一類,它們?cè)趫D中的坐標(biāo)值數(shù)據(jù)相近,如圖1中右圖所示。
四、分析結(jié)論
無(wú)論是采用系統(tǒng)聚類分析中的離差平方和法,還是采用多維標(biāo)度法,對(duì)江蘇十三市經(jīng)濟(jì)競(jìng)爭(zhēng)力的聚類分析的結(jié)果大致是相同的,綜合考慮離差平方和法和多維標(biāo)度法得出的結(jié)論,根據(jù)譜系圖和二維標(biāo)度圖得出三類地域劃分如表1所示。從表1可以看出,江蘇十三個(gè)地級(jí)市按國(guó)民經(jīng)濟(jì)發(fā)展的指標(biāo)統(tǒng)計(jì)出競(jìng)爭(zhēng)力水平的系統(tǒng)聚類分析的結(jié)論,和一般意義上我們認(rèn)為的江蘇經(jīng)濟(jì)發(fā)展的地域劃分,即蘇南、蘇中和蘇北的地域劃分大體上是吻合的。由離差平方和法(WARD)和多維標(biāo)度法(MDS)作出的聚類分析譜系圖和多維標(biāo)度圖可以大致了解各地區(qū)經(jīng)濟(jì)競(jìng)爭(zhēng)力的水平?!?/p>
參考文獻(xiàn):
[1]湯銀才.R語(yǔ)言與統(tǒng)計(jì)分析[M].北京:高等教育出版社,2005
[2]王斌會(huì).多元統(tǒng)計(jì)分析及R語(yǔ)言建模[M].廣州:暨南大學(xué)出版社,2011
[3]張文彤,董偉.SPSS 統(tǒng)計(jì)分析高級(jí)教程[M].北京:高等教育出版社,2004
[4]江蘇省統(tǒng)計(jì)局.江蘇統(tǒng)計(jì)年鑒[R].北京:中國(guó)統(tǒng)計(jì)出版社,2013
[5]任雪松,于秀林.多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2011
[6]揭水平.多維標(biāo)度法的聚類分析:?jiǎn)栴}與解法[J].統(tǒng)計(jì)與決策,2009(11)
(尹楠,1982年生,江蘇鎮(zhèn)江人,南京曉莊學(xué)院商學(xué)院講師。研究方向:企業(yè)信息化)