周建新,付傳秀
(1.皖西學(xué)院 應(yīng)用文科實(shí)訓(xùn)中心; 2.皖西學(xué)院 金融與數(shù)學(xué)學(xué)院, 安徽 六安 237012)
GPCA和遺傳算法聚類(lèi)分析在中國(guó)區(qū)域經(jīng)濟(jì)綜合評(píng)價(jià)中的應(yīng)用
周建新1,付傳秀2
(1.皖西學(xué)院 應(yīng)用文科實(shí)訓(xùn)中心; 2.皖西學(xué)院 金融與數(shù)學(xué)學(xué)院, 安徽 六安 237012)
本文結(jié)合全局主成分分析(GPCA)和遺傳算法聚類(lèi)分析,對(duì)中國(guó) 31 個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展水平進(jìn)行綜合評(píng)價(jià).首先借助 GPCA 獲得經(jīng)濟(jì)水平全局主成分分值,對(duì)區(qū)域經(jīng)濟(jì)發(fā)展進(jìn)行縱向、橫向分析;然后在GPCA 基礎(chǔ)上,對(duì)區(qū)域經(jīng)濟(jì)發(fā)展水平做非線性映射的遺傳算法聚類(lèi)分析.仿真表明,綜合評(píng)價(jià)結(jié)果與客觀實(shí)際吻合度較高.
區(qū)域經(jīng)濟(jì);全局主成分分析;非線性映射;遺傳算法聚類(lèi)分析
改革開(kāi)放以來(lái),中國(guó)經(jīng)濟(jì)迅猛發(fā)展,綜合國(guó)力明顯提高.同時(shí),區(qū)域經(jīng)濟(jì)間的發(fā)展差距問(wèn)題隨之顯現(xiàn).按照科學(xué)發(fā)展觀的要求,統(tǒng)籌區(qū)域經(jīng)濟(jì)協(xié)調(diào)發(fā)展成為現(xiàn)代化建設(shè)中的一個(gè)重大戰(zhàn)略問(wèn)題.正確評(píng)價(jià)中國(guó)各地區(qū)的經(jīng)濟(jì)發(fā)展水平,可以為區(qū)域經(jīng)濟(jì)均衡發(fā)展提供理論指導(dǎo).
區(qū)域經(jīng)濟(jì)的發(fā)展是一個(gè)動(dòng)態(tài)過(guò)程,對(duì)其評(píng)價(jià)應(yīng)考慮時(shí)間因素.全局主成分分析(GPCA)在傳統(tǒng)主成分分析方法的基礎(chǔ)上,融入了時(shí)間序列的思想,適合從縱向、橫向兩方面評(píng)價(jià)中國(guó)各地區(qū)的經(jīng)濟(jì)發(fā)展水平.非線性映射的遺傳算法聚類(lèi)分析,是通過(guò)智能計(jì)算將眾多的評(píng)價(jià)指標(biāo)數(shù)據(jù)映射到二維空間,進(jìn)行聚類(lèi)分析,聚類(lèi)結(jié)果的顯示更為直觀.
本文利用 GPCA和遺傳算法聚類(lèi)分析,對(duì)中國(guó)31個(gè)地區(qū)連續(xù)兩年的經(jīng)濟(jì)發(fā)展水平進(jìn)行綜合評(píng)價(jià),得到一些有意義的結(jié)論,可以為區(qū)域經(jīng)濟(jì)、社會(huì)的統(tǒng)籌發(fā)展提供決策參考.
1.1 區(qū)域經(jīng)濟(jì)綜合評(píng)價(jià)指標(biāo)體系
區(qū)域經(jīng)濟(jì)的發(fā)展受政治、經(jīng)濟(jì)、文化、社會(huì)諸多因素影響,是一個(gè)復(fù)雜系統(tǒng).對(duì)其客觀評(píng)價(jià),需要合理構(gòu)建評(píng)價(jià)指標(biāo)體系.
表1 區(qū)域經(jīng)濟(jì)發(fā)展水平評(píng)價(jià)指標(biāo)體系
本文從經(jīng)濟(jì)規(guī)模、經(jīng)濟(jì)結(jié)構(gòu)、經(jīng)濟(jì)創(chuàng)新及可持續(xù)發(fā)展能力、社會(huì)發(fā)展水平等方面綜合衡量,選取反映區(qū)域經(jīng)濟(jì)發(fā)展水平的 20項(xiàng)評(píng)價(jià)指標(biāo),建立指標(biāo)體系如表1:
1.2 全局主成分分析(GPCA)
經(jīng)典主成分分析,是在樣本評(píng)價(jià)指標(biāo)組成的數(shù)據(jù)表基礎(chǔ)上進(jìn)行分析,無(wú)法實(shí)現(xiàn)不同時(shí)點(diǎn)樣本的評(píng)價(jià)對(duì)比.全局主成分分析,是融入了時(shí)間序列思想的主成分分析方法,它首先將不同時(shí)點(diǎn)的若干數(shù)據(jù)表按時(shí)間順序整合,得到一個(gè)全局?jǐn)?shù)據(jù)表,然后進(jìn)行經(jīng)典主成分分析.
區(qū)域經(jīng)濟(jì)的發(fā)展一般以年為時(shí)間跨度加以評(píng)價(jià)分析,評(píng)價(jià)指標(biāo)間具有數(shù)據(jù)相關(guān)性.通過(guò) GPCA進(jìn)行降維處理,保證了區(qū)域經(jīng)濟(jì)系統(tǒng)分析的整體性、統(tǒng)一性和可比性.
根據(jù)區(qū)域經(jīng)濟(jì)發(fā)展水平的評(píng)價(jià)指標(biāo) A1,A2,…,A20,選取中國(guó) 31個(gè)地區(qū)連續(xù) 2年的數(shù)據(jù),整合為全局?jǐn)?shù)據(jù)表,利用 Matlab7.0軟件的 princomp函數(shù)進(jìn)行全局主成分分析.
2.1 非線性映射
非線性映射分析是 Sammon于 1969年提出的一種幾何降維數(shù)學(xué)方法,是通過(guò)非線性變換,用少數(shù)幾個(gè)綜合變量最大限度地表達(dá)高維變量,將高維空間問(wèn)題轉(zhuǎn)化為直觀的低維空間問(wèn)題.
非線性映射由高維變換到低維的約束條件,即誤差函數(shù)為:分別為高維空間和低維空間中樣本點(diǎn) i、j之間的歐氏距離.
2.2 基于遺傳算法工具箱的聚類(lèi)分析
遺傳算法是借鑒生物界中自然選擇原理、自然遺傳機(jī)制的一種全局尋優(yōu)算法,其實(shí)質(zhì)是通過(guò)群體搜索技術(shù),根據(jù)適者生存的原則逐代進(jìn)化,最終得到最優(yōu)解或準(zhǔn)最優(yōu)解.其構(gòu)成要素:染色體編碼,個(gè)體適應(yīng)度評(píng)價(jià),遺傳算子(選擇、交叉、變異),運(yùn)行參數(shù)設(shè)置.
Matlab7.0軟件的遺傳算法與直接搜索(Genetic Algorithm and Direct Search)工具箱可以優(yōu)化目標(biāo)函數(shù).利用遺傳算法工具箱對(duì)非線性映射的誤差函數(shù)做最小化處理,找到合適的二維數(shù)據(jù)結(jié)構(gòu),完成高維數(shù)據(jù)到二維數(shù)據(jù)的非線性映射,實(shí)現(xiàn)樣本的聚類(lèi)分析.
3.1 選取中國(guó) 31個(gè)地區(qū)連續(xù) 2年的數(shù)據(jù),進(jìn)行GPCA
根據(jù)區(qū)域經(jīng)濟(jì)發(fā)展水平評(píng)價(jià)指標(biāo)體系,選取中國(guó) 31個(gè)地區(qū)在 2010年和 2011年的 31×2×20個(gè)數(shù)據(jù),整合為全局?jǐn)?shù)據(jù)表.經(jīng) GPCA可知,前 4個(gè)主成分的累積貢獻(xiàn)率達(dá)到 85%,故選擇 4個(gè)主成分作為綜合指標(biāo),代替原有的 20個(gè)指標(biāo).2010、2011年地區(qū)經(jīng)濟(jì)發(fā)展水平綜合得分及排序如表2:
表 2 2010、2011年地區(qū)經(jīng)濟(jì)發(fā)展水平綜合得分及排序
經(jīng)驗(yàn)證,GPCA綜合得分及排序與中國(guó)各地區(qū)經(jīng)濟(jì)發(fā)展水平基本相符,表明區(qū)域經(jīng)濟(jì)水平的評(píng)價(jià)指標(biāo)體系構(gòu)建合理.
由表 2縱向、橫向比較可知,中國(guó)經(jīng)濟(jì)在 2010年和 2011年發(fā)展平穩(wěn),東部、東北、中部、西部各區(qū)域經(jīng)濟(jì)發(fā)展均衡.經(jīng)濟(jì)發(fā)展的整體格局穩(wěn)健,其中,東部發(fā)展較迅速,中部尤其是安徽崛起顯著.
3.2 利用遺傳算法工具箱,進(jìn)行 2011年中國(guó)各地區(qū)經(jīng)濟(jì)發(fā)展水平的聚類(lèi)分析
將 2011年的主成分分值作為樣本數(shù)據(jù),在Matlab7.0中調(diào)用遺傳算法工具箱,完成高維數(shù)據(jù)到二維數(shù)據(jù)的非線性映射,實(shí)現(xiàn)樣本的聚類(lèi)分析.
選取一次的仿真結(jié)果并分析如下:
當(dāng)遺傳算法停止,種群進(jìn)化完畢,得到如圖 1所示的最優(yōu)個(gè)體適應(yīng)度函數(shù)值變化曲線及最優(yōu)個(gè)體.最優(yōu)個(gè)體對(duì)應(yīng)的適應(yīng)度函數(shù)值為 0.0137878,比較接近 0,說(shuō)明遺傳算法較好地找到了非線性映射時(shí)誤差函數(shù)的解.
根據(jù)最優(yōu)個(gè)體的值,得到高維數(shù)據(jù)映射到二維空間的結(jié)果如圖 2(標(biāo)號(hào)對(duì)應(yīng)的地區(qū)見(jiàn)表 2),從圖中可看出各樣本的聚類(lèi)情況.2011年我國(guó) 31個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展水平大致可分為 4類(lèi),分別為:A類(lèi)(經(jīng)濟(jì)發(fā)達(dá)地區(qū)):北京、上海;B類(lèi)(經(jīng)濟(jì)較發(fā)達(dá)地區(qū)):天津、浙江、廣東、江蘇、福建、遼寧、山東、內(nèi)蒙古;C類(lèi)(經(jīng)濟(jì)中等發(fā)達(dá)地區(qū)):重慶、海南、吉林、湖北、河北、陜西、黑龍江、山西、湖南、寧夏、江西、安徽、四川、河南、新疆、廣西;D類(lèi)(經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)):青海、云南、西藏、甘肅、貴州.其中,北京、上海的經(jīng)濟(jì)發(fā)展水平明顯高于其它地區(qū);廣東、浙江、江蘇、天津的經(jīng)濟(jì)發(fā)展水平也較高.
由 GPCA和遺傳算法聚類(lèi)分析的結(jié)果,可以得出以下結(jié)論:
(1)將 GPCA和非線性映射的遺傳算法聚類(lèi)分析相結(jié)合,可以為區(qū)域經(jīng)濟(jì)評(píng)價(jià)提供了一種新的思路和方法.GPCA可根據(jù)綜合分值對(duì)區(qū)域經(jīng)濟(jì)發(fā)展水平進(jìn)行縱向、橫向比較;非線性映射的遺傳算法聚類(lèi)分析,實(shí)現(xiàn)了在二維平面中直觀地看到高維樣本點(diǎn)的近似圖像,避免了其它聚類(lèi)法的人為選擇因素.
(2)GPCA得分值與遺傳算法聚類(lèi)分析的結(jié)果基本吻合,實(shí)現(xiàn)了定量與定性的統(tǒng)一,結(jié)果較為理想.從 GPCA的結(jié)果來(lái)看,中國(guó)各地區(qū)經(jīng)濟(jì)在 2010年和 2011年期間整體發(fā)展平穩(wěn);從遺傳算法聚類(lèi)分析的結(jié)果來(lái)看,中國(guó)各地區(qū)經(jīng)濟(jì)發(fā)展的差距較大,特別是東西部間差距明顯,統(tǒng)籌區(qū)域經(jīng)濟(jì)協(xié)調(diào)發(fā)展的任務(wù)十分緊迫.
本文結(jié)合 GPCA和遺傳算法聚類(lèi)分析,對(duì)中國(guó)地區(qū)發(fā)展水平進(jìn)行綜合評(píng)價(jià).首先借助 GPCA獲得經(jīng)濟(jì)水平全局主成分分值,對(duì)區(qū)域經(jīng)濟(jì)發(fā)展進(jìn)行縱向、橫向分析;然后在 GPCA的基礎(chǔ)上,對(duì)區(qū)域經(jīng)濟(jì)發(fā)展水平做非線性映射的遺傳算法聚類(lèi)分析.仿真顯示,綜合評(píng)價(jià)結(jié)果與客觀實(shí)際吻合度較高,表明GPCA和遺傳算法聚類(lèi)分析相結(jié)合的綜合評(píng)價(jià)方法,在中國(guó)區(qū)域經(jīng)濟(jì)評(píng)價(jià)中的應(yīng)用是合理有效的.
圖1 遺傳算法中最優(yōu)個(gè)體適應(yīng)度函數(shù)值變化曲線及最優(yōu)個(gè)體
圖 2 2011年中國(guó)區(qū)域經(jīng)濟(jì)發(fā)展水平二維空間映射結(jié)果
〔1〕高洪深.區(qū)域經(jīng)濟(jì)學(xué)(第三版)[M].北京:中國(guó)人民大學(xué)出版社,2010.7-21.
〔2〕何曉群.多元統(tǒng)計(jì)分析(第三版)[M].北京:中國(guó)人民大學(xué)出版社,2012.114-128.
〔3〕張建平.基于主成分分析的區(qū)域經(jīng)濟(jì)發(fā)展水平的綜合評(píng)價(jià)[J].農(nóng)業(yè)與技術(shù),2007(6):125-128.
〔4〕耿海清,陳帆,詹存衛(wèi)等.基于全局主成分分析的我國(guó)省級(jí)行政區(qū)城市化水平綜合評(píng)價(jià)[J].人文地理,2009(5):47-51.
〔5〕陸仁強(qiáng),張宏偉,牛志廣等.基于非線性映射理論的城市供水管網(wǎng)壓力監(jiān)測(cè)點(diǎn)布置方法研究[J].水利學(xué)報(bào),2010(1):25-29.
〔6〕雷英杰,張善文,李續(xù)武等.MATLAB 遺傳 算法工具箱及應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2006.
〔7〕韓瑞鋒.遺傳算法原理與應(yīng)用實(shí)例[M].北京:兵器工業(yè)出版社,2009.25-36.
F224;O29
A
1673-260X(2014)08-0107-03
基金支持:六安市定向委托皖西學(xué)院市級(jí)研究項(xiàng)目(2012LW 020);安徽高校省級(jí)科學(xué)研究項(xiàng)目(KJ2013B332)