張碩碩
摘 要:電子商務(wù)發(fā)展帶來(lái)的經(jīng)濟(jì)效益越來(lái)越受到重視,以全國(guó)31省市為基礎(chǔ),通過(guò)改進(jìn)主成分聚類法探究各省市電子商務(wù)發(fā)展水平。首先對(duì)評(píng)價(jià)的指標(biāo)進(jìn)行選取,建立合適的評(píng)價(jià)指標(biāo)體系,其次對(duì)原始數(shù)據(jù)進(jìn)行均值化處理,用改進(jìn)后的主成分分析提取主成分,再次用主成分綜合得分與聚類分析相結(jié)合對(duì)各地區(qū)發(fā)展水平進(jìn)行分析,最后與傳統(tǒng)主成分分析進(jìn)行比較得出模型的有效性。
關(guān)鍵詞:改進(jìn)的主成分;電子商務(wù);綜合評(píng)價(jià)
中圖分類號(hào):F27 文獻(xiàn)標(biāo)識(shí)碼:A doi:10.19311/j.cnki.1672-3198.2018.35.036
1 引言
根據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,2017年全國(guó)電子商務(wù)交易額達(dá)到29.16萬(wàn)億元,同比增長(zhǎng)11.7%,電子商務(wù)發(fā)展帶來(lái)的經(jīng)濟(jì)效益不言而喻。目前電子商務(wù)水平測(cè)度及評(píng)價(jià)體系主要運(yùn)通因子分析法、聚類分析法、熵值法等對(duì)電子商務(wù)發(fā)展水平進(jìn)行綜合評(píng)價(jià),本文將使用改進(jìn)的主成分聚類法對(duì)電子商務(wù)發(fā)展水平進(jìn)行綜合評(píng)價(jià),解決單一的評(píng)價(jià)帶來(lái)不準(zhǔn)確。
2 傳統(tǒng)主成分分析原理
3.3 改進(jìn)后主成分分析過(guò)程及結(jié)果
把經(jīng)過(guò)均值化后的數(shù)據(jù)導(dǎo)入SPSS進(jìn)行主成分分析。從相關(guān)系數(shù)矩陣可以看到原始數(shù)據(jù)大部分變量之間的相關(guān)系數(shù)都大于0.3且KMO為0.813>0.8,Bartlett球形檢驗(yàn)的顯著性P值為0.000<0.05,明數(shù)據(jù)適合做因子分析。表2為方差貢獻(xiàn)表,由表2可以看出,提取了特征值大于1的三個(gè)主成分,三個(gè)主成分的特征值分別為13.564、3.696、1.328,方差貢獻(xiàn)率分別是64.590%、17.601%、6.325%,累積方差貢獻(xiàn)率達(dá)到88.516%。
表3為因子載荷矩陣。由表可看出企業(yè)數(shù)x1、企業(yè)擁有網(wǎng)站數(shù)x3、地區(qū)生產(chǎn)總值x9、網(wǎng)上零售額x13、社會(huì)消費(fèi)品零售總額x14第一主成分上有較高載荷,相關(guān)性強(qiáng)。第一主成分集中反映了基礎(chǔ)設(shè)施及經(jīng)濟(jì)狀況,電子商務(wù)發(fā)展水平主要體現(xiàn)在基礎(chǔ)設(shè)施與經(jīng)濟(jì)狀況;互聯(lián)網(wǎng)普及率x5、人均GDPx10、居民消費(fèi)水平城鎮(zhèn)人口比重x11在第二主成分上有較高載荷,第二主成分反映了人口因素;有電子商務(wù)交易的企業(yè)比重x2在第三主成分上載荷較高,反映了從事電子商務(wù)交易企業(yè)比例對(duì)電子商務(wù)發(fā)展水平做的貢獻(xiàn)。
由表3的因子載荷除以對(duì)應(yīng)的特征根(λi,i=1,2,3)得到主成分系數(shù)矩陣,用T表示。根據(jù)得到的主成分系數(shù)表,及公式y(tǒng)=Zx*T,可以得到主成分得分其中Zx為均值化后的矩陣。再通過(guò)表2方差貢獻(xiàn)率64.590%、17.601%、6.325%,計(jì)算出綜合得分函數(shù),其公式為:
y綜*=0.6459y1*+0.17601y2*+0.06325y3*
其中y1*,y2*、y3*為提取的三個(gè)主成分的得分,y綜*為綜為綜合得分。
另外把標(biāo)準(zhǔn)化后的數(shù)據(jù)導(dǎo)入SPSS進(jìn)行傳統(tǒng)主成分分析,y綜為傳統(tǒng)主成分綜合得分。對(duì)比傳統(tǒng)主成分分析,得到表4。我們可以看到,整體排名大致相同,但是部分地區(qū)電子商務(wù)發(fā)展水平綜合評(píng)測(cè)結(jié)果有差異,比如廣西在改進(jìn)后的主成分分析排名19,傳統(tǒng)主成分分析排名20,內(nèi)蒙古在改進(jìn)后的主成分分析排名23,傳統(tǒng)主成分分析中排名19,對(duì)比原始數(shù)據(jù),內(nèi)蒙古除了在企業(yè)擁有網(wǎng)站數(shù)、互聯(lián)網(wǎng)普及率、人均GDP、居民消費(fèi)水平、城鎮(zhèn)人口比重5個(gè)指標(biāo)上比廣西高外,其他指標(biāo)均低于廣西,而這五個(gè)指標(biāo)在因子載荷矩陣中的因子載荷值較小,也就是說(shuō)這幾個(gè)指標(biāo)在電子商務(wù)水平綜合評(píng)價(jià)中并不是最重要的指標(biāo),故廣西的電子商務(wù)發(fā)展水平應(yīng)該高于內(nèi)蒙古,改進(jìn)后的主成分分析結(jié)果優(yōu)于傳統(tǒng)的主成分分析。
3.4 聚類綜合評(píng)價(jià)
對(duì)主成分綜合得分進(jìn)行聚類分析,同時(shí)參考各類中各地區(qū)的綜合主成分得分以此對(duì)類進(jìn)行排序,最終得到綜合的評(píng)價(jià)結(jié)果。系統(tǒng)聚類圖如圖1所示,求得這五類中樣本的平均得分并排序。
第一類{廣州},廣州的綜合得分遠(yuǎn)遠(yuǎn)高于其他地區(qū),為電子商務(wù)最發(fā)達(dá)的地區(qū);第二類{浙江、江蘇、上海、北京},發(fā)展水平低于廣州,為電子商務(wù)較發(fā)達(dá)地區(qū);第三類{山東、福建},為電子商務(wù)發(fā)展水平一般發(fā)達(dá)地區(qū);第四類{河南、四川、湖北、河北、遼寧、湖南、安徽、天津},根據(jù)福建省和河南省綜合得分,有一個(gè)較大差別,為電子商務(wù)發(fā)展水平一般地區(qū);第五類{陜西、重慶、江西、廣西、黑龍江、山西、云南、內(nèi)蒙古、吉林、貴州、海南、新疆、甘肅、寧夏、青海、西藏},主要為中西部地區(qū),為電子商務(wù)不發(fā)達(dá)地區(qū)??傮w來(lái)看,東部沿海地區(qū)電子商務(wù)發(fā)展水平普遍高區(qū)中西部地區(qū)。
4 結(jié)論
與傳統(tǒng)的主成分分析相比,改進(jìn)的主成分聚類分析方法能夠在很大程度上克服主觀因素的影響,同時(shí)在對(duì)原始信息的處理中采用了均值化處理方法,使挖掘的結(jié)果更加準(zhǔn)確,在此基礎(chǔ)上運(yùn)用聚類分析方法,將電子商務(wù)發(fā)展水平相近的地區(qū)聚為一類,為準(zhǔn)確評(píng)估電子商務(wù)整體水平和有針對(duì)性的尋求解決方案提供更可靠的依據(jù)。
參考文獻(xiàn)
[1]王國(guó)祝.聚類分析及算法研究[J].現(xiàn)代商貿(mào)工業(yè),2017,(22).