陳炫輪 蔣澤坤
◆摘? 要:本文以31個省份和地區(qū)為例,分析了2019年城市居民的消費支出狀況,使用主成分分析和聚類分析的方法,結(jié)合SPSS軟件和JMP軟件,對31個省市自治區(qū)的消費支出差異情況進行研究,并對其進行分類。結(jié)論是地區(qū)間經(jīng)濟發(fā)展水平的差異以及地理位置因素的影響導(dǎo)致了我國不同地區(qū)城鎮(zhèn)居民消費支出情況的差異性。
◆關(guān)鍵詞:主成分分析;消費支出差異性;聚類分析
一、引言
伴隨著我國經(jīng)濟的高速發(fā)展,31個省市、自治區(qū)的城市居民的生活水平也在逐步提高,消費水平也在逐步提升,但消費結(jié)構(gòu)也在不斷地改變。此外,由于各省市自治區(qū)經(jīng)濟發(fā)展水平各不相同,受地理位置影響,他們的居民消費支出情況也各不相同。正確認(rèn)識我國31個省市自治區(qū)之間居民消費支出的差異情況,并探究其原因,對于提高我國城鎮(zhèn)居民消費水平有著十分深遠的意義。
國內(nèi)有關(guān)城市居民消費支出的研究從未間斷,而主成分分析和聚類分析是本文的主要研究方法。王傳仕等運用主成分分析法對我國城市居民的消費狀況進行了研究,并運用綜合得分進行了排序;朱建軍分析了中國城市居民的消費行為,由此得到城市居民的主要消費傾向,并提出了自己的對策和建議;蘇靜初在調(diào)查河南省城市居民的消費行為時,找到了他們的消費熱點和焦點;張月等運用恩格爾指數(shù)來表示城市居民的生活水準(zhǔn),并運用聚類分析方法對城市居民的消費構(gòu)成進行了比較分析,得出了各區(qū)域的消費特征。
二、理論基礎(chǔ)
2.1協(xié)方差矩陣與相關(guān)矩陣
在應(yīng)用主成份分析法進行實際問題時,一般有兩種方法,一種是先由原變量的協(xié)方差矩陣,再協(xié)方差矩陣來進行主成分分析;另外一種是從原始變量的相關(guān)系數(shù)矩陣來進行主成分分析。所以,在實踐中,我們到底應(yīng)該怎么做?
在通常的情形下,我們會根據(jù)原變量的協(xié)方差矩陣來進行主成分分析,這是由于原變量的相關(guān)系數(shù)矩陣等于是將原變量的協(xié)方差矩陣進行了歸一化處理,而由相關(guān)系數(shù)矩陣進行的主成分分析則是對原資料進行歸一化后的數(shù)據(jù)進行研究,而在這個時候,數(shù)據(jù)就不再是原來的數(shù)據(jù)了。在資料的維度和變異值差異很大的情況下,采用基于原變量的相關(guān)系數(shù)矩陣進行主成分分析。另外,在選擇的主要成份時,基于相關(guān)系數(shù)矩陣的主成分分析所生成的負(fù)荷矩陣與相關(guān)矩陣的功能是相同的,只須選擇一個矩陣就可以對其進行說明。
三、實證分析
3.1數(shù)據(jù)來源與處理
本文收集了31個省市2019年城鎮(zhèn)居民消費支出的8個指標(biāo),即X1-X8,食物煙酒、服裝、住房、生活、交通通訊、教育、體育衛(wèi)生、其他用品和服務(wù)。資料來源于《中國統(tǒng)計年鑒2020》。
由于各項數(shù)據(jù)的差異相對較大,為了便于后續(xù)的分析處理,故首先對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。本文采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化方法對原始數(shù)據(jù)進行處理,操作軟件為SPSS。
3.2相關(guān)系數(shù)矩陣
在得到了規(guī)范化的資料之后,還要對所選取的變量進行相關(guān)性檢驗,檢驗所選取的指標(biāo)是否具有進行主成分分析的前提。通常,在主成分分析中,選擇的各變量間相關(guān)性越高,就越適宜進行相關(guān)的研究。本文使用SPSS對各個變量進行了相關(guān)分析。
結(jié)果顯示,除了食品煙酒與醫(yī)療保健之間的相關(guān)系數(shù)僅為0.097以后,大部分變量的相關(guān)性都大于0.6。這說明所選擇的指數(shù)具有很高的關(guān)聯(lián)度,符合主成分分析的前提。
3.3主成分結(jié)果展示
采用 JMP軟件,對31個省區(qū)的8個變量進行了主成分分析。首先求出各個主要成份的特性值和累積貢獻率,見表4。在選擇主成分時,原則上通常采用的是大于1的特征值。前兩種主成分的特征值分別為5.2926和1.1077,都超過1,兩種主要成分的累積貢獻率高達80%,說明前面兩個主要成份包含了31個省市的絕大部分城市居民的消費情況,所以我們可以選擇前面兩個主要成份進行分析。
由主成分的載荷矩陣(參見下表),得出了上述兩個主要成分的表達式:Y[1]=0.7328X[1]+0.5315X[2]+0.9032X[3]+0.8791X[4]+0.9148X[5]+0.8452X[6]+0.6667X[7]+0.9427X[8] (1)
Y[2]=-0.5726X[1]+0.5841X[2]-0.1677X[3]+0.0070X[4]-0.2271X[5]-0.0452X[6]+0.5858X[7]+0.1167X[8] (2)
根據(jù)主成分表達式,我們可以給出一個關(guān)于兩個主要成分是否與真實的上下文和語義相符的解釋。根據(jù)的表達式,的值可以衡量全國31個省份城鎮(zhèn)居民消費水平的高低;根據(jù)的表達式,我們可以根據(jù)的值來衡量全國31個省份城鎮(zhèn)居民受氣候影響的消費性支出占比的情況,主要影響變量是衣著以及醫(yī)療保健。
四、結(jié)論及建議
結(jié)合主成分分析對全國31個省份城鎮(zhèn)居民消費支出情況分析的結(jié)果,我們得到如下結(jié)論和建議:
區(qū)域的發(fā)展水平對居民的消費支出有很大的影響,區(qū)域內(nèi)的經(jīng)濟發(fā)展水平越高,消費支出也就越多,因而總成分的得分也就越高。從總體得分上看,31個省市居民的消費支出呈現(xiàn)出明顯的區(qū)域失衡。在東部,居民的消費水平比較高,而在中西部,他們的消費水平比較低。北京市、上海市、天津市、廣東省、浙江省、江蘇省六個省市主要成分的綜合得分最高。由于經(jīng)濟發(fā)展程度比較高,所以他們的消費也比較高。要解決區(qū)域發(fā)展的不平衡問題,必須在宏觀上調(diào)整和調(diào)整中西部的經(jīng)濟發(fā)展,提高經(jīng)濟發(fā)展的速度,同時要加強與中西部、東部的合作與交流,以逐漸減少區(qū)域間的不平衡。
參考文獻
[1]王傳仕.我國城鎮(zhèn)居民消費水平主成分分析[J].技術(shù)經(jīng)濟,2002(09):40-41.
[2]朱建軍.我國城鎮(zhèn)居民消費結(jié)構(gòu)主成分分析[J].無錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報,2009,9(01):21-22.
[3]蘇靜.河南城鎮(zhèn)居民消費結(jié)構(gòu)的計量分析[J].河南財政稅務(wù)高等專科學(xué)校學(xué)報,2011,25(03):48-51.
[4]張月,張金鳳,王泓娜,關(guān)靜.聚類分析在我國城鎮(zhèn)居民消費結(jié)構(gòu)研究中的應(yīng)用[J].遼寧大學(xué)學(xué)報(自然科學(xué)版 ),2004(01):47-49.
作者簡介
陳炫輪(1997-),男,河南信陽人,碩士研究生,主要研究方向大數(shù)據(jù)分析。