李嘉程
摘要:基于2005~2020年間湖南省的數(shù)據(jù),選取5個(gè)影響湖南省居民消費(fèi)水平的因素,運(yùn)用R軟件建立多元回歸模型。但這5個(gè)影響因素之間本身就會(huì)相互影響,導(dǎo)致數(shù)據(jù)間的多重共線性問題。為了回歸中的多重共線性問題,文章先用特征根判定法進(jìn)行診斷,再使用嶺回歸模型和主成分回歸模型對其進(jìn)行修正,最后對這兩個(gè)修正模型進(jìn)行比較分析,得出了嶺回歸模型相對較優(yōu)的結(jié)論。
關(guān)鍵詞:嶺回歸;主成分回歸;R語言;居民消費(fèi)水平
一、引言
中國經(jīng)濟(jì)快速發(fā)展,居民消費(fèi)支出具有突出貢獻(xiàn),居民消費(fèi)水平反映了一個(gè)國家或一個(gè)地區(qū)居民的消費(fèi)水平。對于湖南省這樣的人口大省來說,在30年前提出了“長株潭”經(jīng)濟(jì)區(qū)、“五區(qū)一廊”的戰(zhàn)略,在2004年中央提出了中部崛起戰(zhàn)略后,湖南省GDP以及人均可支配收入在全國位居前列,2020年提出“三高四新”,湖南省在進(jìn)入新發(fā)展階段順應(yīng)變局、把握先機(jī)。現(xiàn)伴隨著湖南省靠自身實(shí)力在全國占得了一席之地,省內(nèi)居民消費(fèi)水平提高較快,消費(fèi)結(jié)構(gòu)也有了很大的改善,因此對其進(jìn)行分析有較強(qiáng)的經(jīng)濟(jì)意義。
現(xiàn)已有很多學(xué)者對居民消費(fèi)水平因素做了研究,但很多對居民消費(fèi)水平影響因素的研究側(cè)重于單個(gè)模型。關(guān)于居民消費(fèi)水平的預(yù)測問題,有學(xué)者對此進(jìn)行了大量研究,也提出了用對應(yīng)的模型來進(jìn)行預(yù)測,但對回歸模型在實(shí)際應(yīng)用的修正比較分析較少。
現(xiàn)以湖南省2008~2020年5個(gè)影響因素?cái)?shù)據(jù)為例,通過嶺回歸和主成分回歸的方法來解決變量間存在的多重共線性問題,并對應(yīng)得到兩個(gè)模型,進(jìn)一步比較兩種方法的優(yōu)缺點(diǎn),同時(shí)分析出對湖南省居民消費(fèi)水平的重要因素,從而對湖南省經(jīng)濟(jì)發(fā)展以及區(qū)域經(jīng)濟(jì)提供一定的政策依據(jù)。
二、指標(biāo)選取與數(shù)據(jù)來源
在現(xiàn)實(shí)生活中,影響居民消費(fèi)的因素很多,但考慮到地區(qū)經(jīng)濟(jì)的實(shí)際情況、經(jīng)濟(jì)理論和樣本數(shù)據(jù)的可收集性,選取了2008~2020年湖南省居民消費(fèi)水平(元)作為被解釋變量,地區(qū)生產(chǎn)總值(億元)、城鎮(zhèn)居民可支配收入(元)、農(nóng)村居民可支配收入(元)、城鎮(zhèn)化率(%)以及居民消費(fèi)價(jià)格指數(shù)(%)的年度數(shù)據(jù)作為解釋變量,本文數(shù)據(jù)選取歷年的《湖南省統(tǒng)計(jì)年鑒》以及中國經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究平臺(tái)國家統(tǒng)計(jì)年鑒報(bào)告。
地區(qū)生產(chǎn)總值GRP是反映一個(gè)地區(qū)經(jīng)濟(jì)中所生產(chǎn)出的全部最終產(chǎn)品和勞務(wù)的價(jià)值,常被公認(rèn)為是衡量地區(qū)經(jīng)濟(jì)狀況的最佳指標(biāo),地區(qū)生產(chǎn)總值GRP高的地區(qū),表明地區(qū)的經(jīng)濟(jì)實(shí)力強(qiáng),人民消費(fèi)水平高;居民可支配收入水平是決定一個(gè)國家消費(fèi)的核心因素,且居民可支配收入分為了城鎮(zhèn)和農(nóng)村居民可支配收入,消費(fèi)會(huì)隨著收入的增加而增加,居民的購買力也會(huì)提高;城鎮(zhèn)化的快速發(fā)展是推動(dòng)社會(huì)消費(fèi)增長的根本動(dòng)力,同時(shí)也是縮短貧富差距的方法,隨著城鎮(zhèn)化率在不斷提升,促進(jìn)了居民消費(fèi);居民消費(fèi)價(jià)格指數(shù)是用來反映消費(fèi)商品及服務(wù)價(jià)格水平的變動(dòng)情況,且會(huì)導(dǎo)致居民消費(fèi)的差異化,與人民群眾的生活密切相關(guān),同時(shí)在整個(gè)國民經(jīng)濟(jì)價(jià)格體系中也具有重要地位,其變動(dòng)率在一定程度上反映通貨膨脹或緊縮的程度。
三、多元線性回歸模型分析
(一)模型設(shè)定及變量說明
為了研究影響湖南省居民消費(fèi)水平因素,本文構(gòu)建的多元線性回歸模型為:
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5
其中,Y為被解釋變量,表示居民消費(fèi)水;、X5為解釋變量,分別表示城鎮(zhèn)化率、城鎮(zhèn)居民可支配收入、農(nóng)村居民可支配收入、地區(qū)生產(chǎn)總值和居民消費(fèi)價(jià)格指數(shù),β0為回歸常;,β5為回歸系數(shù)。
根據(jù)收集的數(shù)據(jù),利用R語言統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)處理,運(yùn)用最小二乘估計(jì)求得各個(gè)參數(shù)的估計(jì)值,得到如下的OLS回歸模型:
Y=233.2x1+1.516x2-1.504x3-0.3106x4+54.61x5-18910
顯著性檢驗(yàn)結(jié)果得到,該模型的相關(guān)系數(shù)R2=0.9987,由此說明模型對樣本的擬合效果很好;F值為1090,且對應(yīng)的P值為5.864×1010,表明該回歸模型高度顯著,整體擬合程度很好。由參數(shù)估計(jì)表可知,x2的t檢驗(yàn)統(tǒng)計(jì)量對應(yīng)的P<0.05,其他四個(gè)變量對Y的影響不顯著。結(jié)合上述分析,這些自變量之間存在很大相關(guān)性,則考慮出現(xiàn)檢驗(yàn)效果不顯著可能是存在多重共線性的原因。
(二)多重共線性診斷
考慮OLS回歸模型中可能有多重共線性的存在,現(xiàn)采用常規(guī)的特征根判定法,來對樣本數(shù)據(jù)進(jìn)行多重共線性的診斷。
現(xiàn)利用R軟件運(yùn)行計(jì)算得出條件數(shù)>10,說明解釋變量間存在嚴(yán)重的多重共線性。同時(shí),通過計(jì)算相關(guān)陣X′X的特征向量來找出哪些解釋變量是多重線性的,得出結(jié)果如下:
ζ=(4.09531,0.89902,0.00396,0.00145,
0.00026)
明顯看出x*3、x*4和*5對應(yīng)的特征值近似于0,所以認(rèn)為x*1和x*2間存在多重共線性。當(dāng)存在多重共線性時(shí),模型的參數(shù)估計(jì)精準(zhǔn)度會(huì)大幅度下降,從而使得所得估計(jì)值無法從經(jīng)濟(jì)社會(huì)角度解釋,進(jìn)而降低模型的應(yīng)用價(jià)值。
四、主成分回歸和嶺回歸分析
考慮到各因素的量綱(單位)不同,首先需要將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,這樣就可以消除量綱對模型精度的影響,然后再使用主成分回歸和嶺回歸來對經(jīng)典回歸模型進(jìn)行修正,同時(shí)來解決解釋變量間的多重共線性問題。
(一)主成分回歸
主成分回歸主要運(yùn)用到降維思想,在盡量不損失太多信息的情況下利用正交旋轉(zhuǎn)把多個(gè)指標(biāo)轉(zhuǎn)化成幾個(gè)重要的綜合指標(biāo),即主成分,且各個(gè)綜合指標(biāo)之間互不相關(guān),所以用主成分回歸分析能很好地消除多重共線性的影響。
首先對5個(gè)解釋變量進(jìn)行主成分的計(jì)算,用R軟件進(jìn)行計(jì)算并輸出相應(yīng)的計(jì)算結(jié)果,得出主成分分析的累計(jì)貢獻(xiàn)率,見表1:
從表1中可以明顯看出第一個(gè)主成分的累計(jì)貢獻(xiàn)率為81.906%,已經(jīng)達(dá)到了80%以上,足夠反映出原始指標(biāo)中大部分信息。為了達(dá)到降維的目的,建議只保留第一個(gè)主成分。
由上述分析得出:現(xiàn)只需要輸出第一個(gè)主成分的得分,且設(shè)為Z1,則
Z1=0.492X1+0.492X2+0.492X3+0.491X4-0.178X5
現(xiàn)在用Y對1做最小二乘回歸,得到相關(guān)系數(shù)R2=0.9887,F(xiàn)統(tǒng)計(jì)量值為1047,且主成分的t檢驗(yàn)統(tǒng)計(jì)量P值<0.01,說明該模型的擬合效果很好。該主成分回歸模型如下:
?=0.47206Z1
將Z1代入上述模型,得標(biāo)準(zhǔn)化的主成分回歸方程如下:
?=0.23226X1+0.23226X2+0.23226X3+0.23178X4-0.08403X5
為了方便后期計(jì)算和比較,還原為原始數(shù)據(jù)的主成分回歸方程如下:
?=257.9578X1+0.1592X2+0.37785X3+0.145555X4-315.565X5+23458.36
(二)嶺回歸分析
嶺回歸用于解決多重共線性的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì),通過放棄最小二乘的無偏性,以損失部分信息和降低精度為代價(jià)獲得回歸系數(shù)更符合實(shí)際、可靠的回歸方法,適用于對病態(tài)數(shù)據(jù)的擬合。
現(xiàn)用R進(jìn)行嶺回歸分析,其嶺參數(shù)k的取值范圍為0-1,步長為0.05,得出21個(gè)嶺參數(shù)取值對應(yīng)的嶺跡圖如圖1所示:
從圖1可以看到,當(dāng)k值較小時(shí),X2的嶺回歸系數(shù)的絕對值較大,隨著k的增大又迅速趨于零,所以予以剔除;同時(shí),選擇剔除嶺回歸系數(shù)比較穩(wěn)定且絕對值很小的自變量X5?,F(xiàn)用Y和其余3個(gè)自變量重新做一遍嶺回歸,新嶺跡如圖2所示:
由圖2看到,剔除X2和X5后嶺回歸系數(shù)變化幅度減,雖然仍為負(fù)值,但與剔除X2和X5前-0.311相比負(fù)的程度已經(jīng)較為減小。通過綜合比較發(fā)現(xiàn)當(dāng)k>0.65時(shí),嶺參數(shù)的取值基本穩(wěn)定,所以最終取嶺回歸系數(shù)k=0.65,得標(biāo)準(zhǔn)化的嶺回歸方程為:
?=0.3594X*1+0.3237X*3+0.2992X*4
此時(shí)對應(yīng)的未標(biāo)準(zhǔn)化的嶺回歸方程為:
?=399.1703X1+0.52661X3+0.18791X4-14233.74
嶺回歸估計(jì)的標(biāo)準(zhǔn)化系數(shù)能客觀反映自變量對因變量的影響程度,從標(biāo)準(zhǔn)化的嶺回歸方程可知:城鎮(zhèn)化率(X1)、農(nóng)村居民可支配收λ(X3)和地區(qū)生產(chǎn)總值(X4)與湖南省居民消費(fèi)水平都呈正相關(guān)關(guān)系。同時(shí),影響湖南省居民消費(fèi)水平的主要三個(gè)因素的重要性從大到小排序依次是:城鎮(zhèn)化率、農(nóng)村居民可支配收入、地區(qū)生產(chǎn)總值。
(三)模型對比分析
運(yùn)用主成分回歸模型和嶺回歸模型消除了變量間的多重共線性,通過對比模型檢驗(yàn)及參數(shù)檢驗(yàn),選擇較優(yōu)的模型。主成分回歸模型和嶺回歸模型的對比分析如表2所示。
由表2的結(jié)果來看,嶺回歸的RMSE(均方根誤差)較小,說明嶺回歸同真值間的偏差更小,效果較優(yōu);但從R2擬合優(yōu)度來看,主成分回歸的R2值較大,擬合效果較好。AIC和BIC信息準(zhǔn)則是衡量統(tǒng)計(jì)模型復(fù)雜度和擬合優(yōu)良性的標(biāo)準(zhǔn),其AIC和BIC值越小的為相對最優(yōu)模型,所以嶺回歸的模型較優(yōu);嶺回歸的平均相對誤差更小,所以其預(yù)測效果更好。綜上所述,嶺回歸為相對較優(yōu)模型。
五、結(jié)語
在近些年湖南省穩(wěn)定經(jīng)濟(jì)增長的前提下,為了順應(yīng)消費(fèi)升級(jí)趨勢和鼓勵(lì)消費(fèi)新模式、新業(yè)態(tài)發(fā)展,人民政府緊密結(jié)合實(shí)際經(jīng)濟(jì)情況推出相應(yīng)對策,進(jìn)而推動(dòng)經(jīng)濟(jì)實(shí)現(xiàn)質(zhì)的穩(wěn)步提升和量的合理增長,繼續(xù)保持經(jīng)濟(jì)平穩(wěn)高效發(fā)展。
由回歸結(jié)果分析可以看出,現(xiàn)如今湖南省城鄉(xiāng)經(jīng)濟(jì)差距以及收入差距逐漸縮小,由此得出今年湖南在積極推動(dòng)和完善城鄉(xiāng)發(fā)展一體化的工作中取得了一定成效。湖南省作為農(nóng)業(yè)大省,長時(shí)間實(shí)行城鄉(xiāng)二元分治的體制影響,城鄉(xiāng)一體化實(shí)施較晚以及受整體環(huán)境影響,目前城鄉(xiāng)發(fā)展速度仍然較慢、發(fā)展不平衡,導(dǎo)致城鎮(zhèn)化率對居民消費(fèi)的影響仍較小。雖然,居民消費(fèi)水平是隨著地區(qū)生產(chǎn)總值的增長在提高,并且居民消費(fèi)率較高,對于經(jīng)濟(jì)貢獻(xiàn)率也較高。但是發(fā)展速度較低,消費(fèi)增勢有降低的趨勢,尤其是現(xiàn)如今新冠疫情的影響。
基于湖南省居民消費(fèi)水平的實(shí)證研究結(jié)果和上述問題,本文對湖南省經(jīng)濟(jì)均衡發(fā)展提出如下建議:第一,全面推進(jìn)城鎮(zhèn)化進(jìn)程。努力健全城鄉(xiāng)一體化的融合機(jī)制,加大統(tǒng)籌城鄉(xiāng)發(fā)展的力度,加大對農(nóng)業(yè)農(nóng)村基礎(chǔ)設(shè)施的投入,夯實(shí)農(nóng)村城鎮(zhèn)化發(fā)展的基礎(chǔ)。第二,提高居民可支配收入。穩(wěn)步提高居民財(cái)產(chǎn)性收入,支持創(chuàng)業(yè)就業(yè)財(cái)稅政策,優(yōu)化工資分配宏觀調(diào)控作用,完善社會(huì)保障體系。湖南省為農(nóng)業(yè)大省,政府還應(yīng)不斷發(fā)展現(xiàn)代農(nóng)業(yè)化產(chǎn)業(yè)、積極拓寬農(nóng)民經(jīng)營性收入渠道和完善補(bǔ)貼政策,提高農(nóng)民財(cái)產(chǎn)收入。第三,加大對外開放力度。進(jìn)一步完善招商引資政策,加強(qiáng)培養(yǎng)和引入適于經(jīng)濟(jì)發(fā)展需求的各類人才。積極擴(kuò)大外需市場,擴(kuò)大省內(nèi)外合作和抓住國際產(chǎn)業(yè)加速轉(zhuǎn)移的契機(jī),不斷拓展新興市場,從而促進(jìn)湖南對外貿(mào)易市場的發(fā)展。
參考文獻(xiàn):
[1]張兆亮.我國居民消費(fèi)率影響因素探究[J].內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報(bào),2010(04):4-12.
[2]陳玲燕.多重共線性下的線性回歸方法綜述[J].市場研究,2008(04):148-152.
[3]郝卉.居民消費(fèi)水平影響因素的計(jì)量分析[J].才智,2011(03):15.
[4]周雨柔.兩種預(yù)測模型在居民消費(fèi)水平預(yù)測中的研究與評價(jià)[J].中國集體經(jīng)濟(jì),2017(33):52-54.
[5]劉金宇.中國居民消費(fèi)水平影響因素的實(shí)證分析[J].中國集體經(jīng)濟(jì),2019(07):17-20.
[6]張玲玲,張予川.消費(fèi)水平影響因素研究——以武漢市為例[J].區(qū)域與城市經(jīng)濟(jì),2020(12):27-31.
[7]何曉群.應(yīng)用回歸分析[M].北京:電子工業(yè)出版社,2017.
(作者單位:廣西師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院)