唐雪銀,張應(yīng)應(yīng)
摘要:本文通過建立多元線性回歸模型,得出中國(guó)GDP與建筑業(yè)總產(chǎn)值和服務(wù)業(yè)總產(chǎn)值的線性回歸方程,并檢驗(yàn)線性回歸方程及線性回歸系數(shù)的顯著性。發(fā)現(xiàn)建筑業(yè)總產(chǎn)值對(duì)應(yīng)的回歸系數(shù)不顯著,究其原因是自變量之間存在多重共線性。然后利用主成分回歸修正多重共線性得出新的回歸方程,最終分析出中國(guó)建筑業(yè)和服務(wù)業(yè)對(duì)于拉動(dòng)中國(guó)經(jīng)濟(jì)增長(zhǎng)的具體作用。
關(guān)鍵詞:GDP;建筑業(yè);服務(wù)業(yè);線性回歸;顯著性檢驗(yàn);多重共線性;主成分回歸
中圖分類號(hào):F12 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)06-0123-03
我國(guó)的經(jīng)濟(jì)增長(zhǎng)速度是國(guó)際上的一個(gè)引人注目的話題。中國(guó)的GDP(國(guó)內(nèi)生產(chǎn)總值)增長(zhǎng)迅猛,同1978年相比,GDP年均增長(zhǎng)近10%,有的地區(qū)超過20%,占世界份額超過5%,即使在最近的經(jīng)濟(jì)危機(jī)中,我國(guó)的GDP仍然能以8%左右的速度增長(zhǎng),可見我國(guó)經(jīng)濟(jì)正處于飛速發(fā)展的階段,且暫無減緩的趨勢(shì)?!笆晃濉逼陂g,我國(guó)建筑業(yè)發(fā)展較為迅速[1]。2010年我國(guó)建筑企業(yè)達(dá)到70061家,從業(yè)人數(shù)達(dá)到了4043.4萬人,中國(guó)房地產(chǎn)業(yè)的火爆大大提升了中國(guó)建筑行業(yè)在國(guó)際上的地位。統(tǒng)計(jì)數(shù)據(jù)顯示,2010年中國(guó)向新建筑項(xiàng)目投入逾1萬億美元,房地產(chǎn)業(yè)的繁榮推動(dòng)中國(guó)首次超越美國(guó),成為全球頭號(hào)建筑大國(guó)。目前建筑業(yè)已經(jīng)成為我國(guó)名副其實(shí)的支柱產(chǎn)業(yè),在國(guó)民經(jīng)濟(jì)中起著重要的支撐性作用,對(duì)于拉動(dòng)經(jīng)濟(jì)增長(zhǎng)和促進(jìn)就業(yè)具有積極的作用。另外,衡量一個(gè)國(guó)家的發(fā)達(dá)程度,其服務(wù)業(yè)占生產(chǎn)總值的比重是一個(gè)關(guān)鍵的數(shù)據(jù)。十一屆全國(guó)人大常委會(huì)第二十二次會(huì)議上提出我國(guó)將推動(dòng)服務(wù)業(yè)加快發(fā)展,力爭(zhēng)到2015年,服務(wù)業(yè)總產(chǎn)值占GDP比重達(dá)到47%左右。通過以往的數(shù)據(jù),我們發(fā)現(xiàn),建筑業(yè)總產(chǎn)值與服務(wù)業(yè)總產(chǎn)值分別與GDP呈一元線性相關(guān),因此我們?cè)噲D在這三者中建立一個(gè)多元線性回歸模型,并通過這樣的模型觀察變量之間的具體關(guān)系。
一、多元線性回歸
(一)符號(hào)與基本假設(shè)
對(duì)各因素賦予變量符號(hào),見表1。
(二)模型構(gòu)建及求解
我們利用多元線性回歸模型。設(shè)(xi1,xi2,yi),i=1,2…,n為(X1,X2,Y)的實(shí)驗(yàn)數(shù)據(jù),則多元線性回歸模型為[2]: yi=β0+β1xi1+β2xi2+ε i=1,2,L,nεi:N(0,σ2), j=1,2,L,ncov(εi,εj)=0 i≠j,i,j=1,2,L,n其矩陣形式為:Y=Xβ+εε~Nn(0,σ2In)其中■,X=1,x11,x121,x21,x22 M1,xn1,xn2,0是n維零向量,In是n階單位陣。當(dāng)X是列滿秩時(shí),可以證明β的最小二乘估計(jì)為:■=(XTX)-1XTY,經(jīng)驗(yàn)回歸方程為:■=■0+■1X1+L+■pXp,設(shè)ε1=Y-X■為殘差向量。通常取■2=■T■/(n-p-1)為■2的估計(jì)(這里p=2),它是σ2的最小二乘估計(jì),■為殘差標(biāo)準(zhǔn)差,它越小越好。相關(guān)系數(shù)的平方定義為:R2=■,其中SSR=■(■i-■)2,SST=■(yi-■)2。用R2來衡量Y與X1,X2,L,Xp之間相關(guān)密切程度,R2越大(接近于1)則所建多元線性回歸模型的擬合程度越好。得到的線性回歸方程需要通過回歸方程的顯著性檢驗(yàn)及回歸系數(shù)的顯著性檢驗(yàn)才能使用。在R軟件中,我們只需要看相應(yīng)的P值,若P值小于α(一般取為0.05),則認(rèn)為是顯著的,反之則不顯著。當(dāng)自變量出現(xiàn)多重共線性時(shí),經(jīng)典回歸方法一般不能通過回歸系數(shù)的顯著性檢驗(yàn),此時(shí)應(yīng)采用主成分回歸以克服經(jīng)典回歸的不足。
二、主成分回歸[3]
主成分法通過線性變換的方式來避開變量間共線性的問題。對(duì)原始變量X1,X2進(jìn)行標(biāo)準(zhǔn)化處理得到相應(yīng)的標(biāo)準(zhǔn)化變量X1*與X2*,計(jì)算原始資料陣的相關(guān)系數(shù)矩陣R的特征值 λ1*≥λ2*,及相應(yīng)的單位特征向量a1*,a2*。利用特征值檢驗(yàn)多重共線性,當(dāng)模型存在多重共線性時(shí)至少會(huì)有一個(gè)特征值接近0。模型中只有兩個(gè)自變量X1和X2,則最多可以提取出兩個(gè)主成分:Zi*=ai*TZ*,i=1,2其中X*=(X1*,X2*)T。假設(shè)因變量與主成分之間的回歸方程為:■=■*0+■*1■*1+L+■*mZ*m,其中Z*i=a*1i+a*2iX*i,i=1,2,L,m,m=1或2。多元線性回歸模型中參數(shù)■i=(i=0,1,2)與主成分回歸模型中系數(shù)■*i之間的關(guān)系為:■0=■*0-■■-■■,■1=■■,■2=■■。則得到■關(guān)于原始變量X1,X2的回歸方程為:■=■0+■1X1+■2X2。
三、計(jì)算結(jié)果分析
本文數(shù)據(jù)[4]中各變量之間的散點(diǎn)圖如圖1:
運(yùn)用R軟件將數(shù)據(jù)先進(jìn)行經(jīng)典的多元線性回歸和顯著性檢驗(yàn)。
得到的回歸方程為:
■=6494.3814+0.4090X1+2.2594X2
在α=0.05的顯著水平下,關(guān)于建筑業(yè)總產(chǎn)值(X1)的P值為0.801>0.05,所以認(rèn)為建筑業(yè)總產(chǎn)值(X1)與GDP(Y)的線性關(guān)系不顯著,與圖1結(jié)果相矛盾。
考慮是否變量間存在多重共線性的問題,對(duì)原數(shù)據(jù)進(jìn)行主成分分析。
主成分分析的結(jié)果見表2。
從表2中我們發(fā)現(xiàn)第一個(gè)主成分已達(dá)到99%的貢獻(xiàn)率,而λ2=0.0562931412=0.00316891≈0所以自變量之間存在著多重共線性。
主成分回歸得到新的回歸系數(shù)和回歸方程,且均通過檢驗(yàn),效果顯著。得到的回歸方程為:■=90396-75257.6Z1*,結(jié)果中得到的R2=0.9966,接近于1,說明擬合效果很好。
上述方程不易于應(yīng)用,需要變換得到原坐標(biāo)下的關(guān)系表達(dá)式,所以最終得到的回歸方程為:
■=6141.687456+7.926687X1+1.159621X2 (1)
從多元線性回歸模型中我們得出服務(wù)業(yè)對(duì)GDP的影響大約是建筑業(yè)的5倍。在對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn)之后,發(fā)現(xiàn)服務(wù)業(yè)總產(chǎn)值與GDP線性相關(guān),而建筑業(yè)總產(chǎn)值則與GDP無線性相關(guān)性,究其原因是自變量之間存在多重共線性。在對(duì)多重共線性進(jìn)行修正后發(fā)現(xiàn)之前的回歸方程并不正確,我們得出了新的回歸方程(1)。根據(jù)式(1)可以看出建筑業(yè)總產(chǎn)值每增長(zhǎng)1元,GDP增加7.93元,服務(wù)業(yè)總產(chǎn)值每增長(zhǎng)1元,GDP增加1.16元。我們發(fā)現(xiàn)建筑業(yè)的發(fā)展對(duì)GDP的影響非常的大,這符合當(dāng)今中國(guó)建筑業(yè)的實(shí)際情況。從另一方面來說,我國(guó)的經(jīng)濟(jì)發(fā)展在一定程度上的確依賴于建筑業(yè)的發(fā)展,如果建筑業(yè)出現(xiàn)危機(jī),將極大阻礙我國(guó)的經(jīng)濟(jì)發(fā)展,發(fā)展這一行業(yè)需要更穩(wěn)健合理的措施。而服務(wù)業(yè)的影響從回歸系數(shù)上看雖然沒有這么大,但由于服務(wù)業(yè)總產(chǎn)值實(shí)際數(shù)據(jù)大約是建筑業(yè)總產(chǎn)值的5至8倍,其基數(shù)相當(dāng)?shù)拇?,所以服?wù)業(yè)的增長(zhǎng)對(duì)GDP也有顯著的拉動(dòng)作用。
參考文獻(xiàn):
[1]全球分析網(wǎng)建筑課題組.2010年中國(guó)建筑行業(yè)總產(chǎn)值分析[N/OL].2013-05-01].
全球分析網(wǎng),2012-06-25.http://zx.qqfx.com.cn/news/103845.html.
[2]楊虎,劉瓊蓀,鐘波.數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2004:125-127.
[3]薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[J].北京:清華大學(xué)出版社,2007:423-441.
[4]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.2011年中國(guó)統(tǒng)計(jì)年鑒[DB/OL].2012.
基金項(xiàng)目:重慶市自然科學(xué)基金項(xiàng)目(CSTC2011BB0058)。
作者簡(jiǎn)介:唐雪銀(1991-),男,重慶人,本科,專業(yè):統(tǒng)計(jì)學(xué);張應(yīng)應(yīng)(1983-),男,重慶人,博士,講師,研究方向:多元統(tǒng)計(jì)分析、期權(quán)定價(jià)。endprint
摘要:本文通過建立多元線性回歸模型,得出中國(guó)GDP與建筑業(yè)總產(chǎn)值和服務(wù)業(yè)總產(chǎn)值的線性回歸方程,并檢驗(yàn)線性回歸方程及線性回歸系數(shù)的顯著性。發(fā)現(xiàn)建筑業(yè)總產(chǎn)值對(duì)應(yīng)的回歸系數(shù)不顯著,究其原因是自變量之間存在多重共線性。然后利用主成分回歸修正多重共線性得出新的回歸方程,最終分析出中國(guó)建筑業(yè)和服務(wù)業(yè)對(duì)于拉動(dòng)中國(guó)經(jīng)濟(jì)增長(zhǎng)的具體作用。
關(guān)鍵詞:GDP;建筑業(yè);服務(wù)業(yè);線性回歸;顯著性檢驗(yàn);多重共線性;主成分回歸
中圖分類號(hào):F12 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)06-0123-03
我國(guó)的經(jīng)濟(jì)增長(zhǎng)速度是國(guó)際上的一個(gè)引人注目的話題。中國(guó)的GDP(國(guó)內(nèi)生產(chǎn)總值)增長(zhǎng)迅猛,同1978年相比,GDP年均增長(zhǎng)近10%,有的地區(qū)超過20%,占世界份額超過5%,即使在最近的經(jīng)濟(jì)危機(jī)中,我國(guó)的GDP仍然能以8%左右的速度增長(zhǎng),可見我國(guó)經(jīng)濟(jì)正處于飛速發(fā)展的階段,且暫無減緩的趨勢(shì)?!笆晃濉逼陂g,我國(guó)建筑業(yè)發(fā)展較為迅速[1]。2010年我國(guó)建筑企業(yè)達(dá)到70061家,從業(yè)人數(shù)達(dá)到了4043.4萬人,中國(guó)房地產(chǎn)業(yè)的火爆大大提升了中國(guó)建筑行業(yè)在國(guó)際上的地位。統(tǒng)計(jì)數(shù)據(jù)顯示,2010年中國(guó)向新建筑項(xiàng)目投入逾1萬億美元,房地產(chǎn)業(yè)的繁榮推動(dòng)中國(guó)首次超越美國(guó),成為全球頭號(hào)建筑大國(guó)。目前建筑業(yè)已經(jīng)成為我國(guó)名副其實(shí)的支柱產(chǎn)業(yè),在國(guó)民經(jīng)濟(jì)中起著重要的支撐性作用,對(duì)于拉動(dòng)經(jīng)濟(jì)增長(zhǎng)和促進(jìn)就業(yè)具有積極的作用。另外,衡量一個(gè)國(guó)家的發(fā)達(dá)程度,其服務(wù)業(yè)占生產(chǎn)總值的比重是一個(gè)關(guān)鍵的數(shù)據(jù)。十一屆全國(guó)人大常委會(huì)第二十二次會(huì)議上提出我國(guó)將推動(dòng)服務(wù)業(yè)加快發(fā)展,力爭(zhēng)到2015年,服務(wù)業(yè)總產(chǎn)值占GDP比重達(dá)到47%左右。通過以往的數(shù)據(jù),我們發(fā)現(xiàn),建筑業(yè)總產(chǎn)值與服務(wù)業(yè)總產(chǎn)值分別與GDP呈一元線性相關(guān),因此我們?cè)噲D在這三者中建立一個(gè)多元線性回歸模型,并通過這樣的模型觀察變量之間的具體關(guān)系。
一、多元線性回歸
(一)符號(hào)與基本假設(shè)
對(duì)各因素賦予變量符號(hào),見表1。
(二)模型構(gòu)建及求解
我們利用多元線性回歸模型。設(shè)(xi1,xi2,yi),i=1,2…,n為(X1,X2,Y)的實(shí)驗(yàn)數(shù)據(jù),則多元線性回歸模型為[2]: yi=β0+β1xi1+β2xi2+ε i=1,2,L,nεi:N(0,σ2), j=1,2,L,ncov(εi,εj)=0 i≠j,i,j=1,2,L,n其矩陣形式為:Y=Xβ+εε~Nn(0,σ2In)其中■,X=1,x11,x121,x21,x22 M1,xn1,xn2,0是n維零向量,In是n階單位陣。當(dāng)X是列滿秩時(shí),可以證明β的最小二乘估計(jì)為:■=(XTX)-1XTY,經(jīng)驗(yàn)回歸方程為:■=■0+■1X1+L+■pXp,設(shè)ε1=Y-X■為殘差向量。通常取■2=■T■/(n-p-1)為■2的估計(jì)(這里p=2),它是σ2的最小二乘估計(jì),■為殘差標(biāo)準(zhǔn)差,它越小越好。相關(guān)系數(shù)的平方定義為:R2=■,其中SSR=■(■i-■)2,SST=■(yi-■)2。用R2來衡量Y與X1,X2,L,Xp之間相關(guān)密切程度,R2越大(接近于1)則所建多元線性回歸模型的擬合程度越好。得到的線性回歸方程需要通過回歸方程的顯著性檢驗(yàn)及回歸系數(shù)的顯著性檢驗(yàn)才能使用。在R軟件中,我們只需要看相應(yīng)的P值,若P值小于α(一般取為0.05),則認(rèn)為是顯著的,反之則不顯著。當(dāng)自變量出現(xiàn)多重共線性時(shí),經(jīng)典回歸方法一般不能通過回歸系數(shù)的顯著性檢驗(yàn),此時(shí)應(yīng)采用主成分回歸以克服經(jīng)典回歸的不足。
二、主成分回歸[3]
主成分法通過線性變換的方式來避開變量間共線性的問題。對(duì)原始變量X1,X2進(jìn)行標(biāo)準(zhǔn)化處理得到相應(yīng)的標(biāo)準(zhǔn)化變量X1*與X2*,計(jì)算原始資料陣的相關(guān)系數(shù)矩陣R的特征值 λ1*≥λ2*,及相應(yīng)的單位特征向量a1*,a2*。利用特征值檢驗(yàn)多重共線性,當(dāng)模型存在多重共線性時(shí)至少會(huì)有一個(gè)特征值接近0。模型中只有兩個(gè)自變量X1和X2,則最多可以提取出兩個(gè)主成分:Zi*=ai*TZ*,i=1,2其中X*=(X1*,X2*)T。假設(shè)因變量與主成分之間的回歸方程為:■=■*0+■*1■*1+L+■*mZ*m,其中Z*i=a*1i+a*2iX*i,i=1,2,L,m,m=1或2。多元線性回歸模型中參數(shù)■i=(i=0,1,2)與主成分回歸模型中系數(shù)■*i之間的關(guān)系為:■0=■*0-■■-■■,■1=■■,■2=■■。則得到■關(guān)于原始變量X1,X2的回歸方程為:■=■0+■1X1+■2X2。
三、計(jì)算結(jié)果分析
本文數(shù)據(jù)[4]中各變量之間的散點(diǎn)圖如圖1:
運(yùn)用R軟件將數(shù)據(jù)先進(jìn)行經(jīng)典的多元線性回歸和顯著性檢驗(yàn)。
得到的回歸方程為:
■=6494.3814+0.4090X1+2.2594X2
在α=0.05的顯著水平下,關(guān)于建筑業(yè)總產(chǎn)值(X1)的P值為0.801>0.05,所以認(rèn)為建筑業(yè)總產(chǎn)值(X1)與GDP(Y)的線性關(guān)系不顯著,與圖1結(jié)果相矛盾。
考慮是否變量間存在多重共線性的問題,對(duì)原數(shù)據(jù)進(jìn)行主成分分析。
主成分分析的結(jié)果見表2。
從表2中我們發(fā)現(xiàn)第一個(gè)主成分已達(dá)到99%的貢獻(xiàn)率,而λ2=0.0562931412=0.00316891≈0所以自變量之間存在著多重共線性。
主成分回歸得到新的回歸系數(shù)和回歸方程,且均通過檢驗(yàn),效果顯著。得到的回歸方程為:■=90396-75257.6Z1*,結(jié)果中得到的R2=0.9966,接近于1,說明擬合效果很好。
上述方程不易于應(yīng)用,需要變換得到原坐標(biāo)下的關(guān)系表達(dá)式,所以最終得到的回歸方程為:
■=6141.687456+7.926687X1+1.159621X2 (1)
從多元線性回歸模型中我們得出服務(wù)業(yè)對(duì)GDP的影響大約是建筑業(yè)的5倍。在對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn)之后,發(fā)現(xiàn)服務(wù)業(yè)總產(chǎn)值與GDP線性相關(guān),而建筑業(yè)總產(chǎn)值則與GDP無線性相關(guān)性,究其原因是自變量之間存在多重共線性。在對(duì)多重共線性進(jìn)行修正后發(fā)現(xiàn)之前的回歸方程并不正確,我們得出了新的回歸方程(1)。根據(jù)式(1)可以看出建筑業(yè)總產(chǎn)值每增長(zhǎng)1元,GDP增加7.93元,服務(wù)業(yè)總產(chǎn)值每增長(zhǎng)1元,GDP增加1.16元。我們發(fā)現(xiàn)建筑業(yè)的發(fā)展對(duì)GDP的影響非常的大,這符合當(dāng)今中國(guó)建筑業(yè)的實(shí)際情況。從另一方面來說,我國(guó)的經(jīng)濟(jì)發(fā)展在一定程度上的確依賴于建筑業(yè)的發(fā)展,如果建筑業(yè)出現(xiàn)危機(jī),將極大阻礙我國(guó)的經(jīng)濟(jì)發(fā)展,發(fā)展這一行業(yè)需要更穩(wěn)健合理的措施。而服務(wù)業(yè)的影響從回歸系數(shù)上看雖然沒有這么大,但由于服務(wù)業(yè)總產(chǎn)值實(shí)際數(shù)據(jù)大約是建筑業(yè)總產(chǎn)值的5至8倍,其基數(shù)相當(dāng)?shù)拇?,所以服?wù)業(yè)的增長(zhǎng)對(duì)GDP也有顯著的拉動(dòng)作用。
參考文獻(xiàn):
[1]全球分析網(wǎng)建筑課題組.2010年中國(guó)建筑行業(yè)總產(chǎn)值分析[N/OL].2013-05-01].
全球分析網(wǎng),2012-06-25.http://zx.qqfx.com.cn/news/103845.html.
[2]楊虎,劉瓊蓀,鐘波.數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2004:125-127.
[3]薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[J].北京:清華大學(xué)出版社,2007:423-441.
[4]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.2011年中國(guó)統(tǒng)計(jì)年鑒[DB/OL].2012.
基金項(xiàng)目:重慶市自然科學(xué)基金項(xiàng)目(CSTC2011BB0058)。
作者簡(jiǎn)介:唐雪銀(1991-),男,重慶人,本科,專業(yè):統(tǒng)計(jì)學(xué);張應(yīng)應(yīng)(1983-),男,重慶人,博士,講師,研究方向:多元統(tǒng)計(jì)分析、期權(quán)定價(jià)。endprint
摘要:本文通過建立多元線性回歸模型,得出中國(guó)GDP與建筑業(yè)總產(chǎn)值和服務(wù)業(yè)總產(chǎn)值的線性回歸方程,并檢驗(yàn)線性回歸方程及線性回歸系數(shù)的顯著性。發(fā)現(xiàn)建筑業(yè)總產(chǎn)值對(duì)應(yīng)的回歸系數(shù)不顯著,究其原因是自變量之間存在多重共線性。然后利用主成分回歸修正多重共線性得出新的回歸方程,最終分析出中國(guó)建筑業(yè)和服務(wù)業(yè)對(duì)于拉動(dòng)中國(guó)經(jīng)濟(jì)增長(zhǎng)的具體作用。
關(guān)鍵詞:GDP;建筑業(yè);服務(wù)業(yè);線性回歸;顯著性檢驗(yàn);多重共線性;主成分回歸
中圖分類號(hào):F12 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)06-0123-03
我國(guó)的經(jīng)濟(jì)增長(zhǎng)速度是國(guó)際上的一個(gè)引人注目的話題。中國(guó)的GDP(國(guó)內(nèi)生產(chǎn)總值)增長(zhǎng)迅猛,同1978年相比,GDP年均增長(zhǎng)近10%,有的地區(qū)超過20%,占世界份額超過5%,即使在最近的經(jīng)濟(jì)危機(jī)中,我國(guó)的GDP仍然能以8%左右的速度增長(zhǎng),可見我國(guó)經(jīng)濟(jì)正處于飛速發(fā)展的階段,且暫無減緩的趨勢(shì)?!笆晃濉逼陂g,我國(guó)建筑業(yè)發(fā)展較為迅速[1]。2010年我國(guó)建筑企業(yè)達(dá)到70061家,從業(yè)人數(shù)達(dá)到了4043.4萬人,中國(guó)房地產(chǎn)業(yè)的火爆大大提升了中國(guó)建筑行業(yè)在國(guó)際上的地位。統(tǒng)計(jì)數(shù)據(jù)顯示,2010年中國(guó)向新建筑項(xiàng)目投入逾1萬億美元,房地產(chǎn)業(yè)的繁榮推動(dòng)中國(guó)首次超越美國(guó),成為全球頭號(hào)建筑大國(guó)。目前建筑業(yè)已經(jīng)成為我國(guó)名副其實(shí)的支柱產(chǎn)業(yè),在國(guó)民經(jīng)濟(jì)中起著重要的支撐性作用,對(duì)于拉動(dòng)經(jīng)濟(jì)增長(zhǎng)和促進(jìn)就業(yè)具有積極的作用。另外,衡量一個(gè)國(guó)家的發(fā)達(dá)程度,其服務(wù)業(yè)占生產(chǎn)總值的比重是一個(gè)關(guān)鍵的數(shù)據(jù)。十一屆全國(guó)人大常委會(huì)第二十二次會(huì)議上提出我國(guó)將推動(dòng)服務(wù)業(yè)加快發(fā)展,力爭(zhēng)到2015年,服務(wù)業(yè)總產(chǎn)值占GDP比重達(dá)到47%左右。通過以往的數(shù)據(jù),我們發(fā)現(xiàn),建筑業(yè)總產(chǎn)值與服務(wù)業(yè)總產(chǎn)值分別與GDP呈一元線性相關(guān),因此我們?cè)噲D在這三者中建立一個(gè)多元線性回歸模型,并通過這樣的模型觀察變量之間的具體關(guān)系。
一、多元線性回歸
(一)符號(hào)與基本假設(shè)
對(duì)各因素賦予變量符號(hào),見表1。
(二)模型構(gòu)建及求解
我們利用多元線性回歸模型。設(shè)(xi1,xi2,yi),i=1,2…,n為(X1,X2,Y)的實(shí)驗(yàn)數(shù)據(jù),則多元線性回歸模型為[2]: yi=β0+β1xi1+β2xi2+ε i=1,2,L,nεi:N(0,σ2), j=1,2,L,ncov(εi,εj)=0 i≠j,i,j=1,2,L,n其矩陣形式為:Y=Xβ+εε~Nn(0,σ2In)其中■,X=1,x11,x121,x21,x22 M1,xn1,xn2,0是n維零向量,In是n階單位陣。當(dāng)X是列滿秩時(shí),可以證明β的最小二乘估計(jì)為:■=(XTX)-1XTY,經(jīng)驗(yàn)回歸方程為:■=■0+■1X1+L+■pXp,設(shè)ε1=Y-X■為殘差向量。通常取■2=■T■/(n-p-1)為■2的估計(jì)(這里p=2),它是σ2的最小二乘估計(jì),■為殘差標(biāo)準(zhǔn)差,它越小越好。相關(guān)系數(shù)的平方定義為:R2=■,其中SSR=■(■i-■)2,SST=■(yi-■)2。用R2來衡量Y與X1,X2,L,Xp之間相關(guān)密切程度,R2越大(接近于1)則所建多元線性回歸模型的擬合程度越好。得到的線性回歸方程需要通過回歸方程的顯著性檢驗(yàn)及回歸系數(shù)的顯著性檢驗(yàn)才能使用。在R軟件中,我們只需要看相應(yīng)的P值,若P值小于α(一般取為0.05),則認(rèn)為是顯著的,反之則不顯著。當(dāng)自變量出現(xiàn)多重共線性時(shí),經(jīng)典回歸方法一般不能通過回歸系數(shù)的顯著性檢驗(yàn),此時(shí)應(yīng)采用主成分回歸以克服經(jīng)典回歸的不足。
二、主成分回歸[3]
主成分法通過線性變換的方式來避開變量間共線性的問題。對(duì)原始變量X1,X2進(jìn)行標(biāo)準(zhǔn)化處理得到相應(yīng)的標(biāo)準(zhǔn)化變量X1*與X2*,計(jì)算原始資料陣的相關(guān)系數(shù)矩陣R的特征值 λ1*≥λ2*,及相應(yīng)的單位特征向量a1*,a2*。利用特征值檢驗(yàn)多重共線性,當(dāng)模型存在多重共線性時(shí)至少會(huì)有一個(gè)特征值接近0。模型中只有兩個(gè)自變量X1和X2,則最多可以提取出兩個(gè)主成分:Zi*=ai*TZ*,i=1,2其中X*=(X1*,X2*)T。假設(shè)因變量與主成分之間的回歸方程為:■=■*0+■*1■*1+L+■*mZ*m,其中Z*i=a*1i+a*2iX*i,i=1,2,L,m,m=1或2。多元線性回歸模型中參數(shù)■i=(i=0,1,2)與主成分回歸模型中系數(shù)■*i之間的關(guān)系為:■0=■*0-■■-■■,■1=■■,■2=■■。則得到■關(guān)于原始變量X1,X2的回歸方程為:■=■0+■1X1+■2X2。
三、計(jì)算結(jié)果分析
本文數(shù)據(jù)[4]中各變量之間的散點(diǎn)圖如圖1:
運(yùn)用R軟件將數(shù)據(jù)先進(jìn)行經(jīng)典的多元線性回歸和顯著性檢驗(yàn)。
得到的回歸方程為:
■=6494.3814+0.4090X1+2.2594X2
在α=0.05的顯著水平下,關(guān)于建筑業(yè)總產(chǎn)值(X1)的P值為0.801>0.05,所以認(rèn)為建筑業(yè)總產(chǎn)值(X1)與GDP(Y)的線性關(guān)系不顯著,與圖1結(jié)果相矛盾。
考慮是否變量間存在多重共線性的問題,對(duì)原數(shù)據(jù)進(jìn)行主成分分析。
主成分分析的結(jié)果見表2。
從表2中我們發(fā)現(xiàn)第一個(gè)主成分已達(dá)到99%的貢獻(xiàn)率,而λ2=0.0562931412=0.00316891≈0所以自變量之間存在著多重共線性。
主成分回歸得到新的回歸系數(shù)和回歸方程,且均通過檢驗(yàn),效果顯著。得到的回歸方程為:■=90396-75257.6Z1*,結(jié)果中得到的R2=0.9966,接近于1,說明擬合效果很好。
上述方程不易于應(yīng)用,需要變換得到原坐標(biāo)下的關(guān)系表達(dá)式,所以最終得到的回歸方程為:
■=6141.687456+7.926687X1+1.159621X2 (1)
從多元線性回歸模型中我們得出服務(wù)業(yè)對(duì)GDP的影響大約是建筑業(yè)的5倍。在對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn)之后,發(fā)現(xiàn)服務(wù)業(yè)總產(chǎn)值與GDP線性相關(guān),而建筑業(yè)總產(chǎn)值則與GDP無線性相關(guān)性,究其原因是自變量之間存在多重共線性。在對(duì)多重共線性進(jìn)行修正后發(fā)現(xiàn)之前的回歸方程并不正確,我們得出了新的回歸方程(1)。根據(jù)式(1)可以看出建筑業(yè)總產(chǎn)值每增長(zhǎng)1元,GDP增加7.93元,服務(wù)業(yè)總產(chǎn)值每增長(zhǎng)1元,GDP增加1.16元。我們發(fā)現(xiàn)建筑業(yè)的發(fā)展對(duì)GDP的影響非常的大,這符合當(dāng)今中國(guó)建筑業(yè)的實(shí)際情況。從另一方面來說,我國(guó)的經(jīng)濟(jì)發(fā)展在一定程度上的確依賴于建筑業(yè)的發(fā)展,如果建筑業(yè)出現(xiàn)危機(jī),將極大阻礙我國(guó)的經(jīng)濟(jì)發(fā)展,發(fā)展這一行業(yè)需要更穩(wěn)健合理的措施。而服務(wù)業(yè)的影響從回歸系數(shù)上看雖然沒有這么大,但由于服務(wù)業(yè)總產(chǎn)值實(shí)際數(shù)據(jù)大約是建筑業(yè)總產(chǎn)值的5至8倍,其基數(shù)相當(dāng)?shù)拇?,所以服?wù)業(yè)的增長(zhǎng)對(duì)GDP也有顯著的拉動(dòng)作用。
參考文獻(xiàn):
[1]全球分析網(wǎng)建筑課題組.2010年中國(guó)建筑行業(yè)總產(chǎn)值分析[N/OL].2013-05-01].
全球分析網(wǎng),2012-06-25.http://zx.qqfx.com.cn/news/103845.html.
[2]楊虎,劉瓊蓀,鐘波.數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2004:125-127.
[3]薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[J].北京:清華大學(xué)出版社,2007:423-441.
[4]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.2011年中國(guó)統(tǒng)計(jì)年鑒[DB/OL].2012.
基金項(xiàng)目:重慶市自然科學(xué)基金項(xiàng)目(CSTC2011BB0058)。
作者簡(jiǎn)介:唐雪銀(1991-),男,重慶人,本科,專業(yè):統(tǒng)計(jì)學(xué);張應(yīng)應(yīng)(1983-),男,重慶人,博士,講師,研究方向:多元統(tǒng)計(jì)分析、期權(quán)定價(jià)。endprint