張二麗, 汪太行, 王玉龍
(1.鄭州財經(jīng)學院 統(tǒng)計與大數(shù)據(jù)學院,河南 鄭州 450044; 2.鄭州財經(jīng)學院 中原統(tǒng)計研究所,河南 鄭州 450044; 3.鄭州財經(jīng)學院 信息工程學院,河南 鄭州 450044)
從21世紀開始,人口老齡化引起了社會和政府的高度重視,眾多學者展開了關于人口老齡化問題的研究?;趯ξ墨I[1-6]的研究,并結合《中國統(tǒng)計年鑒》《中國人口統(tǒng)計年鑒》《中國衛(wèi)生統(tǒng)計年鑒》的相關數(shù)據(jù),在建立多元線性回歸模型分析人口老齡化問題時,選取了15~64歲人口數(shù)、人均GDP、人口的出生率、社會衛(wèi)生總支出、0~14歲人口數(shù)、人口自然增長率、總人口數(shù)、人口密度作為主要因素進行分析。根據(jù)國際上對人口老齡化的劃分標準,選取65歲及以上人口數(shù)和占總人口比重作為研究指標,分別建立關于65歲及以上總人口數(shù)以及比重的多元線性回歸模型,研究以上因素對我國人口老齡化趨勢產(chǎn)生的影響及意義。
1) 選取的樣本之間相對獨立;
2) 自變量、因變量二者之間的相關性非常顯著;
3) 各項研究指標服從正態(tài)分布;
4) 隨機誤差εi服從期望值為零的正態(tài)分布。
本文中用到的符號說明見表1。
本文所使用數(shù)據(jù)主要來自《中國統(tǒng)計年鑒》《中國人口統(tǒng)計年鑒》《中國衛(wèi)生統(tǒng)計年鑒》1988—2018年的各項數(shù)據(jù)。根據(jù)聯(lián)合國對人口老齡化確定的劃分標準,選取65 歲及以上人口數(shù)和占總人口比重作為研究指標。
對x1至x8共8個因素進行相關性分析,利用SPSS軟件得到的結果如表2所示。
從表2中可看出x1,x2,x3,x4,x5,x6,x7,x8,y1,y2的皮爾遜相關性在0.01水平(雙側)上顯著相關,檢驗P值均小于0.01,說明各變量與y1,y2的相關性是顯著的。為了進一步考察各項研究指標對人口老齡化的影響關系和影響因素,將研究以上各變量之間對y1、y2的影響。
表1 符號說明
表2 各個變量之間的相關系數(shù)及相關檢驗系數(shù)P值
根據(jù)相關分析的結果可知,各項研究指標對老齡化系數(shù)和老年人口總數(shù)都會產(chǎn)生影響。為研究這些指標對老齡化問題的具體影響,同時,又為預測人口老齡化系數(shù)和65歲及以上老年人口總數(shù),分別建立y1與x1,x2,x3,x4,x5,x6,x7,x8和y2與x1,x2,x3,x4,x5,x6,x7,x8之間的多元線性回歸方程。由于自變量間可能存在共線性現(xiàn)象,因此,采用逐步回歸方法,從所有可供選擇的自變量中逐步地剔除單個不顯著的變量,利用SPSS軟件得到相關的輸出結果如表3所示。表3中有3個模型(模型1、模型2、模型3),從調整R擬合優(yōu)度來看,模型3的擬合優(yōu)度明顯比模型1和模型2好(0.996>0.995>0.970)。
從表4中易知“模型3”中的“回歸平方和”為225 674 251.900,“殘差平方和”為713 695.056,總平方和=回歸平方和+殘差平方和。根據(jù)表4中統(tǒng)計量F的顯著性水平為0.000,0.000<0.01,隨著預測變量的引入,顯著性水平均小于0.01,由此證明了原假設不成立。通過表4可以看出變量y1與x3、x4、x5之間存在線性關系。至于線性關系的強弱,需要進一步進行分析。
表3 模型擬合情況
表4 全模型F檢驗(ANOVA)情況
基于表5易見,“模型3”中各變量的T檢驗的Sig.值都大于0.05,說明表中各變量對因變量的影響不顯著,因此不能引入線性回歸模型,必須排除。
表5 排除的變量情況
從表6中可以看出多元線性回歸方程應該為
y1=18 532.588+0.130×x4-362.105×x5-0.064×x3。
表6 回歸方程待估系數(shù)的估計情況
圖1為殘差分布的直方圖,直方圖上,殘差分布大致呈正態(tài)分布,不存在極端值。圖2為因變量累計概率和模型預測值累計概率間的P-P圖,殘差散點呈直線趨勢,符合正態(tài)分布,也不存在極端值。
圖1 標準化殘差直方圖
圖2 P-P概率圖
通過表7可知,有3個模型(模型4、模型5、模型6),從調整R擬合優(yōu)度來看,模型6的擬合優(yōu)度明顯比模型4和模型5好(0.996>0.993>0.977)。
表7 模型擬合情況
根據(jù)表8中,統(tǒng)計量F的顯著性水平為0.000,0.000<0.01,隨著預測變量的引入,顯著性水平均小于0.01,由此證明了原假設不成立。通過表8可以看出變量y2與x3、x4、x5之間存在線性關系。
表8 全模型F檢驗(ANOVA)情況
表9 排除的變量情況
表10 回歸方程待估系數(shù)的估計情況
從表9中可以看出,“模型6”中各變量的T檢驗的Sig.值都大于0.05,說明表中各變量對因變量的影響不顯著,因此不能引入線性回歸模型,必須排除。
從表10中得出多元線性回歸方程為
y2=13.761+(8.516E-5)×x4-0.216×x5-(4.991E-5)×x3。
圖3為殘差分布的直方圖,直方圖上,殘差分布大致呈正態(tài)分布,不存在極端值。圖4為因變量累計概率和模型預測值累計概率間的P-P圖,殘差散點呈直線趨勢,符合正態(tài)分布,也不存在極端值。
圖3 標準化殘差直方圖
圖4 P-P概率圖
從上述輸出結果可以看出,模型通過了F檢驗和T檢驗,有較高的擬合優(yōu)度。根據(jù)回歸方程所得到的等級相關系數(shù),這些結果說明模型中不存在多重共線性、自相關,說明模型擬合效果較好。
因此,得到可用于預測老年人口總數(shù)的模型
y1=18 532.588+0.130×x4-362.105×x5-0.064×x3
(1)
和預測老齡化比重的模型
y2=13.761+(8.516E-5)×x4-0.216×x5-(4.991E-5)×x3。
(2)
前面已對模型進行了相關的分析檢驗,通過(1)(2)兩個模型預測未來65歲及以上人口總數(shù)和老齡人口所占比重。用模型預測2014—2018年的老年人口比重,并與年鑒里的實際值進行比較(表11),以此檢驗模型的預測能力以及應用價值。
表11 模型的預測值和實際值比較
由表11可見,模型的預測值與實際值相差不大,很好地證明了該模型具有合理性。本模型在原始數(shù)據(jù)相對較多的情況下,通過對多個自變量的篩選得出多元線性回歸模型,具有很好的預測價值,可以應用于我國相關部門今后進行老齡化進程的預測。
同時在模型中可以看出,15~64歲人口總數(shù)、人均國內生產(chǎn)總值、人口出生率是我國老年人口總數(shù)和人口比重最重要的影響因素。針對如何解決人口老齡化問題,需要提高出生率,提升兒童人口在總人口中所占的比重,可以快速解決人口老齡化問題。人均國內生產(chǎn)總值狀況直接決定和影響著一個國家在居民收入和生活水平及其社會建設方面的投入能力和投入水平。提高人均國內生產(chǎn)總值,可以有效地促進老齡產(chǎn)業(yè)、老年消費市場的發(fā)展,改善我國老年人的晚年生活質量,提高其生活水平。老年人口負擔系數(shù)是指在一定地域范圍內的65歲及以上老年人口總數(shù)與15~64歲人口總數(shù)之比。提高15~64歲人口總數(shù)(勞動人口年齡規(guī)定為15~64歲),有利于降低老年人口負擔系數(shù)。
本文對影響中國人口老齡化的8個因素進行相關性分析,利用SPSS軟件找出了影響老齡化的3個重要因素為人口的出生率 、15~64歲人口、人均國內生產(chǎn)總值,并建立多元線性回歸模型,對老年人口數(shù)量、老年人口比重進行預測,從而為國家相關部門解決老齡化問題提供數(shù)據(jù)參考。