文/黎育權(quán)
長期以來,人口增長預(yù)測一直是有著十分重要意義的一個課題。通過預(yù)測未來的人口數(shù)量,相關(guān)部門可以做出更好的決策,使得社會資源更好的分配。學(xué)者們已經(jīng)提出各種各樣的線性回歸模型以及多元線性模型,人口是非線性的現(xiàn)代,灰色模型和神經(jīng)網(wǎng)絡(luò)模型,較準(zhǔn)確,但很多研究都是從人口基數(shù)趨勢的角度出發(fā),沒有考慮根本原因。本論文從其根源考慮人口增長的多個因素,并使用科學(xué)的方法進(jìn)行預(yù)測,使得人口預(yù)測更加的準(zhǔn)確。
BP 神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣泛且十分強(qiáng)大的一種人工神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)通常擁有至少三層,包括輸入層、一個或多個隱藏層和輸出層。BP神經(jīng)網(wǎng)絡(luò)的最大特點是強(qiáng)大的映射能力,只要 BP 神經(jīng)網(wǎng)絡(luò)中隱藏層的神經(jīng)元足夠,并以足夠的數(shù)據(jù)進(jìn)行訓(xùn)練,足以以任何一個精度無限逼近某個非線性函數(shù)。
參考人口因素分析文獻(xiàn),預(yù)挑選出多個指標(biāo)并從國家數(shù)據(jù)統(tǒng)計局官網(wǎng)取得數(shù)據(jù)。首先進(jìn)行主成分分析法進(jìn)行處理,運用降低數(shù)據(jù)緯度的思想,把多個因子轉(zhuǎn)換5個因子。隨后對
圖1:神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
特征進(jìn)行相關(guān)性分析,死亡率與增長人口的Pearson、Spearman系數(shù)皆小于0.5,相關(guān)性不強(qiáng),故剔除死亡率因子。最終得到經(jīng)過處理的人口基數(shù)、人口出生率、經(jīng)濟(jì)因子、普通高等學(xué)校招生數(shù)和高校數(shù)量五個因子1978-2015年的數(shù)據(jù),以及經(jīng)過處理的1979-2015年增長人口數(shù)據(jù)。
BP神經(jīng)網(wǎng)絡(luò)采用Adam算法為學(xué)習(xí)方法,損失函數(shù)采用MSE,全局學(xué)習(xí)速率設(shè)置0.001,一階據(jù)估計指數(shù)衰減率設(shè)置為0.9,二階據(jù)估計指數(shù)衰減率設(shè)置為0.99,epsilon極小值設(shè)置為10e-8,期望誤差值為0.00001,訓(xùn)練步數(shù)設(shè)置為10000。確定了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù),搭建如圖1結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)。
使用1978-2014年的因子數(shù)據(jù)和次年增長人口作為作為訓(xùn)練集訓(xùn)練神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)在第8592步收斂到理想狀態(tài),誤差小于理想誤差。使用同樣的參數(shù)和方法搭建一個一元輸入的神經(jīng)網(wǎng)絡(luò)用于因子的短期預(yù)測。并將因子短期預(yù)測所得到的值作為輸入,預(yù)測未來2016~2021年的人口增長數(shù)。
由預(yù)測結(jié)果可知,在2019年年末,我國人口將達(dá)到14億,并在2016~2021年持續(xù)保持平均0.510%的增長速率。使用神經(jīng)網(wǎng)絡(luò)對人口進(jìn)行較準(zhǔn)確的短期預(yù)測是可行的,但因為各個影響因子和人口增長具有的混沌特性,對于長期預(yù)測則缺乏科學(xué)性,不做討論。