何思蘭 孫紅兵
(昆明理工大學(xué)理學(xué)院 昆明 650500)
?
基于灰色預(yù)測和BP神經(jīng)網(wǎng)絡(luò)模型的云南省人口總量預(yù)測研究*
何思蘭孫紅兵
(昆明理工大學(xué)理學(xué)院昆明650500)
摘要人口問題一直是關(guān)系經(jīng)濟(jì)增長和社會穩(wěn)定的關(guān)鍵問題,因此科學(xué)準(zhǔn)確的人口預(yù)測也越來越重要。論文通過利用歷年中國統(tǒng)計(jì)年鑒上云南省人口總量數(shù)據(jù),分別應(yīng)用灰色預(yù)測和BP神經(jīng)網(wǎng)絡(luò)模型對2000~2013年人口總量數(shù)據(jù)進(jìn)行仿真模擬,考慮單一預(yù)測模型的局限性,然后利用標(biāo)準(zhǔn)差法對單一預(yù)測仿真結(jié)果進(jìn)行權(quán)重分配,建立了組合預(yù)測模型。模型結(jié)果表明,組合預(yù)測模型優(yōu)于單一的灰色預(yù)測模型和BP神經(jīng)網(wǎng)絡(luò)模型,具有較高的精度。最后利用組合預(yù)測模型,對2014~2025年的人口總量進(jìn)行了短期預(yù)測,結(jié)果表明,到2024年人口總量將突破5000萬人,人口增長速度大概維持在0.6%左右。
關(guān)鍵詞灰色預(yù)測; BP神經(jīng)網(wǎng)絡(luò); 組合預(yù)測模型
Population Prediction Research in Yunnan Province Based on Grey Prediction and BP Neural Network
HE SilanSUN Hongbing
(Department of Science, Kunming University of Science and Technology, Kunming650500)
AbstractThe population problem has always been a key issue in the economic growth and social stability, so scientific and accurate forecast of the population is becoming more and more important. In this paper, by using the total population of yunnan province in China statistical yearbook data, simulation the population from 2000 to 2013 by the grey prediction model and BP neural network model, considering the limitations of single forecasting model, then using the method of standard deviation to weight distribution of single forecasting results, that is the combined forecasting model. Model results show that the combined forecasting model is superior to the single grey prediction model and BP neural network model, and it has high precision. Finally the population from 2014 to 2025 is forecasted by combined forecasting model, the results show that the population will exceed 50 million until 2024, and the population growth remain at around 0.6%.
Key Wordsgrey prediction, BP neural network, combination forecasting method
Class NumberC924
1引言
人口數(shù)量的多少不僅影響國民經(jīng)濟(jì)發(fā)展,也影響社會穩(wěn)定、勞動力就業(yè)以及資源的可持續(xù)利用等重要因素。在一定程度上科學(xué)準(zhǔn)確的人口預(yù)測,可為政府制定人口有關(guān)政策提供理論依據(jù)。云南省是西南地區(qū)人口大省,也是中國重要的少數(shù)民族聚居區(qū),截至2013年總?cè)丝跀?shù)已達(dá)到4686.6萬人,雖然較2012年人口增長率有所下降,但是人口基數(shù)還是較大,人口問題還是面臨眾多挑戰(zhàn),對于人口的研究有著重要的理論與實(shí)際意義。
人口預(yù)測是以人口發(fā)展規(guī)律作為預(yù)測主體,將人口分析與預(yù)測方法結(jié)合運(yùn)用的過程。近年來,在國內(nèi)人口預(yù)測研究中,不同學(xué)者從不同角度對人口問題進(jìn)行了大量研究。最早的是宋健[1]以控制論為基礎(chǔ),把總和生育率作為控制因子,建立人口控制偏微分方程來預(yù)測未來人口趨勢[2],但是模型中需要大量的準(zhǔn)確數(shù)據(jù)來確定參數(shù),而這些數(shù)據(jù)的獲取有一定難度;鄧聚龍[3~4]建立的灰色預(yù)測模型可以在信息量不多的情況下得到較高精度的預(yù)測結(jié)果,使其應(yīng)用在人口預(yù)測方面也越來越多[5~7];人工神經(jīng)網(wǎng)絡(luò)[8~10]由于它的自學(xué)習(xí)功能以及可以充分逼近任意復(fù)雜的非線性關(guān)系等優(yōu)點(diǎn),近些年來也延伸到了人口預(yù)測的運(yùn)用上。但考慮到單一預(yù)測方法的局限性,本文提出了一種基于灰色預(yù)測和神經(jīng)網(wǎng)絡(luò)預(yù)測模型的組合預(yù)測模型,充分利用單一預(yù)測模型的信息,揚(yáng)長避短,用以預(yù)測云南省短期人口總量變化趨勢。
2灰色預(yù)測模型
2.1模型介紹
灰色預(yù)測模型(GM(1,1))是最常用的對時間序列預(yù)測的一種灰色預(yù)測模型,模型的實(shí)質(zhì)是對原始序列作一次累加生成,然后建立一階線性微分方程模型,得到擬合函數(shù)以對系統(tǒng)進(jìn)行預(yù)測。其主要過程如下:
1) 累加生成新序列
已知X(0)=(X(0)(1),X(0)(2),…,X(0)(n))為原始數(shù)列,其中此文X(0)(·)表示云南省歷年人口總數(shù)。對原始數(shù)據(jù)進(jìn)行一次累加生成,以弱化原始序列的隨機(jī)性和波動性,得到生成序列:
X(1)=(X(1)(1),X(1)(2),…,X(1)(n))
2) 構(gòu)建GM(1,1)模型
3) 求解a,u
利用最小二乘法,求解a,u為:A=[a,u]T=(BTB)-1BTY,其中
4) 預(yù)測結(jié)果及還原
5) 對預(yù)測模型進(jìn)行誤差檢驗(yàn)。
2.2數(shù)值模擬
與傳統(tǒng)的預(yù)測方法相比,灰色預(yù)測方法具有只需少量原始數(shù)據(jù)便可得到比較精確的結(jié)果,通過嘗試,本文選取2000~2013年的人口數(shù)據(jù)進(jìn)行預(yù)測可達(dá)較高精度,結(jié)果如表1所示。
表1 GM(1,1)預(yù)測結(jié)果
經(jīng)計(jì)算可得,GM(1,1)預(yù)測模型為
關(guān)聯(lián)度檢驗(yàn):r=0.625是滿足p=0.5時的檢驗(yàn)準(zhǔn)則r>0.6的;后驗(yàn)差檢驗(yàn):計(jì)算方差比c=S1/S0=0.0473,(其中S0,S1分別為原始序列和殘差的均方差),并且小殘差概率P=1,模擬值精度達(dá)到了一級標(biāo)準(zhǔn),由此可知該模型可用于對云南省短期的人口總量預(yù)測。
3BP神經(jīng)網(wǎng)絡(luò)模型
3.1模型介紹
BP神經(jīng)網(wǎng)絡(luò)是由多個神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò),它具有記憶、聯(lián)想、自適應(yīng)、并行處理和非線性轉(zhuǎn)換等一系列優(yōu)點(diǎn)。BP神經(jīng)網(wǎng)絡(luò)通常是一種三層或三層以上的前向型神經(jīng)網(wǎng)絡(luò),包括輸入層、一個或多個隱含層和輸出層。其模型結(jié)構(gòu)如圖1所示。
BP神經(jīng)網(wǎng)絡(luò)模型最大的特點(diǎn)就是在未知因變量和自變量之間的映射關(guān)系時,僅僅利用變量和結(jié)果可仿真模擬出一個穩(wěn)定的神經(jīng)映射。一個完整的BP神經(jīng)網(wǎng)絡(luò)由信息的正向傳播和誤差的反向傳播兩個過程組成。它的算法是:將輸入的數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)經(jīng)過隱含層處理后由最后一個隱層傳遞到輸出層各神經(jīng)元,至此完成一次學(xué)習(xí)的正向傳播處理過程,由輸出層向外界輸出信息處理結(jié)果。在正向?qū)W習(xí)過程中,輸人層、隱含層和輸出層面上的各個節(jié)點(diǎn)的權(quán)重都是隨機(jī)分配取值。當(dāng)實(shí)際輸出與期望輸出不符,或者模型精度偏差過大而沒有達(dá)到預(yù)設(shè)精度時,處理結(jié)果會被保留并進(jìn)入誤差的逆向傳播階段,誤差通過輸出層按誤差梯度下降的方式修正各層權(quán)值,向隱層、輸入層逐層反傳,以使網(wǎng)絡(luò)的輸出不斷地接近期望的輸出,直到運(yùn)算結(jié)果達(dá)到滿意精度或者預(yù)設(shè)學(xué)習(xí)步數(shù)為止。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP模型的算法步驟如下:
1) 初始化全部連接權(quán)值w,v及閾值θ,γ賦予(0,1)區(qū)間的隨機(jī)值,設(shè)置最大迭代次數(shù)和誤差限;
2) 對初始數(shù)據(jù)進(jìn)行歸一化,輸入學(xué)習(xí)樣本(P,T);
3) 據(jù)各輸出單元的輸出函數(shù)計(jì)算各樣本模式隱層和輸出層各單元的實(shí)際輸出值;
4) 輸出層開始,反方向調(diào)整權(quán)系數(shù)值和神經(jīng)元閾值;
5) 計(jì)算輸出層和隱含層的樣本誤差和總誤差;
6) 樣本期望輸出誤差小于給定收斂值,則轉(zhuǎn)至步驟7),否則繼續(xù)步驟3);
7) 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)結(jié)束。
3.2數(shù)值模擬
由于神經(jīng)網(wǎng)絡(luò)需要比較多的數(shù)據(jù)作為訓(xùn)練樣本,本文中,我們選取中國人口統(tǒng)計(jì)年鑒上1978~2000年云南省人口總量作為訓(xùn)練樣本數(shù)據(jù),2001~2013年數(shù)據(jù)作為檢驗(yàn)樣本數(shù)據(jù),采用具有一個隱含層的三層BP神經(jīng)網(wǎng)絡(luò)預(yù)測系統(tǒng)進(jìn)行人口預(yù)測,通過試算法來確定輸入節(jié)點(diǎn)和隱含節(jié)點(diǎn),輸出結(jié)點(diǎn)數(shù)取為1。通過試算和仿真,輸入節(jié)點(diǎn)取8個,隱含節(jié)點(diǎn)取10個,選取“tansig”作為輸入節(jié)點(diǎn)和隱含層節(jié)點(diǎn)之間的傳輸函數(shù),選取“l(fā)ogsig”作為連接隱含層和輸出層節(jié)點(diǎn)的傳輸函數(shù),選取“traingdm”為網(wǎng)絡(luò)的訓(xùn)練函數(shù)。結(jié)果如表2所示。
表2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
由以上兩種單一預(yù)測數(shù)據(jù)可知,它們的相對誤差最大不超過1%,具有較好的精度?;疑A(yù)測的最大相對誤差0.58%小于BP神經(jīng)網(wǎng)絡(luò)的最大相對誤差0.66%,平均相對誤差0.21%大于BP神經(jīng)網(wǎng)絡(luò)的0.19%。并且灰色預(yù)測模型只對短期預(yù)測精度較好,而不適合中長期預(yù)測,而BP神經(jīng)網(wǎng)絡(luò)預(yù)測沒有關(guān)于后期的模型檢驗(yàn),可能具有偶然性,為了充分利用單一預(yù)測的有效信息,克服單一模型的缺陷,減少預(yù)測的隨機(jī)性,提高預(yù)測精度,我們引入組合預(yù)測模型。
4人口總量組合預(yù)測模型
組合預(yù)測方法是由Bates和Granger[11]在1969年提出的一種預(yù)測方法,考慮單一預(yù)測方法的局限性,綜合利用各種預(yù)測方法所提供的信息,揚(yáng)長避短,使其獲得更滿意的結(jié)果,其基本思想是將不同的預(yù)測模型和方法結(jié)合起來,以適當(dāng)?shù)姆绞降贸鼋M合預(yù)測模型。目前比較常用的組合預(yù)測模型有平均值法、遞歸最小二乘法、模糊邏輯系統(tǒng)、BP神經(jīng)網(wǎng)絡(luò)法、標(biāo)準(zhǔn)差法等??紤]到標(biāo)準(zhǔn)差法的簡單并且有效等優(yōu)點(diǎn),本文應(yīng)用標(biāo)準(zhǔn)差法,得出最優(yōu)加權(quán)系數(shù)作為組合預(yù)測模型。
4.1模型介紹
設(shè)灰色預(yù)測和BP神經(jīng)網(wǎng)絡(luò)預(yù)測誤差的標(biāo)準(zhǔn)差分別為得σ1、σ2,且σ=σ1+σ2,則最優(yōu)加權(quán)系數(shù)及組合預(yù)測值分別為
其中,ωi為第i種預(yù)測方法的加權(quán)系數(shù),Xi為第i種預(yù)測方法的預(yù)測值,Xc為組合預(yù)測值。
4.2數(shù)值模擬
本例中按照標(biāo)準(zhǔn)差方法計(jì)算可得灰色預(yù)測模型和BP神經(jīng)網(wǎng)絡(luò)模型的權(quán)重分別為0.4145,0.5855,則組合預(yù)測模型為
Xc=0.4148X1+0.5855X2
結(jié)果如表3所示。
表3 組合模型預(yù)測結(jié)果
對比表1~表3數(shù)據(jù)可以看出,該組合預(yù)測模型具有很強(qiáng)的預(yù)測性,最大相對誤差0.33%比任一單一預(yù)測模型小,平均誤差0.12%也優(yōu)于單一預(yù)測模型,非常適合用于人口預(yù)測問題。
4.3實(shí)例應(yīng)用及結(jié)果分析
根據(jù)上述組合預(yù)測模型對云南省2014~2025年的人口總量進(jìn)行預(yù)測。結(jié)果如表4所示。
表4 云南省2014~2025預(yù)測結(jié)果
上述模型對人口總量變化從不同角度進(jìn)行了模擬、預(yù)測及組合。預(yù)測結(jié)果表明: 1) 從組合預(yù)測模型結(jié)果來看,在2024年,云南省人口總量將突破5000萬人,人口增長速度大概維持在0.6%左右。 2) 任何一種數(shù)量模型的預(yù)測結(jié)果都不可能是完全精確的,這主要是因?yàn)槿魏我环N模型都是直接或間接的依據(jù)歷史數(shù)據(jù)來建模,而隨著時間的推移,與歷史數(shù)據(jù)相聯(lián)系的內(nèi)部及外部環(huán)境條件會產(chǎn)生各種變化。未來影響人口增減變化的主要因素有:
(1)經(jīng)濟(jì)因素。經(jīng)濟(jì)因素對人口自然增長的作用主要表現(xiàn)在它決定了人口的增殖條件和生存條件,通過改變?nèi)丝诘某錾屎退劳雎蕘碛绊懭丝诘淖匀辉雎省?/p>
(2)文化因素。隨著科學(xué)文學(xué)水平的提高,人口自然增長率趨于下降。
(3)醫(yī)療衛(wèi)生因素。醫(yī)學(xué)的進(jìn)步和醫(yī)療衛(wèi)生事業(yè)的發(fā)展對人口出生率和死亡率有著直接影響,并且它對控制生育和實(shí)行優(yōu)生優(yōu)育有著積極的作用。
5結(jié)語
本文重點(diǎn)研究了云南省人口總量的短期預(yù)測,提出了一種基與灰色預(yù)測模型和BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用標(biāo)準(zhǔn)差法的組合預(yù)測模型。應(yīng)用云南省人口總量對本文提出的組合預(yù)測模型方法進(jìn)行了驗(yàn)證分析,結(jié)果表明組合預(yù)測模型提高了預(yù)測的準(zhǔn)確性。
參 考 文 獻(xiàn)
[1] 宋健,田雪原,于景元,等.人口預(yù)測和人口控制[M].北京:人民出版社,1982:42-75.
SONG Jian, TIAN Xueyuan, YU Jingyuan, et al. Population Forcasting and Population Control[M]. Beijing: People’s Publishing House,1982:42-75.
[2] 宋健,于景元,李廣元.人口發(fā)展過程的預(yù)測[J].中國科學(xué),1980(9):920-933.
SONG Jian, YU Jingyuan, LI Guangyuan. Forecast Population Development Process[J]. Science China Press,1980(9):920-933.
[3] 鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中科技大學(xué)出版社,1990:176-263.
DENG Julong. The Course of Grey System Theory[M]. Wuhan: Huazhong University of Science and Technology Press,1990:176-263.
[4] 鄧聚龍.灰色系統(tǒng)基本方法[M].第2版.武漢:華中科技大學(xué)出版社,2005:26-73.
DENG Julong. The Primary Methods of Grey System Theory[M]. Second Edition. Wuhan: Huazhong University of Science & Technology Press,2005:26-73.
[5] 王宇熹,汪泓,肖峻.基于灰色GM(1,1)模型的上海城鎮(zhèn)養(yǎng)老保險(xiǎn)人口分布預(yù)測[J].系統(tǒng)工程理論與實(shí)踐,2010,30(12):2244-2253.
WANG Yuxi, WANG Hong, XIAO Jun. Forecast on Population Distribution of Shanghai Pension System Based on the Gray GM(1,1) Model[J]. Systems Engineering — Theory & Practice,2010,30(12):2244-2253.
[6] 郝永紅,王學(xué)萌.灰色動態(tài)模型及其在人口預(yù)測中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2002,32(5):813-820.
HAO Yonghong, WANG Xuemeng. The Dynamic Model of Gray System and Its Application to Population Forcasting[J]. Mathematics in Practice and Theory,2002,32(5):813-820.
[7] 陳楠,林宗堅(jiān),王欽敏,等.基于灰色理論的中國人口空間分布模式預(yù)測[J].經(jīng)濟(jì)地理,2006,26(5):759-762.
CHEN Nan, LIN Zongjian, WANG Qinmin, et al. The Forecast on the Population Spatial Distribustion Pattern Based on the Gray Theory[J]. Economic Geography,2006,26(5):759-762.
[8] 羅榮桂,黃敏鎂.基于BP神經(jīng)網(wǎng)絡(luò)的長江流域人口預(yù)測研究[J].武漢理工大學(xué)學(xué)報(bào),2004,26(10):90-93.
LUO Ronggui, HUANG Minmei. Study on Population Prediction of Yangtze Basin Based on BP Neural Network[J]. Journal of Wuhan University of Technology,2004,26(10):90-93.
[9] 尹春華,陳雷.基于BP神經(jīng)網(wǎng)絡(luò)人口預(yù)測模型的研究與應(yīng)用[J].人口學(xué)刊,2005(2):44-48.
YIN Chunhua, CHEN Lei. The Research and Application of Population Prediction Based on BP Neural Network Model[J]. Population Journal,2005(2):44-48.
[10] 賴紅松,祝國瑞,董品杰.基于灰色預(yù)測和神經(jīng)網(wǎng)絡(luò)的人口預(yù)測[J].經(jīng)濟(jì)地理,2004,24(2):197-201.
LAI Hongsong, ZHU Guorui, DONG Pinjie. Population Forecast Based on Combination of Gray Forecast and Artificial Neural Networks[J]. Economic Geography,2004,24(2):197-201.
[11] Bates J M, Granger C W. Combination of Forecasts[J]. OperationaI Res Ouart,1969,20(4):451-468.
中圖分類號C924
DOI:10.3969/j.issn.1672-9722.2016.02.001
作者簡介:何思蘭,女,碩士研究生,研究方向:人口經(jīng)濟(jì)等。孫紅兵,女,博士,教授,碩士生導(dǎo)師,研究方向:創(chuàng)新管理和區(qū)域經(jīng)濟(jì)等。
基金項(xiàng)目:國家自然科學(xué)基金“創(chuàng)新型企業(yè)持續(xù)創(chuàng)新機(jī)遇的決策模式與機(jī)制研究”(編號:71262016);國家自然科學(xué)基金“節(jié)能減排進(jìn)程中高耗能產(chǎn)業(yè)群循環(huán)經(jīng)濟(jì)協(xié)同效應(yīng)與協(xié)調(diào)優(yōu)化研究”(編號:71463031)資助。
*收稿日期:2015年6月12日,修回日期:2015年9月24日