姚志鵬,陳盛雙
(1華中師范大學(xué)漢口分校公共數(shù)學(xué)部,武漢430212;2武漢理工大學(xué)理學(xué)院,武漢430063)
人口問題是本世紀(jì)我國面臨的最重大的問題之一.用數(shù)學(xué)建模的方法對(duì)人口發(fā)展的過程進(jìn)行描述、分析和預(yù)測(cè),進(jìn)而研究控制人口增長和人口性別比例失調(diào)問題,早已引起各有關(guān)方面的極大關(guān)注,并成為系統(tǒng)科學(xué)、經(jīng)濟(jì)科學(xué)和人口科學(xué)應(yīng)用研究中的重要交叉領(lǐng)域[1].
最早的人口預(yù)測(cè)模型是馬爾薩斯模型.馬爾薩斯模型的缺點(diǎn)在于沒有考慮物種之間的競(jìng)爭,自然界的平衡和人文環(huán)境因素.后來人們對(duì)馬爾薩斯模型進(jìn)行修正,提出了阻滯增長模型,此模型在一定時(shí)期內(nèi)也取得了比較滿意的結(jié)果.以上兩種模型都是確定性的,只考慮了影響人口總數(shù)變化的時(shí)間因素.在此之后,人們又提出了考慮人口年齡分布狀況的隨機(jī)性模型[2].
由《中國人口統(tǒng)計(jì)年鑒》可得2001~2005年的城市、城鎮(zhèn)和鄉(xiāng)村的詳細(xì)資料,包括各個(gè)區(qū)域的男性、女性的年齡人口分布、死亡率分布和生育率分布以及近10年來的整體性別比例和總體生育水平.本文就是從這些詳細(xì)的資料中找出中國人口層次結(jié)構(gòu)的特點(diǎn),通過對(duì)現(xiàn)有特點(diǎn)的分析來建立適合我國的中短期模型.
(1)假設(shè)數(shù)據(jù)是基本準(zhǔn)確可靠的,不存在巨大偏差和誤報(bào);
(2)假定我國在近期的死亡率、生育率和性別比例是按目前發(fā)展趨勢(shì)變化的,不會(huì)出現(xiàn)巨大的意外(重大災(zāi)害、政策等)造成大幅度數(shù)據(jù)變動(dòng);
(3)在中短期預(yù)測(cè)中,不考慮老齡化的急劇增加和計(jì)劃生育政策的變動(dòng);
(4)不考慮生存空間等自然資源制約,也不考慮意外災(zāi)難、戰(zhàn)爭等非可抗力因素對(duì)人口數(shù)量的影響.
根據(jù)近年人口調(diào)查的相關(guān)數(shù)據(jù)和關(guān)于人口戰(zhàn)略的研究報(bào)告,建立數(shù)學(xué)模型來預(yù)測(cè)中國未來的人口增長趨勢(shì).對(duì)于該問題我們著重從影響人口發(fā)展的死亡率、生育率以及性別比3個(gè)主要因素進(jìn)行分析.
對(duì)于本問題,首先在一個(gè)完全理想的環(huán)境中進(jìn)行分析并建立簡單模型.假設(shè)1:在某個(gè)封閉的環(huán)境下,人口沒有遷入或遷出情況;假設(shè)2:所有的統(tǒng)計(jì)數(shù)據(jù)都是正確的,不存在測(cè)量誤差;假設(shè)3:整個(gè)模型的人口演變只由生育、老化和死亡引起,沒有其他意外因素.
通過考慮n年i歲的人口數(shù)量F(n,i)、死亡率B(n,i)、新生人口數(shù)量N(n),得到n+1年i+1歲的人口數(shù)量為:
其含義是:n+1年的0歲人口數(shù)量是n年新出生的人口、i+1歲的人口數(shù)量是n年i歲人口中存活的數(shù)量,其中90歲以上的人口數(shù)量是n年中89歲和90歲以上的人口中存活的數(shù)量.
假設(shè)時(shí)間以年為單位,年齡按周歲來計(jì)算,記M i(t)為t年i歲的男性人口數(shù)量,W i(t)為t年i歲的女性人口數(shù)量,i=0,1,2,…,90.有
其中:R(t)為t年的總?cè)丝跀?shù)量,M B i(t)為t年i歲男性的比例,W B i(t)為t年i歲女性的比例.
BM i(t)為t年i歲男性人口的死亡率,BW i(t)為t年i歲女性人口的死亡率,即:
于是,M i+1(t+1)=(1-BM i(t))M i(t),
記hi(t)為t年i歲女性生育率,根據(jù)統(tǒng)計(jì)數(shù)據(jù),i=[15,49]為育齡區(qū)間,則t+1年新增人口(0歲人口)為:設(shè)S(t)為t年新出生人口的男女比例,則t年新生小孩中男性人口數(shù)為:
t年新生小孩中女性人口數(shù)為:
當(dāng)i=89時(shí),有:
則t+1年男性總數(shù)量為:
其中,矩陣A(t)是由t年各個(gè)年齡層的男性存活率構(gòu)成,矩陣B(t)由15~49歲間女性生育率構(gòu)成:
同理t+1年女性總數(shù)量為:
矩陣C(t)是由t年各個(gè)年齡層的女性存活率構(gòu)成,C(t)=
式(1)和(2)的一階差分方程就是人口預(yù)測(cè)的基本數(shù)學(xué)模型.其中A(t)和C(t)是依賴每年死亡率的矩陣,B(t)是依賴每年生育率的矩陣.
利用此簡單模型,將相關(guān)數(shù)據(jù)代入進(jìn)行計(jì)算,將城市、城鎮(zhèn)和鄉(xiāng)村作為3個(gè)獨(dú)立的系統(tǒng)分別考慮,計(jì)算出各個(gè)系統(tǒng)的總?cè)丝跀?shù)量,最后相加得到我國的總?cè)丝跀?shù)量.
根據(jù)官方提供的我國人口資料,可查得2001~2006年的中國總?cè)丝跀?shù).通過M atlab利用第n年的數(shù)據(jù)來預(yù)測(cè)第n+1年的總?cè)丝跀?shù)(見表1).
根據(jù)得到的數(shù)據(jù),發(fā)現(xiàn)預(yù)測(cè)數(shù)據(jù)和實(shí)際數(shù)據(jù)存在出入,這表示此簡單模型還無法精確地預(yù)測(cè)我國的人口,還需要對(duì)此模型進(jìn)行進(jìn)一步優(yōu)化,得到更精確的模型.
中短期預(yù)測(cè)和長期預(yù)測(cè)不同,中短期預(yù)測(cè)可以根據(jù)前一年的數(shù)據(jù)來預(yù)測(cè)未來幾年的數(shù)據(jù).中短期預(yù)測(cè)的特點(diǎn)是未來的發(fā)展基本遵循當(dāng)前的增長規(guī)律,不會(huì)出現(xiàn)太大的數(shù)據(jù)變動(dòng).
要建立預(yù)測(cè)模型,首先要確定第2部分中提及的A(t)、B(t)、C(t)矩陣,而這3 個(gè)矩陣,是依賴于生育率和死亡率的.
每年的總體生育水平是會(huì)發(fā)生變化的,這受到政策、經(jīng)濟(jì)狀況等方面的影響,分析2001~2005年的數(shù)據(jù)發(fā)現(xiàn),雖然整體生育水平不同,但在一年中各個(gè)年齡的生育率是遵從一定規(guī)律的.
總體生育率和總體死亡率是反映在一年中整個(gè)區(qū)域內(nèi)的人口生育比率和死亡比率,這受許多因素影響,無法根據(jù)所給的資料進(jìn)行計(jì)算.
灰色預(yù)測(cè)模型GM(1,1)是單變量一階線性模型[3],它是灰色預(yù)測(cè)模型中最基本的模型.它比多變量多階預(yù)測(cè)模型或其他模型計(jì)算簡單,預(yù)測(cè)效果較好,且兼有對(duì)樣本容量和概率分布無嚴(yán)格要求的特點(diǎn).該模型廣泛應(yīng)用于不可知因素的預(yù)測(cè).
本文對(duì)總體生育率、總體死亡率和出生男女比例的預(yù)測(cè)均采用灰色預(yù)測(cè)模型,此模型GM(1,1)對(duì)于短期無規(guī)則數(shù)據(jù)預(yù)測(cè)效果較好,但不適用于長期預(yù)測(cè).
灰色預(yù)測(cè)模型的基本原理和計(jì)算方法詳見文[4].
利用M atlab對(duì)灰色預(yù)測(cè)模型GM(1,1)進(jìn)行編程[5],由《中國人口統(tǒng)計(jì)年鑒》(2001~2006)的生育率、死亡率和新生男女比例錄入到程序中,預(yù)測(cè)出未來幾年的生育率(見表2)、死亡率(見表3)和男女比例(見表4).
表2 2006~2010年總體生育率的預(yù)測(cè)Tab.2 2006~2010 to tal fertility rate p red iction %
表3 2006~2010年男女死亡率的預(yù)測(cè)Tab.3 2006~2010m en andw om en death rate p red iction %
表4 2006~2010年男女比例的預(yù)測(cè)Tab.4 2006~2010m en and w om en p ropo rtion p red iction
分年齡生育率可以描述不同年齡婦女的生育力差別,是分析人口年齡結(jié)構(gòu)變化趨勢(shì)的重要數(shù)據(jù)[5].婦女生育率隨年齡變化的趨勢(shì)接近于正態(tài)分布,其數(shù)學(xué)形式可以描述為:
其中i為婦女生育年齡,f(i)為生育率,h(i)為特定的隨機(jī)分布,k為尺度變換因子,與總體生育水平有關(guān).
基于對(duì)數(shù)正態(tài)分布的分年齡生育率模型為:
式中x0為起始生育年齡,根據(jù)本文數(shù)據(jù),令x0=15;k為對(duì)數(shù)正態(tài)分布函數(shù)所對(duì)應(yīng)的尺度變換因子.
泊松分布近似于正態(tài)分布,基于泊松分布的分年齡生育率模型為:
式中:起始生育年齡x0也取15歲,k為泊松分布函數(shù)所對(duì)應(yīng)的尺度變換因子;λ是決定因素,表示從起始年齡x0到平均生育年齡的時(shí)間長度.
綜合正態(tài)分布和泊松分布,得到組合的分年齡生育率模型:
其中參數(shù)μ,σ,λ與對(duì)數(shù)正態(tài)分布、泊松分布模型中的參數(shù)相同,α為權(quán)值,k為尺度變換因子,即總體生育率.
將2001~2005年的數(shù)據(jù)作為統(tǒng)計(jì)值進(jìn)行檢驗(yàn),以此5年的誤差值作為目標(biāo)函數(shù),使其最小:
需要說明的是,每年的k是隨每年的總體生育率而變化的,yi為實(shí)際生育率.
表5是根據(jù)5年的數(shù)據(jù)估計(jì)出來的參數(shù),因篇幅原因,每年通過函數(shù)計(jì)算得到的生育率不在此列出,將2005年的生育率和函數(shù)計(jì)算得到的生育率擬合可得圖1.
表5 生育率分布模型參數(shù)Tab.5 Fertility d istributionm odelparam eter
圖1 2005年的實(shí)際分年齡生育率和函數(shù)計(jì)算得到的分年齡生育率比較圖Fig.1 Com pare g raph o f the actua l and the calcu lative fertility rate o f each age
由圖1和殘差數(shù)據(jù)可以看出,估計(jì)的參數(shù)基本滿足條件,因此,假設(shè)第t年城市生育率為k,則t年i歲的生育率為:
其中α、μ、σ和λ為表5中所估計(jì)出來的參數(shù)值.
死亡率根據(jù)年齡的分布也是服從一定規(guī)律的,除0歲的新生兒因其他非可抗力的影響死亡率偏大外,其他年齡的死亡率服從一定規(guī)律.分析數(shù)據(jù)后可知,隨著年齡的增長,死亡率逐漸增大.
本文對(duì)分年齡死亡率模型使用如下函數(shù):
其中k為該年的總死亡率,a和b是此函數(shù)的參數(shù),表示死亡率隨年齡增長的趨勢(shì)和年齡的死亡率參數(shù).
只選取1~90歲進(jìn)行分析,定義目標(biāo)函數(shù):
它表示5年內(nèi)的死亡率誤差的平方和,求解參數(shù)a和b,使總誤差最小.yi為實(shí)際死亡率.
表6是根據(jù)5年數(shù)據(jù)估計(jì)出來的參數(shù),以及利用函數(shù)計(jì)算得到的死亡率分布.
表6 死亡率分布模型參數(shù)Tab.6 Death d istributionm odelparam eter
根據(jù)上面的求解,已經(jīng)能夠?qū)t(i),BM i(t),BW i(t)以及S(t)求出,因此可以預(yù)測(cè)對(duì)應(yīng)的A(t),B(t),C(t),然后代入(1)式和(2)式中,即可預(yù)測(cè)今后幾年的人口結(jié)構(gòu)和年齡分布.
表7為根據(jù)預(yù)測(cè)模型預(yù)測(cè)的2006~2010年人口總體預(yù)測(cè)結(jié)果(人口年齡和死亡率結(jié)構(gòu)及生育率結(jié)構(gòu)數(shù)據(jù)略).
圖2 2005年擬合圖與實(shí)際死亡率的比較圖Fig.2 Fitting g raph of the actualand the calcu lative death rate o f each age
因篇幅原因,每年通過函數(shù)計(jì)算得到的死亡率不在此列出,將2005年的死亡率和函數(shù)計(jì)算得到的死亡率擬合如圖2所示.
由圖2和殘差數(shù)據(jù)可以看出,估計(jì)的參數(shù)基本滿足條件,因此,假設(shè)第t年城市男性死亡率為k,則t年i歲的男性死亡率為BM t(i)=kaebi.其中a和b為表6中所估計(jì)出來的參數(shù)值.
表7 2006~2010年人口總體預(yù)測(cè)結(jié)果Tab.7 2006~ 2010 to talpopu lation p redictive resu lt 104 人
本文在模型設(shè)計(jì)時(shí),考慮了大部分因素,以求預(yù)測(cè)結(jié)果的精確性.
在中短期預(yù)測(cè)中,主要是利用擬合方法來對(duì)生育率和死亡率的年齡分布進(jìn)行預(yù)測(cè),且擬合效果都比較理想.利用灰色預(yù)測(cè)理論對(duì)未來幾年的總體生育率、死亡率和性別比例進(jìn)行預(yù)測(cè),是在大量條件未知的情況下最理想的預(yù)測(cè)方法.
本文所建立的模型,對(duì)生育率和死亡率進(jìn)行了準(zhǔn)確的擬合和預(yù)測(cè),并對(duì)未來幾年的人口年齡層次進(jìn)行了詳細(xì)的預(yù)測(cè),使人們對(duì)未來的人口結(jié)構(gòu)有更清晰的認(rèn)識(shí).
本文的中短期預(yù)測(cè)模型建立在遞歸基礎(chǔ)上的,具有數(shù)據(jù)可靠、推算精確等特點(diǎn),而灰色預(yù)測(cè)理論和擬合方法,更是提高了預(yù)測(cè)數(shù)據(jù)的精確性.
但本文建立的模型由于各個(gè)方面的影響,仍然有許多不足,特別是在中短期模型上,沒有考慮到城市、城鎮(zhèn)和鄉(xiāng)村之間的人口遷移和結(jié)構(gòu)變化,以及人口老齡化(年齡結(jié)構(gòu)分布的變化)以及生育年齡推遲(正態(tài)分布的曲線右移)等因素,這些因素將在以后的研究中詳細(xì)考慮.
[1] 蔣正華.人口分析與規(guī)劃[M].西安:陜西科學(xué)出版社,1984.
[2] 宋 健.人口預(yù)測(cè)和控制[M].北京:人民出版社,1980.
[3] 鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中理工大學(xué)出版社,1987.
[4] 赫永紅.灰色動(dòng)態(tài)模型及其在人口預(yù)測(cè)中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2002(9):74-79.
[5] 李勇勝.人口預(yù)測(cè)中的模型選擇與參數(shù)認(rèn)定[J].財(cái)經(jīng)科學(xué),2004(2):68-72.