趙佳音,孫 驍
(北京師范大學a.教育學部;b.經(jīng)濟與工商管理學院,北京 100875)
總和生育率(Total Fertility Rate)倍受青睞的原因除了這個指標考慮到了性別與年齡結構的因素外,還有一個原因是其代表的含義??偤褪找媛士梢越瓶闯梢粋€婦女從進入生育年齡至生育年齡結束期間生育孩子的數(shù)量,也就是說如果總和生育率為1則代表一個婦女從15歲到49歲期間可能生育1個孩子,較前面提及的其他指更有解釋力。而且對于未來人口自然增長情況可以做出一些預判。當然如果想要得到一個婦女一生所生孩子數(shù)量的準確估計需要追蹤調查,但是在現(xiàn)有條件下,總和生育率是最好的替代指標。
可以從表1看出北京市常住人口總和生育率有以下兩個特征:
(1)總體處于極低水平,平均1個婦女一生約可生育0.68至0.71個孩子,無法保證人口增長,一般情況,總和生育率需達到2.1才能保證人口數(shù)量不衰減。(2)區(qū)縣之間差異顯著,最低的西城區(qū)達到0.49平均下來大約兩個婦女一生中才會生育一個孩子,如果總和生育率保持不變,不考慮遷移,則長此以往,西城區(qū)常住人口會變?yōu)楝F(xiàn)在的1/4,而延慶縣達到1.14平均一個婦女會生育1.14個孩子??傮w來說,北京市的總和生育率還是極低的,根據(jù)美國中央情報局對2013年世界224個國家和地區(qū)總和生育率的排名情況來看,北京與排名最低的新加坡0.79水平相當。
表1 2000年北京市分區(qū)縣總和生育率及2010年北京市總和生育率
總和生育率可以看成分年齡別生育率的加總,分年齡別生育率則是總生育率在各個年齡上的分布,根據(jù)2000年與2010年北京市分年齡別生育率作圖1。從圖1可以看出生育年齡峰值從2000年的25歲推延至2010年的29歲,總和生育率有輕微的增加,生育率分布更加分散,從2000年集中在20~30歲之間擴大到2010年的20~40歲之間。年齡別生育率及其分布的變化與受教育程度、初婚年齡、婚姻狀況、民族、居住地性質、城鄉(xiāng)結構、醫(yī)療衛(wèi)生水平、政府相關政策[2]、遷移情況都是相關的。
圖1 2000年與2010年分年齡別生育率分布圖
生育率模型可以從歸納法和演繹法出發(fā)分成兩大類。由于歸納法在定量與模擬方面發(fā)展比較成熟,因此本節(jié)的模型選擇從建立在大量統(tǒng)計分析的歸納法出發(fā)。
現(xiàn)階段對生育率分布擬合的模型主要有:龔帕茲模型(Compertz)、伽馬模型(Gamma)、韋伯分布(Weibull)、對數(shù)正態(tài)分布模型(Lognormal)、泊松分布模型(Poisson)、生育率組合模型[3],在總和生育率小于4.5的前提下,伽馬與對數(shù)正態(tài)模型要好于龔帕茲模型。從精度來說,韋伯分布模型與伽馬模型沒有對數(shù)正態(tài)分布模型好[4,5]。
生育率組合模型的建立者是虞麗萍,生育率組合模型融合了對數(shù)正態(tài)模型與泊松分布模型,擴大了模型的使用范圍,并且提高了擬合精度。模型數(shù)學表達式如下:
其中,k0代表總和生育率,α為對數(shù)正態(tài)分布與泊松分布模型的權值,通過調節(jié)α可以對不同生育率及生育率分布曲線進行擬合,擴大模型適用范圍。x為育齡婦女的年齡;x0為起始生育年齡,μ代表平均生育年齡,μ越大表示平均生育年齡越大;σ表示平均生育年齡周圍的生育率或生育率密度,σ越高表示平均生育年齡周圍的生育率密度越高。λ為起始生育年齡與平均生育年齡之間的時間長度。
將(1)式改寫為隨機變量模式:
其中,yi為樣本i對應的生育率,xi為樣本i對應的年齡,α、μ、σ、λ為參數(shù),ui為誤差項。
2000、2010年北京市分年齡別生育率最小非線性回歸結果見表2,按照《2012年北京市統(tǒng)計年鑒》對18個區(qū)縣劃分,將18個區(qū)縣分為首都核心功能區(qū)、城市功能拓展區(qū)、城市發(fā)展新區(qū)、與生態(tài)涵養(yǎng)區(qū)四部分進行回歸,結果見表3~6。
對于首都核心區(qū),從表3中可以看出崇文區(qū)和宣武區(qū)生育率組合模型中對數(shù)正態(tài)分布的部分不是很好,但是從R2來看都在90%以上,結果是可以接受的。西城和東城對參數(shù)的回歸結果都十分理想,從分布情況與總和生育率數(shù)值來看四個區(qū)縣都比較相近。
對于城市功能拓展區(qū),從表4中可以看出四個區(qū)縣R2都在97%以上,回歸結果很好。豐臺區(qū)的回歸中對數(shù)正態(tài)分布模型的部分參數(shù)均為不顯著,泊松分布的部分在千分之水平顯著。從分布情與總和生育率數(shù)值來看海淀、崇文、朝陽比較相近,豐臺區(qū)與前面三個區(qū)不相同。
對于城市發(fā)展新區(qū)來說,從表5中可以看出五個區(qū)縣R2都在90%以上,回歸結果很好。昌平的回歸結果參數(shù)比較特殊,原因不明。順義、通州比較相像,房山、大興比較相像。
對于生態(tài)漢涵養(yǎng)區(qū)來說,從表6中可以看出,五個區(qū)縣R2都在90%以上,回歸結果理想。懷柔的回歸結果參數(shù)比較特殊,原因不明。門頭溝區(qū)、平谷縣、密云縣、延慶縣比較相像,擬合情況見圖5。
表2 2000、2010年北京市生育率分布擬合
表3 首都核心功能區(qū):東城、西城、崇文、宣武分年齡別生育率回歸
表4 城市功能拓展區(qū):朝陽區(qū)、豐臺區(qū)、石景山區(qū)、海淀區(qū)分年齡別生育率回歸
表5 城市發(fā)展新區(qū):房山區(qū)、通州區(qū)、順義區(qū)、昌平區(qū)、大興縣分年齡別生育率回歸
表6 生態(tài)涵養(yǎng)區(qū):門頭溝區(qū)、懷柔縣、平谷縣、密云縣、延慶縣分年齡別生育率回歸
要做到對未來人口進行較精確的預測,需要知道預測年份的總和生育率與生育率分布模式,而這兩者是未來將要發(fā)生的事情,在現(xiàn)實中還未發(fā)生,也就無法獲得其真實數(shù)據(jù)。本節(jié)將主要對總和生育率的數(shù)值,即前面模型中提及的k進行預測。
由于影響總和生育率的因素很多,而且總和生育率存在一定的波動性,現(xiàn)在對于總和生育率為何會變化還沒有解釋清楚,也沒有精確的基于教育、政策變化而導致總和生育率變化的定量預測方法。因此,可以將各種因素對總和生育率的影響看成是一種灰色的系統(tǒng)性的影響,通過研究已掌握的總和生育率序列內部的變化規(guī)律,進而對未來的總和生育率進行預測。這種方式在人口預測中被廣泛應用,稱為灰色模型(Grey Model,GM(1,1))
灰色模型的數(shù)學表達:
使用灰色模型,首先,要對生育率數(shù)列做歸一化處理。假設總和生育率序列為將總和生育率序列進行一次累加,得到向量GTFR(k),以增強規(guī)律性。
其次,建立灰色方模型程為:
可得到:
c、v為需要求解的未知參數(shù)。
再次,求解c、v,令C=[c v]T
TFRN=[tfr(2)tfr(3)….tfr(n)]T
建立灰色矩陣B
然后,進行矩陣運算得到向量C
表7 GM(1,1)估計值與原始值對比
表8 2013~2039年北京市總和生育率預測值
最后,將解得的c、v帶到方程中,得到估計值
使用表3~9中2000~2012年的北京市總和生育率數(shù)值,應用GM(1,1)模型進行估計,估計中使用的程序為Matlab7.8,將2000~2012年的原始值與估計值進行對比,結果在表3~13中呈現(xiàn),可以看出估計結果與原始值幾乎一致,可以作為預測總和生育率的模型使用,2013~2039年結果見表7~8。使用同樣的方法可以對北京市各區(qū)縣總和生育率進行預測。
本文在前人研究的基礎上,對北京市分年齡別生育率分布情況以及總和生育率情況進行了分析、擬合及預測。結果表明,(1)北京市總和生育率在區(qū)縣存在很大差異,但是總體處于較低水平。(2)北京市總和生育在未來一段時間會有輕微增長。(3)生育率組合模型對北京市及各區(qū)縣分年齡分布擬合情況十分理想,可以在實際預測中使用。(4)隨時間推移,北京市生育率分布情況有比較明顯改變。
[1]尹文耀,姚引妹,李芬.生育水平評估與生育政策調整——基于中國大陸分省生育水平現(xiàn)狀的分析[J].中國社會科學,2013,(6).
[2]陳衛(wèi),靳永愛.中國婦女生育意愿與生育行為的差異及其影響因素[J].人口學刊,2011,(2).
[3]虞麗萍,袁景淇.基于隨機分布函數(shù)的分年齡別生育率組合模型[J].上海交通大學學報,2006,(9).
[4]謝韋克,黃榮清.中國婦女生育模型研究[J].人口與經(jīng)濟,1993,(1).
[5]韓曉慶.基于Leslie模型中國未來人口策略模擬研究[D].東北財經(jīng)大學,2012.
[6]虞麗萍.人口年齡結構模型建模和預測[D].上海交通大學,2007.