• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      區(qū)間人口數(shù)據(jù)插值/調整方法及其應用

      2012-07-25 08:13:38王桂新
      統(tǒng)計與決策 2012年9期
      關鍵詞:人口數(shù)常住人口插值

      王桂新

      1 區(qū)間人口數(shù)據(jù)缺損插值方法及步驟

      1.1 區(qū)間人口數(shù)據(jù)缺損插值的基本方法

      對兩時點之間缺損(或異常)人口數(shù)據(jù)的插值(或調整),實質上也是一種人口預測,所以人口預測方法同樣適用于兩時點之間時間系列缺損人口數(shù)據(jù)的插值。關于兩時點之間時間系列缺損人口數(shù)據(jù)的插值,包括人口數(shù)量、年齡結構數(shù)據(jù)插值等多方面的內容。適用于區(qū)間時間系列人口數(shù)據(jù)插值的人口預測方法,主要有數(shù)學方法和人口增長因素分解法。限于篇幅,本文只介紹區(qū)間人口數(shù)量插值的數(shù)學方法。

      所謂區(qū)間人口數(shù)量插值的數(shù)學方法,即根據(jù)數(shù)學方法和人口靜態(tài)統(tǒng)計數(shù)據(jù),在分析和模擬已有人口數(shù)據(jù)變化趨勢的基礎上建立人口增長模型,并用以推算區(qū)間某一缺損值的方法。用于區(qū)間人口數(shù)量插值的數(shù)學方法,主要有以下幾種:

      (1)假定以算數(shù)級數(shù)增長的直線插值方法

      根據(jù)對已有人口數(shù)據(jù)(或樣本數(shù)據(jù))變化趨勢的考察分析,如果判斷人口數(shù)量變化基本按算術級數(shù)增長,那么就可以用按算數(shù)級數(shù)增長的直線模型推算的方法進行插值,其插值推算模型為

      其中,Pt為需要插值的t時點的人口,P0為期初人口,PN為期末人口。這種方法適用于時間較短、人口數(shù)量增長規(guī)模相對比較均勻的區(qū)間人口插值,在正常情況下以年度數(shù)據(jù)推算年內各月人口數(shù)據(jù)時多采用在這種方法。

      (2)假定以幾何級數(shù)增長的曲線插值方法

      如果根據(jù)對已有人口數(shù)據(jù)(或樣本數(shù)據(jù))變化趨勢的考察分析,發(fā)現(xiàn)人口數(shù)量變化基本按幾何級數(shù)增長,那么就需要用以幾何級數(shù)增長的曲線模型推算的方法進行插值。這種插值方法,對已有人口數(shù)據(jù)多用指數(shù)曲線(即復利曲線)進行擬合,較適用于封閉地區(qū)時間較短、人口增速比較均勻的區(qū)間人口插值,其基本模型為

      其中,P0為期初人口,PN為期末人口為人口年均增長率,n為考察期間的年數(shù)。這種方法,關鍵是通過變換

      然后再根據(jù)公式推算出需要插值的t時點的人口數(shù)Pt。

      (3)根據(jù)一般趨勢曲線模型的插值方法

      如果根據(jù)對已有人口數(shù)據(jù)(或樣本數(shù)據(jù))變化趨勢的考察分析,發(fā)現(xiàn)人口數(shù)量變化曲線并非符合幾何級數(shù),這時可根據(jù)已知人口數(shù)據(jù)擬合建立一般趨勢曲線模型進行插值。采用一般趨勢曲線模型進行插值,通常使用2次曲線、3次曲線、指數(shù)曲線等趨勢線模型,但有時也用其他趨勢線模型。究竟使用哪種趨勢線模型更合適,可通過多次模擬結果做出判斷和選擇。這種方法比較適用于時間較短、人口呈加速增長態(tài)勢的區(qū)間人口插值。

      例如,可對已有人口數(shù)據(jù)用2次多項式進行回歸分析,由此建立的基本曲線模型為

      其中,Pt為需要插值的t年的人口數(shù),a、b、c均為參數(shù)。

      如果人口的加速增長曲線比2次多項式曲線還陡峭,可選用3次多項式曲線進行擬合,并建立相應的趨勢曲線插值模型

      同樣,式中Pt為需要插值的t年的人口數(shù),a、b、c、d均為參數(shù)。

      當然,如果發(fā)現(xiàn)人口呈指數(shù)增長趨勢時,就要用指數(shù)曲線式進行回歸建模。

      (4)根據(jù)極限增長曲線的插值方法

      對一定區(qū)域來說,在一定約束條件下,人口數(shù)量增長往往會存在一定的極限規(guī)模,這時就需要用存在一定極限的增長曲線模型進行插值。存在一定極限的增長曲線主要有變形指數(shù)曲線、岡巴茲曲線(Gompertz curve)和邏輯斯特曲線(Logistic curve)。關于擬合建立變形指數(shù)曲線模型、岡巴茲曲線(Gompertz curve)模型和邏輯斯特曲線(Logistic curve)模型的具體方法可參閱筆者拙著《區(qū)域人口預測方法及其應用》(華東師范大學出版社,2000年出版),在此不再贅述。

      1.2 區(qū)間人口數(shù)據(jù)缺損插值的一般原則和步驟

      1.2.1 區(qū)間人口數(shù)據(jù)缺損插值的基本原則

      由前述可以看出,對區(qū)間缺損人口數(shù)據(jù)進行插值,關鍵是建立一個插值模型;而要建立插值模型,關鍵又是需要獲得數(shù)量足夠、質量可靠的樣本數(shù)據(jù)(已有數(shù)據(jù)),而且建立的模型及其參數(shù)都要通過統(tǒng)計檢驗,最后計算的插值模型值與實際值的相對誤差率都不能太大。具體地說,進行區(qū)間人口數(shù)據(jù)缺損插值,一般應遵循以下原則:

      首先,用于建立插值模型的樣本數(shù)據(jù),數(shù)量要充足,質量要可靠。根據(jù)回歸分析建模,樣本數(shù)據(jù)一般應在10個以上。而進行區(qū)間缺損人口數(shù)據(jù)插值,多屬在兩次人口普查、即10年之間插值,所以要求的樣本數(shù)據(jù)可以少一些,但最好也不能少于六、七個,至少不能少于要插值的個數(shù)。

      其次,建立的插值模型及其參數(shù)都要通過統(tǒng)計檢驗。對模型來說,說明系數(shù)R2最好達到95%以上。如果模型精度達到95%以上,其參數(shù)一般也都會通過檢驗。

      第三,建立插值模型以后推算的年度人口模型值與實際人口值(已有樣本數(shù)據(jù)值)的相對誤差率一般應控制在95%以上,最好能達到1%以內。這樣才能保證模型插值更逼近于實際人口值。

      1.2.2 區(qū)間人口數(shù)據(jù)缺損插值的一般步驟

      第一,要收集數(shù)據(jù),并評估數(shù)據(jù)質量。如對尚未進行常規(guī)年度統(tǒng)計的常住人口進行區(qū)間插值,要收集足夠數(shù)量的常住人口樣本數(shù)據(jù),并對收集的常住人口樣本數(shù)據(jù)進行質量評估。評估常住人口樣本數(shù)據(jù)的質量,最簡單、有效的方法,就是通過繪制樣本數(shù)據(jù)的點子圖,看其樣本數(shù)據(jù)的分布有沒有突變的異常數(shù)據(jù),如果樣本數(shù)據(jù)的分布都很有規(guī)律,即說明樣本數(shù)據(jù)的質量是比較可靠的。

      第二,建立區(qū)間缺損數(shù)據(jù)插值模型。根據(jù)上面繪制的樣本數(shù)據(jù)點子圖形狀,確定選用怎樣的曲線模型模擬更合適。如果點子圖顯示人口數(shù)量基本呈均勻增長態(tài)勢,可選用模型(1)模擬建模;如顯示人口數(shù)量基本呈加速增長態(tài)勢,可選用其他幾種趨勢曲線模型進行模擬建模。模擬建模可以直接用EXCEL或SPSS等軟件實現(xiàn)。在模擬建模時,可以建立幾個插值模型供比較選用。

      第三,檢驗模型。檢驗模型包括三個方面。一是進行統(tǒng)計檢驗。如果對樣本數(shù)據(jù)用EXCEL或SPSS等軟件進行模擬建模,可以直接給出對模型的統(tǒng)計檢驗結果。二是計算和比較所建插值模型理論值與實際人口值的相對誤差率,選用各年相對誤差率都普遍較小的插值模型。實際上,以上這兩種檢驗在效果上是一致的。三是間接檢驗,如已有研究證明年度人口數(shù)量與GDP規(guī)模密切相關,所以也可以根據(jù)已知的GDP規(guī)模變化趨勢檢驗根據(jù)插值模型計算的年度人口數(shù)量的變化是否合理。

      第四,對模型和插值進行解釋。也就是對為什么采用某個插值模型及其插值做出客觀解釋。如對上?!拔迤铡迸c“六普”之間常住人口數(shù)量變化建立的插值(或調整)模型,可結合宏觀經(jīng)濟形勢及上海城市發(fā)展與人口發(fā)展政策等給出客觀、合理的科學解釋。

      2 區(qū)間人口數(shù)據(jù)缺損插值方法應用——以上海為例

      上海統(tǒng)計部門根據(jù)人口普查及相關調查數(shù)據(jù),每年都發(fā)表全市常住人口數(shù),表1即為統(tǒng)計部門發(fā)表的2000~2009年間每年的常住人口數(shù)。2011年4月市計劃生育部門率先發(fā)表了上海2010年常住人口數(shù)為2221(2220.83)萬人,此后統(tǒng)計部門又發(fā)表了2010年上海人口普查的常住人口數(shù)為2302(2301.91)萬人,比計生委部門發(fā)表的年末常住人口數(shù)還多81萬人。不管是計生委部門發(fā)表的年末常住人口數(shù),還是統(tǒng)計部門發(fā)表的10月末人口普查常住人口數(shù),與以前發(fā)表的1999年的常住人口數(shù)比較,分別增長了300萬和381萬人。表1顯示,上海年末常住人口連續(xù)多年年增數(shù)基本都在三、四十萬人左右,而2010年甚至不到1年就增長了380多萬人,這顯然是超越常規(guī)、令人質疑的。為了獲得上海相對較能反映實際的常住人口數(shù),必須對其2000~2010年間的年末常住人口數(shù)進行適當?shù)卣{整和整合??雌饋磉@屬于數(shù)據(jù)調整,但其實質與缺損數(shù)據(jù)插值原理及方法是一致的。

      由于常住人口數(shù)據(jù)主要來源于每10年進行一次的人口普查及中間每5年進行一次的人口抽樣調查。盡管對常住人口(主要是外來常住人口)調查比較困難,統(tǒng)計誤差較大,但相對其他來源的常住人口數(shù)據(jù),每10年進行一次的人口普查所獲的常住人口數(shù)據(jù)仍然被認為信賴度最高,并仍被作為評價其他數(shù)據(jù)可信性的參照依據(jù)。因此,本文對2000~2010年間的年度常住人口數(shù)進行調整,也將以2000年和2010年人口普查獲得的常住人口數(shù)為基準。

      表1 上海市發(fā)表常住人口數(shù) (萬人)

      2.1 數(shù)據(jù)收集、評價及調整模型建模

      2.1.1 數(shù)據(jù)收集和評價

      根據(jù)前述步驟,首先要收集和評價現(xiàn)有數(shù)據(jù)。收集的上海常住人口數(shù)據(jù)已如表1所示。對此,有幾個問題需要討論和評估。

      一是上海2010年一年常住人口是否能暴增三百多萬人甚至更多。根據(jù)作者多方面的調查,對此概括起來主要有兩種看法:一種看法是2010年上海常住人口的增長受到世博會很大影響。他們認為由于世博會的舉辦,吸引了更多的外來人口到上海務工經(jīng)商,從而使上海外來常住人口顯著增長。盡管在人口普查時已注意盡量減少世博會的影響,但這種影響很難消除。這種看法實際上就是認為上海2010年常住人口由于受世博會的影響而暴增,但人口普查的常住人口數(shù)未能剔除因世博會影響而引起的常住人口的非正常增長;另一種看法是上海2010年的常住人口數(shù)量基本沒有受世博會的明顯影響,世博會對上海常住人口增長的影響在世博會舉辦之前的建設期即已表現(xiàn)出來。這種看法實際上就是認為上海2010年常住人口因世博會影響一年暴增三百多萬人是不可能的,人口普查的常住人口數(shù)基本反映了上海常住人口規(guī)模,但它是2010年及之前多年增長的結果。根據(jù)對人口普查獲得的上海全市不同年份“離開戶口登記地時間(R8)”的外來常住人口的參考性分析,結果并不支持第一種看法,但能佐證第二種觀點。對楊浦區(qū)人口普查數(shù)據(jù)的分析結果也同樣如此。

      二是在包括2010年的“十一五”期間上海常住人口呈怎樣的增長態(tài)勢。根據(jù)上海市有關部門調查,上海近年外來常住人口呈加速增長趨勢,如嘉定區(qū)“十一五”期間來滬人員總量從2006年的58萬增長到2010年底的79萬(居住六個月及以上者為73.1萬),平均每年增加8~10%。普陀區(qū)外來常住人口也呈同樣的加速增長趨勢,如其2006年、2008年和2010年來滬常住就業(yè)人口分別為46.83萬人、74.50萬人和101萬人。有關部門對上海郊區(qū)四區(qū)的調查還發(fā)現(xiàn),在“十一五”期間外來常住人口呈倍增趨勢。這說明,表1中“十一五”期間2010年之前幾年的常住人口規(guī)模及其增長,并未真正反映上海常住人口的實際增長變化。

      三是2005年全國1%人口抽樣調查時上海的抽樣比為3.18%,一般來說至少在人口總量層次上按此推算的常住人口規(guī)模應該具有相當?shù)拇硇?。但推算結果顯示,以當時的調查樣本人口和抽樣比推算的常住人口數(shù)為1646萬人,幾乎與2000年人口普查數(shù)據(jù)相等,這顯然是偏小的。表1中發(fā)表的2005年常住人口數(shù)為1778萬人,說明統(tǒng)計部門已經(jīng)根據(jù)當時的實際情況對包括2005年的“十五”期間每年的上海常住人口數(shù)據(jù)進行了調整。該發(fā)表數(shù)據(jù)已得到廣泛應用,而且也沒有相關調查說明其不符上海當時常住人口的增長情況,所以可以認為上?!笆濉逼陂g年度常住人口數(shù)據(jù)是比較符合實際的,可以用作本次常住人口數(shù)據(jù)調整的樣本數(shù)據(jù)。

      基于以上可得結論:第一,2010年上海常住人口數(shù)量并未因世博會影響而出現(xiàn)驟然暴增現(xiàn)象,而是2010年及之前多年增長的結果;第二,表1中“十一五”期間2010年之前幾年的常住人口規(guī)模及其增長未能反映上海常住人口的實際增長變化,需要進行調整處理;第三,“十五”期間常住人口數(shù)據(jù)則相對比較符合實際,可作為調整“十一五”期間2010年之前幾年常住人口數(shù)據(jù)的基礎樣本數(shù)據(jù)。所以,對上?!拔迤铡?、“六普”兩次人口普查(2000~2010年)之間年度常住人口數(shù)據(jù)調整插值,可把上?!笆濉逼陂g5年和2000年、2010年等年份的常住人口數(shù)據(jù)作為基礎樣本數(shù)據(jù),以此建立擬合調整模型,計算“十一五”期間2010年之前幾個年份常住人口的調整值。

      2.1.2 調整模型選擇與建模

      基于以上調查和分析,通過對上海常住人口多種數(shù)據(jù)的嘗試,以及采用多種方法的探索性擬合,發(fā)現(xiàn)上海常住人口數(shù)量的增長,可用前述的多項式曲線模型進行擬合。事實也說明用該曲線模型擬合效果較好,尤以3次多項式模型擬合效果最好。

      為了建立擬合調整模型,并為避免引發(fā)更大的人口規(guī)?!翱执蟀Y”和簡單起見,本文首先把2000年人口普查的1640萬人和2010年人口普查的2302萬人分別作為當年年末的常住人口數(shù)①現(xiàn)有統(tǒng)計年鑒已把1640萬人作為2000年的年末常住人口數(shù)。。這樣就可直接根據(jù)表1中的歷年常住人口數(shù)據(jù),采用逐步去掉“十一五”期間2010年之前幾年常住人口“異?!睌?shù)據(jù)的方法進行反復擬合,直到建立滿足目標精度的擬合模型。當然,在達到目標精度的前提下,去掉的年度數(shù)據(jù)應該盡量少,這樣可以保留更多的數(shù)據(jù)以滿足回歸分析的樣本要求。擬合分析結果顯示,去掉3到4年的“異?!睌?shù)據(jù)即可建立高精度的2次曲線和3次曲線擬合調整插值模型。根據(jù)擬合分析結果,本文對上海2000~2010年間年度常住人口的調整提供了以下2個方案。

      2.2 上海2000~2010年間年度常住人口調整結果

      2.2.1 調整方案Ⅰ

      該方案假定表1中2009年、2008年、2007年3年的常住人口數(shù)為需要調整的“異?!睌?shù)據(jù)。因此,根據(jù)2000~2006年和2010年共8年的常住人口數(shù)據(jù)進行擬合分析,建立相應的2次曲線模型1和3次曲線模型2,據(jù)其計算的2009年、2008年、2007年的常住人口調整值分別如表2和表3所示。

      模型1

      模型2

      表2 根據(jù)模型1的擬合計算結果

      表3 根據(jù)模型2的擬合計算結果

      2.2.2 調整方案Ⅱ

      該方案假定表1中2009年、2008年、2007及2006年4年的常住人口數(shù)為需要調整的“異常”數(shù)據(jù)。因此,根據(jù)2000~2005年和2010年共7年的常住人口數(shù)據(jù)進行擬合分析,建立相應的2次曲線模型3和3次曲線模型4,據(jù)其計算的2009年、2008年、2007年及2006年的常住人口調整值分別如表4和表5所示。

      模型3

      模型4

      表4 根據(jù)模型3的擬合計算結果

      表5 根據(jù)模型4的擬合計算結果

      2.3 兩種調整方案的比較與討論

      根據(jù)以上擬合分析結果可知,兩種方案的4個擬合調整插值模型,說明系數(shù)R2都在99%以上,具有很高的精度。但從4個模型計算模型值與實際值的誤差看,模型1計算模型值與實際值的相對誤差率最大年份達1.88%,其他3個模型的計算結果,年度常住人口數(shù)的絕對誤差都基本小于15萬人,相對誤差率都基本在0.8%以下,其中尤以模型4的擬合效果最佳,模型值與實際值的絕對誤差都在7萬人以下,相對誤差率都小于0.45%。所以,對上海2000~2010年間各年末常住人口數(shù)的調整插值,可優(yōu)先考慮采用模型4的計算調整結果。

      根據(jù)模型1~模型4計算調整后的上海2000~2010年每年的常住人口數(shù)和戶籍人口數(shù)(表6),可計算出每年的外來常住人口數(shù)(表7)。由此可以看出,根據(jù)模型2、模型3、模型4計算調整的上?!笆晃濉逼陂g常住人口數(shù)量均呈加速增長趨勢(圖略),而且也都基本呈倍增態(tài)勢。該結果與前述的調查分析結論相同。這也從一個方面說明了本文調整插值方法的科學性和調整插值結果的合理性。

      表6 根據(jù)模型1-模型4調整計算后的上海常住人口數(shù)

      表7 根據(jù)模型1-模型4擬合計算的上海外來常住人口數(shù)

      [1] 王桂新.區(qū)域人口預測方法及應用[M].上海:華東師范大學出版社,2000.

      猜你喜歡
      人口數(shù)常住人口插值
      廣東:2022 年常住人口與戶籍人口均過億
      確定代表名額按戶籍人口數(shù)還是常住人口數(shù)
      人大研究(2022年3期)2022-04-13 00:47:04
      基于Sinc插值與相關譜的縱橫波速度比掃描方法
      北京城市副中心:常住人口控制在130萬以內
      基于BP神經(jīng)網(wǎng)絡的吉林省GDP預測研究
      市場周刊(2018年1期)2018-08-15 01:42:44
      2015年上海市常住人口首現(xiàn)負增長
      中老年健康(2016年5期)2016-06-13 01:08:46
      一種改進FFT多譜線插值諧波分析方法
      基于四項最低旁瓣Nuttall窗的插值FFT諧波分析
      Blackman-Harris窗的插值FFT諧波分析與應用
      2015年我國60歲以上老年人將達到2.16億
      扶风县| 永兴县| 旌德县| 通江县| 女性| 梅州市| 黑龙江省| 利津县| 陆川县| 南丹县| 翁源县| 马尔康县| 汉沽区| 兴安盟| 钟山县| 桂林市| 攀枝花市| 平阳县| 望奎县| 沁源县| 沧源| 香格里拉县| 右玉县| 温宿县| 五指山市| 林芝县| 罗城| 巴林左旗| 岐山县| 始兴县| 遵化市| 昆山市| 虎林市| 台山市| 河北省| 竹溪县| 肥西县| 松潘县| 库伦旗| 湘阴县| 淮滨县|