• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    人口普查覆蓋誤差估計(jì)方法綜述

    2013-02-15 08:33:43胡桂華
    統(tǒng)計(jì)與信息論壇 2013年9期
    關(guān)鍵詞:估計(jì)量人口數(shù)遺漏

    胡桂華

    (重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)

    人口普查覆蓋誤差估計(jì)方法綜述

    胡桂華

    (重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)

    人口普查工作的質(zhì)量主要體現(xiàn)在覆蓋誤差的規(guī)模上。人口統(tǒng)計(jì)學(xué)家創(chuàng)建了估計(jì)人口普查覆蓋誤差的方法。有些方法利用獨(dú)立于人口普查本身的信息,另外一些方法則利用人口行政記錄的信息。由于每種方法都有其特定的形成背景和適用范圍,因而沒(méi)有適合于所有國(guó)家和地區(qū)的通用方法。通過(guò)對(duì)美國(guó)、新西蘭、澳大利亞、英國(guó)和中國(guó)的人口普查覆蓋誤差估計(jì)方法進(jìn)行了較為詳細(xì)的介紹,說(shuō)明了這些方法的使用情況。研究表明,任何一種估計(jì)方法都有其局限性,需要不斷改進(jìn)與完善。

    人口普查;覆蓋誤差;行政記錄比較;逆記錄檢查;事后計(jì)數(shù)調(diào)查;人口統(tǒng)計(jì)分析

    一、引 言

    由于各種原因,在每次人口普查中,總是有些人被遺漏,有些人被重復(fù)登記,結(jié)果是普查人口數(shù)偏離實(shí)際人口數(shù)。為了更好地發(fā)揮人口普查數(shù)據(jù)的作用,世界上所有進(jìn)行人口普查的國(guó)家和地區(qū)在每次人口普查登記工作結(jié)束之后都要對(duì)其質(zhì)量進(jìn)行評(píng)估。

    人口普查質(zhì)量評(píng)估主要有三個(gè)目的:一是告訴用戶普查數(shù)據(jù)的質(zhì)量;二是為修正普查數(shù)據(jù)提供基礎(chǔ)數(shù)據(jù);三是發(fā)現(xiàn)普查登記過(guò)程中所存在的問(wèn)題,為下次改進(jìn)普查操作方案提供依據(jù)[1]。

    Statistics South Africa把人口普查誤差分為覆蓋誤差和內(nèi)容誤差[2]。覆蓋誤差是指在普查計(jì)數(shù)過(guò)程中因遺漏、重復(fù)或錯(cuò)誤而引起的誤差,它直接影響人口總數(shù)的準(zhǔn)確性。內(nèi)容誤差是指在普查計(jì)數(shù)過(guò)程中因?qū)€(gè)人、家庭和住房單元特征的不正確報(bào)告或錯(cuò)誤記錄而引起的誤差,它影響各類人口數(shù)的精度。由于估計(jì)覆蓋誤差比估計(jì)內(nèi)容誤差的意義大,所以世界上大多數(shù)進(jìn)行人口普查質(zhì)量評(píng)估的國(guó)家只估計(jì)覆蓋誤差(例如美國(guó)、英國(guó)、澳大利亞、加拿大等);另外雖然有少數(shù)國(guó)家(例如南非、烏干達(dá)、中國(guó)等)對(duì)覆蓋誤差和內(nèi)容誤差都進(jìn)行估計(jì),但其估計(jì)內(nèi)容誤差的方法尚不夠成熟。

    覆蓋誤差可進(jìn)一步分為凈誤差及其錯(cuò)誤計(jì)數(shù)(重復(fù)登記、普查日之前死亡者被登記、普查日后出生者被登記、寵物被登記)與遺漏[3]。凈誤差定義為實(shí)際人口數(shù)與普查人口數(shù)之差。不難看出,凈誤差估計(jì)的關(guān)鍵是要獨(dú)立于人口普查設(shè)法估計(jì)出目標(biāo)總體的實(shí)際人口數(shù)。它通常使用基于人口出生、死亡、國(guó)內(nèi)外遷移的人口行政記錄資料和其他統(tǒng)計(jì)調(diào)查資料的人口統(tǒng)計(jì)分析,以及使用基于“捕獲-再捕獲”模型的 雙 系 統(tǒng) 估 計(jì) 量[4-5][6]55-65[7]65-75[8-10]和 基 于“捕獲-再捕獲-再捕獲”模型[11]的三系統(tǒng)估計(jì)量[12]來(lái)估計(jì)。這里的雙系統(tǒng)包括人口普查及其事后計(jì)數(shù)調(diào)查[13],而三系統(tǒng)除包括這兩個(gè)系統(tǒng)外還包括由多個(gè)人口登記冊(cè)組合而成的人口行政記錄系統(tǒng)。普查錯(cuò)誤計(jì)數(shù)人口數(shù)通過(guò)比對(duì)人口行政記錄系統(tǒng)與本次人口普查數(shù)據(jù)庫(kù)來(lái)估計(jì),而普查遺漏人口數(shù)使用逆記錄檢查或把估計(jì)的凈誤差與估計(jì)的普查錯(cuò)誤計(jì)數(shù)人口數(shù)相加或把估計(jì)的實(shí)際人口數(shù)減去估計(jì)的普查正確計(jì)數(shù)人口數(shù)來(lái)獲得[1,14-15]。

    Zaslavsky等研究了雙系統(tǒng)估計(jì)量的缺陷[16]。由于人口對(duì)普查的答復(fù)不獨(dú)立于對(duì)事后計(jì)數(shù)調(diào)查的答復(fù)而引起的交互作用偏差使雙系統(tǒng)估計(jì)量低估或高估(通常是低估)同時(shí)被這兩項(xiàng)調(diào)查遺漏的人口和全部人口的人口數(shù)。換句話說(shuō),從是否包括同時(shí)被人口普查與事后計(jì)數(shù)調(diào)查遺漏的人口來(lái)看,雙系統(tǒng)估計(jì)量一般只是包括了純粹隨機(jī)性地同時(shí)被這兩項(xiàng)調(diào)查遺漏的人口,而沒(méi)有包括系統(tǒng)性地傾向于同時(shí)被人口普查及其事后計(jì)數(shù)調(diào)查遺漏的人口[17]。Bell等根據(jù)人口統(tǒng)計(jì)分析估計(jì)的性別比率和女性不存在交互作用偏差的假設(shè)條件分別測(cè)算了美國(guó)2000年和2010年人口普查男性的交互作用偏差[18-19]。Kenneth W等使用平衡關(guān)系式“估計(jì)的事后計(jì)數(shù)調(diào)查人口數(shù)-估計(jì)的因數(shù)據(jù)處理誤差而引起的正偏差人口數(shù)+因交互作用偏差而引起的負(fù)偏差人口數(shù)=估計(jì)的人口統(tǒng)計(jì)分析人口數(shù)”測(cè)算了美國(guó)1990年人口普查全部人口的交互作用偏差[20]。

    Zaslavsky指出,如果在人口普查與事后計(jì)數(shù)調(diào)查的基礎(chǔ)上再增加一個(gè)系統(tǒng),比如說(shuō)人口行政記錄系統(tǒng),那么交互作用偏差的影響將會(huì)顯著減少[12]。例如在逃犯人傾向于同時(shí)被人口普查及其事后計(jì)數(shù)調(diào)查遺漏,但其監(jiān)獄管理檔案包括他們,因而即便被人口普查和事后計(jì)數(shù)調(diào)查遺漏也會(huì)被人口行政記錄系統(tǒng)包括。雖然人口行政記錄系統(tǒng)的人口登記會(huì)有遺漏,但由于它的人口登記管理機(jī)制與人口普查及其事后計(jì)數(shù)調(diào)查的完全不同,因此與后二者的登記盲點(diǎn)不在同一個(gè)位置上。依據(jù)三個(gè)系統(tǒng)來(lái)源構(gòu)造的三系統(tǒng)估計(jì)量雖然不能完全消除交互作用偏差,但可以最大限度地減少交互作用偏差。

    西方學(xué)者對(duì)三系統(tǒng)估計(jì)量理論及其應(yīng)用進(jìn)行了較長(zhǎng)時(shí)間的研究。他們的貢獻(xiàn)主要體現(xiàn)在三個(gè)方面:一是論證了雙系統(tǒng)估計(jì)量容易遺漏難以計(jì)數(shù)人口[21];二是提出了三系統(tǒng)估計(jì)量的構(gòu)造方法[22-23];三是證實(shí)了使用三系統(tǒng)估計(jì)量分別估計(jì)無(wú)移動(dòng)者和移動(dòng)者數(shù)目比合并在一起估計(jì)他們的數(shù)目精度高。

    然而,三系統(tǒng)估計(jì)量在國(guó)外的研究與應(yīng)用目前仍不很成熟。一是尚未全面深入、系統(tǒng)地研究三個(gè)系統(tǒng)人口登記范圍不一致情形下的三系統(tǒng)估計(jì)量及其方差估計(jì)量;二是尚未深入研究人口行政記錄系統(tǒng)的建立及其更新方法;三是三系統(tǒng)估計(jì)量至今未被任何一個(gè)國(guó)家在人口普查質(zhì)量評(píng)估工作中采用。

    在中國(guó),從已經(jīng)出版的統(tǒng)計(jì)學(xué)或其他學(xué)科的研究成果來(lái)看,尚未發(fā)現(xiàn)哪位國(guó)內(nèi)學(xué)者做過(guò)三系統(tǒng)估計(jì)量的理論研究,甚至連基礎(chǔ)的應(yīng)用研究也沒(méi)有。

    二、五個(gè)國(guó)家人口普查質(zhì)量評(píng)估情況

    (一)美國(guó)

    自1980年起,美國(guó)開(kāi)始進(jìn)行正式的人口普查質(zhì)量評(píng)估,并把它作為每隔10年1次的人口普查不可分割的一部分。評(píng)估采取了不同的方法,包括行政記錄比較、逆記錄檢查、網(wǎng)絡(luò)抽樣詢問(wèn)、事后計(jì)數(shù)調(diào)查和人口統(tǒng)計(jì)分析。

    1.行政記錄比較

    它是通過(guò)對(duì)比從行政記錄系統(tǒng)中抽取的樣本人口記錄與本次人口普查人口記錄而獲得覆蓋誤差估計(jì)值的一種方法。在這個(gè)方法中,要求獲得不同來(lái)源的人口行政記錄文件,并不重復(fù)地把它們組合在一起構(gòu)造超級(jí)人口行政記錄系統(tǒng)。根據(jù)超級(jí)人口行政記錄系統(tǒng)與普查記錄比較結(jié)果的未匹配率來(lái)確定被普查遺漏的人口數(shù)。

    行政記錄比較有兩大優(yōu)勢(shì):一是它完全獨(dú)立于人口普查,因而被普查遺漏的人口可能包括在人口行政記錄文件中;二是它能覆蓋普查目標(biāo)總體中的大部分難以計(jì)數(shù)人口,例如無(wú)家可歸者、在逃犯人等。這兩大優(yōu)勢(shì)有助于發(fā)現(xiàn)普查遺漏人口。行政記錄比較有四個(gè)缺陷:一是難以保證超級(jí)人口行政記錄系統(tǒng)完全覆蓋目標(biāo)總體及其各個(gè)子總體的人口;二是為提高匹配率必須擴(kuò)大比較范圍以致增加現(xiàn)場(chǎng)工作量;三是超級(jí)人口行政記錄系統(tǒng)可能存在重復(fù)人口,因?yàn)槿藗優(yōu)楦髯圆煌哪康模赡軙?huì)在不同的行政記錄文件中使用不同的姓名和地址,這可能導(dǎo)致虛假的未匹配;四是難以精確確認(rèn)行政記錄文件所對(duì)應(yīng)的目標(biāo)總體,這不便于推斷總體參數(shù)。

    行政記錄已應(yīng)用于美國(guó)人口普查質(zhì)量評(píng)估和其他統(tǒng)計(jì)領(lǐng)域。通過(guò)對(duì)比超級(jí)人口行政記錄系統(tǒng)與1940年人口普查記錄,結(jié)果發(fā)現(xiàn),很多被登記在行政記錄文件中的男性被人口普查遺漏。隨后,美國(guó)又進(jìn)行行政記錄文件與人口普查記錄、人口普查預(yù)演調(diào)查和其他統(tǒng)計(jì)調(diào)查記錄的比較。例如對(duì)比醫(yī)療保險(xiǎn)記錄、1970年人口普查記錄和1980年事后計(jì)數(shù)調(diào)查記錄;對(duì)比社會(huì)保障記錄、1980年事后計(jì)數(shù)調(diào)查記錄和1988年普查預(yù)演調(diào)查記錄;對(duì)比國(guó)家稅務(wù)局記錄與1978年2月的當(dāng)前人口調(diào)查記錄、1978年人口普查預(yù)演調(diào)查記錄、1980年事后計(jì)數(shù)調(diào)查記錄、1980年人口普查記錄;對(duì)比電動(dòng)車駕駛員執(zhí)照記錄與1980年人口普查記錄、1970年人口普查記錄、1988年人口普查預(yù)演調(diào)查記錄;對(duì)比福利記錄與1980年人口普查記錄;對(duì)比老兵行政記錄與圣路易斯1988年人口普查預(yù)演調(diào)查及其事后計(jì)數(shù)調(diào)查記錄;對(duì)比緩刑中的犯人、假釋者姓名和地址記錄與1990年人口普查記錄。

    2.逆記錄檢查

    它屬于抽樣調(diào)查,其抽樣框通常由以前普查被計(jì)數(shù)人口、以前普查遺漏人口、出生人口、遷入人口和當(dāng)前人口組成。樣本從每一類人口中隨機(jī)抽取,對(duì)抽取的樣本與本次人口普查數(shù)據(jù)庫(kù)的人口記錄進(jìn)行比較。樣本中個(gè)人未匹配率為在人口普查中被遺漏的個(gè)人比例估計(jì)值,即遺漏率。美國(guó)曾使用逆記錄檢查估計(jì)1960年普查遺漏人口數(shù)及其遺漏率。

    逆記錄檢查的最大優(yōu)勢(shì)是能夠提供人口普查中的遺漏人口總數(shù)。它也有明顯的缺陷:一是為了提供普查錯(cuò)誤計(jì)數(shù)估計(jì)值,需要增加一個(gè)獨(dú)立的普查計(jì)數(shù)樣本;二是抽樣框之間可能有人口重復(fù),這導(dǎo)致同一人口可能被多次抽取,從而影響樣本對(duì)目標(biāo)總體的代表性。

    3.網(wǎng)絡(luò)抽樣詢問(wèn)

    在人口普查期間,通過(guò)網(wǎng)絡(luò)隨機(jī)抽取一部分人口進(jìn)行詢問(wèn)以獲得被普查遺漏的人口。要求回答者報(bào)告他們親屬的姓名和地址,例如父母親、兄弟姐妹和孩子及其地址。檢查所報(bào)告的地址上的普查計(jì)數(shù)以確定回答者的親屬是否在普查中計(jì)數(shù)。普查遺漏估計(jì)值為那些被遺漏人口數(shù)的抽樣權(quán)數(shù)之和。

    這個(gè)方法的優(yōu)勢(shì)是可以查找到大部分難以計(jì)數(shù)人口。劣勢(shì)是實(shí)施比較困難,因?yàn)榛卮鹫呒词怪浪麄兊挠H戚居住在哪里,也可能不知道他們確切的居住地址。

    在1978年普查預(yù)演調(diào)查中,美國(guó)使用這個(gè)方法估計(jì)這次普查預(yù)演調(diào)查中的遺漏人口數(shù),但估計(jì)結(jié)果的最終報(bào)告一直沒(méi)有對(duì)外發(fā)布。1990年郵寄普查表返回后,在10個(gè)地區(qū)組織電話后續(xù)調(diào)查評(píng)估網(wǎng)絡(luò)抽樣詢問(wèn)的有效性。先請(qǐng)回答者填上已經(jīng)不再是家庭成員的孩子姓名和電話號(hào)碼,然后找到這些孩子詢問(wèn)是否被普查計(jì)數(shù)。

    4.事后計(jì)數(shù)調(diào)查與人口統(tǒng)計(jì)分析

    美國(guó)從1980年人口普查開(kāi)始,一方面在事后計(jì)數(shù)調(diào)查中用雙系統(tǒng)估計(jì)量構(gòu)造實(shí)際人口數(shù)估計(jì)量及人口普查凈誤差估計(jì)量;另一方面獨(dú)立地用人口統(tǒng)計(jì)分析來(lái)估計(jì)實(shí)際人口數(shù),并將其作為前一結(jié)果的佐證。雙系統(tǒng)估計(jì)量是通過(guò)移植統(tǒng)計(jì)學(xué)中用來(lái)估計(jì)封閉環(huán)境中某種自由移動(dòng)動(dòng)物數(shù)量的有名的捕獲—再捕獲模型來(lái)構(gòu)造。人口統(tǒng)計(jì)分析設(shè)法用人口的出生、死亡、遷移、醫(yī)療保險(xiǎn)等有關(guān)的行政記錄資料來(lái)獲得實(shí)際人口數(shù)的估計(jì)值。由于雙系統(tǒng)估計(jì)量只能在被人口普查登記概率相同的層內(nèi)構(gòu)造,所以需要對(duì)抽取的樣本普查小區(qū)的人口按反應(yīng)被普查登記概率大小的標(biāo)志作事后分層。很顯然,在樣本量一定的情況下,事后分層標(biāo)志越多,每個(gè)事后層分配的樣本量越少,估計(jì)的人口數(shù)目精度越低。為解決這個(gè)問(wèn)題,美國(guó)在2010年設(shè)計(jì)了用羅吉斯蒂回歸模型實(shí)現(xiàn)事后分層目標(biāo)的實(shí)施方案。由于普查與其事后計(jì)數(shù)調(diào)查不獨(dú)立引起的交互作用偏差使雙系統(tǒng)估計(jì)量低估或高估實(shí)際人口數(shù)和人口普查凈誤差。為解決交互作用偏差問(wèn)題,美國(guó)在2000年進(jìn)行了基于捕獲—再捕獲—再捕獲模型的三系統(tǒng)估計(jì)量實(shí)際人口數(shù)目估計(jì)實(shí)驗(yàn)。由于三系統(tǒng)估計(jì)量構(gòu)造涉及到一系列復(fù)雜的理論和實(shí)踐問(wèn)題至今尚未得到很好地解決,因而到2010年仍然未被美國(guó)普查局采納。美國(guó)普查局計(jì)劃在2020年使用三系統(tǒng)估計(jì)量估計(jì)實(shí)際人口數(shù)及人口普查凈誤差。

    (二)新西蘭

    1996年新西蘭進(jìn)行了第一次正式的人口普查事后計(jì)數(shù)調(diào)查。2006年事后計(jì)數(shù)調(diào)查的目標(biāo)是估計(jì)普查凈遺漏人口數(shù)、遺漏人口數(shù)和重復(fù)登記人口數(shù)。

    2006年事后計(jì)數(shù)調(diào)查抽樣總體由新西蘭私人住宅的常住居民和在事后計(jì)數(shù)調(diào)查期間居住在新西蘭私人住宅里的個(gè)人、海外訪問(wèn)者組成。與國(guó)際統(tǒng)計(jì)慣例一致,抽樣總體沒(méi)有包括居住或停留在非私人住宅的人口、居住在其他私人住宅(廟宇、有篷的車輛、游艇)的人口、普查日前死亡和普查日后出生的人口、海外的外交官以及他們的家庭成員和與他們住在一起的人口等。

    樣本抽取包括六個(gè)步驟。第一步,將全國(guó)劃分為41 392個(gè)街區(qū)。為減少抽樣單位,將這些街區(qū)合并為20 394個(gè)基本抽樣單位。第二步,按地理位置和人口統(tǒng)計(jì)特征把這些基本抽樣單位劃分在119個(gè)層中。第三步,從119層中抽取家庭勞動(dòng)力抽樣調(diào)查所需要的基本抽樣單位1 768個(gè)。第四步,從1 768個(gè)基本抽樣單位中抽取1011個(gè)。抽取的方法是:從毛利人、太平洋島嶼人和亞洲人均多的層中或毛利人、太平洋島嶼人均多的層中抽取全部基本抽樣單位;從毛利人多或太平洋島嶼人多或亞洲人多的層中抽取5/8的基本抽樣單位;從其他的島嶼層中抽取1/2的基本抽樣單位;從其余的層中抽取3/8的基本抽樣單位。第五步,將抽取的每個(gè)基本抽樣單位劃分為6~7組,每組含私人住宅約10個(gè)。第六步,隨機(jī)地從抽取的每一個(gè)基本抽樣單位中抽取1個(gè)小組,含最終樣本私人住宅10 907個(gè)。

    使用事后計(jì)數(shù)調(diào)查問(wèn)卷采集抽取的基本抽樣單位的每一個(gè)私人住宅及其家庭成員。如果成員不在家,由其鄰居代替回答。對(duì)無(wú)法調(diào)查的住宅或信息不完整的住宅,進(jìn)行后續(xù)調(diào)查采集額外信息。

    比對(duì)同一樣本基本抽樣單位小組的事后計(jì)數(shù)調(diào)查問(wèn)卷與普查表信息。比對(duì)采取手工方式進(jìn)行。首先比對(duì)住宅,如果問(wèn)卷中的住宅在普查表中無(wú)法找到,就認(rèn)為該住宅被普查遺漏。住宅比較的結(jié)果有三種:匹配住宅、未匹配住宅和比較狀態(tài)懸而未決住宅。其次對(duì)匹配住宅再比對(duì)其中的個(gè)人,用于個(gè)人比對(duì)的變量包括姓名、出生日期或年齡、性別、民族和常住居民還是訪問(wèn)者等。個(gè)人比對(duì)后的結(jié)果也有三種:匹配者、未匹配者和比對(duì)狀態(tài)懸而未決者。

    使用[(估計(jì)的事后計(jì)數(shù)調(diào)查人口數(shù)/估計(jì)的普查人口數(shù))×普查登記人口數(shù)+(未返回普查表但有足夠證據(jù)證實(shí)家庭實(shí)際存在的普查人口數(shù))]作為估計(jì)目標(biāo)總體實(shí)際人口數(shù)的計(jì)算公式。在此基礎(chǔ)上計(jì)算人口普查凈遺漏人口數(shù)及凈遺漏率。另外,使用事后計(jì)數(shù)調(diào)查抽樣權(quán)數(shù)估計(jì)普查遺漏人口數(shù)與重復(fù)登記人口數(shù)。

    (三)澳大利亞

    澳大利亞2011年事后計(jì)數(shù)調(diào)查目標(biāo)是提供2011年人口普查凈誤差及其構(gòu)成部分(遺漏和錯(cuò)誤計(jì)數(shù))。

    從理論上看,事后計(jì)數(shù)調(diào)查抽樣框應(yīng)該與人口普查范圍相同。然而,由于一些實(shí)際原因,其覆蓋范圍往往受到限制。澳大利亞2011年事后計(jì)數(shù)調(diào)查抽樣框沒(méi)有包括下列人口:公共住宅人口(旅館、汽車旅館、醫(yī)院、老年公寓),事后計(jì)數(shù)調(diào)查時(shí)居住在其他國(guó)家的人口,人口普查日后死亡的人口,人口稀少地區(qū)(每平方公里不足0.57個(gè)住宅)人口,遙遠(yuǎn)地區(qū)人口,居住在澳大利亞的其他國(guó)家和地區(qū)的外交官及其家屬。

    樣本采取分層多階段方式從抽樣框抽取。在抽取樣本之前,將全國(guó)劃分為100個(gè)地區(qū),在每個(gè)地區(qū)按人口密度、距離遠(yuǎn)近等標(biāo)志分層。在每一層,第一階段,以普查數(shù)據(jù)采集區(qū)為抽樣單位,采取等距PPS方式抽取普查數(shù)據(jù)采集區(qū);第二階段,對(duì)每個(gè)抽取的普查數(shù)據(jù)采集區(qū)進(jìn)一步劃分為街區(qū),以街區(qū)為抽樣單位,采取等距PPS方式抽取街區(qū);第三階段,在每個(gè)抽取的街區(qū)中,以住宅為抽樣單位,采取等距PPS方式抽取住宅,對(duì)抽取的住宅不再進(jìn)一步抽取個(gè)人。對(duì)人口稀少地區(qū),在抽取普查數(shù)據(jù)采集區(qū)之前增加一個(gè)抽樣階段,以保證樣本并不是完全按地區(qū)均勻分布。

    對(duì)抽取的樣本,使用問(wèn)卷采集數(shù)據(jù),然后比較這些數(shù)據(jù)。比較的對(duì)象是人口普查與事后計(jì)數(shù)調(diào)查登記的同一住宅或個(gè)人記錄。住宅比較的目的是確定事后計(jì)數(shù)調(diào)查中的住宅是否在人口普查中被登記(如果登記就稱該住宅為匹配,反之稱未匹配)。對(duì)未匹配住宅,現(xiàn)場(chǎng)查看其在樣本普查數(shù)據(jù)采集區(qū)是否實(shí)際存在或是否被普查漏登。所有未匹配住宅都要經(jīng)過(guò)事后計(jì)數(shù)調(diào)查監(jiān)督員的確認(rèn)與簽字。對(duì)經(jīng)過(guò)住宅比較后的匹配住宅,再對(duì)其中的人口進(jìn)行個(gè)人記錄比較。個(gè)人記錄比較的內(nèi)容包括姓名、性別、出生日期、出生地、婚姻狀況、是否為澳大利亞本土居民、出生國(guó)和與家庭戶主的關(guān)系。根據(jù)比較結(jié)果的相似性,判斷事后計(jì)數(shù)調(diào)查個(gè)人是匹配、未匹配或是否匹配懸而未決。

    住宅和個(gè)人比較結(jié)束后,下一步所要做的工作是估計(jì)人口普查凈誤差及其構(gòu)成部分。為提高人口普查覆蓋誤差估計(jì)的精度,事后計(jì)數(shù)調(diào)查必須與人口普查獨(dú)立,包括操作獨(dú)立和人口獨(dú)立。操作獨(dú)立指人口普查的操作方式不影響事后計(jì)數(shù)調(diào)查。人口獨(dú)立指人口普查不能遺漏某些人群。凈誤差定義為應(yīng)該在人口普查中被計(jì)數(shù)的事后計(jì)數(shù)調(diào)查人口數(shù)目估計(jì)值與普查人口數(shù)之差。應(yīng)該在人口普查中被計(jì)數(shù)的事后計(jì)數(shù)調(diào)查人口數(shù)目估計(jì)值為事后計(jì)數(shù)調(diào)查樣本個(gè)人抽樣權(quán)數(shù)之和,而普查人口數(shù)為普查表中的人口數(shù)加上估算的無(wú)答復(fù)住宅中的人口數(shù)。在確定事后計(jì)數(shù)調(diào)查樣本個(gè)人抽樣權(quán)數(shù)之前,先確定事后計(jì)數(shù)調(diào)查樣本住宅最終抽樣權(quán)數(shù),它等于樣本住宅設(shè)計(jì)抽樣權(quán)數(shù)(抽樣概率倒數(shù))"(某層人口普查住宅數(shù)目/該層樣本住宅設(shè)計(jì)抽樣權(quán)數(shù)之和)"(某層樣本住宅數(shù)目/該層實(shí)際接受調(diào)查的樣本住宅數(shù)目)。如果某樣本住宅中的人口全部接受了事后計(jì)數(shù)調(diào)查,那么樣本住宅最終抽樣權(quán)數(shù)是該住宅樣本個(gè)人抽樣權(quán)數(shù),反之要根據(jù)該住宅在人口普查中漏登或拒絕答復(fù)的人口數(shù)目,對(duì)樣本住宅最終抽樣權(quán)數(shù)進(jìn)行調(diào)整,才能得到該住宅接受事后計(jì)數(shù)調(diào)查的樣本個(gè)人抽樣權(quán)數(shù)。凈誤差構(gòu)成部分中的遺漏人口數(shù)定義為,事后計(jì)數(shù)應(yīng)該在人口普查中被計(jì)數(shù)的事后計(jì)數(shù)調(diào)查人口數(shù)目估計(jì)值與事后計(jì)數(shù)調(diào)查同人口普查匹配的人口數(shù)目估計(jì)值之差,重復(fù)登記人口數(shù)定義為重復(fù)登記人口的個(gè)人抽樣權(quán)數(shù)之和。

    2011年澳大利亞普查局提供了全國(guó)及各地區(qū)(南威爾士、維多利亞、昆士蘭、澳大利亞南部、澳大利亞西部、塔斯馬尼亞、北領(lǐng)地、澳大利亞首都領(lǐng)地),以及不同年齡、不同性別的事后計(jì)數(shù)調(diào)查人口數(shù)目估計(jì)值、人口普查凈誤差率、遺漏率、重復(fù)登記率及其抽樣標(biāo)準(zhǔn)誤差。這些數(shù)據(jù)用于修正本次普查人口數(shù)和評(píng)價(jià)本次人口普查數(shù)據(jù)采集過(guò)程的質(zhì)量。

    1971年以來(lái),澳大利亞在使用事后計(jì)數(shù)調(diào)查的同時(shí),還使用人口統(tǒng)計(jì)分析估計(jì)人口普查覆蓋誤差。使用人口統(tǒng)計(jì)分析的前提條件是擁有完整的人口出生、死亡和國(guó)際凈遷移的時(shí)間序列數(shù)據(jù)。人口統(tǒng)計(jì)分析結(jié)果用來(lái)佐證事后計(jì)數(shù)調(diào)查估計(jì)的普查覆蓋誤差的準(zhǔn)確性。由于老年人口時(shí)間序列數(shù)據(jù)需要進(jìn)行估計(jì),因而使用人口統(tǒng)計(jì)分析估計(jì)的老年人口數(shù)目精度呈降低趨勢(shì)。

    (四)英國(guó)

    自1801年起,英國(guó)(英格蘭、蘇格蘭、北愛(ài)爾蘭和威爾士)每隔10年進(jìn)行1次人口普查。1961年開(kāi)始在人口普查后進(jìn)行事后計(jì)數(shù)調(diào)查。

    調(diào)查將英國(guó)劃分為若干設(shè)計(jì)區(qū)。每個(gè)設(shè)計(jì)區(qū)由行政區(qū)或鄰近的一組行政區(qū)構(gòu)成。如果行政區(qū)規(guī)模達(dá)到50萬(wàn)人以上(在英國(guó)很少有人口規(guī)模達(dá)到50萬(wàn)人的行政區(qū)),就單獨(dú)作為一個(gè)設(shè)計(jì)區(qū),反之就由鄰近的一組行政區(qū)組合為一個(gè)設(shè)計(jì)區(qū)。每個(gè)行政區(qū)由若干輸出區(qū)(個(gè)人被普查登記概率基本相同)組成。按反映人口普查計(jì)數(shù)難度的六個(gè)變量(年齡、住房類型、種族、房屋私人租賃、房屋其他租賃或部分租賃部分抵押、收入)將每個(gè)行政區(qū)的所有輸出區(qū)劃分在五個(gè)抽樣層,即計(jì)數(shù)非常容易層、計(jì)數(shù)容易層、計(jì)數(shù)有些困難層、計(jì)數(shù)比較困難層、計(jì)數(shù)很困難層。每個(gè)輸出區(qū)由若干郵政編碼組成,每個(gè)郵政編碼由若干家庭戶組成,郵政編碼分為樣本郵政編碼和非樣本郵政編碼。

    2011年事后計(jì)數(shù)調(diào)查樣本量維持在2001年水平上,即在全國(guó)大約抽取32.5萬(wàn)個(gè)家庭。這樣做基于三方面的考慮:一是經(jīng)費(fèi)預(yù)算有限;二是2001年事后計(jì)數(shù)調(diào)查成功的經(jīng)驗(yàn)表明,2011年只要設(shè)計(jì)合理,組織得當(dāng),使用與2001年相同的樣本量也能獲得同樣精度的估計(jì)值;三是2001年成功并不意味著2011年使用更大的樣本量就一定能夠獲得更大的成功。樣本量確定后,按預(yù)計(jì)的普查遺漏情況分配樣本量。對(duì)預(yù)計(jì)普查遺漏嚴(yán)重的地區(qū)分配的樣本量要多,反之要少。一般地說(shuō),樣本量少的地區(qū)估計(jì)的精度難以獲得普查數(shù)據(jù)用戶的認(rèn)可。

    以行政區(qū)為范圍,采取分層兩階段方式抽取事后計(jì)數(shù)調(diào)查樣本。第一階段,以輸出區(qū)為抽樣單位,使用不等概率抽取輸出區(qū);第二階段,以郵政編碼為抽樣單位,使用等概率方式從抽取的輸出區(qū)中抽取郵政編碼,對(duì)抽取的郵政編碼內(nèi)的所有家庭100%抽取。

    樣本抽取后,使用問(wèn)卷采集信息。對(duì)采集的信息進(jìn)行比較。比較包括四個(gè)階段。第一階段,進(jìn)行確定性比較。如果普查和事后計(jì)數(shù)調(diào)查的家庭和個(gè)人記錄完整、準(zhǔn)確,就使用計(jì)算機(jī)比較,把兩個(gè)調(diào)查的數(shù)據(jù)輸入裝有比較程序的計(jì)算機(jī)。比較結(jié)束后,計(jì)算機(jī)自動(dòng)輸出比較結(jié)果。由于記錄完整,所以不會(huì)發(fā)生比較誤差。比較結(jié)果匹配或者未匹配,對(duì)未匹配記錄轉(zhuǎn)入第二階段做概率比較。第二階段,概率比較。它包括兩個(gè)步驟:首先,估計(jì)未匹配記錄轉(zhuǎn)變?yōu)槠ヅ溆涗浀目偢怕蕶?quán)數(shù)。它依據(jù)未匹配記錄的三個(gè)變量(姓名、房屋所有權(quán)和年齡)的一致性程度來(lái)確定。一致性程度越高,概率權(quán)數(shù)就越大。三個(gè)變量的概率權(quán)數(shù)之和就是總概率權(quán)數(shù);然后,比較未匹配記錄總概率權(quán)數(shù)與設(shè)定的總概率權(quán)數(shù)的上下限臨界值。比較結(jié)果有三種:如果未匹配記錄的總概率權(quán)數(shù)超過(guò)了臨界值上限,就把它們作為匹配記錄;如果小于設(shè)定的總概率權(quán)數(shù)臨界值下限,就作為未匹配記錄;如果總概率權(quán)數(shù)在上述兩者之間,就轉(zhuǎn)入第三階段決定它們是匹配記錄還是未匹配記錄。第三階段,手工決定。比較人員只需要決定第二階段轉(zhuǎn)入的未匹配記錄是匹配還是未匹配記錄,而不需要為匹配而在周圍區(qū)域搜索。比較結(jié)果有兩種:匹配記錄和未匹配記錄。第四階段,手工比較。對(duì)第三階段仍然未匹配的記錄,使用嚴(yán)格的比較規(guī)則在周圍區(qū)域進(jìn)行搜索,看是否能夠找到對(duì)應(yīng)的記錄。比較結(jié)果有兩種:匹配和未匹配記錄。

    比較結(jié)束后,計(jì)算與覆蓋誤差有關(guān)的指標(biāo)。第一,人口普查重復(fù)人口數(shù)目估計(jì)值。它可以通過(guò)四種方法獲得:一是檢查樣本本身的人口普查記錄;二是比較人口普查記錄與事后計(jì)數(shù)調(diào)查記錄;三是現(xiàn)場(chǎng)確認(rèn)在人口普查記錄但未在事后計(jì)數(shù)調(diào)查記錄的人口是否實(shí)際存在;四是使用各種外部信息來(lái)源。第二,計(jì)算全國(guó)實(shí)際人口數(shù)目估計(jì)值。首先使用雙系統(tǒng)估計(jì)量估計(jì)每個(gè)行政區(qū)的實(shí)際人口數(shù);然后把估計(jì)的每個(gè)行政區(qū)的實(shí)際人口數(shù)匯總即為某個(gè)設(shè)計(jì)區(qū)實(shí)際人口數(shù)的估計(jì)值;最后匯總所有設(shè)計(jì)區(qū)實(shí)際人口數(shù)估計(jì)值即得到全國(guó)估計(jì)的實(shí)際人口數(shù)估計(jì)值。第三,計(jì)算全國(guó)人口普查凈誤差估計(jì)值。它為估計(jì)的全國(guó)實(shí)際人口數(shù)與全國(guó)普查人口數(shù)之差。第四,計(jì)算全國(guó)遺漏人口數(shù)估計(jì)值。它為凈誤差與普查重復(fù)人口數(shù)之和。第五,計(jì)算全國(guó)普查凈誤差率估計(jì)值、全國(guó)普查重復(fù)計(jì)數(shù)率估計(jì)值、全國(guó)普查遺漏率估計(jì)值。

    近幾年來(lái),英國(guó)同時(shí)使用事后計(jì)數(shù)調(diào)查和人口統(tǒng)計(jì)分析評(píng)估人口普查質(zhì)量。第一,人口統(tǒng)計(jì)分析結(jié)果作為判斷事后計(jì)數(shù)調(diào)查結(jié)果可靠性的依據(jù);第二,人口統(tǒng)計(jì)分析作為估計(jì)普查年和非普查年人口數(shù)目的基本方法;第三,人口統(tǒng)計(jì)分析為修正普查人口數(shù)提供基礎(chǔ)數(shù)據(jù)。

    (五)中國(guó)

    中國(guó)自1982年起進(jìn)行正式的每隔10年1次的人口普查質(zhì)量評(píng)估①見(jiàn)2012年國(guó)家統(tǒng)計(jì)局課題報(bào)告《人口普查的事后質(zhì)量抽查》。。相比加拿大、北歐國(guó)家的人口行政記錄,中國(guó)無(wú)論在數(shù)量上還是質(zhì)量上均存在較大差距。因此,不具備使用人口統(tǒng)計(jì)分析、逆記錄檢查和行政記錄比較進(jìn)行人口普查質(zhì)量評(píng)估的條件。截止2010年,中國(guó)一直是使用事后質(zhì)量抽查(即事后計(jì)數(shù)調(diào)查)對(duì)人口普查質(zhì)量進(jìn)行評(píng)估。

    中國(guó)“六普”事后計(jì)數(shù)調(diào)查目標(biāo)是估計(jì)人口漏報(bào)率,包括現(xiàn)有人口漏報(bào)率、常住人口漏報(bào)率、戶籍人口漏報(bào)率;估計(jì)人口重登率,包括現(xiàn)有人口重登率、常住人口重登率、戶籍人口重登率;估計(jì)人口凈漏報(bào)率;估計(jì)出生人口和死亡人口漏報(bào)率;估計(jì)年齡和性別差錯(cuò)率。

    樣本分四步抽取。一是獲取由“六普”地址碼庫(kù)構(gòu)成的抽樣框(含552萬(wàn)個(gè)普查小區(qū)的地址碼、行政區(qū)劃名稱、普查小區(qū)所在的城鄉(xiāng)屬性,即111為主城區(qū)、112為城鄉(xiāng)結(jié)合區(qū)、121為鎮(zhèn)中心區(qū)、122為鎮(zhèn)鄉(xiāng)結(jié)合區(qū)、123為特殊區(qū)域、210為鄉(xiāng)中心區(qū)和220為村莊);二是按照全國(guó)總?cè)丝诼﹫?bào)率相對(duì)誤差控制在5%以內(nèi)、人口出生率相對(duì)誤差控制在6%以內(nèi)和人口死亡率相對(duì)誤差控制在8%以內(nèi)的設(shè)計(jì)目標(biāo),全國(guó)共抽取402個(gè)縣級(jí)單位的402個(gè)普查小區(qū),約4萬(wàn)戶、12萬(wàn)人;三是將全國(guó)31個(gè)省份按照人口流動(dòng)類型(流入、流出以及流入流出基本平衡地區(qū)類型)分為三類,在不同類中按照凈流入人口規(guī)?;虺W∪丝谝?guī)模等指標(biāo)進(jìn)行分層,在每層內(nèi)等量分配每個(gè)省份的樣本;四是按分層、隨機(jī)、等距、整群抽樣方式抽取省級(jí)普查小區(qū)。

    抽取樣本普查小區(qū)后,使用抽查表(即事后計(jì)數(shù)調(diào)查表)采集人口信息,包括姓名、性別、出生年月、抽查時(shí)點(diǎn)居住地、戶口登記地、離開(kāi)戶口登記地的原因、截止普查標(biāo)準(zhǔn)日離開(kāi)戶籍登記地的時(shí)間、是否被普查登記。對(duì)普查時(shí)點(diǎn)居住在其他普查小區(qū)和戶口登記地未填寫具體地址的人通過(guò)查詢方式獲得這兩方面的詳細(xì)信息。

    數(shù)據(jù)采集完畢后就進(jìn)行數(shù)據(jù)處理,包括普查表錄入、抽查表錄入、抽查數(shù)據(jù)與普查數(shù)據(jù)比對(duì)、反饋查詢、加權(quán)匯總等步驟。前四步數(shù)據(jù)處理過(guò)程使用專門軟件《第六次全國(guó)人口普查事后計(jì)數(shù)調(diào)查數(shù)據(jù)處理系統(tǒng)》進(jìn)行。加權(quán)匯總工作使用SAS或SPSS統(tǒng)計(jì)軟件進(jìn)行。利用《第六次全國(guó)人口普查事后計(jì)數(shù)調(diào)查數(shù)據(jù)處理系統(tǒng)》生成的包括普查表、抽查表、比對(duì)情況、查詢表等數(shù)據(jù)在內(nèi)的數(shù)據(jù)庫(kù),使用統(tǒng)計(jì)軟件對(duì)事后計(jì)數(shù)調(diào)查數(shù)據(jù)進(jìn)行加權(quán)匯總。匯總指標(biāo)主要有:抽查總戶數(shù)、總?cè)藬?shù)、出生人口、死亡人口、入戶率、現(xiàn)有人口漏報(bào)(重報(bào))率、常住人口漏報(bào)(重報(bào))率、戶籍人口漏報(bào)(重報(bào))率、分性別漏報(bào)(重報(bào))率、分年齡段漏報(bào)(重報(bào))率。其中現(xiàn)有人口漏報(bào)的判斷方法是:如果抽查表中的現(xiàn)有人口在普查時(shí)點(diǎn)居住在本樣本普查小區(qū),就與該普查小區(qū)的普查表進(jìn)行比對(duì),若在普查表中未找到,就作為普查漏報(bào)處理。如果抽查表中的現(xiàn)有人口在普查時(shí)點(diǎn)居住在其他普查小區(qū),就與其他普查小區(qū)的普查表比對(duì),若在其他普查小區(qū)的普查表中未找到,就作為普查漏報(bào)處理。現(xiàn)有人口重報(bào)的判斷方法是:如果抽查表中的某個(gè)人出現(xiàn)在多個(gè)地點(diǎn)的普查時(shí)點(diǎn)的普查表中,就判斷為普查重報(bào)人口。常住人口漏報(bào)(重報(bào))、戶籍人口漏報(bào)(重報(bào))、分性別漏報(bào)(重報(bào))、分年齡段漏報(bào)(重報(bào))也采取類似的方法判斷。

    三、結(jié)論、建議與展望

    從前面五個(gè)國(guó)家的人口普查質(zhì)量評(píng)估實(shí)踐可以看出,每一種覆蓋誤差估計(jì)方法都有它特定的使用范圍與條件。其中逆記錄檢查、行政記錄比較和人口統(tǒng)計(jì)分析需要有健全的行政記錄資料。對(duì)絕大多數(shù)發(fā)展中國(guó)家來(lái)說(shuō),由于缺少這方面的資料,因而難以使用這三種方法。然而,事后計(jì)數(shù)調(diào)查不受資料的限制,無(wú)論是行政記錄不健全的發(fā)展中國(guó)家,還是行政記錄健全的發(fā)達(dá)國(guó)家都可以使用它。目前世界上共有126個(gè)國(guó)家和地區(qū)進(jìn)行人口普查及其質(zhì)量評(píng)估,其中96個(gè)國(guó)家和地區(qū)在人口普查后進(jìn)行事后計(jì)數(shù)調(diào)查。

    美國(guó)開(kāi)始是采取行政記錄比較、逆記錄檢查和網(wǎng)絡(luò)抽樣詢問(wèn)評(píng)估人口普查質(zhì)量。后來(lái),隨著一些學(xué)者對(duì)人口普查質(zhì)量評(píng)估方法研究的逐步深入,事后計(jì)數(shù)調(diào)查和人口統(tǒng)計(jì)分析相繼被美國(guó)普查局采納。由于美國(guó)是一個(gè)多種族、多民族國(guó)家,建立健全的人口行政記錄系統(tǒng)有一定的困難,因此一直是把事后計(jì)數(shù)調(diào)查作為它的人口普查質(zhì)量評(píng)估的主要方法,而人口統(tǒng)計(jì)分析只是作為這一主要方法的輔助方法。行政記錄比較、逆記錄檢查和網(wǎng)絡(luò)抽樣詢問(wèn)已停止使用。

    新西蘭事后計(jì)數(shù)調(diào)查有三個(gè)顯著特點(diǎn):一是使用線性估計(jì)量而不是雙系統(tǒng)估計(jì)量估計(jì)實(shí)際人口數(shù);二是事后計(jì)數(shù)調(diào)查樣本是從家庭勞動(dòng)力抽樣調(diào)查樣本中抽取的;三是提供全國(guó)和各個(gè)地區(qū)以及不同類型人口的覆蓋誤差及其抽樣誤差的估計(jì)值。

    澳大利亞把人口普查凈誤差定義為應(yīng)該在人口普查計(jì)數(shù)的事后計(jì)數(shù)調(diào)查人口數(shù)估計(jì)值與普查人口數(shù)之差。這種方法與美國(guó)的凈誤差定義完全不同。由于事后計(jì)數(shù)調(diào)查覆蓋人口總體的范圍小于事后計(jì)數(shù)調(diào)查與人口普查,因而由事后計(jì)數(shù)調(diào)查資料構(gòu)造的單系統(tǒng)估計(jì)量往往會(huì)低估實(shí)際人口數(shù)和人口普查凈誤差。

    英國(guó)使用雙系統(tǒng)估計(jì)量不像美國(guó)那樣增加一個(gè)事后分層環(huán)節(jié),而是在事前分層中就考慮到被人口普查登記的等概率分層問(wèn)題。另外,首先使用雙系統(tǒng)估計(jì)量估計(jì)樣本普查小區(qū)本身的實(shí)際人口數(shù),并計(jì)算樣本普查小區(qū)估計(jì)的實(shí)際人口數(shù)與其普查人口數(shù)比率;然后用這個(gè)樣本比率逐步估計(jì)大范圍的實(shí)際人口數(shù)。為驗(yàn)證雙系統(tǒng)估計(jì)量結(jié)果,使用人口統(tǒng)計(jì)分析估計(jì)的相應(yīng)結(jié)果作為參照物。

    同美國(guó)等國(guó)相比,中國(guó)事后計(jì)數(shù)調(diào)查存在較為明顯的缺陷。一是事后計(jì)數(shù)調(diào)查樣本總量過(guò)小以及未按國(guó)際上通行的人口數(shù)比例在各層之間進(jìn)行分配;二是沒(méi)有對(duì)抽取的樣本普查小區(qū)中的人口做事后分層以滿足雙系統(tǒng)估計(jì)量的等概率要求;三是未使用國(guó)際上通用的分層抽樣刀切法計(jì)算雙系統(tǒng)估計(jì)量的估計(jì)方差;四是沒(méi)有考慮到普查標(biāo)準(zhǔn)日與事后計(jì)數(shù)調(diào)查日之間可能發(fā)生的人口遷移,也就是說(shuō),沒(méi)有將事后計(jì)數(shù)調(diào)查人口按是否遷移劃分為無(wú)移動(dòng)者、向內(nèi)移動(dòng)者和向外移動(dòng)者;五是充當(dāng)漏報(bào)率或重報(bào)率分母的是事后計(jì)數(shù)調(diào)查樣本人口數(shù)或使用雙系統(tǒng)估計(jì)量估計(jì)的樣本普查小區(qū)本身的人口數(shù),而分子是樣本普查小區(qū)本身的漏報(bào)人口數(shù)和錯(cuò)報(bào)人口數(shù),這違背了抽樣理論要求將樣本普查小區(qū)各類人口數(shù)通過(guò)抽樣權(quán)數(shù)擴(kuò)張到相應(yīng)的子總體人數(shù)的做法;六是未對(duì)錯(cuò)報(bào)與漏報(bào)做詳細(xì)的劃分與估計(jì),并且未計(jì)算漏報(bào)率與錯(cuò)報(bào)率的方差估計(jì)值。

    針對(duì)上述缺陷,對(duì)中國(guó)人口普查質(zhì)量評(píng)估提出六點(diǎn)改進(jìn)建議:第一,使用嚴(yán)格科學(xué)意義上的雙系統(tǒng)估計(jì)量估計(jì)目標(biāo)總體實(shí)際人口數(shù)及人口普查凈誤差;第二,獨(dú)立構(gòu)造人口普查錯(cuò)誤計(jì)數(shù)人口數(shù)估計(jì)量;第三,根據(jù)人口普查凈誤差、人口普查遺漏和人口普查錯(cuò)誤計(jì)數(shù)之間的平衡關(guān)系式間接推算人口普查遺漏人口數(shù)估計(jì)量;第四,使用大折刀方法計(jì)算人口普查凈誤差、錯(cuò)誤計(jì)數(shù)和遺漏人口數(shù)(率)的方差估計(jì)值;第五,使用抽樣設(shè)計(jì)效應(yīng)測(cè)算在既定精度下全國(guó)所需要的事后計(jì)數(shù)調(diào)查樣本量,并按人口數(shù)或普查小區(qū)數(shù)目比例在各省份以及各個(gè)抽樣層之間進(jìn)行分配;第六,不只是公布全國(guó)還要公布各個(gè)省份的總?cè)丝诤透鱾€(gè)類別人口的人口普查覆蓋誤差率及其抽樣標(biāo)準(zhǔn)差。

    根據(jù)人口普查質(zhì)量評(píng)估發(fā)展的歷史和目前的做法,筆者對(duì)未來(lái)人口普查質(zhì)量評(píng)估方法發(fā)展趨勢(shì)的展望是:第一,在質(zhì)量評(píng)估中同時(shí)使用人口普查資料、現(xiàn)場(chǎng)抽樣調(diào)查資料以及人口行政記錄資料構(gòu)造的用來(lái)估計(jì)實(shí)際人口數(shù)的三系統(tǒng)估計(jì)量將有可能取代只應(yīng)用前二者的雙系統(tǒng)估計(jì)量以及僅僅應(yīng)用最后一種資料的人口統(tǒng)計(jì)分析法。第二,在估計(jì)人口普查凈誤差的同時(shí)進(jìn)一步估計(jì)它的兩個(gè)構(gòu)成部分(普查遺漏和普查錯(cuò)誤計(jì)數(shù))將成為更多國(guó)家的選擇。

    [1] Andrew Keller Tyler Fox.2010Census Coverage Measurement Estimation Report:Components of Census Coverage for the Household Population in the United States[R].Washington,DC:U.S.Bureau Census,2012.

    [2] Statistics South Africa.Post-enumeration Survey:Results and Methodology of Census 2011[R].Pretoria:Statistics South Africa,2012.

    [3] 胡桂華.人口普查誤差芻議[J].統(tǒng)計(jì)與信息論壇,2011,26(11).

    [4] Robinson J G,Ahmed B,Das Gupta P,Woodrow K A.Estimation of Population Coverage in the 1990United States Census Based on Demographic Analysis[J].Journal of the American Statistical Association,1993(88).

    [5] Petersen C G J.The Yearly Immigration of Young Plaice into the Limfiord from the German Sea[R].Kobenhavn:Danish Biological Station,1896.

    [6] Lincoln F C.Calculating Waterfowl Abundance on the Basis of Banding Returns[M].Washington,DC:United States Department of Agriculture,1930.

    [7] Seber G A F.The Estimation of Animal Abundance[M].London:Edward Arnold,1982.

    [8] 胡桂華.捕獲-再捕獲模型的統(tǒng)計(jì)學(xué)原理[J].統(tǒng)計(jì)與信息論壇,2012(9).

    [9] Anne Renand.Coverage Estimation for the Swiss Population Census 2000:Estimation and Results[R].Neuchatel:Swiss Federal Statistical Office,2004.

    [10]胡桂華.論人口普查質(zhì)量評(píng)估統(tǒng)計(jì)量[J].統(tǒng)計(jì)與信息論壇,2011(4).

    [11]Birch M H.Maximum Likelihood in Three-way Contingency Tables[J].Journal of the Royal Statistical Society,1963(25).

    [12]Zaslavsky A.Combining Census,Dual System,and Evaluation Study Data to Estimate Population Shares[J].Journal of the American Statistical Association,1993,88(423).

    [13]Hogan H.The Post-Enumeration Survey:An Overview[J].The American Statistician,1992(46).

    [14]Social Survey Method Division of Statistics Canada.2006Census Technical Report:Coverage[R].Ottawa :Statistics Canada,2010.

    [15] U.S.Bureau of the Census.Accuracy and Coverage Evaluation of Census 2000:Design and Methodology[R].Washington,DC:U.S.Census Bureau,2004.

    [16]Zaslavsky A M,Wolfgang G S.Triple System Modeling of Census,Post-Enumeration Survey,and Administrative-List Data[J].Journal of Business and Economistatistics,1993,11(3).

    [17]胡桂華.行政記錄在人口普查質(zhì)量評(píng)估中的應(yīng)用[J].徐州工程學(xué)院學(xué)報(bào),2011(3).

    [18]Bell,William R.Accuracy and Coverage Evaluation Survey:Correlation Bias[R].Washington,DC:U.S.Census Bureau Department,2005.

    [19]Scott Konicki.2010Census Coverage Measurement Estimation Report:Adjustment for Correlation Bias[R].Washington,DC:U.S.Census Bureau,2012.

    [20]Kenneth W,Wachter,David A.The Fifth Cell Correlation Bias in U.S.Census Adjustmen[J].Department of Statistics,University California,Berkely,1999(12).

    [21]Diffendal G.The 1986Test of Adjustment Related Operation in Central Los Angeles County[J].Survey Methodology,1988(14).

    [22]Patrick Ball,Wendy Betts,F(xiàn)ritz Scheuren,Jana Asher.Killings and Refugees Flow in Kosovo March-June 1999[R].Washington,DC:American Association for the Advertisement of Science,2002.

    [23]Fienberg S E.The Multiple-Recapture Census for Closed Populations and Incomplete 2kContingency Tables[J].Biometrika,1972(3).

    A Review of Procedures for Estimating Population Census Coverage Error

    HU Gui-hua
    (School of Math and Statistics,Chongqing Technology and Business University,Chongqing 400067,China)

    Population census work quality mainly is reflected in its coverage error scale.Several methods to estimate population census coverage error have been developed by demographers.Some methods use information from independent of census itself,while other methods use population administrative records information.Because each method has its specific formation background and scope of application,the general method which is suitable for all countries and regions is not existing.Those methods used to estimate coverage error in the United States,New Zealand,Australia,Britain and China are reviewed in detail in order to illustrate how to use these methods.The conclusion is that each method has its limitation and needs to be improved.

    population census;coverage error;administrative record match;reverse record check;postenumeration survey;demographic analysis

    C829.1

    A

    1007-3116(2013)09-0039-08

    2013-04-18

    教育部規(guī)劃基金項(xiàng)目《行政記錄在人口數(shù)目估計(jì)中的應(yīng)用研究》(13YJA910004);全國(guó)統(tǒng)計(jì)科學(xué)研究計(jì)劃重點(diǎn)項(xiàng)目《多系統(tǒng)模型在人口普查質(zhì)量評(píng)估中的應(yīng)用》(2012LZ044);國(guó)家社會(huì)科學(xué)基金項(xiàng)目《我國(guó)人口普查質(zhì)量評(píng)估方法研究》(10XTJ003)

    胡桂華,男,湖北武漢人,經(jīng)濟(jì)學(xué)博士,教授,研究方向:人口普查質(zhì)量評(píng)估方法。

    (責(zé)任編輯:李 勤)

    猜你喜歡
    估計(jì)量人口數(shù)遺漏
    來(lái)自動(dòng)物星球的挑戰(zhàn)(二)小五狼遺漏的線索
    確定代表名額按戶籍人口數(shù)還是常住人口數(shù)
    人大研究(2022年3期)2022-04-13 00:47:04
    遺漏的光陰
    鴨綠江(2021年17期)2021-11-11 13:03:41
    基于BP神經(jīng)網(wǎng)絡(luò)的吉林省GDP預(yù)測(cè)研究
    淺談估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)
    應(yīng)用品管圈降低腹腔鏡抗反流手術(shù)術(shù)前準(zhǔn)備遺漏率的實(shí)踐
    基于配網(wǎng)先驗(yàn)信息的諧波狀態(tài)估計(jì)量測(cè)點(diǎn)最優(yōu)配置
    你會(huì)收集數(shù)據(jù)嗎
    負(fù)極值指標(biāo)估計(jì)量的漸近性質(zhì)
    使用變異系數(shù)和Kurtosis系數(shù)的雙輔助變量的比估計(jì)
    利辛县| 蒙城县| 赣榆县| 四平市| 乌兰察布市| 铜陵市| 宝坻区| 定南县| 苏尼特左旗| 九寨沟县| 十堰市| 揭西县| 慈利县| 灯塔市| 新竹县| 同江市| 阳春市| 漳州市| 蒙自县| 桐梓县| 华亭县| 米脂县| 二连浩特市| 内黄县| 建昌县| 钦州市| 满城县| 固原市| 石阡县| 高清| 泰宁县| 洛浦县| 孝感市| 田阳县| 漳浦县| 荥经县| 偃师市| 平定县| 海原县| 临桂县| 夏津县|