• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      人口重報(bào):人口普查面臨的新挑戰(zhàn)

      2018-07-31 05:07:42張廣宇顧寶昌
      人口與經(jīng)濟(jì) 2018年3期
      關(guān)鍵詞:數(shù)據(jù)質(zhì)量人口普查

      張廣宇 顧寶昌

      摘要:人口普查中的重報(bào)問(wèn)題長(zhǎng)期以來(lái)一直沒(méi)有得到統(tǒng)計(jì)部門(mén)和學(xué)者的足夠重視。但是,美國(guó)2000年和2010年兩次人口普查均出現(xiàn)大規(guī)模的人口重報(bào),隨后加拿大、英國(guó)和澳大利亞等國(guó)的統(tǒng)計(jì)部門(mén)也發(fā)現(xiàn)在各自的普查中重報(bào)現(xiàn)象都有明顯上升的趨勢(shì)。

      本文回顧了這四個(gè)國(guó)家近些年舉辦的普查的調(diào)查方式、居住地原則、人口漏報(bào)和重報(bào)的情況,歸納了重報(bào)人口的共同特征和造成重報(bào)的原因,以及各國(guó)應(yīng)對(duì)重報(bào)問(wèn)題增加而采取的措施。

      普查中重報(bào)現(xiàn)象的增加,既與普查方式的轉(zhuǎn)變有關(guān),也與人們?cè)絹?lái)越復(fù)雜的生活和居住方式、越來(lái)越頻繁的人口流動(dòng),以及對(duì)人口普查的居住地原則的不同理解有關(guān)。要有效地應(yīng)對(duì)重報(bào)問(wèn)題,不僅要加強(qiáng)事后抽樣工作,而且要積極利用計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),通過(guò)數(shù)據(jù)匹配發(fā)現(xiàn)和去除重報(bào)的普查記錄。文章還對(duì)中國(guó)2020年的普查應(yīng)對(duì)重報(bào)問(wèn)題提出了一些建議。

      關(guān)鍵詞:人口普查;重報(bào);數(shù)據(jù)質(zhì)量

      中圖分類(lèi)號(hào):C921.2文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000-4149(2018)03-0001-12

      Abstract:Overcoverage in census has long been considered as nonsignificant in comparison to undercoverage. However, it was found that both the 2000 and 2010 US decennial censuses overcounted millions of people with a net overcount outcome. Meanwhile, an increase in the magnitude of person duplications in recent censuses has been reported in Canada, the UK and Australia.

      This paper reviews census residence rules, censustaking methods and coverage errors in these four countries. It summarizes common features of census duplicates and potential causes for overcount in census, and the measures taken by national statistical offices to address these issues.

      The increase in overcount is not only associated with the adoption of new censustaking method while shifting away from the traditional doorknocking method, but also attributable to more frequent population movement and more complex living situations, and the resultant respondents confusion on census residence rules. To identify and remove census duplicates, it is important to both enhance the postenumeration survey, and undertake data linking between census and administrative statistics. The paper also makes some recommendations on Chinas 2020 census addressing potential overcoverage.

      Keywords:census;overcoverage;data quality

      我們?cè)凇吨袊?guó)人口科學(xué)》2017年第5期發(fā)表的“從國(guó)際視角看人口普查中的低齡兒童的漏報(bào)問(wèn)題”一文中討論了各國(guó)在人口普查中遇到的人口漏報(bào)[1],特別是低齡兒童漏報(bào)的問(wèn)題。但是,影響人口普查完整性的因素不僅來(lái)自人口漏報(bào),也來(lái)自人口重報(bào)。本文擬在前文的基礎(chǔ)上,著重討論近些年來(lái)各國(guó)人口普查中越來(lái)越顯著的人口重報(bào)問(wèn)題。

      自1950年以來(lái),世界各國(guó)舉辦了1600多次普查,人口漏報(bào)和普查結(jié)果的凈漏報(bào)一直是人口普查面對(duì)的最主要的挑戰(zhàn)[2]。由于人口重報(bào)的程度和影響相對(duì)較小,因而一直沒(méi)有得到各國(guó)統(tǒng)計(jì)部門(mén)和人口學(xué)者的足夠重視和深入研究。美國(guó)2000年的普查是世界上第一次在規(guī)模很大的人口中開(kāi)展的人口普查中發(fā)現(xiàn)總?cè)丝诘膬糁貓?bào),即重報(bào)人口大于漏登人口[3],而隨后的2010年人口普查又繼續(xù)發(fā)現(xiàn)大幅度的人口重報(bào)和漏報(bào)[4]。與此同時(shí),加拿大、英國(guó)和澳大利亞統(tǒng)計(jì)部門(mén)也發(fā)現(xiàn),盡管總?cè)丝诘膬袈﹫?bào)依然是近些年舉辦的普查的最主要的挑戰(zhàn),但人口的重報(bào)也呈現(xiàn)顯著上升的趨勢(shì)[5-7]。

      人口普查的主要目標(biāo)是完整和準(zhǔn)確地登記一個(gè)國(guó)家在普查時(shí)點(diǎn)的所有居住人口,這不僅包括完整登記所有普查對(duì)象,還包括在正確的地址登記這些人口。由于人口流動(dòng),很多人在普查時(shí)點(diǎn)居住的地址(即現(xiàn)住地)與其長(zhǎng)期居住的地址(即常住地)并不一致。而隨著經(jīng)濟(jì)的發(fā)展和全球經(jīng)濟(jì)的一體化,人們生活和居住方式也越來(lái)越復(fù)雜,國(guó)內(nèi)流動(dòng)和國(guó)際遷移越來(lái)越頻繁,在很多國(guó)家現(xiàn)住地和常住地不一致的人口大量增加,由此產(chǎn)生的對(duì)普查的居住地原則的誤解相應(yīng)地導(dǎo)致普查中重報(bào)和漏報(bào)程度的上升[8]。

      在上述幾個(gè)國(guó)家的人口普查實(shí)踐中,人口重報(bào)問(wèn)題的顯現(xiàn)與近些年普查調(diào)查方式的改變?cè)跁r(shí)間上密切相關(guān):由于計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的進(jìn)步,同時(shí)也是出于節(jié)省經(jīng)費(fèi)的考慮,這些國(guó)家逐步放棄了傳統(tǒng)的依靠普查員登門(mén)入戶(hù)投送和收集問(wèn)卷的普查方式,轉(zhuǎn)而采用依靠全國(guó)性的地址名錄,通過(guò)郵局向絕大多數(shù)普查對(duì)象寄送普查問(wèn)卷,要求他們自行填寫(xiě)普查問(wèn)卷,或通過(guò)郵局寄回普查表,或通過(guò)互聯(lián)網(wǎng)完成普查。

      中國(guó)2010年的第六次人口普查采取了雙口徑登記的原則,即流動(dòng)人口既在現(xiàn)住地登記,也在戶(hù)口登記地進(jìn)行登記,然后由統(tǒng)計(jì)部門(mén)采取相應(yīng)的措施去除重復(fù)登記的記錄。這種措施有助于大大減少普查中由于現(xiàn)住地和常住地的分離而可能帶來(lái)的漏登程度,但也相應(yīng)地增加了人口重報(bào)的可能性。在六普以前,有些人口學(xué)者已經(jīng)關(guān)注人口的重報(bào)問(wèn)題[9]。而六普結(jié)果公布以后,更多的研究開(kāi)始關(guān)注此問(wèn)題,并一致認(rèn)為2010年人口普查的重報(bào)問(wèn)題可能比以往的普查更為顯著[10-14]。回顧和借鑒其他國(guó)家分析和處理人口重報(bào)問(wèn)題的經(jīng)驗(yàn)和教訓(xùn),對(duì)于更好地準(zhǔn)備和成功舉辦2020年的人口普查,更好地評(píng)估普查的數(shù)據(jù)質(zhì)量,具有十分積極的意義。

      一、美國(guó)、加拿大、英國(guó)和澳大利亞近年人口普查中的重報(bào)問(wèn)題

      1.美國(guó)2000和2010年人口普查中的重報(bào)問(wèn)題

      美國(guó)的人口普查自1790年以來(lái),每十年舉辦一次,由人口普查局具體執(zhí)行。普查的對(duì)象是所有普查時(shí)點(diǎn)在美國(guó)生活和居住并以美國(guó)為常住地的人,包括非美國(guó)公民。從1970年普查開(kāi)始,普查局已經(jīng)逐步對(duì)大多數(shù)人口采取通過(guò)郵局寄送和回收問(wèn)卷的方式進(jìn)行普查。對(duì)于這種登記方式?jīng)]有覆蓋的少數(shù)人口,則采取由普查員登門(mén)入戶(hù)的方式,或攜帶新問(wèn)卷要求住戶(hù)把完成的問(wèn)卷郵寄回普查局,或以直接登記的方式完成普查。在普查后期的查漏補(bǔ)缺階段,對(duì)還沒(méi)有返回問(wèn)卷的家庭,普查局或通過(guò)電話(huà),或派普查員登門(mén)催促他們盡快完成普查[15]。

      近幾十年來(lái),美國(guó)人口普查的凈漏報(bào)率一直在穩(wěn)定下降,1980年普查已降低到很低的水平[4]。但是,相對(duì)低的凈漏報(bào)率可能隱藏了大量的人口漏報(bào)和重報(bào)的事實(shí),這一點(diǎn)在2000和2010年兩次普查中尤為顯著(見(jiàn)表1)。由于美國(guó)人口的基數(shù)大,實(shí)際漏報(bào)的人口數(shù)很可觀。

      2000年的人口普查,普查局第一次實(shí)現(xiàn)通過(guò)計(jì)算機(jī)進(jìn)行的實(shí)時(shí)的數(shù)據(jù)匹配,以期提高普查后期查漏補(bǔ)缺工作的成效。但是,還在普查正在進(jìn)行的階段,就發(fā)現(xiàn)有大量的家庭郵寄回不止一份問(wèn)卷。進(jìn)一步的分析發(fā)現(xiàn)大約有160萬(wàn)家庭重復(fù)登記,由此導(dǎo)致大約360萬(wàn)人口的重報(bào),這些記錄最終被從普查記錄中刪除[16]。

      美國(guó)的人口普查采用事后抽樣調(diào)查和人口分析兩種方法獨(dú)立評(píng)估普查質(zhì)量。與以往的歷次普查不同,對(duì)2000年普查,兩種評(píng)估方法得出截然相反的結(jié)論:事后抽樣調(diào)查結(jié)果認(rèn)為普查大約凈漏報(bào)1%的人口,而人口分析的結(jié)果則表明,結(jié)果很有可能是凈重報(bào)。為此,普查局決定暫緩公布對(duì)普查數(shù)據(jù)質(zhì)量的評(píng)估,一方面對(duì)兩種評(píng)估方法進(jìn)行回顧及檢查,并重新評(píng)估普查的數(shù)據(jù)質(zhì)量,另一方面積極探索新的辦法研究普查中新出現(xiàn)的大規(guī)模的人口重報(bào)問(wèn)題,例如,把普查數(shù)據(jù)與其他來(lái)源的數(shù)據(jù)進(jìn)行匹配,從而發(fā)現(xiàn)重報(bào)的人口[17]。

      2000年普查實(shí)際登記的人口為2.73億人,在兩年之后公布的研究成果,證實(shí)此次普查的結(jié)果為凈重報(bào),凈重報(bào)率為0.5%,即大約凈重報(bào)了133萬(wàn)人[3]。除了在數(shù)據(jù)處理過(guò)程中對(duì)應(yīng)在普查中登記而沒(méi)有登記的家庭利用統(tǒng)計(jì)方法進(jìn)行賦值從而由系統(tǒng)生成虛擬的記錄以外,大約有600多萬(wàn)人在普查中登記了一次以上[3]。而這些重報(bào)的人口并不包括在普查期間刪除的由于地址重報(bào)而導(dǎo)致的大約360多萬(wàn)人的重報(bào)。研究還發(fā)現(xiàn),傳統(tǒng)的只針對(duì)凈漏報(bào)率設(shè)計(jì)的事后抽樣調(diào)查,不能準(zhǔn)確發(fā)現(xiàn)新出現(xiàn)的大規(guī)模人口重報(bào)的現(xiàn)象[18]。

      在總結(jié)經(jīng)驗(yàn)和教訓(xùn)的基礎(chǔ)上,2010年的人口普查采取了大量針對(duì)人口漏報(bào)和重報(bào)問(wèn)題的改進(jìn)措施。例如,在編制全國(guó)地址名錄的過(guò)程中進(jìn)行了大量的數(shù)據(jù)匹配和實(shí)地調(diào)查,力爭(zhēng)在普查前去除主地址名錄中重復(fù)的地址[19]。由于此次普查,所有普查對(duì)象都只填寫(xiě)短表,只需回答包括姓名、地址和一些關(guān)鍵的人口指標(biāo)等問(wèn)題,問(wèn)卷中專(zhuān)門(mén)加上了關(guān)于在每一個(gè)住址是否有潛在的人口漏報(bào)和重報(bào)的兩個(gè)問(wèn)題。在普查期間,普查局利用計(jì)算機(jī)即時(shí)進(jìn)行數(shù)據(jù)匹配和分析,發(fā)現(xiàn)對(duì)這兩個(gè)問(wèn)題的回答有疑問(wèn)的問(wèn)卷,就與該住址的家庭聯(lián)系,爭(zhēng)取在普查結(jié)束前就澄清和解決有關(guān)疑問(wèn)[20]。

      2010年普查在事后抽樣調(diào)查的目標(biāo)和方法方面也進(jìn)行了大量的改進(jìn),該調(diào)查不僅要評(píng)估普查的凈漏報(bào)率或凈重報(bào)率,還要估計(jì)普查差錯(cuò)的具體構(gòu)成,即粗重報(bào)率和粗漏報(bào)率。除此以外,還要根據(jù)不同人口特征提供相應(yīng)的指標(biāo),例如種族。針對(duì)人口的重報(bào)問(wèn)題,普查局在2000年普查以后就已經(jīng)測(cè)試過(guò)把部分普查數(shù)據(jù)與其本身進(jìn)行一對(duì)一的數(shù)據(jù)匹配,以確定重報(bào)的人口。2010年普查結(jié)束以后,普查局第一次實(shí)施了對(duì)全部普查記錄本身進(jìn)行數(shù)據(jù)匹配的做法,即對(duì)每一個(gè)普查記錄都在全部普查記錄中搜尋和匹配具有相同姓名、性別和生日等確定性特征的記錄,以發(fā)現(xiàn)和確定重報(bào)的人口[21]。

      2010年的人口普查共登記了3億多人口。事后抽樣調(diào)查結(jié)果表明,大約1600萬(wàn)人漏登,同時(shí)有1600萬(wàn)人錯(cuò)登,包括800萬(wàn)系統(tǒng)生成的記錄,實(shí)際上大約有800 萬(wàn)人在普查中登記了一次以上。普查粗重報(bào)率和漏報(bào)率都是5.3%,凈漏報(bào)率為-0.01%,大約凈重登了3.6萬(wàn)人,但不具備統(tǒng)計(jì)顯著的意義[4]。

      2.加拿大2006年和2011年人口普查中的重報(bào)問(wèn)題

      加拿大統(tǒng)計(jì)局自1951年開(kāi)始,每五年舉辦一次人口普查。普查采用常住地原則,即所有普查對(duì)象在其常住地登記,普查時(shí)點(diǎn)不在常住地的人口在其登記地登記為“臨時(shí)/暫住人口”。2006和2011年普查的調(diào)查方式與美國(guó)相似,依靠全國(guó)地址名錄,對(duì)大多數(shù)城市人口采取通過(guò)郵局寄送/回收的方式進(jìn)行調(diào)查。對(duì)城市中難以調(diào)查的人口,或邊遠(yuǎn)地區(qū)的人口,則專(zhuān)門(mén)派普查員登門(mén),或者要求普查對(duì)象自行填寫(xiě)問(wèn)卷然后寄回普查部門(mén),或者直接進(jìn)行調(diào)查[6]。這兩次普查積極鼓勵(lì)普查對(duì)象通過(guò)互聯(lián)網(wǎng)完成普查。2006年的普查大約有18%的家庭通過(guò)互聯(lián)網(wǎng)填寫(xiě)問(wèn)卷,而在2011年則有54%的家庭通過(guò)互聯(lián)網(wǎng)完成普查[6]。

      自1991年普查開(kāi)始,加拿大統(tǒng)計(jì)局不僅調(diào)查普查中的漏登問(wèn)題,還調(diào)查普查中的錯(cuò)登,主要是重報(bào)問(wèn)題。表2列出1991—2011年五次人口普查中的重報(bào)和漏報(bào)問(wèn)題。盡管總的凈漏報(bào)率有所下降,但粗重報(bào)率則一直呈現(xiàn)不斷上升的趨勢(shì)。例如,2011年的粗重報(bào)率是1991年的3倍,而重報(bào)的人口也從1991年普查的15萬(wàn)人增加到2011年的63萬(wàn)人(見(jiàn)表2)。

      受美國(guó)2000年普查出現(xiàn)大規(guī)模重報(bào)問(wèn)題的影響,加拿大統(tǒng)計(jì)局在2006年普查以前已經(jīng)積極采取了很多有針對(duì)性的措施。例如,在普查前花大力氣清理和提高普查用地址名錄的準(zhǔn)確性,力求避免因?yàn)榈刂访浀闹貜?fù)而導(dǎo)致普查人口的重報(bào)。不僅如此,還在2006年普查的質(zhì)量評(píng)估中增加了專(zhuān)門(mén)的普查重報(bào)調(diào)查,主要是把普查數(shù)據(jù)與其他來(lái)源的行政統(tǒng)計(jì)數(shù)據(jù)進(jìn)行匹配[22]。但普查結(jié)果表明,粗重報(bào)率實(shí)際比上次普查又上升了0.6個(gè)百分點(diǎn)。加拿大統(tǒng)計(jì)局總結(jié)經(jīng)驗(yàn)教訓(xùn),在2011年普查準(zhǔn)備階段繼續(xù)采取很多有針對(duì)性的措施,但實(shí)際結(jié)果表明粗重報(bào)率依然呈現(xiàn)上升趨勢(shì)。這個(gè)現(xiàn)象除了部分歸因于重報(bào)調(diào)查的方法和技術(shù)[6],但更重要的是也表明普查中重報(bào)問(wèn)題與漏報(bào)問(wèn)題一樣不可避免。

      3.英國(guó)2001和2011年人口普查中的重報(bào)問(wèn)題

      英國(guó)(指英格蘭和威爾士)的人口普查每十年舉辦一次,最近的一次是2011年的普查。英國(guó)以前的普查采取的是現(xiàn)住地原則,即普查對(duì)象均在普查時(shí)的所在地登記,但從2001年普查開(kāi)始,采取常住地原則,所有人均須在其常住地進(jìn)行登記。與以前歷次普查相比,英國(guó)2011年的普查又有許多重要的改進(jìn)。一個(gè)很重要的變化是采用美國(guó)和加拿大的普查模式,即在普查前建立完善的全國(guó)地址名錄,普查時(shí)依靠此地址名錄通過(guò)郵局寄送/回收問(wèn)卷,普查后期依靠此地址名錄進(jìn)行查漏補(bǔ)缺的工作。不僅如此,普查對(duì)象還可以利用互聯(lián)網(wǎng)完成普查。

      在英國(guó)2001年普查以前的歷次普查,人口重報(bào)都不是一個(gè)值得重視的問(wèn)題。與美國(guó)和加拿大不同,這些普查都是由普查員登門(mén)入戶(hù)投送和回收問(wèn)卷,而且普查采取的又是現(xiàn)住地原則,因而大大減少了人口重報(bào)的可能性和重報(bào)的程度。從2001年開(kāi)始,英國(guó)普查改用常住地原則統(tǒng)計(jì)人口,調(diào)查方式也改為由普查員挨家挨戶(hù)投送問(wèn)卷,但問(wèn)卷的回收由普查對(duì)象用預(yù)先提供的信封自行寄送回普查部門(mén)。與以前普查不同,這次普查并不要求普查員必須與普查對(duì)象見(jiàn)面。這樣一來(lái),不僅漏報(bào)率大為提高,而且重報(bào)率也顯著增加[23]。

      在美國(guó)和加拿大普查先后發(fā)現(xiàn)重報(bào)問(wèn)題已經(jīng)成為一個(gè)顯性的問(wèn)題之后,英國(guó)統(tǒng)計(jì)部門(mén)加強(qiáng)了這方面的研究。對(duì)2001年普查數(shù)據(jù)的分析表明,此次普查粗漏報(bào)率為6%,但粗重報(bào)率也達(dá)到0.4%,大約有20萬(wàn)人重報(bào)[24],重報(bào)問(wèn)題比以前歷次普查有明顯增加。研究還表明住校大學(xué)生、離婚夫婦共同撫養(yǎng)的小孩,和有不止一處家庭住址的人,在普查中的重報(bào)概率相對(duì)較高[23]。因而在準(zhǔn)備和舉辦2011年普查的過(guò)程中,統(tǒng)計(jì)部門(mén)加強(qiáng)了對(duì)這些人群登記的檢查,例如加強(qiáng)對(duì)學(xué)生普查登記記錄的審核,努力避免他們既在學(xué)校登記,又在父母住址登記。在普查的問(wèn)卷上,專(zhuān)門(mén)列有針對(duì)離婚夫婦共同撫養(yǎng)的小孩如何登記的提示[7]。

      對(duì)2011年普查數(shù)據(jù)的質(zhì)量評(píng)估,英國(guó)統(tǒng)計(jì)部門(mén)除了利用傳統(tǒng)的事后抽樣調(diào)查的方法以外,還采用美國(guó)的做法,即對(duì)普查記錄本身進(jìn)行數(shù)據(jù)匹配,以應(yīng)對(duì)潛在增加的人口重報(bào)問(wèn)題。抽樣調(diào)查的結(jié)果用于估計(jì)本地人口的重報(bào)程度,而普查數(shù)據(jù)匹配的結(jié)果主要用于在全國(guó)范圍內(nèi)尋找重報(bào)的人口[7]。研究結(jié)果表明,2011年普查登記人口接近6000萬(wàn)人,粗漏報(bào)率為6.7%,但粗重報(bào)率估計(jì)在0.5%—1.0%之間,即大約重報(bào)了30萬(wàn)至60萬(wàn)人[7]。

      4.澳大利亞2016年人口普查中的重報(bào)問(wèn)題

      澳大利亞統(tǒng)計(jì)局自1961年以來(lái)每五年舉辦一次人口普查。普查同時(shí)采用現(xiàn)住地和常住地原則,即所有普查對(duì)象在現(xiàn)住地登記,但必須在普查問(wèn)卷上填寫(xiě)其常住地地址。所有的官方人口統(tǒng)計(jì)數(shù)據(jù)都是以常住地為準(zhǔn)。2011年普查以及以前的歷次普查的調(diào)查,都是采用由普查員登門(mén)投送問(wèn)卷,普查對(duì)象自行填寫(xiě)問(wèn)卷,再由普查員登門(mén)回收問(wèn)卷的方式進(jìn)行[25]。但是,普查對(duì)象也可選擇使用普查部門(mén)提供的信封寄回問(wèn)卷,或選擇使用互聯(lián)網(wǎng)完成問(wèn)卷。

      2016年的普查實(shí)施了很多重大的改進(jìn),一個(gè)重大的變化是采取美國(guó)、加拿大和英國(guó)的普查模式,即事先編制全國(guó)地址名錄和通過(guò)郵局寄送/回收普查問(wèn)卷,鼓勵(lì)普查對(duì)象盡可能使用互聯(lián)網(wǎng)參加電子普查。事實(shí)上,使用互聯(lián)網(wǎng)參加普查的家庭的比例在2016年超過(guò)2/3[5]。與其他國(guó)家不同的是,統(tǒng)計(jì)局依然雇傭了大批普查員登門(mén)提醒普查對(duì)象按時(shí)完成普查,或向要求使用書(shū)面問(wèn)卷的家庭投送問(wèn)卷。對(duì)邊遠(yuǎn)地區(qū)的土著居民,仍然依靠普查員登門(mén)入戶(hù)登記人口。

      另外一個(gè)重大的變化是,吸取美國(guó)、加拿大和英國(guó)普查的經(jīng)驗(yàn)教訓(xùn),在事后抽樣調(diào)查中專(zhuān)門(mén)加上了調(diào)查人口重報(bào)的內(nèi)容[26]。表3提供了1996年至2016年五次人口普查的重報(bào)和漏報(bào)情況。除1996年普查以外,各次普查的粗漏報(bào)率比變化不大,但是粗重報(bào)率一直在逐步上升。在2011和2016年兩次普查期間,粗漏報(bào)率變化不大,但是粗重報(bào)率卻顯著上升。漏報(bào)人口增加了將近30%,而重報(bào)的人數(shù)則幾乎是上一次普查重報(bào)人數(shù)的兩倍[5]。

      二、重報(bào)人口的分布和特點(diǎn)

      上述四國(guó)對(duì)普查中重報(bào)人口的特征和分布都相應(yīng)做了很多研究,盡管幾個(gè)國(guó)家的情況各不相同,但總結(jié)他們的研究成果,仍然可以發(fā)現(xiàn)重報(bào)人口有一些共同的特征。

      1.有些特定人群比其他人群更容易在人口普查中重報(bào)

      在美國(guó),2000年和2010年的兩次普查都發(fā)現(xiàn)以下幾種人群更容易在普查中重報(bào)/被重報(bào):①住校但周末回家的大學(xué)生,雖然他們應(yīng)該在學(xué)校登記,但有些父母還會(huì)把孩子也包括在普查表里。②由離婚父母共同撫養(yǎng)的小孩,小孩因?yàn)榕c父親和母親分別居住一段時(shí)間,其父母有可能都在各自的普查表中包括了孩子的信息。③有不止一個(gè)住址的人,包括通勤上班者(平時(shí)住城市,周末回家)和有不止一處房產(chǎn)的人。本人和家人有可能分別填寫(xiě)了普查表。④在普查登記期間流動(dòng)的人,包括短期旅行和搬家的人,他們也有可能在不同的地方都做了登記。⑤普查期間在監(jiān)獄里的犯人。

      而加拿大2011年普查的質(zhì)量評(píng)估結(jié)果也顯示,大約30%的重報(bào)記錄屬于離婚夫婦協(xié)議撫養(yǎng)的小孩,很顯然父母雙方都把孩子登記到自己的地址。接近20%的重報(bào)記錄來(lái)自于既在大學(xué)登記,又在父母地址登記的在校學(xué)生,或者是新近結(jié)婚離開(kāi)父母單獨(dú)居住的年輕人。還有超過(guò)20%的重報(bào)記錄來(lái)自于居住在親戚或朋友家的成年人[6]。

      在澳大利亞,2016年普查的事后抽樣調(diào)查發(fā)現(xiàn),人口的重報(bào)主要有以下三種情況:①普查時(shí)點(diǎn)在外地并在其現(xiàn)住地登記,但是家人將其包括在常住地登記的普查表中; ②普查期間搬家,同時(shí)在原住址和現(xiàn)住址參與了普查;③普查時(shí)點(diǎn)在國(guó)外,不是本次普查的對(duì)象,但卻被家人包括在其常住地的普查表中[5]。

      2.重報(bào)人口遍布各個(gè)年齡段,但年輕人口更容易重報(bào)

      相對(duì)于其他年齡組,很多年輕人由于求學(xué)和工作的緣故而成為流動(dòng)人口,不僅容易在普查中漏報(bào),而且也容易在普查中重報(bào)。對(duì)美國(guó)最近兩次普查重報(bào)人口的研究發(fā)現(xiàn),重報(bào)人口幾乎分布在每一個(gè)5歲年齡組,但是年輕群組比其他年齡組更容易出現(xiàn)重報(bào),特別是15—24歲年齡組,同時(shí),15歲以下兒童組和25—29歲年齡組的人群也有相對(duì)較高的重報(bào)比例[21]。年輕年齡組的人口不僅容易在普查中漏報(bào),他們也更容易在普查中重報(bào),這是因?yàn)樗麄冇捎谇髮W(xué)和工作的緣故而成為流動(dòng)人口的主要組成部分。

      加拿大統(tǒng)計(jì)局對(duì)2006和2011年兩次普查的分析發(fā)現(xiàn),5—14歲和15—24歲年齡組比其他年齡組的人口更容易重報(bào)。研究發(fā)現(xiàn),在所有這些年齡組,男性和女性人口重報(bào)的比例差不多[6]。

      3.在地理范圍上很多重報(bào)發(fā)生在同一地址或相近的地址

      對(duì)美國(guó)2010年普查的深入研究發(fā)現(xiàn),就地理范圍而言,將近13%的重報(bào)是跨州登記(即登記在不同的州),另外大約23%的重報(bào)是在同一個(gè)州但不同的縣登記。超過(guò)25%的重報(bào)發(fā)生在同一普查小區(qū),也就是說(shuō),很多重報(bào)是在同一個(gè)地址登記,或者在相鄰的地址登記[21]。

      加拿大2006年的調(diào)查結(jié)果顯示,大約20%的重報(bào)記錄來(lái)自于在同一地址上的同一個(gè)家庭,一個(gè)很重要的原因是許多家庭既填寫(xiě)了普查問(wèn)卷,又在互聯(lián)網(wǎng)上完成了普查。另外有20%的重報(bào)記錄來(lái)自于同一個(gè)家庭,但是登記為不同的地址,一個(gè)很有可能的解釋是不同的家庭成員在不同的地址都登記了家庭成員的情況[27]。

      4.重報(bào)人口的其他特征

      在美國(guó)2010年的人口普查中,大約82%的重報(bào)發(fā)生在家庭戶(hù)中,其他18%的重報(bào)發(fā)生在家庭戶(hù)和非家庭戶(hù)(集體戶(hù))之間,即有許多人口既在家庭戶(hù)登記,也在學(xué)校、醫(yī)院和旅館等其他場(chǎng)合登記。在重報(bào)的家庭戶(hù)中,絕大多數(shù)的重報(bào)發(fā)生在部分家庭成員中,整個(gè)家庭重報(bào)的比例相對(duì)較低,大約占1/4。美國(guó)的研究還發(fā)現(xiàn),弱勢(shì)群體更容易在普查中被漏登,而社會(huì)經(jīng)濟(jì)條件相對(duì)好一些的人群則更容易出現(xiàn)重報(bào),因?yàn)樗麄兏袟l件流動(dòng)或者擁有多處地址,與統(tǒng)計(jì)部門(mén)也更為配合。以種族劃分,非西班牙裔白人的重報(bào)比例要比其他種族的人口要高。在歷次美國(guó)的人口普查中,黑人和西班牙裔人口一向有比較高的漏報(bào)率[21]。

      三、普查中部分人群容易重報(bào)的原因

      人口的頻繁流動(dòng)和人們生活和居住方式的多樣化和復(fù)雜化,使得人們對(duì)普查的居住地原則產(chǎn)生不同的理解,這無(wú)疑是造成人口重報(bào)的重要原因。但是,綜合這幾個(gè)國(guó)家統(tǒng)計(jì)部門(mén)的研究,重報(bào)問(wèn)題的顯著上升,在時(shí)間上與這些國(guó)家放棄傳統(tǒng)的登門(mén)入戶(hù)的調(diào)查方式轉(zhuǎn)而采用新的普查方法也密切相關(guān)。

      1.普查方式的變化是人口重報(bào)問(wèn)題顯著上升的一個(gè)重要原因

      西方發(fā)達(dá)國(guó)家傳統(tǒng)的人口普查,每次都耗資巨大臨時(shí)雇傭大量的普查人員。近年來(lái)很多國(guó)家的統(tǒng)計(jì)部門(mén)都面臨預(yù)算緊縮的壓力,大量減少普查人員就成為減少普查經(jīng)費(fèi)最易行的措施。計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的進(jìn)步、普查方法的改進(jìn)、行政統(tǒng)計(jì)數(shù)據(jù)的廣泛使用,和數(shù)據(jù)匹配方法的發(fā)展等,在客觀上促進(jìn)很多國(guó)家采用新的普查方法。

      本文回顧的四個(gè)國(guó)家逐步拋棄了傳統(tǒng)的普查員登門(mén)入戶(hù)的調(diào)查方式,轉(zhuǎn)而采用新的普查方式,即編制“完整”的全國(guó)地址名錄,然后依靠此地址名錄通過(guò)郵局寄送/回收問(wèn)卷,和進(jìn)行普查后期的查漏補(bǔ)缺工作,并積極鼓勵(lì)普查對(duì)象通過(guò)互聯(lián)網(wǎng)完成普查。計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)在普查中的廣泛使用,不僅提高了普查的內(nèi)容的準(zhǔn)確性,例如大大減少由于手寫(xiě)筆誤造成的錯(cuò)誤等,而且提高了普查后數(shù)據(jù)處理的時(shí)效性。

      采用新的普查方式以后,統(tǒng)計(jì)部門(mén)可以大量減少普查員,但是很明顯的副作用就是一名普查員不得不應(yīng)對(duì)大量的普查對(duì)象,因而也就不可能多次登門(mén)入戶(hù)完成投送問(wèn)卷、提醒督促和回收問(wèn)卷等任務(wù)。結(jié)果就是這些國(guó)家普查的漏報(bào)率都不可避免地有所上升。與此同時(shí),問(wèn)卷由普查對(duì)象自行完成,特別是由于紙質(zhì)問(wèn)卷和互聯(lián)網(wǎng)問(wèn)卷的同時(shí)使用,一些過(guò)于熱心的普查對(duì)象就有可能提交不止一份問(wèn)卷。例如,英國(guó)2011年的普查,在問(wèn)卷回收階段,就發(fā)現(xiàn)有24萬(wàn)對(duì)來(lái)自相同地址和家庭的重復(fù)的問(wèn)卷[7]。

      此外,依靠郵局投送和回收問(wèn)卷,郵局投送工作的失誤,也有可能造成普查的重報(bào)。例如,美國(guó)的研究發(fā)現(xiàn),郵遞員把A地址的問(wèn)卷投遞到B地址,那么B地址的家庭有可能填寫(xiě)兩份問(wèn)卷,構(gòu)成重報(bào),而A家庭則沒(méi)有填寫(xiě)問(wèn)卷,構(gòu)成漏登。還有一種情況是在編制全國(guó)地址名錄的時(shí)候,地址仍然存在,但在此之后該地址不再存在,如拆遷,郵遞員可能把問(wèn)卷投送到附近的地址。如果附近地址的居民填寫(xiě)了問(wèn)卷,則有可能構(gòu)成重報(bào)[17,21]。

      2.普查用地址名錄的質(zhì)量會(huì)直接導(dǎo)致普查中的重報(bào)和漏報(bào)

      新的普查方式依賴(lài)一個(gè)高質(zhì)量的全國(guó)地址名錄,如果該地址名錄不能準(zhǔn)確地去除重復(fù)的,或者相似的但實(shí)際上是同一個(gè)地址的住址,就很容易造成重報(bào)。同樣,如果該地址名錄遺漏一些地址,在這些地址的家庭就不會(huì)收到通過(guò)郵局寄送的問(wèn)卷,那么地址的遺漏就會(huì)直接導(dǎo)致部分人口的漏報(bào)。

      美國(guó)普查局的研究發(fā)現(xiàn),在編制全國(guó)地址名錄的時(shí)候,不同來(lái)源的數(shù)據(jù)有可能導(dǎo)致同一地址被登記為兩個(gè)很相似/相近的地址,例如同一地址以“X公寓1號(hào)”和“X公寓A號(hào)”被登記兩次。普查部門(mén)根據(jù)地址名錄給同一家庭先后寄送了兩份普查問(wèn)卷,而該家庭把兩份問(wèn)卷都寄還給普查部門(mén),從而造成該戶(hù)家庭成員都被登記兩次,形成重報(bào)[17]。這個(gè)問(wèn)題在2000年普查中比較突出,在2010年的普查中得到了很好的解決。但是由于各種原因,普查局不可能全部根除地址名錄中的重復(fù)地址,因而這仍然是導(dǎo)致人口重報(bào)的原因之一。加拿大和英國(guó)的研究也都得出相同的結(jié)論,即地址名錄的重報(bào)和漏報(bào)是導(dǎo)致很多人口在普查中重報(bào)和漏報(bào)的重要原因[6-7]。

      3.流動(dòng)人口對(duì)居住地原則的不同理解導(dǎo)致人口的漏報(bào)和重報(bào)

      很多國(guó)家的人口普查采用常住地原則,即以占用人們生活和休息大部分時(shí)間的地方為主。由于人口流動(dòng)和生活方式的多樣化,很多人口的常住地和現(xiàn)住地并不一致。因而每一次人口普查,各國(guó)統(tǒng)計(jì)部門(mén)都要制定詳細(xì)的標(biāo)準(zhǔn)來(lái)確定一個(gè)人是否為普查對(duì)象,其常住地在何處。

      例如,美國(guó)2000年的普查,對(duì)學(xué)生如何參加普查登記有如下的標(biāo)準(zhǔn):①寄宿學(xué)校的學(xué)生在父母的地址登記;②住校的大學(xué)生在學(xué)校登記;③如果大學(xué)生在父母家常住,則在父母家的地址登記。這些標(biāo)準(zhǔn)看似詳細(xì),但與復(fù)雜的實(shí)際情況相比則還是顯得過(guò)于簡(jiǎn)單。同時(shí),不同背景的普查對(duì)象對(duì)此標(biāo)準(zhǔn)的理解又有很大的不同。美國(guó)普查局的相關(guān)研究證實(shí),普查對(duì)象對(duì)居住地原則的誤解是造成人口重報(bào)的重要原因之一[8]。

      為此,美國(guó)普查局不斷改進(jìn)對(duì)居住地原則標(biāo)準(zhǔn)的制定。在2010年的普查中,普查局總結(jié)經(jīng)驗(yàn)教訓(xùn),對(duì)學(xué)生如何參加普查制定了更為詳細(xì)的標(biāo)準(zhǔn):①住在大專(zhuān)院校以下的寄宿學(xué)校的學(xué)生,仍然在父母家登記;②大專(zhuān)院校學(xué)生仍然在父母家居住的,在父母家登記; ③離家的大專(zhuān)院校學(xué)生,但在校園內(nèi)或校園外居住的,在居住時(shí)間更長(zhǎng)的地址登記;④離家的大專(zhuān)院校學(xué)生,并在校園內(nèi)或校園外居住的,但經(jīng)常回父母家度假的,在居住時(shí)間更長(zhǎng)的校園內(nèi)或校園外的地址登記;⑤在境外的美國(guó)學(xué)生不在普查范圍之內(nèi);⑥在美國(guó)境內(nèi)的外國(guó)學(xué)生,在校園內(nèi)或校園外居住的,在居住時(shí)間更長(zhǎng)的地址登記[28]。

      4.在數(shù)據(jù)處理過(guò)程中由系統(tǒng)生成“虛擬人口”導(dǎo)致的重報(bào)

      在美國(guó)和澳大利亞的人口普查記錄中,還包括一些通過(guò)統(tǒng)計(jì)方法產(chǎn)生的所謂“虛擬人口”,相應(yīng)的,這些國(guó)家的普查中又產(chǎn)生了一些由數(shù)據(jù)處理導(dǎo)致的人口重報(bào)。以澳大利亞的普查為例,在普查實(shí)地調(diào)查中,某一住址沒(méi)有普查問(wèn)卷返回,一種可能是該戶(hù)家庭成員普查時(shí)點(diǎn)在該地居住,但拒絕參與普查。但是另一種可能是該戶(hù)家庭成員在外地或國(guó)外,而普查人員沒(méi)有可靠的信息確定該戶(hù)人家是否應(yīng)該包括在普查之中。有很多時(shí)候,普查員把問(wèn)卷留在該地址,但如果鄰居或朋友幫助把問(wèn)卷收走,普查員就有可能錯(cuò)誤地判斷該戶(hù)人家已經(jīng)參與了而實(shí)際并沒(méi)有參與普查。事實(shí)是,如果該戶(hù)家庭普查時(shí)點(diǎn)在外地,也參與了普查,就有可能造成重報(bào)。同樣,如果該戶(hù)家庭普查時(shí)點(diǎn)在國(guó)外,雖然不在普查范圍之內(nèi),但人數(shù)、年齡和性別等信息則通過(guò)出入境記錄加入總?cè)丝趨R總數(shù)據(jù)中,同樣會(huì)造成重報(bào)。但是由于這種重報(bào)是在普查數(shù)據(jù)匯總過(guò)程中產(chǎn)生的,與普查對(duì)象在同一地址或不同地址填寫(xiě)兩份問(wèn)卷造成的重報(bào)性質(zhì)不同,后一種重報(bào)是可以通過(guò)數(shù)據(jù)匹配發(fā)現(xiàn),而前一種重報(bào)主要通過(guò)事后抽樣調(diào)查發(fā)現(xiàn)[29]。

      四、發(fā)現(xiàn)和去除重報(bào)人口的方法及挑戰(zhàn)

      人口的重報(bào)與漏報(bào)一樣,是大多數(shù)國(guó)家人口普查與生俱來(lái)的問(wèn)題。當(dāng)重報(bào)問(wèn)題開(kāi)始顯現(xiàn)的時(shí)候,美國(guó)、加拿大、英國(guó)和澳大利亞等國(guó)的統(tǒng)計(jì)部門(mén),沒(méi)有回避問(wèn)題,而是積極探索新的方法以發(fā)現(xiàn)和去除重報(bào)人口。

      1.改進(jìn)事后抽樣調(diào)查方法,把人口重報(bào)問(wèn)題納入調(diào)查重點(diǎn)

      美國(guó)是世界上最早采用事后抽樣調(diào)查方法評(píng)估普查數(shù)據(jù)質(zhì)量的國(guó)家。但長(zhǎng)期以來(lái),事后抽樣調(diào)查的主要目標(biāo)就是發(fā)現(xiàn)普查的凈漏報(bào)率,用以估計(jì)普查時(shí)點(diǎn)的總?cè)丝?。所以,原先的調(diào)查方法并不是先分別計(jì)算出粗重報(bào)率和粗漏報(bào)率,然后再計(jì)算出凈漏報(bào)率,而是直接得出凈漏報(bào)率。對(duì)2000年普查及其抽樣調(diào)查結(jié)果的分析還表明,當(dāng)人口出現(xiàn)重報(bào)的時(shí)候,原先的事后抽樣調(diào)查方法不僅很難發(fā)現(xiàn)重報(bào),而且會(huì)得出相反的錯(cuò)誤結(jié)論[18]。要估計(jì)普查的完整的差錯(cuò)構(gòu)成,就必須在事后抽樣調(diào)查的抽樣方法、樣本規(guī)模和結(jié)果估計(jì)上作出很多改進(jìn)[20]。

      自美國(guó)2000年普查發(fā)現(xiàn)大規(guī)模人口重報(bào)并改進(jìn)事后抽樣調(diào)查方法以后,加拿大統(tǒng)計(jì)局在2006年的普查中增加了專(zhuān)項(xiàng)普查重報(bào)調(diào)查,而英國(guó)統(tǒng)計(jì)局也在準(zhǔn)備2011年普查的同時(shí)開(kāi)始研究如何改進(jìn)事后抽樣調(diào)查的方法[22,25]。澳大利亞統(tǒng)計(jì)局也吸取這幾個(gè)國(guó)家的經(jīng)驗(yàn)教訓(xùn),在2016年普查的事后抽樣調(diào)查中增加了人口重報(bào)的調(diào)查內(nèi)容[5]。

      當(dāng)然,事后抽樣調(diào)查可以估計(jì)全國(guó)或大的地區(qū)范圍的重報(bào)和漏報(bào)水平,但無(wú)法給出具體估計(jì),特別是確定哪些人是重報(bào)人口。所以,這些國(guó)家都利用數(shù)據(jù)匹配的方法,特別是對(duì)普查記錄本身進(jìn)行數(shù)據(jù)匹配,以發(fā)現(xiàn)和判定重報(bào)的人口。

      2.通過(guò)數(shù)據(jù)匹配的方法發(fā)現(xiàn)普查中重報(bào)記錄

      美國(guó)2000年人口普查中重報(bào)問(wèn)題的發(fā)現(xiàn),既得益于美國(guó)人口普查局同時(shí)實(shí)行兩種獨(dú)立的普查數(shù)據(jù)評(píng)估方法,更得益于普查中收集的姓名和地址等信息第一次轉(zhuǎn)化為電子數(shù)據(jù),從而能夠利用計(jì)算機(jī)實(shí)行一對(duì)一的數(shù)據(jù)匹配。人口普查局在2000年普查以后開(kāi)始把普查數(shù)據(jù)與其他外部數(shù)據(jù)進(jìn)行匹配,以發(fā)現(xiàn)重報(bào)問(wèn)題。2010年普查之后,更是在以前實(shí)驗(yàn)的基礎(chǔ)上,開(kāi)始實(shí)行把普查與其自身匹配,以從中發(fā)現(xiàn)重報(bào)的普查記錄[21]。

      加拿大統(tǒng)計(jì)局從2006年普查起,開(kāi)始實(shí)施獨(dú)立的普查重報(bào)調(diào)查[22]。但與其他抽樣調(diào)查不同的是,這個(gè)調(diào)查依靠把普查數(shù)據(jù)與行政統(tǒng)計(jì)數(shù)據(jù)以及普查數(shù)據(jù)本身進(jìn)行匹配,以估計(jì)普查的重報(bào)程度。用于匹配的數(shù)據(jù)包括出生、死亡、國(guó)際遷移、衛(wèi)生、福利和稅收記錄等行政統(tǒng)計(jì)數(shù)據(jù)[6]。英國(guó)和澳大利亞統(tǒng)計(jì)局也積極實(shí)施把普查數(shù)據(jù)與其他行政統(tǒng)計(jì)數(shù)據(jù)匹配,或借鑒美國(guó)的做法,對(duì)普查數(shù)據(jù)本身進(jìn)行數(shù)據(jù)匹配以發(fā)現(xiàn)重報(bào)的人口。

      這些國(guó)家的普查都搜集普查對(duì)象的姓名、出生日期和其他人口信息,并把普查數(shù)據(jù)轉(zhuǎn)換為計(jì)算機(jī)數(shù)據(jù),因而大大促進(jìn)了數(shù)據(jù)匹配工作。數(shù)據(jù)匹配有兩類(lèi):一類(lèi)是確定性的匹配。如果普查搜集的數(shù)據(jù)包含全部普查對(duì)象的社會(huì)保險(xiǎn)號(hào)碼、身份證號(hào)碼等個(gè)人獨(dú)有的信息,計(jì)算機(jī)可以很容易地進(jìn)行確定性的匹配。但是如果沒(méi)有這些獨(dú)特的信息,就只能進(jìn)行另外一類(lèi)數(shù)據(jù)匹配,即概率性的匹配[30-31]。本文回顧的這些國(guó)家的數(shù)據(jù)匹配都利用概率性的匹配方法,并輔以人工判定和實(shí)地追蹤調(diào)查以確定和去除重報(bào)記錄。但是,他們的實(shí)踐也表明,數(shù)據(jù)匹配可以辨別重報(bào)的人口,但如果不輔以實(shí)地追蹤調(diào)查,也沒(méi)有辦法去除普查數(shù)據(jù)中的重報(bào)記錄。

      3.數(shù)據(jù)匹配方法上的挑戰(zhàn)

      在這些國(guó)家實(shí)行概率性數(shù)據(jù)匹配的實(shí)踐中,如何準(zhǔn)確無(wú)誤地發(fā)現(xiàn)重報(bào)人口,仍然面臨方法上的挑戰(zhàn)。在確定普查記錄是否重報(bào)時(shí),姓名和出生日期是非常重要的變量。如果普查中兩個(gè)記錄具有相同的姓名、性別和出生日期,而且在同一個(gè)地址,就可以準(zhǔn)確判定有一個(gè)記錄是重報(bào);如果是相鄰的地址,如在相鄰的鄉(xiāng)鎮(zhèn)和區(qū)縣,那么也有很大的可能確定為重報(bào)。但是,如果在更大的地域范圍,直至全國(guó)范圍內(nèi)搜尋,就會(huì)遇到方法和技術(shù)上的挑戰(zhàn)。美國(guó)人口普查局在進(jìn)行數(shù)據(jù)匹配時(shí)就遇到過(guò)“琳達(dá)·史密斯(Linda Smith)問(wèn)題”,因?yàn)榱者_(dá)·史密斯是非常普遍的女性姓名,在全國(guó)范圍內(nèi)用姓名、性別和出生日期來(lái)確定匹配的普查記錄是否重報(bào),如果有超過(guò)365個(gè)女士有相同的姓名和出生日期,就無(wú)法確定匹配的記錄是不同的人重名,還是相同的人重報(bào)[16]。要想判定重報(bào),需要引入更多的數(shù)據(jù)變量,如教育程度、婚姻狀態(tài)和工作性質(zhì),等等,但普查的數(shù)據(jù)內(nèi)容畢竟有限,如果人口數(shù)量很大,就會(huì)很快遇到相同的問(wèn)題。

      在進(jìn)行數(shù)據(jù)匹配的過(guò)程中,如果匹配的普查記錄并不是同一個(gè)人,而是具有一些相似特征的不同的兩個(gè)人,那么其中一個(gè)記錄會(huì)被去除,而真正的重報(bào)記錄仍然留在普查數(shù)據(jù)之中。如果匹配的記錄依靠的是出生日期和性別等關(guān)鍵數(shù)據(jù),那么清理后的普查數(shù)據(jù)在年齡和性別結(jié)構(gòu)方面仍然可靠,但是在其他數(shù)據(jù)方面就會(huì)有很多誤差。如果一個(gè)為沒(méi)有生育的育齡婦女和一個(gè)有生育的育齡婦女具有相同的姓名、性別和出生日期,但由于沒(méi)有其他變量來(lái)區(qū)分她們因而被判定其中一人為重報(bào),那么刪除哪一個(gè)記錄就會(huì)對(duì)利用普查數(shù)據(jù)估計(jì)生育率造成直接的影響。

      總之,這些國(guó)家的數(shù)據(jù)匹配工作各有自己的問(wèn)題和挑戰(zhàn),也在不斷完善的過(guò)程之中。如何更好地進(jìn)行數(shù)據(jù)匹配來(lái)辨別和判定普查中的重報(bào)記錄,還是一個(gè)需要不斷研究和實(shí)踐的重要課題。

      五、對(duì)中國(guó)2010年和2020年人口普查的一些啟示

      中國(guó)的人口普查依靠普遍實(shí)行的戶(hù)籍登記和身份證制度,和普查員登門(mén)入戶(hù)的調(diào)查方式,保證了普查能夠成功舉行和取得高質(zhì)量的數(shù)據(jù)。雖然近些年關(guān)于普查對(duì)低齡兒童調(diào)查的質(zhì)量、對(duì)總?cè)丝诤蜕实墓烙?jì)等爭(zhēng)論很多,但是以國(guó)際標(biāo)準(zhǔn)衡量,在中國(guó)這樣一個(gè)十多億人口的大國(guó)進(jìn)行普查,能取得已有的成果已經(jīng)是一個(gè)很了不起的成就。

      從1982年到2000年的三次普查,人口的漏登是主要的挑戰(zhàn)。但是,這些普查采用的是唯一的居住地原則,理論上,每個(gè)人只應(yīng)登記一次,因而漏報(bào)的概率要比重報(bào)的概率大得多。針對(duì)流動(dòng)人口數(shù)量龐大和人們生活方式越來(lái)越復(fù)雜的現(xiàn)實(shí),國(guó)家統(tǒng)計(jì)局在2010年的普查中采用了雙口徑的方法進(jìn)行調(diào)查,即流動(dòng)人口同時(shí)在現(xiàn)住地和常住地登記,然后在數(shù)據(jù)匯總階段由普查部門(mén)進(jìn)行去除重登記錄的工作。采取這樣的普查方式無(wú)疑有助于減少人口的漏登,但也會(huì)給準(zhǔn)確地評(píng)估普查的數(shù)據(jù)質(zhì)量,以及發(fā)現(xiàn)和去除重報(bào)記錄的工作帶來(lái)極大的挑戰(zhàn)。

      由于國(guó)家統(tǒng)計(jì)局沒(méi)有公布詳細(xì)的事后抽樣調(diào)查的結(jié)果,也沒(méi)有介紹如何去除由于雙口徑調(diào)查以及其他原因?qū)е碌娜丝谥貓?bào),我們并不清楚人口重報(bào)的程度究竟有多高,也不清楚重報(bào)究竟如何影響普查結(jié)果中的年齡結(jié)構(gòu),因此也就很難對(duì)六普的質(zhì)量評(píng)估下更進(jìn)一步的結(jié)論,并評(píng)估重報(bào)對(duì)生育率估計(jì)和總?cè)丝诠烙?jì)的影響。

      但是,考慮到中國(guó)流動(dòng)人口龐大的現(xiàn)實(shí),雙口徑登記造成的重報(bào)規(guī)??隙ㄒ让绹?guó)2000年普查重登的規(guī)模還要大。那么,在局部地區(qū),如流動(dòng)人口流出集中的地區(qū),人口重報(bào)很可能大于漏報(bào)。而根據(jù)美國(guó)2000年普查的經(jīng)驗(yàn),采用傳統(tǒng)的以調(diào)查凈漏報(bào)率為目標(biāo)的事后抽樣調(diào)查方法就很難準(zhǔn)確地發(fā)現(xiàn)人口的重報(bào)[18]。

      從國(guó)際經(jīng)驗(yàn)看,發(fā)現(xiàn)重登的普查記錄最好的辦法是對(duì)普查記錄本身進(jìn)行數(shù)據(jù)匹配。但是,中國(guó)人口眾多,即使只挑選流動(dòng)人口與普查數(shù)據(jù)匹配,其工作量也比美國(guó)全國(guó)普查數(shù)據(jù)匹配的工作量要大得多。這些年飛速發(fā)展的計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),尤其是大數(shù)據(jù)、云計(jì)算等技術(shù),在提高人口數(shù)據(jù)匹配的速度和準(zhǔn)確性等方面具有十分積極的意義。但是,計(jì)算能力只是眾多挑戰(zhàn)之一,對(duì)數(shù)據(jù)匹配方法和技術(shù)的研究和選擇,也是很重要的挑戰(zhàn)。如果普查能夠搜集全國(guó)統(tǒng)一的而且是每個(gè)個(gè)人獨(dú)有的鑒別碼,例如身份證號(hào)或健康保險(xiǎn)卡號(hào)等,數(shù)據(jù)匹配可以相對(duì)容易地進(jìn)行,發(fā)現(xiàn)和判定普查記錄是否重報(bào)也相對(duì)容易。但是,如果沒(méi)有這些全國(guó)統(tǒng)一且個(gè)人獨(dú)有的鑒別碼,數(shù)據(jù)匹配就只能利用概率匹配的方法進(jìn)行,不確定性也就相應(yīng)地大大增加,也就很難避免由于錯(cuò)誤的匹配和去除重登記錄而導(dǎo)致的普查數(shù)據(jù)的缺陷。

      鑒于這些發(fā)達(dá)國(guó)家的經(jīng)驗(yàn)和教訓(xùn),隨著我國(guó)社會(huì)經(jīng)濟(jì)的進(jìn)一步發(fā)展,人口流動(dòng)的越發(fā)頻繁和多居住地人口的增多,特別是雙口徑普查方式的使用,或許準(zhǔn)確地發(fā)現(xiàn)和去除重報(bào)人口會(huì)成為考驗(yàn)即將到來(lái)的2020年人口普查質(zhì)量的重大挑戰(zhàn)。

      六、結(jié)論及討論

      人口普查中的重報(bào)問(wèn)題,長(zhǎng)期以來(lái)一直沒(méi)有獲得人口學(xué)界和統(tǒng)計(jì)部門(mén)的重視。但是近十多年來(lái),美國(guó)、加拿大、英國(guó)和澳大利亞等國(guó)的普查實(shí)踐表明,人口重報(bào)已經(jīng)是一個(gè)不可避免而且逐步增加的問(wèn)題,成為影響人口普查質(zhì)量的一個(gè)新的挑戰(zhàn)。

      與全部人口相比,有些特定的人群更容易被重報(bào),例如流動(dòng)人口、有多住址的人口、住校學(xué)生和離婚夫婦共同撫養(yǎng)的小孩,等等。由于求學(xué)和工作的原因,年輕人群比其他人群更有可能在普查中漏報(bào)和重報(bào)。

      人口的頻繁流動(dòng)以及人們生活和居住方式的多樣化和復(fù)雜化,以及由此導(dǎo)致的對(duì)普查居住地原則的不同理解,無(wú)疑是造成人口重報(bào)的最重要原因。但這些國(guó)家放棄傳統(tǒng)的登門(mén)入戶(hù)的調(diào)查方式,轉(zhuǎn)而采取新的普查方式,也是導(dǎo)致人口重報(bào)顯著上升的重要原因。這些國(guó)家的普查實(shí)踐也表明,改進(jìn)事后抽樣調(diào)查方法有助于準(zhǔn)確發(fā)現(xiàn)和估計(jì)普查中的漏報(bào)問(wèn)題,但利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)匹配是發(fā)現(xiàn)和判定普查記錄中重報(bào)人口的主要方法。如果普查無(wú)法搜集全國(guó)統(tǒng)一和個(gè)人獨(dú)有的鑒別碼,從而進(jìn)行決定性的數(shù)據(jù)匹配,那么概率性的匹配就是唯一選擇。而要做到這一點(diǎn),無(wú)論在裝備上、方法的研究上和人員的準(zhǔn)備上,都需要提前做好準(zhǔn)備。

      在本文結(jié)束之際,我們?cè)俅螐?qiáng)調(diào),中國(guó)的普查與本文回顧的四個(gè)國(guó)家現(xiàn)行的普查方法有很大的不同,因而面臨的主要挑戰(zhàn)也不盡相同。為了應(yīng)對(duì)由于人口大規(guī)模流動(dòng)可能帶來(lái)的人口漏報(bào)問(wèn)題,2010年中國(guó)人口普查采用的雙口徑登記方法,盡管減少了漏報(bào)程度,卻又在事實(shí)上大大增加了普查結(jié)果中人口重報(bào)增多的風(fēng)險(xiǎn)。如果2020年普查仍然采取雙口徑登記的方法,那么統(tǒng)計(jì)部門(mén)需要積極借鑒國(guó)際經(jīng)驗(yàn),利用計(jì)算機(jī)和大數(shù)據(jù)技術(shù)的最新發(fā)展,提高普查的技術(shù)裝備水平,同時(shí)積極組織力量研究和準(zhǔn)備利用計(jì)算機(jī)進(jìn)行數(shù)據(jù)匹配的技術(shù)和方法,及早應(yīng)對(duì)潛在的相當(dāng)規(guī)模的人口重報(bào)問(wèn)題。同時(shí),利用現(xiàn)有的2010年普查的數(shù)據(jù),組織專(zhuān)家學(xué)者認(rèn)真研究普查中重報(bào)的模式和程度,總結(jié)出可供2020年普查借鑒的經(jīng)驗(yàn)和教訓(xùn)。

      參考文獻(xiàn):

      [1]張廣宇,顧寶昌. 從國(guó)際視角看人口普查中低齡兒童的漏報(bào)問(wèn)題[J].中國(guó)人口科學(xué), 2017(5):96-109.

      [2]UNITED NATIONS. World population prospects: the 2015 revision[R]. New York: United Nations, 2015.

      [3]US CENSUS BUREAU. Decision on intercensal population estimates (12 March 2003)[R]. Washington, D C: U.S. Census Bureau, 2003.

      [4]US CENSUS BUREAU. For immediate release: Tuesday, May 22, 2012: census bureau releases estimates of undercount and overcount in the 2010 census

      [EB/OL].[2018-02-08]. https://www.census.gov/newsroom/releases/archives/2010_census/cb12-95.html.

      [5]AUSTRALIAN BUREAU OF STATISTICS. Census of population and housing: details of overcount and undercount[R]. Canberra: Australian Bureau of Statistics, Cat. No. 2940.0, 2017.

      [6]STATISTICS CANADA. 2011 census technical report: coverage[R]. Ottawa: Statistics Canada, 2015.

      [7]OFFICE FOR NATIONAL STATISTICS. 2011 census: methods and quality report: overcount estimation and adjustment[R]. London: Office for National Statistics, 2012.

      [8]NATIONAL RESEARCH COUNCIL. Once, only once, and in the right place: residence rules in the decennial census[M]//CITROC C D, NORWOOD J. Panel on the Residence Rules in the Decennial Census. Washington, D C:The National Academies Press, 2006.

      [9]王廣州. 對(duì)第五次人口普查數(shù)據(jù)重報(bào)問(wèn)題的分析[J]. 中國(guó)人口科學(xué),2003(1): 63-66.

      [10]胡耀嶺, 原新. 1982—2010年期間全國(guó)人口普查數(shù)據(jù)一致性研究[J]. 人口研究, 2013(1): 3-9.

      [11]崔紅艷, 徐嵐, 李睿. 對(duì)2010年人口普查準(zhǔn)確性的估計(jì)[J]. 人口研究, 2013(1): 10-21.

      [12]王金營(yíng),戈艷霞. 2010年人口普查數(shù)據(jù)質(zhì)量評(píng)估以及對(duì)以往人口變動(dòng)分析校正[J].人口研究, 2013(1): 22-33.

      [13]陶濤, 張現(xiàn)岺. 六普人口數(shù)據(jù)的漏報(bào)與重報(bào)[J].人口研究, 2013(1): 42-53.

      [14]胡桂華,武潔,安軍. 人口普查中多報(bào)人口數(shù)的估計(jì)[J]. 中國(guó)人口科學(xué), 2016(1):41-52.

      [15]MAURY M, PEMBERTON D. History: 2000 census of population and housing[R]. Washington, D C: US Census Bureau, 2009.

      [16]FAY R. Probabilistic models for detecting census person duplication[C]. Proceedings of the Survey Research Methods Section, Joint Statistical Meetings, 2002.

      [17]MARSHALL L. Potential duplicates in the census: methodology and selection of cases for followup[C]. Proceedings of the Survey Research Methods Section, Joint Statistical Meetings, 2008.

      [18]MULRY M. Methodological lessons from census 2000 coverage error measurement[C]. Proceedings of the Survey Research Methods Section, Joint Statistical Meetings, 2004.

      [19]MULE T. Census coverage measurement estimation report: summary of estimates of coverage for persons in the United States[R].Washington, D C: US Census Bureau, 2012.

      [20]WHITFORD D. Coverage improvement and measurement in the 2010 US census: innovation in response to census 2000[C]. Proceedings of the 59th International Statistical Institute World Statistics Congress, Durban, South Africa, 2009.

      [21]HEIMEL S, KING R. 2010 census effectives of unduplication evaluation report[R]. Washington, D C: US Census Bureau, 2012.

      [22]CLARK C. Census population coverage error: results and methods[C]. Presentation at the Federal Committee on Statistical Methodology Research Conference, Washington, D C, 2009.

      [23]ABBOTT O, BROWN J. Overcoverage in the 2011 UK census[C]. Paper presented to 13th Meeting of the National Statistics Methodology Advisory Committee, 2007.

      [24]BLACKWELL L, LYNCH K, SMITH J, GOLDBLATT P. Longitudinal study 1971—2001: completeness of census linkage[R]. London: Office for National Statistics, N0.10, 2003.

      [25]AUSTRALIAN BUREAU OF STATISTICS. How Australia takes a census, 2011[R]. Canberra: Australian Bureau of Statistics, No.2903.0, 2011.

      [26]AUSTRALIAN BUREAU OF STATISTICS. Information paper: measuring overcount and undercount in the 2016 population census[R]. Canberra: Australian Bureau of Statistics, No. 2940.0.55.002, 2016.

      [27]STATISTICS CANADA.2006 census technical report: coverage[R]. Ottawa: Statistics Canada, 2010.

      [28]US CENSUS BUREAU.Residence rule and residence situations for the 2010 census[EB/OL].[2018-02-08]. https://www.census.gov/population/www/cen2010/resid_rules/resid_rules.html.

      [29]FELLEGI I, SUNTER A. A theory for record linkage[J]. Journal of the American Statistical Association, 1969, 64 (328): 1183-1210.

      [30]CHRISTEN P. Data matching:concepts and techniques for record linkage, entity resolution, and duplicate detection[M]. Canberra: Springer, 2002.

      [31]AUSTRALIAN BUREAU OF STATISTICS. Estimated resident population and effects of census systems created records[R]. Canberra: Australian Bureau of Statistics, No. 3132.0, 2002.

      [責(zé)任編輯 方志]

      猜你喜歡
      數(shù)據(jù)質(zhì)量人口普查
      無(wú)人機(jī)助力人口普查
      人口普查學(xué)問(wèn)多
      黑龍江省人民政府關(guān)于做好黑龍江省第七次全國(guó)人口普查工作的通知
      人口普查為什么既要“查人”又要“查房”
      新傳奇(2019年47期)2019-12-27 09:33:45
      電子商務(wù)平臺(tái)數(shù)據(jù)質(zhì)量控制系統(tǒng)及仿真模型分析
      強(qiáng)化統(tǒng)計(jì)執(zhí)法提高數(shù)據(jù)質(zhì)量
      淺析統(tǒng)計(jì)數(shù)據(jù)質(zhì)量
      金融統(tǒng)計(jì)數(shù)據(jù)質(zhì)量管理的國(guó)際借鑒與中國(guó)實(shí)踐
      淺談統(tǒng)計(jì)數(shù)據(jù)質(zhì)量控制
      提高政府統(tǒng)計(jì)數(shù)據(jù)質(zhì)量,增強(qiáng)政府公信力
      平武县| 高雄县| 吕梁市| 昆明市| 金塔县| 新干县| 保康县| 长葛市| 武汉市| 东至县| 安阳市| 新民市| 吉水县| 巴塘县| 蛟河市| 吴川市| 天气| 治多县| 遂宁市| 宁安市| 东明县| 嘉义市| 天水市| 万宁市| 望都县| 西青区| 密山市| 板桥市| 伊春市| 临泉县| 定日县| 淮安市| 花莲县| 墨脱县| 化隆| 阳新县| 绥中县| 乐清市| 武乡县| 安庆市| 普兰店市|