劉建平,梁 敏
(暨南大學 經(jīng)濟學院, 廣東 廣州 510632)
?
數(shù)量特征敏感問題問卷設(shè)計
劉建平,梁敏
(暨南大學 經(jīng)濟學院, 廣東 廣州 510632)
摘要:目前,數(shù)量特征敏感問題調(diào)查主要采用隨機化策略,該策略需使用隨機化裝置,從而需要在現(xiàn)場實施。提出一種問卷設(shè)計技術(shù),該技術(shù)用無關(guān)問題替代隨機化裝置,因而不需要調(diào)查者親臨現(xiàn)場,不受調(diào)查規(guī)模及調(diào)查單位聚散的限制,使得調(diào)查更加方便、實用、經(jīng)濟。給出了相應的無偏估計量,推算出估計量的方差和方差的估計量并舉例說明。
關(guān)鍵詞:敏感性問題;隨機化回答技術(shù);問卷設(shè)計
一、引言
在抽樣調(diào)查中,我們經(jīng)常會遇到各種各樣的敏感性問題,即所調(diào)查的內(nèi)容涉及商業(yè)機密或個人隱私而不便向外界透露的問題。例如考生的作弊現(xiàn)象、社會上的賭博吸毒以及企業(yè)偷稅,等等。對于這類敏感性問題,調(diào)查中若采用直接調(diào)查的方式,很難取得被調(diào)查者的配合,往往會引起被調(diào)查者的抵觸而拒絕回答或故意做出錯誤的回答,從而大大增加非抽樣誤差。
為了改進參與者合作,鼓勵真實回答,Warner在1965年首次創(chuàng)立了隨機化回答模型[1]。他利用特殊的隨機化裝置,設(shè)計制作外表相同的卡片,上面分別寫有需要調(diào)查的敏感性問題及其對立問題。被調(diào)查者按事先設(shè)定的比例隨機抽取一張卡片,根據(jù)自己的真實情況做出“是”或“否”的回答。這樣調(diào)查者并不知道被調(diào)查者回答的是哪個問題,從而起到保密作用。
此后,人們通過各種努力來不斷修改、完善Warner模型,取得了很多研究成果,主要分為兩大類型:屬性特征敏感問題隨機化回答模型和數(shù)量特征敏感問題隨機化回答模型,其中數(shù)量特征敏感性問題的隨機化回答模型主要有無關(guān)問題模型、轉(zhuǎn)移模型、隨機截尾模型、加法模型和乘法模型等[2-3]。使用這些模型進行調(diào)查時都需要在現(xiàn)場使用隨機化裝置并在現(xiàn)場回答,這就使得上述調(diào)查方法成本高,操作不便,不易大范圍進行。因此,很多隨機化回答技術(shù)并沒有在社會實踐中推廣開來,而問卷方式調(diào)查可克服以上缺點,目前已有學者在屬性特征敏感問題的問卷調(diào)查方面做了研究[4]。下面提出數(shù)量特征敏感問題的一種問卷調(diào)查技術(shù),該技術(shù)用無關(guān)問題替代隨機化裝置,因而不需要調(diào)查者親臨現(xiàn)場,不受調(diào)查范圍、調(diào)查規(guī)模及調(diào)查單位聚散的限制,使得調(diào)查更加方便、實用、經(jīng)濟。
二、數(shù)量特征敏感問題問卷調(diào)查方法
設(shè)X是敏感性數(shù)量特征變量,其均值是EX,方差是V(X)。而U1是不相關(guān)屬性特征變量(令U1=1表示具有無關(guān)特征A,U1=0表示不具有無關(guān)特征A),具有無關(guān)特征A的人在總體中的比例為p 。U2是另一個與U1及X都不相關(guān)的數(shù)量特征變量,其均值是EU2,方差是V(U2)。估計目標量為EX。
(一)比例p以及均值EU2已知時
從總體中以放回簡單隨機抽樣方法抽取一個樣本量為n的樣本回答下述問卷:你有無關(guān)特征A嗎?如果沒有,請如實回答U2的取值;如果有,請如實回答X的取值。你的回答是()。
(1)
其方差為:
(2)
(3)
(二)比例p已知但均值EU2未知時
考慮兩個獨立的放回簡單隨機樣本s1和s2,其樣本容量分別為n1和n2,n=n1+n2,樣本s1對應問卷與(一)相同,而樣本s2對應直接問卷:請如實回答U2的取值。你的回答是()。
(4)
其方差為:
(5)
(6)
(三)比例p以及均值EU2未知時
從總體中以放回簡單隨機抽樣方式抽取三個相互獨立的樣本s1,s2和s3,其樣本容量分別為n1、n2和n3,n=n1+n2+n3,樣本s1和s2對應問卷與(二)相同,而樣本s3對應直接問卷:你有無關(guān)特征A嗎?如果有,請回答“是”,否則請回答“否”。你的回答是()。
(7)
(8)
(9)
三、數(shù)值舉例
以上三種情況中,最后一種最復雜,下面舉例說明這種情況。
某大學欲估計全體本科生上兩個學期考試作弊次數(shù)的均值,于是從總體中以放回簡單隨機抽樣方式抽取三個相互獨立的樣本,其樣本容量分別為150、130和100,這380個學生在指定的只對他(她)們可見的網(wǎng)頁上填寫問卷,問卷開頭給出一段說明性文字,寫明本次調(diào)查的目的并強調(diào)所使用的方法只能得到全體學生作弊次數(shù)的均值而不能推斷出每個學生的作弊次數(shù)。
第一個樣本的學生回答下述問卷:請問你父親是否吸煙?如果不吸,請回答你有幾個親叔叔;如果吸,請回答你上兩個學期考試作弊總次數(shù)。你的回答是()。
第二個樣本的學生回答下述問卷:請回答你有幾個親叔叔。你的回答是()。
第三個樣本的學生回答下述問卷:請問你父親是否吸煙?你的回答是()。
四、結(jié)束語
本文中表述的是無重復單元的情形,對于有重復單元的情形,則文中所有估計量都只用不相同單元計算,這樣得到的估計量比采用全部單元計算得到的估計量更有效,這是因為這些異值單元是充分統(tǒng)計量[5]。
由前面的討論可知,p、EU2已知時的估計精度比p、EU2未知時的估計精度高,這是由于因調(diào)查p、EU2而減小了調(diào)查EX的樣本量,不過從實踐角度來看,p、EU2未知的情況更常見。當p、EU2未知時,盡管隨機化回答裝置能夠增加EX的信息,從而有助于減少EX的方差,但這種精度上的得益不足以抵消由于隨機化回答帶來的損失,因此,文中新增加的問卷設(shè)計采取直接回答的裝置而非隨機化回答裝置。
最后,在設(shè)計問卷時,要講究問卷的排列順序,將較易回答的問題放在前面,而將敏感問題放在后面,以免給人以唐突感。如文中問卷設(shè)計為:
你有無關(guān)特征A嗎?如果沒有,請如實回答U2的取值;如果有,請如實回答X的取值。
而不是:
你有無關(guān)特征A嗎?如果有,請如實回答敏感變量X的取值;如果沒有,請如實回答U2的取值。你的回答是()。
參考文獻:
[1]Warner S L.Randomized Response:A Survey Technique for Eliminating Evasive Answer Bias[J].Journal of the American Statistical Association,1965(3).
[2]孫山澤,孫明舉.數(shù)量特征的隨機化回答模型(上)——隨機化調(diào)查方法V[J].數(shù)理統(tǒng)計與管理,2000(6).
[3]孫明舉,孫山澤.數(shù)量特征的隨機化回答隨機變量加法、乘法模型——隨機化調(diào)查方法Ⅵ[J].數(shù)理統(tǒng)計與管理,2001(1).
[4]彭秀云,閆在在.雙輔助信息敏感性問題問卷調(diào)查技術(shù)[J].數(shù)學的實踐與認識,2008(5).
[5]Basu D.On Sampling with and without Replacement[J].Sankhya,1958(12).
(責任編輯:張治國)
收稿日期:2015-10-16;修復日期:2016-01-17
作者簡介:劉建平,男,山西懷仁人,教授,博士生導師,研究方向:抽樣調(diào)查理論;
中圖分類號:C811∶O212.2
文獻標志碼:A
文章編號:1007-3116(2016)04-0013-04
A Questionnaire Survey Technique of Quantitative Sensitive Questions
LIU Jian-ping,LIANG Min
(School of Economics,Jinan University,Guangzhou 510632,China)
Abstract:The randomized response technique(RRT) is a commonly used survey method when collecting quantitative sensitive information.In this technique,a randomizing device and face-to-face personal interviews are required.We propose a questionnaire survey technique in which we use an unrelated question instead of randomizing devices.Therefore,it is not limited in application to on-site and small-scale surveys and thus is more convenient,more practical and cost effective.Unbiased estimates and their variances are obtained.For completeness we present estimators for the variance of our estimator.A numerical example is also reported.
Key words:sensitive question; randomized response technique; questionnaire survey
梁敏,女,江西吉安人,博士生,研究方向:抽樣調(diào)查理論。
【統(tǒng)計理論與方法】