郭 靜 郭 巍 黃曉娟 王秀彬 翁昊藝
網(wǎng)絡(luò)規(guī)模迭加法(network scale-up method)[1-6]是一種在國(guó)外已經(jīng)被廣泛應(yīng)用的人群規(guī)模估計(jì)方法,這種方法只需要針對(duì)全人群代表性抽樣,數(shù)據(jù)的收集可以嵌入一項(xiàng)針對(duì)一般人群的調(diào)查或?qū)θ巳捍硇猿闃舆M(jìn)行調(diào)查。相對(duì)于需要針對(duì)目標(biāo)人群進(jìn)行抽樣調(diào)查的傳統(tǒng)方法,網(wǎng)絡(luò)規(guī)模迭加法更易于獲得數(shù)據(jù),花費(fèi)低且不易被察覺(jué),近年來(lái)在敏感人群的規(guī)模估計(jì)中得到了較好的實(shí)踐應(yīng)用。
本研究旨在對(duì)網(wǎng)絡(luò)規(guī)模疊加法進(jìn)行綜合介紹,并以大學(xué)生中發(fā)生過(guò)異性性行為的人群為例,對(duì)其規(guī)模進(jìn)行估計(jì),并為該方法的進(jìn)一步推廣應(yīng)用提供理論和科學(xué)依據(jù)。
1.資料
采用分層整群隨機(jī)抽樣,從北京市88所高校中隨機(jī)抽取5所高校,在每所高校隨機(jī)抽取2個(gè)系,每個(gè)系二年級(jí)及以上隨機(jī)抽取2個(gè)班級(jí)(30人為一個(gè)班級(jí)),抽中班級(jí)中的所有學(xué)生均作為調(diào)查對(duì)象,共2005人。剔除沒(méi)有完整回答7個(gè)已知人群的記錄,剔除性別缺失的記錄,剔除年級(jí)缺失的記錄,剔除沒(méi)有完整回答對(duì)7種已知人群態(tài)度的記錄,并利用對(duì)數(shù)轉(zhuǎn)換和箱式圖對(duì)社交網(wǎng)絡(luò)規(guī)模C的異常值進(jìn)行剔除,剩余1761條記錄,即最后分析的數(shù)據(jù)庫(kù)。
2.概念界定
(1)敏感人群:一般是指社會(huì)上的一些具有某種敏感特征的人群組合,本研究中設(shè)置了兩個(gè)敏感人群,即:“發(fā)生過(guò)異性性行為的男生”和“發(fā)生過(guò)異性性行為的女生”。
(2)已知人群:已知其規(guī)模大小的人群,本次研究選取了在校大學(xué)生中的少數(shù)民族、來(lái)自港澳臺(tái)地區(qū)、來(lái)自山東省、來(lái)自河南省、留學(xué)生、中共黨員和過(guò)去1年發(fā)生意外事故(車(chē)禍,溺水等)的人數(shù),共7個(gè)已知人群。已知人群規(guī)模數(shù)據(jù)來(lái)自北京市教委。
(3)認(rèn)識(shí):本研究中的認(rèn)識(shí)界定為北京市的在校大學(xué)生,看到對(duì)方或?qū)Ψ降拿只蚓b號(hào)時(shí)能認(rèn)出對(duì)方,最近兩年內(nèi)與其有過(guò)接觸(包括見(jiàn)面、聚會(huì)、通過(guò)電話網(wǎng)絡(luò)等方式聯(lián)系既往已經(jīng)見(jiàn)過(guò)面的人,不包括素未謀面的網(wǎng)友)。
3.分析方法
網(wǎng)絡(luò)規(guī)模迭加法估計(jì)人群規(guī)模步驟可分為兩步:第一步是通過(guò)調(diào)查數(shù)據(jù)估計(jì)社交網(wǎng)絡(luò)規(guī)模C值;第二步是通過(guò)已得到的C值估算目標(biāo)(未知)人群規(guī)模。
(1)社交網(wǎng)絡(luò)規(guī)模C值的估計(jì)和校正:采用反向預(yù)測(cè)法對(duì)C進(jìn)行估計(jì),依次從已知人群中剔除一個(gè)已知人群,利用其他已知人群估計(jì)得到C值,反推被剔除的已知人群的規(guī)模。保留反向預(yù)測(cè)值與實(shí)際值的比值在0.2~6.0之間的已知人群作為計(jì)算C值的人群;并利用大學(xué)生人口學(xué)特征對(duì)C值進(jìn)行校正。
(2)敏感人群規(guī)模校正:調(diào)查對(duì)象對(duì)敏感問(wèn)題的接受程度會(huì)對(duì)其認(rèn)識(shí)敏感人群的規(guī)模造成影響,以不同認(rèn)可度水平調(diào)查對(duì)象社交網(wǎng)絡(luò)規(guī)模平均值除以中等認(rèn)可度水平社交網(wǎng)絡(luò)規(guī)模平均值所得到的權(quán)重對(duì)數(shù)據(jù)進(jìn)行校正。權(quán)重較正系數(shù)的公式如下所示:
(3)本研究利用EpiData建立數(shù)據(jù)庫(kù),采用SAS統(tǒng)計(jì)軟件進(jìn)行分析,不同特征大學(xué)生社交網(wǎng)絡(luò)規(guī)模比較采用秩和檢驗(yàn)。
1.一般情況
最終納入分析的1761名調(diào)查者中(初始納入1776人,經(jīng)過(guò)一系列檢驗(yàn)后最終納入1761人進(jìn)行分析,具體過(guò)程見(jiàn)后“社交網(wǎng)絡(luò)規(guī)模的估計(jì)和校正”部分),男生有764名,占總體的43.38%,女生有997名,所占比例為56.62%。從年級(jí)來(lái)看,大二學(xué)生所占比例最大,共有668個(gè)樣本,占總體的37.93%;大三學(xué)生642個(gè),占總體36.46%,大四學(xué)生所占比例最小,共有451個(gè)樣本,占總體的25.61%。從專業(yè)特色來(lái)看,醫(yī)學(xué)類院校和理工類院校的樣本量相對(duì)較大,分別占總體21.35%和21.24%;藝術(shù)類院校的323個(gè)樣本相對(duì)較小,占總體18.34%;其余為文科類院校338個(gè),占19.19%;體育類院校350個(gè),占19.88%。
2.社交網(wǎng)絡(luò)規(guī)模的估計(jì)和校正
本研究選取了在校大學(xué)生中的少數(shù)民族、來(lái)自港澳臺(tái)地區(qū)、來(lái)自山東省、來(lái)自河南省、留學(xué)生、中共黨員(包括預(yù)備黨員)和過(guò)去1年發(fā)生意外事故(車(chē)禍,溺水等)共7個(gè)已知人群,并從北京市教委獲取以上人群的規(guī)模數(shù)據(jù)。
(1)粗估計(jì)值:以7個(gè)已知人群估計(jì)的個(gè)人社交網(wǎng)絡(luò)規(guī)模的均值為98人,中位數(shù)為57人。
(2)C值的校正:利用反向預(yù)測(cè)的方法評(píng)價(jià)C值估計(jì)結(jié)果的穩(wěn)定性,以反向預(yù)測(cè)值和實(shí)際數(shù)據(jù)的比值在0.2~6.0之間作為標(biāo)準(zhǔn),確定用于最終分析的已知人群。各人群反向預(yù)測(cè)結(jié)果見(jiàn)表1。
表1 反向預(yù)測(cè)的已知人群規(guī)模
第7個(gè)已知人群“過(guò)去1年發(fā)生意外事故”的預(yù)測(cè)規(guī)模與實(shí)際規(guī)模的比值97.97超出標(biāo)準(zhǔn),故將其剔除。
剩余6個(gè)已知人群,再次利用其他5個(gè)已知人群估計(jì)剩余的第6個(gè)已知人群的規(guī)模。結(jié)果顯示,反向預(yù)測(cè)值與實(shí)際數(shù)據(jù)的比值在0.21~5.76之間,說(shuō)明剩下的6個(gè)已知人群基本符合已知人群的篩選標(biāo)準(zhǔn),該6個(gè)人群作為最終計(jì)算社交網(wǎng)絡(luò)規(guī)模的已知人群。
(3)C值的分布、異常值處理:根據(jù)篩選出的6個(gè)已知人群,重新計(jì)算社交網(wǎng)絡(luò)規(guī)模,結(jié)果顯示C值呈右偏態(tài)分布,對(duì)C值進(jìn)行對(duì)數(shù)轉(zhuǎn)換并利用箱式圖進(jìn)行異常點(diǎn)診斷,刪除異常值,最終確定納入分析的調(diào)查對(duì)象為1761人。利用6個(gè)人群1761名調(diào)查對(duì)象計(jì)算大學(xué)生的社交網(wǎng)絡(luò)規(guī)模,并根據(jù)北京市大學(xué)生的人口學(xué)特征(專業(yè)、年級(jí))對(duì)其社交網(wǎng)絡(luò)規(guī)模進(jìn)行校正,經(jīng)過(guò)逐步校正后的社交網(wǎng)絡(luò)規(guī)模C的均值97人,中位數(shù)55人,標(biāo)準(zhǔn)差109。利用上述方法對(duì)C值進(jìn)行逐步調(diào)整的結(jié)果如表2。
表2 社交網(wǎng)絡(luò)規(guī)模C逐步校正結(jié)果
(4)大學(xué)生社交網(wǎng)絡(luò)規(guī)模比較:不同性別大學(xué)生社交網(wǎng)絡(luò)規(guī)模差異無(wú)統(tǒng)計(jì)學(xué)意義;不同年級(jí)大學(xué)生社交網(wǎng)絡(luò)規(guī)模差異有統(tǒng)計(jì)學(xué)意義,大三學(xué)生的社交網(wǎng)絡(luò)規(guī)模最大,大四及以上學(xué)生社交網(wǎng)絡(luò)規(guī)模最小。不同專業(yè)大學(xué)生社交網(wǎng)絡(luò)規(guī)模差異有統(tǒng)計(jì)學(xué)意義,其中藝術(shù)類大學(xué)生社交網(wǎng)絡(luò)規(guī)模最大,醫(yī)學(xué)類大學(xué)生社交網(wǎng)絡(luò)規(guī)模最小,其余三類大學(xué)生社交網(wǎng)絡(luò)規(guī)模居中(見(jiàn)表3)。
3.敏感人群規(guī)模和校正:
(1)人群規(guī)模初步估計(jì):利用6個(gè)已知人群計(jì)算得到大學(xué)生社交網(wǎng)絡(luò)規(guī)模C的均值為97人,并計(jì)算北京市在校大學(xué)生有異性性伴的學(xué)生規(guī)模和比例(見(jiàn)表5)。
(2)人群規(guī)模校正: 調(diào)查對(duì)象對(duì)待每個(gè)已知人群都有5種態(tài)度:非常愿意、比較愿意、像一般同學(xué)一樣對(duì)待、不太愿意、非常不愿意。以態(tài)度作為分組標(biāo)志,采用秩和檢驗(yàn)比較不同態(tài)度學(xué)生的社交網(wǎng)絡(luò)規(guī)模,結(jié)果顯示不同態(tài)度學(xué)生的網(wǎng)絡(luò)規(guī)模差異有統(tǒng)計(jì)學(xué)意義(P<0.01)。因此在初步估計(jì)北京市在校大學(xué)生性行為發(fā)生規(guī)模和比例后,計(jì)算其校正系數(shù)(見(jiàn)表4),在此系數(shù)基礎(chǔ)上重新估計(jì)北京市在校大學(xué)生性行為發(fā)生規(guī)模和比例(見(jiàn)表5)。
表3 不同特征大學(xué)生社交網(wǎng)絡(luò)規(guī)模及比較
表4 已知人群和未知人群的態(tài)度1校正系數(shù)
表5 校正前后人群規(guī)模比較
結(jié)果顯示,北京市在校大學(xué)生中有異性性伴的大學(xué)生占總體比例為13.74%(2011年北京市在校大學(xué)生共819368人,其中女生409048人,男生410320人),其中男生比例為13.84%,女生比例為13.62%。
本次研究證明,運(yùn)用反向預(yù)測(cè)法得到的已知人群規(guī)模與運(yùn)用網(wǎng)絡(luò)規(guī)模迭加法得到的規(guī)模大體一致,并且計(jì)算得到的敏感人群規(guī)模與已有相關(guān)研究結(jié)果相似[7-8],說(shuō)明了運(yùn)用網(wǎng)絡(luò)規(guī)模迭加法計(jì)算社交網(wǎng)絡(luò)規(guī)模和敏感人群規(guī)模的可信性。
研究結(jié)果顯示北京市在校大學(xué)生的社交網(wǎng)絡(luò)規(guī)模C值呈偏態(tài)分布,與國(guó)內(nèi)外研究中C值的分布情況一致[9-11]。關(guān)于社交網(wǎng)絡(luò)規(guī)模的描述是用均數(shù)還是中位數(shù),目前沒(méi)有確定性的建議,本研究給出了兩個(gè)參數(shù)的估計(jì)值。不同性別、學(xué)校和年級(jí)學(xué)生的社交網(wǎng)絡(luò)規(guī)模存在差異,其分布差異可以從他們的身份特點(diǎn)上得到合理的解釋。本研究樣本理科和醫(yī)學(xué)生比例較高,而其社交網(wǎng)絡(luò)規(guī)模C值較低,為了排除樣本構(gòu)成對(duì)結(jié)果的影響,用北京市大學(xué)生的人口學(xué)特征進(jìn)行了校正,結(jié)果更為準(zhǔn)確和可信。
已知人群的選擇將對(duì)網(wǎng)絡(luò)規(guī)模迭加法的運(yùn)用產(chǎn)生極大的影響,繼而影響社交網(wǎng)絡(luò)規(guī)模和未知人群規(guī)模的計(jì)算。所以,在網(wǎng)絡(luò)規(guī)模迭加法的運(yùn)用中,要慎重選擇已知人群。一般,至少需要6個(gè)已知人群,同時(shí)不能選擇規(guī)模太大或太小的人群,反向預(yù)測(cè)值與官方數(shù)據(jù)的比值在0.2~6.0之間較合適。
(同時(shí)感謝中國(guó)疾病預(yù)防控制中心性艾中心對(duì)于本次研究的項(xiàng)目資金支持。)
參 考 文 獻(xiàn)
1.Bernard HR,Hallett T,Iovita A,et al.Counting hard-to-count populations: the network scale-up method for public health.Sex Transm Infect,2010,86(supply 2):11-15.
2.Johnsen EC,Bernard HR,Killworth PD,et al.A social network approach to corroborating the number of AIDS/HIV+victims in the U.S.Social Networks,1995,17(3):167-187.
3.Bernard HR,Johnsen EC,Killworth PD,et al.Estimating the size of an average personal network and of an event subpopulation: some empirical results,1991,20(2):109-121.
4.Bernard HR,Killworth PD,Johnsen EC,et al.Mccarty C.Estimating the Ripple Effect of a Disaster.Connections,2001,24(2):18-22.
5.Bernard HR,Mccarty C.Scale-up method theory and history with notes,2009.
6.Killworth PD,Mccarty C,Johnscn EC,et al.Investigating the variation of personal network size under unknown error Conditions.Socio-logical Methods & Research,2006,35(1):84-112.
7.張絲艷,徐震雷.北京市四所高校大學(xué)生性行為現(xiàn)狀及相關(guān)因素調(diào)查.中國(guó)性科學(xué),2010,9(2):3-6.
8.彭彧華,沈莉.當(dāng)代大學(xué)生性行為和性態(tài)度,性知識(shí)的特點(diǎn)及關(guān)系.人口研究,2009,33(6):85-93.
9.惠珊,王璐,郭巍.網(wǎng)絡(luò)規(guī)模迭加法及其在男男性接觸者人群規(guī)模估計(jì)中的應(yīng)用.國(guó)際流行病學(xué)傳染病學(xué)雜志,2010,37(6):405-407.
10.包水蓮,吳國(guó)輝,張維,等.利用網(wǎng)絡(luò)規(guī)模迭加法估計(jì)重慶市男男性行為人群規(guī)模的研究.中華流行病學(xué)雜志,2012,33(010):1036-1039.
11.還錫萍,包水蓮,等.利用網(wǎng)絡(luò)規(guī)模迭加法估計(jì)泰州市暗娼和嫖客人群規(guī)模.中華預(yù)防醫(yī)學(xué)雜志,2013,47(3):19-21.