楊 政,原子霞,賈祖瑤
(1. 電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院 成都 611731;2. 電子科技大學(xué)數(shù)學(xué)科學(xué)學(xué)院 成都 611731)
新型冠狀病毒肺炎已經(jīng)成為國(guó)際關(guān)注的重大緊急公共衛(wèi)生事件,給人民的生命和生活造成嚴(yán)重危害。因此,阻擊病毒傳染成了全國(guó)人民的共同戰(zhàn)役。從2020 年1 月23 日武漢開始“封城”后,各個(gè)省市采取多種防控措施。居民按照專家建議減少外出活動(dòng),在家隔離以降低被感染的風(fēng)險(xiǎn)。
2020 年1 月23 日?2 月4 日,武漢市確診人數(shù)和疑似病例的數(shù)據(jù)不斷升高。國(guó)家在武漢投入更多的力量醫(yī)治確診病人,如緊急調(diào)撥物資、建立火神山和雷神山醫(yī)院、派出多批次的支援醫(yī)療隊(duì)等。這些措施給全國(guó)人民帶來(lái)了戰(zhàn)勝病毒的信心。此時(shí),明確武漢市感染者的數(shù)量對(duì)于防控、診斷和治療有重要意義。那么,武漢市目前受感染的人數(shù)有多少?這是本文擬研究的問(wèn)題。
從Elsevier 數(shù)據(jù)庫(kù)查閱到新型冠狀病毒的相關(guān)論文大約有70 余篇,大致分為兩類。一類側(cè)重于從醫(yī)學(xué)方面探討新型冠狀病毒的來(lái)源[1]、發(fā)現(xiàn)和臨床診斷[2]、病毒基因分析[3]、公眾心理健康[4]以及如何控制病毒流行[5]等問(wèn)題。
另一類論文利用大數(shù)據(jù)、傳播動(dòng)力學(xué)模型、統(tǒng)計(jì)計(jì)算方法等工具對(duì)疫情進(jìn)行了預(yù)測(cè)分析。文獻(xiàn)[6]基于包括“易感態(tài)-潛伏態(tài)-感染態(tài)-移除態(tài)”的SEIR 倉(cāng)室模型,對(duì)病毒的基本再生數(shù)進(jìn)行估計(jì)。以《人民日?qǐng)?bào)》新型冠狀病毒肺炎疫情實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)為基準(zhǔn),估計(jì)基本再生數(shù)在2.8~3.3 之間;以國(guó)外同行預(yù)測(cè)的感染人數(shù)為基準(zhǔn),基本再生數(shù)在3.2~3.9 之間。文獻(xiàn)[7]利用傳播動(dòng)力學(xué)模型,對(duì)新型冠狀病毒肺炎傳播風(fēng)險(xiǎn)進(jìn)行了預(yù)測(cè)分析。該文利用2020 年1 月10 日?1 月22 日的報(bào)告疫情數(shù)據(jù),采用動(dòng)力學(xué)模型和統(tǒng)計(jì)計(jì)算方法預(yù)測(cè)基本再生數(shù)為6.47(95%置信區(qū)間為 5.71~7.23),給出了疫情的達(dá)峰時(shí)間、峰值及最終感染規(guī)模,按照2020 年1 月22 日前的控制措施,疫情將在3 月10 日左右達(dá)到峰值。文獻(xiàn)[8]分析了分布在全國(guó)31 個(gè)省市自治區(qū)、552 家醫(yī)院的1 099 個(gè)確診病例的臨床特征、潛伏期、診斷情況、治療方式等要素,發(fā)現(xiàn)新型冠狀病毒感染的平均潛伏期為3 天。文獻(xiàn)[9]預(yù)測(cè)了新型冠狀病毒感染者的人數(shù),估計(jì)2020 年1 月25 日的感染人數(shù)約7.5 萬(wàn)人。文獻(xiàn)[10]根據(jù)自然增長(zhǎng)規(guī)律動(dòng)態(tài)提出數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法,跟蹤疫情發(fā)展并檢測(cè)干預(yù)措施的有效性。在2020 年2 月5 日預(yù)測(cè)約4 天后(2 月9 日)達(dá)到峰值,確診病例總數(shù)將在3.7 萬(wàn)~4.4 萬(wàn)之間。
上述研究并沒(méi)有直接針對(duì)武漢市的感染者人數(shù)進(jìn)行預(yù)估。本文在疫情前期把武漢市所有民眾看作一個(gè)樣本總體,離開武漢和留在武漢是由同一個(gè)總體分布中抽取的兩組隨機(jī)樣本。本文把離開武漢的民眾視為實(shí)驗(yàn)組樣本,把留在武漢的民眾視為對(duì)照組樣本。武漢市受到醫(yī)護(hù)人員不足和醫(yī)療物資緊缺的約束,對(duì)照組樣本的確診人數(shù)低于實(shí)際被感染人數(shù)。所以,利用實(shí)驗(yàn)組樣本的確診數(shù)據(jù),分析其統(tǒng)計(jì)分布的數(shù)字特征,借鑒這些數(shù)字特征對(duì)武漢市的感染人數(shù)進(jìn)行估計(jì)。簡(jiǎn)單來(lái)說(shuō),就是利用實(shí)驗(yàn)組樣本的統(tǒng)計(jì)參數(shù),估計(jì)對(duì)照組樣本未受約束時(shí)的發(fā)展?fàn)顩r。
本文利用百度遷徙數(shù)據(jù)來(lái)估計(jì)武漢目前受感染的人數(shù)。統(tǒng)計(jì)從武漢遷入人員數(shù)量排名前50 位城市的人數(shù),遷徙時(shí)間從2020 年1 月10 日至1 月22 日。表1 給出了排名前50 位城市從武漢遷入的人數(shù)。
表1 排名前50 城市從武漢遷入的人數(shù)
為了估算武漢市感染新型冠狀病毒的人數(shù),本文做出如下假設(shè)。
假設(shè)1:2020 年1 月10 日?1 月22 日離開武漢的遷徙數(shù)據(jù)是準(zhǔn)確的。
由于并沒(méi)有一手的人員流動(dòng)數(shù)據(jù),故以網(wǎng)絡(luò)報(bào)道的百度遷徙數(shù)據(jù)為準(zhǔn)。百度遷徙數(shù)據(jù)是根據(jù)遷徙人員的手機(jī)在不同地點(diǎn)的定位統(tǒng)計(jì)的,準(zhǔn)確性較高。例如本文根據(jù)遷徙數(shù)據(jù)計(jì)算從武漢到信陽(yáng)的人數(shù)是7.19 萬(wàn)人(新聞報(bào)道的數(shù)據(jù)是8.046萬(wàn)人,包括了22 日之后的遷徙人數(shù))。因此,在2020 年1 月22 日之前的遷徙數(shù)據(jù)具有較高的可信度。在50 個(gè)城市中,遷徙人員是確診新冠病毒肺炎患者的直接來(lái)源,至少在潛伏期間遷徙數(shù)據(jù)是一個(gè)最主要的影響因子。因此,50 個(gè)城市的確診病例應(yīng)該是以武漢遷入人員為主。在潛伏期之后,武漢遷入人員經(jīng)過(guò)病毒潛伏期,確診比率應(yīng)該會(huì)下降。在病毒的潛伏期內(nèi),50 個(gè)城市本地居民受到武漢遷入人員傳染,確診比率應(yīng)該會(huì)升高。從武漢遷入50 個(gè)城市的人員數(shù)量仍然是一個(gè)基礎(chǔ)變量,它持續(xù)影響了后續(xù)感染患者的數(shù)量。
假設(shè)2:從武漢遷徙到50 個(gè)城市的人數(shù)在未來(lái)一段時(shí)間內(nèi)保持不變。
這個(gè)假設(shè)是為了對(duì)應(yīng)“封城”后武漢的人數(shù)保持不變。計(jì)算50 個(gè)城市感染患者人數(shù)的基數(shù)也應(yīng)該保持不變。事實(shí)上,這個(gè)假設(shè)對(duì)個(gè)別城市可能不成立,如溫州市,據(jù)報(bào)道2020 年1 月22 日之后從武漢到溫州的人數(shù)比之前的人數(shù)更多。這對(duì)研究結(jié)果有一定影響,因此在后面研究中做了一些修正。
假設(shè)3:留在武漢和離開武漢人員感染病毒的概率是同一個(gè)分布。
這個(gè)假設(shè)是估計(jì)武漢感染人數(shù)的一個(gè)重要前提。假設(shè)意味著離開和留在武漢的人員都是同一個(gè)概率分布的樣本。這個(gè)假設(shè)在2020 年1 月22 日之后幾天可能是成立的。由于本文整理數(shù)據(jù)是2020 年從1 月29 日開始,距離1 月22 日已經(jīng)有7 天的時(shí)間間隔。通過(guò)檢驗(yàn)湖北省內(nèi)城市和省外城市的確診比率,發(fā)現(xiàn)兩者并不是同一個(gè)分布。為此,本文把50 個(gè)城市分成兩組。一組是湖北省內(nèi)的15 個(gè)城市,另一組是省外的35 個(gè)城市。即使這兩組樣本的分布不同,仍然假設(shè)武漢屬于這兩組樣本中的某一種情況。如果武漢不屬于這兩組樣本,那會(huì)是一種最差的情況。
假設(shè)4:樣本期內(nèi)留在武漢和離開武漢確診的人員都是源于相同的病毒感染模式。
這個(gè)假設(shè)表示武漢市的確診人員和其他城市的確診人員是相同的感染模式。比如,其他城市前期的確診人員都是從武漢遷入被確診,后期的部分確診人員是受遷移人員傳染而被確診。武漢市早期的確診人員和其他城市早期的確診人員是同一批感染者,后期的部分人員受他人傳染被確診。
除了收集50 個(gè)城市從武漢遷徙來(lái)的人員數(shù)量,利用百度新型冠狀病毒肺炎-疫情實(shí)時(shí)大數(shù)據(jù)報(bào)告,收集整理這些城市從2020 年1 月29 日至2 月9 日的確診人數(shù),并從萬(wàn)德(Wind)數(shù)據(jù)庫(kù)收集武漢市的戶籍人口數(shù)據(jù)。
用i=1,2,···,50表示50 個(gè)城市中的第i 個(gè)城市 ,用 xt,i表 示第i 個(gè)城市在第t天的累積確診人數(shù),用 yi表示從武漢遷出到第i 個(gè)城市的人數(shù)。計(jì)算第i 個(gè)城市每天的確診比率 pt,i為:
這樣得到50 個(gè)城市累計(jì)確診比率的時(shí)間序列數(shù)據(jù)。
接下來(lái),用R 軟件對(duì)各城市每天的數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析。為了避免個(gè)別城市的特殊值影響整體分析,除了最大值和最小值,還在描述性統(tǒng)計(jì)中增加了第二大值和第二小值。表2 給出湖北省內(nèi)和省外城市在確診比率方面的描述性統(tǒng)計(jì)。由于確診人數(shù)是累計(jì)值而不是每天增量值。因此均值、中位數(shù)、最大值、最小值和標(biāo)準(zhǔn)差等隨著時(shí)間增加而變大。對(duì)比省內(nèi)外城市,省外城市在均值,中位數(shù)、標(biāo)準(zhǔn)差、最大值及第二大值這些統(tǒng)計(jì)量的數(shù)值上都大于當(dāng)日的省內(nèi)城市。省外城市確診比率的最小值和第二小值在5 日和6 日之前都小于省內(nèi)城市,之后都大于省內(nèi)城市。原因是省內(nèi)城市早期有確診人員,初始值較大,但是受限于醫(yī)務(wù)人員的不足,確診比率增長(zhǎng)較慢。省外城市的初始值小,隨著省外城市的醫(yī)療資源充足,潛在患者被迅速確診,確診比率的最小值和第二小值迅速超過(guò)省內(nèi)城市。
表2 中雅克貝拉(Bera–Jarque, JB)檢驗(yàn)統(tǒng)計(jì)量用于檢驗(yàn)分布是否屬于正態(tài)分布。對(duì)于每日確診比率,檢驗(yàn)原假設(shè) H0:pt,服從標(biāo)準(zhǔn)正態(tài)分布。根據(jù)文獻(xiàn)[11],定義JB 統(tǒng)計(jì)量為:
表2 湖北省內(nèi)和省外城市確診比率的描述性統(tǒng)計(jì)
表3 每天確診比率極值對(duì)應(yīng)的城市
省外城市在2020 年1 月29 日?2 月9 日期間的變化不大。前3 日確診比率最高的是浙江溫州和杭州。隨著浙江采取嚴(yán)格的防控措施,2 月1 日之后確診比率第二大值出現(xiàn)在深圳市。確診比率最小值一直由貴陽(yáng)市保持。第二小值在洛陽(yáng)市、廈門市和石家莊市中變換。
對(duì)比湖北省內(nèi)城市和省外城市的表現(xiàn)??紤]到省內(nèi)和省外城市的樣本數(shù)和分布相同,采用文獻(xiàn)[12]提出的F 檢驗(yàn)做省內(nèi)外的均值相等性檢驗(yàn),采用文獻(xiàn)[13]的 χ2檢驗(yàn)做中位數(shù)相等性檢驗(yàn)。應(yīng)用R 軟件檢驗(yàn)均值和中位數(shù)的相等性,檢驗(yàn)結(jié)果見(jiàn)表4。
從均值檢驗(yàn)結(jié)果看,表4 顯示省內(nèi)外均值相等的原假設(shè)在5%水平被顯著拒絕,說(shuō)明湖北省內(nèi)城市和省外城市的均值差異明顯。從中位數(shù)檢驗(yàn)看,2020 年1 月30 日?2 月1 日,中位數(shù)相等的原假設(shè)在1%水平上被顯著拒絕。2 月2 日的中位數(shù)檢驗(yàn)在10%水平上并不顯著。在2 月3 日?6 日的結(jié)果出現(xiàn)反轉(zhuǎn),顯示省內(nèi)中位數(shù)持續(xù)低于省外的中位數(shù)。一個(gè)好的信號(hào)出現(xiàn)在2 月7 日,p 值在10%水平上不拒絕省內(nèi)外中位數(shù)相等的原假設(shè)。這說(shuō)明湖北省內(nèi)和省外的確診狀況暫時(shí)進(jìn)入一個(gè)新階段。2 月8 日和9 日的中位數(shù)檢驗(yàn)結(jié)果強(qiáng)化了這一結(jié)論。
根據(jù)式(1),估計(jì)每日武漢感染人數(shù)為:
表4 均值和中位數(shù)檢驗(yàn)
式中,y =883.73萬(wàn) 是武漢市的戶籍人數(shù); pt,j是表2的比率,表示第t 日第j 種情況下的數(shù)值; j 分別表示均值、中位數(shù)、最大值、第二大值、第二小值和最小值這6 種情況。常見(jiàn)的統(tǒng)計(jì)估計(jì)應(yīng)該包括某些置信水平下的區(qū)間估計(jì),比如估計(jì)武漢感染人數(shù)的95%區(qū)間,在本文中并沒(méi)有做區(qū)間估計(jì)。由于武漢市的情況很特殊,也可能不屬于省內(nèi)和省外的兩種分布,匯報(bào)區(qū)間估計(jì)的意義不大。直接采用4 種極值比率來(lái)估計(jì),這樣能夠看到極端情況下武漢市感染人數(shù)的估計(jì)值。
表5 給出了6 種情況估計(jì)的武漢感染人數(shù)。表5 的最后一列是每日公布的武漢市確診人數(shù)。為了更好地理解估計(jì)結(jié)果,把估計(jì)值除以每日公布的確診人數(shù),得到估計(jì)值和公布確診人數(shù)的比值,結(jié)果見(jiàn)表6。表5 和6 的結(jié)果總結(jié)為以下3 點(diǎn)。
表5 6 種情況下武漢感染人數(shù)的估計(jì)
1) 按照確診比率的最小值 (即最小比率)來(lái)估計(jì)?;谑?nèi)城市確診比率最小值(即潛江市),估計(jì)武漢市受感染人數(shù)。除了前3 日的估計(jì)人數(shù)低于確診人數(shù)外,后面5 日的估計(jì)人數(shù)都高于確診人數(shù)。自2020 年2 月8 日開始,武漢市確診人數(shù)開始大于估計(jì)的感染人數(shù)。再按第二小值的比率估計(jì),1 月29 日的估計(jì)值是1 971 人,和確診的1 905 人較為接近。2 月9 日,根據(jù)第二小值(即恩施市)的確診比率估計(jì)武漢市感染人數(shù),估計(jì)值大約是確診人數(shù)的1.1 倍。
從省外城市來(lái)看,按照確診比率的最小值(即貴陽(yáng)市)估計(jì)2020 年2 月1 日武漢市的受感染人數(shù),估計(jì)值和確診人數(shù)持平。用第二小值(即洛陽(yáng)市)估計(jì),在2 月1 日的估計(jì)值已經(jīng)開始大于確診人數(shù)。按照省外城市確診比率的最小值,即最樂(lè)觀的估計(jì),2 月2 日之后武漢市感染人數(shù)的估計(jì)值全部大于確診人數(shù)。
2) 按照省內(nèi)城市的平均值估計(jì),表5 顯示武漢在2020 年1 月29 日?2 月9 日的感染人數(shù)分別是4 483人和31 531 人。表6 展示了比值的動(dòng)態(tài)變化,由1 月29 日的2.4 倍開始增加,到2 月1 日到達(dá)峰值即3.4 倍,之后比值開始持續(xù)減少,2 月9 日的比值是2.1 倍。
在按照省外城市的平均值估計(jì),從2020 年1 月29 日?2 月9 日的感染人數(shù)分別是1.304 0 萬(wàn)人和5.324 8 萬(wàn)人。表6 的比值隨時(shí)間變化的動(dòng)態(tài)特征和省內(nèi)情況類似,從1 月29 日的6.8 倍到1 月31 日達(dá)到峰值即8.3 倍,比值從2 月1 日開始持續(xù)下降,到2 月9 日估計(jì)的感染人數(shù)是確診人數(shù)的3.6 倍。
表6 武漢感染人數(shù)的估計(jì)和公布確診人數(shù)的比值
按中位數(shù)估計(jì),省內(nèi)城市的比值從1 月31 日的3 倍減少到2 月9 日的2 倍。利用省外城市估計(jì)的感染人數(shù)和確診人數(shù)的比值,從1 月29 日的4.7 倍增加到1 月31 日的6 倍,再逐步減少到2 月9 日的2.6 倍。
3) 從感染確診比率的最大值(即最大比率)來(lái)估計(jì)。按照省內(nèi)城市的最大值(即十堰市和隨州市)估計(jì),從2020 年1 月29 日?2 月9 日,估計(jì)的武漢感染人數(shù)是當(dāng)日確診人數(shù)的4.5 倍和3.9 倍,期間比值在2 月4 日達(dá)到最大的5.9 倍。按照省內(nèi)城市的第二大值(分別是荊門市和十堰市)來(lái)估計(jì),1 月29 日和2 月9 日的估計(jì)值分別是0.811 7 萬(wàn)人和4.598 3 萬(wàn)人。武漢市估計(jì)的感染人數(shù)是確診人數(shù)的4.3 倍和3.1 倍。
按照省外城市的最大值(即溫州市)估計(jì),從2020 年1 月29 日?2 月9 日,估計(jì)的感染人數(shù)和確診人數(shù)比值從45.6 倍(1 月29 日)增加到65.5 倍(1 月31 日),再 逐 步 減 少 到22.8 倍(2 月9 日)。1 月29 日的估計(jì)值是8.685 萬(wàn)人,2 月9 日的估計(jì)值是34.130 萬(wàn)人。用省外城市的第二大值來(lái)估計(jì),1 月29 日(杭州市)和2 月9 日(深圳市)的估計(jì)值分別是2.666 9 萬(wàn)人和12.392 5 萬(wàn)人,估計(jì)的感染人數(shù)分別是當(dāng)日確診人數(shù)的14 倍和8.3 倍。
用省外城市的最大比率(即溫州市)估計(jì)出武漢市的感染人數(shù)在2 月9 日是34.130 萬(wàn)人,這個(gè)結(jié)果令人吃驚。追查從武漢回到溫州的人數(shù),溫州市副市長(zhǎng)在2020 年1 月29 日采訪中提到:“武漢‘封城’后,1 月23 日至27 日5 天,仍然有1.88 萬(wàn)人從湖北特別是武漢到達(dá)溫州,平均每天有3 600 多人”。因此從武漢回到溫州是3.04 萬(wàn)人,大于百度遷徙數(shù)據(jù)計(jì)算的2020 年1 月10 日至22 日的1.16 萬(wàn)人,回到溫州的實(shí)際人數(shù)增加了1.6 倍。假設(shè)溫州的累計(jì)確診人數(shù)是從3.04 萬(wàn)人中得到的,那么估算武漢市感染人數(shù)大約為13.127 萬(wàn)人(34.130 萬(wàn)人/2.6),仍然高于由第二大值(即深圳市)確診比率估計(jì)的12.393 萬(wàn)人。調(diào)整后的估計(jì)感染人數(shù)與當(dāng)日確診人數(shù)的比值是8.7 倍,高于第二大值的8.3 倍。從表6 看到,省外城市感染比率第二大的城市在1 月29 日是杭州。從2 月1 日之后就是深圳市。顯然,從確診率高的溫州市和深圳市估計(jì)武漢市的感染人數(shù),結(jié)果較為一致。
由于研究樣本較少,尤其是省內(nèi)的15 個(gè)樣本屬于小樣本情形。對(duì)均值和中位數(shù)的估計(jì)可能會(huì)有一些影響。為此,采用Bootstrap 方法[14]重新估計(jì)每日的均值和中位數(shù)。具體步驟為:
對(duì)湖北省內(nèi)外城市的每日樣本進(jìn)行Bootstrap抽樣B=10 000 次,計(jì)算得到Bootstrap 均值和中位數(shù),結(jié)果見(jiàn)表7。圖1 給出從2020 年1 月29 日到2 月9 日每天的直方圖。
表7 基于bootstrap 抽樣計(jì)算的省內(nèi)外城市的均值和中位數(shù)
把表7 的Bootstrap 均值和中位數(shù)與表2 的均值和中位數(shù)對(duì)比,二者數(shù)據(jù)非常接近,說(shuō)明均值和中位數(shù)的結(jié)果是魯棒的。
圖1 的直方圖反映了湖北省內(nèi)城市和省外城市確診比率在均值上的差異。直方圖是經(jīng)驗(yàn)分布的直觀表現(xiàn)。圖1 表明省內(nèi)外均值的差異是多方面的。省內(nèi)確診比率的均值始終小于省外均值,峰值高表明確診比率在均值周圍的頻次非常高,表明省內(nèi)城市的確診比率非常集中,方差小同樣表明確診比率在均值周圍變化小。省外城市確診比率的特點(diǎn)是方差更大。
圖1 的另一個(gè)重要特征是隨著時(shí)間變化,省內(nèi)城市的直方圖和省外城市的直方圖產(chǎn)生了交集,當(dāng)時(shí)間增加,交集重合的部分越來(lái)越多。從表7 看到,省內(nèi)城市的均值以更快的速度增加,1 月29 日是0.508,2 月9 日是3.570,大約增加了6 倍。省外城市的均值在1 月29 日是1.473,2 月9 日是6.029,大約增加了3 倍。從表7 還可以看到從1 月29 日到2 月9 日,省內(nèi)城市的中位數(shù)增加了6.5 倍,而省外城市的中位數(shù)增加了3.2 倍。這表明隨著湖北省內(nèi)城市醫(yī)療條件的改善,確診比率提高得越來(lái)越快,逐漸跟上省外城市的確診趨勢(shì)。只有當(dāng)省內(nèi)外的均值和中位數(shù)在統(tǒng)計(jì)檢驗(yàn)上不再有顯著差異時(shí),省內(nèi)外的疫情達(dá)到了相同的水平。
圖1 基于10 000 次Bootstrap 抽樣估計(jì)均值的直方圖
利用2020 年1 月10 日?1 月22 日的百度遷徙數(shù)據(jù),本文統(tǒng)計(jì)從武漢市到全國(guó)50 個(gè)城市的遷移人數(shù)。同時(shí),收集2020 年1 月29 日?2 月9 日這12 天內(nèi)50 個(gè)城市感染新型冠狀病毒確診人數(shù)的數(shù)據(jù)。首先,利用統(tǒng)計(jì)方法計(jì)算了感染新型冠狀病毒人數(shù)占遷移人數(shù)的比率。其次,對(duì)省內(nèi)外每天的確診比率進(jìn)行描述性統(tǒng)計(jì),以及均值和中位數(shù)相等性檢驗(yàn)。接下來(lái),根據(jù)省內(nèi)外的統(tǒng)計(jì)結(jié)果,對(duì)武漢市的感染人數(shù)進(jìn)行估計(jì)。最后對(duì)均值和中位數(shù)進(jìn)行了Bootstrap 抽樣計(jì)算,均值和中位數(shù)結(jié)果具有穩(wěn)健性。本文研究得到以下結(jié)論。
1) 通過(guò)對(duì)比發(fā)現(xiàn),湖北省內(nèi)城市確診人數(shù)的均值和中位數(shù)都低于省外城市的均值和中位數(shù)。原因是疫情初期湖北省內(nèi)的醫(yī)療資源不足,許多感染病人還未得到有效的診斷和治療。潛在病人尚未被發(fā)現(xiàn),這需要特別重視。隨州、十堰、襄陽(yáng)、宜昌市和荊門等城市,在樣本期內(nèi)的確診比率處于15 個(gè)省內(nèi)城市的前兩位。從均值檢驗(yàn)來(lái)看,湖北省內(nèi)城市和省外城市的差異是顯著的。從中位數(shù)檢驗(yàn)來(lái)看,湖北省內(nèi)城市和省外城市的差異在2 月7 日發(fā)生了改變,不拒絕在10%水平上中位數(shù)相等的假設(shè)。這表明湖北省內(nèi)城市感染者的確診逐漸趕上省外城市確診的速度。當(dāng)省內(nèi)和省外城市在均值檢驗(yàn)也無(wú)顯著差異時(shí),才能認(rèn)為省內(nèi)外疫情狀態(tài)達(dá)到同一個(gè)水平,疫情防控進(jìn)入一個(gè)新的階段。
2) 從最近一天(2 月9 日)的情況來(lái)看,利用省內(nèi)城市確診比率的均值和中位數(shù)估計(jì)武漢市的感染人數(shù),估計(jì)值是確診人數(shù)的2.1 倍和2 倍。利用最大值和第二大值估計(jì),感染人數(shù)是確診人數(shù)的3.9 倍和3.1 倍。利用省外城市的均值和中位數(shù)估計(jì)武漢市的感染人數(shù),估計(jì)值是確診人數(shù)的3.6 倍和2.6 倍。用最大值和第二大值估計(jì)的武漢市感染人數(shù),是確診人數(shù)的8.7 倍(修正后)和8.3 倍。這些結(jié)果無(wú)不說(shuō)明武漢市內(nèi)有很多潛在的感染患者尚未得到診斷。根據(jù)通報(bào)信息,武漢市前期已經(jīng)征用和開辟了9 000 張床位,雷神山醫(yī)院的1 000~1 500 張床位,火神山醫(yī)院的700~1 000 張床位。2 月4 日武漢市征用11 家場(chǎng)館改造成“方艙醫(yī)院”,改造完成后,可提供萬(wàn)余張床位。這些床位數(shù)量加在一起仍然小于估計(jì)的感染人數(shù)。
3) 利用Bootstrap 方法重新估計(jì)湖北省內(nèi)外城市確診比率的均值和中位數(shù)。穩(wěn)健性的結(jié)論進(jìn)一步支持對(duì)武漢市感染患者的預(yù)測(cè)結(jié)果。
首先,由于作者不具備醫(yī)學(xué)方面的專業(yè)知識(shí),無(wú)法從傳染病模型、病毒潛伏期、基本再生數(shù)及感染傳播機(jī)制等方面進(jìn)行分析。本文的假設(shè)也忽略了病毒二代傳播在不同地方的差異性,這些差異性對(duì)估計(jì)結(jié)果會(huì)有一定的影響,使得估計(jì)值和實(shí)際感染人數(shù)有一定偏差。
其次,基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性會(huì)影響估計(jì)結(jié)果。由于研究數(shù)據(jù)是根據(jù)網(wǎng)絡(luò)上百度遷移數(shù)據(jù)整理得到,而實(shí)際情況更復(fù)雜,整理的數(shù)據(jù)與實(shí)際數(shù)據(jù)有差異。50 個(gè)城市遷徙人員的基數(shù)變小使得計(jì)算的確診率偏高,導(dǎo)致武漢感染人數(shù)的估計(jì)值也偏高。
最后,文中沒(méi)有考慮50 個(gè)城市每日增加確診人數(shù)的動(dòng)態(tài)特征,利用面板分析方法研究動(dòng)態(tài)數(shù)據(jù)會(huì)得到新的啟示,比如判斷疫情拐點(diǎn)的出現(xiàn)。利用更多的數(shù)據(jù)信息,更復(fù)雜的統(tǒng)計(jì)和大數(shù)據(jù)研究方法,研究結(jié)論將會(huì)更豐富。