吳 姍
(華北水利水電大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 鄭州 450046)
2019年12 月,湖北省武漢市報(bào)告了不明原因肺炎病例,疫情發(fā)生后武漢地區(qū)采取了嚴(yán)厲的防控措施,由于武漢市特殊的交通地理區(qū)位,新冠肺炎疫情很快蔓延至中國其他省市,特別是湖北省內(nèi)城市[1],并逐漸波及各地。醫(yī)療衛(wèi)生領(lǐng)域科學(xué)家曾提出,新型冠狀病毒病大概率會間歇性暴發(fā),并且有概率會與人類長期共存。目前關(guān)于COVID-19時空演變特征的研究主要包括對疫情發(fā)展的預(yù)測、確診病例時空聚集的探測以及確診病例分布的影響因素分析。文獻(xiàn)[2]中提出確診病例時空聚集的探測常采用的方法有描述性統(tǒng)計(jì)分析、時空掃描統(tǒng)計(jì)和空間自相關(guān)分析。Kang等[3]發(fā)現(xiàn)中國省級尺度疫情存在顯著的空間相關(guān)性。武文韜等[4]以廣東省為研究對象,側(cè)重于分析確診病例在該區(qū)域的分布特征,從而對疫情的發(fā)展趨勢做出預(yù)測。簡子菡等[5]從鎮(zhèn)域尺度對河南省新冠肺炎疫情病例的時空演化特征進(jìn)行分析,結(jié)論表明疫情在空間上整體呈現(xiàn)“南重北輕”,確診病例數(shù)東南多西北少。Mo等[6]使用時空立方體研究中國各城市的疫情熱點(diǎn)區(qū)域。Xiong等[7]發(fā)現(xiàn)湖北各縣市的疫情與人口、經(jīng)濟(jì)等因素相關(guān)。Jia等[8]發(fā)現(xiàn)在疫情早期,各省的累積確診病例與當(dāng)?shù)厝丝跀?shù)的相關(guān)性不顯著,而與從武漢輸入當(dāng)?shù)氐娜藬?shù)相關(guān)性很強(qiáng)。
了解疾病的空間動態(tài)及其與社會因素之間的關(guān)系,有利于確定感染傳播潛力增大的地區(qū)、優(yōu)先在這些地區(qū)采取預(yù)防和控制措施,加大衛(wèi)生系統(tǒng)對治療病例的管控。本研究通過對確診病例進(jìn)行空間自相關(guān)分析,描述其時間和空間上的聚集性。通過空間回歸分析模型探索影響確診病例的空間分布相關(guān)因素,有助于公共決策者更好地規(guī)劃衛(wèi)生政策干預(yù)措施,為今后此類傳染病防控提供參考。
本文以2020年1月23日至3月25日湖北及鄰省區(qū)為研究區(qū)域來探索新冠肺炎疫情的時空分布特征,湖北省是此次疫情爆發(fā)的起點(diǎn),其周圍地區(qū)與湖北交通來往密切且人口眾多,皆在疫情早期受到了不同程度的影響。以湖北及鄰省區(qū)為研究區(qū)可以直觀地反映人群遷徙及社會因素對COVID-19疫情擴(kuò)散的影響。
2020年1 月下旬至2月中旬是華中地區(qū)疫情傳播的主要階段,本次搜集了研究區(qū)域各省衛(wèi)生健康委員會2020年1月23日至3月25日每日疫情通報(bào)信息中確診病例和每日新增病例數(shù)據(jù),湖北及鄰省各行政區(qū)劃地圖數(shù)據(jù)以及百度遷徙大數(shù)據(jù)平臺1月13日至1月23日期間武漢市的人口遷徙指數(shù)及遷出人口比例數(shù)據(jù),湖北省、河南省、安徽省、江西省、湖南省、重慶市和陜西省2020年統(tǒng)計(jì)年鑒人口密度數(shù)據(jù)。
研究分別從時間和空間的角度對疫情的演變趨勢以及聚集性特征進(jìn)行分析。在時間上分析了新冠肺炎確診病例的演變趨勢??臻g上分析了聚集性特征,探尋湖北及鄰省地區(qū)累計(jì)確診病例的具體聚集區(qū)域,最后采用了空間回歸分析的方法來探究影響疫情確診病例的因素。
空間自相關(guān)檢驗(yàn)方法是檢驗(yàn)?zāi)骋灰貙傩灾翟诳臻g范圍內(nèi)是否與其鄰近空間點(diǎn)的屬性值相關(guān)聯(lián)的重要指標(biāo),一般來說,方法在功能上可大致分為兩大類:一類為全局型(Global Spatial Autocorrelation),另一類是局部型(Local Spatial Autocorrelation)。全局空間自相關(guān)用于探測整個研究區(qū)域的空間模式,這種相關(guān)性的大小由Moran值表示,Moran’sI的取值范圍在-1和1之間,Mroan’sI>0表示存在正的空間自相關(guān),Mroan’sI<0表示存在負(fù)的空間相關(guān)性,Mroan’sI=0表示不存在空間上的相關(guān)關(guān)系,其計(jì)算公式為:
其中,N為湖北及鄰省各地級市個數(shù)(即N=87),y為各市截至2020年3月25日新冠肺炎累計(jì)確診人數(shù);yˉ為各市累計(jì)確診人數(shù)的均值;wij為空間權(quán)重矩陣。
全局空間自相關(guān)的功能在于描述某個現(xiàn)象的整體分布狀況,判斷此種現(xiàn)象在空間是否有聚集特性存在,但是卻不能具體地指出聚集的區(qū)域。這時就可以采用局部空間自相關(guān)(Local Spatial Autocorrelation)對各地級市累計(jì)確診人數(shù)進(jìn)行局部特征進(jìn)行分析,LocalMoran’sI計(jì)算公式如下:
公式(2)中的變量與公式(1)變量相同[9]。
構(gòu)建空間權(quán)重矩陣是空間建模的基本前提,權(quán)重矩陣類型可劃分為鄰接的空間權(quán)重矩陣和基于距離的空間權(quán)重矩陣,空間鄰接關(guān)系可分為三種類型:Bishop鄰接、Rock鄰接以及Queen鄰接,Bishop是共頂點(diǎn)連接,Rock為共鄰邊連接,Queen是即共頂點(diǎn)又共鄰邊連接。
空間回歸分析模型可應(yīng)用于對存在空間相關(guān)性的事故數(shù)據(jù)的研究??臻g回歸模型主要包括空間滯后模型,空間誤差模型以及空間自回歸組合(SAC)模型[10]??臻g滯后模型是一種考察一個地級市的感染人數(shù)是如何受鄰近市的感染人數(shù)影響的模型,空間誤差模型估計(jì)了一個市的普通最小二乘殘差與其鄰近地市的殘差相關(guān)的程度,而空間自回歸組合(SAC)模型是前兩個模型的組合,同時考慮空間滯后和空間誤差參數(shù)??臻g滯后模型公式如下:
Y是因變量即確診病例個數(shù),WY是帶有權(quán)重矩陣的空間滯后因子,它與觀測目標(biāo)周圍的Y值有關(guān),X是解釋變量,β為參數(shù)向量,W為基于鄰近的空間權(quán)重矩陣,ρ的作用是衡量觀測值之間的空間相互作用程度,為空間滯后項(xiàng)的參數(shù),μ是噪音干擾項(xiàng)。
想要同時且全面地分析確診病例時空分布信息是比較困難的,繪制折線趨勢圖可以很直觀地顯示新增病例隨時間變化的趨勢,但是反映空間上的信息是不容易的,華中地區(qū)的累計(jì)新增確診病例時間趨勢分布如圖1所示。
圖1 累計(jì)新增確診病例時間趨勢分布圖
由新增病例增長的趨勢圖可知1月下旬到2月中旬確診病例的增長較為明顯,2月下旬病例的增長明顯緩慢了許多,2月12號新增病例急劇增長,因2020年2月12號國家出臺相關(guān)政策在湖北省的病例診斷分類中增加了“臨床診斷”,自2月12號起湖北省將臨床診斷病例數(shù)納入確診病例數(shù),而到3月份確診病例的增長逐漸歸零,數(shù)據(jù)表明各級政府以及社會公眾的防控措施在2月中旬有效地遏制了疫情的傳播,確診病例的增長呈現(xiàn)了由少到多,再由多到少的變化趨勢。
使用ARCGIS10.2進(jìn)行全局空間自相關(guān)分析,華中地區(qū)各地級市1月23日-3月25日的累計(jì)確診病例全局空間自相關(guān)分析結(jié)果如圖2所示,1月23日空間自相關(guān)指數(shù)為小于零,自1月25日起Moran指數(shù)迅速增大,P值均小于0.001,說明此時間段內(nèi)確診病例全局分布存在正向空間自相關(guān)性,病例表現(xiàn)出快速聚集的趨勢,Moran指數(shù)在2月1日達(dá)到最大值,2月12日至3月25日逐步減少直至趨于平緩,病例分布保持穩(wěn)定的較高聚集水平[2]。
圖2 累計(jì)確診病例全局空間自相關(guān)分析結(jié)果分布圖
本文選取華中地區(qū)新冠肺炎累計(jì)確診病例數(shù)和人口遷徙數(shù)據(jù)中的武漢人口遷出規(guī)模指數(shù)與武漢遷入到華中地區(qū)各市人口比例的乘積累計(jì)值,運(yùn)用空間回歸分析探討影響疫情空間分布的影響因素,首先構(gòu)建出一般的普通線性回歸模型,然后在其基礎(chǔ)上構(gòu)建空間回歸分析模型。
3.3.1 普通線性回歸模型
空間相關(guān)分析已經(jīng)證明華中地區(qū)各市確診病例具有空間相關(guān)性,下一步需采用空間回歸分析模型來進(jìn)行估計(jì),選取各市累計(jì)確診病例、人口密度和遷徙指數(shù)數(shù)據(jù),首先用普通線性回歸分析對基本模型進(jìn)行估計(jì),然后用極大似然方法估計(jì)普通線性回歸模型,結(jié)果見表1。
由表1可知,普通線性回歸模型的擬合優(yōu)度為0.408 8,因殘差具有空間相關(guān)性,數(shù)據(jù)是否適用于空間回歸模型以及模型的選擇可通過采用拉格朗日乘子誤差和滯后及其穩(wěn)健性(LM)檢驗(yàn),若LM(lag)比LM(error)統(tǒng)計(jì)量中有一個比較顯著,則選擇統(tǒng)計(jì)量顯著的空間回歸分析模型[11]。LM檢驗(yàn)中滯后檢驗(yàn)統(tǒng)計(jì)量和誤差檢驗(yàn)統(tǒng)計(jì)量都不顯著則不適用空間回歸分析模型[12]。由表1可知LM(lag)比LM(error)顯著,且RobustLM(lag)顯著而RobustLM(error)不顯著,可判定空間滯后回歸模型要比空間誤差模型更適合。
表1 普通線性回歸模型分析結(jié)果
3.3.2 空間滯后回歸模型的極大似然估計(jì)
從由3.3.1節(jié)結(jié)果分析可知空間滯后模型更加適用,因此對空間滯后模型進(jìn)行極大似然估計(jì)結(jié)果見表2。采用極大似然法估計(jì)參數(shù)時,基于殘差平方和分解的擬合優(yōu)度檢驗(yàn)意義不是很大,可比較對數(shù)似然函數(shù)值Log L值,空間滯后回歸模型的Log L值大于普通線性回歸模型的,并且SLM的AIC值(253.48)均小于普通線性回歸模型的AIC值(303.74),因此空間滯后回歸模型比普通線性回歸估計(jì)的模型要好??臻g滯后回歸模型中空間自回歸系數(shù)0.086 3在1%水平下顯著,表明一個區(qū)域確診病例的增加會影響到其鄰近區(qū)域的確診病例人數(shù)。似然比檢驗(yàn)值(LR=52.268,p<0.01)也很顯著。在空間滯后回歸模型中,空間滯后系數(shù)為0.1(p<0.01),說明確診病例數(shù)與相鄰地區(qū)的確診病例呈正相關(guān),遷徙累計(jì)值與人口密度的顯著性概率小于0.01,兩種因素對確診病例的空間分布均有較為顯著的影響,說明累計(jì)確診病例數(shù)與人口遷移量和人口密度存在明顯的回歸關(guān)系。
表2 空間滯后回歸模型分析結(jié)果
分析結(jié)果顯示,COVID-19在華中地區(qū)的爆發(fā)因地理位置的不同而不同,疫情總體在空間上呈現(xiàn)聚集性,與傳染病客觀規(guī)律也是相符合的。傳染病具有傳染性和普遍性,鄰近區(qū)域間大多具有共同的危險(xiǎn)因素,使用空間權(quán)重矩陣表達(dá)空間相關(guān)性,使模型估計(jì)更加有效,同時估計(jì)空間相關(guān)性的大小也反映區(qū)域之間相互作用的程度,遷徙指數(shù)對疫情發(fā)展作用非常顯著,表明在疫情暴發(fā)的初始時期武漢人員的流動對疫情的擴(kuò)散起到了非常大的影響,但遷徙指數(shù)在解釋確診病例時在準(zhǔn)確性以及充分性上仍有所欠缺,今后還需要獲取更充分的人口流動數(shù)據(jù)來進(jìn)行分析,由此可知交通管制政策和人員隔離措施是防疫政策中很重要的一部分,今后隨著更多數(shù)據(jù)的豐富,嚴(yán)格的時空分析將會發(fā)揮重要作用。在防控措施的實(shí)施上,不同區(qū)域和階段的防控策略需要按照當(dāng)?shù)匾咔榫珳?zhǔn)施策。通過對疫情發(fā)展過程的回顧分析把握疫情發(fā)展的時空規(guī)律,爭取為疫情防控及其他傳染病防控工作提供借鑒。