楊麗娟 段 禹 張燕杰 黃曉磊 范引光 潘貴霞 王 靜
安徽醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(230032)
動(dòng)態(tài)因子模型在安徽省乙類(lèi)傳染病發(fā)病情況分析中的應(yīng)用*
楊麗娟 段 禹 張燕杰 黃曉磊 范引光 潘貴霞 王 靜△
安徽醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(230032)
目的采用動(dòng)態(tài)因子模型分析安徽省近11年常見(jiàn)乙類(lèi)傳染病發(fā)病率,為傳染病的防控工作提供參考。方法用Stata 11.0軟件基于安徽省2004年1月到2014年12月乙類(lèi)傳染病的發(fā)病率建立動(dòng)態(tài)因子模型,通過(guò)提取的共同因子來(lái)了解傳染病發(fā)病率的動(dòng)態(tài)趨勢(shì)。結(jié)果2004-2014年安徽省發(fā)病率最高的5種乙類(lèi)傳染病依次是肺結(jié)核、乙肝、痢疾、瘧疾和梅毒,其年均發(fā)病率(/10萬(wàn))分別為73.14,53.79,21.42,16.33和15.25。消化道傳染病、呼吸道傳染病和蟲(chóng)媒傳染病的發(fā)病率總體呈下降趨勢(shì),模型中消化道傳染病共同因子一階和二階滯后參數(shù)為1.620(P<0.001)和-0.882(P<0.001),呼吸道傳染病共同因子一階和二階滯后參數(shù)為1.242(P<0.001)和-0.494(P<0.001),蟲(chóng)媒傳染病共同因子一階滯后參數(shù)為0.881(P<0.001)。經(jīng)體液傳播乙類(lèi)傳染病發(fā)病波動(dòng)較大且呈上升趨勢(shì),其共同因子一階和二階滯后參數(shù)為-1.081(P<0.001)和-0.440(P=0.008)。結(jié)論應(yīng)重點(diǎn)加強(qiáng)對(duì)經(jīng)體液傳播乙類(lèi)傳染病的防控力度,動(dòng)態(tài)因子模型可用于乙類(lèi)傳染病的綜合分析。
乙類(lèi)傳染病 時(shí)間序列 動(dòng)態(tài)因子模型
乙類(lèi)傳染病從2004年開(kāi)始網(wǎng)絡(luò)直報(bào),病例較多且對(duì)人群健康危害較重大[1]。了解認(rèn)識(shí)傳染病的發(fā)病水平和流行規(guī)律對(duì)傳染病防控工作有重要意義。目前已有多種動(dòng)態(tài)分析傳染病資料的方法[2-3],但一般都是只分析某一種疾病,而不能同時(shí)對(duì)多種疾病進(jìn)行綜合分析。由于某些原因,如相同傳播途徑,不同傳染病的發(fā)生可能存在一定的共性。若能觀測(cè)到這種共性便可從總體上了解某一類(lèi)傳染病發(fā)病和流行規(guī)律,進(jìn)而為某一類(lèi)傳染病的防控提供思路。動(dòng)態(tài)因子模型(dynamic factor model,DFM)的思想是從若干變量中提取潛在、不可觀測(cè)的共同趨勢(shì),并利用這個(gè)共同趨勢(shì),對(duì)變量進(jìn)行分析、預(yù)測(cè)等。DFM因其靈活性和在處理高維數(shù)據(jù)時(shí)的明顯優(yōu)勢(shì)近年來(lái)逐漸受到更多學(xué)者的關(guān)注,DFM已被廣泛應(yīng)用在宏觀經(jīng)濟(jì)和管理領(lǐng)域的評(píng)估、預(yù)測(cè)等方面廣泛應(yīng)用[4]。本次研究采用DFM分析對(duì)安徽省近十一年的常見(jiàn)乙類(lèi)傳染病的總體發(fā)病情況進(jìn)行研究,并觀察其動(dòng)態(tài)變化情況,為傳染病的防控工作提供參考,同時(shí)嘗試DFM這種分析方法在醫(yī)學(xué)研究領(lǐng)域中的應(yīng)用。
DFM是一種基于因子模型提出的,適用于分析多組時(shí)間序列分析的統(tǒng)計(jì)方法[5-6]。以本次研究為例,每種疾病不同時(shí)期發(fā)病率構(gòu)成都是一個(gè)時(shí)間序列,DFM將每個(gè)時(shí)間序列的變化看作由全部時(shí)間序列的共同趨勢(shì)部分和每個(gè)時(shí)間序列的特殊部分組成,共同部分用幾個(gè)不可觀測(cè)共同因子ft的滯后多項(xiàng)式表示,特殊部分用相互獨(dú)立的特殊因子ut表示,其形式可表述如下:
yt=Pft+Qxt+ut
(1)
ft=Rwt+A1ft-1+A2ft-2+…+At-pft-p+vt
(2)
ut=C1ut-1+C1ut-2+…+Ct-qut-q+εt
(3)
其中,yt是通過(guò)觀測(cè)得到的n個(gè)發(fā)病率時(shí)間序列;ft是共同因子,即這n個(gè)時(shí)間序列的共同趨勢(shì),P是因子載荷矩陣;ut是每個(gè)時(shí)間序列除去共同趨勢(shì)后的特殊因子;ft和ut分別有p和q階自回歸結(jié)構(gòu),自回歸參數(shù)矩陣分別是Ai和Ci,νt和εt是自回歸方程的擾動(dòng)向量;xt和wt是可能納入方程的外生變量,Qi和Ri是外生變量參數(shù)矩陣。以發(fā)病率時(shí)間序列為因變量建模可得到模型中各參數(shù),進(jìn)而可得到不可觀測(cè)的共同因子。
建模時(shí)需確定因子個(gè)數(shù),目前確定因子個(gè)數(shù)的方法尚無(wú)權(quán)威性定論[4],研究者常根據(jù)所選數(shù)據(jù)特征取合適因子個(gè)數(shù)。因子自回歸階數(shù)可根據(jù)模型似然函數(shù)值最大化(MLR),赤池信息量準(zhǔn)則(AIC)和貝葉斯信息準(zhǔn)則(BIC)等來(lái)選擇。
1.資料與方法
(1)數(shù)據(jù)與變量選取
收集2004-2014年安徽乙類(lèi)傳染病月發(fā)病數(shù)并從國(guó)家統(tǒng)計(jì)局獲取安徽各年平均人口數(shù),計(jì)算各月發(fā)病率(/10萬(wàn))。乙類(lèi)傳染病按傳播途徑可分四類(lèi),我們分別對(duì)這四類(lèi)傳染病進(jìn)行DFM分析。實(shí)際操作中有些疾病發(fā)病率被納入模型時(shí)會(huì)存在變量不顯著,海塞矩陣非半負(fù)定等問(wèn)題,所以需嘗試對(duì)納入的變量進(jìn)行調(diào)整以使模型能運(yùn)行。在綜合考慮了疾病發(fā)病率和模型自身等多方面因素后,擬在每一類(lèi)中選取3到4種疾病的發(fā)病率作為觀測(cè)變量。
(2)統(tǒng)計(jì)分析方法
本研究采用Stata 11.0對(duì)數(shù)據(jù)進(jìn)行分析。DFM要求觀測(cè)序列有平穩(wěn)性,故用單位根檢驗(yàn)(augmented dickey-fuller test,ADF)判斷序列平穩(wěn)性并用差分來(lái)調(diào)整非平穩(wěn)序列。為估計(jì)出因子,所有序列做標(biāo)準(zhǔn)化處理。參照相關(guān)方法[7]對(duì)所選的3或4個(gè)觀測(cè)變量提取一個(gè)動(dòng)態(tài)因子且該因子有一階或二階自回歸過(guò)程,無(wú)內(nèi)生變量被納入方程,擾動(dòng)項(xiàng)自回歸階數(shù)q=0。
1.常見(jiàn)乙類(lèi)傳染病發(fā)病率
本次研究,消化道傳染病選取痢疾、戊肝和傷寒發(fā)病率作為觀察變量,呼吸道傳染病以肺結(jié)核、麻疹、流腦和百日咳發(fā)病率為觀察變量,經(jīng)體液傳播疾病選取乙肝、梅毒、淋病和HIV感染發(fā)病率,經(jīng)蟲(chóng)媒傳播傳染病選瘧疾、乙型腦炎、血吸蟲(chóng)病和狂犬病發(fā)病率。各疾病發(fā)病率(/10萬(wàn)),單位根檢驗(yàn)及相關(guān)性檢驗(yàn)結(jié)果見(jiàn)表1。
表1 四類(lèi)傳染病發(fā)病率和單位根檢驗(yàn)以及相關(guān)性檢驗(yàn)
安徽省近十一年發(fā)病率較高的乙類(lèi)傳染病有痢疾、肺結(jié)核、乙肝、梅毒和瘧疾??袢“l(fā)病率最低。由Kaiser-Meyer-Olkin(KMO)值和Bartlett球形檢驗(yàn)結(jié)果知,同類(lèi)傳染病之間有較好相關(guān)性,適合做DFM分析。梅毒、淋病和HIV感染的發(fā)病率時(shí)間序列是非平穩(wěn)的。
2.消化道傳染病
乙類(lèi)消化道傳染病有4種,選取痢疾、戊肝和傷寒為觀察變量,動(dòng)態(tài)因子數(shù)為1,自回歸階數(shù)為2,參數(shù)估計(jì)和檢驗(yàn)結(jié)果及共同因子的變化見(jiàn)表2和圖1。
圖1 消化道傳染病動(dòng)態(tài)因子變化趨勢(shì)
表2中各種疾病所對(duì)應(yīng)參數(shù)即為式1中參數(shù)P的矩陣,L1和L2即為式2中A1和A2估計(jì)值。圖1中,共同因子波動(dòng)較規(guī)律,其峰值在2005年之后逐漸減小,到2008年開(kāi)始上升,在2012年之后又逐漸下降。
3.經(jīng)呼吸道傳播疾病
乙類(lèi)呼吸道傳染病共8種,以其中4種為觀察變量,參數(shù)估計(jì)和檢驗(yàn)結(jié)果及共同因子的變化情況見(jiàn)表2和圖2。呼吸道傳染病共同因子在2005年,2008年和2009年分別有一次大幅度上升,且波動(dòng)的幅度逐漸減小,2010年之后保持平穩(wěn)狀態(tài),且大致處于零水平線(xiàn)以下。
圖2 呼吸道傳染病動(dòng)態(tài)因子變化趨勢(shì)
圖3 經(jīng)體液傳播疾病動(dòng)態(tài)因子變化趨勢(shì)
圖4 經(jīng)蟲(chóng)媒傳播疾病動(dòng)態(tài)因子變化趨勢(shì)
4.經(jīng)體液傳播疾病
該類(lèi)傳染病共4種,所有觀測(cè)序列經(jīng)一階差分處理,參數(shù)估計(jì)結(jié)果及共同因子的變化見(jiàn)表2和圖3。經(jīng)體液傳播疾病共同因子波動(dòng)頻率較大,波動(dòng)幅度相對(duì)較小,總體上保持相對(duì)平穩(wěn)狀態(tài)。2013年左右波動(dòng)幅度達(dá)到最大。從圖中不能看出共同因子具有明顯規(guī)律性。
5.經(jīng)蟲(chóng)媒傳播疾病
經(jīng)蟲(chóng)媒傳播乙類(lèi)傳染病共10種,以其中四種為觀察變量,參數(shù)估計(jì)和檢驗(yàn)結(jié)果及共同因子變化見(jiàn)表2和圖4。2008年之前共同因子波動(dòng)幅度較大,2008年后減小且總體處于零水平線(xiàn)以下,2014年因子波動(dòng)有增加??傮w上看,動(dòng)態(tài)因子呈下降趨勢(shì)。
表2 四類(lèi)傳染病的動(dòng)態(tài)因子模型參數(shù)估計(jì)及檢驗(yàn)結(jié)果
*:ft,共同因子;L1,一階滯后;L2,二階滯后
從圖1共同因子趨勢(shì)看,消化道傳染病發(fā)病有明顯季節(jié)性,與其他研究相符[8],總體發(fā)病率有下降,這可能與經(jīng)濟(jì)發(fā)展和飲用水管理等有關(guān)[9]。加強(qiáng)5到8月間疾病的防治,尤其在4月份左右發(fā)病率迅速上升前采取措施,對(duì)降低發(fā)病有重要意義。在2005,2008和2009年呼吸道傳染病發(fā)病率均有大幅上升,2010年后較平穩(wěn)且處于歷年平均發(fā)病率以下,2014年后有增大趨勢(shì),應(yīng)注意加強(qiáng)防控。發(fā)病率幾次升高可能與麻疹等局部暴發(fā)有關(guān)[10],也可能是由于手足口病及流感暴發(fā)[11]增加了呼吸道疾病的檢測(cè)和報(bào)告率。平穩(wěn)性檢驗(yàn)時(shí)只有體液傳播疾病不滿(mǎn)足平穩(wěn)性要求,原始數(shù)據(jù)差分處理過(guò),共同因子趨勢(shì)不能直接代表發(fā)病率變化,但其波動(dòng)情況說(shuō)明在消除原有趨勢(shì)后發(fā)病率總體波動(dòng)較不穩(wěn)定,防控措施需進(jìn)一步加強(qiáng)。2008年之前蟲(chóng)媒傳染病發(fā)病率波動(dòng)較大,2008年后較平穩(wěn)且多處于歷年平均發(fā)病率以下。這可能與常見(jiàn)疾病的防控[12]及疫苗的使用等有關(guān)。蟲(chóng)媒傳染病發(fā)病常有季節(jié)性,這種波動(dòng)可能也與發(fā)病季節(jié)性有關(guān)[12]。
DFM與分析某類(lèi)或單種疾病發(fā)病趨勢(shì)的傳統(tǒng)方法相比[1-3,12],考慮到相同類(lèi)型疾病的相關(guān)性,并能充分提取每一種疾病發(fā)病率變化信息,從總體層面對(duì)多種疾病同時(shí)分析,所得的總體趨勢(shì)不受單種疾病發(fā)病率絕對(duì)值大小影響,結(jié)果更為可信。DFM在處理高維時(shí)間序列方面有明顯優(yōu)勢(shì),可用于指數(shù)構(gòu)建[13],變量預(yù)測(cè)[14]及結(jié)構(gòu)分析[15],其預(yù)測(cè)效果要優(yōu)于VAR和ARIMA模型,以后的研究可參照經(jīng)濟(jì)學(xué)領(lǐng)域,用DFM構(gòu)建指數(shù)以從總體評(píng)價(jià)及預(yù)測(cè)疾病流行和防控效果等。DFM也有不足,主要是共同因子含義不明確,由此擴(kuò)展出的分層DFM在一定程度上解決了這一問(wèn)題。DFM理論尚處于發(fā)展期,由其拓展出的許多理論方法也越來(lái)越受關(guān)注[16-18]。由于模型本身特點(diǎn)和軟件限制,本次研究不能把所有乙類(lèi)傳染病都納入分析,只能選幾種疾病代表一類(lèi)疾病分析。盡管如此,本次研究?jī)?nèi)容和結(jié)果可對(duì)傳染病的分析方法以及預(yù)防和控制措施提供一定參考價(jià)值。
[1] 李欣,裴姣,高博.我國(guó)6年間法定甲乙類(lèi)傳染病流行趨勢(shì)分析.現(xiàn)代預(yù)防醫(yī)學(xué),2009,36(1):25-27.
[2] 王伶,姚文清.利用時(shí)間序列模型分析預(yù)測(cè)遼寧手足口病疫情趨勢(shì).中國(guó)衛(wèi)生統(tǒng)計(jì),2016,33(5):847-849.
[3] 孟凡東,吳迪,隋承光.2004-2015年中國(guó)狂犬病發(fā)病數(shù)據(jù)ARIMA乘積季節(jié)模型的建立及預(yù)測(cè).中國(guó)衛(wèi)生統(tǒng)計(jì),2016,33(3):389-391+395.
[4] 高華川,張曉垌.動(dòng)態(tài)因子模型及其應(yīng)用研究綜述.統(tǒng)計(jì)研究,2015,32(12):101-109.
[5] Geweke J.The Dynamic Factor Analysis of Economic Time Series.Latent Variables in Socio-Economic Models.Netherlands.Springer Netherlands,1982,317-337.
[6] Breitung J,Eickmeier S.Dynamic factor models.AStA Advances in Statistical Analysis,2006,90(1):27-42.
[7] 沈磊.基于動(dòng)態(tài)因子模型構(gòu)建的中國(guó)廣義價(jià)格指數(shù)的估計(jì).安徽:安徽財(cái)經(jīng)大學(xué),2015.
[8] 魏珊.我國(guó)乙類(lèi)法定報(bào)告?zhèn)魅静〉陌l(fā)病趨勢(shì)和季節(jié)性研究.上海:復(fù)旦大學(xué),2013.
[9] Teschke K,Bellack N,Shen H,et al.Water and sewage systems,socio-demographics,and duration of residence associated with endemic intestinal infection diseases:A cohort study.BMC Public Health,2011,10(1):767-780.
[10]Zhang Z,Zhao Y,Yang L,et al.Measles Outbreak among Previously Immunized Adult Healthcare Workers,China,2015.Can J Infect Dis Med Microbiol.2016,2016:1742530.
[11]葉冬青.甲型H1N1流感的流行與應(yīng)對(duì).中華疾病控制雜志,2009,13(3):215-218.
[12]樊雯婧,陸群,仰鳳桃,等.2005-2009年安徽省合肥市瘧疾發(fā)病趨勢(shì)分析.中華疾病控制,2013,17(5):410-413.
[13]Kim CJ,Nelson CR.Business Cycle Turning Points,a New Coincident Index,and Tests of Duration Dependence Based on a Dynamic Factor Model with Regime Switching.The Review of Economics and Statistics,2006,80(2):188-201.
[14]Eickmeier S,Ziegler C.How successful are dynamic factor models at forecasting output and inflation? A meta-analytic approach.Journal of Forecasting,2008,27(3):237-265.
[15]Forni M,Gambetti L.The dynamic effects of monetary policy:A structural factor model approach.Journal of Monetary Economics,2010,57(2):203-216.
[16]朱滿(mǎn)洲.動(dòng)態(tài)因子模型的理論和應(yīng)用研究.湖北:華中科技大學(xué),2013.
[17]Forni M,Hallin M,Lippi M,et al.The Generalized Factor Model:Identification And Estimation.Review of Economics and Statistics,2000,82(4):540-554.
[18]Koop G,Potter S.Forecasting in dynamic factor models using Bayesian model averaging.The Econometrics Journal,2004,7(2):550-565.
ApplicationofDynamicFactorModelintheIncidencesofBCategoryInfectiousDiseasesinAnhuiProvince
Yang Lijuan,Duan Yu,Zhang Yanjie,et al
(DepartmentofEpidemiologyandBiostatistics,SchoolofPublicHealth,AnhuiMedicalUniversity(230032),Hefei)
ObjectiveWe aimed to analysis the incidence of B category infectious diseases in last eleven years in Anhui province based on dynamic factor model,and provide references for control of B category infectious diseases.MethodsWe set up dynamic factor models with Stata 11.0 software based on incidences of B category infectious diseases in Anhui province from 2004 to 2014 and extracted a general factor to analysis the dynamic trend of incidence.ResultsPulmonary tuberculosis,hepatitis B,dysentery,malaria and syphilis were the top five B category infectious diseases with incidences of 73.14,53.79,21.42,16.33 and 15.25 per 100000 persons in Anhui province from 2004 to 2014.Infectious diseases transmitted through digestive tract,respiratory tract and insect were on the decline,parameters of lag dynamic factor in the models were 1.620(P<0.001) and -0.882(P<0.001),1.242(P<0.001) and -0.494(P<0.001),and 0.881(P<0.001) respectively.Humoraldiseases were on the rise in general,parameter of lag dynamic factor in the model were -1.081(P<0.001)and-0.440(P=0.008).ConclusionTo prevent and control B category infectious diseases,more attention should be humoral diseases.Dynamic factor model can be used in the comprehensive analysis of B category infectious diseases.
B category infectious diseases;Time series;Dynamic factor model
國(guó)家自然科學(xué)基金(11526034);安徽省重大自身免疫性疾病重點(diǎn)實(shí)驗(yàn)室;2016年安徽省質(zhì)量工程教學(xué)研究重大項(xiàng)目(2016jyxm0378)
△通信作者:王靜,E-mail:jwang2006@126.com
郭海強(qiáng))