新疆大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院(830046) 胡 興 胡錫健
新疆H1N1甲型流感疫情預(yù)測(cè)模型的比較研究
新疆大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院(830046) 胡 興 胡錫健
本文針對(duì)2009年9月6日至11月17日新疆的甲流病例數(shù)據(jù),用多種統(tǒng)計(jì)方法建立了數(shù)學(xué)模型,通過(guò)對(duì)幾種方法的比較以期得到理想的預(yù)測(cè)模型,數(shù)據(jù)來(lái)源于政府官方網(wǎng)站。
反映甲流疫情的指標(biāo)有每日新增病例數(shù)、累積病例數(shù)、病死率、累積疑似病例數(shù)等。
新疆2009年9月6日至11月17日甲流累積病例數(shù)與每日新增病例數(shù)的圖像,如圖1,2所示。
圖1 新疆HIV1甲型流感累計(jì)病例數(shù)
圖2 新疆HIV1甲型流感每日新增病例數(shù)
甲流一般為三個(gè)階段:發(fā)展期,抑制期和衰退期。在發(fā)展期時(shí),由于疾病產(chǎn)生初期醫(yī)療手段還不能有效的控制疫情,所以累積患病人數(shù)會(huì)持續(xù)走高且每日新增發(fā)病人數(shù)也逐天上升;在抑制期,由于醫(yī)療手段已相對(duì)成熟,雖然累積人數(shù)還在上升,但是每日新增患病人數(shù)已經(jīng)開(kāi)始逐漸下降,疫情已經(jīng)得到控制;在衰退期時(shí),每日新增患病人數(shù)基本為零,這時(shí)累積患病人數(shù)也開(kāi)始逐漸下降直至降為零。從圖1,2可以看出,新疆累積患病人數(shù)還在持續(xù)走高,而每日新增患病人數(shù)已經(jīng)開(kāi)始明顯下降,故可以認(rèn)為新疆的疫情已經(jīng)基本處在抑制期。
從累積病例數(shù)據(jù)的時(shí)序圖上可以看出,累積病例數(shù)據(jù)可能服從指數(shù)曲線(xiàn)模型或S曲線(xiàn)模型。下面我們用指數(shù)曲線(xiàn)模型,S曲線(xiàn)模型及時(shí)間序列中的ARMA(p,q)模型來(lái)分別建立預(yù)測(cè)模型,對(duì)這幾種方法進(jìn)行比較后得出最佳的預(yù)測(cè)方法。
(1)指數(shù)曲線(xiàn)模型
指數(shù)曲線(xiàn)預(yù)測(cè)模型如下:
其中,a,b為待定參數(shù)。計(jì)算得 yt=28.07e0.065t,擬合度為0.985。擬合曲線(xiàn)見(jiàn)圖3。
模型的擬合優(yōu)度,模型的擬合圖都很好,所以用指數(shù)模型來(lái)預(yù)測(cè)現(xiàn)階段的疫情發(fā)展其結(jié)果比較好。
圖3 甲流積累病例數(shù)據(jù)曲線(xiàn)擬合圖
(2)S曲線(xiàn)模型
S曲線(xiàn)預(yù)測(cè)模型如下:
其中,a,b為待定參數(shù)。計(jì)算得
回歸模型的系數(shù)為a=0.006,b=0.068,但是擬合優(yōu)度僅為0.201,用S曲線(xiàn)來(lái)預(yù)測(cè)疫情的發(fā)展其結(jié)果并不理想。
(3)ARMA(p,q)模型
由自回歸和移動(dòng)平均兩部分共同構(gòu)成的隨機(jī)過(guò)程稱(chēng)為自回歸移動(dòng)平均過(guò)程,即為ARMA(p,q)。其中p,q分別表示自回歸和移動(dòng)平均部分的最大階數(shù)。
利用Box-Jenkins建模思想來(lái)對(duì)數(shù)據(jù)進(jìn)行建模,可分為四個(gè)步驟:
①平穩(wěn)性檢驗(yàn)
使用EViews軟件對(duì)原數(shù)據(jù)進(jìn)行ADF檢驗(yàn),檢驗(yàn)結(jié)果顯示,原序列以較大的概率(P=0.9994)接受原假設(shè),即存在單位根的結(jié)論。將原序列做1階差分,然后對(duì)差分后的序列進(jìn)行ADF檢驗(yàn),檢驗(yàn)結(jié)果顯示,差分后的序列在0.01的檢驗(yàn)水平下拒絕原假設(shè),接受不存在單位根的結(jié)論,因此可以確定原序列是經(jīng)1階差分后的序列是一個(gè)平穩(wěn)序列。
②確定ARMA模型的階數(shù)p和q
我們對(duì)一階差分后的序列采用AIC準(zhǔn)則來(lái)確定模型的階。取T/10,ln(T)分別作為p,q的滯后上限,其中T為樣本容量。由于原序列的樣本量為73,故差分后的樣本容量T=72。p=1,2,3,4,5,6,7;q=1,2,3,4。使用 EViews 軟件計(jì)算得到當(dāng)p=7,q=2時(shí)模型的AIC值最小,為9.24。對(duì)差分后的序列進(jìn)行ARMA(7,2)的模型參數(shù)估計(jì),并檢驗(yàn)參數(shù)的統(tǒng)計(jì)學(xué)意義。
③估計(jì)檢驗(yàn)?zāi)P臀恢脜?shù)
經(jīng)EViews軟件計(jì)算得到回歸系數(shù)和各t-統(tǒng)計(jì)量,經(jīng)檢驗(yàn)均有統(tǒng)計(jì)學(xué)意義,擬合度達(dá)到了0.83。
④進(jìn)行診斷分析
回歸方程如下:
把上面得到的回歸方程轉(zhuǎn)換成原序列的形式:
對(duì)殘差序列進(jìn)行序列相關(guān)性檢驗(yàn)考察模型本身的合理性,結(jié)果顯示殘差不存在序列相關(guān)。預(yù)測(cè)結(jié)果與原序列的比較結(jié)果如圖4。
圖4 甲流累積病例預(yù)測(cè)結(jié)果與原序列的比較
通過(guò)對(duì)以上三個(gè)模型的建立,可以看出在現(xiàn)階段使用指數(shù)模型和ARMA(p,q)模型均能取得不錯(cuò)的預(yù)測(cè)效果,可以對(duì)現(xiàn)階段的疫情發(fā)展做出較為準(zhǔn)確的預(yù)測(cè)。
1.張劍湖,葉鋒.SARS的傳播預(yù)測(cè)模型研究,中國(guó)系統(tǒng)工程學(xué)會(huì)全面建設(shè)小康社會(huì)和系統(tǒng)過(guò)程會(huì)議論文集(母體文獻(xiàn)),2004:715-720.
2.王建鋒.SARS流行預(yù)測(cè)分析,中國(guó)工程科學(xué),2003,5(8):23-28.
3.Development of mathematical models(Logistic,Gompertz and Richards models)describing the grow th pattern of Pseudomonas putida(NICM 2174),Bioprocess Engineering,2000(23):607-612.