濰坊醫(yī)學(xué)院(261053)
許小珊 孫 娜 杜彥春 李望晨 王素珍△ 石福艷△
【提 要】 目的 通過對傳統(tǒng)GM(1,1)模型優(yōu)化,并探討優(yōu)化后的GM(1,1)在乙肝發(fā)病預(yù)測中的應(yīng)用,為乙肝防治提供科學(xué)依據(jù)。方法 對傳統(tǒng)GM(1,1)建模的維數(shù)、背景值和初始值進行改進,通過比較不同模型對2007-2017年全國乙肝發(fā)病率數(shù)據(jù)擬合效果,選擇最優(yōu)模型外推預(yù)測2018和2019年乙肝發(fā)病率。結(jié)果 優(yōu)化組合模型擬合精度最優(yōu),可選其預(yù)測我國2018和2019年乙肝發(fā)病率。結(jié)論 優(yōu)化組合GM(1,1)擬合效果理想,預(yù)測精度高,可用于乙肝發(fā)病預(yù)測。
中國疾病預(yù)防控制中心法定傳染病報告顯示,病毒性乙型肝炎報告發(fā)病人數(shù)一直處于乙類傳染病首位。且有研究表明,HBV感染不僅是干細跑癌的重要危險因素,還與B細胞惡性腫瘤之間存在相關(guān)性[1],故做好乙肝預(yù)測預(yù)警工作意義重大。近年來,灰色GM(1,1)模型已被多次應(yīng)用于乙肝流行趨勢的預(yù)測[2-3]。但傳統(tǒng)模型預(yù)測精度往往不易達到要求,故本研究擬對傳統(tǒng)GM(1,1)模型的建模維數(shù)、背景值和初始值方面改進,盡量彌補傳統(tǒng)模型的缺陷,并采用構(gòu)建的優(yōu)化組合GM(1,1)模型預(yù)測我國2018-2019年乙肝發(fā)病率,為乙肝防治提供科學(xué)依據(jù)。
1.資料來源
本研究資料來源于中國疾病預(yù)防控制中心2007-2017年乙型肝炎發(fā)病資料及人口資料[4],詳見表 1。
表1 2007-2017年全國乙型肝炎發(fā)病率(1/10萬)
2.模型構(gòu)建方法
(1)構(gòu)建GM(1,1)的前提條件
(2)傳統(tǒng)GM(1,1)預(yù)測模型構(gòu)建步驟[5]
①已知原始非負數(shù)列Xt=X1,X2,…,Xn(t=1,2,…,n),Xt一次累加數(shù)列Yt和均值數(shù)列Zt:
Yt=∑Xt
(1)
Zt=(Yt+Yt-1)/2
(2)
②Yt的白化微分方程:dYt/dt+αYt=u
(3)
其中,α為發(fā)展系數(shù),負值反映發(fā)展趨勢是增長的,正值反映發(fā)展趨勢是衰減的;絕對值越大,則增長(或衰減)越快。u為灰色作用量,其大小反映因子作用的強弱,即數(shù)據(jù)變化的關(guān)系。根據(jù)最小二乘法估計:
(4)
(5)
(6)
(3)最優(yōu)建模維數(shù)
傳統(tǒng)GM(1,1)模型對建模維數(shù)不作要求,但不同維數(shù)的灰色模型,其預(yù)測值也不一定相同[6]。為了提高模型的預(yù)測精度,本研究以2007-2016年全國乙肝發(fā)病率數(shù)據(jù)為例,以時間序列最后一個數(shù)據(jù)為基礎(chǔ)分別建立4~10不同維數(shù)模型,通過比較各模型對2017年發(fā)病率的預(yù)測效果和模型的精確度,以選擇最優(yōu)的建模維數(shù)。
(4)背景值和初始值的改進
由傳統(tǒng)GM(1,1)模型構(gòu)建過程可見,背景值假定是由一次累加生成序列的緊鄰等權(quán)生成,即權(quán)重u=0.5,樊新海[7]等學(xué)者認為沒有理由證明u=0.5時模型的預(yù)測精度最高,故采用自動尋優(yōu)定權(quán)的方法選擇u值,即給定一接近于零的初始權(quán)u=0,計算在該權(quán)值下的模型預(yù)測精度,然后令權(quán)值有一微小的增量u=u+Δu,重復(fù)上述過程,直到u=1,即可得到不同權(quán)值下模型的預(yù)測精度,取預(yù)測精度最高時的權(quán)值作為最佳權(quán)值。另外,楊華龍[8]對模型的初始值也進行了改進,其認為數(shù)據(jù)序列中的每一個數(shù)據(jù)都帶有一定的隨機誤差,不能將第一個或最后一個原始數(shù)值作為初始值,具體推導(dǎo)過程參考相關(guān)文獻[8],此處只給出初始值C和時間響應(yīng)函數(shù):
(7)
(8)
其中α、u為待定系數(shù)。
原始數(shù)列Xt的擬合值:
(9)
3.模型檢驗
在GM(1,1)模型檢驗中,預(yù)測精度檢驗方法主要有殘差檢驗、關(guān)聯(lián)度檢驗、級比偏差檢驗和后驗差檢驗,本研究采用殘差檢驗和后驗差檢驗。
(1)殘差檢驗
(10)
MRE小于20%稱模型為合格模型,模型分類等級見表2。
(2)后驗差檢驗
后驗差檢驗是利用后驗差比值c與最小誤差幾率P來衡量預(yù)測模型的精度,
(11)
(12)
c=s2/s1
(13)
(14)
s1是衡量原始數(shù)據(jù)的離散程度,s2是衡量殘差的離散程度,故c值越小表示預(yù)測模型準確度越高。最小誤差幾率P越大,表示殘差與殘差平均值的差值小于0.6745s1的數(shù)值越多,故P值越大表示預(yù)測模型越好,模型檢驗等級見表2。
表2 模型檢驗等級表
1.GM(1,1)模型構(gòu)建的可行性分析
2.模型的構(gòu)建
(1)傳統(tǒng)GM(1,1)模型構(gòu)建
(2)最優(yōu)維數(shù)模型的構(gòu)建
從表3可知,并不是維數(shù)越高的模型擬合效果越好,5維模型的相對誤差為5.88%,其2017年發(fā)病率預(yù)測值與實際值最為接近,且模型的MRE和c值最小,模型精度最高,故選擇5維作為建模的最優(yōu)維數(shù)。
表3 不同維數(shù)GM(1,1)模型預(yù)測2017年乙肝發(fā)病率(1/10萬)
(3)背景值和初始值優(yōu)化模型的構(gòu)建
(4)優(yōu)化組合GM(1,1)模型構(gòu)建
3.模型精度檢驗結(jié)果
分別對以上構(gòu)建的4種模型進行精度檢驗,結(jié)果如表4所示,5維傳統(tǒng)模型的平均相對誤差(MRE)和后驗差比值c均小于10維傳統(tǒng)模型,最小誤差幾率P大于10維傳統(tǒng)模型,說明維數(shù)優(yōu)化可提高模型預(yù)測精度;對背景值和初始值改進后的模型平均相對誤差(MRE)和后驗差比值c均減小,說明此改進方法有效;將模型的維數(shù)、背景值和初始值同時改進組合得到優(yōu)化組合GM(1,1),其平均相對誤差(MRE)和后驗差比值c最小,模型精度最高,適合外推預(yù)測2018年和2019年乙肝發(fā)病率。
表4 不同模型精度檢驗比較
4.2018-2019年全國乙型肝炎發(fā)病率預(yù)測
運用以上構(gòu)建的4種模型分別擬合2007-2017年的乙肝發(fā)病率并外推預(yù)測2018-2019年的發(fā)病率,結(jié)果如表5所示。由表5可知,優(yōu)化組合GM(1,1)擬合2007-2017年發(fā)病率的擬合效果優(yōu)于其他模型,適合外推預(yù)測2018年和2019年乙肝發(fā)病率,預(yù)測值為71.13/10萬和71.55/10萬。
應(yīng)用數(shù)學(xué)模型預(yù)測傳染病疫情時,原始數(shù)據(jù)的質(zhì)量及其是否符合建模條件是影響預(yù)測結(jié)果的關(guān)鍵因素。本研究使用的2007-2017年全國乙肝年發(fā)病數(shù)據(jù)來自中國疾病預(yù)防控制中心法定傳染病呈報數(shù)據(jù),計算的發(fā)病率較為可靠。當(dāng)然,如果原始數(shù)列呈現(xiàn)線性分布特點時,可參考構(gòu)建線性回歸模型,合理有效的預(yù)測模型取決于實際資料分析和模型方法檢驗[9]。本研究經(jīng)過對資料分析后,認為其滿足構(gòu)建灰色模型的前提條件,并且最終模型預(yù)測精度較高。通過4種模型對乙肝發(fā)病率的擬合發(fā)現(xiàn),傳統(tǒng)模型、維數(shù)優(yōu)化模型、背景值和初始值優(yōu)化模型的發(fā)展系數(shù)均大于0,即預(yù)測發(fā)病趨勢是衰減的,但優(yōu)化組合模型發(fā)展系數(shù)小于0,預(yù)測發(fā)病趨勢是上升的,這可能與2017年發(fā)病率上升有關(guān),說明優(yōu)化組合模型能更好地利用新近信息,比傳統(tǒng)模型和單一改進模型更具優(yōu)勢。從表5中發(fā)現(xiàn),雖然優(yōu)化組合模型對個別年份(2016年)發(fā)病率擬合效果不如傳統(tǒng)模型,但其總體的預(yù)測精度遠遠高于傳統(tǒng)模型。同時,考慮到GM(1,1)模型穩(wěn)定性問題,根據(jù)相關(guān)理論[10],當(dāng)發(fā)展系數(shù)很小時模型的穩(wěn)定性較好,此優(yōu)化模型,滿足該條件,故可選其預(yù)測2018-2019年全國乙肝發(fā)病率。
表5 不同模型對乙肝發(fā)病率(1/10萬)的擬合和預(yù)測
由2007-2017年全國乙肝發(fā)病率資料可以看出,發(fā)病率總體呈下降趨勢,其中2010年和2013年下降幅度較大,這可能與人群的健康預(yù)防意識提高有關(guān),也與人群乙肝疫苗接種率增加有關(guān),但不難發(fā)現(xiàn),近幾年發(fā)病率呈上下波動趨勢,其中最近的年份(2017年)上升幅度較大,這也為優(yōu)化組合模型預(yù)測2018-2019年發(fā)病率呈上升趨勢作出合理解釋,雖然預(yù)測模型的發(fā)展系數(shù)較小,但也應(yīng)引起有關(guān)部門的重視,探究其發(fā)病率上升的原因,對乙肝患者做好治療管理的同時,還要加強易感人群的防護工作,提高疫苗的接種率。通過開展一系列乙型肝炎的綜合干預(yù)措施,控制乙肝的傳播和流行,降低發(fā)病率,使乙肝得到有效控制。
綜上所述,本研究構(gòu)建的優(yōu)化GM(1,1)模型可用于乙肝的發(fā)病率預(yù)測研究中。但由于本研究所用的模型具有建模數(shù)據(jù)少、無需假定數(shù)據(jù)服從某種特定的分布規(guī)律的特點[11],影響因素較多,因此該模型的預(yù)測精度有待進一步提高。同時,模型預(yù)測穩(wěn)定性問題也一直是研究者關(guān)心的問題。在后期時間及經(jīng)費允許的前提下,可根據(jù)已有的對穩(wěn)定性理論探討的基礎(chǔ)[12],將模型的精度優(yōu)化方法與穩(wěn)定性優(yōu)化方法相結(jié)合, 對其進行更深入的探索,進一步提升GM(1,1)模型的適用價值。