龐艷蕾 張惠蘭 李向云△ 趙 晶
灰色模型GM(1,1)和ARIMA在擬合全國嬰兒、5歲以下兒童死亡率中的應(yīng)用
龐艷蕾1張惠蘭2李向云1△趙 晶1
目的 比較分析灰色模型GM(1,1)、ARIMA模型在全國嬰兒死亡率(IMR)和5歲以下兒童死亡率(U5MR)擬合過程中的適用性,為兒童保健工作提供科學依據(jù)。方法 以1991-2012年全國IMR、U5MR為原始資料,統(tǒng)一運用SAS分析軟件。采用灰色模型GM(1,1)和ARIMA模型進行擬合分析,分別計算各模型擬合MPE、MAPE值,比較各模型的適用性和精確性。結(jié)果 嬰兒死亡率GM(1,1)和ARIMA模型MPE分別為0.32、1.18,MAPE分別為3.09%、5.34%;5歲以下兒童死亡率GM(1,1)和ARIMA模型MPE分別為0.57、0.89,MAPE分別為3.11%、4.33%。結(jié)論 GM(1,1)模型對兒童保健指標擬合效果優(yōu)于ARIMA模型,模型擬合要充分考慮數(shù)據(jù)特征。
GM(1,1) ARIMA 嬰兒死亡率 5歲以下兒童死亡率 擬合
2000年9月世界各國領(lǐng)導(dǎo)人在聯(lián)合國千年首腦會議上通過“聯(lián)合國千年宣言”[1]并制定了八項千年發(fā)展目標(MDGs)。其中一項就關(guān)系到兒童保健方面,要求到2015年在1990年的基礎(chǔ)上使五歲以下兒童的死亡率降低三分之二??刂坪徒档蛬雰核劳雎?IMR)和5歲以下兒童死亡率(U5MR)既是改善和增進人民福利的內(nèi)在要求,又是我國人口與社會發(fā)展的重要內(nèi)容[2]。國內(nèi)大多數(shù)學者運用單一模型對兒童死亡率進行擬合分析,且缺乏橫向比較。本文旨在運用模型GM(1,1)和ARIMA對IMR和U5MR擬合分析,比較兩模型在擬合兒童死亡率中的適用性和精確性。
1.資料來源
資料來源于中國國家衛(wèi)生和計劃生育委員會衛(wèi)生信息中心《2013中國衛(wèi)生統(tǒng)計年鑒》和《2013年中國衛(wèi)生統(tǒng)計提要》,真實可靠。利用1991-2012年全國嬰兒死亡率(IMR)及5歲以下兒童死亡率(U5MR),作為建模分析的原始數(shù)據(jù)。
2.模型原理
(1) 灰色模型GM(1,1)
②模型檢驗 根據(jù)小誤差概率(P值)和后驗差檢驗計算方差比(C值)檢驗?zāi)P偷木_性,詳見表1。
* 以C值或P值對應(yīng)的最優(yōu)精度等級作為模型精度等級
(2) 模型ARIMA
②模型檢驗 純隨機性檢驗(白噪聲檢驗),對模型檢驗時,殘差序列為白噪聲序列則模型擬合較好,說明充分提取了數(shù)列信息。若殘差序列不是白噪聲序列要重新建模,直到殘差為白噪聲序列為止。
3.統(tǒng)計分析
兩種預(yù)測模型都通過SAS軟件編輯程序并分析。根據(jù)兩種模型擬合結(jié)果計算出與實際值誤差,以擬合誤差來判定模型擬合的優(yōu)劣性。
4.模型比較
各指標數(shù)據(jù)擬合后,以擬合值與真實值的差值作為誤差,然后計算各模型擬合預(yù)測平均相對誤差MPE和平均相對誤差絕對值MAPE。前者是將每個預(yù)測值的誤差以誤差的倍數(shù)放大,這樣單個誤差較大的預(yù)測值就可以使預(yù)測誤差的方差大幅增加,這更適合模型比較;與前者相比后者不存在正負相抵消的情況,所以應(yīng)用起來更優(yōu)越。因此,將MPE和MAPE結(jié)合起來共同作為模型評價標準。
1.擬合嬰兒死亡率
(2)建立ARIMA模型 利用全國1991-2012年IMR數(shù)據(jù),先進行白噪聲檢驗并結(jié)合序列ACF和PACF進行分析,結(jié)果序列為有很強的遞減趨勢的非白噪聲序列。然后對序列進行差分運算,2階差分后,表現(xiàn)為平穩(wěn)非白噪聲序列。觀察差分后序列ACF和PACF,并結(jié)合表2和擬合結(jié)果殘差白噪聲檢驗結(jié)果,最終選擇ARIMA(0,2,2)模型擬合,即2階差分2階移動平均模型:(1-Β)2χt=(1-0.72067Β+0.81441Β2)εt。模型殘差和參數(shù)檢驗均通過檢驗詳見表3,擬合結(jié)果詳見表4。
2.擬合5歲以下兒童死亡率
(2)建立ARIMA模型 同ARIMA建模原理步驟,經(jīng)過白噪聲檢驗、差分運算、擬合結(jié)果白噪聲檢驗以及AIC值和BIC值比較,最終選擇最優(yōu)ARIMA(0,2,1)模型,即2階差分1階移動平均模型:(1-B)χt=0.12478 + (1-B)εt。模型殘差白噪聲檢驗:延遲6階χ2值為10.68,P值為0.0582,延遲12階χ2=19.14,P=0.0587,P值均大于0.05,模型通過檢驗。模型參數(shù)顯著性檢驗:均值(常數(shù))t=2.96,P=0.0084,θ1檢驗t=6.42,P=0.00001,P值均小于0.05,參數(shù)通過檢驗。擬合結(jié)果詳見表4。
3.模型比較
根據(jù)各模型預(yù)測結(jié)果和擬合誤差,計算各模型擬合MPE、MAPE值。為使結(jié)果比較更有說服力現(xiàn)統(tǒng)一采用2005年以后擬合數(shù)據(jù)進行誤差分析。嬰兒死亡率GM(1,1)和ARIMA模型MPE分別為0.32、1.18,MAPE分別為3.09%、5.34%;5歲以下兒童死亡率GM(1,1)和ARIMA模型MPE分別為0.57、0.89,MAPE分別為3.11%、4.33%??梢姡珿M(1,1)模型在IMR和U5MR擬合方面優(yōu)于ARIMA。圖1、圖2直觀展現(xiàn)了兩模型在IMR和U5MR方面擬合效果。
GM(1,1)或ARIMA都適用于短期序列擬合,均曾被學者用在兒童死亡率的研究中[5-6],也有學者將兩者共同運用于疾病或入院人數(shù)預(yù)測的比較分析[7-8]。本次研究將兩模型同時用于IMR和U5MR擬合,在各模型均通過檢驗情況下,比較其精確性。兩種模型擬合均通過了模型檢驗,均可用于IMR和U5MR擬合,但GM(1,1)在IMR、U5MR的擬合時MPE、MAPE值均低于ARIMA模型。所以說在擬合兒童死亡率方面,GM(1,1)擬合效果優(yōu)于ARIMA。
GM(1,1)對樣本含量和概率分布沒有嚴格的要求,適應(yīng)性強,可廣泛應(yīng)用于農(nóng)業(yè)、工業(yè)、氣象、醫(yī)學等領(lǐng)域的預(yù)測[9],并允許較少數(shù)據(jù)預(yù)測,對影響因素不明確或結(jié)局不明朗的事件均可以展開預(yù)測[10]。而ARIMA對數(shù)據(jù)要求相對較高,需要相對較多的連續(xù)序列數(shù)據(jù),且過程相對GM(1,1)復(fù)雜。依據(jù)兩種模型的適用條件,數(shù)據(jù)無波動或波動較小的時間序列宜用GM模型、波動較大的時間序列宜用ARIMA模型[7]。當序列存在周期波動或季節(jié)波動時ARIMA更是首選。由原始數(shù)據(jù)可以看出,IMR、U5MR均表現(xiàn)很強的遞減趨勢,沒有很大逆向波動,因此原始數(shù)據(jù)特征和模型自身特點是選擇合適擬合模型的關(guān)鍵。
兒童死亡率受到多方面的影響,比如社會經(jīng)濟發(fā)展水平、衛(wèi)生資源的配置利用、以及家長經(jīng)濟狀況和文化程度等,并且各種因素對兒童死亡率影響程度、方式、途徑等都有各自的特點。模型擬合兒童死亡率只是單純從模型擬合角度探究模型擬合歷史數(shù)據(jù)的精確程度,數(shù)學模型主要是反映數(shù)據(jù)的規(guī)律性,不能完全反映各種非規(guī)律性的社會因素對預(yù)測數(shù)據(jù)的影響[11]。因此在擬合乃至預(yù)測過程中要慎重。
[1]聯(lián)合國千年宣言.A/55/L.2,http://www.un.org/chinese/ga/55/res/a55r2.htm.
[2]劉元元.2010年我國孕產(chǎn)婦、嬰兒及5歲以下兒童死亡率的統(tǒng)計預(yù)測研究.成都:四川大學,2005.
[3]徐國祥.統(tǒng)計預(yù)測和決策.第二版.上海:上海財經(jīng)大學出版社,2005:202-224.
[4]王燕.應(yīng)用時間序列分析.第二版.北京:中國人民大學出版社,2008.142-173.
[5]劉潔,曲波,郭海強,等.ARIMA模型在中國5歲以下兒童死亡率預(yù)測中應(yīng)用.中國公共衛(wèi)生,2011,27(2):237-238.
[6]李向云,劉曉冬,馬麗敏,等.GM (1,1)灰色模型在擬合我國嬰兒死亡率中的應(yīng)用.中國醫(yī)院統(tǒng)計,2009,16(1):33-35.
[7]金如鋒,邱宏,周霞,等.ARIMA模型和GM(1,1)模型預(yù)測全國3種腸道傳染病發(fā)病率.復(fù)旦學報(醫(yī)學版),2008,35(5):675-680.
[8]梁景星.GM(1,1) 灰色模型和ARIMA模型在我院季度入院人數(shù)預(yù)測中的比較分析.中衛(wèi)生統(tǒng)計,2014,31(1):107-109.
[9]許筱紅,金小林.GM(1,1)數(shù)學模型在瘧疾疫情預(yù)測中的應(yīng)用.中國寄生蟲病防治雜志,2005,18(3):178-179.
[10]楊婷,王玉貴,楊丹,等.基于灰色成分數(shù)據(jù)模型的醫(yī)療費用結(jié)構(gòu)變動趨勢預(yù)測研究.中國衛(wèi)生統(tǒng)計,2011,28(1):58-60.
[11]張冬艷,盧亦愚,馮燕,等.應(yīng)用灰色系統(tǒng)模型預(yù)測麻疹的流行時間.數(shù)理醫(yī)藥學雜志,2011,24(1):7-9.
(責任編輯:郭海強)
1.濰坊醫(yī)學院公共衛(wèi)生學院(261053)
2.山東省濰坊市奎文區(qū)婦幼保健院(261041)
△通信作者:李向云,E-mail:lixy@wfmc.edu.cn