彭乃馳, 黨 婷
(云南大學(xué) 旅游文化學(xué)院信科系,云南 麗江 674199)
?
基于三次指數(shù)平滑的云南學(xué)齡兒童人數(shù)預(yù)測(cè)研究
彭乃馳, 黨婷
(云南大學(xué) 旅游文化學(xué)院信科系,云南 麗江 674199)
摘要:構(gòu)建科學(xué)、準(zhǔn)確的學(xué)齡兒童人數(shù)預(yù)測(cè)模型,對(duì)合理規(guī)劃小學(xué)學(xué)校數(shù)量,制定小學(xué)教師招聘計(jì)劃,制定人口政策具有一定的參考價(jià)值。根據(jù)預(yù)測(cè)誤差平方和最小原則,利用Matlab循環(huán)語(yǔ)句命令編程,設(shè)定平滑系數(shù)α的一個(gè)精度,從0<α<1的所有值中選擇最優(yōu)α,研究發(fā)現(xiàn)利用該法建立的三次指數(shù)平滑模型在學(xué)齡兒童人數(shù)預(yù)測(cè)方面有較好的預(yù)測(cè)效果;在此基礎(chǔ)上利用馬爾科夫預(yù)測(cè)法,對(duì)三次指數(shù)平滑模型預(yù)測(cè)結(jié)果進(jìn)行修正,彌補(bǔ)了因隨機(jī)波動(dòng)性導(dǎo)致的預(yù)測(cè)誤差偏大的情形;通過(guò)對(duì)這兩個(gè)模型預(yù)測(cè)結(jié)果的對(duì)比分析,表明三次指數(shù)平滑-馬爾科夫模型的預(yù)測(cè)效果比單獨(dú)利用三次指數(shù)平滑模型的效果有較大改善。
關(guān)鍵詞:三次指數(shù)平滑;馬爾科夫模型;學(xué)齡兒童
此處研究的“學(xué)齡兒童”是指“小學(xué)學(xué)齡兒童”,即符合普及小學(xué)義務(wù)教育入學(xué)年齡階段的兒童。目前,學(xué)術(shù)界對(duì)學(xué)齡兒童的研究主要集中在安全、心理、教育、行為與失學(xué)等問(wèn)題上。在中國(guó)知網(wǎng)上以“主題”或“篇名”為“學(xué)齡兒童人數(shù)預(yù)測(cè)”進(jìn)行檢索,未能檢索到相關(guān)文獻(xiàn)。對(duì)學(xué)齡兒童人數(shù)的預(yù)測(cè)有著較重要的意義,一方面,準(zhǔn)確預(yù)測(cè)學(xué)齡兒童人數(shù)有利于合理規(guī)劃小學(xué)學(xué)校數(shù)量,制定合理的小學(xué)教師招聘計(jì)劃,從而既不造成社會(huì)資源的浪費(fèi),又能保證學(xué)齡兒童的入學(xué)。另一方面,如果學(xué)齡兒童人數(shù)少,則預(yù)示著將來(lái)可能存在高校招生難、人口老齡化等社會(huì)問(wèn)題,準(zhǔn)確預(yù)測(cè)學(xué)齡兒童人數(shù)可以對(duì)可能存在的社會(huì)問(wèn)題提前做出應(yīng)對(duì),對(duì)制訂人口政策提供參考。三次指數(shù)平滑模型在建筑事故預(yù)測(cè)與交通事故預(yù)測(cè)等方面有著廣泛的應(yīng)用,馬爾科夫模型也被應(yīng)用于煤自然發(fā)火與橋梁耐久性等問(wèn)題的預(yù)測(cè)[1-4]。文獻(xiàn)[5](2013)將一次指數(shù)平滑模型與馬爾科夫模型結(jié)合,運(yùn)用于巢湖水質(zhì)的預(yù)測(cè)。此處嘗試將三次指數(shù)平滑模型與馬爾科夫模型進(jìn)行結(jié)合,首先利用1992—2010年云南學(xué)齡兒童人數(shù)數(shù)據(jù),分別建立三次指數(shù)平滑模型與三次指數(shù)平滑-馬爾科夫模型;然后將兩模型分別應(yīng)用于2011—2013年云南學(xué)齡兒童人數(shù)的預(yù)測(cè),與真實(shí)值進(jìn)行比較,結(jié)果表明兩個(gè)模型對(duì)該問(wèn)題的預(yù)測(cè)都取得了較好的效果,且后者相較于前者在預(yù)測(cè)效果上有了明顯的改進(jìn);最后,利用1992—2013年云南學(xué)齡兒童人數(shù)數(shù)據(jù),再次建立基于三次指數(shù)平滑的馬爾科夫模型,預(yù)測(cè)了2014—2016年云南學(xué)齡兒童人數(shù)。
1馬爾科夫模型的建立
1.1三次指數(shù)平滑模型
三次指數(shù)平滑模型是一種用于短期內(nèi)預(yù)測(cè)非線性趨勢(shì)時(shí)間序列變化情況的模型。模型表達(dá)式如下:
(1)
(2)
(3)
1.2馬爾科夫預(yù)測(cè)
馬爾科夫模型是通過(guò)對(duì)事物不同狀態(tài)的初始概率與狀態(tài)之間的轉(zhuǎn)移概率的研究來(lái)預(yù)測(cè)事物未來(lái)狀態(tài)的一種數(shù)學(xué)方法[6]。馬爾科夫模型表達(dá)式為[7]
(4)
X(0)為初始狀態(tài)概率向量,X(k)為經(jīng)過(guò)k個(gè)時(shí)期后的狀態(tài)概率向量,P為一步狀態(tài)轉(zhuǎn)移概率矩陣。該模型的建立包含狀態(tài)劃分、狀態(tài)轉(zhuǎn)移概率矩陣的確定和預(yù)測(cè)3個(gè)過(guò)程。
1) 狀態(tài)劃分。利用三次指數(shù)平滑模型的預(yù)測(cè)結(jié)果計(jì)算相對(duì)誤差Δk,其中Δk的計(jì)算公式為Δk=(Yk-yk)/yk*100%。以相對(duì)誤差的最大范圍區(qū)間為基礎(chǔ),根據(jù)相對(duì)誤差的具體情況得到K個(gè)可能狀態(tài)?1,?2,…,?K,其中任一狀態(tài)可表示為?i=[?i1,?i2],狀態(tài)劃分具體情況見(jiàn)表2。
3) 預(yù)測(cè)。初始狀態(tài)概率向量X(0)及一步狀態(tài)轉(zhuǎn)移概率矩陣P確定后,根據(jù)公式(4)可得到經(jīng)過(guò)k個(gè)時(shí)期后的狀態(tài)概率向量X(k)。
記三次指數(shù)平滑模型由初始時(shí)刻經(jīng)過(guò)k個(gè)時(shí)期后的預(yù)測(cè)值為Y(k),根據(jù)狀態(tài)劃分情況,得到Y(jié)(k)的K個(gè)預(yù)測(cè)區(qū)間,任一預(yù)測(cè)區(qū)間可表示為
(5)
(6)
2實(shí)例分析
2.1數(shù)據(jù)收集
收集了1992—2013年云南省學(xué)齡兒童人數(shù)數(shù)據(jù),數(shù)據(jù)來(lái)源于《云南統(tǒng)計(jì)年鑒》。首先用1992—2010年的數(shù)據(jù)建立三次指數(shù)平滑模型與三次指數(shù)平滑-馬爾科夫模型,2011—2013年的數(shù)據(jù)用于測(cè)試模型;再用1992—2013年數(shù)據(jù)建立三次指數(shù)平滑-馬爾科夫模型,預(yù)測(cè)2014—2016云南省學(xué)齡兒童人數(shù)。
2.2三次指數(shù)平滑模型的建立
利用1992—2010年云南省學(xué)齡兒童人數(shù)數(shù)據(jù)做散點(diǎn)圖,發(fā)現(xiàn)數(shù)據(jù)基本呈曲線下降趨勢(shì)。因?yàn)槿沃笖?shù)平滑模型一般適用于短期內(nèi)曲線趨勢(shì)時(shí)間序列的預(yù)測(cè),故可選用該模型進(jìn)行預(yù)測(cè)。先用1992—1994年云南省學(xué)齡兒童人數(shù)的平均值作為平滑指數(shù)的初值:
一般地,平滑系數(shù)α是根據(jù)經(jīng)驗(yàn)從0.3,0.5與0.7等少數(shù)幾個(gè)值中選取預(yù)測(cè)效果最好的一個(gè)。這種選取α的方法,雖然有一定的可取性,但是主觀性較強(qiáng)。此處選取α的思想是根據(jù)預(yù)測(cè)誤差平方和最小原則,利用Matlab循環(huán)語(yǔ)句命令編程,從0<α<1的所有值中選擇最優(yōu)α,這樣選出的平滑系數(shù)更具客觀性。在實(shí)際操作中,不可能取遍0<α<1的所有值,一般要先設(shè)定α的一個(gè)精度,取出最優(yōu)α后看預(yù)測(cè)效果是否達(dá)到要求,如果沒(méi)達(dá)到,再進(jìn)一步提高精度。此處嘗試設(shè)定α的精度為小數(shù)點(diǎn)后3位,即從999個(gè)α=0.001,0.002,…,0.999中選出最優(yōu)值。按照前面選取α的思想,選擇出最優(yōu)α=0.720。
表1 三次指數(shù)預(yù)測(cè)結(jié)果與馬爾科夫狀態(tài)表
a2010=402.146 8,b2010=-14.459 4,c2010=-2.146 6
以2010年為起點(diǎn),預(yù)測(cè)模型的表達(dá)式為
Y2010+T=402.146 8-14.459 4T-2.146 6T2
2.3三次指數(shù)平滑-馬爾科夫模型的建立
三次指數(shù)平滑模型建立成功后,在其基礎(chǔ)上可利用馬爾科夫預(yù)測(cè)對(duì)其預(yù)測(cè)結(jié)果進(jìn)行修正,進(jìn)一步建立三次指數(shù)平滑-馬爾科夫模型。首先進(jìn)行狀態(tài)劃分,其原則是狀態(tài)數(shù)一般取3~5個(gè)為佳,且必須保證區(qū)間內(nèi)均有數(shù)據(jù)[7]。根據(jù)以上原則,結(jié)合模型一的相對(duì)誤差最大范圍區(qū)間 [-4.60%,3.31%],以-5%,-2%,0,2%與5%為狀態(tài)分界點(diǎn)進(jìn)行狀態(tài)劃分,劃分情況見(jiàn)表2。
表2 狀態(tài)劃分表
由表1 1993—2010年三次指數(shù)平滑模型每年相對(duì)誤差所處的狀態(tài)可得表3。表1表明,狀態(tài)1轉(zhuǎn)狀態(tài)1不存在,狀態(tài)1轉(zhuǎn)狀態(tài)2有1個(gè)(1993年轉(zhuǎn)1994年),狀態(tài)1轉(zhuǎn)狀態(tài)3有1個(gè)(2004年轉(zhuǎn)2005年),……。總結(jié)以上狀態(tài)轉(zhuǎn)移情況,得到狀態(tài)轉(zhuǎn)移情況表(表3)。
表3 狀態(tài)轉(zhuǎn)移情況表
由表3,計(jì)算出一步狀態(tài)轉(zhuǎn)移概率矩陣為
以2010年相對(duì)誤差狀態(tài)3為初始概率向量,即X(0)=(0,0,1,0),在公式(4)中依次取k=1,2,3,計(jì)算出2011—2013年的狀態(tài)概率向量。由三次指數(shù)平滑模型2011—2013年的預(yù)測(cè)值及表2的狀態(tài)劃分,用式(5)求出每年的預(yù)測(cè)區(qū)間;然后進(jìn)一步可求出區(qū)間中值,得出每年的區(qū)間中值向量;最后,利用式(6)計(jì)算三次指數(shù)平滑-馬爾科夫模型預(yù)測(cè)值,所有計(jì)算結(jié)果列于表4。
表4 三次指數(shù)平滑-馬爾科夫模型預(yù)測(cè)結(jié)果表
為比較兩種模型的預(yù)測(cè)效果,將兩模型2011—2013年的預(yù)測(cè)值、相對(duì)誤差與平均相對(duì)誤差列于表5。
表5 模型測(cè)試情況對(duì)比表
由2011—2013年的兩模型測(cè)試情況可見(jiàn),在相對(duì)誤差方面,平滑-馬爾科夫模型每年的預(yù)測(cè)效果均優(yōu)于三次指數(shù)平滑模型;在平均相對(duì)誤差方面,平滑-馬爾科夫模型為1.69%,相較于三次指數(shù)平滑模型的2.54%有了較大改善。由此可得,在云南學(xué)齡兒童人數(shù)預(yù)測(cè)這個(gè)問(wèn)題上,平滑-馬爾科夫模型的預(yù)測(cè)效果是優(yōu)于三次指數(shù)平滑模型的。
為了更加合理利用原始數(shù)據(jù)的全部信息,使預(yù)測(cè)結(jié)果更加準(zhǔn)確、可靠,利用1992—2013年全部數(shù)據(jù)與上文所述方法重新建立三次指數(shù)平滑-馬爾科夫模型,對(duì)2014—2016年云南省學(xué)齡兒童人數(shù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果依次為333.20萬(wàn)人、311.62萬(wàn)人、288.42萬(wàn)人。
3結(jié)論
利用三次指數(shù)平滑模型對(duì)云南學(xué)齡兒童人數(shù)進(jìn)行預(yù)測(cè)分析,取得了較好的預(yù)測(cè)效果,模型測(cè)試平均相對(duì)誤差為2.54%。在此基礎(chǔ)上,利用馬爾科夫預(yù)測(cè)模型對(duì)三次指數(shù)平滑模型的預(yù)測(cè)結(jié)果進(jìn)行修正,進(jìn)一步提高了預(yù)測(cè)的精度,模型測(cè)試平均相對(duì)誤差為1.69%。但是,因?yàn)槿沃笖?shù)平滑模型,通常只適用于短期預(yù)測(cè),故文中建立三次指數(shù)平滑-馬爾科夫模型也只在短期內(nèi)預(yù)測(cè)較可靠。三次指數(shù)平滑-馬爾科夫模型也可嘗試用于其他省份學(xué)齡兒童人數(shù)的預(yù)測(cè),或是嘗試用于其他方面的預(yù)測(cè)研究。
由2014—2016云南學(xué)齡兒童人數(shù)預(yù)測(cè)數(shù)據(jù)可見(jiàn),云南學(xué)齡兒童人數(shù)逐年遞減,這預(yù)示著若云南省對(duì)現(xiàn)有狀況不及時(shí)應(yīng)對(duì),則在不久的將來(lái)云南小學(xué)學(xué)校數(shù)量、小學(xué)教師人數(shù)相對(duì)于需求可能會(huì)偏多,造成社會(huì)資源的浪費(fèi);在更遠(yuǎn)的未來(lái)還可能導(dǎo)致高校招生難、人口老齡化等問(wèn)題。
參考文獻(xiàn)(References):
[1]嚴(yán)小麗,何超,黃怡浪.三次指數(shù)平滑法在建筑事故預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)與決策,2015(10):72-73
YAN X L,HE CH,HUANG Y L.Application of the Cubic Exponential Smoothing Method in Forecasting of Construction Accident[J].Statistics & Decision,2015(10):72-73
[2] 王洪德,曹英浩.道路交通事故的三次指數(shù)平滑預(yù)測(cè)法[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,33(1):42-46
WANG H D,CAO Y H. Cubic Exponential Smooth Method of Road Traffic Accident Forecasting[J].Journal of Liaoning Technical University(Natural Science),2014,33(1):42-46
[3] 王磊,武術(shù)靜,李長(zhǎng)青.灰色馬爾科夫模型對(duì)煤自然發(fā)火預(yù)測(cè)的研究[J].河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,34(1):35-39
WANG L,WU SH J,LI CH Q.Study on Prediction of Coal Spontaneous Combustion Based on Grey Markov Methed[J]. Journal of Henan Polytechnic University(Natural Science),2015,34(1):35-39
[4] 哈娜,付深遠(yuǎn).基于改進(jìn)灰色——馬爾科夫的橋梁耐久性預(yù)測(cè)模型研究[J].中外公路,2015,35(3):152-157
HA N,FU SH Y.Study on Prediction Model of Bridge Durability Based on Improved Grey Markov[J]. Journal of China & Foreign Highway,2015,35(3):152-157
[5] 榮潔,王臘春.指數(shù)平滑法:馬爾科夫模型在巢湖水質(zhì)預(yù)測(cè)中的應(yīng)用[J].水資源與水工程學(xué)報(bào),2013,24(4):98-102
RONG J,WANG L CH.Application of the Exponential Smoothing Law-Markov Model in Prediction of Water Quality of Chaohu Lake[J]. Journal of Water Resources and Water Engineerin,2013,24(4):98-102
[6] 芮海田,吳群琪,袁華智,等.基于指數(shù)平滑法和馬爾科夫模型的公路客運(yùn)量預(yù)測(cè)方法[J].交通運(yùn)輸工程學(xué)報(bào),2013,13(4):87-93
RUI H T,WU Q Q,YUAN H ZH,et al. Prediction Method of Highway Passenger Transportation Volume Based on Exponential Smoothing Method and Markov Model[J].Journal of Traffic and Transportation Engineering,2013,13(4):87-93
[7] 熊祖強(qiáng),王曉蕾.礦井相對(duì)瓦斯涌出量動(dòng)態(tài)無(wú)偏灰色馬爾科夫預(yù)測(cè)[J].安全與環(huán)境學(xué)報(bào),2015,15(3):15-18
XIONG Z Q,WANG X L. Application of the Markov Bias-Free Dynamic Grey Model for the Relative Gas Gush-Out Rate Predict[J〗. Journal of Safety and Environment,2015,15(3):15-18
責(zé)任編輯:李翠薇
Yunnan School-age Children Prediction Based onCubic Exponential Smoothing
PENG Nai-chi, DANG Ting
(Department of Information Science and Technology, Tourism and Culture College of Yunnan University, Yunnan Lijiang 674199, China)
Abstract:Construction of scientific and accurate forecasting model for predicting the number of Yunnan school-age children has certain reference value for the rational planning of the number of primary school, the development of primary school teachers recruitment plan, and the formulation of population policy. According to the principle of minimum sum of prediction error square, a precision of the smoothing coefficient is set up, the optimal smoothing coefficient is selected from all the values between 0 and 1, by using the Matlab loop statement programming. Research shows that the three exponential smoothing model established by this method has good prediction effect on the number of school-age children. On this basis, the forecasting results of the three exponential smoothing model are modified by using Markov forecasting method, which makes up for the forecast errors caused by random fluctuation. Through the comparison and analysis of the predicted results, it shows that the forecasting effect of cubic exponential smoothing-markov model is better than cubic exponential smoothing model. Finally, the number of 2014-2016 Yunnan school-age children is forecasted by using cubic exponential smoothing-markov Model.
Key words:cubic exponential smoothing model; Markov model; school-age children
中圖分類(lèi)號(hào):O213
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1672-058X(2016)02-0049-05
作者簡(jiǎn)介:彭乃馳(1981-),男,貴州黔東南人,講師,碩士,從事應(yīng)用統(tǒng)計(jì)學(xué)研究.
*基金項(xiàng)目:2015年度云南省教育廳科學(xué)研究基金一般項(xiàng)目資助(2015Y507).
收稿日期:2015-10-09;修回日期:2015-11-09.
doi:10.16055/j.issn.1672-058X.2016.0002.011
重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版)2016年2期