(北京化工大學(xué)體育部 北京 100129)
2001-2019年世界100m項目年終排名第1名、第2名、第3名和第8名的成績。成績?nèi)∽試H田聯(lián)官網(wǎng)成績統(tǒng)計(結(jié)束于2021月1月上旬),不包括超風(fēng)速成績。
文獻(xiàn)資料法:查閱與時間序列分析、灰色模型預(yù)測相關(guān)的著作,通過知網(wǎng)和學(xué)校圖書館查找與田徑成績預(yù)測相關(guān)的文獻(xiàn)資料,通過學(xué)校有圖書館查閱與時間序列分析、灰色模型相關(guān)的著作,為2021年的成績預(yù)測提供理論支撐和方法參考。
比率分析法:計算2001-2019年世界100m跑成績的環(huán)比、定基比,通過環(huán)比動態(tài)圖和定基比動態(tài)圖反映出2001-2019年世界男子、女子100m跑項目的特點和成績變化趨勢。
季節(jié)性時間序列預(yù)測模型:存在季節(jié)性因素的時間序列數(shù)據(jù)(周期數(shù)據(jù))可以被分解為趨勢因子、季節(jié)因子(周期因子)和隨機因子。趨勢因子能夠捕捉到長期變化趨勢,季節(jié)性因子能夠捕捉到周期性變化,而隨機因子對應(yīng)的是不能被趨勢或季節(jié)效應(yīng)解釋的變化。
季節(jié)性時間序列分析的方法有很多,例如,分解預(yù)測模型(包括經(jīng)典分解、X11分解、SEATS分解和STL分解),三指數(shù)模型(或稱Holt-Winters指數(shù)平滑模型)和ARIMA季節(jié)模型。分解預(yù)測模型和Holt-Winters指數(shù)平滑模型均可以表示成可加模型或者可乘模型。如對STL分解預(yù)測模型來說,相加模型可以表示為,相乘模型則將時間序列表示為。經(jīng)過分析,百米成績序列奧運周期性明顯,故而在進(jìn)行季節(jié)性時間序列分析時,我們?nèi)≈芷跒?,將數(shù)據(jù)看作季節(jié)性數(shù)據(jù),利用一系列時間序列分析模型進(jìn)行預(yù)測。
對比分析:總結(jié)各預(yù)測方法的使用條件,并將不同方法預(yù)測得到的世界男子、女子2019年100m成績預(yù)測相對誤差和2021年預(yù)測值進(jìn)行對比,總結(jié)各方法的優(yōu)劣。
本文通過時間序列圖分析法直接觀察時間序列圖,分析序列的總體趨勢和變化規(guī)律。
從圖1可知,2001-2019年世界男子、女子的100m成績整體呈波動上升趨勢。
圖1 世界男子女子100m成績折線圖
男子第1名成績自2003年起一直上升,并在2009年達(dá)到頂峰(9.58s),2010-2019年平均成績9.762s;第 2名、第 3名的趨勢也大致相同,前三名總體水平在2009年最好,平均9.66s,2012年次之,為9.69s,2017年平均成績?yōu)榻曜畹统煽儯?名僅9.82s。
女子成績在2001-2007年多有波動,2007-2009年成績連續(xù)上升并達(dá)到最好水平,此后多年成績相對平穩(wěn),第1名平均成績在10.74s的水平,前三名總體水平在2009年最好(10.68s)、2016年次之 (10.71s),2018年平均成績?yōu)榻曜畹统煽儯?名僅10.85s。
圖中男女百米跑成績都呈明顯的周期性變化——以奧運年為節(jié)點進(jìn)行周期劃分,奧運年成績幾乎都接近或達(dá)到該周期內(nèi)的最好成績,并在奧運年的后一年開始下降 (男子項目除2005、2009年、女子項目除2009年之外)、在下一個奧運年之前開始上升。100m成績序列具有明顯的奧運周期效應(yīng),并且這樣的周期趨勢在近十年中更為顯著。
本文對男子項目四條成績序列取平均進(jìn)行分析,發(fā)現(xiàn)上升趨勢均接連2-3年出現(xiàn),男子項目在2003-2006年、2007-2009年、2010-2012年、2013-2015年、2017-2019年連續(xù)上升。女子項目也呈現(xiàn)出同樣的特點,并且接連上升的年份與男子的相同或僅提前或滯后一年,女子項目在2002-2005年 (提前)、2007-2009年、2010-2012年、2014-2016年(滯后)及 2018-2019年(滯后)接連上升。結(jié)合根據(jù)周期規(guī)律,推測2021年男子成績達(dá)到或接近第五周期內(nèi)的峰值、女子成績2018-2021年連續(xù)兩年上升,二者均在2021年達(dá)到較好水平。
總體來說,男子女子100m項目的第一名水平都在2009年都達(dá)到了頂峰,以第8名成績衡量世界運動員整體水平,女子成績第五周期(2017-2019年)平均整體水平(2017-2019年第8名成績平均值約10.85s)較第一周期的總體水平(約10.97s)有明顯提高,而男子平均整體水平在第三周期水平最高 (第8名平均值9.83s),第五周期(約9.90s)與第一周期的整體平均水平(約9.96s)差距不大。
當(dāng)時序中可以觀察到季節(jié)因子時,可以對時序進(jìn)行季節(jié)性分解。季節(jié)性分解的方法有很多,圖2為世界男子100m第1名2001-2019年的成績序列的STL季節(jié)性分解結(jié)果,該方法的主要思想是利用LOESS光滑進(jìn)行分解。
圖2 世界男子第1名2001-2019年成績序列的季節(jié)性分解圖
圖3
圖2中的季節(jié)效應(yīng)圖“seasonal”描述的就是季節(jié)因子,在本文研究的問題中表示的是周期因子,每4年中,第一年與第四年的季節(jié)因子為負(fù)值(值越小代表成績越快),顯著小于第二年與第三年的成績。這一結(jié)果也可以從周期圖(圖3)中更清楚地看到。
圖3表示的是各周期第一、二、三、四年組成的子序列以及每個子序列的均值,各周期第二、第三年的成績變化趨勢比較相近,在奧運年后第一年(Q1)和奧運年(Q4)的平均成績顯著高于其他兩年。
本節(jié)著重列出STL分解預(yù)測模型、三指數(shù)模型的預(yù)測結(jié)果。利用分解時序分析結(jié)果再還原預(yù)測數(shù)據(jù)時,有多種方法可供選擇,如樸素法、ARIMA模型和隨機漫步模型。2019年的成績預(yù)測 (基于2001-2018年成績序列)和2021年的預(yù)測結(jié)果分別列于表1、表2。
表1 季節(jié)性時間序列分析2019年預(yù)測結(jié)果
表2 季節(jié)性時間序列分析2021年預(yù)測結(jié)果
STL分解預(yù)測模型可以適用于任何季節(jié)周期的數(shù)據(jù),本文的原始時序需要進(jìn)行設(shè)定成周期為4的周期數(shù)據(jù),2001-2019年的成績轉(zhuǎn)化為五個周期的數(shù)據(jù)。該模型的另一優(yōu)點是季節(jié)因子和趨勢因子隨時間的變化率可以被控制,在多數(shù)問題的應(yīng)用上更合理??紤]到該問題中只有5個周期,跨度較短,故設(shè)定季節(jié)因子在各個周期內(nèi)不變,趨勢項變化率不人為控制,該方法只能擬合出加法模型,即。預(yù)測的精確度也不穩(wěn)定。三指數(shù)模型擬合了具有水平項、趨勢項和季節(jié)效應(yīng)的時序,經(jīng)分析,100m跑成績周期效應(yīng)明顯,數(shù)據(jù)符合模型的要求。通過對數(shù)據(jù)先取對數(shù)再用ets函數(shù)擬合,可以擬合加法模型。因此三指數(shù)模型的預(yù)測結(jié)果具有較高的準(zhǔn)確性。由此可以得出較為可靠的100m跑2021年預(yù)測成績。
運用三指數(shù)模型預(yù)測2021年100m跑成績?nèi)缦拢?/p>
男子前三名分別是: 9.70s、9.89s、9.91s,第 8名是 9.89s;
女子前三名:10.68s、10.75s、10.74s,第 8 名為 10.77s。