張正民
(西華師范大學(xué) 體育學(xué)院,四川 南充 637009)
奧運(yùn)會男子100 m跑成績的灰色GM(1,1)模型預(yù)測
張正民
(西華師范大學(xué) 體育學(xué)院,四川 南充 637009)
首先討論了基于對數(shù)變換的GM(1,1)模型,并結(jié)合 C語言程序?qū)崿F(xiàn)了該模型的程序化。然后以奧運(yùn)會男子100 m跑為例,從專項訓(xùn)練學(xué)角度出發(fā),結(jié)合自行編寫的C語言程序進(jìn)行數(shù)據(jù)處理、分析、驗證,并預(yù)測了2012年第30屆奧運(yùn)會的男子100 m跑成績在9.63~9.71 s。
科學(xué)計量學(xué);競賽成績預(yù)測;灰色GM(1,1)模型;對數(shù)變換;奧運(yùn)會男子100 m跑
體育成績的預(yù)測是一個歷久彌新的課題。隨著體育以及其它相關(guān)領(lǐng)域如數(shù)學(xué)和計算機(jī)等學(xué)科的發(fā)展,準(zhǔn)確迅速地預(yù)測體育成績已成可能。預(yù)測未來奧運(yùn)會成績是當(dāng)今各國體育工作者研究的熱點(diǎn)之一,因為它關(guān)系到各國體育戰(zhàn)略發(fā)展目標(biāo)的建立與決策管理,是體育發(fā)展戰(zhàn)略的基礎(chǔ)和目標(biāo)管理的依據(jù),尤其是關(guān)系到一個國家或省市競技主攻方向的選擇、重點(diǎn)項目的布局與設(shè)置等。所以,對體育成績的預(yù)測具有全局的、總體的和系統(tǒng)的戰(zhàn)略意義。而灰色預(yù)測具有需要原始數(shù)據(jù)少、計算簡單、預(yù)測精度高等特點(diǎn),并且只需預(yù)測對象本身的單因素數(shù)據(jù)就可做出近期、中長期的預(yù)測[1]。由于田徑成績具有明顯的灰色特征,又是奧運(yùn)會的主要項目之一,因此,對其研究具有深遠(yuǎn)意義。
預(yù)測運(yùn)動成績與體育發(fā)展戰(zhàn)略和訓(xùn)練決策密切相關(guān),也是目標(biāo)管理,制定具體訓(xùn)練方案的依據(jù)之一。預(yù)測和掌握未來世界運(yùn)動水平的趨勢,有利于我們在訓(xùn)練中統(tǒng)籌規(guī)劃,控制訓(xùn)練過程,逐步逼近目標(biāo)。因此,對運(yùn)動成績預(yù)測和研究是很有價值的工作?;疑A(yù)測GM(1,1)模型由于其具有需要原始數(shù)據(jù)少、計算簡單、不需要預(yù)先知道原始的時間序列統(tǒng)計分布、預(yù)測精度高等特點(diǎn)而被廣泛應(yīng)用于體育成績預(yù)測[2]。
體育成績是時間軸上的數(shù)據(jù)序列,總體趨勢呈現(xiàn)單調(diào)性(如本文中提到的男子100 m跑成績總體呈單調(diào)遞減趨勢),由于成績的影響因素復(fù)雜,因此成績實際上是擺動的。以前大多采用傳統(tǒng)的GM(1,1)模型或者改進(jìn)的 GM(1,1)模型(如殘差 GM(1,1)模型等)對其成績進(jìn)行預(yù)測[3-6]。而傳統(tǒng)的GM(1,1)模型要求原始數(shù)據(jù)為光滑序列[7],原始數(shù)據(jù)越光滑,其預(yù)測模型越精確。但是原始數(shù)據(jù)是客觀的,并不能像人們想象那樣光滑,因此,預(yù)測模型的精確度受到了很大的影響,如何解決原始數(shù)據(jù)的不規(guī)則性,是首先要解決的實際問題。本研究在建模的同時結(jié)合C語言編程,對原始數(shù)據(jù)進(jìn)行了對數(shù)變換[8](其它的變換方法有冪函數(shù)變換[9]、余切函數(shù)變換[10]等),提高了數(shù)據(jù)序列的光滑度,從而更適用于GM(1,1)模型,提高了預(yù)測精度。
首先探討了灰色預(yù)測 GM(1,1)模型及其檢驗方法。GM(1,1)模型的具體實施步驟包括:(1)對原始數(shù)據(jù)的處理,弱化隨機(jī)性;(2)根據(jù)所選擇白化微分方程,求解發(fā)展系數(shù)α和灰色作用量 u;(3)根據(jù)初始條件求累加生成序列,并還原求原始數(shù)據(jù)的模型序列。根據(jù)所描述的GM(1,1)模型,我們采用C語言自主完成了程序的編寫,以方便今后的科研工作需要。該程序當(dāng)前的功能和選擇包括:①只需要輸入原始數(shù)據(jù)序列。注意,原始數(shù)據(jù)序列的多寡會影響預(yù)測精度,這由用戶自己選擇決定和負(fù)責(zé)。②對原始數(shù)據(jù)的處理(即弱化隨機(jī)性),提供了兩個選擇:直接累加和對數(shù)變換。其它的弱化隨機(jī)性的方法也可根據(jù)需要實現(xiàn);③打印輸出中包括多種信息以方便隨時分析使用,包括:原始數(shù)據(jù)的均值、方差和均方差,殘差序列、相對誤差,精度和濾波精度等等。
本研究選擇二戰(zhàn)后男子100 m跑最好成績?yōu)樵紭颖尽Mㄟ^分析原始數(shù)據(jù),并從專項訓(xùn)練學(xué)角度出發(fā),結(jié)合數(shù)學(xué)函數(shù)的合理性,用C語言程序建模處理、分析數(shù)據(jù),用基于對數(shù)變換的GM(1,1)模型對2012年奧運(yùn)會男子100 m跑的成績進(jìn)行了研究和預(yù)測。
選取1948年第14屆奧運(yùn)會到2008年第29屆奧運(yùn)會的歷屆男子100 m跑的第1名的比賽成績和奪冠年份作為樣本(見表 1)。全部數(shù)據(jù)來源于http://www.olympic.cn。這部分?jǐn)?shù)據(jù)反映了第2次世界大戰(zhàn)以后,奧運(yùn)會100 m跑成績的發(fā)展水平與趨勢。
表1 1948~2008年奧運(yùn)會男子100 m奧運(yùn)會第1名成績 s
灰色預(yù)測GM(1,1)模型的檢驗方法主要包括:(1)相對誤差檢驗;(2)后驗差檢驗;(3)關(guān)聯(lián)度檢驗等[5]。
圖1 二戰(zhàn)后奧運(yùn)會男子100 m跑第1名成績變化
對1948~2008年奧運(yùn)會男子100 m跑第1名成績作圖(見圖 1)。由圖1可知,1948~2008年間的成績波動較大,很難用某個函數(shù)來擬合,即便是按照現(xiàn)代奧林匹克運(yùn)動的發(fā)展階段將其分成兩個部分,即 1948~1976年,1980~2008年,波動性仍然較大,難以擬合預(yù)測。為了降低波動性,弱化隨機(jī)性,對原始數(shù)據(jù)采用一次累加處理,將年代改為 1,2,3,…,16,如圖 2。由圖 2可知,累加生成序列可以由線性函數(shù) Y=0.202 75+9.998 5X(X=1,2,3,…,16)擬合,相關(guān)系數(shù)R=0.999 9,因此在該線性函數(shù)下,原始數(shù)據(jù)序列中第n個成績的模型值為yn=Yn-Yn-1=9.998 5,是定值,即線性處理后,預(yù)測值即為全部原始數(shù)據(jù)的平均值,所得到的成績隨時間不發(fā)生變化,顯然是不合理的,這種預(yù)測沒有任何意義;累加生成序列也可以由指數(shù)函數(shù) Y=-3 707 691.839 34+3 707 692.042 78 eX/370833.34361(X=1,2,3,…,16)擬合,因此在該指數(shù)函數(shù)下,原始序列中第n(n=1,2,3,…,16)個成績的模型值為:
此時其預(yù)測模型是有明確意義的,即預(yù)測值yn將會隨著時間(這里為年代n)發(fā)生變化,這顯然是合理的。
圖2 累加生成序列
但是,通過函數(shù)擬合方法預(yù)測未來成績時,所需樣本數(shù)目一般都比較大,而且這種方法是完全建立在舊信息的基礎(chǔ)之上的,即在舊信息足夠的情況下,未來的信息是完全確定的,沒有考慮到未來可能發(fā)生的變化,并且認(rèn)為樣本中所有數(shù)據(jù)對未來系統(tǒng)發(fā)展的貢獻(xiàn)是完全一樣的。顯然在實際情況中,這是不合理的。比如,體育發(fā)展階段的不同,各發(fā)展時期所表現(xiàn)出來的運(yùn)動成績的發(fā)展趨勢不同,其對未來的貢獻(xiàn)肯定也是不同的,一般來說越新的(時間上表現(xiàn)為越靠后)數(shù)據(jù),對未來時間序列所起的貢獻(xiàn)就越大。
文獻(xiàn)[8]證明對數(shù)變換能夠增加原始數(shù)據(jù)序列的光滑度,從而提高模型的預(yù)測精度。其它變換方法計算復(fù)雜,且對預(yù)測精度沒有明顯改善,因此不便應(yīng)用。對數(shù)變換的GM(1,1)預(yù)測思想是:首先將原始數(shù)據(jù)采用自然對數(shù)變換后再用傳統(tǒng)的GM(1,1)模型處理,最后還原即可。
1)第1部分(1948~1976年)建模分析。
通過反復(fù)建模分析,選擇傳統(tǒng)模型預(yù)測誤差最小的6樣本數(shù)(1952~1972年的成績)作為預(yù)測1976年第21屆奧運(yùn)會男子100 m跑成績的建模數(shù)據(jù)。然后采用基于對數(shù)變換的 GM(1,1)模型再進(jìn)行建模分析(見表2)。從表 2看出,模型值與實際值非常接近。最大誤差出現(xiàn)在1968年的墨西哥奧運(yùn)會成績(-9.95 s),由美國人詹姆斯·西恩斯創(chuàng)造。這是首次破10 s,且該紀(jì)錄保持了15年之久。這種由天才運(yùn)動員創(chuàng)造的記錄屬于偶然事件,所以會出現(xiàn)較大的誤差。但是對于預(yù)測的1976年的100 m跑成績,其誤差僅為0.005 s,相對誤差為0.05%,這是非常精確的。這說明了本研究選擇的對數(shù)變換的GM(1,1)模型具有較高的預(yù)測精度。
表2 對數(shù)變換對1976年奧運(yùn)會男子100 m跑成績的預(yù)測
2)第2部分(1980~2008年)建模分析。
選擇傳統(tǒng)模型預(yù)測誤差最小的 5樣本數(shù)(1988~2004年的成績)作為預(yù)測2008年第29屆奧運(yùn)會男子100 m跑成績的建模數(shù)據(jù)。然后采用基于對數(shù)變換的GM(1,1)模型再進(jìn)行建模分析(見圖3)。
圖3 1980~2008年實際值與模型預(yù)測值
從圖3看出,模型預(yù)測值與實際值非常接近,1992年到2004年的100 m跑成績誤差為0.005~0.055 s。當(dāng)然,2008年北京奧運(yùn)會上,牙買加飛人烏賽恩.博爾特創(chuàng)造了新的世界記錄 9.69 s。天才運(yùn)動員的出現(xiàn)是不能包括在以往的信息中的,因此,產(chǎn)生了較大的誤差。
以上兩部分都是基于對原始數(shù)據(jù)對數(shù)變換的灰色GM(1,1)預(yù)測模型,容易看出,該方法簡單實用,預(yù)測精度很高,適合于男子成績100 m跑的預(yù)測。
3)對2012年奧運(yùn)會男子100 m跑成績的預(yù)測。
按照奧運(yùn)田徑運(yùn)動發(fā)展階段的劃分,1980年以后的成績反映了世界經(jīng)濟(jì)和科技高速發(fā)展的情況。因此,選擇1980年以后的成績,并結(jié)合對數(shù)變換預(yù)測了2012年奧運(yùn)會男子100 m跑的最好成績(見表3),同時考慮了不同樣本數(shù)的預(yù)測情況。從平均相對誤差來看,預(yù)測模型的精度是很高的。因此認(rèn)為2012年奧運(yùn)會男子100 m跑的最好成績是9.63~9.71 s。
表3 不同樣本數(shù)預(yù)測2012年奧運(yùn)會成績
體育成績是時間軸上的數(shù)據(jù)序列,總體趨勢呈現(xiàn)單調(diào)性,由于成績的影響因素復(fù)雜,因此成績實際上是擺動的。在一定程度上影響GM(1,1)模型預(yù)測準(zhǔn)確度的因素是很多的,例如樣本數(shù)、原始數(shù)據(jù)的平滑處理等都會影響模型預(yù)測精度。如果對原始數(shù)據(jù)進(jìn)行對數(shù)變換、冪函數(shù)變換、余切函數(shù)變換等方法能增加數(shù)據(jù)序列的光滑度,從而更適用于GM(1,1)模型,在查閱參考文獻(xiàn),確認(rèn)對數(shù)變換能夠提高預(yù)測精度的情況下,采用基于對數(shù)變換的灰色預(yù)測GM(1,1)模型預(yù)測。由于同時考慮了不同樣本數(shù)的預(yù)測情況,從平均相對誤差來看,預(yù)測模型的精度是很高的。
對奧運(yùn)會等大賽成績的科學(xué)預(yù)測,是現(xiàn)代運(yùn)動科學(xué)化訓(xùn)練的重要組成部分。我們以二戰(zhàn)后奧運(yùn)會男子100 m跑成績?yōu)榛A(chǔ),以統(tǒng)計學(xué)和灰色理論為依據(jù),結(jié)合計算機(jī)技術(shù),運(yùn)用編程方法,自行研發(fā)出一套應(yīng)用系統(tǒng);分析灰色預(yù)測GM(1,1)模型,自編程序?qū)崿F(xiàn)了對成績的GM(1,1)模型的預(yù)測。本研究所采用的基于對數(shù)變換的灰色預(yù)測GM(1,1)模型可以被用來進(jìn)行成績預(yù)測,且方法簡單易行。本方法不僅在奧運(yùn)會田徑項目中適用,而且在其他項目中以及更重要的比賽中都有一定的適用性,諸如游泳、劃船等測量類運(yùn)動項目。該模型開拓性的預(yù)測方法,簡便實用的操作過程,可為我們今后研究確定比賽成績的預(yù)測工作提供參照模版,也可為其它競技體育運(yùn)動項目成績的預(yù)測研究工作提供參考。任何預(yù)測都是建立在已有信息的基礎(chǔ)上的,而未來不是過去的簡單延續(xù),因此,預(yù)測是有一定偏差的,但是該預(yù)測可以為目標(biāo)管理決策部門或運(yùn)動訓(xùn)練提供參考和依據(jù)。
[1]范振國. 運(yùn)動訓(xùn)練控制領(lǐng)域中的灰色系統(tǒng)模型分析[J]. 體育學(xué)刊,2006,13(6):104-106.
[2]金川江,童麗平. 男子跳遠(yuǎn)全國紀(jì)錄的等維灰數(shù)遞補(bǔ)GM(1,1)模型及預(yù)測[J]. 體育學(xué)刊,2002,9(5):134-135.
[3]李毅青,鄧宗琦. 1990,1994,1998,2002年亞運(yùn)會部分項目成績的預(yù)測[J]. 華中師范大學(xué)學(xué)報:自然科學(xué)版,1990,24(3):365-375.
[4]閻守扶,段賽勇. 對第26屆奧運(yùn)會田徑成績的灰色預(yù)測[J]. 中國體育科技,1996,32(5):60-62.
[5]張芝蘭,徐明,劉艇. 對第27屆奧運(yùn)會游泳成績的灰色預(yù)測[J]. 上海體育學(xué)院學(xué)報,1997,21(3):46-51.
[6]范文杰,周愛國,劉建敏. 對第28屆奧運(yùn)會田徑運(yùn)動成績的灰色預(yù)測[J]. 北京體育大學(xué)學(xué)報,2002,25(6):847-849.
[7]鄧聚龍. 灰色系統(tǒng)理論教程[M]. 武漢:華中理工大學(xué)出版社,1990.
[8]陳濤捷. 灰色預(yù)測模型的一種拓廣[J]. 系統(tǒng)工程,1990,8(4):50.
[9]李群. 灰色預(yù)測模型的進(jìn)一步拓廣[J]. 系統(tǒng)工程理論與實踐,1993,13(1):64.
[10]李翠鳳,戴文戰(zhàn). 基于函數(shù)cotx變換的灰色建模方法[J]. 系統(tǒng)工程,2005,23(3):110-114.
[11]Chen Li-Hui. Using grey Markov forecasting model to examine the merger announcement affected the banks’stock values[J]. Journal of Grey System,2004,7:1.
Prediction of the result of men’s 100m run in the Olympic Games based on the grey GM(1, 1) model
ZHANG Zheng-min
(School of Physical Education,China West Normal University,Nanchong 637009,China)
Firstly, the author discussed the GM(1, 1) model based on logarithmic transformation, and realized the programming of this model by using C language. Then, by taking the men’s 100m run in the Olympic Games for example, from the perspective of the science of event specific training, the author carried out data processing,analysis and verification based on the program he compiled in C language, and predicted that the result of the men’s 100 m run in the 30thOlympic Games in 2012 would be somewhere between 9.63 s and 9.71 s.
scientific metrology;competition result prediction;grey GM(1,1)model;logarithmic transformation;Olympic Games;men’s 100 m run
G811.21
A
1006-7116(2011)04-0111-04
2010-10-24
張正民(1968-),男,副教授,碩士,碩士研究生導(dǎo)師,研究方向:體育教學(xué)與訓(xùn)練。