張 碩
山西省體育科學研究所,山西 太原 030012
當今時代已經(jīng)是一個大量數(shù)據(jù)不斷產(chǎn)生并被記錄的時代。自信息革命以來,信息交互工具、通訊基礎設施、數(shù)據(jù)處理軟件之間的平行發(fā)展使得數(shù)據(jù)在我們當今社會的方方面面產(chǎn)生著愈加重要的指示性作用。依靠電子計算機強大的快速分類和記錄能力進行的數(shù)據(jù)收集,通過搜索引擎技術的不斷進步,各類數(shù)據(jù)在互聯(lián)網(wǎng)平臺上的相互交流、串聯(lián)、溝通,并在“云計算”這一設計的幫助下,在互聯(lián)網(wǎng)維度中將一個個單獨數(shù)據(jù)匯聚成一個巨大的無所不含的大數(shù)據(jù)庫?!按髷?shù)據(jù)之所以產(chǎn)生,主要得益于當今正邁進普世計算機時代下隨處可見的傳感器和微處理器。這些設備留下的數(shù)據(jù)痕跡通過互聯(lián)網(wǎng)的相互交流,形成的一個龐大的數(shù)據(jù)源是可以被使用、被分析的無形寶藏?!盵1]當我們作出某一選擇時需要相應的支持,可以通過對與該決定相關連的事件以往所產(chǎn)生并被記錄的一系列數(shù)據(jù)進行系統(tǒng)化的篩選、分析以及“數(shù)據(jù)挖掘”,通過找尋相關數(shù)據(jù)與事件結果間的一些聯(lián)系,借以支持我們作出符合相應目的的選擇。
“大數(shù)據(jù)時代”將是一個以數(shù)據(jù)為主導的,通過對所發(fā)生事件所產(chǎn)生數(shù)據(jù)的收集、儲存、分析、挖掘,進而指導決定的作出的一個時代。
“任何行業(yè)、組織在應用大數(shù)據(jù)的過程中,從技術角度來看,首先要收集并且開發(fā)特定的工具,來處理大規(guī)模并行服務器產(chǎn)生的結構化和非結構化數(shù)據(jù)。這些數(shù)據(jù)可能是專有數(shù)據(jù),也可能是來自于“云”。其次,任何一個組織都需要選定分析軟件,用它來挖掘數(shù)據(jù)的意義,以及最重要的管理和分析大數(shù)據(jù)的專業(yè)人才?!盵2]
“飛行時刻(Flyontime.us)”是美國的航班延誤分析系統(tǒng),通過對Date.gov中全美航班起、降時間,延誤信息為基礎,通過總體延誤率對比、不同航空公司間延誤率對比、以及不同天氣情況、不同日期、時間段、節(jié)假日情況甚至航班具體延誤情況的系統(tǒng)分析及數(shù)據(jù)挖掘。幫助消費者找到最符合自己目標的航班,同時可以倒逼航空市場間的良性競爭。
“數(shù)據(jù)混搭器(Datemasher.org)”是美國以開放的數(shù)據(jù)為基礎,通過選擇需要整合對比的公共數(shù)據(jù)組,然后產(chǎn)生以地圖為基礎的數(shù)據(jù)可視化分析報告。如通過分析來自聯(lián)邦調(diào)查局(FBI)和疾病控制中心的各州每百萬人口犯罪案件數(shù)和各州居民武器擁有比例這兩組數(shù)據(jù)。通過分析可知華盛頓州居民的槍支擁有率為1.9%,遠低于其他州,但每百萬人口罪案數(shù)為1414宗,居全美第一。再以密西西比州為例,槍支擁有率為11.1%,為全美第二,但每百萬人口罪案數(shù)僅為291宗,在全美處于較低水平。由此可知,各州居民槍支擁有率與當?shù)刂伟睬闆r沒有必然聯(lián)系。[3]
表1 華盛頓州與密西西比州居民槍支擁有率與當?shù)刂伟睬闆r
在美國職業(yè)籃球聯(lián)賽(NBA)、英格蘭超級足球聯(lián)賽、美國職業(yè)橄欖球聯(lián)賽(NFL)等職業(yè)化程度較高的比賽項目,大數(shù)據(jù)理論的應用已經(jīng)充斥著運動員日常訓練與比賽的過程中。
如NBA比賽的背后,有著強大的數(shù)據(jù)統(tǒng)計、挖掘系統(tǒng)。NBA對比賽數(shù)據(jù)的量化已經(jīng)到了極致的地步,以得分、失分、投籃命中率等統(tǒng)計多達90多項技術指標。除去可以簡單理解的統(tǒng)計數(shù)據(jù)外。也有諸如“球員貢獻度PIE(Player Impact Estimate)”,即通過計算一個球員整場比賽的得分,陣地戰(zhàn)得分,罰球得分等主動得分,一級助攻、搶斷等正面技術指標,減去犯規(guī)、丟球等負面數(shù)據(jù)通過相應公式得出的經(jīng)挖掘后的“高級指標”。還有一些諸如某兩名特定球員得分相關性或者得分總和對球隊勝率影響的“高級指標”。
英超很早就有俱樂部和美國職業(yè)橄欖球聯(lián)盟NFL合作,希望借鑒美國體育的運動醫(yī)療知識,特別是專業(yè)分工清晰的、圍繞球員不同身體部位進行專門功能性訓練以及恢復的新方式。[4]這樣的分析研究和恢復手段,帶有強烈的移動互聯(lián)網(wǎng)特色:充分使用攝像頭、移動客戶端和計算機綜合分析體系,采集大量數(shù)據(jù)來提供解決方案。這種通過大數(shù)據(jù)應對球員傷病的模式,是通過仔細搜集其運動、睡眠休息和日常移動的各種形體姿態(tài),以及相關體能消耗數(shù)據(jù),來分析球員全面的生物學指數(shù),尤其著重研究球員們在各種肌體壓力下的生理反應。
田麥久教授主導的“五要素”學說下,即體能、技術能力、戰(zhàn)術能力、運動智能、心理能力,這些子集間的發(fā)展水平普遍的處于非衡性狀態(tài)下。于其他要素而言,在運動技能的形成與發(fā)展方面由于各項目間具體技術差別過大,尚沒有統(tǒng)一的規(guī)律出現(xiàn),同時由于現(xiàn)代社會的信息及交互程度的不斷深入,使得頂尖運動員之間技術差距逐漸縮??;戰(zhàn)術能力則受到更多外部因素影響,如對手競技能力、賽制、自身技術能力、體能水平等,過多的因變量無法進行統(tǒng)一標準的分析;心理能力和運動智能的研究和探索仍在模糊的概念階段,缺乏具體方法,無法直接提高運動員的競技能力。
田麥久教授、劉大慶教授[5]所提出的在統(tǒng)計學視角下運動員競技能力各因素間的發(fā)展絕大部分呈現(xiàn)不均衡的非衡性狀態(tài),而競技能力各因素間的非衡性補償作用也是普遍存在的。
李贊關于競技子能力非同步發(fā)展的相關研究中指出,由于“體、技、戰(zhàn)、心、智”五個競技子能力的內(nèi)在屬性差別決定了其固有發(fā)展規(guī)律的不同;不同專項因其競技能力的主導因素的不同,決定了各子能力在發(fā)展過程中也必然有所不同,[7]同時還有如教練員訓練理念,運動員個性化的特點,以及科技手段介入后帶來的訓練方法、手段的改進都是的各競技子能力間非同步性發(fā)展的特點普遍存在的基礎。[8]
運動員在競技能力上水平相當,不同運動員所具備的構成元素不一的競技能力呈相對關系,即各競技能力子因素間存在的關系呈現(xiàn)異構同工效果。
由此可知,運動員競技子能力發(fā)展具備非同步性而使得其競技能力存在著非衡結構,結構中各因素間呈現(xiàn)相互補償?shù)奶攸c?;谶@些理論的推演可以分析得出,可以通過重點發(fā)展已經(jīng)具備較完善的訓練方法及監(jiān)測手段的子能力,來達到整體競技能力提高的目的。
體能訓練這一競技能力子集已經(jīng)有著充分的人體解刨學、生理學、生物化學等理論學科的支撐和多年訓練實踐檢驗。通過有效提高運動員體能,依據(jù)不平衡性特征帶動其他競技能力要素發(fā)展同時提高運動員整體競技能力有著實際而可控的效果。
依據(jù)大數(shù)據(jù)理論的形成方式,針對目標對象所進行的數(shù)據(jù)收集工作是整體工作的基礎,針對體能訓練的數(shù)據(jù)收集工作可根據(jù)運動訓練學的分類標準進行;
3.1.1 運動員身體形態(tài)指標收集
針對運動員身體形態(tài)進行系統(tǒng)化測量并進一步精細化、專項化,除去傳統(tǒng)的身高、體重、臂展長度、肢體維度等外部形態(tài)指標外,可以通過不同科技手段對運動員身體肌肉、脂肪含量、肌肉橫斷面積等傳統(tǒng)手段無法檢測的形態(tài)指標進行測量記錄。在數(shù)據(jù)測量的過程中保證相關數(shù)據(jù)的收集與運動員多年訓練計劃間的同步,做到隨運動員運動生涯的身體形態(tài)指標測量數(shù)據(jù)的跟蹤收集。
3.1.2 運動員身體機能指標收集
通過科技手段測量運動員身體機能指標,監(jiān)控、收集并分析運動員運動及恢復過程中心率、血壓、生物電、生化指標等運動員的身體機能指標,同時針對運動員在運動和睡眠、休息時間進行對應的機能監(jiān)測,在恢復階段的身體機能監(jiān)控的進行,對比相應的數(shù)據(jù)變化分析其關系,基于運動訓練學理論中“超量適應”與“過度疲勞”現(xiàn)象進行監(jiān)控,基于數(shù)據(jù)的變化分析運動員競技水平提高的訓練周期理論模型,并基于身體機能數(shù)據(jù)進行監(jiān)控、統(tǒng)計并分析可以有效的提供相應的數(shù)據(jù)支持。
3.1.3 運動員一般運動素質(zhì)指標收集
針對運動員身體素質(zhì)的監(jiān)測是對運動員力量、速度、耐力、協(xié)調(diào)、柔韌、靈敏等運動素質(zhì)的一般性測量,而在科技手段的介入下可以針對不同研究維度進行測試與數(shù)據(jù)收集,如通過對力量訓練中負重物移動速度、沖量、加速度以及腱反射等傳統(tǒng)測量方法無法測量的數(shù)據(jù)。摸底監(jiān)測運動員身體素質(zhì),建立整體體能模型檢測流程,充分收集運動員身體素質(zhì)數(shù)據(jù)。一方面通過數(shù)據(jù)分析對具體運動素質(zhì)的訓練效果進行監(jiān)控,另一方面對數(shù)據(jù)的相關分析可以提供給教練員下一階段的訓練計劃制定的參考。
3.1.4 運動員其他運動指標收集
同時為滿足“大數(shù)據(jù)”對數(shù)據(jù)樣本量收集的多樣性、全面性的要求,區(qū)別于以往的體能數(shù)據(jù)測量收集手段,依據(jù)電子設備被標準化高、誤差小,便于操作,節(jié)省測試人員等特點,增加體能訓練過程中的數(shù)字化設備,如短距離沖刺跑過程中,記錄達到不同距離點的所用時間,及步幅、步頻甚至踏地時間的監(jiān)控進行全程動作攝錄,同步監(jiān)測心率、血壓、血乳酸等機能指標,同時根據(jù)訓練計劃做好體能數(shù)據(jù)的跟蹤監(jiān)測和收集。爭取做到訓練即是測試,測試也是訓練;即時產(chǎn)生訓練數(shù)據(jù),即時分析訓練數(shù)據(jù),即時反饋訓練效果的目標。
數(shù)據(jù)的分析及挖掘作為大數(shù)據(jù)理論的核心,將是該體系產(chǎn)生作用的直接環(huán)節(jié),其他部分也都是為這一步而服務的。
首先,數(shù)據(jù)收集的可信度要保證,否則從根本上就不具有效果;其次是數(shù)據(jù)庫的建立,積累一個巨大的數(shù)據(jù)庫,在這個“大數(shù)據(jù)時代”無疑是建立了一座寶藏;其次是數(shù)據(jù)的處理和挖掘,數(shù)據(jù)必須要應用才有意義,怎么用是一個像挖掘金礦般的工作,因此需要科研人員對訓練活動的全程參與,收集和處理數(shù)據(jù),為教練員、運動員提供訓練的反饋,幫助訓練計劃的優(yōu)化。同時,大數(shù)據(jù)體能數(shù)據(jù)庫的建立也能在運動員選材及跨界跨項選材上具備指導意義,根據(jù)數(shù)據(jù)庫的體能結構模型可以有效地分析得出項目體能特點,指導選材活動的開展。
綜上所述,大數(shù)據(jù)背景下的運動員體能訓練是通過對體能數(shù)據(jù)的“收集—儲存—分析”的結構,做到訓練即數(shù)據(jù)測試,測試數(shù)據(jù)即時收集并分析,訓練計劃即時依據(jù)反饋數(shù)據(jù)調(diào)整。依據(jù)促進體能訓練計劃的效果進行反饋,從而提高運動員體能,并提升競技能力,獲得競賽優(yōu)勝的體能訓練思路。