史一丹 蔡雨琦 于華 張怡 姚輝波*
(1.南京理工大學(xué)體育部 江蘇南京 210094;2.中國(guó)電子科技集團(tuán)公司第二十八研究所 江蘇南京 210007;3.南京市第九中學(xué) 江蘇南京 210018)
隨著多種科學(xué)技術(shù)手段的融入,籃球比賽數(shù)據(jù)分析的先進(jìn)性得到了長(zhǎng)足的提升。首先是體育相關(guān)設(shè)備的智能化水平提高,為數(shù)據(jù)采集與數(shù)據(jù)分析提供了更加堅(jiān)實(shí)的硬件支持。其次,各種先進(jìn)的技術(shù)與算法的研發(fā),為解決籃球相關(guān)技術(shù)問(wèn)題提供了理論支撐。例如,數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用為籃球相關(guān)數(shù)據(jù)的保存與應(yīng)用提供了基礎(chǔ)[1],先進(jìn)的數(shù)據(jù)分析算法的應(yīng)用為找到籃球數(shù)據(jù)反映的內(nèi)部規(guī)律提供更加快速、高效的手 段[2]。此外,各種籃球相關(guān)新媒體與數(shù)據(jù)分析團(tuán)隊(duì)的崛起也為籃球數(shù)據(jù)分析行業(yè)注入了加速劑。相關(guān)媒體的介入,使更多的實(shí)體參與比賽的技術(shù)統(tǒng)計(jì),數(shù)據(jù)分析團(tuán)隊(duì)的加入也為球隊(duì)的進(jìn)步與發(fā)展提供了專業(yè)化的參考意見(jiàn)。
然而,目前的籃球數(shù)據(jù)分析仍然存在許多不足之處。首先,籃球比賽以及籃球相關(guān)新媒體的種類復(fù)雜多樣且相對(duì)獨(dú)立,現(xiàn)有的籃球數(shù)據(jù)庫(kù)都是中心化的,如新浪體育、騰訊體育等,中心化數(shù)據(jù)庫(kù)會(huì)造成數(shù)據(jù)壟斷,導(dǎo)致數(shù)據(jù)無(wú)法共享和流通,“信息孤島”現(xiàn)象十分明顯,導(dǎo)致大、中、小型的籃球相關(guān)組織缺乏獲得數(shù)據(jù)的渠道,大量的數(shù)據(jù)需求只能訴諸數(shù)據(jù)黑產(chǎn)、數(shù)據(jù)寡頭、數(shù)據(jù)聯(lián)盟,沒(méi)有形成完善的數(shù)據(jù)流通機(jī)制[3]。其次,籃球數(shù)據(jù)分析實(shí)時(shí)性差且存在主觀誤差[4],教練員及其團(tuán)隊(duì)需要根據(jù)相關(guān)理論和經(jīng)驗(yàn),結(jié)合籃球運(yùn)動(dòng)員的技能水平數(shù)據(jù),分析對(duì)手以及自身的技戰(zhàn)術(shù)水平。這種模式的主觀性很強(qiáng),教練員需要花費(fèi)大量的時(shí)間去分析技戰(zhàn)術(shù)與運(yùn)動(dòng)員技術(shù)動(dòng)作,這就產(chǎn)生了大量的時(shí)間浪費(fèi)以及主觀判斷誤差。
區(qū)塊鏈?zhǔn)且环N全新的分布式數(shù)據(jù)庫(kù)技術(shù),其核心功能在于分布式數(shù)據(jù)存儲(chǔ)、點(diǎn)對(duì)點(diǎn)傳輸、共識(shí)機(jī)制等[5]。分布式存儲(chǔ)和點(diǎn)對(duì)點(diǎn)傳輸在一個(gè)去中心化的分布式系統(tǒng)中實(shí)現(xiàn)數(shù)據(jù)的安全可靠存儲(chǔ)與共享,共識(shí)機(jī)制則決定了在去中心化的網(wǎng)絡(luò)中如何記錄和存儲(chǔ)數(shù)據(jù)。首先,區(qū)塊鏈網(wǎng)絡(luò)中不存在一個(gè)絕對(duì)的核心。也就是說(shuō),沒(méi)有人可以控制整個(gè)網(wǎng)絡(luò)的數(shù)據(jù)并且制定網(wǎng)絡(luò)規(guī)則。這就使區(qū)塊鏈網(wǎng)絡(luò)中的節(jié)點(diǎn)具有相對(duì)的公平性,主要體現(xiàn)在網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)都用于網(wǎng)絡(luò)數(shù)據(jù)的備份及網(wǎng)絡(luò)中的節(jié)點(diǎn)都可以通過(guò)參與共識(shí)機(jī)制來(lái)管理區(qū)塊鏈網(wǎng)絡(luò)兩個(gè)方面。其次,區(qū)塊鏈網(wǎng)絡(luò)中的數(shù)據(jù)具有更高的安全性,這得益于區(qū)塊鏈中的數(shù)據(jù)都運(yùn)用了密碼學(xué)的加密方法。最后,區(qū)塊鏈網(wǎng)絡(luò)中的數(shù)據(jù)具有追根溯源性,每一組數(shù)據(jù)都具有明顯的身份標(biāo)識(shí),可以快速查詢到數(shù)據(jù)的來(lái)源出處。
移動(dòng)邊緣計(jì)算技術(shù)近年來(lái)引起了人們的關(guān)注。移動(dòng)邊緣計(jì)算的概念是由歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)提出的,將計(jì)算資源部署在靠近終端設(shè)備的區(qū)域,旨在將計(jì)算資源引入無(wú)線接入網(wǎng),為終端提供強(qiáng)大的計(jì)算能力擴(kuò)展,同時(shí)縮短通信距離,減小計(jì)算時(shí)延[6]。目前,對(duì)于邊緣計(jì)算的研究處于起步階段,如在車(chē)聯(lián)網(wǎng)中,大量有關(guān)車(chē)輛的計(jì)算任務(wù)需要將大量的數(shù)據(jù)上傳至數(shù)據(jù)中心(數(shù)據(jù)計(jì)算中心是數(shù)據(jù)服務(wù)提供商所擁有的,如亞馬遜云計(jì)算中心、谷歌云計(jì)算中心等),然而這些計(jì)算任務(wù)往往實(shí)時(shí)性要求比較高,衛(wèi)星通信產(chǎn)生的大量數(shù)據(jù)傳輸會(huì)產(chǎn)生較大的時(shí)延,尤其在數(shù)據(jù)高峰期,數(shù)據(jù)中心計(jì)算資源的短缺會(huì)產(chǎn)生較大計(jì)算時(shí)延,影響網(wǎng)絡(luò)性能。而在邊緣計(jì)算網(wǎng)絡(luò)中,數(shù)據(jù)服務(wù)提供商通過(guò)在蜂窩網(wǎng)絡(luò)中設(shè)置邊緣計(jì)算節(jié)點(diǎn),使計(jì)算資源更貼近用戶終端,將會(huì)減小因?yàn)樾l(wèi)星通信產(chǎn)生的時(shí)延,并且邊緣計(jì)算節(jié)點(diǎn)密度較大,會(huì)對(duì)終端的計(jì)算資源形成良好的補(bǔ)充。
機(jī)器學(xué)習(xí)作為最強(qiáng)大的人工智能工具之一,已被廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)、信號(hào)/語(yǔ)言處理、社會(huì)行為分析、無(wú)人機(jī)路徑規(guī)劃等[7]。明確地說(shuō),它運(yùn)用統(tǒng)計(jì)技術(shù)來(lái)識(shí)別模式和底層結(jié)構(gòu),繼而分析觀測(cè)到的數(shù)據(jù)以形成經(jīng)驗(yàn)。這就使智能設(shè)備能夠自動(dòng)“學(xué)習(xí)”做出預(yù)測(cè),而無(wú)需人工干預(yù)來(lái)相應(yīng)地調(diào)整機(jī)器的行為。機(jī)器學(xué)習(xí)主要包括3類:監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)根據(jù)已有的數(shù)據(jù)集,知道智能設(shè)備數(shù)據(jù)輸入和輸出結(jié)果之間的關(guān)系。根據(jù)這種已知的關(guān)系,訓(xùn)練得到一個(gè)最優(yōu)的數(shù)據(jù)處理模型。也就是說(shuō),在監(jiān)督學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)既有特征又有標(biāo)簽,通過(guò)訓(xùn)練,讓機(jī)器可以自己找到特征和標(biāo)簽之間的聯(lián)系。相反,在無(wú)監(jiān)督學(xué)習(xí)中,機(jī)器不知道數(shù)據(jù)之間的關(guān)系,而是要根據(jù)聚類或一定的模型得到數(shù)據(jù)之間的關(guān)系??梢赃@么說(shuō),比起監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)更像是自學(xué),讓機(jī)器學(xué)會(huì)自己做事情。強(qiáng)化學(xué)習(xí)算法則是讓機(jī)器學(xué)習(xí)如何將環(huán)境變化情況映射到動(dòng)作,以通過(guò)與環(huán)境互動(dòng)來(lái)最大化獎(jiǎng)勵(lì)。也就是說(shuō),讓機(jī)器能夠根據(jù)環(huán)境的變化做出相應(yīng)的變化以更好地適應(yīng)環(huán)境。
基于以上前言中對(duì)籃球數(shù)據(jù)分析局限性的分析,結(jié)合了區(qū)塊鏈、邊緣計(jì)算以及機(jī)器學(xué)習(xí)在如今數(shù)據(jù)分析方面的突出優(yōu)勢(shì),該文提出了基于以上3種技術(shù)的新型籃球比賽數(shù)據(jù)分析平臺(tái)(見(jiàn)圖1)。其主要的思路如下:首先,基于先進(jìn)的區(qū)塊鏈技術(shù)組建分布式的數(shù)據(jù)庫(kù)用于存儲(chǔ)籃球比賽相關(guān)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)共享;其次,就近(籃球比賽場(chǎng)地周?chē)┎渴鸶咝阅艿倪吘売?jì)算服務(wù)器,將先進(jìn)的機(jī)器學(xué)習(xí)算法裝載于邊緣計(jì)算平臺(tái);最后,邊緣計(jì)算平臺(tái)運(yùn)用先進(jìn)的機(jī)器算法分析數(shù)據(jù)庫(kù)數(shù)據(jù)后,將結(jié)果反饋至數(shù)據(jù)分析服務(wù)需求方。
圖1 新型籃球比賽數(shù)據(jù)分析平臺(tái)架構(gòu)示意圖
下面該文將具體描述三大板塊的運(yùn)行機(jī)制與意義。
在區(qū)塊鏈架構(gòu)上構(gòu)建籃球數(shù)據(jù)庫(kù),以區(qū)塊鏈來(lái)構(gòu)建籃球比賽相關(guān)數(shù)據(jù)庫(kù)是整個(gè)平臺(tái)運(yùn)行的基礎(chǔ)。在傳統(tǒng)的集中式數(shù)據(jù)庫(kù)中,數(shù)據(jù)被幾個(gè)實(shí)力雄厚的籃球?qū)嶓w(籃協(xié)、新浪體育、各大籃球俱樂(lè)部等)所擁有,這就導(dǎo)致數(shù)據(jù)的流通性差,數(shù)據(jù)的獲取困難重重。而且容易發(fā)生“單點(diǎn)失效”問(wèn)題,也就是數(shù)據(jù)擁有方服務(wù)器故障,則所有的數(shù)據(jù)將不復(fù)存在。而區(qū)塊鏈數(shù)據(jù)庫(kù)是一個(gè)全新的分布式數(shù)據(jù)庫(kù)技術(shù),其自身的技術(shù)特點(diǎn)能夠非常好地克服以上幾點(diǎn)問(wèn)題。有文獻(xiàn)提出運(yùn)用區(qū)塊鏈進(jìn)行體育大數(shù)據(jù)的存儲(chǔ)與共享[8]。借鑒此思路,該研究將區(qū)塊鏈技術(shù)應(yīng)用于籃球比賽數(shù)據(jù)庫(kù)。首先,所有籃球相關(guān)的實(shí)體(觀眾、媒體、籃協(xié)以及俱樂(lè)部等)會(huì)在區(qū)塊鏈的網(wǎng)絡(luò)中注冊(cè)成為合法的節(jié)點(diǎn),享受區(qū)塊鏈網(wǎng)絡(luò)中的數(shù)據(jù)服務(wù)。然后,隨著多種籃球比賽的進(jìn)行,會(huì)產(chǎn)生大量的數(shù)據(jù)。由于區(qū)塊鏈?zhǔn)且环N去中心化的數(shù)據(jù)庫(kù)技術(shù),不存在可信的第三方實(shí)體來(lái)記錄數(shù)據(jù)。此時(shí),區(qū)塊鏈系統(tǒng)將按照特定的規(guī)則(共識(shí)機(jī)制)選擇一個(gè)節(jié)點(diǎn)來(lái)記錄數(shù)據(jù)并上傳到區(qū)塊鏈網(wǎng)絡(luò)中,當(dāng)某個(gè)節(jié)點(diǎn)上傳到網(wǎng)絡(luò)中的數(shù)據(jù)被其他節(jié)點(diǎn)驗(yàn)證(也就是驗(yàn)證數(shù)據(jù)真實(shí)可靠)之后,該數(shù)據(jù)將出現(xiàn)在網(wǎng)絡(luò)中所有節(jié)點(diǎn)的內(nèi)存中。而負(fù)責(zé)上傳數(shù)據(jù)和驗(yàn)證數(shù)據(jù)的節(jié)點(diǎn)也將受到一定的物質(zhì)激勵(lì)。在區(qū)塊鏈數(shù)據(jù)庫(kù)中,每一個(gè)區(qū)塊鏈中的實(shí)體將擁有一個(gè)所有數(shù)據(jù)的完整備份,這就解決了籃球數(shù)據(jù)的流通性與共享問(wèn)題。另外,就算某個(gè)節(jié)點(diǎn)的數(shù)據(jù)庫(kù)發(fā)生故障,也可以從其他節(jié)點(diǎn)處拷貝從而得到恢復(fù),這也就很好地解決了“單點(diǎn)失效”問(wèn)題。
在籃球比賽過(guò)程中,對(duì)于對(duì)手籃球戰(zhàn)術(shù)的分析僅靠肉眼往往難以快速作出判斷,這就需要借助計(jì)算能力較強(qiáng)的智能計(jì)算機(jī)來(lái)輔助分析。雖然智能手機(jī)計(jì)算能力有所加強(qiáng),但是想要做到快速準(zhǔn)確分析還是天方夜譚。因此,現(xiàn)有的技術(shù)手段需要將大量圖像數(shù)據(jù)上傳至云服務(wù)器(計(jì)算能力強(qiáng)大的計(jì)算機(jī)一般較比賽場(chǎng)地較遠(yuǎn)),如果利用衛(wèi)星通信傳輸大量數(shù)據(jù),較長(zhǎng)的傳輸距離會(huì)產(chǎn)生較大計(jì)算時(shí)延,也無(wú)法快速對(duì)比賽做出分析。因此,將云服務(wù)器拉近用戶是非常有必要的。邊緣計(jì)算平臺(tái)的架設(shè)就是遵循了這一思路,將擁有強(qiáng)大計(jì)算能力的邊緣計(jì)算服務(wù)器部署在靠近籃球比賽場(chǎng)地的區(qū)域,并將其接入無(wú)線局域網(wǎng),這樣籃球數(shù)據(jù)分析的需求方可以直接通過(guò)無(wú)線局域網(wǎng)上傳數(shù)據(jù)至邊緣計(jì)算服務(wù)器分析,避開(kāi)云服務(wù)器的冗長(zhǎng)傳輸距離,就近處理,對(duì)籃球比賽中的數(shù)據(jù)分析快速作出反應(yīng)。
在數(shù)據(jù)庫(kù)與邊緣計(jì)算平臺(tái)這些硬件準(zhǔn)備完成之后,數(shù)據(jù)處理算法將成為整個(gè)數(shù)據(jù)分析平臺(tái)的核心競(jìng)爭(zhēng)力。一方面,數(shù)據(jù)分析算法較為簡(jiǎn)單,只能對(duì)于籃球分析數(shù)據(jù)做簡(jiǎn)單分類,而后續(xù)的分析工作大多是借助人工分析才能得到結(jié)論。另一方面,現(xiàn)有的數(shù)據(jù)分析算法是靜態(tài)的,只能判斷“是與否”的問(wèn)題,也就是只能判斷出對(duì)手的戰(zhàn)術(shù)是否是現(xiàn)有的某種戰(zhàn)術(shù),對(duì)于對(duì)手運(yùn)用的新型戰(zhàn)術(shù),做不到識(shí)別與判斷。此時(shí),機(jī)器學(xué)習(xí)算法便可以良好地適配該問(wèn)題。例如,有研究設(shè)計(jì)了一種機(jī)器學(xué)習(xí)框架來(lái)對(duì)體育運(yùn)動(dòng)結(jié)果預(yù)測(cè)進(jìn)行預(yù)測(cè)[9]。此外,還有研究匯總了人工智能在體育行業(yè)的應(yīng)用前景,指出體育數(shù)據(jù)分析前景廣闊[10]。由此可見(jiàn),機(jī)器學(xué)習(xí)算法應(yīng)用到籃球數(shù)據(jù)分析也是大有裨益的。機(jī)器學(xué)習(xí)算法是自適應(yīng)與自演化算法的集合,能夠自主提取數(shù)據(jù)中的特征數(shù)據(jù),并對(duì)數(shù)據(jù)做到更加智能的分析,并且隨著對(duì)手戰(zhàn)術(shù)的變化,算法本身也可以進(jìn)行動(dòng)態(tài)的演進(jìn),不斷識(shí)別新的戰(zhàn)術(shù),豐富關(guān)于對(duì)手的戰(zhàn)術(shù)庫(kù),為更好地應(yīng)對(duì)對(duì)手的戰(zhàn)術(shù)提出對(duì)策。
新型的數(shù)據(jù)分析平臺(tái)將克服現(xiàn)有籃球數(shù)據(jù)分析平臺(tái)的幾大問(wèn)題。利用區(qū)塊鏈構(gòu)建籃球數(shù)據(jù)庫(kù),將更好地實(shí)現(xiàn)籃球數(shù)據(jù)的共享,為各單位實(shí)現(xiàn)籃球數(shù)據(jù)的分析提供便利。利用邊緣計(jì)算技術(shù)就近解決籃球數(shù)據(jù)分析問(wèn)題提高數(shù)據(jù)分析的實(shí)時(shí)性,便于快速做出應(yīng)對(duì)。利用先進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行數(shù)據(jù)分析,將提高數(shù)據(jù)分析的準(zhǔn)確性,提高比賽的勝率。