高長玉, 李 丹, 侯 文, 高清宇
(1.大連醫(yī)科大學(xué) 現(xiàn)代教育技術(shù)中心,遼寧 大連 116044; 2.遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連 116029;3.大連外國語大學(xué) 孔子學(xué)院工作處,遼寧 大連 116044)
?
基于Bradley-Terry模型的中國男子籃球職業(yè)聯(lián)賽球隊(duì)實(shí)力分析
高長玉1, 李 丹2, 侯 文2, 高清宇3
(1.大連醫(yī)科大學(xué) 現(xiàn)代教育技術(shù)中心,遼寧 大連 116044; 2.遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連 116029;3.大連外國語大學(xué) 孔子學(xué)院工作處,遼寧 大連 116044)
隨著體育事業(yè)及體育科學(xué)的發(fā)展,與體育相關(guān)的數(shù)據(jù)分析和統(tǒng)計(jì)工作也越來越得到重視.基于Bradley-Terry模型,對(duì)2015—2016賽季中國男子籃球職業(yè)聯(lián)賽數(shù)據(jù)進(jìn)行分析,得到了20支參賽球隊(duì)的實(shí)力指數(shù)估計(jì)值和主場(chǎng)效應(yīng)指數(shù),基本反映了各支球隊(duì)真實(shí)的實(shí)力水平.此外,對(duì)籃球技術(shù)指標(biāo)進(jìn)行因素分析,得到籃板球、助攻和投籃命中率是影響球隊(duì)實(shí)力指數(shù)的主要技術(shù)指標(biāo),為今后預(yù)測(cè)體育賽事和提高球隊(duì)的技戰(zhàn)術(shù)水平提供依據(jù).
成對(duì)比較數(shù)據(jù);Bradley-Terry模型;實(shí)力指數(shù)
近幾年,隨著我國政府對(duì)體育事業(yè)發(fā)展的支持力度不斷加大,特別以中國男子籃球職業(yè)聯(lián)賽(以下簡稱CBA)為代表的職業(yè)體育賽事也得到了極大的發(fā)展,運(yùn)動(dòng)競(jìng)技水平也在不斷提高,比賽精彩紛呈,吸引了廣大體育愛好者的關(guān)注.同時(shí),與體育賽事相關(guān)的體育博彩業(yè)也得到了相應(yīng)的發(fā)展.當(dāng)2支球隊(duì)進(jìn)行比賽,球隊(duì)的實(shí)力往往決定比賽的結(jié)果,當(dāng)一個(gè)強(qiáng)隊(duì)同一個(gè)弱隊(duì)進(jìn)行比賽時(shí),我們理所當(dāng)然會(huì)認(rèn)為強(qiáng)隊(duì)贏或者得分率會(huì)高,機(jī)會(huì)只會(huì)在個(gè)別場(chǎng)次比賽中起或多或少的作用,這些都可以通過對(duì)比賽數(shù)據(jù)的統(tǒng)計(jì)分析來驗(yàn)證.因此,對(duì)體育賽事結(jié)果進(jìn)行數(shù)據(jù)分析是體育博彩業(yè)的基礎(chǔ).
Bradley-Terry模型最早是由Bradley和Terry[1]在1952年提出的,是針對(duì)成對(duì)比較數(shù)據(jù)的模型.后來,Bradley[2-3]又詳細(xì)地討論了Bradley-Terry模型中的極大似然估計(jì)的漸近性、假設(shè)檢驗(yàn)、置信空間等問題.由于Bradley-Terry模型在成對(duì)比較數(shù)據(jù)模型中具有良好的統(tǒng)計(jì)性質(zhì),因此,Bradley-Terry模型已應(yīng)用到了生物醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等很多領(lǐng)域[4-7].而很多體育項(xiàng)目比賽結(jié)果數(shù)據(jù)屬于成對(duì)比較數(shù)據(jù),Bradley-Terry模型也可應(yīng)用其中.例如,Koehler和Ridpath[8]利用Bradley-Terry模型分析了1977—1978賽季美國男子籃球職業(yè)聯(lián)賽球隊(duì)的實(shí)力,并評(píng)估出每支球隊(duì)的主場(chǎng)優(yōu)勢(shì).Mchale和 Morton[9]利用Bradley-Terry模型對(duì)2000—2008賽季的國際男子職業(yè)網(wǎng)球巡回賽選手的排名進(jìn)行了預(yù)測(cè).Balreira、Miceli和Tegtmeyer[10]運(yùn)用Bradley-Terry模型對(duì)2002—2013賽季的美國職業(yè)橄欖球比賽數(shù)據(jù)進(jìn)行了擬合,給出了各支球隊(duì)獲勝的概率.我國在這方面研究的文獻(xiàn)很少.
本文采用Bradley-Terry模型擬合2015—2016賽季的CBA的賽事數(shù)據(jù),估計(jì)各支參賽球隊(duì)的實(shí)力指數(shù),以及球隊(duì)實(shí)力的影響因素分析.
1.1 Bradley-Terry模型
設(shè)有n個(gè)個(gè)體參與成對(duì)比較,記為“1,2,…,n”,假設(shè)個(gè)體r有真實(shí)的能力參數(shù)γr,令Pr,s表示個(gè)體r優(yōu)于個(gè)體s的概率,Bradley-Terry模型將Pr,s表示為Logit模型形式
Pr,s=exp (γr-γs)/[1+exp (γr-γs)].
(1)
在體育比賽中,不失一般性,比賽結(jié)果有2種情況.設(shè)Yrs表示主隊(duì)ar與客隊(duì)as的比賽結(jié)果,Yrs=1,表示主隊(duì)ar獲勝,Yrs=0,表示客隊(duì)as獲勝.如果考慮比賽的主場(chǎng)因素,就需要在Bradley-Terry模型(1)中加入所有球隊(duì)主場(chǎng)效應(yīng)參數(shù)η,模型表示為
P(Yrs=1)=exp (η+γr-γs)/[1+exp (η+γr-γs)].
(2)
1.2 模型的解釋變量
為了能夠解釋一些個(gè)體優(yōu)于其他個(gè)體的原因,就需要找出可能影響個(gè)體能力差異的一些因素,然后建立回歸模型,這些因素就是個(gè)體能力的解釋變量.
以γr表示個(gè)體ar的能力參數(shù),如果每一個(gè)個(gè)體的能力都與解釋變量xr1,xr2,…,xrm有關(guān),β1,β2,…,βm是解釋變量的系數(shù),Ur是獨(dú)立的誤差項(xiàng),并且Ur~N(0,σ2).個(gè)體能力γr與各解釋變量的模型為
個(gè)體ar與個(gè)體as的能力值之間差異的模型為
(3)
將式(3)帶入式(1)就構(gòu)成一個(gè)廣義線性混合模型,可以用懲罰擬似然方法對(duì)模型參數(shù)進(jìn)行估計(jì)[11].
CBA聯(lián)賽開始于1995年,創(chuàng)辦之初有12支球隊(duì)參賽,發(fā)展到現(xiàn)在有20支球隊(duì)參賽.賽季比賽分常規(guī)賽和季后賽2個(gè)階段進(jìn)行,每年聯(lián)賽最后2名降級(jí),下級(jí)聯(lián)賽的前2名升入CBA聯(lián)賽.在常規(guī)賽中,所有參賽球隊(duì)進(jìn)行雙循環(huán)比賽,即每支球隊(duì)要打38場(chǎng)比賽,分別在主場(chǎng)和客場(chǎng)各進(jìn)行19場(chǎng)比賽,所有比賽的總場(chǎng)數(shù)為380場(chǎng).比賽計(jì)分方式為勝1場(chǎng)得2分,負(fù)1場(chǎng)得1分,棄權(quán)得0分.常規(guī)賽按比賽勝場(chǎng)數(shù)/負(fù)場(chǎng)數(shù)比率確定常規(guī)賽總排名,勝場(chǎng)率高者名次列前.2015—2016賽季參賽的20支球隊(duì)按它們?cè)诔R?guī)賽的積分順序列于表1的第1列和第2列.
近幾個(gè)賽季,各支球隊(duì)為營造主場(chǎng)球市氛圍,球隊(duì)在主場(chǎng)實(shí)力都得到充分展示,主場(chǎng)勝率較高,所以用帶有主場(chǎng)效應(yīng)的Bradley-Terry模型(2)擬合2015—2016賽季常規(guī)賽380場(chǎng)比賽結(jié)果數(shù)據(jù).由模型識(shí)別條件,設(shè)定八一隊(duì)實(shí)力指數(shù)為0,其他各隊(duì)實(shí)力指數(shù)的估計(jì)值及其對(duì)應(yīng)的標(biāo)準(zhǔn)誤分別列于表1的第3列和第4列.由于需要比較各支球隊(duì)實(shí)力間的差異,故要計(jì)算擬標(biāo)準(zhǔn)誤,其定義和計(jì)算方法見Firth和Menezes[12]的論著,主要用于分類數(shù)據(jù)中類別之間比較.各支球隊(duì)擬標(biāo)準(zhǔn)誤的值見第5列.根據(jù)實(shí)力參數(shù)的估計(jì)值及其標(biāo)準(zhǔn)誤計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量Z值列于第6列,其對(duì)應(yīng)的概率在第7列,根據(jù)各支球隊(duì)實(shí)力估計(jì)值排名見第8列.
表1 2015—2016賽季CBA聯(lián)賽球隊(duì)實(shí)力估計(jì)結(jié)果
注:數(shù)據(jù)來源于文獻(xiàn)[13]
球隊(duì)的實(shí)力往往決定比賽的結(jié)果,那么影響球隊(duì)實(shí)力的因素是什么呢?根據(jù)葉慶暉和鄧飛[14]以及張斌[15]對(duì)籃球技術(shù)特點(diǎn)的研究文獻(xiàn), 選擇可能影響球隊(duì)實(shí)力的7項(xiàng)技術(shù)指標(biāo)代入模型(3)中進(jìn)行影響因素的分析,具體技術(shù)指標(biāo)及其參數(shù)估計(jì)結(jié)果見表2.
廣義線性混合模型中包括固定效應(yīng)和隨機(jī)效應(yīng)2部分.在隨機(jī)效應(yīng)檢驗(yàn)中,剩余標(biāo)準(zhǔn)差為0.891 1(0.260 4),非常顯著,說明混合模型是成立的.固定效應(yīng)分析結(jié)果見表2.在表2中,固定效應(yīng)中顯著影響球隊(duì)實(shí)力的技術(shù)指標(biāo)有投籃命中率、籃板球和助攻3項(xiàng),其他技術(shù)指標(biāo)對(duì)球隊(duì)實(shí)力沒有顯著性影響.
表2 影響因素估計(jì)結(jié)果
基于Bradley-Terry模型分析了中國職業(yè)體育比賽中具有影響的CBA聯(lián)賽賽事數(shù)據(jù),探討了參賽球隊(duì)的實(shí)力指數(shù)及其影響因素,該方法也可以用于其他項(xiàng)目的賽事數(shù)據(jù)分析.
對(duì)CBA球隊(duì)實(shí)力影響較大的常規(guī)技術(shù)指標(biāo)分別是總投籃命中率、籃板球和助攻,這為球隊(duì)有針對(duì)性訓(xùn)練,提高球隊(duì)實(shí)力提供參考依據(jù).不過本研究只局限于一個(gè)賽季數(shù)據(jù),影響球隊(duì)實(shí)力的技術(shù)指標(biāo)只是在本賽季是顯著的,在其他賽季這種影響是否顯著,是否還有其他技術(shù)指標(biāo)對(duì)球隊(duì)實(shí)力也有影響還需進(jìn)一步研究.同時(shí),在不同國家聯(lián)賽球隊(duì)的技戰(zhàn)術(shù)水平和特點(diǎn)不同,影響球隊(duì)實(shí)力的技術(shù)指標(biāo)也會(huì)有所差異.
一般運(yùn)營成熟有影響的體育賽事賽季時(shí)間都比較長,各支球隊(duì)的實(shí)力會(huì)受傷病、疲勞、客場(chǎng)的地域環(huán)境等各種因素的影響,球隊(duì)實(shí)力會(huì)產(chǎn)生波動(dòng).如何能在基本Bradley-Terry模型中附加一些參數(shù),能夠反映這些因素造成的球隊(duì)實(shí)力變化,是需要研究的課題.
[1] BRADLEY R A,TERRY M E.Rank analysis of incomplete block designs Ⅰ. The method of paired comparisons[J].Biometrika,1952,39(3):324.
[2] BRADLEY R A.Incomplete block rank analysis:on the appropriateness of the model for a method of paired comparisons[J].Biometrics,1954,10(3):375-390.
[3] BRADLEY R A.Rank analysis of incomplete block designs Ⅲ. Some large-sample results on estimation and power for a method of paired comparisons[J].Biometrika,1955,42(3):450-470.
[4] ATKINSON D R,WAMPOLD B E,LOWE S M,et al.Asian American preferences for counselor characteristics:application of the Bradley-Terry-Luce model to paired comparison data[J].Counseling Psychologist,1998,26(1):101-123.
[5] MCMANUS I C,RICHARDS P,WINDER B C.Do UK medical school applicants prefer interviewing to non-interviewing schools?[J].Advances in Health Sciences Education,1999,4(2):155-165.
[6] ZEITHAML V A.Service quality,profitability, and the economic worth of customers:what we know and what we need to learn[J].Journal of the Academy of Marketing Science,2000,28(1):67-85.
[7] SINSHEIMER J S, MCKENZIE C A,KEAVNEY B,et al.SNPs and snails and puppy dogs'tails:analysis of SNP haplotype data using the gamete competition model[J].Annals of Human Genetics,2001,65(5):483-490.
[8] KOEHLER K J, RIDPATH H.An application of a biased version of the Bradley-Terry-Luce model to professional basketball results[J].Journal of Mathematical Psychology,1982,25(3):187-205.
[9] MCHALE I, MORTON A.A Bradley-Terry type model for forecasting tennis match results[J].International Journal of Forecasting,2011,27(2):619-630.
[10] BALREIRA E C,MICELI B K,TEGTMEYER T.An oracle method to predict NFL games[J].Journal of Quantitative Analysis in Sports,2014,10(2):183-196.
[11] BRESLOW N E,CLAYTON D G.Approximate inference in generalized linear mixed models[J].Journal of the American Statistical Association,1993,88(421):9-25.
[12] FIRTH D,MENEZES R X.Quasi-variances[J].Biometrika,2004,91(1):65-80.
[13] 新浪竟技風(fēng)暴.中國籃球數(shù)據(jù)庫[EB/OL].(2016-06-09)[2016-12-28].http://cba.sports.sina.com.cn/cba/schedule?qleagueid=171&qmonth=&qteamid=2016-06-09.
[14] 葉慶暉,鄧飛.男子籃球比賽常規(guī)技術(shù)統(tǒng)計(jì)指標(biāo)與比賽名次相關(guān)關(guān)系的分析研究[J].中國體育科技,1999,35(12):28-29.
[15] 張斌.亞、歐洲男子籃球技術(shù)戰(zhàn)術(shù)特點(diǎn)研究[J].北京體育大學(xué)學(xué)報(bào), 2010,33(7):137-141.
Analysis of ability about China Basketball Association team based on Bradley-Terry model
GAOChangyu1,LIDan2,HOUWen2,GAOQingyu3
(1.Modem Educational Technology Center, Dalian Medical University, Dalian 116044, China; 2.School of Mathematics, Liaoning Normal University, Dalian 116029, China; 3.Confucius College Office, Dalian University of Foreign Languages, Dalian 116044, China)
With the development of sports cause and sports science in China, data analysis and statistical works on sports have attracted more and more concerns. We analyze the data of the ability index about 20 teams and technical indicators factors affecting team’s ability index within the Bradley-Terry model about China Basketball Association in 2015—2016,and the results reflect the true ability level of each team. In addition, we find that for rebound of basketball, assisting and shooting average are the main technical indicators which affect team’s ability index which provide some evidence for predicting sports events and improving skills and tactics of sport teams.
paired comparison data;Bradley-Terry model;ability index
2017-01-20
高長玉(1963-),男,遼寧營口人,大連醫(yī)科大學(xué)教授研究員級(jí)高級(jí)工程師.
1000-1735(2017)02-0145-05
10.11679/lsxblk2017020145
O213
A
遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2017年2期