黃曉敏
(天津大學(xué) 天津 300072)
基于計(jì)量模型的NBA籃球成績(jī)影響因素分析
黃曉敏
(天津大學(xué) 天津 300072)
美國(guó)NBA籃球聯(lián)賽深受廣大群體喜愛(ài),對(duì)籃球這項(xiàng)體育運(yùn)動(dòng)有著重要影響,因此對(duì)于NBA球員的數(shù)據(jù)分析很有意義。文中首先介紹了背景意義,問(wèn)題提出和描述;其次對(duì)NBA30名球員的數(shù)據(jù)進(jìn)行了Spss因子分析;最后,對(duì)模型與實(shí)際之間做出了貼合度解釋,分析了球員籃球成績(jī)的影響因素。
因子分析;計(jì)量模型;影響因素;籃球
美國(guó)職業(yè)男子籃球聯(lián)賽(NBA,全稱 National Basketball Association)是最受廣大群體喜愛(ài)的籃球聯(lián)賽之一,其日益精進(jìn)的球員技能與球場(chǎng)戰(zhàn)術(shù)對(duì)籃球運(yùn)動(dòng)的進(jìn)步起了巨大的推動(dòng)作用,因此對(duì)于NBA球員的數(shù)據(jù)分析很有意義[1]。
因子分析是指從研究相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),根據(jù)相關(guān)性大小把原始變量分組,使組內(nèi)的變量之間相關(guān)性較高,而不同組變量的相關(guān)性則較低,把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法[2]。在研究NBA球員數(shù)據(jù)時(shí),由于指標(biāo)較多增加了分析問(wèn)題的復(fù)雜性和難度,因此用因子分析法找到合理的個(gè)數(shù)較少的指標(biāo)去替代眾多的指標(biāo)[3]。
文中將會(huì)對(duì)抽取的30名球員在他們2010-2011年的各項(xiàng)指標(biāo)的得分統(tǒng)計(jì)進(jìn)行因子分析,來(lái)看這些指標(biāo)間的相關(guān)性并進(jìn)行指標(biāo)分類(lèi),所有分析都采用了spss18程序。
本次數(shù)據(jù)來(lái)源于“搜狐NBA數(shù)據(jù)中心(2010—2011年)”,其中對(duì)原始變量進(jìn)行了標(biāo)準(zhǔn)化:Z出場(chǎng)次數(shù)、Z場(chǎng)均時(shí)間、Z得分、Z二分命中(個(gè)數(shù))、Z二分出手次數(shù)、Z二分命中率、Z三分命中(個(gè)數(shù))、Z三分出手次數(shù)、Z三分命中率、Z罰球命中(個(gè)數(shù))、Z罰球出手次數(shù)、Z罰球命中率。接下來(lái)的運(yùn)行分析都是用對(duì)標(biāo)準(zhǔn)化后的變量進(jìn)行的。
從搜集的數(shù)據(jù)中進(jìn)行現(xiàn)實(shí)的邏輯推理,可以看出原始變量之間是有著不同的相關(guān)性的。例如,三分命中、三分出手次數(shù)和三分命中率之間應(yīng)該是高度相關(guān)的。
在此,假設(shè)一個(gè)因子分析模型:
其中S代表因子總得分;λi代表第i個(gè)因子方差的百分比,(λ1+λ2+…λn)代表提取的n個(gè)因子累積百分比;Fi代表提取的第i個(gè)因子。
在輸入自變量之前,經(jīng)過(guò)分析,初步認(rèn)為“Z得分”變量與其他變量不容易區(qū)分,也不好分類(lèi)解釋,因此在輸入時(shí)將其提前剔除。
進(jìn)行KMO和Bartlett的檢驗(yàn),KMO的度量值為0.625大于0.5;Sig.的值為0.00遠(yuǎn)小于0.05,說(shuō)明這些變量可作因子分析。
公因子方差分析中的各個(gè)變量的因子共同度都在0.7之上,說(shuō)明這11個(gè)變量很好的被3個(gè)因子解釋。在解釋的總方差中,第一個(gè)因子的特征值為5.061,大約占去方差的46.006%,基于過(guò)程內(nèi)定取特征值大于1的原則,提取了前3個(gè)因子,這3個(gè)因子的特征值共占去方差的83.615%,所以提取的因子是合理的,并且放棄的其他9個(gè)因子解釋的方差占不到20%,因此,能夠說(shuō)明前3個(gè)因子提供了原始數(shù)據(jù)的足夠信息。在得出的碎石圖中,前3個(gè)因子的特征根都大于1,從第4個(gè)主成分開(kāi)始特征根就比較低,可以認(rèn)為前3個(gè)因子能概括絕大部分信息。
在做出初始因子負(fù)荷矩陣后,發(fā)現(xiàn)前3個(gè)因子在原始變量上的載荷值相差不太大,故不能很明確的解釋各個(gè)公因子,因此需要下一步的因子旋轉(zhuǎn)。在得出的旋轉(zhuǎn)后的因子負(fù)荷矩陣中,因子系數(shù)已經(jīng)明顯的出現(xiàn)分化。其中成分1中絕對(duì)值大的主要有:Z三分命中、Z三分出手次數(shù)、Z三分命中率、Z二分命中率、Z罰球命中率;成分2中:Z場(chǎng)均時(shí)間、Z二分命中、Z二分出手次數(shù)、Z罰球命中、Z罰球出手次數(shù);成分3中:Z出場(chǎng)次數(shù)。
對(duì)以上的分類(lèi)進(jìn)行解釋時(shí),發(fā)現(xiàn)成分3和成分2是有現(xiàn)實(shí)意義的,但是,在成分1中,發(fā)現(xiàn)Z二分命中率是呈負(fù)相關(guān),與實(shí)際意義有偏頗;而Z罰球命中率在成分2中會(huì)更好解釋。基于此,下面會(huì)剔除這兩個(gè)變量(Z二分命中率、Z罰球命中率)進(jìn)行第二次的因子分析。
從旋轉(zhuǎn)后的因子散點(diǎn)圖中可以看出成分1、成分2和成分3與11個(gè)原始變量之間的關(guān)系。并且在成分得分協(xié)方差矩陣中,旋轉(zhuǎn)后的成分1、成分2和成分3之間的相關(guān)系數(shù)為0,說(shuō)明各因子間是互補(bǔ)相關(guān)的,提取的3個(gè)因子是合理的。
基于第一次的運(yùn)算和分析,尤其是對(duì)初始因子負(fù)荷矩陣和旋轉(zhuǎn)后的因子負(fù)荷矩陣的分析,在這次的修正中決定剔除變量“Z二分命中率”“Z罰球命中率”。
表1 KMO和Bartlett的檢驗(yàn)Tab.1 KMO and Bartlett’s test
從表1中可以得知,KMO度量值為0.665大于0.5,球形檢驗(yàn)的Sig.值為0.00遠(yuǎn)小于0.05,檢驗(yàn)P值十分接近于0,這就說(shuō)明變量之間有很強(qiáng)的相關(guān)關(guān)系[4]。因此說(shuō)明可以進(jìn)行因子分析。
表2 公因子方差Tab.2 Common factor variance
從表2中可以看出這9個(gè)變量的因子共同度均在0.7以上,可以很好的被3個(gè)因子解釋。
表3顯示:根據(jù)內(nèi)定取特征值大于1的原則,提取了前3個(gè)因子。第一個(gè)因子的特征值為4.511,大約占去方差的50.118%,前3個(gè)因子共占去方差的87.416%,比第一次高,所以提取的因子是合理的,放棄的其余6個(gè)因子解釋的方差不到20%,更加說(shuō)明前3個(gè)因子提供了原始數(shù)據(jù)的足夠多的信息。
表3 解釋的總方差Tab.3 Total variance explained
從圖1中可知,前3個(gè)因子的特征根都大于1,從第4個(gè)成分開(kāi)始特征根就比較低,且特征值小于1,因此前3個(gè)因子能概括絕大部分信息。
表4是初始因子負(fù)荷矩陣,可以看出這3個(gè)成分在變量上的載荷值都相差不大,因此需要進(jìn)一步進(jìn)行因子旋轉(zhuǎn)以便更好的解釋。
圖1 碎石圖Fig.1 Scree piot
表4 成分矩陣Tab.4 Component matrix
表5 旋轉(zhuǎn)成分矩陣Tab.5 Rotating component matrix
從表5中得出,屬于成分1的變量有:Z場(chǎng)均時(shí)間、Z二分命中(個(gè)數(shù))、Z二分出手次數(shù)、Z罰球命中(個(gè)數(shù))、Z罰球出手次數(shù);屬于成分2的變量有:Z三分命中(個(gè)數(shù))、Z三分出手次數(shù)、Z三分命中率;屬于成分3的變量有:Z出場(chǎng)次數(shù)。
可以看出,經(jīng)過(guò)這次的修正而得出因子分類(lèi)更加具有實(shí)際理論意義,并且解釋也會(huì)更符合實(shí)際。
圖2為因子散點(diǎn)圖,可以形象看出成分1、2、3與9個(gè)變量之間的關(guān)系,此圖中的各個(gè)變量能比較明顯的劃分出3類(lèi)。
圖2 旋轉(zhuǎn)空間中的成分圖Fig.2 Rotating components in space
表6中可以看出旋轉(zhuǎn)后的成分1、成分2和成分3之間的相關(guān)系數(shù)為0,很明顯各個(gè)因子互不相關(guān),說(shuō)明提取的3個(gè)因子是合理的、科學(xué)的。
基于本次修正的運(yùn)算和分析,可以看到本次的因子分析不論是在指標(biāo)數(shù)值上,還是實(shí)際意義上都是較好的,接下來(lái),便是對(duì)得出的結(jié)論進(jìn)行實(shí)際意義的解釋。
根據(jù)表9解釋的總方差,將得出的數(shù)值代入在第一節(jié)中建立的模型:
表6 成分得分協(xié)防差矩陣Tab.6 Ingredients of the covariance matrix
可以得出最終結(jié)果是:
其中F1即為成分1,包含變量:Z場(chǎng)均時(shí)間、Z二分命中(個(gè)數(shù))、Z二分出手次數(shù)、Z罰球命中(個(gè)數(shù))、Z罰球出手次數(shù);F2即為成分2,包含變量:Z三分命中(個(gè)數(shù))、Z三分出手次數(shù)、Z三分命中率;F3即為成分3,包含變量:Z出場(chǎng)次數(shù)。
結(jié)合整個(gè)分析,對(duì)3個(gè)成分的實(shí)際意義解釋如下:成分1為內(nèi)線能力,內(nèi)線的水平是一個(gè)球員得分的關(guān)鍵,籃下進(jìn)攻成為最有效的得分手段[5],因此它的系數(shù)0.491也是最大的;成分2為外線能力,外線能力在球場(chǎng)上是僅次于內(nèi)線能力的得分因素,三分命中率是影響球隊(duì)成績(jī)的一項(xiàng)重要技術(shù)指標(biāo)[6],因此,其系數(shù)0.369也是僅次于成分1的系數(shù);成分3為出場(chǎng)機(jī)會(huì),顯然,一個(gè)球員的內(nèi)外線水平再高也得在能有上場(chǎng)的前提下才能展現(xiàn)。
因此,在得出了實(shí)際解釋之后,可以將其借鑒應(yīng)用于籃球的比賽戰(zhàn)略上,在球場(chǎng)上最關(guān)鍵的是要捉住內(nèi)線進(jìn)攻,這是得分的核心所在,其次是外線的三分球得分,同時(shí)要合理分配優(yōu)秀球員的出場(chǎng)時(shí)間和次數(shù)。
[1]方博.基于NBA球員的聚類(lèi)分析和因子分析[J].科技視界,2013(11):80-82.
FANG Bo.Cluster analysis and factor analysis based on NBA player[J].Science & Technology View,2013(11):80-82.
[2]賈俊平.統(tǒng)計(jì)學(xué)[M].北京:中國(guó)人民大學(xué)出版社,2011.
[3]彭大松,左從現(xiàn).因子分析的統(tǒng)計(jì)思想及在體育科研中的應(yīng)用[J].四川體育科學(xué),2007(3):18-20,23.
PENG Da-song,ZUO Cong-xian.The thought of factor analysis and the applying in sports[J].Sichuan Sports Science,2007(3):18-20,23.
[4]于浩飛.因子分析、多元回歸分析與訓(xùn)練管理體系的建立[C]//中國(guó)體育科學(xué)學(xué)會(huì)運(yùn)動(dòng)訓(xùn)練學(xué)分會(huì),中國(guó)體育科學(xué)學(xué)會(huì)運(yùn)動(dòng)訓(xùn)練學(xué)分會(huì)第六屆全國(guó)田徑運(yùn)動(dòng)發(fā)展研究成果交流會(huì)論文集,2013:1342-1353.
[5]江巍,孫慶祝,易洪剛.因子分析、聚類(lèi)分析對(duì)第28屆奧運(yùn)會(huì)男子籃球比賽的應(yīng)用研究[J].中國(guó)體育科技,2007(3):94-97.
JIANG Wei,SUN Qing-zhu,YI Hong-gang.Factor and cluster analysis on the applied research of man.s basketball match in the 28th olympics games[J].China Sport Science and Technology,2007(3):94-97.
[6]劉毅.因子分析法對(duì)第16屆女子籃球世錦賽各球隊(duì)技術(shù)指標(biāo)的分析[J].體育科技文獻(xiàn)通報(bào),2012(3):40-41.
LIU Yi.Factor analysis on technical indexes of each Team in the 16th women's basketball championship[J].Bulletin of Sport Science& Technology,2012(3):40-41.
The analysis of inf l uencing factors of the NBA basketball scores based on the measurement model
HUANG Xiao-min
(Tianjin University,Tianjin 300072, China)
NBA basketball league is very popular with the general population, and has an important influence for the basketball sports , therefore ,it is very meaningful for analysing the data of NBA players.This paper firstly introduces the background,and proposes and describes the problem.Secondly,using Spss factor analysis for the 30 players’ data of NBA .Finally, giving a rational explaination between the model and the practice, and analyses the influence factors of basketball players’ scores.
factor analysis;measurement model;influence factor;basketball
TN802
A
1674-6236(2014)14-0031-03
2013-09-27 稿件編號(hào):201309210
黃曉敏(1988—),女,山東淄博人,碩士研究生。研究方向:創(chuàng)意經(jīng)濟(jì),計(jì)量經(jīng)濟(jì)等。