• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      統(tǒng)計總體的3種形式及其在體育科研中的地位和作用

      2015-07-23 06:43:40魏登云吳家發(fā)
      天津體育學(xué)院學(xué)報 2015年4期
      關(guān)鍵詞:個體差異概率分布變量

      魏登云,吳家發(fā)

      ?

      ●體育科學(xué)研究方法Method of Sport Scientific Research

      統(tǒng)計總體的3種形式及其在體育科研中的地位和作用

      魏登云,吳家發(fā)

      摘要統(tǒng)計總體在體育統(tǒng)計應(yīng)用中具有重要作用,對統(tǒng)計總體的全面和深刻認(rèn)識關(guān)系到統(tǒng)計方法的正確應(yīng)用。從體育科研的實際出發(fā),提出統(tǒng)計總體的3種形式:原總體、數(shù)量化總體和模型化總體。3種形式總體的特征各有不同:原總體個體同質(zhì)性,數(shù)量化總體個體差異性,模型化總體個體同分布。3種形式總體的地位和作用各不相同:原總體是定量分析的出發(fā)點和歸宿,對統(tǒng)計方法有引導(dǎo)作用,對統(tǒng)計處理結(jié)果起決定作用;數(shù)量化總體是研究目的的操作化,是量的規(guī)律的承載體,也是樣本數(shù)據(jù)的母體;模型化總體則是統(tǒng)計規(guī)律的反映形式,是揭示統(tǒng)計規(guī)律的必要手段。確定總體時需要重點把握確定試驗對象的共同屬性、準(zhǔn)確體現(xiàn)研究變量的價值信息和正確把握隨機變量及其分布模型3個方面。

      關(guān)鍵詞統(tǒng)計總體;試驗;變量;概率分布;共性特征;個體差異

      統(tǒng)計總體是統(tǒng)計學(xué)的基本概念,無論是數(shù)理統(tǒng)計學(xué),還是應(yīng)用統(tǒng)計學(xué),統(tǒng)計總體都無可爭辯地被視為最重要的概念。一般看來,作為概念,總體不難解釋,各類教科書中關(guān)于總體的定義基本上一致。但在應(yīng)用領(lǐng)域面對具體問題,需要明確總體是什么的時候,難度遠(yuǎn)比想象的大。因為實際問題錯綜復(fù)雜,總體的內(nèi)容和形式多樣,針對一個具體問題,關(guān)于“總體是什么”的問題,人們的理解和看法出現(xiàn)了分歧,由此引發(fā)了激烈爭議[1-6],甚至波及到對“什么是總體”的重新審視。在體育科研中,由于總體不明確,導(dǎo)致的問題也確實不少[7]。

      實際上,在體育統(tǒng)計方法應(yīng)用中,總體的地位和身份很特殊,她既是研究目的的操作化體現(xiàn),又與研究手段相關(guān)聯(lián),還在統(tǒng)計結(jié)果中扮演著重要的角色。在不同的工作環(huán)節(jié)中,總體的表現(xiàn)形式不同,不同形式的總體各有其實際價值,不能互相替代,但又是統(tǒng)一的。如果對總體的內(nèi)涵認(rèn)識模糊,混淆總體的表現(xiàn)形式,將會導(dǎo)致統(tǒng)計方法的應(yīng)用錯誤,而且錯誤之處不容易被發(fā)現(xiàn)。

      本文擬從體育科研的實際出發(fā),討論總體的形式、不同形式總體的價值以及應(yīng)用中如何把握總體。

      1 總體的形式

      什么是總體?作為概念,人們對總體的定義是基本一致的:根據(jù)研究目的所確定的對象的全體。但是針對某一個具體問題,總體是什么?在統(tǒng)計學(xué)文獻中有不同的描述。如研究某工廠生產(chǎn)的電子元件的壽命,總體是“該工廠生產(chǎn)的電子元件的全體”,其中每一個單個元件是一個個體,這里的總體是一批“物”的全體;總體也可以是“該工廠生產(chǎn)的電子元件壽命的全體”,個體是單個元件的壽命,這里的總體是一批“數(shù)”的全體;該工廠生產(chǎn)的電子元件的壽命是一個變量,總體還可以描述為“具有某種概率分布的一個隨機變量”[8-9]。同一個具體問題,總體為什么有或為什么需要有不同的描述,這正是本文的研究目的。關(guān)于總體的不同描述,實際上是具體應(yīng)用中總體的不同形式。實際應(yīng)用中,總體有3種形式,為了表述方便,分別稱之為原總體、數(shù)量化總體和模型化總體。

      1.1原總體

      運用統(tǒng)計學(xué)原理和方法解決實際問題,首先就要根據(jù)研究目的確定與所研究問題有關(guān)的對象。如觀察對象、測試對象和實驗對象等,統(tǒng)稱為試驗對象。具體問題中,試驗對象可能是人、物、現(xiàn)象或行為等。所有試驗對象的全體,稱為原總體,其中的每一個試驗對象稱為個體。原總體不考慮課題研究的指標(biāo),只關(guān)心試驗對象的同質(zhì)屬性。

      例1:研究安徽省成年男子的身高分布狀況。

      原總體是安徽省所有成年男子的全體,每一個成年男子是一個個體,這里的原總體是一類“人”的全體。

      例2:研究某人的籃球投籃命中率,令其在相同條件下重復(fù)投籃若干次。

      這里研究者關(guān)注的“對象”不是這個“人”,而是此人的“投籃”現(xiàn)象。所以,原總體是此人在相同條件下所有可能的重復(fù)投籃的全體,個體是其中的一次投籃。

      需要說明的是,例2中的總體是“無窮多次投籃的全體”,而不是“無窮多次投籃結(jié)果的全體”?!巴痘@”與“投籃結(jié)果”是不同的,“投籃”是一次行為或現(xiàn)象,而“投籃結(jié)果”是一種可以量化的結(jié)果,這正是原總體與數(shù)量化總體的區(qū)別。

      1.2數(shù)量化總體

      實際問題盡管多種多樣,但從定量分析(尤其是統(tǒng)計學(xué))的角度看,研究目的無非是分析“在某一類對象上,某些變量(在一般統(tǒng)計學(xué)著作中也稱指標(biāo)或項目,在經(jīng)濟、管理類統(tǒng)計學(xué)中,稱為標(biāo)志,而指標(biāo)卻另有指稱,為了避免誤解,本文稱為變量)的分布情況”或“某些變量在某類對象上的規(guī)律”。涉及到2大要素,即“對象”和“變量”。原總體已經(jīng)把全體“對象”包羅起來,那么研究目的就是分析變量在原總體上的分布或規(guī)律,此時自然要考慮變量在原總體上的實現(xiàn),即原總體的數(shù)量化。經(jīng)過量化,原總體中的每一個個體都被賦予一個或一組變量值,所有個體“變量值”的全體也是總體,稱之為數(shù)量化總體,其中每一個個體“變量值”稱為個體。

      例1中,數(shù)量化總體是安徽省成年男子身高的全體,每一個人的身高值是一個個體。這里,課題研究的指標(biāo)是身高,數(shù)量化總體是試驗對象具體到“指標(biāo)”的結(jié)果。

      例2中,被關(guān)注的變量是“投籃結(jié)果”,該變量只取2個值,即“投籃命中”和“投籃不中”(實際應(yīng)用中通常以1和0表示2種結(jié)果),原總體中的個體“變量值”就是1或0。從形式上看,數(shù)量化總體是由無窮多個1和0構(gòu)成的,用語言描述為“此人在相同條件下所有可能的投籃結(jié)果的全體”。

      1.3模型化總體

      數(shù)量化總體是變量在原總體上“實現(xiàn)”的結(jié)果,變量在原總體上的分布規(guī)律完全蘊含在數(shù)量化總體中。但是,數(shù)量化總體畢竟是“個體集合”的形式,而且多數(shù)情況下數(shù)量化總體中的個體數(shù)是有限的,有限總體的分布形式只能是離散的,難以用簡潔的數(shù)學(xué)形式來表述。于是,統(tǒng)計學(xué)家引進了“無限總體”的概念,從而用連續(xù)型分布去逼近離散型分布。

      例1中,數(shù)量化總體只有有限個個體(有觀測時間約定),卻可以說“安徽省成年男子的身高服從正態(tài)分布”,就是用正態(tài)分布來逼近有限總體的分布。這就相當(dāng)于,用一個理想化的分布模型去逼近一個現(xiàn)實總體的分布,這種理想化的分布模型也叫做總體,稱之為模型化總體。因為,概率分布肯定是指某個隨機變量(或隨機向量)的分布,所以模型化總體通常又以一個隨機變量或隨機向量來代表。隨機變量(向量)作為總體的一種形式,實質(zhì)上是對總體分布的模型化。

      例2中,數(shù)量化總體形式如{0,1,1,0……},“投籃”所表現(xiàn)的隨機現(xiàn)象的規(guī)律蘊含其中。該總體中的個體非1即0,總體的分布實質(zhì)上是1和0出現(xiàn)的頻次分布,如果以X代表只取1和0 2個數(shù)值的變量,則隨機變量X的概率分布便是總體的分布。實際上,此時X的概率分布是典型的“2點分布”概率模型[8]。至此,例2中的研究目的實質(zhì)上是對服從“2點”分布的隨機變量的統(tǒng)計推斷,隨機變量X就是該問題的模型化總體。

      2 3種形式總體的比較

      2.13種形式總體的區(qū)別

      2.1.1總體形式不同從形式上看,原總體和數(shù)量化總體都是個體集合形式,構(gòu)成總體的方式是羅列所有的個體;模型化總體則是隨機變量或隨機向量的形式,不再羅列總體中有哪些個體,只是將數(shù)量化總體中不同的個體象征性地提出來。需要說明的是,隨機變量所有可能取值的全體不等于數(shù)量化總體。如例2數(shù)量化總體由無窮多個1和0構(gòu)成,是無限總體,而隨機變量X所有可能取值的全體是集合{1,0},模型化總體不是集合{1,0},而是服從“2點分布”的隨機變量。

      2.1.2總體特征不同 (1)原總體的個體同質(zhì)性。原總體是試驗對象的全體,這些試驗對象之所以構(gòu)成一個總體,必有其共同的特征或?qū)傩?,即個體同質(zhì)性。如例1中,原總體是“安徽省所有成年男子的全體”,其中每一個個體都有共同的屬性,即安徽省、成年人和男性。原總體中所有個體都是同質(zhì)的,不同的原總體肯定有不同的質(zhì),“質(zhì)”的內(nèi)容在實際問題中自有規(guī)定。(2)數(shù)量化總體的個體差異性。數(shù)量化總體是變量在原總體上“實現(xiàn)”的結(jié)果,其個體是變量在原總體中個體上的一個實現(xiàn)(即變量值),個體之間有差異。如果某一個變量在某個原總體上沒有差異,那么該“變量”在該總體上是常量。實際應(yīng)用中,常量是不會作為統(tǒng)計分析對象的,充其量是原總體的一個同質(zhì)特征。統(tǒng)計分析的主要目的是研究變量在原總體上的規(guī)律,正因為變量在原總體上有差異,才需要做統(tǒng)計分析。如果說,原總體反映個體的同質(zhì)性,那么數(shù)量化總體則關(guān)注個體之間的差異性。(3)模型化總體的抽象化和理想化特征。模型化總體不考慮具體的個體,只表示總體的分布,即隨機變量或隨機向量的概率分布。模型化總體的分布,是從實際問題中抽象出來的理想化的概率分布模型。如例1中,模型化總體是一個服從正態(tài)分布的隨機變量,正是數(shù)量化總體分布的理想化結(jié)果;例2考慮的是某人的投籃命中率,如果研究某市中學(xué)生的近視率、某個排球隊的發(fā)球得分率等,模型化總體都是服從2點分布的隨機變量,這些具體問題形形色色,但總體分布的模型是一類的,體現(xiàn)出模型化總體的抽象化特征。

      2.1.3總體信息不同從信息的角度看,原總體表明試驗對象的共性特征或?qū)傩裕础百|(zhì)”的內(nèi)容,除此之外,看不出其他信息;數(shù)量化總體,蘊含著變量在原總體上的所有信息,包括個體信息和各種分布信息,但數(shù)量化總體是“數(shù)”的全體,原始對象的共性特征或?qū)傩栽跀?shù)量化總體中是看不出來的;模型化總體,是對數(shù)量化總體中有關(guān)分布信息的反映或描述,只關(guān)注有關(guān)變量的分布信息,而且模型化總體所表達的信息與數(shù)量化總體中的真實信息未必完全一致,前者有人為加工的成分,模型化色彩較濃。

      2.23種總體形式的聯(lián)系

      2.2.1原總體是數(shù)量化總體的前身原總體是所有試驗對象的全體,數(shù)量化總體是原總體“量化”的結(jié)果,二者的個體是一一對應(yīng)的,從結(jié)構(gòu)上看,兩者完全一致。但原總體是前提,沒有明確的原總體,就沒有具體的數(shù)量化總體。

      2.2.2數(shù)量化總體是模型化總體的源模型化總體是對數(shù)量化總體中“量”的規(guī)定的一種提煉,數(shù)量化總體的分布規(guī)律通過模型化總體反映出來,如果說原總體和數(shù)量化總體帶有明顯的目的性的話,那么模型化總體則是工具性的,沒有數(shù)量化總體,當(dāng)然也就不需要模型化總體。

      原總體、數(shù)量化總體和模型化總體是隨著實際分析問題的推進,不同時段的總體表現(xiàn)形式,三者的關(guān)系見圖1。

      圖1 3種形式總體的流程圖

      3 3種形式總體的地位和作用

      總體的3種形式盡管統(tǒng)一于“對象的全體”,但在實際應(yīng)用中,三者的作用各不相同,不能相互替代。

      3.1原總體的基礎(chǔ)地位和作用

      3.1.1定量分析的出發(fā)點和歸宿前面提到,定量分析的2大基本要素是“對象”和“變量”,明確“對象”是課題設(shè)計的首要環(huán)節(jié)。原總體作為試驗對象的全體,在明確所有對象共同屬性的同時,也規(guī)定了總體的范圍,為保證樣本的同質(zhì)性提供了必要的基礎(chǔ)。站在抽樣的角度,原總體是樣本的唯一來源,這是數(shù)量化總體和模型化總體所無法替代的,因為只有原總體明確了試驗對象“質(zhì)”的規(guī)定。

      原總體也是定量分析結(jié)果應(yīng)用的對象,原總體界定了抽樣的范圍,自然也就規(guī)定了分析結(jié)果的使用范圍,這在實際應(yīng)用中是非常重要的。實際工作中,人們往往關(guān)注的是數(shù)量化的樣本,而疏于對原總體的重視。其實,多數(shù)情況下原總體才是目的。

      3.1.2對統(tǒng)計方法的引導(dǎo)作用原總體對統(tǒng)計方法的選用有重要影響。同樣的問題,選擇的原總體不同,采用的統(tǒng)計方法也不一樣。

      例3:體操比賽中,6位裁判員同時、獨立地給某個運動員評分,6個評分結(jié)果不盡相同,該運動員的最終成績?nèi)绾未_定?

      目前,國內(nèi)外比賽通用方法存在的問題在已有研究[10]中已有詳細(xì)闡述,這里提出2種原總體,用以說明對處理方法的影響。(1)總體1:符合規(guī)定要求的所有裁判員的全體?,F(xiàn)場執(zhí)裁的6位裁判員是一個樣本。(2)總體2:現(xiàn)場執(zhí)裁的6位裁判員無窮多次評分(對1個運動員)的全體。6位裁判員的現(xiàn)場評分(每人1次)視為來自總體的一個樣本。

      總體1是常見的,也頗為自然,如果按這個總體和樣本,運動員最終成績確定為6位裁判員評分結(jié)果的平均數(shù)。因為,樣本平均數(shù)是總體均值的最優(yōu)估計量。事實上,這里用6個評分結(jié)果的平均數(shù)作為運動員最后得分是不合適的。

      總體2中,蘊含著“6位裁判員評分的權(quán)重不盡相同”,已有研究[11]據(jù)此給出了運動員最后得分的估計方法。

      總體不一樣,處理方法截然不同。

      3.1.3對統(tǒng)計處理結(jié)果的決定作用有時候原總體不同,即使同樣的處理方法,結(jié)果也相差甚遠(yuǎn)。

      例4:某人研究30個身體素質(zhì)項目的內(nèi)在結(jié)構(gòu),希望簡化指標(biāo)。請20位專家對30個項目的重要性進行評分,然后對獲得的評分?jǐn)?shù)據(jù)進行主成分分析,得到8個主成分,認(rèn)為30個指標(biāo)被壓縮成了8個。

      該處理結(jié)果是有問題的,相關(guān)研究[12]針對類似情況,從認(rèn)知數(shù)據(jù)的角度分析了其中的問題所在,這里從總體的視角透視其中的原因。

      由數(shù)據(jù)來源不難看出,例4中原總體是“某一類專家的全體”,20位專家被視為一個樣本。主成分分析的實質(zhì)是揭示變量之間的關(guān)系,而專家是對每個項目的“重要性”進行評分,并非評價各個項目之間的關(guān)系。事實上,若要專家對30個項目之間的關(guān)系作主觀評價也確實是強人所難。所以,基于這樣的數(shù)據(jù)作主成分分析,得到的結(jié)果是難以揭示變量之間的關(guān)系的,至少達不到研究目的。

      根據(jù)研究目的,例4中的原總體應(yīng)該是“能夠客觀反映30個身體素質(zhì)項目真實水平的某一類運動員的全體”,樣本是隨機抽取的部分運動員。

      例4中的問題隱蔽性很強,從數(shù)據(jù)形式上很難看出弊端。從源頭來看,問題就出在原總體的選擇上,原總體不合適,再高級的統(tǒng)計處理方法也難以得出可靠的結(jié)果。

      3.2數(shù)量化總體的特殊地位和作用

      原總體明確了所有對象及其共同特征,但沒有變量的任何信息。數(shù)量化總體是原總體與變量的結(jié)合體,是原總體經(jīng)過量化的結(jié)果,明確數(shù)量化總體是定量研究的必要環(huán)節(jié)。

      3.2.1明確數(shù)量化總體是研究目的的操作化從工作環(huán)節(jié)上看,原總體的量化包括變量的確定和變量的實現(xiàn)2部分,其中,變量的確定是主要工作。實際工作中,研究目的往往比較籠統(tǒng),甚至比較抽象,需要由某些變量來具體化。如學(xué)習(xí)能力、綜合素質(zhì)和訓(xùn)練效果等,都要以某些具體變量來反映或衡量,這是研究目的操作化的重要組成部分。僅有變量尚不能完整地反映研究目的,變量需要落實到原總體上(即在原總體上實現(xiàn)),才能具體地體現(xiàn)研究目的。數(shù)量化總體恰恰是研究目的操作化結(jié)果的體現(xiàn),數(shù)量化總體用量的語言來表述研究目的,將實際問題用量的形式來顯示。

      例5:檢驗?zāi)撤N新訓(xùn)練方法的效果,考慮與傳統(tǒng)訓(xùn)練方法作比較,采用配對實驗設(shè)計。

      研究目的很明確,即檢驗新訓(xùn)練方法相對于傳統(tǒng)方法效果是否顯著。原總體:該訓(xùn)練方法適用范圍內(nèi)的所有人(運動員或?qū)W生)的全體。變量的確定:針對該運動項目,選擇能反映訓(xùn)練效果的有效變量,可以是一個變量,也可能是幾個變量,不妨以X(也可以是向量)表示。傳統(tǒng)訓(xùn)練方法的效果以X0表示,新方法效果用X1表示。針對研究目的,新方法相對于傳統(tǒng)方法的效果體現(xiàn)在2種效果的差值上,即X1-X0,所以最終考慮的變量是X1-X0。變量的實現(xiàn):對于原總體中的某一個個體,若按傳統(tǒng)方法訓(xùn)練效果是x0,新方法訓(xùn)練效果是x1,2種方法的效果差x1-x0是變量X1-X0在該個體上的實現(xiàn),即觀測值。數(shù)量化總體:原總體上所有差值的全體。數(shù)量化總體明確后,本例的具體研究目的為:檢驗數(shù)量化總體的平均值是否為0。

      3.2.2數(shù)量化總體是量的規(guī)律的承載體定量分析的最終目的是,研究有關(guān)變量在原總體上的分布規(guī)律或特征,數(shù)量化總體是變量在原總體上實現(xiàn)的結(jié)果,變量的所有價值信息全面蘊涵于數(shù)量化總體之中。明確了數(shù)量化總體,實際問題的探討就歸結(jié)為對數(shù)量化總體的分析。至此,數(shù)理方法得以有用武之地,這或許是數(shù)量化總體作為“總體”最有說服力的理由。

      退而言之,統(tǒng)計學(xué)研究隨機現(xiàn)象的內(nèi)在規(guī)律,通過重復(fù)隨機現(xiàn)象來發(fā)現(xiàn),大量的重復(fù)隨機現(xiàn)象構(gòu)成原總體,而所有重復(fù)隨機現(xiàn)象的結(jié)果形成數(shù)量化總體,所以數(shù)量化總體是隨機現(xiàn)象的數(shù)量反映,研究隨機現(xiàn)象在很大程度上就是研究數(shù)量化總體。

      3.2.3數(shù)量化總體是樣本數(shù)據(jù)的母體數(shù)量化總體是個體集合形式的總體,其中的個體是量化的個體,應(yīng)用中樣本往往是數(shù)量的形式(即樣本觀測值),表現(xiàn)為數(shù)據(jù)。所以,數(shù)量化總體是樣本數(shù)據(jù)的來源,總體內(nèi)個體形式和結(jié)構(gòu)規(guī)定了樣本中的數(shù)據(jù)形式和結(jié)構(gòu),明確數(shù)量化總體有利于數(shù)據(jù)的收集和整理。

      例6:分析某地區(qū)高三學(xué)生性別與視力狀況是否有關(guān)。性別和視力狀況為2個分類變量,分別以X和Y代表。視力狀況取“近視”和“正?!?種,則變量X和Y均為只取2個值的變量。原總體是“該地區(qū)所有在校高三學(xué)生的全體”,數(shù)量化總體中的個體形式如(x,y),如果抽測n名學(xué)生,則樣本數(shù)據(jù)形如(x1,y1),(x2,y2),…,(xn,yn),這時很容易將這些數(shù)據(jù)整理成列聯(lián)表。

      3.3模型化總體的作用

      如果說數(shù)量化總體注重變量在原總體上的實現(xiàn),那么模型化總體則關(guān)注變量本身及其分布。數(shù)量化總體是量的規(guī)律的承載體,模型化總體則是統(tǒng)計規(guī)律的反映形式,是揭示統(tǒng)計規(guī)律的必要手段。

      模型化總體的提出,是統(tǒng)計推斷的首要環(huán)節(jié)。由樣本推斷總體,無論是推斷總體分布還是推斷總體中的有關(guān)參數(shù),都是以明確總體模型為前提的。總體的分布模型確定了,隨機樣本中各個個體的分布才明確,在此基礎(chǔ)上得到各類統(tǒng)計量的概率分布(即抽樣分布),從而推斷總體。所以,在數(shù)理統(tǒng)計學(xué)文獻中,總體都是模型化總體,是隨機變量或隨機向量的形式。

      例7:研究2個分類變量X1與X2之間的關(guān)系,模型化總體X= (X1,X2)’的概率分布:

      檢驗2個變量是否獨立,即檢驗pij=pipj,i=1,2,…,C;j=1,2,…,R。

      可見,借助模型化總體,統(tǒng)計推斷的目標(biāo)很明確。

      模型化總體的提出,是統(tǒng)計模型的思想體現(xiàn);模型化手段,是統(tǒng)計思想的重要體現(xiàn)。實際問題多種多樣,統(tǒng)計分析常用的方法是提出模型,然后通過樣本檢驗實際總體(數(shù)量化總體)是否符合該模型。

      例8:試卷分析中,檢驗學(xué)生的某一門課程卷面分?jǐn)?shù)是否服從正態(tài)分布。

      研究目的:檢查學(xué)生的考試情況是否正常(試題被默認(rèn)是規(guī)范的)。原總體:參加該課程考試的所有學(xué)生。數(shù)量化總體:參加考試的所有學(xué)生卷面分?jǐn)?shù)的全體。

      很顯然,這里的數(shù)量化總體是“有限個學(xué)生卷面分?jǐn)?shù)的全體”,個體數(shù)也許只有幾十個,研究目的是分析該總體中有限個學(xué)生分?jǐn)?shù)的分布規(guī)律。按理說,正態(tài)分布是針對連續(xù)型隨機變量的,而且正態(tài)分布隨機變量的取值范圍在(-∞,+∞),那么,所謂“參加考試的有限個學(xué)生卷面分?jǐn)?shù)服從正態(tài)分布”如何理解呢?這正是模型化總體的作用所在,正態(tài)分布是一種分布模型,如果參加考試的有限個學(xué)生卷面分?jǐn)?shù)的分布規(guī)律“符合”正態(tài)分布模型,則稱該總體服從正態(tài)分布。這樣,很多實際問題的總體分布就有模型可依,統(tǒng)計分析才會目標(biāo)明確。當(dāng)然,這里的學(xué)生成績是按百分制的,隨機變量的可能取值較多,而且取值范圍在〔0,100〕。如果隨機變量的可能取值過少,如學(xué)生成績按5個等級計分,那么檢驗其是否符合某種連續(xù)型分布模型是不合適的。因為,此時隨機變量的分布類型屬于多項分布,勉強檢驗其是否服從某種連續(xù)型分布模型(如正態(tài)分布)沒有實際意義??梢?,模型化總體對統(tǒng)計方法的選用有指導(dǎo)作用。

      4 總體的確定

      總體的3種形式是因?qū)嶋H工作不同時段的需要而提出的,形式各異,作用互補。所以,在分析實際問題時,3種形式的總體是必須明確的。確定總體,實質(zhì)上是研究目的的操作化,本身就是研究方法,也是具體研究手段的體現(xiàn),涉及到具體問題,有時難度是比較大的。以下從比較宏觀的層面提出確定總體時需要重點把握的3個方面。

      4.1確定試驗對象的共同屬性

      作為某一個具體問題的試驗對象,必然有共同屬性,這些屬性是原總體的本質(zhì)屬性,是原總體內(nèi)所有個體均具有的屬性。明確了這些共同屬性,也就界定了原總體的內(nèi)容和范圍,從而確定了原總體。

      一個原總體中的個體有哪些共同屬性,是由研究目的決定的。實際應(yīng)用中值得注意的是,區(qū)分共同屬性與研究變量的值。一個具體問題可能涉及很多變量,有些是課題需要研究的變量(稱之為研究變量),有的在本課題中只取固定的值,是不變的常量,該常量構(gòu)成原總體的共同屬性之一。如“某一類男生的全體”,“男性”是該總體的一個共同屬性,該共同屬性是“性別”取固定值的結(jié)果。研究變量的值是研究變量在個體上的實現(xiàn),在原總體上體現(xiàn)個體差異性,不能將研究變量取相同值的個體視為一個原總體。實際上,原總體的確定與研究變量的值無關(guān),確定原總體只關(guān)心共同屬性,不考慮研究變量取什么值。一個具體問題,只有一個原總體,如果出現(xiàn)2個或多個原總體,那么肯定是按某些研究變量取值不同而人為地分解總體,但此時已經(jīng)不是在確定原總體,而是在考慮數(shù)量化總體了。之所以將原總體與研究變量分開考慮,是為了保證原總體的同質(zhì)性,以便明確統(tǒng)計結(jié)果的適用范圍,體現(xiàn)原總體的作用。

      例9:為了探討不同訓(xùn)練方法對提高100 m跑成績的效果,將64名同年齡,身體形態(tài)和運動素質(zhì)基本相同的初一男生,隨機分為4組,每組16人,進行4種不同方法的訓(xùn)練。一學(xué)期后,按統(tǒng)一測量方法進行測試,得到訓(xùn)練前后100 m跑成績的差值數(shù)據(jù)[13]。

      這是一個單因素方差分析的例子,有2個研究變量:(1)訓(xùn)練方法,條件(或處理)變量,可能取4個值;(2)訓(xùn)練前后100 m跑成績的差值,響應(yīng)變量。研究目的:探討不同的訓(xùn)練方法對提高100 m跑成績的效果有無顯著差異,即研究處理變量對響應(yīng)變量有無顯著影響。

      原總體:訓(xùn)練方法適用范圍內(nèi)的所有男生的全體(原總體及其共性特征應(yīng)當(dāng)是研究者在試驗前確定的,這里是筆者根據(jù)題意推測的,不一定準(zhǔn)確)。原總體共性特征:某年齡段、一定的身體形態(tài)和運動素質(zhì)、男生。

      值得注意的是,原總體的確定與2個研究變量的值沒有關(guān)系,不能按4種訓(xùn)練方法的不同,設(shè)想有4個原總體,那樣容易忽視原總體的共性特征,從而模糊處理結(jié)果的適用范圍。

      4.2準(zhǔn)確體現(xiàn)研究變量的價值信息

      根據(jù)研究目的,明確了觀測指標(biāo)(本文稱之為“研究變量”),那么原總體中的每一個個體都有觀測值,所有個體觀測值(即研究變量的實現(xiàn)值)的全體,形成數(shù)量化總體,數(shù)量化總體是原總體針對研究變量的量化結(jié)果。確定數(shù)量化總體是研究目的的操作化,必須確保所有研究變量的信息完整準(zhǔn)確。首先,不能遺漏研究變量,尤其是作為條件變量的分類變量容易被忽視;其次,所有研究變量作為變量組必須在一個個體上同時實現(xiàn)。

      例10:研究一個分類變量(X)對若干個響應(yīng)變量(Y1,Y2,…,Ym)是否有影響。

      這是單因素多元方差分析的問題。顯然,分類變量和m個響應(yīng)變量均為研究變量,所有研究變量用向量(X,Y1,Y2,…,Ym)’來表示。針對原總體中的每一個個體,研究變量(X,Y1,Y2,…,Ym)’有一個觀測值(x,y1,y2,…,ym)’,該觀測值向量是數(shù)量化總體中的一個個體,所有形如(x,y1,y2,…,ym)’的個體的集合構(gòu)成數(shù)量化總體。

      實際應(yīng)用中,人們經(jīng)常根據(jù)分類變量的取值不同,將上述數(shù)量化總體分成若干個總體。假定上述分類變量X可取3個值,針對X取某個值的所有個體構(gòu)成一個總體,共有3個總體。

      原總體只有一個,數(shù)量化總體之所以有多個,是因為某些研究變量已經(jīng)實現(xiàn),人們對相同變量值進行歸類,從數(shù)量化總體中分出來。分解數(shù)量化總體,多數(shù)情況下是抽樣設(shè)計的需要,為了保證樣本中各類個體所占比例相對合理。

      4.3隨機變量及其分布模型的把握

      研究變量在個體之間體現(xiàn)出差異性,所有研究變量均可視為隨機變量,原則上,模型化總體就是所有研究變量的全體。例10中,模型化總體是隨機向量(X,Y1,Y2,…,Ym)’,但在討論隨機向量的概率分布時,通常不考慮隨機向量的聯(lián)合分布,而是針對條件變量X的不同取值,分析響應(yīng)變量(Y1,Y2,…,Ym)’關(guān)于X的條件分布。條件變量X可取3個值,有3個條件分布,所以模型化總體可視為3個,分別對應(yīng)條件變量X的3個值,實質(zhì)上也對應(yīng)3個數(shù)量化總體。若以F1(y1,y2,…,ym),F(xiàn)2(y1,y2,…,ym)和F3(y1,y2,…,ym)分別表示3個總體的分布,則3個數(shù)量化總體通常也以分布F1,F(xiàn)2和F3來指稱。

      確定模型化總體的關(guān)鍵是總體分布模型的提出,對實際問題的有效解決往往起決定作用。在例3中,原總體是“現(xiàn)場執(zhí)裁的6位裁判員無窮多次評分(對一個運動員)的全體”。研究變量有2個:(1)裁判員,用X表示,X可取6個值;(2)“評分結(jié)果(對一個運動員)”,用Y表示。數(shù)量化總體是“形如(x,y)的所有個體的集合”。如果按裁判員變量X取不同的值,可以將數(shù)量化總體分成6個子總體,即每一位裁判員無窮多次評分結(jié)果的全體。針對X的不同取值,考慮“評分結(jié)果”變量Y關(guān)于X的6個條件分布,得到6個模型化總體F(y|x)(x=1,2,…,6),統(tǒng)計模型為:

      式中:μ為常數(shù);E(εi)=0;Vαr(εi)=σi2,i=1,2,…,6,且ε1,ε2,…,ε6相互獨立。

      該模型在文獻[11]中有詳細(xì)解釋。正是基于此模型,主觀評分?jǐn)?shù)據(jù)的處理問題得以較好地解決。

      5 小 結(jié)

      綜上所述,原總體、數(shù)量化總體和模型化總體作為統(tǒng)計總體的3種形式,統(tǒng)一于總體這個范疇。統(tǒng)計總體因統(tǒng)計工作的需要而產(chǎn)生,統(tǒng)計學(xué)研究隨機現(xiàn)象的規(guī)律,通過多次重復(fù)隨機現(xiàn)象(多數(shù)情況下是人為設(shè)想的重復(fù))來反映其內(nèi)在規(guī)律,重復(fù)隨機現(xiàn)象的過程稱為(隨機)試驗,一次重復(fù)試驗稱為一個試驗對象(單元),大量重復(fù)試驗的集合稱作總體。隨機現(xiàn)象的規(guī)律蘊含在總體中,總體是隨機現(xiàn)象內(nèi)在規(guī)律的承載體,總體就是研究對象??傮w中,陳列著所有可能的重復(fù)試驗及其結(jié)果,從試驗對象的角度看,總體是所有試驗對象的全體(原總體);如果關(guān)注每次試驗的結(jié)果,那么總體是所有試驗結(jié)果的全體(數(shù)量化總體);透過大量的重復(fù)隨機現(xiàn)象,看其內(nèi)在規(guī)律,則總體是研究變量的概率分布(模型化總體)。

      之所以從不同的視角看總體,提出3種形式,是因為實際工作的需要,3種形式的總體在統(tǒng)計工作的不同階段、不同環(huán)節(jié)分別發(fā)揮不同的作用,不能互相替代。實際應(yīng)用中,3種形式的總體都應(yīng)該明確。從原總體到數(shù)量化總體,再到模型化總體,任何一種總體的確定不合適,都會使抽樣不合理,或統(tǒng)計方法選用不得當(dāng),或統(tǒng)計分析不具有針對性,導(dǎo)致研究結(jié)果出現(xiàn)問題,且不易被發(fā)現(xiàn)。

      各種統(tǒng)計方法都是針對特定總體的,而在實際工作中,總體是需要研究者自己確定的。確定總體的難度固然是有,但是對統(tǒng)計總體本身的深刻理解是應(yīng)用者所必須的。

      參考文獻:

      [1]耿建華.“統(tǒng)計總體”辨析:兼與賈俊平、周恒彤商榷[J].統(tǒng)計教育,2006(10):63-64.

      [2]楊緒忠.統(tǒng)計總體和總體單位辨析[J].統(tǒng)計教育,2005(4):37-38.

      [3]常樂.總體單位概念引出的歧義[J].中國統(tǒng)計,2001(10):42.

      [4]姜培耕.統(tǒng)計總體的哲學(xué)反思:兼論統(tǒng)計學(xué)是方法論科學(xué)[J].上海統(tǒng)計,2000(2):18-20.

      [5]李繼梅.統(tǒng)計學(xué)中幾個重要范疇的區(qū)別與聯(lián)系[J].產(chǎn)業(yè)與科技論壇,2008(7):140-141.

      [6]楊昌斌.論總體與總體單位、指標(biāo)與標(biāo)志的關(guān)系[J].統(tǒng)計研究,1990 (2):70-71.

      [7]魏登云.提高體育統(tǒng)計應(yīng)用水平的關(guān)鍵:正確認(rèn)識統(tǒng)計總體[J].體育科學(xué),1997(2):87-91.

      [8]陳希孺.概率論與數(shù)理統(tǒng)計[M].合肥:中國科技大學(xué)出版社,2002.

      [9]賈俊平,何曉群,金進勇.統(tǒng)計學(xué)[M].4版.北京:中國人民大學(xué)出版社,2012.

      [10]魏登云,鄒可觀,李良萍.記點、打分類項目裁判員個體客觀性的非參數(shù)評價[J].體育科學(xué),2006,26(9):51-53.

      [11]魏登云,李良萍.競技體育主觀評分?jǐn)?shù)據(jù)的統(tǒng)計模型及其參數(shù)估計[J].體育科學(xué),2008,28(7):83-87.

      [12]魏登云.主成分與因子分析在體育綜合評價中的應(yīng)用監(jiān)測[J].體育科學(xué),2003,23(4):48-51.

      [13]叢湖平.體育統(tǒng)計[M].北京:高等教育出版社,2008.

      [14]張堯庭,夏立顯,安希忠,等.定性資料的統(tǒng)計分析[M].桂林:廣西師范大學(xué)出版社,1991.

      [15]魏登云,楊亞莉.體育科研中定性數(shù)據(jù)的統(tǒng)計分析問題辨析[J].體育科學(xué),2010,30(6):92-96.

      [16]GUDMUNDR.Iversen andM aryGerge n[M].吳喜之,程博,柳林旭,等,譯.北京:高等教育出版社,2002.

      [17]JOHNSONR A,WICHERN D W.實用多元統(tǒng)計分析[M].4版.陸璇,譯.北京:清華大學(xué)出版社,2001.

      中圖分類號:G 80-3

      文獻標(biāo)志碼:A

      文章編號:1005-0000(2015)04-345-06

      DOI:10.13297/j.cnki.issn1005-0000.2015.04.014

      收稿日期:2015-04-13;修回日期:2015-07-05;錄用日期:2015-07-06

      作者簡介:魏登云(1963-),男,安徽肥東人,教授,研究方向為體育計量學(xué)。

      作者單位:安徽師范大學(xué)體育學(xué)院,安徽蕪湖241003

      Three FormsofStatisticalPopulation and Their Position and Function in theScientific Research of Sport

      WEI Dengyun,WU Jiafa
      (Schoo1ofPE,AnhuiNorma1University,Wuhu 241003,China)

      AbstractIn order to revea1 the nature of statistica1 popu1ation and its potentia1 in app1ication,three types of statistic popu1ation are proposed. They are primitive popu1ation,quantity popu1ation and mode1 popu1ation,respective1y. Those three types of popu1ation exhibit three different characteristics:the individua1 homoge? neity in primitive popu1ation,individua1 discrepancy in quantity popu1ation,and individua1 homogenous distribution. Their ro1es and app1ications are a1so different. The primitive popu1ation is the starting point and destination of quantitative ana1ysis,which cou1d guide the statistic methods and p1ay a critica1 ro1e to statistic process resu1t. Quantity popu1ation is the operation of study goa1,carrier of quantity ru1es,and source of samp1ing data. Mode1 popu1ation ref1ects the statistic ru1es,and is an essentia1 too1 to disc1ose statistic ru1es. Severa1 aspects shou1d be paid attention to when determine which types of popu1ation:First1y figure out the common characteristics ofthestudy object.Second1y,the va1uab1e information shou1d be ref1ected precise1y.The random variab1e and its distribution mode1 shou1d be correct1y grasped.

      Key wordsstatistica1 popu1ation;trai1;variab1es;probabi1ity distribution;common characteristics;individua1 differences

      猜你喜歡
      個體差異概率分布變量
      抓住不變量解題
      離散型概率分布的ORB圖像特征點誤匹配剔除算法
      也談分離變量
      關(guān)于概率分布函數(shù)定義的辨析
      科技視界(2016年19期)2017-05-18 10:18:46
      基于概率分布的PPP項目風(fēng)險承擔(dān)支出測算
      淺談新課程下的初中英語分層教學(xué)
      講究糾錯藝術(shù),提升英語學(xué)習(xí)效果
      高中生二語(L2)習(xí)得的性別個體差異
      科技視界(2016年21期)2016-10-17 19:10:49
      如何根據(jù)學(xué)生的個體差異進行體育教學(xué)
      科技視界(2016年20期)2016-09-29 12:36:11
      SL(3,3n)和SU(3,3n)的第一Cartan不變量
      根河市| 通州区| 贵德县| 关岭| 绥芬河市| 石楼县| 抚松县| 鄂尔多斯市| 津市市| 寿阳县| 永德县| 海口市| 尖扎县| 清水县| 台中县| 海淀区| 雅江县| 大理市| 南漳县| 寿宁县| 顺平县| 噶尔县| 红原县| 海伦市| 海口市| 慈利县| 浦北县| 南涧| 武邑县| 甘南县| 石林| 福鼎市| 孟连| 铜梁县| 江都市| 达州市| 黄浦区| 宁夏| 新和县| 连江县| 周至县|