李明泉
(三峽數(shù)學(xué)研究中心三峽大學(xué)理學(xué)院,湖北 宜昌 443002)
在講數(shù)理統(tǒng)計(jì)之前,首先要向?qū)W生闡明數(shù)理統(tǒng)計(jì)學(xué)的基本特點(diǎn),數(shù)理統(tǒng)計(jì)學(xué)是應(yīng)用性極強(qiáng)的一門應(yīng)用類基礎(chǔ)課程,她是一門關(guān)于數(shù)據(jù)收集、整理和分析的科學(xué),它研究的對(duì)象主要是來源于各個(gè)部門的數(shù)據(jù),其目的是通過大量統(tǒng)計(jì)數(shù)據(jù)揭示事物的本質(zhì)。其次要告訴學(xué)生數(shù)理統(tǒng)計(jì)是作為概率論的一個(gè)重要應(yīng)用提出來的,在概率論中所討論的問題都是這樣一些問題:已知一個(gè)隨機(jī)變量的概率分布,要去研究相應(yīng)的隨機(jī)現(xiàn)象,例如,要計(jì)算隨機(jī)變量落入某個(gè)區(qū)間內(nèi)的概率,要計(jì)算隨機(jī)變量的期望、方差、協(xié)方差、相關(guān)系數(shù)和矩等等,也就是說在概率論中,一個(gè)隨機(jī)變量所服從的概率分布往往是已知的,在這個(gè)前提條件下要去研究這個(gè)隨機(jī)變量所表征的隨機(jī)現(xiàn)象。然而在數(shù)理統(tǒng)計(jì)中情況卻有很大的不同,在數(shù)理統(tǒng)計(jì)中,一個(gè)隨機(jī)變量所服從的概率分布往往是未知的或雖然知道它的分布形式,但其中的參數(shù)未知,例如,隨機(jī)變量X服從正態(tài)分布N(,2),但是和2未知,因此這個(gè)分布還是不完全知道,數(shù)理統(tǒng)計(jì)的主要任務(wù)就是要根據(jù)抽樣的結(jié)果即樣本去推斷分布的形式或估計(jì)分布當(dāng)中的未知參數(shù),由此可見數(shù)理統(tǒng)計(jì)與概率論所討論的問題有很大的不同。建立在概率論基礎(chǔ)上的數(shù)理統(tǒng)計(jì)學(xué)其分支也很多,但大體上可分為兩類,一類是試驗(yàn)設(shè)計(jì),試驗(yàn)設(shè)計(jì)屬于抽樣的問題,它是指如何安排隨機(jī)試驗(yàn),才能使獲得的數(shù)據(jù)資料更合理、更有效和更具有代表性,試驗(yàn)設(shè)計(jì)一般的教材都不講這個(gè)問題,有專門的教材講這個(gè)問題,再一類就是統(tǒng)計(jì)推斷,它是指如何利用所獲得的數(shù)據(jù)資料即隨機(jī)樣本,對(duì)我們所關(guān)心的問題(如參數(shù)、分布……)作出種種合理的估計(jì)和推斷,數(shù)理統(tǒng)計(jì)主要講統(tǒng)計(jì)推斷。
總體是首先要講的第一個(gè)基本概念,通俗的可以這樣來說,人們通常把要研究對(duì)象的全體稱為總體,而把組成總體的每一個(gè)基本單位成為個(gè)體,例如,全國人所組成的總體,而其中每一個(gè)中國人就是一個(gè)個(gè)體,再如,一麻袋稻種所構(gòu)成的總體,其中每一粒稻種就是一個(gè)個(gè)體??傮w和個(gè)體從通俗的角度來看是很容易理解的,但是在實(shí)際應(yīng)用中,人們對(duì)總體的研究往往是很具體的而不是抽象的,例如,研究全國人這個(gè)總體,你研究全國人這個(gè)總體研究它的什么東西?是研究全國人的身高還是體重?這里面得有一個(gè)具體的數(shù)量指標(biāo)!其實(shí)在實(shí)際應(yīng)用中,人們對(duì)總體的研究往往都是研究總體的某一個(gè)或某幾個(gè)數(shù)量指標(biāo),例如,我們要研究一家工廠生產(chǎn)的液晶顯示器的使用壽命,這個(gè)時(shí)候就把這個(gè)廠生產(chǎn)的全部液晶顯示器的使用壽命看作是一個(gè)總體,而把其中每一個(gè)液晶顯示器的使用壽命看作是一個(gè)個(gè)體,也就是說,這個(gè)時(shí)候總體就是一大堆數(shù)據(jù),而其中每一個(gè)數(shù)據(jù)就是一個(gè)個(gè)體。其實(shí)在實(shí)際應(yīng)用中,總體就是指一大堆數(shù)據(jù),而其中每一個(gè)數(shù)據(jù)就是一個(gè)個(gè)體,由于這一大堆數(shù)據(jù)具有統(tǒng)計(jì)規(guī)律性或者說服從一定的概率分布,比如,其中有80%的液晶顯示器的使用壽命超過了2萬個(gè)小時(shí),這就是統(tǒng)計(jì)規(guī)律性,對(duì)此加以引申得到數(shù)理統(tǒng)計(jì)中總體的含義。在數(shù)理統(tǒng)計(jì)中,所謂總體就是指一個(gè)隨機(jī)變量或一個(gè)概率分布,對(duì)上述例子來說這個(gè)隨機(jī)變量就是指液晶顯示器的使用壽命,這里需要向?qū)W生強(qiáng)調(diào)的是總體的這個(gè)含義只是引申出來的,并不是總體的本意,從本質(zhì)上來講,總體就是指一大堆數(shù)據(jù),其中每一個(gè)數(shù)據(jù)就是一個(gè)個(gè)體,而且還要告訴學(xué)生總體與集合是有區(qū)別的,集合里面不允許有相同的元素,而總體里面卻允許有相同的元素,為了是使學(xué)生完全、真正理解總體的引申意義,筆還舉了這樣一個(gè)例子,例如,檢驗(yàn)自生產(chǎn)線出來的零件是正品還是次品,以0表示產(chǎn)品是正品,以1表示產(chǎn)品是次品。設(shè)出現(xiàn)次品的概率為p,則總體就是由一些1和一些0所組成的,X表示從中任取一個(gè)數(shù),則P{X=1}=p,P{X=0}=1-p,這個(gè)分布就是(0-1)分布,從由很多0和1所構(gòu)成的這樣一個(gè)總體中,我們得到了一個(gè)隨機(jī)變量X,還得到了一個(gè)概率分布(0-1)分布,所以總體又叫一個(gè)隨機(jī)變量,總體又叫一個(gè)概率分布。
因?yàn)闃颖緛碓从诳傮w,所以樣本當(dāng)中肯定包含有總體的有關(guān)信息,數(shù)理統(tǒng)計(jì)的主要任務(wù)就是根據(jù)樣本提供的信息去推斷總體的有關(guān)性質(zhì),因此,樣本是進(jìn)行統(tǒng)計(jì)推斷的主要依據(jù),但是通常并不是直接根據(jù)樣本去推斷總體的性質(zhì),直接推斷不好推斷,為什么呢?因?yàn)闃颖揪褪且唤M數(shù),它是雜亂無章,例如,我們要研究某高校男生的身高,于是就從男生當(dāng)中隨機(jī)地抽取了n個(gè)男生出來,他們的身高記為X1,X2,…,Xn,這就是一個(gè)樣本,根據(jù)這個(gè)樣本能夠看出什么問題出來?關(guān)于男生的身高能夠做出什么樣的評(píng)價(jià)呢?這是看不出太大的問題出來的!要能看出問題出來,需要對(duì)這些數(shù)據(jù)進(jìn)行加工,進(jìn)行處理,進(jìn)行分析,比如,可計(jì)算這些數(shù)據(jù)的平均值,根據(jù)這個(gè)平均值就能夠看出一些問題出來!事實(shí)上,我們能夠根據(jù)這個(gè)平均值來大體上估計(jì)該高校所有男生的平均身高,所以在數(shù)理統(tǒng)計(jì)當(dāng)中,并不是直接根據(jù)樣本去推斷總體的某些性質(zhì),而是需要把樣本所包含的總體有關(guān)信息集中起來加工成樣本的某種函數(shù),然后利用這種函數(shù)去推斷總體的有關(guān)性質(zhì)的,像這種由樣本所構(gòu)成的函數(shù)就稱之為統(tǒng)計(jì)量。設(shè)X1,X2,…,Xn,是來自于總體X的一個(gè)樣本,g(X1,X2,…,Xn)是關(guān)于樣本X1,X2,…,Xn的一個(gè)函數(shù),一般要求還是一個(gè)連續(xù)函數(shù),并且不含任何未知參數(shù),稱g(X1,X2,…,Xn)為統(tǒng)計(jì)量,當(dāng)樣本,X1,X2,…,Xn,得到一組觀察值x1,x2,…,xn,就稱為統(tǒng)計(jì)量g(X1,X2,…,Xn)的觀察值。在數(shù)理統(tǒng)計(jì)中,統(tǒng)計(jì)量是進(jìn)行統(tǒng)計(jì)推斷的主要手段。這里需要向?qū)W生強(qiáng)調(diào)的是統(tǒng)計(jì)量g(X1,X2,…,Xn)是完全已知的一個(gè)函數(shù),不能包含任何未知的東西,例如,是統(tǒng)計(jì)量,而(其中未知)則不是統(tǒng)計(jì)量。下面這幾個(gè)統(tǒng)計(jì)量是很常用的,需要學(xué)生記得?。簶颖揪担瑯颖痉讲?,樣本標(biāo)準(zhǔn)差,樣本k階(原點(diǎn))矩,,當(dāng)k=1時(shí),,由此可見樣本k階矩將樣本均值這個(gè)概念加以推廣了,樣本k階中心矩(k=2,3,…)。
在講好上述三個(gè)統(tǒng)計(jì)學(xué)的基本概念的同時(shí),筆者在課堂上還融入了一些思政元素,數(shù)理統(tǒng)計(jì)是通過樣本去推斷總體的有關(guān)信息和規(guī)律,這其實(shí)是用了“管中窺豹,可見一斑”的思想,通過事物的一部分而推測全體,起到事半功倍的作用,這同時(shí)也反映了從點(diǎn)到面,從局部到整體的辯證關(guān)系,據(jù)此,將學(xué)生的三觀與社會(huì)主義核心價(jià)值觀完美地結(jié)合起來。數(shù)理統(tǒng)計(jì)需要做統(tǒng)計(jì)調(diào)查以便搜集統(tǒng)計(jì)數(shù)據(jù),我融入毛主席的“沒有調(diào)查就沒有發(fā)言權(quán)”的名言,教導(dǎo)學(xué)生要實(shí)事求是,不能隨意地篡改數(shù)據(jù),要誠實(shí)守信,在以后的工作中要遵守職業(yè)道德,培養(yǎng)學(xué)生嚴(yán)謹(jǐn)?shù)淖鍪伦鋈说娘L(fēng)格。還通過《資本論》解讀了數(shù)據(jù)對(duì)于論證觀點(diǎn)的重要性,在教學(xué)中,還介紹了中國學(xué)者在統(tǒng)計(jì)學(xué)方面的成就和影響,比如,數(shù)學(xué)家許寶騄,他在我國開創(chuàng)了概率論和數(shù)理統(tǒng)計(jì)的教學(xué)與科研工作,是多元統(tǒng)計(jì)分析的最早的開拓者之一,也是我國概率論和數(shù)理統(tǒng)計(jì)領(lǐng)域最主要奠基人之一。通過這些名人的事跡激發(fā)學(xué)生的愛國熱情和學(xué)習(xí)積極性,增強(qiáng)民族自信心,為實(shí)現(xiàn)中華民族的偉大復(fù)興而努力學(xué)習(xí),既可以圓中國夢,也可以實(shí)現(xiàn)個(gè)人的夢想。
講清、講透總體、樣本和統(tǒng)計(jì)量這三個(gè)基本概念是學(xué)生學(xué)好數(shù)理統(tǒng)計(jì)學(xué)的基礎(chǔ),在教學(xué)中,筆者采取上述講法取得了很好的教學(xué)效果。