錢欣潔,劉 歡
(金陵科技學(xué)院 理學(xué)院,江蘇 南京 211169)
概率論與數(shù)理統(tǒng)計(jì)是研究隨機(jī)現(xiàn)象的學(xué)科,將隨機(jī)現(xiàn)象“量化”成隨機(jī)變量,并用隨機(jī)變量的不同取值表示隨機(jī)現(xiàn)象的不同的試驗(yàn)結(jié)果。設(shè)隨機(jī)試驗(yàn)的樣本空間為Ω,對(duì)每個(gè)ω∈Ω,總有一個(gè)實(shí)數(shù)X(ω)與之對(duì)應(yīng),則稱Ω上的單值實(shí)函數(shù)X(ω)為一個(gè)隨機(jī)變量[1]。隨機(jī)變量可分為離散型隨機(jī)變量、混合型隨機(jī)變量和連續(xù)型隨機(jī)變量。混合型隨機(jī)變量較復(fù)雜,一般本科教材只介紹離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。由于離散型隨機(jī)變量表現(xiàn)形式簡(jiǎn)單,學(xué)生很容易掌握。但學(xué)生對(duì)于連續(xù)型隨機(jī)變量的相關(guān)內(nèi)容理解不深,掌握不牢。連續(xù)型隨機(jī)變量的概率密度函數(shù)、函數(shù)的分布和條件概率密度是概率論與數(shù)理統(tǒng)計(jì)課程中的基礎(chǔ),通過總結(jié)往年的教學(xué)經(jīng)驗(yàn)發(fā)現(xiàn),學(xué)生學(xué)習(xí)這些內(nèi)容時(shí)較吃力,很多學(xué)生只是死記硬背,無法從本質(zhì)上理解掌握這部分內(nèi)容,在做題時(shí)也經(jīng)常出錯(cuò)。
類比教學(xué)法[2]是課堂教學(xué)活動(dòng)中應(yīng)用較廣泛的方法之一,將類比的思維用到課堂教學(xué)活動(dòng)中,通過將兩件事情做類比,可以自然而然將學(xué)習(xí)者的原有經(jīng)驗(yàn),和需要學(xué)習(xí)的新知識(shí),通過某種微妙的相似性建立起連接,從而幫助學(xué)生有效地理解新知識(shí)。本文利用類比教學(xué)法,將連續(xù)型隨機(jī)變量的概率密度函數(shù)、連續(xù)型隨機(jī)變量函數(shù)的分布和條件概率密度分別與離散型隨機(jī)變量分布律、離散型隨機(jī)變量函數(shù)的分布和條件分布律做類比,化繁為簡(jiǎn)、深入淺出地使連續(xù)型隨機(jī)變量的相關(guān)內(nèi)容具體化,有趣生動(dòng)地幫助學(xué)生從本質(zhì)上理解這部分內(nèi)容,徹底掌握連續(xù)型隨機(jī)變量的相關(guān)知識(shí)。
本節(jié)只討論一維隨機(jī)變量,二維隨機(jī)變量的類比方法與一維相同,這里不再做詳細(xì)闡述。對(duì)于一維離散型隨機(jī)變量,我們用分布律表示它的所有可能的取值及取每個(gè)值的概率。設(shè)離散型隨機(jī)變量X的所有可能的取值為xi,X取xi的概率為pi(i∈N,i≥1;),則隨機(jī)變量X的分布律為:P{X=xi}=pi,i∈N,i≥1。它滿足性質(zhì):
這兩條性質(zhì)是分布律的本質(zhì),任給一個(gè)滿足這兩條性質(zhì)的函數(shù)可作為某個(gè)隨機(jī)變量的分布律。用分布律來研究離散型隨機(jī)變量的統(tǒng)計(jì)規(guī)律,簡(jiǎn)單易懂,一目了然。
對(duì)于一維連續(xù)型隨機(jī)變量,我們也想用如此直接的方法,將隨機(jī)變量每個(gè)取值處的概率列舉出來,但這時(shí)隨機(jī)變量的取值點(diǎn)是不可列的。那如何像離散情況那樣給出隨機(jī)變量每個(gè)點(diǎn)的概率呢?或者說,如何得到一個(gè)定義在隨機(jī)變量取值點(diǎn)的函數(shù),這個(gè)函數(shù)與取值點(diǎn)的概率有關(guān)呢?我們采取了高等數(shù)學(xué)中經(jīng)常用的方法,討論“一個(gè)點(diǎn)”的概率情況,我們可以稍微擴(kuò)范圍,考慮一個(gè)無窮小區(qū)間上的概率,這個(gè)區(qū)間概率除以區(qū)間長(zhǎng)度就得到了“平均概率”,而當(dāng)這個(gè)無窮小區(qū)間趨近于零時(shí),“平均概率”的極限就是我們需要的函數(shù),這里Δx表示區(qū)間長(zhǎng)度,ΔF表示區(qū)間上的概率。
若分布函數(shù)F(x)處處可導(dǎo),則處處存在,這樣可以定義函數(shù),稱之為概率密度函數(shù)。但是現(xiàn)實(shí)生活中隨機(jī)現(xiàn)象的分布函數(shù)往往不能處處可導(dǎo),所以以上概率密度函數(shù)的定義有缺陷。為了研究更多現(xiàn)實(shí)生活中的隨機(jī)現(xiàn)象,我們需要降低對(duì)分布函數(shù)F(x)的要求,即雖然分布函數(shù)F(x)不是處處可導(dǎo),但是存在一個(gè)函數(shù)f(x),使其變上限積分為F(x),具體地定義如下。
定義1[3]42:如果對(duì)于隨機(jī)變量X的分布函數(shù)F(x),存在非負(fù)函數(shù)f(x),使得對(duì)于任意實(shí)數(shù)x有
則稱X為連續(xù)型隨機(jī)變量,其中f(x)稱為X的概率密度函數(shù),簡(jiǎn)稱概率密度。
連續(xù)型隨機(jī)變量的概率密度函數(shù)滿足性質(zhì):
這兩條性質(zhì)是概率密度函數(shù)的本質(zhì),任給一個(gè)滿足這兩條性質(zhì)的函數(shù)可作為某個(gè)隨機(jī)變量的概率密度函數(shù)。概率密度函數(shù)的規(guī)范性與分布律的規(guī)范性類似,因?yàn)榭梢钥醋鞑煌瑴y(cè)度集上的兩種積分定義方式。
由以上分析可知,離散型隨機(jī)變量用分布律來表示隨機(jī)變量取值點(diǎn)及其概率,連續(xù)型隨機(jī)變量是用一個(gè)定義在隨機(jī)變量每個(gè)取值點(diǎn)處的概率密度函數(shù)來揭示其統(tǒng)計(jì)規(guī)律。分布律與概率密度函數(shù)具有的性質(zhì)十分類似,都滿足非負(fù)性和規(guī)范性。
本節(jié)只討論一維隨機(jī)變量。對(duì)于一維離散型隨機(jī)變量函數(shù)g(x)的分布問題,我們可以直接將函數(shù)代入到隨機(jī)變量的分布律中得到新的隨機(jī)變量Y=g(X)的分布律[4]。具體地,將隨機(jī)變量X中任一取值點(diǎn)t代入函數(shù)g(x),得到新的取值點(diǎn)y=g(t),而y發(fā)生的概率等于t發(fā)生的概率,最后將相同取值點(diǎn)的概率相加,就得到了隨機(jī)變量Y的分布律。
對(duì)于一維連續(xù)型隨機(jī)變量函數(shù)的分布問題,類比于離散型隨機(jī)變量,我們也想通過直接將連續(xù)函數(shù)g(x)代入到連續(xù)型隨機(jī)變量X的概率密度函數(shù)fX(x)中得到新的連續(xù)型隨機(jī)變量Y=g(X)的概率密度函數(shù)fy(y)。但是概率密度函數(shù)“相當(dāng)于”分布函數(shù)F(x)的導(dǎo)函數(shù),而求概率密度函數(shù)fy(y)就是求復(fù)合函數(shù)的導(dǎo)函數(shù),我們無法直接從導(dǎo)函數(shù)fx(x)推出復(fù)合函數(shù)導(dǎo)函數(shù)fY(y),所以需要討論復(fù)合原函數(shù)的導(dǎo)數(shù)來得出fY(y)。也就是說,先由隨機(jī)變量X的概率密度函數(shù)推導(dǎo)出隨機(jī)變量X的分布函數(shù),再由此推出隨機(jī)變量Y的分布函數(shù),最后求導(dǎo)得到隨機(jī)變量Y的概率密度函數(shù)。具體流程如圖1所示。
圖1 連續(xù)型隨機(jī)變量函數(shù)概率密度推導(dǎo)過程
由以上分析可知,連續(xù)型與離散型隨機(jī)變量函數(shù)分布問題的求解方法具有一定的相似性,討論離散型隨機(jī)變量函數(shù)分布問題就是求解分布律,可將此函數(shù)直接代入原有分布律求得。而討論連續(xù)型隨機(jī)變量函數(shù)分布問題就是求解概率密度函數(shù),可將此函數(shù)代入新的分布函數(shù)并求導(dǎo)得到。這兩種方法之間具有相似性,可以進(jìn)行對(duì)比學(xué)習(xí)。
對(duì)于條件概率,我們只討論二維隨機(jī)變量。二維離散型隨機(jī)變量(X,Y),如果固定j,并且P,則稱[3]68
為在Y=yj條件下X的條件分布律。
對(duì)于二維連續(xù)型隨機(jī)變量(X,Y),我們也想討論條件概率P{X=xi|Y=yj}的值,但連續(xù)型隨機(jī)變量在一點(diǎn)的概率為零,即P{X=xi,Y=yj},所以考慮一點(diǎn)處的條件概率并沒有意義,需要討論一個(gè)區(qū)間的條件概率,即討論條件分布函數(shù)P{X≤x|Y=y} 。對(duì)于此分布函數(shù),類似于公式(2),我們希望用公式
來定義。然而P{Y=y}=0,公式(3)沒有定義。那我們將公式(3)如何變形才能得出正確的條件分布函數(shù)的定義呢?我們用類似于高等數(shù)學(xué)中“可去間斷點(diǎn)”的想法來將公式(3)變形。因?yàn)楣剑?)在y點(diǎn)沒有定義,那么稍微擴(kuò)大討論范圍,討論在區(qū)間(y,y+ε]上的條件概率P{X≤x|y<Y≤y+ε},然后再令ε→0+,這樣得到。若此極限處處存在,則它可作為條件分布函數(shù)的定義。
這里0<δ1,δ2<ε。由此,固定y,當(dāng)fY(y)>0,我們可以定義Y=y條件下X的條件分布函數(shù)為?,F(xiàn)在條件分布函數(shù)的定義得出了,那條件概率密度如何定義呢?類似于第一節(jié)的討論,我們可以用“導(dǎo)數(shù)的觀點(diǎn)”推導(dǎo)出條件概率密度的定義Y=y,即條件下X的條件概率密度就是
本文通過將連續(xù)型隨機(jī)變量概率密度函數(shù),條件概率密度分別與離散型隨機(jī)變量分布律,條件分布律做類比,一步一步引出連續(xù)型隨機(jī)變量、概率密度函數(shù)和條件概率密度的概念,這樣比直接給學(xué)生定義更能讓學(xué)生接受,也更利于學(xué)生理解此概念。