呂文華,韓慧霞
概率統(tǒng)計是高校理工科專業(yè)學生的一門基礎(chǔ)課程,而條件分布是概率論中一個重要的概念,是研究變量之間相依關(guān)系的一個有力工具,在工程計算、金融保險等領(lǐng)域都有廣泛的應(yīng)用,也是教學的一個難點。因此,如何使學生深刻理解條件數(shù)學分布的概念、熟練掌握其計算方法是概率統(tǒng)計教學的一個重要問題。
在條件分布的教學中,常通過對一個簡單例子的分析指出條件分布的重要性,并使學生明確在已知Y=y(tǒng)的條件下,X的條件分布與X的無條件分布是不同的。
例1 考慮一大群人,從其中隨機抽取一個,分別以X和Y記其身高和體重,則X和Y都是隨機變量,各自都有一定的概率分布。如限制1.8≤X≤1.9,在此條件下去求體重Y的條件分布,這就意味著從這一大群人中,把身高在1.8米和1.9米之間的人挑出來,然后在挑出的人群中求其體重的分布。由于身高和體重會有一定的正相依關(guān)系,這個分布與不設(shè)這個條件時的分布會很不一樣。所以有必要研究把一個變量限制在一定條件下另一個隨機變量的條件分布。
由于離散型隨機變量常用分布列表示其分布,而連續(xù)型常用其密度函數(shù),所以我們分別考慮條件分布列與條件分布函數(shù)。設(shè)(X,Y)為一個二維離散型隨機向量,聯(lián)合分布列為P(X=xi,Y=y(tǒng)j)=pij,i,j=1,2,…,考慮Y=y(tǒng)j的條件下X的條件分布,即是要找條件概率P(X=xi|Y=y(tǒng)j)由條件概率的定義,可得若P(Y=y(tǒng)j)>0,則
此即為在給定Y=y(tǒng)j的條件下X的條件分布列。
為加深學生對概念的理解,應(yīng)進一步補充說明,在Y=y(tǒng)j條件不變的情況下,條件分布列仍是分布列,即滿足:
在連續(xù)場合中,因?qū)θ我鈟,P(Y=y(tǒng))=0,故P(X=xi|Y=y(tǒng)j)沒有意義,首先考慮Y=y(tǒng)時X的條件分布函數(shù)的概念.設(shè)二維連續(xù)隨機變量(X,Y)的聯(lián)合分布函數(shù)和密度函數(shù)分別為F(x,y),p(x,y),邊際密度函數(shù)為pX(x),pY(y),則Y=y(tǒng)時X的條件分布函數(shù)可以寫成
分子分母各除以h,并分別取極限,則上式化為
上式表明條件分布也是連續(xù)分布,并且在pY(y)>0時,給定Y=y(tǒng)條件下X的條件密度函數(shù)為
為加深學生對條件密度的理解,應(yīng)強調(diào)兩點:
1.條件密度函數(shù)仍然是概率密度,即滿足概率密度的兩點基本性質(zhì)。2.(1)式可改寫為:
類似可得,
即兩個隨機變量的聯(lián)合密度等于其中之一的概率密度乘以在給定這一個之下另一個的條件概率密度,這個公式與條件概率的公式P(AB)=P(B)P(A/B)類似 。
由于條件分布列仍是分布列,條件密度函數(shù)仍然是條件概率密度,所以在此基礎(chǔ)上可以求條件期望。其計算公式如下,若(X,Y)為二維離散型,
若(X,Y)為二維離散型,
條件期望E(X|Y=y(tǒng))是y的函數(shù),它與無條件期望E(X)是有區(qū)別的。進一步指出若以E(X|Y)記Y的如下函數(shù):當Y=y(tǒng)時它取值E(X|Y=y(tǒng)),這樣定義的E(X|Y)是一個隨機變量,對它求期望可得有趣的結(jié)果。
例2 (重期望公式)設(shè)(X,Y)是二維隨機變量,且E(X)存在,則
證:在此僅對連續(xù)場合給出證明,而離散場合可類似證明。設(shè)(X,Y)有聯(lián)合密度p(x,y),
由Y的函數(shù)的期望公式,有
重期望公式是概率論中較為深刻的結(jié)果,它在實際中很有用.譬如,要求在一個取值于很大范圍上的指標X的均值E(X),會遇到計算上的許多困難.為此可換一種思維方式:尋求一個與X有關(guān)的量Y,以Y的不同取值把大范圍劃分成若干個小區(qū)域,先在小區(qū)域上求X的平均,再對此類平均求加權(quán)平均,即可得到大范圍上X的平均E(X).
例3 一個礦工被困在有兩個門的礦井里,第一個門通一坑道,沿此坑道走3小時可到達安全區(qū);第二個門通一坑道,沿此坑道5小時又回到原處。假定此礦工總是等可能地在兩個門中選擇一個,試求他平均要用多少時間才能到達安全區(qū)。
解:設(shè)該礦工需要X小時到達安全區(qū),Y表示第一次所選的門。
由題設(shè)條件知,
例4 (隨機個隨機變量之和的期望)設(shè)X1,X2,…為一列獨立同分布的隨機變量,隨機變量N只取正整數(shù)值,且N與{Xn}獨立,則有
對此例子不要求學生掌握其證明,而是強調(diào)其在實際中的應(yīng)用。如設(shè)一天內(nèi)到達商場的顧客數(shù)N是僅取非負整數(shù)值的隨機變量,且E(N)=35000.又設(shè)進入此商場的第i個顧客的購物金額為Xi,可以認為諸Xi是獨立同分布的隨機變量,且E(Xi)=82(元).假設(shè)N與Xi相互獨立是合理的,則此商場一天的平均營業(yè)額為
僅考慮(X,Y)為連續(xù)型,一般p(x|y)隨y的變化而變化,這反映了X與Y有相依關(guān)系,如果p(x|y)不依賴于y,只是x的函數(shù),由(1)式易得,p(x|y)=pX(x),則表示X的分布情況與Y的取值完全無關(guān),這時就稱X與Y這兩個隨機變量獨立。
定義:設(shè)二維隨機向量(X,Y)的聯(lián)合密度函數(shù)為p(x,y),X與Y的邊際密度分別為pX(x),pY(y),如果
則稱X與Y相互獨立。
進一步解釋之所以沒有采用p(x|y)=pX(x)來定義X與Y的獨立性,原因有如下兩點
(1)式(5)總是有意義的,而用條件密度去定義時,可能碰到在個別點無法定義的情況,而在一般情況下可以用p(x|y)=pX(x)來驗證其獨立性。
(2)式(5)式在形式上關(guān)于兩個變量對稱,便于推廣到對多個變量定義獨立性。
證:由二維正態(tài)分布的密度形式可得,從而 當且僅當ρ=0時,p(x|y)=pX(x),即X與Y獨立。
隨著我國的高等教育由“精英型教育”向“大眾化教育”轉(zhuǎn)變,像我校這樣的應(yīng)用型本科院校,學生數(shù)學基礎(chǔ)知識不夠扎實,學習的主動性不足,以上教學方法在做法上淡化理論證明,強調(diào)對知識的應(yīng)用。目的是使學生對概率統(tǒng)計這門課程感興趣、克服畏難心理,對條件分布理論有一個較系統(tǒng)的把握。
[1]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2010.
[2]陳希孺.概率論與數(shù)理統(tǒng)計[M].合肥:中國科學技術(shù)大學出版社,2002.
[3]徐洪香.概率論的緣起、發(fā)展及其應(yīng)用[J].遼寧工學院學報,2001,21(3):62-63.
[4]張克軍.關(guān)于條件概率及其應(yīng)用的教學研究[J].徐州教育學院學報,2008,23(3):134-135.
[5]沙秀艷,辛 杰.概率論與數(shù)理統(tǒng)計教學實踐與探索[J].大學數(shù)學,2013,29(4):9-12.