彭雨明,凌衛(wèi)平
(廣東白云學院基礎教學部,廣東 廣州510500)
利用縮減樣本空間方法替代貝葉斯公式的計算
彭雨明,凌衛(wèi)平
(廣東白云學院基礎教學部,廣東 廣州510500)
條件概率的計算是概率論中極其重要的計算之一,一般有利用定義式計算和縮減樣本空間計算兩種方法.縮減樣本空間計算法在先驗概率問題計算上比較淺顯易懂,但在后驗概率問題上計算一般不采用這個方法,而是使用定義式來計算,后驗概率的計算又和貝葉斯公式有較大的關系.著重討論縮減樣本空間計算法在后驗概率問題上的應用,從而避免利用貝葉斯公式計算的繁瑣過程.
條件概率;先驗概率;后驗概率;縮減樣本空間
條件概率是概率論中重要而又基本的概念之一.對條件概率的計算,我們尋找更多方法和技巧,在力求簡單的同時,還要促使學生正確、全面地了解和掌握概率論的相關知識.而貝葉斯公式是為計算一類條件概率服務的,傳統(tǒng)利用貝葉斯公式計算條件概率基本都是從定義出發(fā),筆者考慮從其他更為簡單的方法入手,來替代貝葉斯公式較為復雜的計算.
1.1 條件概率計算的兩個一般方法
方法一:直接利用定義計算.
設A與B是樣本空間Ω中的兩個事件,若P(B)>0,則稱P(A|B)為“事件B發(fā)生的條件下事件A發(fā)生的概率”[1],且
方法二:利用“縮減”的樣本空間來進行計算.
從另外一個角度考慮P(A|B)的計算,P(A|B)是在事件B已經(jīng)發(fā)生的條件下事件A發(fā)生的概率,那么僅考慮事件B的樣本空間ΩB中樣本的個數(shù)n,及ΩB中屬于事件A的基本事件數(shù)k,再由概率的古典型計算方法[2]得到:
1.2 貝葉斯公式的計算
一般來說,貝葉斯公式是全概率公式和由條件概率公式推導而來的乘法公式的綜合運用,通常在計算一個條件概率P(A|B)時候,發(fā)現(xiàn)這個條件概率不太容易計算,而P(B|A)相較而言,卻比較容易計算,就會使用貝葉斯公式來計算P(A|B),也即是先驗概率和后驗概率的不同.當然這中間往往利用包含事件A的一組完備事件,將整個樣本空間Ω進行分解,貝葉斯公式計算方法[3]如下其中某個Ai=A,而所有的Ai構(gòu)成了對樣本空間Ω的一個完備分解.
1.3 先驗概率和后驗概率
先驗概率(prior probability)是指根據(jù)以往經(jīng)驗和分析得到的概率,如全概率公式,它往往作為“由因求果”問題中的“因”出現(xiàn).后驗概率(posterior probability)是指在得到“結(jié)果”的信息后重新修正的概率,如貝葉斯公式中是“執(zhí)果尋因”問題中的“果”.后驗概率是信息理論的基本概念之一.一個通信系統(tǒng)中,在收到某個消息之后,接收端所了解到的該消息發(fā)送的概率稱為后驗概率.
先驗概率與后驗概率有不可分割的聯(lián)系,后驗概率的計算要以先驗概率為基礎.
來看一個較簡單、在課堂上經(jīng)常提到的例子.
例1 盒子里有a個黑球,b個白球(a≥1,b≥1),現(xiàn)從盒子中先后兩次不放回的取球.問:
(1)已知第一次取到的是黑球,問第二次取到的是黑球的概率;
(2)已知第二次取到的是黑球,問第一次取到的是黑球的概率.
解 (1)對于第一問,可以利用條件概率計算的兩種方法來求解.
方法一:直接利用定義計算.設Ai=“第i次取到的是黑球”(i=1,2),則:
方法二:利用“縮減”的樣本空間來進行計算.在事件A1已經(jīng)發(fā)生的條件下,盒子中的球的總數(shù)以及黑球的總數(shù)均減少了一個,所以事件A2發(fā)生相當于在總數(shù)為a+b-1個,黑球數(shù)為a-1個的盒子中求取到一個黑球的概率,由古典型概率計算方法,不難得到和方法一計算的結(jié)果一致.
(2)對于第二問,由于計算的是P(A2|A1),事件A2發(fā)生在后,事件A1發(fā)生在前,屬于后驗概率問題,一般利用貝葉斯公式來進行求解,計算方法如下.
不難發(fā)現(xiàn),第一問和第二問所求解的答案是完全一樣的,進一步研究可以得出,這類問題的結(jié)論“答案完全一樣”是必然的.
觀察上面的計算方法,發(fā)現(xiàn)過程比較繁瑣.如果對樣本空間Ω的分解比較復雜,計算起來就更不簡單.有沒有其他簡單的方法來計算這個問題呢?
換個角度再思考一下第二問,這個問題依然是一個條件概率,它的計算也應該有屬于條件概率計算的第二個方法,也就是縮減的樣本空間的方法.在求解這類后驗概率的問題時,如何利用縮減空間方法計算呢?可以這樣理解:如果事件A2發(fā)生了,相當于在a個黑球中肯定有一個黑球需要放在旁邊“等待”第二次的抽取,因此第一次取到黑球,也就是事件A1發(fā)生時候,已經(jīng)不是從球總數(shù)為a+b個、黑球數(shù)為a個盒子中取球的問題了,而是只能從剩下的球總數(shù)為a+b-1個,黑球數(shù)為a-1個的盒子中取球的問題,這樣依據(jù)古典型概率計算,不難得到此時這和利用貝葉斯公式計算出來的結(jié)果完全“一致”.
在教學的過程中,學生始終不明白這種縮減樣本空間的方法,往往會提出“明明第一次可供選擇的球總數(shù)為a+b個,黑球數(shù)為a個,為什么都變化了呢?”針對這個問題,筆者一般把a或b具體實值化,比如特殊設置a=1或b=1(針對取白球情形),然后再考慮這個問題,就比較容易理解了.
貝葉斯公式應用計算的問題,只要是涉及到有“先后”發(fā)生的事件之間的條件概率,一般都可以從這個角度思考,利用這個方法,可以使計算大大簡化.從某種程度上理解,好像時間在這些問題面前不是“單向”的,而是“雙向”的,也就是考慮問題的方式既可以從前往后,還可以從后往前思考,無論我們采取前向計算,還是后向計算,結(jié)論必然是完全一致.下面舉例說明利用縮減樣本空間方法來計算用貝葉斯公式求解的其他例題,用以比較兩個方法的難易.
例2 盒子里有a個黑球,b個白球(a≥2,b≥1),現(xiàn)從盒子中先后三次不放回的取球,已知第三次取到的是黑球,問前兩次取到的是一黑一白的概率.
解 方法一:直接利用定義計算.設Ai=“第i次取到的是黑球”(i=1,2,3),B=“前兩次取到的是一黑球一白球”容易有使用貝葉斯公式和乘法公式,則:
方法二:利用“縮減”的樣本空間來進行計算.由于第三次抽出的是黑球,所以前兩次只能從“剩下的”球總數(shù)為a+b-1個、黑球數(shù)為a-1個的盒子中取兩球,且一球為黑一球為白.因此:
比較兩種方法,難易程度不言而喻.
小結(jié)這種類型的問題,如果不放回的抽球次數(shù)更多,使用貝葉斯公式計算會更加復雜和麻煩,但是如果使用縮減樣本空間方法計算就簡單多了.
例3 一個盒子里有11個球,其中6個黑球,5個白球.現(xiàn)不放回的取球5次,已知后三次取到的都是白球,問前兩次取到的球至少有一個白球的概率.
解 利用縮減樣本空間方法直接計算:由于后三次取到的都是白球,所以,前兩次取球時,只“剩下”總數(shù)8個球,其中6黑、2白,則:
如果利用貝葉斯公式計算,也可以得出一樣的結(jié)論.
例4 某電子設備廠所用的元件是由三家元件廠提供的.根據(jù)以往的記錄,這三個廠家的次品率分別為0.02、0.01、0.03,提供元件的份額分別為0.15、0.8、0.05,設這三個廠家的產(chǎn)品在倉庫是均勻混合的,且無區(qū)別的標志.現(xiàn)在倉庫中隨機地取一個元件,若已知它是次品,則次品由三個廠家生產(chǎn)的概率分別是多少?
解 假設生產(chǎn)總數(shù)為10 000個,則三個廠家分別生產(chǎn)總數(shù)分別為1 500、8 000、500,從而三個廠家次品數(shù)為30、80、15.所以次品總數(shù)為125.現(xiàn)在已知隨機抽取的一個元件是次品,也就意味著次品率高的工廠被抽中的可能性大,分別計算三個工廠生產(chǎn)次品在總次品數(shù)中所占的次品率,因為這個次品一定來自于三個廠家生產(chǎn)的次品之中,所以樣本空間縮減為由從所有次品中抽取一個而產(chǎn)生的所有結(jié)果構(gòu)成的樣本空間.
假設Ai=“已知取到的是次品,它來自于第i個工廠”(i=1,2,3)可以計算出:
結(jié)果計算表明,來自第二個工廠生產(chǎn)的可能性較大.
從上面的舉例中可以看出,在一類帶有明顯事件發(fā)生有先后順序的后驗概率計算過程中,使用縮減樣本空間的方法計算,比使用貝葉斯公式簡單很多,雖然很多利用貝葉斯公式計算的條件概率問題不一定全部可以用這樣的方法思考,但是一旦適合,使用此方法可以快速求解出正確結(jié)果,達到事半功倍的效果.
[1]鄭玉仙.縮減樣本空間在條件概率計算中的應用[J].浙江水利水電??茖W校學報,2006,18(1):57-58.
[2]李元東.縮減樣本空間在條件概率計算中的應用[J].綿陽師范學院學報,2008,27(8):25-27.
[3]袁蔭棠.概率論與數(shù)理統(tǒng)計[M].2版.北京:中國人民大學出版社,1990.
On using the method of the sample space to replace the Bayesian formula calculation
PENG Yu-ming,LING Wei-ping
(Foundation Department,Guangdong Baiyun University,Guangzhou,510540,Guangdong,China)
Conditional probability calculations are extremely important probability theory basics,there are generally calculated by use of the definition or of the methods to reduce the sample space.Reducing the sample space on the a priori probability calculation is easy to understand the problem,but a posteriori computational problems generally are calculated using the definition,then the calculation of posterior probability have a greater relationship with the Bayesian formula.This paper focuses on reducing the sample space to calculate posterior probability problems,thus avoiding the use of Bayesian formula to calculate the tedious process.
conditional probability;prior probability;posteriori probability;reduced sample space
O211.9
:A
:1007-5348(2014)08-0005-04
(責任編輯:李 婉)
2014-05-18
彭雨明(1973-),男,湖北武漢人,廣東白云學院基礎教學部講師,碩士,主要從事基礎數(shù)學方面的研究.