馬少龍
超幾何分布與二項(xiàng)分布模型是人教版選修2—3概率問(wèn)題的重要模型,教材通過(guò)實(shí)例,要讓學(xué)生認(rèn)識(shí)模型所刻畫的隨機(jī)變量的共同特點(diǎn),并能運(yùn)用兩個(gè)模型解決一些實(shí)際問(wèn)題。然而在教學(xué)過(guò)程中卻經(jīng)常發(fā)現(xiàn)學(xué)生不能準(zhǔn)確辨別是何種概率模型,根源在于學(xué)生不能準(zhǔn)確地理解概念,超幾何分布和二項(xiàng)分布雖然有著密切的聯(lián)系,但也有明顯的區(qū)別,事實(shí)上,在超幾何分布模型上只要稍作改變,超幾何分布就可能變?yōu)槎?xiàng)分布。其中超幾何分布必須同時(shí)滿足兩個(gè)條件:一是抽取的產(chǎn)品不再放回;二是產(chǎn)品數(shù)目為有限個(gè),當(dāng)這兩個(gè)條件中任何一個(gè)發(fā)生改變,則不再是超幾何分布,下面結(jié)合例題對(duì)這類問(wèn)題作闡述。
一、準(zhǔn)確理解概念
超幾何分布的概念是:一般的,在含有M件次品的N件產(chǎn)品中,任取n件,其中恰有X件次品,則P(X=k)=,k=0,1,2,…,m,其中m=minM,n,且n≤N,M≤N,n,M,N∈N?鄢,如果隨機(jī)變量X的分布列具有上述形式,則稱隨機(jī)變量X服從超幾何分布。而二項(xiàng)分布的概念為:一般的,在n次獨(dú)立重復(fù)試驗(yàn)中,設(shè)每次試驗(yàn)中事件A發(fā)生的概率為p,用X表示事件A發(fā)生的次數(shù),則P(X=k)=Cknpk(1-p)n-k,k=0,1,2,…,n,如果隨機(jī)變量X的分布列具有上述形式,則稱隨機(jī)變量X服從二項(xiàng)分布。
由以上概念可知,超幾何分布與二項(xiàng)分布模型的最主要區(qū)別是有放回抽樣還是無(wú)放回抽樣,一般來(lái)說(shuō),有放回抽樣與無(wú)放回抽樣計(jì)算的概率是不一樣的,學(xué)生在解題時(shí)要仔細(xì)閱讀題意,不要濫用公式。
二、注意超幾何分布和二項(xiàng)分布的區(qū)別
例1:(1)袋中有大小相同的8個(gè)白球、2個(gè)黑球,有放回的從中隨機(jī)地連續(xù)抽取3次,每次取1個(gè)球。求取到黑球的次數(shù)X的分布列;
(2)袋中有大小相同的8個(gè)白球、2個(gè)黑球,從中隨機(jī)地取3個(gè)球。求取到黑球的個(gè)數(shù)Y的分布列。
分析:(1)有放回抽樣時(shí),每次抽取時(shí)的總體沒(méi)有改變,因而每次抽到某物的概率都是相同的,可以看成是獨(dú)立重復(fù)試驗(yàn),此種抽樣是二項(xiàng)分布模型,取到的黑球次數(shù)X可能的取值為0,1,2,3。又由于每次取到黑球的概率均為,3次取球可以看成3次獨(dú)立重復(fù)試驗(yàn),則X~B3。
例2:某農(nóng)場(chǎng)計(jì)劃種植某種新作物,為此對(duì)這種作物的兩個(gè)品種(分別稱為品種甲和品種乙)進(jìn)行田間試驗(yàn)。現(xiàn)在在總共8小塊地中,隨機(jī)選4小塊地種植品種甲,另外4小塊種植品種乙。種植完成后隨機(jī)選出4塊地,其中種植品種甲的小地塊的數(shù)量記為X,求X的分布列與數(shù)學(xué)期望。
分析:本題容易錯(cuò)誤的得到X服從二項(xiàng)分布,即X~B(4,)。錯(cuò)誤的根源在于每塊地種植甲或種植乙不是相互獨(dú)立的,它們之間相互制約,無(wú)論怎樣種植都要保證8塊地中有4塊種植甲,4塊種植乙,事實(shí)上X是服從超幾何分布。若將例2改為:在8塊地中,每塊地要么種植甲,要么種植乙,那么在選出的4塊地中種植甲的數(shù)量為ξ,則ξ服從二項(xiàng)分布,即ξ~B(4,)。二項(xiàng)分布模型和超幾何分布模型最主要的區(qū)別在于是有放回抽樣還是不放回抽樣。所以,在解有關(guān)二項(xiàng)分布和超幾何分布問(wèn)題時(shí),要仔細(xì)閱讀、辨析題目條件。
三、注意超幾何分布和二項(xiàng)分布的聯(lián)系
事實(shí)上,超幾何分布和二項(xiàng)分布有著密切的聯(lián)系,樣本個(gè)數(shù)越大,超幾何分布和二項(xiàng)分布的對(duì)應(yīng)概率相差越小,也就是說(shuō):樣本數(shù)量較大時(shí),不放回抽樣與放回抽樣的差別不大,一般認(rèn)為是獨(dú)立重復(fù)試驗(yàn)。
例3:隨機(jī)觀測(cè)生產(chǎn)某種零件的某特大型工廠的25名工人日加工零件數(shù)(單位:件),獲得數(shù)據(jù)如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36。
(1)確定樣本頻率分布表中n1,n2,f1和f2的值;
(2)根據(jù)上述頻率分布表,畫出樣本頻率分布直方圖;
(3)根據(jù)樣本頻率分布直方圖,求在該廠任取4人,至少有1人的日加工零件數(shù)落在區(qū)間(30,35]的概率.
分析:(3)題意是:“某特大型工廠”,即工人很多,根據(jù)樣本頻率分布表,每人的日加工零件數(shù)落在區(qū)間(30,35]的概率為■,設(shè)所取的4人中,日加工零件數(shù)落在區(qū)間(30,35]的人數(shù)為隨機(jī)變量ξ,則ξ~B(4,),故4人中,至少有1人的日加工零件數(shù)落在區(qū)間(30,35]的概率為:P(ξ≥1)=1-P(ξ=0)=1-1-4=1-0.4096=0.5904。
所以4人中,至少有人的日加工零件數(shù)落在區(qū)間(30,35]的概率約為0.5904。
點(diǎn)評(píng):當(dāng)總體的容量非常大時(shí),超幾何分布近似于二項(xiàng)分布。所以,在處理超幾何分布與二項(xiàng)分布相關(guān)問(wèn)題時(shí)一定要仔細(xì)閱讀題目,辨析概念,準(zhǔn)確區(qū)分。
(作者單位:廣東省汕頭市實(shí)驗(yàn)學(xué)校)