王 進(jìn)
(山東省淄博市高青縣第一中學(xué))
超幾何分布、二項(xiàng)分布是高考常考的概率分布類(lèi)型,這兩種分布既有區(qū)別,又有關(guān)聯(lián),學(xué)生在初學(xué)時(shí)由于對(duì)兩種分布的本質(zhì)認(rèn)識(shí)不清,極易造成混淆,進(jìn)而在解題中出現(xiàn)錯(cuò)解.那么如何區(qū)分這兩種分布?筆者歸納出如下幾個(gè)區(qū)分點(diǎn),供讀者參考.
辨析從概念上來(lái)看:若隨機(jī)變量X的分布列為(k=0,1,2,…,l,l=min{n,M}),則稱(chēng)X服從超幾何分布.若隨機(jī)變量X的分布列為1,p+q=1),則稱(chēng)X服從二項(xiàng)分布.從中可以看出,二項(xiàng)分布在每次試驗(yàn)中某一事件發(fā)生的概率是不變的,超幾何分布是變化的.
例1某大型國(guó)際活動(dòng)招募了50萬(wàn)青年志愿者,根據(jù)性別分層抽樣,從中隨機(jī)選取20人進(jìn)行英語(yǔ)水平測(cè)試,所得成績(jī)(單位:分)如圖1所示.
圖1
(1)從選出的8名男生中隨機(jī)連續(xù)選取2次,每次選1人,記其中測(cè)試成績(jī)?cè)?0分以上的人數(shù)為X,求X的分布列和數(shù)學(xué)期望;
(2)為便于聯(lián)絡(luò),現(xiàn)將所有青年志愿者隨機(jī)分成若干組(每組人數(shù)不少于5000),并在每組中隨機(jī)選取m人作為聯(lián)絡(luò)員,要求每組聯(lián)絡(luò)員至少有1人英語(yǔ)成績(jī)?cè)?0分以上的概率大于90%.根據(jù)圖中數(shù)據(jù),以頻率作為概率,求m的最小值.
分析本題第(1)問(wèn)從8人中隨機(jī)連續(xù)選取2次,每次選取1人,第一次選取的學(xué)生成績(jī)?cè)?0分以上的概率,與第二次選取的學(xué)生成績(jī)?cè)?0以上的概率不同,故X服從超幾何分布.第(2)問(wèn)中每個(gè)志愿者的英語(yǔ)成績(jī)?cè)?0分以上的概率都是相互之間互不影響,概率不變,故X服從二項(xiàng)分布.
解(1)8名男生中70分以上的有3人,故X的可能取值為0,1,2.
因此,X的分布列如表1所示.
表1
(2)由圖1中的數(shù)據(jù)可知20人中英語(yǔ)成績(jī)?cè)?0分以上的有10人,故從中任取1人,其成績(jī)?cè)?0分以上的概率為人中至少有1人成績(jī)?cè)?0分以上,情況較多,包括1人,2人,…,m人.據(jù)對(duì)立事件的原理得,即m的最小值為4.
辨析教材中對(duì)兩種分布的模型解釋:在N件產(chǎn)品中有M件次品,無(wú)放回地任取n件,其中次品數(shù)X服從超幾何分布.在N件產(chǎn)品中有M件次品,有放回地任取n件,其中次品數(shù)X服從二項(xiàng)分布.從中可以看出抽取方式是有放回還是無(wú)放回,這是判斷超幾何分布與二項(xiàng)分布的一個(gè)關(guān)鍵條件.超幾何分布是無(wú)放回,二項(xiàng)分布是有放回.
例2某套高考模擬試卷中單選題共有8道,已知小明能答對(duì)其中的6道.
(1)小明從中任選4道題作答,設(shè)答對(duì)題目的個(gè)數(shù)為X,求X的數(shù)學(xué)期望;
(2)小明從中每次取出1道題作答,取出后放回,連取4次,設(shè)答對(duì)題目的個(gè)數(shù)為Y,求Y的數(shù)學(xué)期望.
分析第(1)問(wèn)從8道題中選4道,可理解為“一把抓”,沒(méi)有順序.第(2)問(wèn)每次取1道題,有順序,且取出后再放回,即第一次取時(shí),8道題中有6道題會(huì)答,第二次再取時(shí),仍是8道題中有6道題會(huì)答,每次取題互不影響,即獨(dú)立重復(fù),共重復(fù)了4次,故服從二項(xiàng)分布.
解(1)8道題中能答對(duì)6道,從中任選4道題,則至少能答對(duì)2道,故X的可能取值為2,3,4,相應(yīng)的概率分別為
因此,X的分布列如表2所示.
表2
(2)每次取出1道題,取出后放回,8道題中有6道能答對(duì),故每次取題答對(duì)的概率為連續(xù)取4次,即進(jìn)行4次獨(dú)立重復(fù)試驗(yàn),答對(duì)題目的個(gè)數(shù)Y的可能取值為0,1,2,3,4.
因此,Y的分布列如表3所示.
表3
辨析在概率統(tǒng)計(jì)的應(yīng)用中,我們常用樣本數(shù)據(jù)特征來(lái)估計(jì)總體.因此在試驗(yàn)活動(dòng)中,要明確是在總體中抽取,還是在樣本中抽取.若在總體中抽取,甚至在某些情況下總體數(shù)量是不確定的,此時(shí)應(yīng)按二項(xiàng)分布的類(lèi)型來(lái)處理.若在樣本中抽取,且無(wú)放回,則按超幾何分布來(lái)處理.
例3每年的4月23日是聯(lián)合國(guó)教科文組織確定的“世界讀書(shū)日”,又稱(chēng)“世界圖書(shū)和版權(quán)日”,為了解某地區(qū)高一學(xué)生閱讀時(shí)間的分配情況,從該地區(qū)隨機(jī)抽取了500名高一學(xué)生進(jìn)行在線調(diào)查,得到了這500名學(xué)生的日平均閱讀時(shí)間(單位:h),并將樣本數(shù)據(jù)分成[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],(12,14],(14,16],(16,18]這9組,繪制成如圖2所示的頻率分布直方圖.
圖2
(1)求a的值;
(2)為進(jìn)一步了解這500名學(xué)生數(shù)字媒體閱讀時(shí)間和紙質(zhì)圖書(shū)閱讀時(shí)間的分配情況,從日平均閱讀時(shí)間在(12,14],(14,16],(16,18]這3組內(nèi)的學(xué)生中,采用分層抽樣的方法抽取了10人.現(xiàn)從這10人中隨機(jī)抽取3人,記日平均閱讀時(shí)間在(14,16]內(nèi)的學(xué)生人數(shù)為X,求X的分布列;
(3)以調(diào)查結(jié)果的頻率估計(jì)概率,從該地區(qū)所有高一學(xué)生中隨機(jī)抽取3名學(xué)生,記日平均閱讀時(shí)間在(10,12]內(nèi)的學(xué)生人數(shù)為X,求X的分布列及數(shù)學(xué)期望.
分析本題第(2)問(wèn),是從分層抽樣得到的10人中,無(wú)放回任選3人,隨機(jī)變量X服從超幾何分布.第(3)問(wèn),是從地區(qū)所有高一學(xué)生中抽取,且總體人數(shù)不確定,故X服從二項(xiàng)分布.
解(1)a=0.1(求解過(guò)程略).
(2)根據(jù)分層抽樣原理,可知在閱讀時(shí)間為(12,14],(14,16],(16,18]內(nèi)抽到的學(xué)生人數(shù)分別為5人,4人,1人.
從這10人中任選3人,則閱讀時(shí)間在(14,16]內(nèi)的人數(shù)X的可能取值為0,1,2,3,則
因此,X的分布列如表4所示.
表4
(3)由題意及(1)的結(jié)論知,從該地區(qū)所有高一學(xué)生中隨機(jī)抽取1名學(xué)生,平均閱讀時(shí)間在(10,12]內(nèi)的概率為因該地區(qū)高一學(xué)生總?cè)藬?shù)不確定,故每次抽取概率不變,抽取3次,即進(jìn)行3次獨(dú)立重復(fù)試驗(yàn).
X的可能取值為0,1,2,3,相應(yīng)的概率分別為
因此,X的概率分布列如表5所示.
表5
辨析超幾何分布與二項(xiàng)分布既有區(qū)別,又有聯(lián)系.當(dāng)總體的數(shù)量非常大,抽取樣本數(shù)量很少時(shí),可以近似地認(rèn)為每次抽取時(shí)事件發(fā)生的概率不變,這樣就可以看成每次抽取結(jié)果是相互獨(dú)立的,進(jìn)而將超幾何分布近似地看作二項(xiàng)分布來(lái)處理.
例4某手機(jī)生產(chǎn)商一批次生產(chǎn)了50000臺(tái)手機(jī),其中次品率是2%,現(xiàn)從中不放回地依次抽取3臺(tái)進(jìn)行檢驗(yàn).求抽到次品臺(tái)數(shù)X的概率分布列.
分析本題抽取方式為無(wú)放回,因此從問(wèn)題的本質(zhì)來(lái)看,屬于超幾何分布.手機(jī)總臺(tái)數(shù)為50000,其中次品為臺(tái),合格的手機(jī)為49000臺(tái).現(xiàn)從50000臺(tái)中抽取3臺(tái),則X的可能取值為0,1,2,3.我們先按古典概率類(lèi)型來(lái)計(jì)算X取某一值時(shí)的概率,比如X=1.
因?yàn)榭傮w數(shù)非常大,第一次抽取與第二次、第三次抽取次品率非常接近,我們可以認(rèn)為每次抽到次品率均為2%,抽取3次,即3次獨(dú)立重復(fù)試驗(yàn),故抽到的次品數(shù)近似服從二項(xiàng)分布,此時(shí)
不難發(fā)現(xiàn)這兩種計(jì)算方式所得的概率幾乎相等,因此這種情況,我們可按獨(dú)立重復(fù)概率類(lèi)型來(lái)處理.
解X的可能取值為0,1,2,3.
因此,X的概率分布列如表6所示.
表6
另外,常見(jiàn)的概率分布類(lèi)型還有兩點(diǎn)分布,兩點(diǎn)分布是一種特殊的二項(xiàng)分布,即只進(jìn)行一次獨(dú)立重復(fù)試驗(yàn),只有發(fā)生與不發(fā)生兩種結(jié)果,與其有關(guān)的問(wèn)題相對(duì)于前兩種要簡(jiǎn)單一些.
總之,在處理與概率分布有關(guān)的問(wèn)題時(shí),我們要明確各種概率分布的本質(zhì),以及不同概率類(lèi)型之間的異同,結(jié)合題目條件,準(zhǔn)確識(shí)別概率類(lèi)型.