新疆維吾爾自治區(qū)烏魯木齊市第八中學(830002) 李昌成
普通高中課程標準實驗教科書A 版數(shù)學選修2-3 的第2.1 節(jié)介紹了超幾何分布,第2.2 節(jié)介紹了二項分布.這兩個內(nèi)容分節(jié)學習時,學生掌握得還行,但是混合出題就有少數(shù)學生難以分辨.近期烏魯木齊地區(qū)按照《普通高中課程標準》和2019年版《考試大綱》的要求,進行了規(guī)范的高三年級質(zhì)量檢測考試,概率統(tǒng)計方面的解答題就是關(guān)于二項分布方向的.在學校網(wǎng)絡(luò)數(shù)據(jù)平臺上我們發(fā)現(xiàn)了嚴峻的問題.
題目某調(diào)查機構(gòu)對某校學生做了一個是否同意父母生“二孩”的抽樣調(diào)查,該調(diào)查機構(gòu)從該校隨機抽查了100 名不同性別的學生,調(diào)查統(tǒng)計他們是否同意父母生“二孩”,現(xiàn)已得知100 人中同意父母生“二孩”的占60%,統(tǒng)計情況如下表:
同意不同意合計男生a 50女生40 d合計100
(I) 求a,d 的值,根據(jù)以上數(shù)據(jù),能否有97.5%的把握認為是否同意父母生“二孩”與性別有關(guān)? 請說明理由;
(II) 將上述調(diào)查所得的頻率視為概率,現(xiàn)在從所有學生中, 采取隨機抽樣的方法抽取4 位學生進行長期跟蹤調(diào)查,記被抽取的4 位學生中持“同意”態(tài)度的人數(shù)為X,求X 的分布列及數(shù)學期望.
P(K2 ≥k0)0.15 0.100 0.050 0.025 0.010 k0 2.072 2.706 3.841 5.024 6.635
分析本題以近年來有關(guān)人口方面的熱門話題為背景,考查概率統(tǒng)計部分的獨立性檢驗和二項分布,同時考查學生的數(shù)學建模、數(shù)據(jù)分析、數(shù)學運算等核心素養(yǎng).這個背景學生并不陌生,甚至是親歷者.題目出得不偏不倚,學生上手容易,數(shù)據(jù)也不復雜,得分率應(yīng)該在0.85 以上.
《普通高中課程標準》和2019 版《考試大綱》對二項分布要求達到“理解”水平.我們在教學中也予以了高度重視.拿到考題,我還有一種竊喜——押中考題了! 但是閱卷結(jié)束后,在學校網(wǎng)絡(luò)數(shù)據(jù)平臺上一瀏覽才發(fā)現(xiàn),第二問居然得分率低于0.5,僅僅0.46,我有些失望,比期望值低了不少.知道這個結(jié)果后,我就在思考學生的問題在哪里呢?
與此同時,沒得分的學生也很憂郁,甚至懷疑老師閱卷不認真.答案明明是對的,為什么不給分呢? 幾個膽大的學生到辦公室找我論過理,聽起來還是蠻有道理的,思維是“縝密”的,運算是仔細的,最終結(jié)果也是“正確”的.在和一個一個學生交流過程中,我發(fā)現(xiàn)學生最大的困難是不知道如何判斷一個隨機變量的分布列是二項分布還是超幾何分布? 為了給困惑的學生們一個完整、及時、正確、全面的答復,我重溫了教科書,查閱了近十年高考題,翻閱了數(shù)學專業(yè)雜志等資料,希望能幫助學生明白數(shù)據(jù)背后的真相——二項分布和超幾何分布的聯(lián)系和區(qū)別以及如何辨認兩個分布列.現(xiàn)整理如下,以饗讀者.
(I) 因為100 人中同意父母生“二孩”的占60%,所以a = 60 - 40 = 20, d = 40 - 5 = 35.易得而所以有97.5 % 的把握認為是否同意父母生“二孩”與性別有關(guān).
X 0 1 2 3 4 P 16 625 96 625 216 625 216 625 81 625
(I) 同上.
(II) 隨機變量X 的所有可能取值為0,1,2,3,4.P(X =所以隨機變量X 的分布列為
X 0 1 2 3 4 P 54834 2352735 71136 470547 55224 156849 54752 156849 97527 784245
這個解答僅從數(shù)值方面看沒問題,但是沒得分.下面對疑問進行剖析.
細究學生的解答過程發(fā)現(xiàn),雖然答案相同,但是模型的判斷截然不同,命題專家設(shè)置是二項分布,學生誤判為超幾何分布了.下面談?wù)劧椃植寂c超幾何分布的關(guān)系,將問題徹底地弄明白.
1.定義不同:
人民教育出版社A 版《數(shù)學》選修2-3 給出的二項分布和超幾何分布定義分別是:
一般地, 在n 次獨立重復試驗中, 用X 表示事件A發(fā)生的次數(shù), 設(shè)每次試驗中事件A 發(fā)生的概率為p, 則此時稱隨機變量X 服從二項分布,記作X ~B(n,p),并稱p 為成功概率.
一般地, 在含有M 件次品的N 件產(chǎn)品中, 任取n 件,其中恰好有X 件次品, 則0,1,2··· ,m, 其中m = min{M,n} 且n ≤ N,M ≤N,n,M,N ∈N?則稱隨機變量X 服從超幾何分布.
2.隨機試驗不同:二項分布中的試驗是重復試驗;超幾何分布中的試驗是古典概型的隨機試驗.
3.抽樣方法不同:二項分布中用的是有放回抽樣;超幾何分布中用的是不放回抽樣.
4.隨機變量X 含義不同:二項分布中X 表示n 次獨立重復試驗成功的次數(shù);超幾何分布中X 表示從N 件產(chǎn)品中抽取n 件產(chǎn)品,其中次品件數(shù).
5.隨機變量X 的概率計算公式不同:
6.隨機變量X 的期望表示形式不同,本質(zhì)相同:二項分布中E(X) = np;超幾何分布中(此式教材未做要求,下文給出證明).
7.二項分布中有概率常數(shù)(成功概率p);超幾何分布中沒有概率常數(shù).本題中有兩次二項分布暗示:一是“100 人中同意父母生“二孩”的占60%”,即p = 0.6;二是“將上述調(diào)查所得的頻率視為概率”.
事實上,當樣本的容量越大(參考答案提到了),二項分布和超幾何分布對應(yīng)的概率就越接近,當樣本的個數(shù)無窮大時,二項分布和超幾何分布對應(yīng)的概率就相等,也就是說,超幾何分布的極限就是二項分布.假設(shè)產(chǎn)品個數(shù)N 無窮大,且次品率為p,即這說明,當樣本個數(shù)無限多時,有放回抽樣與無放回抽樣沒有本質(zhì)區(qū)別,都可以看成n 次獨立重復試驗,所以超幾何分布在一定條件下可以轉(zhuǎn)換成二項分布,轉(zhuǎn)換條件為:產(chǎn)品數(shù)量無限多,否則不放回抽樣不能看成n 次獨立重復試驗;在產(chǎn)品個數(shù)N 無限增加的過程中,次品數(shù)也應(yīng)該按照相應(yīng)的比例增大,即次品率p 保持相對穩(wěn)定.
結(jié)論超幾何分布的數(shù)學期望和二項分布的數(shù)學期望相等.
注意到,
為了使學生不再犯類似錯誤,非常有必要研究如何判斷一個隨機試驗是服從超幾何分布還是二項分布.
1.在每一次試驗中,事件發(fā)生的概率相同.
2.各次試驗中的事件是相互獨立的.
3.在每一次試驗中,試驗的結(jié)果只有兩個,即發(fā)生不發(fā)生.
1.每次試驗是在“兩”類元素中取元素.
2.不放回抽樣.
例1(2017年全國II 卷理科第13 題)一批產(chǎn)品的二等品率為0.02,從這批產(chǎn)品中每次隨機取一件,有放回地抽取100 次.X 表示抽到的二等品件數(shù),則DX =____.
分析依據(jù)題設(shè)中“一批產(chǎn)品”“二等品率”“有放回”“二等品率為0.02”等信息可以準確判斷隨機變量X服從二項分布.
例2(2015年湖南卷理科第18 題)某商場舉行有獎促銷活動,顧客購買一定金額的商品后即可抽獎,每次抽獎都是從裝有4 個紅球、6 個白球的甲箱和裝有5 個紅球、5 個白球的乙箱中,各隨機摸出1 個球,在摸出的2 個球中,若都是紅球,則獲一等獎;若只有1 個紅球,則獲二等獎;若沒有紅球,則不獲獎.
(I) 求顧客抽獎1 次能獲獎的概率.
(II) 若某顧客有3 次抽獎機會,記該顧客在3 次抽獎中獲一等獎的次數(shù)為X,求X 的分布列和數(shù)學期望.
分析依據(jù)已知中“每次抽獎都是從裝有4 個紅球、6 個白球的甲箱和裝有5 個紅球、5 個白球的乙箱中,各隨機摸出1 個球”可以得出成功概率由此可以判斷X 服從二項分布.
例3(2015年四川高考卷理科第17 題)某市A,B 兩所中學的學生組隊參加辯論賽,A 中學推薦了3 名男生、2 名女生,B 中學推薦了3 名男生、4 名女生,兩校所推薦的學生一起參加集訓.由于集訓后隊員水平相當,從參加集訓的男生中隨機抽取3 人、女生中隨機抽取3 人組成代表隊.
(I) 求A 中學至少有1 名學生入選代表隊的概率;
(II) 某場比賽前,從代表隊的6 名隊員中隨機抽取4 人參賽.設(shè)X 表示參賽的男生人數(shù),求X 的分布列和數(shù)學期望.
分析本題中針對“男女參賽隊員”“男生人數(shù)”表明問題是在“兩”類元素中取元素,且為不放回抽樣,可以判斷X服從超幾何分布.
例4(2017年山東卷理科第18 題)在心理學研究中,常采用對比試驗的方法評價不同心理暗示對人的影響, 具體方法如下:將參加試驗的志愿者隨機分成兩組,一組接受甲種心理暗示,另一組接受乙種心理暗示.通過對比這兩組志愿者接受心理暗示后的結(jié)果來評價兩種心理暗示的作用,現(xiàn)有6 名男志愿者A1,A2,A3,A4,A5,A6和4 名女自愿者B1,B2,B3,B4,從中隨機抽取5 人接受甲種心理暗示,另外5 人接受乙種心理暗示.
(I) 求接受甲種心理暗示的志愿者中包含A1但不包含B1的概率.
(II) 用X 表示接受乙種心理暗示的女志愿者人數(shù),求X的分布列和數(shù)學期望E(X).
分析本題與例3 比較,有較強相似性,只是問題背景不同而已.題中“兩種心理暗示”“女志愿者人數(shù)”都表明問題是在“兩”類元素中取元素,且為不放回抽樣,可以判斷X 服從超幾何分布.
認真學習教材給出的定義,尤其要理解每一個字母的含義,每一個符號的作用.牢牢把握定義的精髓.
人民教育出版社A 版《數(shù)學》選修2-3 第59 頁B 組第3題以及對應(yīng)的教師教學用書第63 頁內(nèi)容.尤其是“說明”非常重要,內(nèi)容如下:由于數(shù)字比較大,可以利用計算機或計算器進行數(shù)值計算.另外,本題目也可以幫助學生了解超幾何分布和二項分布之間的關(guān)系:
第一,n 次試驗中,某一事件A 出現(xiàn)的次數(shù)X 可能服從超幾何分布或二項分布.當這n 次試驗是獨立重復試驗時,X 服從二項分布;當這n 次試驗是不放回摸球問題,事件A為摸到某種特性(如某種顏色)的球時,X 服從超幾何分布.
第二,在不放回n 次摸球試驗中,摸到某種顔色球的次數(shù)X 服從超幾何分布.但是當袋子中的球的數(shù)目N 很大時,X 的分布列近似于二項分布,并且隨著N 的增加,這種近似的精度也增加.
從教學實戰(zhàn)經(jīng)驗看,概率統(tǒng)計問題具有較強的創(chuàng)新性和應(yīng)用性,是數(shù)學建模核心素養(yǎng)的實際考查點位.對學生來說,這是一個復雜而艱巨的問題,必須靜待“頓悟”從“漸悟”中來,不可急于求成.分類訓練是一個行之有效的辦法,首先訓練超幾何分布,再訓練二項分布,再混合訓練.教學中務(wù)必做好三件事:一是讀懂題,即應(yīng)花相當?shù)臅r間去閱讀、處理文字圖表信息、準確把握題意;二是選擇模型,確保審題無誤,方向正確.在概念的指導下慢慢地“悟”,何為二項分布,何為超幾何分布;三是算對數(shù)值,這是學生的一個痛,經(jīng)常是認認真真地算出一個錯誤答案.在教學中,我們要敢于在課堂上給學生時間,現(xiàn)場限時訓練,提高速度和準確率.最終達到提高學生核心素養(yǎng)的目的.
練習1(2015年天津卷理科第16 題)為推動乒乓球運動的發(fā)展, 某乒乓球比賽允許不同協(xié)會的運動員組隊參加.現(xiàn)有來自甲協(xié)會的運動員3 名,其中種子選手2 名;乙協(xié)會的運動員5 名,其中種子選手3 名.從這8 名運動員中隨機選擇4 人參加比賽.
(I) 略;(II) 設(shè)X 為選出的4 人中種子選手的人數(shù),求隨機變量X 的分布列和數(shù)學期望E(X).(提示:超幾何分布.)
練習2(2014年福建高考卷理科第18 題)為回饋顧客,某商場擬通過摸球兌獎的方式對1000 位顧客進行獎勵,規(guī)定:每位顧客從一個裝有4 個標有面值的球的袋中一次性隨機摸出2 個球,球上所標面值之和為顧客所獲的獎勵額.
(I) 若袋中所裝的4 個球中有1 個所標的面值為50 元,其余3 個均為10 元,求:①略; ②顧客所獲的獎勵額的分布列及數(shù)學期望.(提示:超幾何分布.)
練習3(2012 四川卷理科第17 題)某居民小區(qū)有兩個相互獨立的安全防范系統(tǒng)(簡稱系統(tǒng))A 和B,系統(tǒng)A 和系統(tǒng)B 在任意時刻發(fā)生故障的概率分別為和p.
(I) 略;(II) 設(shè)系統(tǒng)A 在三次相互獨立的檢測中不發(fā)生故障的次數(shù)為隨機變量ξ,求隨機變量ξ 的分布列和數(shù)學期望Eξ.(提示:二項分布.)
練習4(2019年新疆自治區(qū)二模理科第19 題)今年學雷鋒日,烏魯木齊市某中學計劃從高中三個年級選派4 名教師和若干名學生去當學雷鋒文明交通宣傳志愿者,用分層抽樣法從高中三個年級的相關(guān)人員中抽取若干人組成文明交通宣傳小組,學生的選派情況如下:
年級相關(guān)人數(shù)抽取人數(shù)高一99 x高二27 y高三18 2
(I) 略;(II) 略;(III) 若4 名教師可去A、B、C 三個學雷鋒文明交通宣傳點進行文明交通宣傳,其中每名教師去A、B、C 三個文明交通宣傳點是等可能的,且各位教師的選擇相互獨立.記到文明交通宣傳點A 的人數(shù)為X,求隨機變量X的分布列和數(shù)學期望.(提示:二項分布.)
在老師的指導下,讓學生掌握二項分布和超幾何分布的概念,理清二者的區(qū)別和聯(lián)系,真正掌握二者的本質(zhì),學懂弄通,再在練習中提高認識,強化概念,可謂是“授之以漁”,我們可以杜絕“授之以魚”,就題講題,真正提高復習備考的實效性.
統(tǒng)計發(fā)現(xiàn),近幾年來,地方卷多次反復考查了二項分布和超幾何分布.在解答題層面全國卷已經(jīng)考查了函數(shù)背景下的統(tǒng)計概率問題(連續(xù)3年);回歸方程(兩次);獨立性檢驗;莖葉圖背景下的概率統(tǒng)計; 不計算的論述題(兩次); 相關(guān)系數(shù);正態(tài)分布.但全國卷還未考查二項分布和超幾何分布,這值得我們在教學中留心注意.