《普通高中數(shù)學(xué)課程標(biāo)準(zhǔn)(2017 年版)》將“數(shù)據(jù)分析”列為高中數(shù)學(xué)六大核心素養(yǎng)之一。數(shù)據(jù)分析是指針對(duì)研究對(duì)象獲得相關(guān)數(shù)據(jù),運(yùn)用統(tǒng)計(jì)方法對(duì)數(shù)據(jù)中的有用信息進(jìn)行分析和推斷,形成知識(shí)的過(guò)程,主要表現(xiàn)為:收集數(shù)據(jù),整理數(shù)據(jù),提取信息,構(gòu)建模型,對(duì)信息進(jìn)行分析、推斷,獲得結(jié)論。
概率與統(tǒng)計(jì)部分,作為高中數(shù)學(xué)課程內(nèi)容的重要組成部分,是培養(yǎng)學(xué)生核心素養(yǎng)的關(guān)鍵環(huán)節(jié)。其中,數(shù)據(jù)分析是概率與統(tǒng)計(jì)的核心,概率與統(tǒng)計(jì)是學(xué)生數(shù)據(jù)分析素養(yǎng)發(fā)展的知識(shí)載體。
為有效提高數(shù)據(jù)分析素養(yǎng),準(zhǔn)確探求高考命題規(guī)律,下面結(jié)合2023年高考概率與統(tǒng)計(jì)試題,和同學(xué)們一起實(shí)際感受數(shù)據(jù)分析視角下高考概率與統(tǒng)計(jì)試題的命題特征。
一、數(shù)據(jù)分析素養(yǎng)之收集數(shù)據(jù)
例1 (2023 年新高考全國(guó)Ⅱ 卷第3題)某學(xué)校為了解學(xué)生參加體育運(yùn)動(dòng)的情況,用比例分配的分層隨機(jī)抽樣方法作抽樣調(diào)查,擬從初中部和高中部共抽取60名學(xué)生,已知該校初中部和高中部分別有400 名和200名學(xué)生,則不同的抽樣結(jié)果共有( )。
A.C44500·C12500 種 B.C24000·C42000 種
C.C34000·C32000 種 D.C44000·C22000 種
解析:因?yàn)槌踔胁亢透咧胁糠謩e有400名和200名學(xué)生,所以人數(shù)比例為400∶200=2∶1,需要從初中部抽取40人,高中部抽取20人。
故不同的抽樣結(jié)果共有C44000·C22000 種,選D。
例2 (2023年天津卷理科第13 題)甲、乙、丙三個(gè)盒子中裝有一定數(shù)量的、完全相同的黑球和白球,總數(shù)之比為5∶4∶6。
這三個(gè)盒子中黑球占總數(shù)的比例分別為40%,25%,50%。現(xiàn)從三個(gè)盒子中各取一個(gè)球,取到的三個(gè)球都是黑球的概率為_(kāi)___;將三個(gè)盒子混合后任取一個(gè)球,取到白球的概率為_(kāi)___。
解析:設(shè)甲、乙、丙三個(gè)盒子中球的個(gè)數(shù)分別為5n,4n,6n,則總數(shù)為15n。
則甲盒中黑球個(gè)數(shù)為40%×5n=2n,白球個(gè)數(shù)為3n。
乙盒中黑球個(gè)數(shù)為25%×4n=n,白球個(gè)數(shù)為3n。
丙盒中黑球個(gè)數(shù)為50%×6n=3n,白球個(gè)數(shù)為3n。
記“從三個(gè)盒子中各取一個(gè)球,取到的球都是黑球”為事件A,則P (A )=0.4×0.25×0.5=0.05。
記“將三個(gè)盒子混合后任取一個(gè)球,取到白球”為事件B,黑球總共有2n+n+3n=6n個(gè),白球共有9n 個(gè),則P(B)=9n/15n=3/5。
點(diǎn)評(píng): 數(shù)據(jù)分析素養(yǎng)之收集數(shù)據(jù)主要包括:能夠掌握運(yùn)用調(diào)研、試驗(yàn)和查閱資料等收集數(shù)據(jù)的基本方法;根據(jù)解題的需要,選擇隨機(jī)抽樣、分層抽樣等不同的抽樣方法收集數(shù)據(jù);合理運(yùn)用餅狀圖、條形圖等統(tǒng)計(jì)圖表對(duì)數(shù)據(jù)進(jìn)行直觀描述;能夠通過(guò)統(tǒng)計(jì)圖表識(shí)別數(shù)據(jù)的數(shù)字特征。
二、數(shù)據(jù)分析素養(yǎng)之整理數(shù)據(jù)
例3 (2023年上海卷第14題)根據(jù)身高和體重散點(diǎn)圖(圖1),下列說(shuō)法正確的是( )。
A.身高越高,體重越重
B.身高越高,體重越輕
C.身高與體重成正相關(guān)
D.身高與體重成負(fù)相關(guān)
解析:根據(jù)散點(diǎn)圖可知,散點(diǎn)的分布是從左下到右上,則身高和體重成正相關(guān)。故選C。
例4 (2023年天津卷理科第7題)調(diào)查某種群花萼長(zhǎng)度和花瓣長(zhǎng)度,所得數(shù)據(jù)如圖2所示,其中相關(guān)系數(shù)r=0.824 5,下列說(shuō)法正確的是( )。
A.花瓣長(zhǎng)度和花萼長(zhǎng)度沒(méi)有相關(guān)性
B.花瓣長(zhǎng)度和花萼長(zhǎng)度呈現(xiàn)負(fù)相關(guān)
C.花瓣長(zhǎng)度和花萼長(zhǎng)度呈現(xiàn)正相關(guān)
D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.824 5
解析:根據(jù)散點(diǎn)的集中程度可知,花瓣長(zhǎng)度和花萼長(zhǎng)度有相關(guān)性,故A 選項(xiàng)錯(cuò)誤。
散點(diǎn)的分布是從左下到右上,從而花瓣長(zhǎng)度和花萼長(zhǎng)度呈現(xiàn)正相關(guān)性,故B 選項(xiàng)錯(cuò)誤,C選項(xiàng)正確。
由于r=0.824 5是全部數(shù)據(jù)的相關(guān)系數(shù),取出來(lái)一部分?jǐn)?shù)據(jù),相關(guān)性可能變強(qiáng),也可能變?nèi)?,即取出的?shù)據(jù)的相關(guān)系數(shù)不一定是0.824 5,故D選項(xiàng)錯(cuò)誤。
故選C。
例5 (2023年上海卷第9題)國(guó)內(nèi)生產(chǎn)總值(GDP)是衡量地區(qū)經(jīng)濟(jì)狀況的最佳指標(biāo),統(tǒng)計(jì)數(shù)據(jù)顯示,某市在2020年經(jīng)濟(jì)高質(zhì)量增長(zhǎng),GDP 逐月增加。已知第一季度的GDP為231(單位:億元),第四季度的GDP為242(單位:億元),且四個(gè)季度的GDP 中位數(shù)與平均數(shù)相同,則該市2020 年的GDP總額為_(kāi)___。
解析:設(shè)第二季度GDP 為x 億元,第三季度GDP為y 億元,則231lt;xlt;ylt;242。
因?yàn)橹形粩?shù)與平均數(shù)相同,所以x+y/2 =231+x+y+242/4 ,即x+y=473。
因此,該市2020年的GDP總額為231+x+y+242=946(億元)。
例6 (2023 年全國(guó)乙卷理科第17題) 某廠為比較甲、乙兩種工藝對(duì)橡膠產(chǎn)品伸縮率的處理效應(yīng),進(jìn)行10次配對(duì)試驗(yàn),每次配對(duì)試驗(yàn)均選用材質(zhì)相同的兩個(gè)橡膠產(chǎn)品,隨機(jī)地選其中一個(gè)用甲工藝處理,另一個(gè)用乙工藝處理,測(cè)量處理后的橡膠產(chǎn)品的伸縮率。甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為xi,yi(i=1,2,…,10)。
試驗(yàn)結(jié)果如表1所示。
記zi =xi -yi (i=1,2,…,10),記z1,z2,…,z10 的樣本平均數(shù)為z,樣本方差為s2。
(1)求z,s2;
(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(若z≥2根號(hào)下 s2/10,則認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高,否則不認(rèn)為有顯著提高)。
解析:(1)由題意可得:
所以認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高。
點(diǎn)評(píng):數(shù)據(jù)分析素養(yǎng)之整理數(shù)據(jù)主要包括:能夠運(yùn)用恰當(dāng)?shù)臄?shù)學(xué)方法處理數(shù)據(jù);能夠綜合運(yùn)用數(shù)字、文字、 圖形、表格等多種形式描述數(shù)據(jù),并認(rèn)清數(shù)據(jù)之間的關(guān)系;能夠利用相關(guān)公式計(jì)算樣本數(shù)據(jù)的眾數(shù)、中位數(shù)、平均數(shù)、標(biāo)準(zhǔn)差和方差等數(shù)字特征。
三、數(shù)據(jù)分析素養(yǎng)之構(gòu)建模型
例7 (2023年新高考全國(guó)Ⅱ 卷第19題)某研究小組經(jīng)過(guò)研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項(xiàng)醫(yī)學(xué)指標(biāo)有明顯差異,經(jīng)過(guò)大量調(diào)查,得到如圖3、圖4所示的患病者和未患病者該指標(biāo)的頻率分布直方圖。
利用該指標(biāo)制定一個(gè)檢測(cè)標(biāo)準(zhǔn),需要確定臨界值c,將該指標(biāo)大于c 的人判定為陽(yáng)性,小于或等于c的人判定為陰性。此檢測(cè)標(biāo)準(zhǔn)的漏診率是將患病者判定為陰性的概率,記為p(c);誤診率是將未患病者判定為陽(yáng)性的概率,記為q(c)。假設(shè)數(shù)據(jù)在組內(nèi)均勻分布,以事件發(fā)生的頻率作為相應(yīng)事件發(fā)生的概率。
(1)當(dāng)漏診率p(c)=0.5%時(shí),求臨界值c 和誤診率q(c);
(2)設(shè)函數(shù)f(c)=p(c)+q(c),當(dāng)c∈[95,105]時(shí),求f(c)的解析式,并求f(c)在區(qū)間[95,105]內(nèi)的最小值。
解析:(1)依題可知,圖3中第一個(gè)小矩形的面積為5×0.002gt;0.5%,所以95
q(c)=0.01×(97.5-95)+5×0.002=0.035=3.5%。
(2)當(dāng)c∈[95,100]時(shí),f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002 =-0.008c+0.82≥0.02;當(dāng)c∈(100,105]時(shí),f(c)=p(c)+q(c)=5×0.002+ (c-100)×0.012+ (105-c)×0.002=0.01c-0.98gt;0.02。
點(diǎn)評(píng):數(shù)據(jù)分析素養(yǎng)之構(gòu)建模型主要包括:能夠根據(jù)問(wèn)題的需要,用合適的度量來(lái)表達(dá)數(shù)據(jù)的差異性;合理構(gòu)建常見(jiàn)的兩點(diǎn)分布、超幾何分布、二項(xiàng)分布、正態(tài)分布等概率模型。
四、數(shù)據(jù)分析素養(yǎng)之分析推斷
例8 (2023年北京卷理科第18 題)為研究某種農(nóng)產(chǎn)品價(jià)格變化的規(guī)律,收集得到該農(nóng)產(chǎn)品連續(xù)40天的價(jià)格變化數(shù)據(jù),如表2所示。在描述價(jià)格變化時(shí),用“+”表示“上漲”,即當(dāng)天價(jià)格比前一天價(jià)格高;用“-”表示“下跌”,即當(dāng)天價(jià)格比前一天價(jià)格低;用“0”表示“不變”,即當(dāng)天價(jià)格與前一天價(jià)格相同。
用頻率估計(jì)概率。
(1)試估計(jì)該農(nóng)產(chǎn)品價(jià)格“上漲”的概率。
(2)假設(shè)該農(nóng)產(chǎn)品每天的價(jià)格變化是相互獨(dú)立的。在未來(lái)的日子里任取4天,試估計(jì)該農(nóng)產(chǎn)品價(jià)格在這4天中2天“上漲”、1天“下跌”、1天“不變”的概率。
(3)假設(shè)該農(nóng)產(chǎn)品每天的價(jià)格變化只受前一天價(jià)格變化的影響。判斷第41天該農(nóng)產(chǎn)品價(jià)格“上漲”、 “下跌”和 “不變”的概率估計(jì)值哪個(gè)最大。(結(jié)論不要求證明)
解析:(1)根據(jù)表格數(shù)據(jù)可知,40天里,有16個(gè)+,即16天是上漲的,根據(jù)古典概型的計(jì)算公式,農(nóng)產(chǎn)品價(jià)格上漲的概率為16/40=0.4。
(2)在這40天里,16天上漲,14天下跌,10天不變,即上漲,下跌,不變的概率分別是0.4,0.35,0.25。
于是未來(lái)的日子里任取4天,2天上漲,1天下跌,1 天不變的概率是C24×0.42 ×C12×0.35×0.25=0.168。
(3)由于第40天處于上漲狀態(tài),從前39次的15次上漲進(jìn)行分析,上漲后下一次仍上漲的有4次,概率為4/15;不變的有9次,概率為3/5;下跌的有2次,概率為2/15。
因此估計(jì)第41天不變的概率估計(jì)值最大。
數(shù)據(jù)分析素養(yǎng)的提升是學(xué)生發(fā)展的重要基石,更是高考的主要考查內(nèi)容。對(duì)于概率與統(tǒng)計(jì)部分內(nèi)容的復(fù)習(xí),同學(xué)們要透過(guò)現(xiàn)象看本質(zhì),明晰概率意義和統(tǒng)計(jì)思想,明確數(shù)據(jù)分析的方法,明了高考試題的命題特征,學(xué)會(huì)針對(duì)不同問(wèn)題,運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)或概率模型解決問(wèn)題。
(責(zé)任編輯 徐利杰)