本考點(diǎn)主要有兩類(lèi)問(wèn)題:一是回歸分析的問(wèn)題;二是獨(dú)立性檢驗(yàn)的問(wèn)題. 理科一般會(huì)在選擇題、填空題中出現(xiàn),文科也會(huì)在解答題中出現(xiàn),難度中等.
(1)了解獨(dú)立檢驗(yàn)(只要求2?鄢2列聯(lián)表)的基本思想、方法及其簡(jiǎn)單應(yīng)用.
(2)了解回歸分析的基本思想、方法及其簡(jiǎn)單應(yīng)用.
①會(huì)作兩個(gè)有關(guān)聯(lián)變量的數(shù)據(jù)的散點(diǎn)圖,利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系.
②了解最小二乘法的思想,能根據(jù)給出的線(xiàn)性回歸方程系數(shù)公式建立線(xiàn)性回歸方程(線(xiàn)性回歸方程系數(shù)公式不要求記憶).
了解獨(dú)立性檢驗(yàn)和回歸分析的基本思想、方法是解決兩類(lèi)問(wèn)題的關(guān)鍵. 關(guān)于求線(xiàn)性回歸方程,方法是最小二乘法,其步驟是:①計(jì)算 , ;②計(jì)算∑xiyi,∑x ;③計(jì)算 , ;④代入寫(xiě)出回歸直線(xiàn)方程.其中求 , 時(shí)需要利用系數(shù)公式,此公式在高考中會(huì)直接給出,同學(xué)們不需要記憶.關(guān)于獨(dú)立性檢驗(yàn),是求k2的值,通過(guò)比較臨界值表來(lái)分析兩個(gè)分類(lèi)變量的相關(guān)程度,其中k2公式在高考中也會(huì)直接給出,同學(xué)們亦不需要記憶.這兩類(lèi)問(wèn)題的解決還有一個(gè)關(guān)鍵就是數(shù)據(jù)處理與運(yùn)算求解,途徑合理、速度快捷、結(jié)果準(zhǔn)確非常重要.
例1 某高中學(xué)校對(duì)高一年級(jí)學(xué)生在計(jì)算機(jī)上練習(xí)使用五筆輸入法打字進(jìn)行了統(tǒng)計(jì)研究,他們記錄了學(xué)生練習(xí)的時(shí)間和最后考核每分鐘打字的個(gè)數(shù),從中抽取了五位學(xué)生的數(shù)據(jù)列表如下:
(1)從這5位學(xué)生中任選2人,記每分鐘打字?jǐn)?shù)分別為m,n,求事件“m,n均小于45”的概率;
(2)請(qǐng)根據(jù)乙、丙、丁三人的數(shù)據(jù),求出y關(guān)于x的線(xiàn)性回歸方程 = x+ ;
(3)若由線(xiàn)性回歸方程得到的估計(jì)數(shù)據(jù)與所選出的檢驗(yàn)數(shù)據(jù)的誤差均不超過(guò)2個(gè),則認(rèn)為得到的線(xiàn)性回歸方程是可靠的,試問(wèn):(2)所得的線(xiàn)性回歸方程是否可靠?
(參考公式:回歸直線(xiàn)方程是 = x+ ,其中 = , = - )
破解思路 本題共三個(gè)問(wèn)題,其中第一個(gè)問(wèn)題考查隨機(jī)事件的概率;第二、第三個(gè)問(wèn)題考查回歸分析的數(shù)學(xué)思想. 用最小二乘法求回歸直線(xiàn)的方程時(shí)要根據(jù)步驟來(lái)完成,其中第一步、第二步是對(duì)第三步的一個(gè)分解計(jì)算. 解決此題雖然不需要很強(qiáng)的思維能力,但對(duì)運(yùn)算能力的要求較高. 另外,如果沒(méi)有告訴兩個(gè)變量具有很強(qiáng)的線(xiàn)性相關(guān)性,求回歸直線(xiàn)方程前,首先應(yīng)進(jìn)行相關(guān)性檢驗(yàn),若畫(huà)散點(diǎn)圖,則要觀(guān)察散點(diǎn)是否大致分布在一條直線(xiàn)附近,然后求出的回歸直線(xiàn)方程才有實(shí)際意義,否則,求出的回歸直線(xiàn)方程毫無(wú)意義. 或通過(guò)相關(guān)系數(shù)的絕對(duì)值與0.75的關(guān)系來(lái)判定兩個(gè)變量的相關(guān)性的強(qiáng)弱.
答案詳解 (1)m,n構(gòu)成的基本事件(m,n)有:(43,45),(43,50),(43,46),(43,36),(45,50),(45,46),(45,36),(50,46),(50,36),(46,36),共10個(gè). 其中“m,n均小于45”的有1個(gè),即(43,36),所以事件“m,n均小于45”的概率為 .
(2)因?yàn)?=12, =47,所以 = = .
于是, =47- ×12=17.
故所求線(xiàn)性回歸方程為 = x+17.
(3)由(2)知, = x+17,當(dāng)x=10時(shí),y=42;當(dāng)x=8時(shí),y=37. 與檢驗(yàn)數(shù)據(jù)的誤差均為1,滿(mǎn)足題意. 故認(rèn)為得到的線(xiàn)性回歸方程是可靠的.
例2 春節(jié)期間,某市消費(fèi)者報(bào)一記者走上街頭,調(diào)查消費(fèi)者對(duì)該市食品安全的滿(mǎn)意情況,他隨機(jī)詢(xún)問(wèn)了110名消費(fèi)者,得到如下的列聯(lián)表:
(1)采取分層抽樣的方法,從這50名女性消費(fèi)者中按對(duì)食品安全是否滿(mǎn)意抽取一個(gè)容量為5的樣本,問(wèn):樣本中滿(mǎn)意與不滿(mǎn)意的女消費(fèi)者各有多少名?
(2)從(1)中的5名女消費(fèi)者樣本中隨機(jī)選取2名作深度訪(fǎng)談,求選到滿(mǎn)意與不滿(mǎn)意的女消費(fèi)者各一名的概率;
(3)根據(jù)以上列聯(lián)表,請(qǐng)問(wèn):有多大把握認(rèn)為“該市消費(fèi)者性別與對(duì)該市食品安全滿(mǎn)意”有關(guān)?
注:k2= .
臨界值表:
破解思路 本題第一問(wèn)考查分層抽樣,第二問(wèn)考查隨機(jī)事件的概率,第三問(wèn)考查獨(dú)立性檢驗(yàn)的數(shù)學(xué)思想. 第三問(wèn)的解決是根據(jù)k2公式求出k2的值,然后對(duì)照臨界值表評(píng)價(jià)兩個(gè)分類(lèi)變量的相關(guān)程度.
答案詳解 (1)根據(jù)分層抽樣可得:樣本中滿(mǎn)意的女消費(fèi)者為 ×5=3名,樣本中不滿(mǎn)意的女消費(fèi)者為 ×5=2名.
(2)記樣本中對(duì)食品安全滿(mǎn)意的3名女消費(fèi)者分別為a1,a2,a3,對(duì)食品安全不滿(mǎn)意的2名女消費(fèi)者分別為b1,b2. 從5名女消費(fèi)者中隨機(jī)選取2名,共有10個(gè)基本事件,分別為:(a1,a2),(a1,a3),(a1,b1),(a1,b2),(a2,a3),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2). 其中事件A“選到滿(mǎn)意與不滿(mǎn)意的女消費(fèi)者各一名”包含了6個(gè)基本事件,分別為:(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2). 所以所求概率P(A)= = .
(3)假設(shè)H0:該市消費(fèi)者性別與對(duì)食品安全滿(mǎn)意無(wú)關(guān),則k2應(yīng)該很小. k2= = ≈7.486,由P(k2≥6.635)=0.010可知,有99%的把握認(rèn)為:該市消費(fèi)者性別與對(duì)食品安全滿(mǎn)意有關(guān).
1. 對(duì)兩個(gè)變量y和x進(jìn)行回歸分析,得到一組樣本數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),則下列說(shuō)法不正確的是( )
A. 若求得的回歸方程為 =0.9x-0.3,則變量y和x之間具有正相關(guān)
B. 若這組樣本數(shù)據(jù)分別是(1,1),(2,1.5),(4,3),(5,4.5),則其回歸方程 =bx+a必過(guò)點(diǎn)(3,2.5)
C. 若同學(xué)甲根據(jù)這組數(shù)據(jù)得到的回歸模型l的殘差平方和為E1=0.8,同學(xué)乙根據(jù)這組數(shù)據(jù)得到的回歸模型2的殘差平方和為E2=2.1,則模型1的擬合效果更好
D. 若用相關(guān)指數(shù)R2(R2=1- )來(lái)刻畫(huà)回歸效果,回歸模型3的相關(guān)指數(shù)R23=0.32,回歸模型4的相關(guān)指數(shù)R24=0.91,則模型3的擬合效果更好
2. 某校對(duì)學(xué)生周末的業(yè)余生活狀況進(jìn)行調(diào)查. 某調(diào)查小組隨機(jī)抽查了該校55名學(xué)生,以此來(lái)研究學(xué)生在周末喜歡運(yùn)動(dòng)與性別的關(guān)系,得到下面的數(shù)據(jù)表:
(1)判斷能否在犯錯(cuò)誤的概率不超過(guò)0.5%的前提下認(rèn)為喜歡運(yùn)動(dòng)與性別有關(guān);
(2)用分層抽樣的方法從喜歡運(yùn)動(dòng)的學(xué)生中抽取6名學(xué)生作進(jìn)一步調(diào)查,將這6名學(xué)生作為一個(gè)樣本,從中任選2人,求恰有1名男生和1名女生的概率.
下面的臨界值表供參考:
注:k2= .endprint