為了研究一些生活中的問題,找出其中的規(guī)律,我們通常需收集、整理一些數(shù)據(jù),從中提煉出一些信息,構(gòu)建出數(shù)學(xué)模型,以利用數(shù)學(xué)模型進行計算、推斷、得出結(jié)論,從而作出正確的決策.這就需要用到一些統(tǒng)計知識,如數(shù)學(xué)期望、標準差、方差、最大值、最小值、眾數(shù)、中位數(shù)、極差,通過獨立性檢驗、回歸分析等方法作出分析、推斷,從而為作出決策提供理論依據(jù).
一、根據(jù)數(shù)學(xué)期望作出決策
在收集和整理數(shù)據(jù)后,往往需要對數(shù)據(jù)進行分析,如分析一組數(shù)據(jù)的數(shù)學(xué)期望,即均值,以了解數(shù)據(jù)的特征,作出相應(yīng)的決策.
一般地,若離散型隨機變量 x 的分布列為:
則稱 E(X)=x1 p1 +x2 p2+…+xi pi +…+xnpn為隨機變量 X 的均值或數(shù)學(xué)期望.它反映了離散型隨機變量取值的平均水平.
根據(jù)數(shù)學(xué)期望來作出決策,通常要先讀懂圖表,仔細研究其中的數(shù)據(jù);然后求出相關(guān)事件的概率、列出隨機變量的分布列;再求得數(shù)學(xué)期望,得出結(jié)論,進而作出決策.
例1.受轎車在保修期內(nèi)維修費的影響,企業(yè)生產(chǎn)每輛轎車的利潤與該轎車首次出現(xiàn)故障的時間有關(guān). 某轎車制造廠生產(chǎn)甲、乙兩種品牌轎車的保修期均為 2年,現(xiàn)從該廠已售出的兩種品牌轎車中分別隨機抽取50輛,統(tǒng)計數(shù)據(jù)如下表:
現(xiàn)將其頻率視為概率.若該廠生產(chǎn)的轎車均能售出,記生產(chǎn)一輛甲品牌轎車的利潤為 x1 萬元,生產(chǎn)一輛乙品牌轎車的利潤為 x2 萬元.由于資金限制,只能生產(chǎn)其中的一種型號.那么生產(chǎn)哪種型號的汽車,能取得最大經(jīng)濟效益?
解
要知道生產(chǎn)哪種型號的汽車能取得最大經(jīng)濟效益,只需比較生產(chǎn)兩種型號汽車的平均利潤,即比較其數(shù)學(xué)期望值,就能作出決策.
二、通過獨立性檢驗作出決策
獨立性檢驗是一種重要的檢驗方法.在分析研究問題時,我們經(jīng)常要對不同的假設(shè)進行檢驗,通過檢驗兩個或多個變量之間是否存在相關(guān)性或獨立性,判斷不同假設(shè)的可行性,對實際情況進行推斷,并根據(jù)推斷結(jié)果作出決策.在進行獨立性實驗時,要先假設(shè) “兩個變量沒有關(guān)系”;然后由觀測數(shù)據(jù)計算得到隨機變量 K2 的觀測值 k ;再根據(jù)隨機變量 K2 的含義判斷假設(shè)是否合理.
例 2.某視頻上傳者為了確定下一段時間的視頻制作方向,發(fā)布主題為“你希望我接下來更新哪個方向的視頻”的投票活動,共計 8000 人參與此投票,投票結(jié)果如下圖所示(每位關(guān)注者僅選一項).
其中,投票游戲、動漫、生活的關(guān)注者之比為 1:1:3 .以游戲與生活兩個方向為例,依據(jù)小概率值 α = 0.001的 χ2 獨立性檢驗,判斷性別與關(guān)注者喜歡視頻上傳者上傳視頻的類型是否有關(guān).
解:根據(jù)統(tǒng)計圖計算可得,選擇游戲的關(guān)注者中,男性關(guān)注者的人數(shù)為 8000 × 1 5 × 0.9 = 1440 人,女性關(guān)注者的人數(shù)為 8000 × 1 5 × 0.1 = 160 人;選擇生活的關(guān)注者中,男性關(guān)注者的人數(shù)為 8000 × 3 5 × 0.2 = 960 人,女性關(guān)注者的人數(shù)為 8000 × 3 5 × 0.8 = 3840 人.
假設(shè) H0: 性別對關(guān)注者喜歡視頻上傳者上傳視頻的類型有關(guān)
由計算的數(shù)據(jù)可以得到下面的表格:
題目要求判斷性別與上傳視頻的類型是否相關(guān),即是對這種不確定性問題的決策.只需運用獨立性檢驗的方法求得 χ2 ,當 χ2 的數(shù)值越大,表示觀察值和期望值之間的差異越大,變量間的關(guān)聯(lián)性越強.值得注意的是,在進行獨立性檢驗時,需要確保樣本容量足夠大,以提高統(tǒng)計檢驗的可靠性.
三、通過回歸分析作出決策
在分析問題時,常常需要了解變量之間的關(guān)系.而回歸分析法是統(tǒng)計學(xué)中分析數(shù)據(jù)常用的方法.通過建立回歸模型,預(yù)測一個或多個自變量對因變量的影響,從而為決策者提供量化的指導(dǎo),使其能夠作出正確的決策.回歸分析分為線性回歸分析和非線性回歸分析兩種.對于線性回歸分析問題,通常要先畫出散點圖,判斷兩個變量是否線性相關(guān),并計算相關(guān)系數(shù) r ;然后根據(jù)公式求回歸直線的方程;最后用回歸直線方程進行計算、預(yù)報,作出決策.而對于非線性回歸分析問題,常常要根據(jù)已知擬合的函數(shù)進行計算,結(jié)合系數(shù)或殘差圖來判斷擬合的效果,確定哪一種函數(shù)模型更適合用來預(yù)報、決策.
例 3.某食品公司為了讓新研發(fā)的某種零食更好地占領(lǐng)市場,受到顧客的喜歡,根據(jù)市場調(diào)研與模擬,得到該零食的單包成本 y (單位:元)與生產(chǎn)的數(shù)量 x (單位:千包)之間的關(guān)系,相關(guān)數(shù)據(jù)見下表:
根據(jù)以上數(shù)據(jù),技術(shù)人員分別借助甲、乙兩種不同的回歸模型,得到兩個回歸方程,方程甲: y?(1)= 4 x + 1.1 ,方程乙:y?(2)= 6.4 x 2 + 1.6 .為了評價兩種模型的擬合效果,并得到了下表.
(1)分別計算模型甲與模型乙的殘差平方和 Q1 及 Q2 ,并比較 Q1 ,Q2 的大小,判斷哪個模型擬合效果更好.
(2)該新品上市之后,受到廣大消費者熱捧,于是該食品公司決定再投入生產(chǎn).根據(jù)市場調(diào)查,新需求量為8千包或16千包.若食品公司以每包5元的價格將零食出售給訂貨商,估計食品公司二次投入生產(chǎn)8千包還是16千包能獲得更多利潤?(按(1)中擬合效果較好的模型計算)
解
我們先利用殘差平方和來判斷函數(shù)模型擬合的效果;然后借助函數(shù)模型來求出兩種情形下獲得的利潤,并進行比較,即可確定問題的答案.在進行回歸分析時,由于擬合函數(shù)值與實際數(shù)據(jù)之間總存在一些偏差,因此要注意殘差對模型的影響,可以用殘差圖、殘差平方和、相關(guān)指數(shù) R2 來判斷函數(shù)模型擬合的效果.
總之,同學(xué)們要把握相關(guān)概念的本質(zhì),熟練掌握一些基本模型,并靈活運用數(shù)列、導(dǎo)數(shù)、函數(shù)等知識來解題.只有夯實基礎(chǔ),并進行針對性練習,才能靈活運用統(tǒng)計知識獲得更準確的結(jié)論,以作出正確的決策.
(作者單位:江蘇省連云港高級中學(xué))