☉華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院 唐佳麗
☉華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院徐章韜
正交試驗(yàn)中的極差分析與方差分析
☉華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院 唐佳麗
☉華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院徐章韜
在社會(huì)生產(chǎn)和實(shí)際工作中,我們常常會(huì)遇到多因素的問(wèn)題,需要找出主要因素.為了節(jié)約時(shí)間、成本,提高效率,我們通常會(huì)抓影響試驗(yàn)的主要因素進(jìn)行研究[1].正交試驗(yàn)設(shè)計(jì)就是要求在較短的時(shí)間里,用較少的試驗(yàn)次數(shù)分清影響試驗(yàn)的主次因素.在“各個(gè)因素均衡分布”的指導(dǎo)思想下,運(yùn)用標(biāo)準(zhǔn)化的正交表來(lái)安排試驗(yàn),能減少試驗(yàn)次數(shù),縮短試驗(yàn)時(shí)間,并可用極差分析和方差分析對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行整理和合理的分析,快速找到優(yōu)化方案,取得較好的試驗(yàn)效果,具有很強(qiáng)的實(shí)用性.
對(duì)中學(xué)的概率統(tǒng)計(jì)課程而言,我們可以在更大一點(diǎn)的范圍內(nèi)深度挖掘教材內(nèi)涵[2].在人教版高中數(shù)學(xué)選修教材中,詳細(xì)介紹了試驗(yàn)設(shè)計(jì)和如何實(shí)施正交試驗(yàn)設(shè)計(jì),然而在數(shù)據(jù)的分析處理上只用了極差分析法,事實(shí)上還可以運(yùn)用方差分析法處理數(shù)據(jù).在教學(xué)實(shí)踐中,我們可以將方差分析的思想滲透給學(xué)生,從深度和廣度上拓寬學(xué)生的視野和思維,從而讓學(xué)生明白,數(shù)學(xué)的分支雖然千差萬(wàn)別,但不同的數(shù)學(xué)知識(shí)之間是相關(guān)聯(lián)的.本文正是做這方面的補(bǔ)充,為“正交試驗(yàn)設(shè)計(jì)”的教學(xué)添磚加瓦.
1.正交試驗(yàn)中的相關(guān)術(shù)語(yǔ)
為了便于閱讀,首先需要明白正交試驗(yàn)設(shè)計(jì)中的一些常見名詞.指標(biāo)是指在試驗(yàn)中需要考查的效果的特性值.例如,后面提到的彈簧的彈性,也就是因變量.因素也稱因子,是試驗(yàn)中考查對(duì)試驗(yàn)指標(biāo)可能有影響的原因或要素,也就是自變量,一般用大寫字母A、B、C來(lái)表示.水平是指試驗(yàn)中選定的因素所處的狀態(tài)和條件稱為水平或位級(jí)[3].全試驗(yàn)指各因素各水平全部的搭配都做試驗(yàn)[1].在多因素的情況下,最好能抓住主要因素,化多因素試驗(yàn)為少因素試驗(yàn),以達(dá)到用較少的試驗(yàn)次數(shù)取得較好效果的目的.
正交試驗(yàn)之所以在一定程度上能用部分試驗(yàn)去代表全試驗(yàn),主要是因?yàn)樗幸韵聝蓚€(gè)特點(diǎn):其一,用于試驗(yàn)安排的正交表具有正交性,這就保證了不同因素的不同水平參與試驗(yàn)的次數(shù)相等,不同因素的不同水平搭配出現(xiàn)的次數(shù)也相等,即各種因素的各種水平的搭配是均衡的;其二,正交試驗(yàn)設(shè)計(jì)具有整齊可比性,也稱綜合可比性.因其具有正交性,所以任意兩種因素之間進(jìn)行的是全試驗(yàn),在不考慮各因素交互作用的前提下,任一因素的各水平的試驗(yàn)條件近似相同,各因素間具有可比性.
2.正交試驗(yàn)實(shí)施步驟
以教材中“如何實(shí)施正交試驗(yàn)設(shè)計(jì)”這一章節(jié)的例1(某五金廠在彈簧生產(chǎn)中,有時(shí)發(fā)生產(chǎn)品斷裂現(xiàn)象,為提高彈簧的彈性指標(biāo),要做回火工藝試驗(yàn))為例,介紹正交試驗(yàn)設(shè)計(jì)的實(shí)施步驟,并在此基礎(chǔ)上對(duì)教材進(jìn)行深一步剖析,引進(jìn)方差分析,溝通極差分析與方差分析.
步驟1:制定因素水平表.
在制作因素水平表安排試驗(yàn)之前,首先,我們應(yīng)當(dāng)考慮試驗(yàn)指標(biāo)與試驗(yàn)?zāi)康模诖死?,試?yàn)指標(biāo)即彈簧的彈性,而目的就是提高彈簧的彈性,在實(shí)際需要中,彈性越大越好.其次,根據(jù)試驗(yàn)的目的、理論及平時(shí)生產(chǎn)的經(jīng)驗(yàn)綜合分析,選擇需要考查的因素:回火溫度(A);保溫時(shí)間(B);工件質(zhì)量(C),并確定好各因素的各個(gè)水平.其中,A:A1=440℃,A2=460℃,A3=500℃;B:B1=3min,B2= 4min,B3=5min;C:C1=7.5kg,C2=9.0kg,C3=10.5kg.最后,根據(jù)因素和水平制作因素水平表,見表1.
表1 因素水平表
步驟2:設(shè)計(jì)試驗(yàn)方案.
根據(jù)已經(jīng)制作完成的因素水平表,考慮試驗(yàn)條件和實(shí)際的可操作性,選擇一張適合的三水平正交表:L9(34),因這張表最多可以考查4個(gè)因素對(duì)試驗(yàn)結(jié)果的影響,而此次試驗(yàn)我們只考查3個(gè)因素對(duì)試驗(yàn)的影響,所以我們可任意選擇表中的3列進(jìn)行表頭設(shè)計(jì)并制作試驗(yàn)方案表安排試驗(yàn),見表2.
表2 回火試驗(yàn)方案表
步驟3:試驗(yàn)并列出試驗(yàn)結(jié)果分析計(jì)算表.
列出方案表之后,就可以根據(jù)方案表進(jìn)行試驗(yàn).試驗(yàn)過(guò)程中,我們應(yīng)特別注意:試驗(yàn)的次序盡可能隨機(jī)化以減少因素間相互影響造成較大的誤差;除了我們需要考查的因素,其他的試驗(yàn)條件在整個(gè)實(shí)驗(yàn)過(guò)程中盡量保持相同,增大結(jié)論的可靠性;準(zhǔn)確記錄好每一次試驗(yàn)的數(shù)據(jù).
試驗(yàn)結(jié)束后,對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行簡(jiǎn)單的分析計(jì)算,列出實(shí)驗(yàn)結(jié)果分析表,詳見表3.
表3 實(shí)驗(yàn)結(jié)果分析計(jì)算表
注:表中的T表示所有試驗(yàn)次數(shù)的數(shù)據(jù)之和,Ti表示各因素的第i水平所做試驗(yàn)的數(shù)據(jù)之和,Ti是Ti的平均數(shù),即各因素的第i水平所做試驗(yàn)的數(shù)據(jù)的平均數(shù),R表示各因素Ti的最大值和最小值之差,即Ti的極差.
1.數(shù)據(jù)的直觀分析——極差分析
由于正交試驗(yàn)具有正交性和綜合可比性,以A因素為例,雖然在試驗(yàn)中與B、C因素的搭配不同,但A因素的同一水平下的B、C因素處于相同的地位,其不同水平的效應(yīng)也可以近似抵消.如此,我們就可以把TAi(A因素的i水平數(shù)據(jù)的平均數(shù))的數(shù)據(jù)變化大體看成是由A因素的不同水平引起的,則RA就能近似看成A因素的水平變化能引起整個(gè)試驗(yàn)產(chǎn)生變化的程度,RA的值越大,說(shuō)明A因素對(duì)整個(gè)試驗(yàn)的影響越大,此因素對(duì)于試驗(yàn)越重要[1].反之,就說(shuō)明A因素對(duì)整個(gè)試驗(yàn)的影響越小,屬次要因素.B、C因素的比較與A因素同理,這就是極差分析法的原理.
用極差分析進(jìn)行分析,我們可以較為直觀地比較出來(lái)此次試驗(yàn)的主次因素,并通過(guò)簡(jiǎn)單的對(duì)比找出最優(yōu)水平的搭配.此例中,RA>RC>RB,所以A是影響試驗(yàn)的主要因素,B為次要因素.另外,我們可以根據(jù)TAi的數(shù)據(jù)大小選擇使彈性指標(biāo)最大的A因素的水平:A1,用相同的方法選出B1、C2,得到的搭配A1B1C2為最優(yōu)水平的搭配,即回火溫度為400℃,保溫時(shí)間為3min,工件質(zhì)量為9.0kg為最佳搭配.
當(dāng)然,在簡(jiǎn)單的數(shù)據(jù)之間進(jìn)行比較,使用圖示會(huì)更清晰明了,將極差的數(shù)據(jù)利用極差的效果對(duì)比圖表示出來(lái),可以更直觀地得到結(jié)論,如圖1.
圖1各因素極差對(duì)比圖
從圖中可以看出,對(duì)試驗(yàn)影響最大的因素為A,在各因素確定的各個(gè)水平上,使得y軸上數(shù)值(試驗(yàn)數(shù)據(jù):彈性指標(biāo))最大的水平分別為:A1、B1、C2,故最優(yōu)搭配為A1B1C2.
極差分析原理簡(jiǎn)便,通俗易懂,在分析數(shù)據(jù)中起到了一定的作用,但這種分析方法的局限性很強(qiáng):雖然我們可以將所有考查的因素進(jìn)行主次的排序,得到了主要因素,但這種因素對(duì)試驗(yàn)的影響是否顯著,在何種水平上顯著,我們?nèi)匀灰粺o(wú)所知.而且,引起試驗(yàn)數(shù)據(jù)變化的來(lái)源也十分模糊,我們并不知道數(shù)據(jù)的波動(dòng)究竟是由于因素的改變(可以解釋的誤差),還是由于試驗(yàn)的隨機(jī)誤差(未被解釋的誤差),在多大的程度上依賴于這兩種誤差?因此,這種分析從數(shù)學(xué)意義上就顯得過(guò)于粗糙,引進(jìn)方差分析正是為了解決這一問(wèn)題.
2.數(shù)據(jù)的方差分析
教材中并沒(méi)有對(duì)方差分析進(jìn)行介紹,但在“試驗(yàn)為什么要設(shè)計(jì)”這一章節(jié)中提到:“英國(guó)學(xué)者R.A.Fisher提出了方差分析方法,創(chuàng)立了‘試驗(yàn)設(shè)計(jì)’”[1].既然教材中有所提及,并說(shuō)明了方差分析在試驗(yàn)設(shè)計(jì)中的地位,教師就有必要挖掘教材的內(nèi)涵進(jìn)行拓展,架起溝通極差分析和方差分析之橋,完善學(xué)生的數(shù)學(xué)認(rèn)知結(jié)構(gòu),使教學(xué)內(nèi)容既能符合教學(xué)需要,又能促進(jìn)學(xué)生的發(fā)展.
方差分析是分類變量與定距變量之間的相關(guān)性分析[2],通過(guò)分析各因素引起的數(shù)據(jù)波動(dòng)較誤差引起的數(shù)據(jù)波動(dòng)的差異程度,來(lái)推斷相應(yīng)因素不同水平總體均值差異的顯著性.所以我們有必要對(duì)試驗(yàn)數(shù)據(jù)進(jìn)一步計(jì)算其相應(yīng)的離差平方和與誤差平方和,見表4,其中,ST為總離差平方和,SE為誤差平方和.
表4 方差分析計(jì)算表
表中相應(yīng)的數(shù)據(jù)計(jì)算公式和計(jì)算過(guò)程如下(r是各因素的水平數(shù),ni表示各因素i水平參與試驗(yàn)的次數(shù)):
當(dāng)正交表中出現(xiàn)空白列,則誤差平方和就等于總平方和減去各因素平方和;而當(dāng)正交表的列數(shù)充分使用時(shí),即每列都使用,誤差平方和就選擇各因素平方和中最小的一個(gè).
由以上的計(jì)算結(jié)果我們可以列出一個(gè)方差分析表,見表5.
表5 方差分析表
注:均方和等于平方和除以相應(yīng)的自由度,F(xiàn)比等于因素均方和除以誤差均方和.
顯然,F(xiàn)的比值越大,其相應(yīng)的因素對(duì)試驗(yàn)的影響程度越高,故能根據(jù)F比的大小排列出因素的主次程度.但僅僅有因素主次的排列是不夠的,極差分析也正好止步于此,而方差分析能進(jìn)行進(jìn)一步的分析.在方差分析中,看各因素對(duì)試驗(yàn)的影響是否顯著,在何種顯著性水平上顯著只需比較相應(yīng)的F比值與各顯著性水平的臨界值的大小.若因素F比超過(guò)了某一顯著性水平的臨界值,則此因素在此顯著性水平上顯著,反之,我們就認(rèn)為此因素在此水平上無(wú)顯著特征.這樣,我們就能深入地分析各因素對(duì)試驗(yàn)的影響程度.
從上面的分析表中可以看出FA=67.6>F(2,2)0.10=9.0,F(xiàn)A=67.6>F(2,2)0.05=19.0,A因素對(duì)試驗(yàn)的影響無(wú)論是在0.1的顯著性水平上,還是在0.05的顯著性水平上都表現(xiàn)為顯著,所以我們有理由相信A因素是顯著性因素.而C因素不僅在0.05的水平上不顯著,在0.10的水平上也不顯著,所以C因素在試驗(yàn)中對(duì)試驗(yàn)的影響很小.B較C更是對(duì)試驗(yàn)的影響不顯著,因此在選擇最優(yōu)搭配的時(shí)候,我們可以從環(huán)保、節(jié)約時(shí)間、降低成本,方便操作等角度綜合考慮,如B2因素節(jié)約材料,操作簡(jiǎn)單,故在試驗(yàn)中選擇B2水平是較合理的,這時(shí)得到的最優(yōu)水平的搭配A1B2C2較用極差分析法得到的最優(yōu)搭配A1B1C2更符合實(shí)際的需要,也更具有現(xiàn)實(shí)意義.當(dāng)然,如果在操作或技術(shù)層面的區(qū)別十分微小,就選擇使彈性指標(biāo)值最大的因素水平,此時(shí)最優(yōu)搭配亦為A1B1C2.
通過(guò)分析確定的最優(yōu)搭配A1B1C2并不在之前所做的9次試驗(yàn)當(dāng)中,而9次回火試驗(yàn)中,試驗(yàn)結(jié)果最好的是第2次試驗(yàn),彈性指標(biāo)為391,因而我們要對(duì)選擇的最優(yōu)搭配進(jìn)行試驗(yàn)驗(yàn)證.通過(guò)試驗(yàn),其試驗(yàn)結(jié)果指標(biāo)為400,高于第2次試驗(yàn)的試驗(yàn)指標(biāo)值391,則認(rèn)為A1B1C2是滿意的,也證實(shí)了A1B1C2是最優(yōu)的水平搭配.
通過(guò)對(duì)“正交試驗(yàn)設(shè)計(jì)”的闡述,我們可以看出,極差分析法思想樸素,原理單純,能根據(jù)各因素的極差大小排列出因素的主次順序,學(xué)生學(xué)習(xí)起來(lái)困難并不大.然而這種比較方法的精度并不高,教師若能在此基礎(chǔ)上進(jìn)一步引導(dǎo)學(xué)生思考誤差的來(lái)源,自然而然地將方差分析的思想和方法融入課堂,彌補(bǔ)極差分析之不足.這也要求在平時(shí)的實(shí)際的教學(xué)中,教師要縱觀數(shù)學(xué)和課堂的全局,有意識(shí)地挖掘教材,使教學(xué)內(nèi)容豐富多彩,使學(xué)生的數(shù)學(xué)認(rèn)知結(jié)構(gòu)日益精進(jìn).另外,教科書的編寫者花了大量心血編寫了通俗易懂、致力于提高學(xué)生核心素養(yǎng)的選修教材,若不加強(qiáng)教學(xué)研究,任之束于高閣,絕非課程改革的本意,故我們以溝通極差分析與方差分析為主題,撰寫了小文.
1.課程教材研究所.普通高中課程標(biāo)準(zhǔn)試驗(yàn)教科書(B版)數(shù)學(xué)選修4-7[M].北京:人民教育出版社,2007.
2.徐章韜,趙宏.作為數(shù)學(xué)教育研究數(shù)據(jù)處理的方差[J].中學(xué)數(shù)學(xué)(上),2016(2).
3.徐仲安,王天保,李常英.正交試驗(yàn)設(shè)計(jì)法簡(jiǎn)介[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2002(7).F