胡純嚴 ,胡良平 ,2*
(1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
析因設計是一種全因素試驗設計方法,也就是要在全部試驗因素的各種水平組合條件下進行2次及以上獨立重復試驗。通過此設計收集到的定量資料,可以全面反映所有試驗因素及其各階交互作用項對定量觀測結(jié)果影響的詳細信息。本文將介紹析因設計的特點、具體實施方法、定量資料一元方差分析的計算公式和SAS實現(xiàn)方法。
析因設計是安排因素之間存在復雜交互作用的多因素試驗的重要方法[1-2]。具體做法如下:羅列出試驗因素的全部水平組合,在每種組合(稱為試驗點)條件下,進行2次及以上獨立重復試驗。
析因設計具有以下7個特點[2]:①試驗因素的個數(shù)≥2;②每個試驗因素的水平數(shù)≥2,且各因素的水平數(shù)可以不等;③不同的試驗條件數(shù)(或組合數(shù)或試驗點數(shù))等于全部試驗因素的水平數(shù)之乘積;④各試驗條件下至少進行2次獨立重復試驗;⑤全部受試對象被完全隨機地分配進入任何一個試驗條件組中,各小組中的受試對象個數(shù)相等為最佳,但也可以不等;⑥試驗時,每次試驗都涉及任一試驗因素的某個水平,即全部試驗因素同時施加;⑦進行統(tǒng)計分析時,假定全部試驗因素對觀測結(jié)果的影響是平等的,即沒有主次之分。由此可知,析因設計的明顯優(yōu)點是可以分析每個試驗因素的主效應以及試驗因素之間各階交互作用的效應大小;缺點在于總試驗次數(shù)太多,費時費力且增加試驗費用。
析因設計是考察因素之間各階交互作用效應的主要方法。高階交互作用效應的解釋是非常困難的,現(xiàn)以最常見的一階交互作用(即兩因素之間的交互作用)為例,解釋其含義[3]。
假設在某項藥物試驗研究中,需要將A藥與B藥聯(lián)合使用,若在固定的劑量下,兩藥聯(lián)合使用比單用任何一種藥物的療效更好,則稱這兩種藥物具有協(xié)同作用;反之,則稱這兩種藥物具有拮抗作用。協(xié)同作用和拮抗作用都不是交互作用。A藥與B藥之間具有交互作用是指當A藥分別取不同劑量時,其療效的差別并非一成不變,而是會隨著與之聯(lián)用的B藥劑量的改變而改變。例如,當B藥取低劑量時,A藥取高劑量的療效優(yōu)于A藥低劑量的療效;而當B藥取高劑量時,A藥取低劑量的療效優(yōu)于A藥高劑量的療效。在統(tǒng)計學上,A藥的劑量與B藥的劑量之間存在交互作用效應。至于交互作用效應是否有統(tǒng)計學意義,則需要通過假設檢驗來做出統(tǒng)計推斷,還需要通過大樣本臨床試驗進一步驗證。
析因設計將二維平面劃分成多行與多列的網(wǎng)狀結(jié)構(gòu),其網(wǎng)格數(shù)就是全部試驗因素的水平組合數(shù)。在此網(wǎng)狀結(jié)構(gòu)中,行數(shù)可代表一個試驗因素的全部水平數(shù)或若干個試驗因素的水平組合數(shù),列數(shù)可代表一個試驗因素的全部水平數(shù)或若干個試驗因素的水平組合數(shù)。因篇幅所限,析因設計的具體架構(gòu)見后文各表格,此處從略。
由于析因設計常用于安排有2~4個試驗因素(因為因素過多時,各水平組合條件下仍需要做重復試驗,故總試驗次數(shù)很多,實際科研工作者一般難以承受)的試驗研究場合,因此,其方差分析計算公式至少有三種。然而,隨著因素個數(shù)的增加,因素之間的各階交互作用項數(shù)也相應增加:當有A和B兩個因素時,只有一個交互作用項(AB);當有A、B、C三個因素時,有4個交互作用項(AB、AC、BC、ABC);當有A、B、C、D四個因素時,就有11個交互作用項(AB、AC、AD、BC、BD、CD、ABC、ABD、ACD、BCD、ABCD)。因篇幅所限,本文僅呈現(xiàn)兩因素析因設計定量資料一元方差分析的計算公式,其他情況下的計算公式從略。
現(xiàn)以兩因素析因設計定量資料為例,介紹其總離均差平方和(簡稱“總變異”)的分解方法[1,4]。設試驗因素A有a個水平,試驗因素B有b個水平,在因素A和因素B各水平組合條件下進行r次獨立重復試驗,則受試對象總數(shù)(即總樣本含量)N=abr,其方差分析表見表1。
表1 兩因素析因設計定量資料方差分析表Table 1 Analysis of variance for the quantitative data with two-factor factorial design
表1中各統(tǒng)計量計算公式如下:
在以上各式中,i=1,2,…,a;j=1,2,…,b;k=1,2,…,r。
【例1】為了給一種裝置設計出一種壽命長的電池,研究者根據(jù)經(jīng)驗確定了兩個重要試驗因素,一個是制造電池材料的種類(因素M),另一個是研究者設定的試驗溫度(因素T)。因素M取3個水平,1~3分別代表三種不同的材料;因素T取3個水平,1~3分別代表15℉、70℉和125℉。為了較好地估計試驗誤差,研究者擬在每種水平組合下進行4次獨立重復試驗。試驗安排與試驗結(jié)果見表2[1]。試分析各因素及其交互作用項對電池壽命的影響是否有統(tǒng)計學意義。
表2 材料種類(M)與試驗溫度(T)對電池壽命影響的試驗結(jié)果Table 2 Experimental results of the influence of material type(M)and the experimental temperature(T)on battery life
【例2】某試驗同時涉及A、B、C三個地位平等的試驗因素,A有2個水平,B有3個水平,C有4個水平,觀測指標為OD值,受試對象為樣品,在不同試驗條件下均獨立地重復做了2個樣品,資料見表3[2]。試分析兩因素及其交互作用項對OD值的影響是否有統(tǒng)計學意義。
表3 3個試驗因素作用下OD值的測量結(jié)果Table 3 Measurement results of OD value under the action of three experimental factors
3.2.1 對例1的分析與解答
【分析與解答】所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
由兩因素析因設計定量資料一元方差分析總模型的檢驗結(jié)果可知,總模型具有統(tǒng)計學意義(F=11.00,P<0.000 1)。
由兩因素及其交互作用項的輸出結(jié)果可知,材料種類(M)(F=7.91,P=0.002 0)、試驗溫度(T)(F=28.97,P<0.000 1)及其交互作用項(M*T)(F=3.56,P=0.018 6)對電池壽命的影響均有統(tǒng)計學意義。
材料種類(M)與試驗溫度(T)之間的交互作用效應見圖1。橫軸為材料種類(M),分別取1、2、3水平;縱軸為試驗結(jié)果電池壽命(Y,單位:h)。圖中從上到下的三條折線對應的試驗溫度(T)分別為1、2、3水平。顯然,T=1(即溫度為15℉,低溫)時,用三種材料制造的電池壽命普遍長;隨著溫度逐漸增加,用三種材料制造的電池壽命逐漸縮短。然而,圖中的3條折線的變化趨勢是不同的(顯然,它們不是互相平行的),當M=1時,T=2與T=3兩條折線相交;當M=3時,T=1與T=2兩條折線相交。
圖1 材料種類(M)與試驗溫度(T)交互作用效應圖Figure 1 Graph reflecting the interaction effect between the material type(M)and the experimental temperature(T)
以上輸出的是因素M(材料種類)與因素T(試驗溫度)在各種水平組合條件下,試驗結(jié)果Y的平均值,并將這9種水平組合編號為1~9。編號1~3的均值代表M=1(即在第一種材料的前提條件下)的三種溫度所對應的試驗結(jié)果Y的平均值;編號4~6的均值代表M=2(即在第二種材料的前提條件下)的三種溫度所對應的試驗結(jié)果Y的平均值;編號7~9的均值代表M=3(即在第三種材料的前提條件下)的三種溫度所對應的試驗結(jié)果Y的平均值。同理,可理解編號(1、4、7)、(2、5、8)和(3、6、9)的均值含義,即在同種試驗溫度條件下,用三種材料制造的電池的平均壽命的均值。
采用TUKEY法對因素M與因素T的9種水平組合下的9個平均值進行兩兩比較。因篇幅所限,此部分結(jié)果從略。現(xiàn)將它們之間的比較結(jié)果解釋如下。
在如此多的兩兩比較的結(jié)果中,研究者最關(guān)心的是將兩個因素中的一個控制在特定水平上,考察另一個因素各水平組平均值差異是否有統(tǒng)計學意義。例如:在溫度為第3個水平(即125℉)條件下,三種材料所對應的電池壽命的平均值差異是否有統(tǒng)計學意義?可查看編號為3、6、9的3個均值(57.500、49.500、85.500)之間對應的P值:編號3與編號6之間的P值為1.000 0,編號3與編號9之間的P值為0.834 7,編號6與編號9之間的P值為0.581 9。三個P值均大于0.05,說明當溫度高(T=125℉)時,用三種材料制造的電池的平均壽命差異無統(tǒng)計學意義。
編號為1、4、7對應的3個P值分別為0.961 6、0.999 9、0.999 1,說明當溫度低(T=15℉)時,用三種材料制造的電池的平均壽命差異無統(tǒng)計學意義;而編號為2、5、8對應的3個P值分別為0.046 0、0.001 4、0.882 3,說明當溫度居中(T=70℉)時,第一種材料與第二種材料、第一種材料與第三種材料制造的電池平均壽命(57.250 vs.119.750,57.250 vs.145.750)差異有統(tǒng)計學意義,而第二種材料與第三種材料制造的電池平均壽命(119.750 vs.145.750)差異無統(tǒng)計學意義。
相對來說,溫度較低時,用第二種材料制造的電池平均壽命較長(均值為155.750);溫度居中時,用第三種材料制造的電池平均壽命較長(均值為145.750);溫度較高時,用第三種材料制造的電池平均壽命較長(均值為85.500)。
3.2.2 對例2的分析與解答
【分析與解答】所需要的SAS程序如下:
【SAS程序說明】“a|b|c”代表一種簡化表達方式,其詳細寫法為[5]:a b c a*b a*c b*c a*b*c。
【SAS輸出結(jié)果及解釋】
由總模型的方差分析結(jié)果可知,總模型無統(tǒng)計學意義(F=1.50,P=0.163 4),說明此總模型需要精簡。
由3個主效應、3個一級交互作用項效應和1個二級交互作用項效應的輸出結(jié)果可知,僅交互作用項“b*c”(F=2.67,P=0.039 7)具有統(tǒng)計學意義。
若從模型語句中刪除P值大于0.4的前4項后,再運行SAS程序,由輸出結(jié)果可知,三項均無統(tǒng)計學意義。
由此可知,在對多因素析因設計定量資料進行方差分析過程中,隨著模型中所包含的因素和交互作用項的改變,對某個特定因素或交互作用項而言,其分析的結(jié)果是會發(fā)生變化的。也就是說,方差分析的結(jié)果是相對的。
嚴格地說,在對析因設計定量資料進行一元方差分析前,也應檢查定量資料是否滿足“獨立性、正態(tài)性和方差齊性”這三個前提條件[6]。為節(jié)省篇幅,本文假定定量資料已滿足此前提條件。當試驗因素很多時,采用析因設計安排試驗是非常耗時耗力的。一種補救措施是采用分式析因設計[1,3]或正交設計或均勻設計[2]。在析因設計的具體實施過程中,全部受試對象被完全隨機分配到因素的全部水平組合中去。然而,當來自受試對象的某個或某些重要非試驗因素對試驗結(jié)果的影響不可忽視時,改進的做法是將受試對象按重要非試驗因素形成若干個“區(qū)組”,每個區(qū)組內(nèi)的受試對象在重要的非試驗因素方面條件最接近、且數(shù)量等于全部試驗因素的水平組合數(shù)。于是,就可參照隨機區(qū)組設計的思路來隨機分配受試對象[7]。這樣的安排被稱為“含區(qū)組因素的析因設計”[2],此設計有利于控制區(qū)組因素對結(jié)果的影響,增加結(jié)論的可信度。
本文介紹了析因設計的基本概念、析因設計的架構(gòu)以及兩因素析因設計定量資料一元方差分析的計算公式;通過兩個實例并借助SAS軟件實現(xiàn)了析因設計定量資料一元方差分析和關(guān)于交互作用效應的多重比較。