胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029
交叉設(shè)計是考察一個試驗因素和兩個區(qū)組因素(即重要非試驗因素)對定量觀測結(jié)果影響的一個試驗設(shè)計方法。本文將介紹該設(shè)計類型的要點、定量資料一元方差分析的計算公式,并基于SAS軟件實現(xiàn)交叉設(shè)計定量資料一元方差分析。
當(dāng)試驗中涉及一個試驗因素,還涉及兩個區(qū)組因素(其中一個為時期因素,另一個為個體因素)時,若它們之間的交互作用不存在或可以忽略不計,一種節(jié)省樣本含量的設(shè)計方法為交叉設(shè)計。根據(jù)試驗因素的水平數(shù)和時期因素的水平數(shù),可將交叉設(shè)計分為三種類型,即2×2交叉設(shè)計(或二階段交叉設(shè)計)、3×3交叉設(shè)計和三階段交叉設(shè)計[1]。
若每個區(qū)組中只有一個受試對象(觀察單位),則稱為“單個體型交叉設(shè)計”;否則,就稱為“多個體型(不能節(jié)省樣本含量)交叉設(shè)計”[2]。
【例1】在針麻研究中,為比較A、B兩種參數(shù)電針刺激后痛閾值上升情況,以條件近似的16只大白鼠進行交叉試驗。先將每兩只條件相同的大白鼠配成一對,共8對。用隨機方法決定每對中一只大白鼠接受刺激的順序,另一只大白鼠接受刺激的順序相反。試驗結(jié)果如表1所示[3]。
表1 給大白鼠兩種不同參數(shù)電針刺激后痛閾值上升數(shù)(mA)
【例2】假定為了研究A、B、C三種藥物對高血壓的治療效果,希望考察三種藥先后用于同一位患者的療效,于是進行了如下試驗研究。從高血壓患者中隨機選取12名,隨機均分成6組,每組患者接受藥物的順序依次為 ABC、ACB、BAC、BCA、CAB、CBA,觀測每次服藥后的血壓值。設(shè)計與資料見表 2[1]。
表2 A、B、C三種藥物用于每一位高血壓患者的療效觀測結(jié)果(kPa)
【例3】假定有A、B兩種治療高血壓的藥物,擬通過小規(guī)模的預(yù)試驗來進行探索性研究,以判斷兩種藥物的療效之間的差別是否有統(tǒng)計學(xué)意義。研究者給出了以下兩種設(shè)計方案。
方案一:從高血壓患者中隨機選取12名,再用隨機的方法讓其中6名患者在三個時期內(nèi)按先A后B再A的順序接受治療,記為ABA;另外6名患者在三個時期內(nèi)按先B后A再B的順序接受治療,記為BAB。觀測的指標(biāo)是血壓下降值(kPa)。設(shè)計與資料見表 3[1]。
表3 方案一中高血壓患者在三個時期服用兩種藥的血壓下降值(kPa)
方案二:從高血壓患者中隨機選取12名,按病情、性別、年齡等重要的非試驗因素將12名患者配成6對,每對中的兩名患者在前述重要的非試驗因素方面非常接近。再采用隨機的方法讓每對中的一名患者在三個時期內(nèi)按先A后B再A的順序接受治療,記為ABA;另外一名患者在三個時期內(nèi)按先B后A再B的順序接受治療,記為BAB。觀測的指標(biāo)是血壓下降值(kPa)。設(shè)計與資料見表4[1]。
表4 方案二中高血壓患者在三個時期服用兩種藥的血壓下降值(kPa)
2×2交叉設(shè)計定量資料一元方差分析的計算公式見表 5[3-4]。
表5 2×2交叉設(shè)計定量資料一元方差分析表
表5中各統(tǒng)計量的計算公式如下:
【分析與解答】設(shè)例1資料所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
以上第一部分輸出的是交叉方差分析模型的計算結(jié)果,因F=29.68,P<0.000 1,說明該模型具有統(tǒng)計學(xué)意義。
以上第二部分輸出的是交叉設(shè)計模型中的三個因素的方差分析結(jié)果,除時間因素(time)外,另兩個因素都有統(tǒng)計學(xué)意義??梢栽谏厦娴倪^程步程序中刪除時間因素(time)后重新運行程序,得到如下結(jié)果:
在以上第一部分結(jié)果中,與前文類似結(jié)果相比,誤差自由度由14增加為15,誤差均方由0.025 669 64下降為0.024 479 17。
在以上第二部分結(jié)果中,與前文類似結(jié)果相比,兩個因素對應(yīng)的F值都有所增加且P值相應(yīng)地有所變小。說明采用現(xiàn)在的隨機區(qū)組設(shè)計定量資料一元方差分析模型擬合此定量資料更合適。
由上述結(jié)果可知,A參數(shù)電針刺激后痛閾值的均值(2.87)高于B參數(shù)電針刺激后痛閾值的均值(2.34)。
【分析與解答】設(shè)例2資料所需要的SAS程序如下:
【SAS輸出結(jié)果及解釋】
以上第一部分輸出的是交叉方差分析模型的計算結(jié)果,因F=9.95,P<0.000 1,說明該模型具有統(tǒng)計學(xué)意義。
以上第二部分輸出的是交叉設(shè)計模型中的三個因素的方差分析結(jié)果,除時間因素(time)外,另兩個因素都有統(tǒng)計學(xué)意義??梢栽谏厦娴倪^程步程序中刪除時間因素(time)后重新運行下面的程序:
【SAS輸出結(jié)果及解釋】
以上第一部分結(jié)果中,與前文類似結(jié)果相比,誤差自由度由20增加為22,誤差均方由138.761 11上升為139.482 32。
以上第二部分結(jié)果中,與前文類似結(jié)果相比,兩個因素對應(yīng)的F值略微減少,P值也變小。說明采用現(xiàn)在的隨機區(qū)組設(shè)計定量資料一元方差分析模型擬合此定量資料更合適。
以上輸出的結(jié)果是三種降壓藥對應(yīng)的血壓平均值及標(biāo)準(zhǔn)差。
由圖1可看出:A藥與B藥所對應(yīng)的均值之間的差別具有統(tǒng)計學(xué)意義,B藥的療效好于A藥的療效。
圖1 采用TUKEY法對三種藥物所對應(yīng)的均值的兩兩比較結(jié)果
【分析與解答】設(shè)例3資料所需SAS程序如下:
【SAS輸出結(jié)果及解釋】
以上第一部分輸出的是交叉方差分析模型的計算結(jié)果,因F=2.62,P=0.022 5,說明該模型有統(tǒng)計學(xué)意義。
以上第二部分輸出的是交叉設(shè)計模型中的三個因素的方差分析結(jié)果,僅試驗因素(treat)具有統(tǒng)計學(xué)意義(F=7.59,P=0.011 9)。若按單因素兩水平(因為試驗因素只有兩個水平)設(shè)計定量資料一元方差分析計算,則輸出結(jié)果如下:
以上輸出結(jié)果是單因素兩水平設(shè)計定量資料一元方差分析模型的計算結(jié)果,F(xiàn)=7.36,P=0.010 4,說明此模型有統(tǒng)計學(xué)意義。此結(jié)果的第一行,與前面關(guān)于模型的分析結(jié)果相同(因為模型中只有一個兩水平的試驗因素)。
由上述結(jié)果可知,A藥的平均血壓下降值(3.11)大于B藥的平均血壓下降值(2.39)。
本文給出的3個實例都屬于“單個體型區(qū)組因素(即每個區(qū)組內(nèi)只有一個受試對象)的交叉設(shè)計”,在時期因素的兩個或多個水平下對每個區(qū)組里的一個受試對象進行重復(fù)試驗和測量,嚴(yán)格地說,各區(qū)組上的多個測定結(jié)果之間存在一定程度的相關(guān)性,故不符合方差分析關(guān)于定量資料應(yīng)滿足“獨立性”的要求;更為嚴(yán)重的是,在第1個時間點之后的多次測定結(jié)果不可避免地要受到之前“處理”的影響,特別是當(dāng)試驗因素類似“藥物種類”或“藥物劑量”時,這種影響可能是持續(xù)的逐漸累積的過程,這種現(xiàn)象被稱為“攜帶效應(yīng)”[5]。因此,單個體型交叉設(shè)計定量資料一元方差分析結(jié)果的精確度不夠高。解決這個問題的措施有如下三個:其一,采用多個體型區(qū)組因素的交叉設(shè)計,即每個區(qū)組里應(yīng)包含多個受試對象(其數(shù)目應(yīng)等于時期因素的水平數(shù));其二,可嘗試采用混合效應(yīng)模型處理定量資料,通過尋找適合的方差和協(xié)方差結(jié)構(gòu)的混合效應(yīng)模型[6-7],最大限度地提高結(jié)果的精確度;其三,可嘗試采用廣義估計方程方法求解交叉設(shè)計定量資料方差分析模型中的參數(shù)[8-9]。
本文介紹了交叉設(shè)計的要點,介紹了交叉設(shè)計定量資料一元方差分析的計算公式;借助SAS軟件對三個實例(即三種不同類型)進行交叉設(shè)計定量資料的一元方差分析。在討論中,指出單個體型交叉設(shè)計存在的不足之處,并提供了三個解決措施。