谷恒明,胡良平,2*
(1.軍事醫(yī)學科學院生物醫(yī)學統(tǒng)計學咨詢中心,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029
科研方法專題
試驗設計類型之可以考察全部交互作用的多因素設計:析因設計
谷恒明1,胡良平1,2*
(1.軍事醫(yī)學科學院生物醫(yī)學統(tǒng)計學咨詢中心,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029
本文目的是介紹一種可以考察各級交互作用的多因素設計類型,即析因設計。通過介紹兩個實際例子,總結出析因設計的八個特點及優(yōu)點、缺點。針對實際應用時可能面臨的情況或問題,人們可能會對析因設計進行改造,由此產(chǎn)生了析因設計的三種變形,即“含區(qū)組因素的析因設計”“分式析因設計”和“多因素非平衡組合試驗”。最后一種情形,是實際工作者常會使用的,但在對定量評價指標進行差異性分析時需要對原先的分組進行合理拆分,再進行恰當?shù)慕M合,構造出多種標準的設計類型,以利于分析者選擇正確的統(tǒng)計分析方法。
試驗因素;區(qū)組因素;析因設計;分式析因設計;交互作用
具有正常思維和心理的人做任何事都會通盤考慮,盡可能做到系統(tǒng)全面、有條不紊。然而,對于一個事物而言,在眾多的設計類型之中,“析因設計”就具有前述提及的那種“潛質”。
析因設計具有多個特點,其中最突出的特點是包括全部的“試驗點(即試驗因素不同水平組合所決定的每個特定試驗條件)”數(shù)目,是全部擬被考察的試驗因素水平的全面組合數(shù)。例如,假定在某項試驗研究中共需考察10個三水平試驗因素,若采用析因設計,則全部試驗點數(shù)為310=59 049個。這個數(shù)目代表什么含義呢?它相當于科研人員習慣上所稱呼的“試驗分組數(shù)”。若每個試驗組僅做一次試驗(即無重復試驗),那這個數(shù)也可以被叫做“總試驗次數(shù)”。但是,此時的安排不能被稱為“十因素析因設計”,而只能被稱為“無重復試驗的十因素全面組合試驗”。因為由這樣的安排得出的試驗結果不能全面、真實地揭示多個試驗因素各自和相互作用對結果產(chǎn)生的影響,即使采用某種復雜的統(tǒng)計分析方法,也可能會得出錯誤的結論。原因在于:試驗結果中沒有包含試驗因素對評價結果的作用規(guī)律,全靠統(tǒng)計學或數(shù)學方法是不可能創(chuàng)造出規(guī)律來的。
2.1 兩因素析因設計實例
【例1】觀察A、B兩種鎮(zhèn)痛藥物聯(lián)合運用在產(chǎn)婦分娩時的鎮(zhèn)痛效果。A藥取3個劑量:1.0 mg,2.5 mg,5.0 mg;B藥也取3個劑量:5 μg,15 μg,30 μg。共9個處理組。將27名產(chǎn)婦隨機等分為9組,每組各3名,記錄每名產(chǎn)婦分娩時的鎮(zhèn)痛時間,結果見表1。試分析A、B兩種藥物的聯(lián)合鎮(zhèn)痛效果[1]。
表1 A、B兩種藥物聯(lián)合運用的鎮(zhèn)痛時間(min)
2.2 三因素析因設計實例
【例2】某臨床醫(yī)生收集到如下資料[2],見表2。問:此資料所對應的試驗設計類型是什么?
3.1 對例1的解析
在例1中,有兩個獨立于受試對象(本例中為產(chǎn)婦)的試驗因素,分別叫做“A藥劑量”與“B藥劑量”,它們都具有3個水平。每位產(chǎn)婦均需同時接受兩種鎮(zhèn)痛藥以減輕分娩時的疼痛,由基本常識可知,在使用時,每種鎮(zhèn)痛藥只可能取一個特定的劑量,于是,兩種鎮(zhèn)痛藥的劑量組合數(shù)就有3×3=9種(即試驗點數(shù))。在各種組合(即試驗點或稱特定的試驗組)下均做了3次獨立重復試驗(即有三位產(chǎn)婦)。有一個定量的評價指標,即“鎮(zhèn)痛時間(min)”,確切地說,應該是“鎮(zhèn)痛保持的時間(min)”。
臨床醫(yī)生并沒有聲明:所涉及的兩個試驗因素對評價指標的影響是否有主次之分,只能被視為“同等重要或地位平等”。
基于以上的背景,可以比較有把握地判定例1的試驗安排屬于“兩因素析因設計”。
表2 2 545例糖尿病患者血脂檢測結果
注:TC,總膽固醇;TG,甘油三酯;HDL-C,高密度脂蛋白膽固醇;LDL-C,低密度脂蛋白膽固醇
3.2 對例2的解析
在例2中,表2中的“組別”究竟是一個8水平的因素,還是多個因素的組合呢?仔細觀察“組別”之下的8行內(nèi)容,不難發(fā)現(xiàn):它們是“C高否”“G高否”與“HD低否” 3個因素各2水平的全面組合而得到的,即這是由3個2水平試驗因素按2×2×2組織起來的“架構”。表2中的后4列為在臨床上可能有聯(lián)系的4個定量指標,若需要同時考察它們的變化情況,就屬于四元統(tǒng)計分析問題,它們不影響對設計類型的判定。
若將表2中的第1列改寫成3列,即把3個試驗因素的名稱及其水平各用一列來呈現(xiàn),就把一個貌似“單因素8水平”的“混淆型設計架構”清楚地“重構”了,使其成為一個“2×2×2”的“設計架構”,見表3。
此時,僅依據(jù)表3的外表,還不能直接判定其為“三因素析因設計”。還必須聲明:這3個因素對評價指標(這里有4個定量評價指標)的影響是否“地位平等”,僅當答案為“以專業(yè)知識為依據(jù),3個因素對所有定量評價指標的影響地位平等”時,表3所對應的安排才可以被叫做“三因素析因設計”或“2×2×2析因設計”。后一種稱呼稍好一點,因為它清楚地告知讀者,每個因素有幾個水平。
表3 用三因素及其水平組合取代表2中“組別”±s,mmol/L)
在文獻[3]中,呈現(xiàn)了析因設計具有的7個特點。為嚴謹起見,這里還要補充一點,匯總如下。
具備下列8個特點的多因素試驗設計可被稱為標準的析因設計:①試驗因素個數(shù)≥2;②每個試驗因素的水平數(shù)≥2且可以不相等;③試驗因素之間不存在“連帶關系”且獨立于受試對象;④不同的試驗條件數(shù)(或組合數(shù)、試驗點數(shù))等于全部試驗因素的水平數(shù)之乘積;⑤各試驗條件下至少要做兩次獨立重復試驗;⑥全部受試對象被完全隨機地分配到任何一個試驗條件組中去,各小組中的受試對象個數(shù)可以不等,但最好相等;⑦試驗時,任何一次試驗都將涉及到任何一個試驗因素的某個水平,即全部試驗因素同時施加;⑧進行統(tǒng)計分析時,假定有專業(yè)依據(jù)認為:全部試驗因素對觀測結果的影響是地位平等的,即沒有主次之分。
由上述特點,決定了析因設計具有明顯的優(yōu)點和缺點。優(yōu)點:可以分析每個試驗因素的主效應和試驗因素之間各級交互作用的效應大小。缺點:總試驗次數(shù)太多,試驗費用大且費時費力。
若嚴格按上述的8個特點來考察,例2不滿足上述的“第三點”和“第六點”。因此,例2中的表3確實具有“析因設計結構”,但算不上“標準的析因設計”。相比而言,例1中的表1可稱為“標準的兩因素析因設計”。
說明:上述“第三個特點”中的“連帶關系”是指一個因素與另一個因素之間存在內(nèi)在的聯(lián)系,例如,藥物種類(分為A藥、B藥)與“藥物劑量”之間就存在“連帶關系”。假定在本文例1中,每個產(chǎn)婦只接受一種特定劑量的鎮(zhèn)痛藥,全部產(chǎn)婦被隨機分配到6個試驗組,分別為A藥的3個劑量組與B藥的3個劑量組。這樣的安排,很容易被判定為2×3析因設計(藥物種類有2個水平,藥物劑量有3個水平)。若考慮到兩個因素之間存在“連帶關系”,將其判定為兩因素嵌套設計更為合理。
5.1 含區(qū)組因素的析因設計[4]
【例3】有人研究豬食用不同飼料對體重增加量的影響。A(大豆粉+不同含量的蛋白質):A1(加14%蛋白質)、A2(加12%蛋白質);B(玉米中己氨酸的含量):B1(含0.6%己氨酸)、B2(缺乏己氨酸),共有4種不同的飼料配方。用24頭豬作為受試對象,按豬的初始體重由輕到重排序,并形成6個隨機區(qū)組,每組中的4只豬體重接近,被隨機分到4個飼料組中,在喂養(yǎng)期間,盡可能使每只豬每餐都能吃飽。設計格式和資料見表4,該資料所取自的試驗設計類型為含區(qū)組因素的析因設計。
表4 兩種飼料的不同配方對豬平均日增重量的影響結果
【分析與解答】在表4中,核心架構是由A、B兩個試驗因素組成的2×2析因設計,在將受試對象(本例為豬)分組時,將其“原始體重”作為一個重要的非試驗因素。由于“原始體重”是定量因素,又按范圍將其劃分成6段,使其轉化成“有序因素”。于是,就派生出一個所謂的“區(qū)組因素”??紤]區(qū)組因素的目的是盡可能消除“原始體重”對評價指標(平均日增重量)的影響,更真實地顯露出試驗因素不同水平組合所決定的試驗條件(在本例中,本質上是營養(yǎng)價值高低)對評價指標的影響大小。
5.2 分式析因設計[4-6]
【例4】25-1分式析因設計:若有5個2水平試驗因素,析因設計的水平組合數(shù)為32種,基于5因素的交互作用項的正、負號,可將32種組合一分為二,取其中一半所對應的水平組合,就稱為分式析因設計。
【分析與解答】若設每個試驗因素的水平分別為-1與1,則在五個2水平因素的32種水平組合中,取五個因素的水平連乘積為“+1”或“-1”的部分,即16種水平組合,見圖1(五因素交互作用取“+1”的那部分,圖中Y之下填寫試驗結果)。
OBSYX1X2X3X4X51。111-1-12。-1-1-1-113。1-1-1114。1-1-1-1-15。1-11-116。-111-117。1-111-18。111119。-1111110。-1-1-11-111。-11-1-1-112。-1-11-1-113。-1-111114。11-1-1115。-11-11116。11-11-1
圖1 25-1分式析因設計對應的水平組合
同理,25-1分式析因設計、25-2分式析因設計,一般用符號表示如下:2P-K分式析因設計,其中P>K,皆為正整數(shù)。
同理,34-1分式析因設計、34-2分式析因設計,一般用符號表示如下:3P-K分式析因設計,其中P>K,皆為正整數(shù)。
5.3 不平衡析因設計——多因素非平衡組合試驗[2]
【例5】沿用例1資料,假定研究者在下列三種條件下,未做試驗:①:A(1.0)與B(5);②:A(2.5)與B(15);③:A(5.0)與B(30)。
試辨析這是一個什么試驗設計類型。
【分析與解答】在一個析因設計中,少做了一組或多組試驗,其安排就不能被稱為析因設計了。從表面上看,它屬于“不平衡析因設計”。其實,它已經(jīng)嚴重偏離了“標準析因設計的定義或特點”。它的最確切名稱為“多因素非平衡組合試驗”,因為它已經(jīng)沒有“資格”被稱為“設計”了。對基于這種安排而產(chǎn)生的定量評價指標的數(shù)據(jù)擬做差異性分析之前,首先必須對全部試驗組進行合理的拆分;然后再結合基本常識、專業(yè)知識和統(tǒng)計學知識進行各種重新組合,這個過程相當于進行“回顧性試驗設計”。根據(jù)不同的組合判斷其應屬于什么試驗設計類型,再選用相應的差異性分析模型對定量資料進行分析,具體方法參見文獻[2-3],此處從略。
[1] 胡良平,王素珍,郭晉. 內(nèi)科科研統(tǒng)計設計與數(shù)據(jù)分析[M]. 北京: 電子工業(yè)出版社,2015: 33-39.
[2] 胡良平. 統(tǒng)計學三型理論在實驗設計中的應用[M]. 北京:人民軍醫(yī)出版社,2006: 152-163.
[3] 胡良平. 科研設計與統(tǒng)計分析[M]. 北京: 軍事醫(yī)學科學出版社,2012: 228-264.
[4] 胡良平. 面向問題的統(tǒng)計學——(1)科研設計與統(tǒng)計基礎[M]. 北京: 人民衛(wèi)生出版社,2012:166-219.
[5] 郭祖超. 醫(yī)用數(shù)理統(tǒng)計方法[M]. 3版. 北京: 人民衛(wèi)生出版社,1988: 307-341.
[6] Dean A, Voss D. Design and analysis of experiments[M]. New York: Springer, 1999: 483-546.
(本文編輯:吳俊林)
科研方法專題策劃人——胡良平教授簡介
胡良平,男,1955年8月出生,教授,博士生導師,曾任軍事醫(yī)學科學院研究生部醫(yī)學統(tǒng)計學教研室主任和生物醫(yī)學統(tǒng)計學咨詢中心主任、國際一般系統(tǒng)論研究會中國分會概率統(tǒng)計系統(tǒng)專業(yè)理事會常務理事和北京大學口腔醫(yī)學院客座教授;現(xiàn)任世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會會長、中國生物醫(yī)學統(tǒng)計學會副會長,《中華醫(yī)學雜志》等10余種雜志編委和國家食品藥品監(jiān)督管理局評審專家。主編統(tǒng)計學專著45部,參編統(tǒng)計學專著10部;發(fā)表第一作者學術論文220余篇,發(fā)表合作論文130余篇,獲軍隊科技成果和省部級科技成果多項;參加并完成三項國家標準的撰寫工作;參加三項國家科技重大專項課題研究工作。在從事統(tǒng)計學工作的30年中,為幾千名研究生、醫(yī)學科研人員、臨床醫(yī)生和雜志編輯講授生物醫(yī)學統(tǒng)計學,在全國各地作統(tǒng)計學學術報告100余場,舉辦數(shù)十期全國統(tǒng)計學培訓班,培養(yǎng)多名統(tǒng)計學專業(yè)碩士和博士研究生。近幾年來,參加國家級新藥和醫(yī)療器械項目評審數(shù)十項、參加100多項全軍重大重點課題的統(tǒng)計學檢查工作。歸納并提煉出有利于透過現(xiàn)象看本質的“八性”和“八思維”的統(tǒng)計學思想,獨創(chuàng)了逆向統(tǒng)計學教學法和三型理論。擅長于科研課題的研究設計、復雜科研資料的統(tǒng)計分析與SAS實現(xiàn)、各種層次的統(tǒng)計學教學培訓和咨詢工作。
Types of the multifactor experimental designs with all interactions: factorial design
GuHengming1,HuLiangping1,2*
(1.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China; 2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)
The paper aims to introduce a multifactor design type that can examine the interactions at all levels, that is factorial design. By introducing two practical examples, the eight characteristics and advantages and disadvantages of the factorial design are summarized. Facing the situation or the problem in the real application, people may transform the factorial design into the following three forms: factorial design with block factor, fractional factorial design and multifactor unbalanced combination test. The last case is often used by the actual workers. However, the primary task is to reasonable divide the original grouping and then appropriate combination in the difference analysis for quantitative evaluation index. Thus, a variety of standard design types are constructed and facilitate the analysts to select a correct statistical analysis.
Experimental factors; Block factor; Factorial design; Fractional factorial design; Interaction effection
R195.1
A
10.11886/j.issn.1007-3256.2017.03.001
國家高技術研究發(fā)展計劃課題資助(2015AA020102)
2017-06-04)
*通信作者:胡良平,E-mail:lphu812@sina.com)