傅 強(qiáng)
圣路易斯大學(xué)公共衛(wèi)生與社會(huì)公正學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)系,圣路易斯市,美國(guó),63104
人類(lèi)獲得知識(shí)和解決問(wèn)題的方法有很多種,有的憑自己以往的經(jīng)驗(yàn)和直覺(jué),有的向年長(zhǎng)有經(jīng)驗(yàn)的智者請(qǐng)教,有的回顧歷史的案例,有的通過(guò)一種理性的系統(tǒng)的方法來(lái)尋求答案??茖W(xué)就是一種方法論和系統(tǒng)論??茖W(xué)研究產(chǎn)生的知識(shí)即科學(xué)知識(shí)并非基于個(gè)人觀點(diǎn)、感受和直覺(jué),而是建立在客觀基礎(chǔ)之上,通過(guò)謹(jǐn)慎的觀察,使用系統(tǒng)的、有控制的、有條理的方法獲得的故相較于其它方法,它的結(jié)論是更可靠和可信的。研究的目的是尋求問(wèn)題的答案并獲得新知識(shí),科學(xué)研究依其功能可分為基礎(chǔ)研究和應(yīng)用研究。前者主要目的是發(fā)現(xiàn)新知識(shí),是否實(shí)用不是其關(guān)注的焦點(diǎn);后者主要目的是解決現(xiàn)實(shí)問(wèn)題,其研究的場(chǎng)所不在實(shí)驗(yàn)室而在社會(huì)。醫(yī)學(xué)與社會(huì)科學(xué)的很多研究都屬于應(yīng)用科學(xué)??茖W(xué)研究依其觀念的不同又可分為理論研究和實(shí)證研究。前者是推理性和抽象的研究;后者是歸納性的研究,即對(duì)許多現(xiàn)象的觀察和各種經(jīng)驗(yàn)的總結(jié)得出結(jié)論或支持理論。兩種類(lèi)型的研究在科學(xué)實(shí)踐中相輔相成,共同幫助人類(lèi)獲得知識(shí)和解決問(wèn)題。醫(yī)學(xué)與社會(huì)科學(xué)研究多采用實(shí)證性研究,不管什么類(lèi)型的科學(xué)研究,其決定性特征就是科學(xué)方法。13世紀(jì)的哲學(xué)家和科學(xué)家羅杰·培根指出科學(xué)方法是一切科學(xué)的基礎(chǔ)。科學(xué)方法提供了一整套清晰和一致的收集、評(píng)估、報(bào)告信息的準(zhǔn)則。學(xué)者們一般認(rèn)為科學(xué)方法包含實(shí)證方法、觀察、問(wèn)題、假設(shè)、實(shí)驗(yàn)、分析、結(jié)論和復(fù)制等關(guān)鍵要素[1]??茖W(xué)研究的方法大致可分為兩類(lèi)。一類(lèi)是是定性研究法,它的主要目的是細(xì)致描述特定環(huán)境(如醫(yī)院、學(xué)校、社區(qū)、商店、工礦企業(yè)等)中的現(xiàn)象,深入了解在特定環(huán)境中被研究的人(例如病人、醫(yī)護(hù)工作者、學(xué)生、居民、消費(fèi)者、職工等)的關(guān)切和感受,提供創(chuàng)建理論的基礎(chǔ)和思路。其結(jié)論反映了被研究者對(duì)現(xiàn)實(shí)問(wèn)題的看法和答案,故具有較大的主觀性,多為探索性,不一定具有普遍性,不適用于大規(guī)模調(diào)查。另一類(lèi)是定量研究法,它適用于大規(guī)模的調(diào)查。它要求對(duì)數(shù)據(jù)收集的方式有嚴(yán)格的設(shè)計(jì),盡量客觀地降低或排除人為的影響,數(shù)據(jù)收集要靠準(zhǔn)確而可靠的測(cè)量工具,數(shù)據(jù)管理要科學(xué),使用統(tǒng)計(jì)學(xué)方法分析數(shù)據(jù),得出的結(jié)果具有廣泛性、肯定性、前瞻性,或具有因果關(guān)系。一個(gè)學(xué)科的成熟與否可以從其量化的程度看出。研究設(shè)計(jì)發(fā)生在每一科學(xué)研究項(xiàng)目過(guò)程的早期,數(shù)據(jù)分析發(fā)生在科學(xué)研究過(guò)程的后期階段,但兩者緊密相關(guān)。什么樣的研究設(shè)計(jì)決定了什么樣的分析方法,根據(jù)不同類(lèi)型的問(wèn)題(如描述、預(yù)測(cè)、解釋)研究設(shè)計(jì)可分為實(shí)驗(yàn)性研究設(shè)計(jì)和觀察性研究設(shè)計(jì)。后者包括隊(duì)列研究、病例對(duì)照研究、橫截面研究(如圖1所示)。隨著近30年來(lái)統(tǒng)計(jì)學(xué)方法的迅猛發(fā)展,面對(duì)復(fù)雜繁多的統(tǒng)計(jì)方法,如何根據(jù)研究設(shè)計(jì)選擇正確的統(tǒng)計(jì)方法,很多研究者感到缺乏足夠的知識(shí),需要清晰實(shí)用的方法指南;同時(shí)國(guó)內(nèi)外的統(tǒng)計(jì)學(xué)專(zhuān)著往往將研究設(shè)計(jì)與統(tǒng)計(jì)分析方法分開(kāi)論述[1],這樣的安排有其原因和優(yōu)勢(shì),但同時(shí)也使讀者難以看清兩者互相交織的關(guān)系。因此本文將結(jié)合每一種研究設(shè)計(jì)類(lèi)型討論統(tǒng)計(jì)分析方法的應(yīng)用原則。
圖1 研究設(shè)計(jì)分類(lèi)圖
實(shí)驗(yàn)性研究設(shè)計(jì)用于研究一個(gè)因素對(duì)另一個(gè)或幾個(gè)事件之間的因果影響。此研究要求對(duì)研究的環(huán)境可以操控,目的是將被研究的因素與其他任何外界干擾結(jié)論的因素剝離出來(lái)從而通過(guò)人為改變被研究的因素,觀察預(yù)期的結(jié)果或現(xiàn)象是否會(huì)產(chǎn)生。最常見(jiàn)的是隨機(jī)雙盲對(duì)照設(shè)計(jì),這種設(shè)計(jì)代表了最嚴(yán)格的研究設(shè)計(jì),被譽(yù)為研究設(shè)計(jì)的金標(biāo)準(zhǔn),多用于實(shí)驗(yàn)室研究。在數(shù)據(jù)分析領(lǐng)域,各種因素或現(xiàn)象被轉(zhuǎn)化后稱(chēng)作自變量或者因變量。因變量可以表達(dá)為一系列自變量的函數(shù)。實(shí)驗(yàn)性研究設(shè)計(jì)的特征是有一個(gè)可以控制操縱的自變量(即因素),排除了其它外界干擾因素,實(shí)驗(yàn)結(jié)果即因變量的觀察具有重復(fù)性,通過(guò)改變自變量可以觀察到因變量在其影響下的相應(yīng)變化。例如在評(píng)估新藥療效時(shí)將患某疾病的病人隨機(jī)分配到治療組和安慰劑組,治療組別即自變量。在足夠的樣本量下,兩組病人在各方面都非常相似甚至相同而唯有用藥不同。如果病人對(duì)治療有不同的反應(yīng),則可以確定是新藥的效果。如果病人的反應(yīng)是可以量化的連續(xù)型因變量,例如血脂、血壓等,且該因變量在兩組病人中分布符合正態(tài)分布,則可用t檢驗(yàn)進(jìn)行假設(shè)檢驗(yàn)即兩組的均值是否相等。如果病人隨機(jī)分配到兩個(gè)以上的組別里,則方差分析(analysis of variance,ANOVA)可用于假設(shè)檢驗(yàn)即多組的均值是否相等[2]。這兩種統(tǒng)計(jì)方法均適用于分析一個(gè)分類(lèi)型自變量與一個(gè)連續(xù)型因變量之間的關(guān)系。如果因變量在兩組或三組以上的病人中分布是不對(duì)稱(chēng)的,則分別使用非參數(shù)檢驗(yàn)中的Wilcoxon秩和檢驗(yàn)和Kruskal-Wallis檢驗(yàn)。如果因變量也是分類(lèi)變量,則可使用皮爾遜(Pearson)或似然比(likelihood ratio)卡方檢驗(yàn)。由于隨機(jī)雙盲對(duì)照的實(shí)驗(yàn)設(shè)計(jì)較好地去除了干擾因素,因此使用統(tǒng)計(jì)分析方法比較簡(jiǎn)單。
如果因變量是生存時(shí)間(即記錄經(jīng)歷多久結(jié)局事件發(fā)生),例如肥胖者接受干預(yù)后體重降到正常的時(shí)間,某疾病住院日長(zhǎng)短等問(wèn)題則需要用生存分析的統(tǒng)計(jì)方法[3]。例如使用log-rank檢驗(yàn)或Wilcoxon檢驗(yàn)比較治療組與對(duì)照組的癌癥生存概率的差別。
在現(xiàn)實(shí)社會(huì)中由于許多客觀條件和因素的限制,實(shí)驗(yàn)設(shè)計(jì)在社會(huì)科學(xué)領(lǐng)域幾乎難以做到雙盲,但應(yīng)盡量做到隨機(jī)對(duì)照。例如評(píng)估一種戒煙的新型行為干預(yù)方法,吸煙者可以隨機(jī)地分配到干預(yù)組和對(duì)照組,使兩組研究對(duì)象的各種特征均相似。對(duì)照組使用當(dāng)前標(biāo)準(zhǔn)行為干預(yù)法,干預(yù)組則使用針對(duì)吸煙者自身特征而量身訂制的戒煙干預(yù)方法。此時(shí)難以做到雙盲。另外,有時(shí)隨機(jī)原則在實(shí)際中也難以實(shí)現(xiàn),例如一項(xiàng)研究計(jì)劃通過(guò)實(shí)驗(yàn)性研究設(shè)計(jì)證明參加醫(yī)療保險(xiǎn)可以提高婦女宮頸癌的早期診斷率。在實(shí)際操作中隨機(jī)分配一部分婦女參加醫(yī)療保險(xiǎn),另一部分婦女不參加醫(yī)療保險(xiǎn),然后去追蹤觀察有醫(yī)療保險(xiǎn)的婦女宮頸癌的早期診斷率是否高于沒(méi)有參加醫(yī)療保險(xiǎn)的婦女,研究設(shè)計(jì)上不可行也有違倫理。故在社會(huì)科學(xué)領(lǐng)域里可以應(yīng)用實(shí)驗(yàn)性研究設(shè)計(jì)的場(chǎng)景較有限,例如某些行為干預(yù)和醫(yī)療服務(wù)市場(chǎng)研究時(shí)可以考慮該研究設(shè)計(jì)。
它是選定一組研究對(duì)象對(duì)之跟蹤觀察一段時(shí)間記錄下期待事件/結(jié)果的發(fā)生,它對(duì)與事件密切相關(guān)的敏感/暴露因素沒(méi)有控制。此類(lèi)資料收集費(fèi)時(shí)費(fèi)力,周期較長(zhǎng),成本較高。因?yàn)樵蛟谇?、結(jié)果在后,故此研究設(shè)計(jì)較其他觀察性研究設(shè)計(jì)更有可能顯示出自變量與因變量之間潛在的因果關(guān)系,但其結(jié)論仍然無(wú)法斷定因果關(guān)系。它與實(shí)驗(yàn)研究設(shè)計(jì)的根本區(qū)別在于前者沒(méi)有雙盲隨機(jī)的機(jī)制。例如假定暴露因素是是否接受了某種干預(yù),研究對(duì)象通過(guò)自我選擇是否接受該干預(yù),由于沒(méi)有隨機(jī)分配的機(jī)制,因此干預(yù)組和對(duì)照組在很多方面都不相似,故在確定干預(yù)對(duì)預(yù)期結(jié)果的效果時(shí)需要將其它混雜因素對(duì)預(yù)期結(jié)果的影響加以排除。前述t檢驗(yàn)、方差分析、卡方檢驗(yàn)、非參數(shù)檢驗(yàn)等方法盡管可以使用,但因?yàn)檫@些方法缺乏控制混雜因素影響的能力而無(wú)法給出肯定的結(jié)論,一般較少使用。
對(duì)這類(lèi)觀察性資料常用能控制混雜因素影響的統(tǒng)計(jì)方法是回歸方法,最常用的回歸方法是廣義線性模型(generalized linear models)[4]。例如將重要的混雜因素轉(zhuǎn)化為協(xié)變量代入到廣義線性模型中加以控制。廣義線性模型包括一組指數(shù)方程模型例如一般線性模型、logistic回歸、對(duì)數(shù)線性模型、泊松回歸、伽瑪回歸,因此它適用于不同類(lèi)型的因變量。如果預(yù)期結(jié)果是連續(xù)型因變量且符合正態(tài)分布則選用一般線性模型(general linear model),若連續(xù)型因變量不符合正態(tài)分布則選用分位數(shù)回歸模型(quantile regression)[5];如果預(yù)期結(jié)果是二分類(lèi)、有序多分類(lèi)、或名義多分類(lèi)變量則選用logistic回歸;如果預(yù)期結(jié)果是計(jì)數(shù)型因變量則選擇泊松回歸或負(fù)二項(xiàng)回歸。廣義線性模型對(duì)自變量的類(lèi)型和分布沒(méi)有限制。
由于縱向研究設(shè)計(jì)允許在不同時(shí)間觀察不同事件的發(fā)生,此類(lèi)資料適合于中介效應(yīng)分析(mediation analysis)和路徑分析(path analysis)方法[6]。圖2為一個(gè)簡(jiǎn)單中介效應(yīng)示意圖。X代表自變量,M1和M2代表兩個(gè)中介變量,Y代表因變量,箭頭代表對(duì)應(yīng)的回歸系數(shù),即每一對(duì)變量間相關(guān)的程度。在時(shí)間序列上X先發(fā)生,接著M1和M2發(fā)生,最后Y發(fā)生。M1和M2既是X的因變量,也是Y的自變量。此圖還提示X直接影響Y,還通過(guò)M1和M2間接影響Y。如果分析顯示所有箭頭代表的回歸系數(shù)都顯著性地不等于零,則提示M1和M2有顯著性中介效應(yīng)。其結(jié)果有助于理解X影響Y的機(jī)制,也可對(duì)如何控制和改變X對(duì)Y的影響提出建議。
圖2 中介效應(yīng)模型示意圖
在醫(yī)學(xué)與社會(huì)科學(xué)領(lǐng)域中,很多數(shù)據(jù)通過(guò)調(diào)查問(wèn)卷的方式獲取,除少數(shù)觀測(cè)變量具有較高的信度外,觀測(cè)變量常常出現(xiàn)準(zhǔn)確性較差,測(cè)量誤差較大,信度較低的問(wèn)題,其后果是中介模型估計(jì)出X,M1,M2,Y之間的關(guān)系出現(xiàn)偏差,從而無(wú)法檢驗(yàn)出X影響到Y(jié)的真實(shí)機(jī)制。在這種情況下,可以用潛變量代替顯變量(即X,M1,M2,Y)并使用結(jié)構(gòu)方程模型(structural equation modeling)來(lái)分析[7]。圖3為結(jié)構(gòu)方程模型示意圖。橢圓形代表潛變量,長(zhǎng)方形代表外顯變量,箭頭代表回歸系數(shù)。潛變量是不可以直接觀察到的變量,但它可以通過(guò)相應(yīng)的可觀測(cè)的外顯變量推導(dǎo)出來(lái)。現(xiàn)實(shí)生活中有許多現(xiàn)象是不能直接觀測(cè)到但可以通過(guò)其外在表現(xiàn)而間接觀測(cè)的。例如一個(gè)人的愛(ài)好可能是無(wú)法直接觀測(cè)的,但如果人們看到他經(jīng)常去打球、跑步、健身、看體育比賽、追蹤體育新聞等,人們依此可推斷出他有體育愛(ài)好。另外很多疾病是無(wú)法直接觀測(cè)到的,但可通過(guò)癥狀、體征、病理變化等診斷出疾病。潛變量與顯變量之間的一項(xiàng)重要差別就是前者沒(méi)有測(cè)量誤差。故中介效應(yīng)的估計(jì)更準(zhǔn)確。
圖3 結(jié)構(gòu)方程模型示意圖
如果研究目的不僅僅是反映觀察期間內(nèi)事件發(fā)生的概率,而是更關(guān)注何時(shí)事件會(huì)發(fā)生的概率或風(fēng)險(xiǎn)率則需要用到生存分析。例如癌癥手術(shù)后五年內(nèi)不同時(shí)間生存的概率和死亡的危險(xiǎn)率及其影響因素,某疾病不同住院時(shí)間的概率及其影響因素等。Kaplan-Meier(K-M)生存概率估計(jì)法可用于估計(jì)在某一時(shí)間后的生存概率。Cox比例風(fēng)險(xiǎn)回歸和Weibull回歸最常用于此類(lèi)問(wèn)題分析。如果在觀察期間同一事件多次發(fā)生且每次事件發(fā)生的具體時(shí)間可能不同,例如心臟病病人反復(fù)住院、戒煙多次失敗、腫瘤多次復(fù)發(fā)等現(xiàn)象,如需對(duì)何時(shí)同一事件會(huì)反復(fù)出現(xiàn)的危險(xiǎn)率及其影響因素進(jìn)行研究,則使用分層Cox比例風(fēng)險(xiǎn)回歸模型加上穩(wěn)健方差估計(jì)(robust variance estimation)方法分析資料[8-9]。
近年來(lái)隨著數(shù)據(jù)收集方法的提高,縱向研究設(shè)計(jì)在醫(yī)學(xué)與社會(huì)科學(xué)領(lǐng)域使用得越來(lái)越多。例如針對(duì)研究對(duì)象在跟蹤觀察期間內(nèi)定期反復(fù)進(jìn)行測(cè)量,這樣得到的數(shù)據(jù)往往不再相互獨(dú)立,即同一個(gè)體的多次觀測(cè)數(shù)據(jù)之間存在某種相關(guān)性,因此傳統(tǒng)的廣義線性模型不再適用。統(tǒng)計(jì)學(xué)家們對(duì)傳統(tǒng)的廣義線性模型加以改造擴(kuò)展以適用于此類(lèi)數(shù)據(jù),發(fā)明了混合線性模型和廣義估計(jì)方程(generalized estimating equation)[3,10]。前者又稱(chēng)多水平線性模型或成長(zhǎng)曲線模型。該模型可以根據(jù)所有個(gè)體隨時(shí)間變化的結(jié)局而估計(jì)結(jié)局變化的平均趨勢(shì)以及影響趨勢(shì)的因素。此方法已成為分析縱向設(shè)計(jì)資料的標(biāo)準(zhǔn)方法。廣義估計(jì)方程與廣義線性模型結(jié)合亦常用于縱向設(shè)計(jì)資料的分析,它用于估計(jì)因變量和自變量在群體中的平均相關(guān)性而不在于估計(jì)事件變化的平均趨勢(shì)。
它同時(shí)收集結(jié)果以及影響結(jié)果的因素即自變量與因變量之間無(wú)時(shí)間上先后發(fā)生順序, 多用于量化群體的不同特征之間的關(guān)系。該研究設(shè)計(jì)的優(yōu)點(diǎn)是資料收集的成本較低,時(shí)間較短。前述t檢驗(yàn)、方差分析、卡方檢驗(yàn)、非參數(shù)檢驗(yàn)等方法均可以使用[2]。但因?yàn)檫@些方法缺乏控制混雜因素影響的能力而無(wú)法給出肯定的結(jié)論,一般較少使用。最常用的回歸方法是廣義線性回歸模型。廣義線性回歸模型可以用于控制混雜因素的影響后研究目標(biāo)群體中哪些特征變量是互相關(guān)聯(lián)的[2]。例如某研究想分析社會(huì)支持程度與生活質(zhì)量之間的關(guān)系。由于社會(huì)支持程度與生活質(zhì)量均是通過(guò)相應(yīng)的量表打分測(cè)量得到的變量,故自變量和因變量均為連續(xù)型變量,如果因變量符合正態(tài)分布,則可以使用一般線性模型。又例如某研究想了解哪些因素影響居民與家庭醫(yī)生的簽約,由于因變量是是否簽約了家庭醫(yī)生,故logistic回歸適用于此類(lèi)資料分析。
如果觀測(cè)的變量出現(xiàn)準(zhǔn)確性較差,測(cè)量誤差較大,信度較低的問(wèn)題亦可以使用結(jié)構(gòu)模型方程的方法來(lái)降低測(cè)量誤差,更準(zhǔn)確地估計(jì)目標(biāo)群體中哪些特點(diǎn)是互相關(guān)聯(lián)的。例如在研究肥胖程度對(duì)心血管和腫瘤疾病影響時(shí),需要對(duì)肥胖程度進(jìn)行明確的定義,但其定義常常引起爭(zhēng)議。有的從體重的角度來(lái)衡量肥胖,即使用體重指數(shù)(body mass index,BMI);有的從脂肪分布的角度來(lái)衡量肥胖,即使用腰圍、臀圍、腰臀比。每一項(xiàng)指標(biāo)都部分地代表了肥胖特征,但都不全面,導(dǎo)致使用不同的肥胖變量后,得出了不一致的肥胖對(duì)心血管和腫瘤疾病影響的結(jié)論。如果將肥胖處理成一個(gè)潛變量,通過(guò)體重、體重指數(shù)、腰圍、臀圍、腰臀比這些外顯變量來(lái)衡量肥胖,則有助于更全面更準(zhǔn)確地反映肥胖對(duì)心血管和腫瘤疾病的影響。結(jié)構(gòu)方程模型就是適用于分析這類(lèi)資料的統(tǒng)計(jì)方法[7]。又如心血管疾病是指一類(lèi)疾病,具體包括多種具體的心血管疾病,例如急性心血管阻塞、中風(fēng)、心力衰竭、心律失常,它們反映了心血管系統(tǒng)動(dòng)脈粥樣硬化的結(jié)果。由于心血管系統(tǒng)動(dòng)脈粥樣硬化的程度不易直接觀測(cè)到,動(dòng)脈粥樣硬化也可以被視為是一個(gè)潛變量,具體的心臟病可以被視為動(dòng)脈粥樣硬化程度的指標(biāo)。這個(gè)評(píng)估系統(tǒng)的建立可以使得臨床醫(yī)生和病人不用費(fèi)時(shí)費(fèi)力費(fèi)錢(qián)的方法就能知道當(dāng)某種心臟病出現(xiàn)時(shí),動(dòng)脈粥樣硬化就到了何種程度,即用具體心血管疾病給動(dòng)脈粥樣硬化評(píng)級(jí)。這種研究適合于使用橫截面設(shè)計(jì)和項(xiàng)目反應(yīng)理論(item response theory, IRT)方法分析資料[11]。
在醫(yī)療衛(wèi)生領(lǐng)域,人們常遇到分層結(jié)構(gòu)(又稱(chēng)多水平)的資料。例如病人屬于不同科室,科室屬于不同的醫(yī)院,醫(yī)院分布在不同的區(qū)域。又如居民居住在不同社區(qū)或街道,不同社區(qū)或街道屬于不同的城市。研究對(duì)象被不同水平的組合分成不同的群。群內(nèi)研究對(duì)象的觀測(cè)資料之間往往互相關(guān)聯(lián),但群間研究對(duì)象的觀測(cè)資料互相獨(dú)立。每一層各有其特征,且均對(duì)最底層的研究對(duì)象有間接影響。如果將多水平資料當(dāng)作做同一水平的資料使用廣義線性模型,依據(jù)高層次的特征與屬性推測(cè)低層次中個(gè)體的特征與屬性就會(huì)得出謬誤[12],這種錯(cuò)誤稱(chēng)為生態(tài)學(xué)謬誤(ecological fallacy)。正確的統(tǒng)計(jì)分析方法是使用多水平線性模型和廣義估計(jì)方程[4,10]。
以上統(tǒng)計(jì)方法均是以變量為中心的方法(variable-centered methods),旨在揭示變量之間的關(guān)系。在醫(yī)學(xué)與社會(huì)科學(xué)研究中,往往存在較大的個(gè)體差異或異質(zhì)性(heterogeneity),針對(duì)不同類(lèi)型的對(duì)象使用有針對(duì)性的對(duì)策才能產(chǎn)生最好的效果,在健康研究領(lǐng)域尤其如此。物以類(lèi)聚,人以群分,人與人之間的千差萬(wàn)別既有生物方面的原因也有社會(huì)方面的原因。所以近年來(lái)在醫(yī)學(xué)與社會(huì)科學(xué)研究中越來(lái)越多地開(kāi)始應(yīng)用以人為中心的統(tǒng)計(jì)方法(person-centered methods),旨在揭示人群中存在的異質(zhì)性和類(lèi)別(尤其是潛在類(lèi)別)。此時(shí)需要回答的是有多少類(lèi)別及各類(lèi)別特征的問(wèn)題。有些情況下分類(lèi)很容易很簡(jiǎn)單,例如按性別、年齡、民族、地域、職業(yè)分類(lèi)等;有些情況則不容易進(jìn)行分類(lèi),例如人格、價(jià)值觀、態(tài)度、身體健康、心理健康等。它們沒(méi)有單一直觀的指標(biāo)而是通過(guò)多個(gè)特征來(lái)顯示。有意義的分類(lèi)要達(dá)到兩個(gè)目的:一是有幾類(lèi)以及每一類(lèi)占多大的比例;二是每一類(lèi)的特征是什么,受哪些因素影響。潛類(lèi)別分析(latent class analysis)方法適用于分析用橫截面設(shè)計(jì)收集而來(lái)的資料[13]。該方法將潛類(lèi)別視為潛變量,該潛變量通過(guò)可見(jiàn)的具體特征即外顯變量表現(xiàn)出來(lái)。例如某研究想了解在某特定人群中抑郁的程度有多少類(lèi),每類(lèi)占多大比例,特征如何,不同類(lèi)別受哪些因素影響。該研究可以根據(jù)國(guó)際疾病分類(lèi)第十一版(International Statistical Classification of Diseases and Related Problems-11)提出的抑郁的九大特征[14],用潛類(lèi)別分析的方法找出最佳類(lèi)別、相應(yīng)的特征以及影響各類(lèi)的因素。其結(jié)果可能有利于預(yù)防、治療、資源配置等需要。
該設(shè)計(jì)主要針對(duì)小概率的事件或結(jié)果。它將現(xiàn)在已有事件發(fā)生的研究對(duì)象,例如患某種疾病的病人作為一組,另外再配備一組無(wú)此結(jié)果的研究對(duì)象作為對(duì)照組,然后追溯兩組研究對(duì)象之前是否暴露于相關(guān)的危險(xiǎn)因素。該設(shè)計(jì)決定了結(jié)果就是因變量即病例或?qū)φ?。如果自變量是分?lèi)變量則可用皮爾遜(Pearson)或似然比(likelihood ratio)卡方檢驗(yàn)來(lái)分析自變量與因變量之間是否相關(guān)。為了控制混雜因素的影響,常用logistic回歸研究目標(biāo)群體中危險(xiǎn)因素與結(jié)果是否相關(guān)。
如果病例與對(duì)照兩組樣本是配對(duì)樣本且自變量是二分類(lèi)變量,例如檢驗(yàn)糖尿病與心肌梗塞之間的關(guān)系,每一位心肌梗塞的病人匹配一位同年齡和性別相同但沒(méi)有心肌梗塞的病人,然后比較兩組病人中糖尿病患病的差異,則需用McNemar檢驗(yàn)[2]。為了控制混雜因素的影響,常用條件logistic回歸(conditional logistic regression)研究目標(biāo)群體中危險(xiǎn)因素與結(jié)果是否相關(guān),例如糖尿病是否增加心肌梗塞的風(fēng)險(xiǎn)[4]。
在配對(duì)設(shè)計(jì)中常用自身做對(duì)比,例如同一病人治療前和治療后疾病的變化,醫(yī)療服務(wù)改進(jìn)前后同一病人滿意度的變化等。這些資料分別適合用于McNemar檢驗(yàn)和配對(duì)t檢驗(yàn)[2]。如果需要控制外在因素的影響,則需使用條件logistic回歸、多水平模型、廣義估計(jì)方程[4,10]。
統(tǒng)計(jì)方法繁多,每種統(tǒng)計(jì)方法都有適用的條件和范圍,針對(duì)不同的研究采用最合適的統(tǒng)計(jì)方法對(duì)于每項(xiàng)研究的結(jié)果都是至關(guān)重要。選擇最合適的統(tǒng)計(jì)方法可以從多角度來(lái)考慮,難以有唯一的答案。作者認(rèn)為研究設(shè)計(jì)決定了統(tǒng)計(jì)方法的使用,沒(méi)有在研究設(shè)計(jì)指導(dǎo)下的分析是沒(méi)有實(shí)際意義的分析,本文旨在為在醫(yī)學(xué)與社會(huì)科學(xué)領(lǐng)域一線工作的廣大科研工作者提供如何根據(jù)研究設(shè)計(jì)的類(lèi)型合理選擇統(tǒng)計(jì)方法的實(shí)用指南。有一些統(tǒng)計(jì)方法適用于多種設(shè)計(jì)類(lèi)型,另一些則適用面較窄(見(jiàn)表1),對(duì)于統(tǒng)計(jì)結(jié)果的解釋需要結(jié)合研究設(shè)計(jì)才能準(zhǔn)確。
表1 研究設(shè)計(jì)類(lèi)型、變量類(lèi)型與常用統(tǒng)計(jì)方法之間的關(guān)系
由于統(tǒng)計(jì)方法選擇的正確與否直接關(guān)系到分析結(jié)果的正確與否,廣大科研工作者一方面可以通過(guò)加強(qiáng)自身統(tǒng)計(jì)學(xué)知識(shí)的學(xué)習(xí)提高正確使用統(tǒng)計(jì)學(xué)方法的能力;另一方面應(yīng)多與統(tǒng)計(jì)學(xué)家組成協(xié)作團(tuán)隊(duì),在研究項(xiàng)目剛開(kāi)始或尚在計(jì)劃階段積極邀請(qǐng)統(tǒng)計(jì)學(xué)家參與計(jì)劃,統(tǒng)計(jì)學(xué)家會(huì)根據(jù)后期資料分析整理與解釋的要求在資料尚未收集之前對(duì)研究項(xiàng)目提出建設(shè)性的意見(jiàn),極大地提高研究項(xiàng)目的成功率。