段康靜
摘 要:統(tǒng)計(jì)學(xué)是一門研究隨機(jī)現(xiàn)象,以推斷為特征的方法論科學(xué),“由部分推及全體”的思想貫穿于統(tǒng)計(jì)學(xué)的始終。從一開(kāi)始的研究設(shè)計(jì)到最后的數(shù)據(jù)分析,都是統(tǒng)計(jì)學(xué)的研究范疇。統(tǒng)計(jì)學(xué)不僅是數(shù)據(jù)分析,前期的科研設(shè)計(jì)其實(shí)更為重要。在應(yīng)用到醫(yī)學(xué)統(tǒng)計(jì)中,需注意一些思路和錯(cuò)誤辨析。本文主要闡述統(tǒng)計(jì)分析的基本思路,并說(shuō)明一下當(dāng)前統(tǒng)計(jì)學(xué)應(yīng)用的一些注意事項(xiàng)。
關(guān)鍵詞:統(tǒng)計(jì)學(xué);參數(shù);假設(shè)檢驗(yàn)
一、統(tǒng)計(jì)學(xué)的基本思想
統(tǒng)計(jì)學(xué)分析的主要內(nèi)容就是參數(shù)估計(jì)和假設(shè)檢驗(yàn),幾乎所有的統(tǒng)計(jì)方法都離不開(kāi)這兩個(gè)內(nèi)容。所謂參數(shù),就是描述總體特征的一些指標(biāo),如總體中的率、均值等都是參數(shù)。這些指標(biāo)在樣本中則稱為統(tǒng)計(jì)量。由于各種原因,實(shí)際中只能獲得樣本數(shù)據(jù)而非總體數(shù)據(jù)。因此統(tǒng)計(jì)學(xué)的主要目的就是利用樣本統(tǒng)計(jì)量去推斷總體參數(shù),也就是參數(shù)估計(jì)。
參數(shù)估計(jì)只是利用樣本數(shù)據(jù)估計(jì)總體情況,但這一估計(jì)值是否反映了總體的真實(shí)情況,則需要假設(shè)檢驗(yàn)來(lái)驗(yàn)證,其涵蓋了統(tǒng)計(jì)學(xué)從數(shù)據(jù)到結(jié)論的基本思想,它是證明驗(yàn)證后是“接受”還是“拒絕”。例如,某藥廠研發(fā)了一種新的降壓藥,想證明這種藥比常規(guī)藥的降壓效果好。這里藥廠的假設(shè)就是新藥可能比常規(guī)藥療效好,利用樣本數(shù)據(jù)計(jì)算一定的統(tǒng)計(jì)量,得到相應(yīng)的P值,做出結(jié)論,這樣一個(gè)過(guò)程,就是假設(shè)檢驗(yàn)。
我們來(lái)通過(guò)一個(gè)例子闡述從樣本數(shù)據(jù)到結(jié)論的一個(gè)過(guò)程。假設(shè)根據(jù)樣本數(shù)據(jù),計(jì)算新藥和常規(guī)藥的血壓降低值平均分別是5.5mmHg和3mmHg,差值為2.5mmHg。計(jì)算的2.5mmHg就是參數(shù)估計(jì),這一參數(shù)估計(jì)值是否反映了總體的真實(shí)情況呢?換句話說(shuō),總體中是否兩種藥物的差值也是2.5mmHg呢?
首先需要明白,即使總體中兩種藥物沒(méi)有差異(差值為0),由于抽樣誤差的存在,樣本中兩種藥物仍可能存在差異,仍然可能出現(xiàn)2.5mmHg甚至更大的差異。要想判斷2.5mmHg這樣大的值是否超出了樣本變化所能造成的差異范圍,首先得知道在總體均值相等的條件下(差值為0),樣本均值會(huì)有什么樣的變化。
在統(tǒng)計(jì)學(xué)中,回答這一問(wèn)題稱為零假設(shè),又稱原假設(shè),指進(jìn)行統(tǒng)計(jì)檢驗(yàn)時(shí)預(yù)先建立的假設(shè)。零假設(shè)成立時(shí),有關(guān)統(tǒng)計(jì)量應(yīng)服從已知的某種概率分布。當(dāng)統(tǒng)計(jì)量的計(jì)算值落入否定域時(shí),可知發(fā)生了小概率事件,應(yīng)否定原假設(shè)。備擇假設(shè)就是和原假設(shè)相反的假設(shè)也就是說(shuō),假定總體中兩種藥物的療效是完全相等的。在這種假設(shè)下,我們可以計(jì)算樣本數(shù)據(jù)中出現(xiàn)的差異大小是否超出了抽樣誤差所能解釋的范圍。與零假設(shè)對(duì)立的假設(shè)稱為備擇假設(shè),它假定總體中兩種藥物的療效不相等。由于二者完全對(duì)立,所以如果能否定零假設(shè),就可以肯定備擇假設(shè)。通常情況下,備擇假設(shè)是我們想證明的觀點(diǎn),而零假設(shè)使我們想要推翻的觀點(diǎn)。
在這一例子中,我們想驗(yàn)證的是新藥物-降壓藥的療效比常規(guī)藥好,所以先做出一個(gè)零假設(shè),假設(shè)兩種藥物在總體中是沒(méi)有差異的。即使這一假設(shè)是真實(shí)的,但由于抽樣誤差的存在,我們獲得的樣本中的差值也不一定正好為0,可以有很多情況存在。我們可以計(jì)算出各種情況出現(xiàn)的概率,在這里我們想了解的是,如果在總體中兩種藥物差值為0這一前提條件下,出現(xiàn)樣本中差值為2.5mmHg(甚至比2.5mmHg還要大),這種概率有多大?這個(gè)概率就是P值。
如果這一概率很小,比如P=0.001,那我們就可以說(shuō),如果兩種藥物真的沒(méi)有差別(差值為0),那么在樣本中出現(xiàn)了差值為2.5mmHg(以及比2.5mmHg還大,如差值為3mmHg),這種概率最多只有千分之一。對(duì)于這么低的概率,我們認(rèn)為理論上很難在一次樣本中就出現(xiàn)。既然不大可能出現(xiàn),那我們就要回過(guò)頭來(lái)質(zhì)疑一開(kāi)始的前提假設(shè)條件,換句話說(shuō),我們懷疑原假設(shè)是錯(cuò)誤的,而更傾向于接受原假設(shè)的對(duì)立面——備擇假設(shè)。所以我們才會(huì)下結(jié)論說(shuō),總體中兩種藥物的差值不為0,下這一結(jié)論至少有99.9%的信心
參數(shù)估計(jì)是假設(shè)檢驗(yàn)的第一步,沒(méi)有參數(shù)估計(jì),也就無(wú)法完成假設(shè)檢驗(yàn)。-但應(yīng)注意以下問(wèn)題:
(1)做假設(shè)檢驗(yàn)之前,應(yīng)注意資料本身是否有可比性。
(2)當(dāng)差別有統(tǒng)計(jì)學(xué)意義時(shí)應(yīng)注意這樣的差別在實(shí)際應(yīng)用中有無(wú)意義。
(3)根據(jù)資料類型和特點(diǎn)選用正確的假設(shè)檢驗(yàn)方法。。
(4)判斷結(jié)論時(shí)不能絕對(duì)化,應(yīng)注意無(wú)論接受或拒絕檢驗(yàn)假設(shè),都有判斷錯(cuò)誤的可能性。
(5)報(bào)告結(jié)論時(shí)是應(yīng)注意說(shuō)明所用的統(tǒng)計(jì)量。
二、統(tǒng)計(jì)分析中的誤區(qū)
(1)加強(qiáng)對(duì)基礎(chǔ)統(tǒng)計(jì)分析方法的重視,應(yīng)掌握各種基礎(chǔ)方法的應(yīng)用條件,避免再次發(fā)生類似錯(cuò)誤。
(2)避免統(tǒng)計(jì)學(xué)方法的盲目套用,采用與別人同樣的方法進(jìn)行分析。實(shí)際上,統(tǒng)計(jì)學(xué)分析最重要的一個(gè)原則就是具體問(wèn)題具體分析,即使同樣的研究目的,在不同的數(shù)據(jù)類型、數(shù)據(jù)分布中都應(yīng)采用不同的方法。
(3)為突出文章的質(zhì)量和特色,一些臨床人員不可一味追求方法的新穎,采用復(fù)雜的方法去說(shuō)明。事實(shí)上,統(tǒng)計(jì)分析方法并無(wú)任何高低之分,只有合適與否。統(tǒng)計(jì)方法的應(yīng)用,需要結(jié)合研究目的、數(shù)據(jù)類型、數(shù)據(jù)結(jié)構(gòu)等多個(gè)條件,選擇最適合自己數(shù)據(jù)的方法。復(fù)雜的方法得出的結(jié)論未必可靠,簡(jiǎn)單的方法同樣可以得到合理的結(jié)果。
(4)加強(qiáng)對(duì)科研設(shè)計(jì)的重視不少臨床人員輕視前期的科研設(shè)計(jì),對(duì)如何選擇設(shè)計(jì)方法、如何抽樣、樣本量計(jì)算等隨意設(shè)計(jì),直到最終數(shù)據(jù)收集上來(lái)之后才去找統(tǒng)計(jì)學(xué)家分析處理。這種情況無(wú)異于忽視預(yù)防,直到有病才去找醫(yī)生。此時(shí)統(tǒng)計(jì)學(xué)家只能告訴你錯(cuò)誤在什么地方,卻無(wú)法去彌補(bǔ)前面犯下的錯(cuò)誤。
參考文獻(xiàn)
[1]梁馮珍,關(guān)靜.統(tǒng)計(jì)學(xué)(五版)[M].北京:機(jī)械工業(yè)出版社,2009.
[2]馮國(guó)雙,羅鳳基.醫(yī)學(xué)案例統(tǒng)計(jì)分析與SAS應(yīng)用(2版)[M].北京:北京大學(xué)醫(yī)學(xué)出版社,2015.