周 穎
如何用EXCEL進(jìn)行醫(yī)學(xué)統(tǒng)計(jì)分析
周 穎
在所有的科學(xué)研究中數(shù)據(jù)都是十分重要的基礎(chǔ),對數(shù)據(jù)的收集、記錄、處理的過程是任何學(xué)科都離不開的。目前很多的數(shù)據(jù)處理軟件都可以實(shí)現(xiàn)這樣的功能,其不僅可以做簡單的變量分析,而且還可實(shí)現(xiàn)各種繁雜的多變量的分析。不過在實(shí)際應(yīng)用中,對數(shù)據(jù)的處理大部分都是簡單的統(tǒng)計(jì)描述性數(shù)據(jù),并需形成圖表以便明確數(shù)據(jù)關(guān)系,或者是進(jìn)行回歸分析、t檢驗(yàn)、方差分析等等。這時(shí)EXCEL軟件就因?yàn)槠鋬?yōu)勢獲得了廣泛的認(rèn)可,和SAS、SPSS相比有其特有表現(xiàn)在于:1.EXCEL有著強(qiáng)大的自動(dòng)的數(shù)據(jù)填充和公式計(jì)算功能;2.在數(shù)據(jù)編輯和透視性分析的過程中操作簡單;3.在單元格的絕對引用和相對引用中可以靈活的處理;4.內(nèi)置函數(shù)功能豐富,并有多種的圖表形式可供選擇。
EXCEL在數(shù)據(jù)處理的模塊設(shè)計(jì)中提供了一些數(shù)據(jù)分析工具,使用這些現(xiàn)成的數(shù)據(jù)分析工具時(shí),只需要將數(shù)據(jù)所在的單元格和必要的參數(shù)指示出來,即可利用系統(tǒng)的自動(dòng)套用功能,來完成相應(yīng)的數(shù)據(jù)處理,并給出正確的結(jié)果。而且有的工具在數(shù)據(jù)統(tǒng)計(jì)的時(shí)候可以生產(chǎn)圖表。
在使用EXCEL的時(shí)候首先應(yīng)當(dāng)利用軟件功能對數(shù)據(jù)進(jìn)行基本描述,其中有:1)數(shù)據(jù)集中指標(biāo)處理,包括平均數(shù)、幾何平均數(shù)、眾數(shù)等等。主要是利用軟件提供的函數(shù)套用和公式來進(jìn)行這些指標(biāo)的計(jì)算。2)變異指標(biāo)的計(jì)算,主要包括百分?jǐn)?shù)、四位數(shù)、方差、標(biāo)準(zhǔn)誤和峰度系數(shù)等。其中方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、百分?jǐn)?shù)等是醫(yī)學(xué)數(shù)據(jù)處理中常常用到的分析指標(biāo)。
t檢驗(yàn)是醫(yī)學(xué)數(shù)據(jù)統(tǒng)計(jì)和分析當(dāng)中最為常見的數(shù)據(jù)處理方法,主要是完成試驗(yàn)標(biāo)準(zhǔn)試樣測定的結(jié)果平均值進(jìn)行與標(biāo)準(zhǔn)值的比較,以此確定其是否具備統(tǒng)計(jì)學(xué)意義,也就是其結(jié)果是否可以作為參考。在EXCEL中“數(shù)據(jù)分析”提供了很多種不同條件下的t檢驗(yàn)工具,例如:平均值的成對二樣本分析,雙樣本等發(fā)差假設(shè),雙樣本異方差假設(shè)等,以及其他統(tǒng)計(jì)用分析工具,當(dāng)樣本中數(shù)據(jù)存在互為配對的關(guān)系,這時(shí)可以利用“平均值的成對二樣本”來進(jìn)行t檢驗(yàn)。例如:在試驗(yàn)中對一個(gè)樣本組進(jìn)行試驗(yàn)前后兩次檢測,這主要是為了測定樣本在試驗(yàn)前后的變化平均值是否相等,這就可以利用成對t檢驗(yàn),這個(gè)t檢驗(yàn)并不是假設(shè)兩個(gè)結(jié)果的方差相等。具體看,如果在工作表中設(shè)定數(shù)據(jù)區(qū)域?yàn)锳1-J2。處理數(shù)據(jù)時(shí)可以在“工具”中調(diào)用“數(shù)據(jù)分析”模塊。在數(shù)據(jù)分析的窗口上選擇t檢驗(yàn)當(dāng)中的“平均值的成對二樣本分析”,這時(shí)在顯示出來的“平均值的成對二樣本分析”對話框中輸入需要分析的變量范圍,變量1所代表的區(qū)域,即輸入分析的第1個(gè)數(shù)據(jù)區(qū)域的單元格引用。該區(qū)域必須是一個(gè)行或者列所構(gòu)成的數(shù)據(jù)組。這個(gè)步驟可以點(diǎn)擊輸入框上的“按鈕”,回到表格的初始數(shù)據(jù)中,利用拖動(dòng)選取需要處理的單元格數(shù)據(jù)。此時(shí)分析工具中的變量1就為A1-J1,完成了自動(dòng)的輸入。
然后再利用同樣的方式,將變量2輸入到數(shù)據(jù)分析工具中,通過這個(gè)操作,使得變量2的數(shù)據(jù)區(qū)域與變量1相對應(yīng),為A2-J2。然后再假定平均差,就是在這里輸入期望中樣本的平均差值。如缺省,默認(rèn)為0值,也就是假設(shè)樣本的平均值使相同的。標(biāo)志,如果在分析區(qū)域內(nèi)的第1行或者列有包含標(biāo)志的選項(xiàng),就應(yīng)選擇此項(xiàng)為標(biāo)志;如果在輸入的區(qū)域中沒有標(biāo)志項(xiàng),軟件將在輸出表中自動(dòng)生成其認(rèn)為的合理數(shù)據(jù)標(biāo)志。如果選擇這個(gè)標(biāo)志數(shù)據(jù),那么α在這個(gè)數(shù)據(jù)檢驗(yàn)的統(tǒng)計(jì)意義為水平,范圍是0-1,缺省的值為0.05。
在利用EXCEL進(jìn)行數(shù)據(jù)分析時(shí),數(shù)據(jù)分析工具庫中有三種基本的方差分析類型為分析提供幫助。包括:單因素方差分析、重復(fù)雙因素分析、無重復(fù)雙因素分析,下面針對方差方分析進(jìn)行簡要的介紹:
單因素方差分析法,在進(jìn)行這個(gè)分析方法前必須將試驗(yàn)所得到的基礎(chǔ)數(shù)據(jù)輸入到工作表中,而且格式是固定的,其中每種水平關(guān)系的試驗(yàn)數(shù)據(jù)放在同一個(gè)行或者列中,具體如在同一個(gè)試驗(yàn)中使試驗(yàn)前和后的數(shù)據(jù)就應(yīng)當(dāng)區(qū)分開,放在同一個(gè)行或者列中。數(shù)據(jù)填寫完成后,和前面一樣在工具中找到數(shù)據(jù)分析,選擇數(shù)據(jù)分析對話框中的“單因素方差分析”,這時(shí)就會(huì)出現(xiàn)下一個(gè)對話框,然后操作分為以下步驟:1)輸入數(shù)據(jù)區(qū)域,即選擇分析數(shù)據(jù)所在的工作表區(qū)域,可以是行或者列,也可以選用標(biāo)志,在針對表中的數(shù)據(jù)進(jìn)行分析是選擇;2)分組方式的選擇,即提供行和列的選擇,當(dāng)同一個(gè)水平的數(shù)據(jù)在同一個(gè)行或列時(shí),需作出相應(yīng)的選擇,行或者列。3)如選擇的數(shù)據(jù)包中含有水平的標(biāo)志,則需要選擇標(biāo)志數(shù)據(jù)位第一行;4)分析中的系數(shù)α為顯著的水平,一般為0.05,也就是體現(xiàn)為95%以上的準(zhǔn)確度;5)分析的輸出,按照實(shí)際的數(shù)據(jù)保存情況,選擇適當(dāng)?shù)妮敵鼋Y(jié)果的保存位置。
雙因素?zé)o重復(fù)試驗(yàn)的方差分析總體看和單因素方差分析十分相似,在分析前也需要將數(shù)據(jù)按照工作表需要的格式輸入到單元格中。數(shù)據(jù)輸入后,同樣在“工具-數(shù)據(jù)分析”中選擇分析的方法,“雙因素?zé)o重復(fù)方差分析”,這時(shí)出現(xiàn)一個(gè)對話框,按照內(nèi)容輸入1)輸入?yún)^(qū)域的選擇,即選擇所要分析的數(shù)據(jù),包括含因素水平的標(biāo)志;2)如果輸入的數(shù)據(jù)中含有因素水平的標(biāo)志,則需要選擇標(biāo)志按鈕;3)顯著的水平性α,可以根據(jù)實(shí)際的分析要求進(jìn)行,但一般為0.05。4)輸出分析數(shù)據(jù)的選項(xiàng)和前面一樣選擇相應(yīng)的存儲(chǔ)位置。
可重復(fù)的雙因素分析,這個(gè)分析方法與雙因素?zé)o重復(fù)方差分析數(shù)據(jù)的差別就是在于增加了對重復(fù)試驗(yàn)數(shù)據(jù)的處理,即將重復(fù)試驗(yàn)的數(shù)據(jù)進(jìn)行累計(jì),使之參與到數(shù)據(jù)分析中。同樣數(shù)據(jù)輸入后在工具中選擇數(shù)據(jù)分析,在數(shù)據(jù)工具庫中選擇“雙因素可重復(fù)方差分析”然后利用和雙因素?zé)o重復(fù)的數(shù)據(jù)分析操作方法相同,只是在每個(gè)樣本的行數(shù)選擇中輸入試驗(yàn)的次數(shù)而已。如還需要對數(shù)據(jù)進(jìn)行方差分析時(shí),則在輸入?yún)^(qū)選擇其區(qū)域和因素的水平標(biāo)記,在每個(gè)樣本的行數(shù)位置輸入試驗(yàn)的次數(shù)即可,而水平性選擇仍然為0.05。最后在輸出位置上選擇合適的區(qū)域,也就完成了分析。
這個(gè)分析方法是可以適應(yīng)于,1)反映兩個(gè)或者多個(gè)變量之間的關(guān)系描述出來,且具備方向和密度性質(zhì)需求時(shí);2)為了反映兩個(gè)或者多個(gè)變量之間的相互依存的關(guān)系并建立回歸方程,可以采用回歸分析。在實(shí)際的應(yīng)用中也是現(xiàn)將數(shù)據(jù)輸入到工作表中,然后利用EXCEL提供的函數(shù)進(jìn)行簡單的回歸性分析或者Spearman高等級的相關(guān)分析。在菜單中利用的是工具、數(shù)據(jù)分析、相關(guān)系數(shù),就可與之相關(guān)的分析。應(yīng)用其中的協(xié)方差工具就可以完成方差分析。同時(shí)也可以選擇使用散點(diǎn)圖來繪制直觀的散點(diǎn)圖形。
在統(tǒng)計(jì)分析中往往都需要進(jìn)行假設(shè)檢驗(yàn),即利用隨機(jī)、分組、數(shù)據(jù)采集等方式來得到試驗(yàn)的數(shù)據(jù)。因此在利用試驗(yàn)得到統(tǒng)計(jì)數(shù)據(jù)的過程中,需要完善數(shù)據(jù)得出的準(zhǔn)確性,因?yàn)槿魏谓y(tǒng)計(jì)分析方法都不能彌補(bǔ)試驗(yàn)中的失誤,或者糾正錯(cuò)誤。
在對醫(yī)學(xué)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析中,為了嚴(yán)謹(jǐn)普遍將0.05設(shè)定為數(shù)據(jù)的準(zhǔn)確度標(biāo)準(zhǔn),但是在有些試驗(yàn)中這個(gè)0.05并不適應(yīng)試驗(yàn)的需求,因此在實(shí)際的操作中不要忘記在自動(dòng)統(tǒng)計(jì)時(shí)確定準(zhǔn)確度標(biāo)準(zhǔn)。同時(shí)也要利用多種試驗(yàn)方法來驗(yàn)證某個(gè)試驗(yàn)的準(zhǔn)確性,尤其是醫(yī)學(xué)試驗(yàn)或者數(shù)據(jù)采集,一定要進(jìn)行多重的檢驗(yàn)和大量的數(shù)據(jù)匯總,才能讓統(tǒng)計(jì)分析數(shù)據(jù)準(zhǔn)確。
(作者單位:浙江省安吉人民醫(yī)院統(tǒng)計(jì)科)