魏鳳江,胡良平
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,天津 300070; 2.天津醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院遺傳學(xué)系,天津 300070;3.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;4.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
PASS軟件在觀察性研究設(shè)計樣本含量估算中的應(yīng)用
魏鳳江1,2,胡良平3,4*
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室,天津 300070; 2.天津醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院遺傳學(xué)系,天津 300070;3.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;4.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
樣本含量估算是科研人員進行科研設(shè)計所關(guān)注的重要問題之一,合理估算樣本含量是試驗設(shè)計中的一個重要內(nèi)容。本文應(yīng)用PASS 11.0軟件對臨床研究中觀察性研究(即隊列研究、病例-對照研究和橫斷面研究)的樣本含量進行計算。探討PASS軟件在科研過程中計算樣本含量的實用性和準確性,為科研工作者在進行觀察性研究設(shè)計階段進行科學(xué)的樣本含量估算提供參考。
樣本含量;隊列研究;病例-對照研究;橫斷面研究
樣本含量(sample size)是指承受研究者實施的樣本所包含之觀察單位數(shù)或樣本例數(shù)。除個別設(shè)計方法外,在研究設(shè)計中必須確定需要多少試驗對象或觀察對象。因為人力、物力、經(jīng)費等各種因素的限制,開展一項研究往往只能對總體中的一部分進行研究,即研究樣本,然后由樣本統(tǒng)計量推斷總體參數(shù)或總體分布。樣本含量過小,結(jié)果不穩(wěn)定,不能真實地反映總體規(guī)律;而樣本含量過大,會增大研究的難度,并造成人力、物力的浪費。所以合理的樣本含量一方面可以在既定的科研經(jīng)費下保證精確度和可靠性,另一方面可以合理利用資源,保證統(tǒng)計推斷的最大效果。目前,能夠估算樣本含量的方法較多,應(yīng)用較廣泛的方法是以公式為基礎(chǔ)的SAS編程;也可以利用SAS/STAT模塊中的GLMPOWER和POWER兩個過程,對樣本含量和檢驗效能進行更加深入的探討,但是對于編程軟件不太精通的人士,SAS軟件使用難度很大。PASS,即Power Analysis and Sample Size,是由美國NCSS公司開發(fā)的一款樣本含量計算軟件,覆蓋了幾乎各種場合下的樣本含量計算方法,其界面友好,操作簡單,可以滿足臨床科研需要[1]。本文采用PASS軟件對觀察性研究設(shè)計(即隊列研究、病例-對照研究和橫斷面研究)中樣本含量的計算方法進行舉例說明。
樣本含量計算公式[2]:
【例1】某醫(yī)生擬采用隊列研究設(shè)計方法評價某藥物預(yù)防腦卒中再發(fā)的效果,得知不用藥者腦卒中的再發(fā)概率為23%,估計RR值為0.5,設(shè)α=0.05,β=0.10,問至少需要多大樣本含量[3]?
PASS操作如下:
Proportions(+號展開)→TwoIndependentProportions(+號展開)→Test(Inequality)(單擊展開)TestsforTwoProportions(Ratios)
按照圖1標識,分別在相應(yīng)位置輸入α值、β值、RR值、P0值。最后,輸出結(jié)果顯示用藥組和非用藥組各需要225人。見圖2。
圖1 PASS軟件隊列研究計算樣本量操作示意圖
圖2 PASS軟件隊列研究計算樣本含量結(jié)果
3.1 不配對但病例數(shù)與對照數(shù)相等時的樣本含量
樣本含量計算公式[4]:
【說明】如果無p1的估計值,但有備擇假設(shè)中的優(yōu)勢比的估計值OR,則可用下式計算p1:
式中OR應(yīng)取優(yōu)勢比OR的可能數(shù)值中之最小值。
【例2】在一個病例對照研究中,已知對照人群的暴露率p0=0.33,預(yù)計暴露的OR=2.8,設(shè)定α=0.05,β=0.10,若要進行假設(shè)檢驗,試估計病例組和對照組所需的樣本含量[5]。PASS操作如下:
Proportions(+號展開)→TwoIndependentProportions(+號展開)→Test(Inequality)(單擊展開)TestsforTwoProportions(OddsRatios)
按照圖3標識,分別在相應(yīng)位置輸入α值、β值、OR值、P0值。最后,輸出結(jié)果顯示病例組和對照組各需要82人。見圖4。
圖3 PASS軟件病例對照研究計算樣本量操作示意圖
圖4 PASS軟件病例對照研究計算樣本量結(jié)果
3.2 不配對且病例數(shù)與對照數(shù)不等時的樣本含量
設(shè)病例組例數(shù)與對照組例數(shù)之比為1∶C,則病例組的樣本含量可按下述公式計算[4]:
PASS操作:參照例2,R(Sample Allocation Ratio)鍵入c值。
3.3 配對的病例-對照研究所需的樣本含量
1∶1配對的病例-對照研究中,調(diào)查結(jié)果有四種情況,即++、--、+-、-+。其中++和--稱為一致結(jié)果,+-和-+稱為不一致結(jié)果。配對調(diào)查的優(yōu)點是可以對某些干擾因素的作用作均衡處理,并可能減少樣本含量。其樣本含量(或?qū)ψ訑?shù)N)的計算公式為:
N≈n/(p0q1+p1q0)
式中p1為估計的病例組中暴露者的比例;p0為估計的對照組中暴露者的比例;n為不一致的對子數(shù)。
如果將例2按照配對的病例-對照研究進行觀察,則所需樣本含量計算如下:
PASS操作如下:
Proportions(+號展開)→TwoCorrelatedProportions(+號展開)→Test(Inequality)(單擊展開)TestsforTwoCorrelatedProportionsinaMatchedCase-con-trolDesign(OddsRatios)
按照下面圖5標識,分別在相應(yīng)位置輸入α值、β值、OR值、P0值。最后,輸出結(jié)果顯示需要103對樣本。見圖6。
圖5 PASS軟件配對病例對照研究計算樣本含量操作示意圖
圖6 PASS軟件配對病例對照研究計算樣本含量結(jié)果
橫斷面研究中的主要研究方法是抽樣調(diào)查,常見的抽樣方法有簡單隨機抽樣、系統(tǒng)抽樣、分層隨機抽樣、整群抽樣和多級抽樣。本文示例主要是應(yīng)用單純隨機抽樣獲取樣本的樣本含量計算方法。
4.1 定量資料
樣本含量計算公式[5]:
式中n、δ、σ、S分別為樣本含量、允許誤差、總體標準差、樣本標準差;uα、tα分別為與u臨界值表、t臨界值表中雙側(cè)概率欄所對應(yīng)的臨界值。
【例3】在血吸蟲病防治工作中,需要調(diào)查血吸蟲患者血紅蛋白含量(g/L),根據(jù)以往經(jīng)驗,標準差為30,這次希望誤差不超過5(即置信區(qū)間上限與下限之差為10),取α=0.05,在這些條件下,要估計患者的血紅蛋白含量,問需調(diào)查多少名患者?
PASS操作如下:
Means(+號展開)→OneMeans(+號展開)→ConfidenceIntervals(單擊展開)ConfidenceIntervalsforOneMeans
按照下面圖7標識,分別在相應(yīng)位置輸入α值、β值、δ值。最后,輸出結(jié)果顯示需調(diào)查141人。見圖8。
圖7 PASS軟件橫斷面研究(計量資料)計算樣本量操作示意圖
圖8 PASS軟件橫斷面研究(計量資料)計算樣本量結(jié)果
4.2 定性資料
式中n、δ、p分別為樣本含量、允許誤差、總體率π的估計值。
【例4】擬用抽樣調(diào)查了解某地小學(xué)生蛔蟲感染率。假定以往該地小學(xué)生蛔蟲感染率P=50%,要求誤差不超過3%,如取α=0.05,問需調(diào)查多少人?
PASS操作如下:
Proportions(+號展開)→OneProportions(+號展開)→Confi-denceIntervals(單擊展開)ConfidenceIntervalsforOnePropor-tion
按照下面圖9標識,分別在相應(yīng)位置輸入α值、p值、δ值。最后,輸出結(jié)果顯示需調(diào)查1 068人。見圖10。
圖9 PASS軟件橫斷面研究(定性資料)計算樣本量操作示意圖
圖10 PASS軟件橫斷面研究(定性資料)計算樣本量結(jié)果
PASS軟件目前涵蓋的統(tǒng)計學(xué)檢驗超過680種,覆蓋了幾乎所有臨床試驗設(shè)計所需的樣本含量計算方法,在NCSS官網(wǎng)上有軟件的使用說明、視頻及試用版可以免費下載,經(jīng)過20年不斷進行調(diào)試和完善,該軟件已成為臨床試驗樣本含量估算的較好選擇。
臨床觀察性研究的樣本含量估計只有相對意義,并非絕對精確的數(shù)值。因為樣本含量估計是有條件的,而這種條件在重復(fù)研究中不是一成不變的。實際研究中往往同時探索幾個因素,而每個因素都有其各自的OR值及p0,這時估計樣本大小常以最小的OR和最適的p0(距50%最遠)為準進行估計,以使所有的因素都能獲得較高的檢驗效率。
以上樣本含量的研究是基于理論之上,而在實際研究中,樣本含量的估計還要考慮研究中面臨的一些實際問題,如研究對象的選擇、完成研究所需的經(jīng)費等問題。除此之外。還需要考慮研究對象的依從性和失訪等因素,通常會將樣本含量增大20%左右。倫理也是在確定樣本含量時必須考慮的因素。如果確定了較大的樣本量,但實際效果不明顯,或為達到所需的研究結(jié)果,在較長期限內(nèi)讓研究對象承受生理上的不適,這些都是需要研究者權(quán)衡的因素[6]。
[1] 王媛媛,孫瑞華.PASS軟件實現(xiàn)臨床試驗中非劣效、等效和優(yōu)效性檢驗的樣本量估算[J].中華流行病學(xué)雜志,2016,37(5):741-744.
[2] 胡良平.SAS實驗設(shè)計與統(tǒng)計分析[M]. 北京: 人民衛(wèi)生出版社,2010: 211.
[3] 胡良平.統(tǒng)計學(xué)三型理論在實驗設(shè)計中的應(yīng)用[M]. 北京: 人民軍醫(yī)出版社,2006: 215.
[4] 金丕煥.醫(yī)用統(tǒng)計方法[M]. 2版. 上海: 復(fù)旦大學(xué)出版社, 2006: 514-517.
[5] 孫振球.醫(yī)學(xué)科學(xué)研究與設(shè)計[M]. 北京: 人民衛(wèi)生出版社,2010: 125-127, 135.
[6] Billoir E, Navratil V, Blaise BJ.Sample size calculation in metabolic phenotyping studies[J]. Brief Bioinform, 2015,16(5):813-819.
ApplicationofPASSinthesamplesizeestimationoftheobservationalstudydesign
WeiFengjiang1,2,HuLiangping3,4*
(1.DepartmentofHealthStatistics,SchoolofPublicHealth,TianjinMedicalUniversity,Tianjin300070,China;2.DepartmentofGenetics,CollegeofBasicMedicalSciences,TianjinMedicalUniversity,Tianjin300070,China;3.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;4.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)
To estimate the sample size is one of the most important issues in the research design, and it is an important part of the experimental design to determine the sample size rationally. In this paper, we used PASS 11.0 software to calculate the sample size of the observational studies including cohort study, case-control study and cross-sectional study. In order to evaluate the practicability and accuracy of PASS software for the purpose of providing reference for the sample size estimation in the observational study design.
Sample size; Cohort study; Case-control study; Cross-sectional study
R195.1
A
10.11886/j.issn.1007-3256.2017.05.002
2017-08-13)
(本文編輯:陳 霞)
國家高技術(shù)研究發(fā)展計劃課題資助(2015AA020102)