• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      遺傳關(guān)聯(lián)性研究Meta分析的多重檢驗(yàn)校正方法

      2016-03-07 01:59:30翁鴻張永剛牛玉明曾憲濤
      關(guān)鍵詞:假設(shè)檢驗(yàn)關(guān)聯(lián)性校正

      翁鴻,張永剛,牛玉明,曾憲濤

      · 循證理論與實(shí)踐 ·

      遺傳關(guān)聯(lián)性研究Meta分析的多重檢驗(yàn)校正方法

      翁鴻1,2,張永剛3,牛玉明4,曾憲濤1,2

      制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),我們常常計(jì)算其五個(gè)基因模型的結(jié)果,而這一做法使得檢驗(yàn)次數(shù)增多,增大了假陽性結(jié)果的發(fā)生率。此外,也有研究在同一研究中對(duì)多個(gè)位點(diǎn)、多種表型進(jìn)行分析,這也會(huì)增加假陽性結(jié)果的發(fā)生率。因此,在制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),除了計(jì)算出每個(gè)基因模型的結(jié)果外,還應(yīng)給出每個(gè)基因模型檢驗(yàn)結(jié)果的校正值,判斷結(jié)果是否為假陽性結(jié)果。本文主要介紹多重檢驗(yàn)校正的方法。

      遺傳關(guān)聯(lián)性研究;多重檢驗(yàn);校正;Meta分析

      在制作遺傳關(guān)聯(lián)性研究Meta分析(尤其是候選基因研究的Meta分析)時(shí),多數(shù)研究者會(huì)采用計(jì)算五種基因遺傳模型的結(jié)果(即同時(shí)進(jìn)行五個(gè)假設(shè)檢驗(yàn));也有研究者在同一個(gè)研究中研究多個(gè)遺傳位點(diǎn)、多種表型,這也增加了假設(shè)檢驗(yàn)的數(shù)量;此外,在全基因組關(guān)聯(lián)性研究及其Meta分析中,假設(shè)檢驗(yàn)的個(gè)數(shù)更為龐大。在不調(diào)整檢驗(yàn)水準(zhǔn)的情況下,隨著檢驗(yàn)次數(shù)的增加,假陽性錯(cuò)誤的發(fā)生率也會(huì)隨之增加。因此,在制作遺傳關(guān)聯(lián)性研究Meta分析時(shí),除了計(jì)算出每個(gè)基因模型的結(jié)果外,還應(yīng)給出每個(gè)基因模型檢驗(yàn)結(jié)果的校正值,判斷結(jié)果是否為假陽性結(jié)果。本文主要就多重檢驗(yàn)校正的方法進(jìn)行闡述,方便讀者在制作遺傳關(guān)聯(lián)性研究Meta分析時(shí)合理應(yīng)用這些校正方法。

      1 經(jīng)典假設(shè)

      典型的假設(shè)檢驗(yàn)過程是,先假定零假設(shè)(H0)和備擇假設(shè)(H1),再計(jì)算統(tǒng)計(jì)量(T),通過T來判斷是否拒絕H0。關(guān)聯(lián)研究中H0指效應(yīng)值等于0,H1指效應(yīng)值大于1,因此,在病例對(duì)照研究的遺傳關(guān)聯(lián)性研究中,將比值比(odds ratio,OR)的對(duì)數(shù)值logOR作為效應(yīng)值。此時(shí),P值的定義為假設(shè)H0為真時(shí),出現(xiàn)T及大于T數(shù)值的概率。公式如下:

      P=P(T≥t|H0)

      若P值小于預(yù)定的顯著性水平α=0.05,則拒絕H0,即有統(tǒng)計(jì)學(xué)意義。

      2 多重檢驗(yàn)

      多重檢驗(yàn)就是對(duì)多個(gè)假設(shè)同時(shí)進(jìn)行檢驗(yàn)。多重檢驗(yàn)的主要問題是,當(dāng)一個(gè)研究中同時(shí)進(jìn)行多個(gè)假設(shè)檢驗(yàn)時(shí),將假設(shè)檢驗(yàn)顯著性水準(zhǔn)設(shè)定為α=0.05可能會(huì)增加假陽性結(jié)果的發(fā)生(即Ⅰ型錯(cuò)誤的發(fā)生率增加),如下:

      Ⅰ類錯(cuò)誤:

      第一次,α=0.05

      第二次,1-(1-α)2=0.0975

      第n次:1-(1-α)n

      因此,涉及到多個(gè)基因、多個(gè)位點(diǎn)、多種表型或疾病的遺傳關(guān)聯(lián)性研究及其Meta分析均需進(jìn)行多重檢驗(yàn)的校正。

      3 多重檢驗(yàn)的校正方法

      多重檢驗(yàn)的校正方法主要有控制總Ⅰ型錯(cuò)誤率(FWER)、對(duì)預(yù)設(shè)定的顯著性閾值進(jìn)行Bayesian分析、錯(cuò)誤發(fā)現(xiàn)率(FDR)法、FDR改進(jìn)的方法及假陽性結(jié)果報(bào)告率(FPRP)法??刂艶WER的方法有Bonferroni校正、遞減Bonferroni校正及置換檢驗(yàn)。

      3.1 Bonferroni校正Bonferroni校正常用于多重檢驗(yàn)的數(shù)量級(jí)較為適中的情況,且各檢驗(yàn)之間的依賴性較弱,若同一研究中的多個(gè)遺傳突變的聯(lián)系較為緊密,此時(shí)不宜使用Bonferroni校正法。Bonferroni校正法基于檢驗(yàn)的個(gè)數(shù)[1],簡(jiǎn)單地增加顯著性水平,對(duì)m個(gè)假設(shè)檢驗(yàn),采用Bonferroni校正法后,顯著性水平α′為0.05/m:

      0.05 =P(Pmin≤α|H0)=1-P[(P1>α)∩(P2>α)∩…∩(Pn>α)]=1-(1-α)m

      Pmin為最小P值,解上述方程,得出α=1-(1-0.05)1/m≈0.05/m。例如,一個(gè)遺傳關(guān)聯(lián)性研究Meta分析檢驗(yàn)了五種基因模型,那么校正后的顯著性水平α'=0.05/5=0.01,即將各基因模型所得檢驗(yàn)結(jié)果P值與0.01進(jìn)行比較,而不再是與0.05。但遺傳關(guān)聯(lián)性研究Meta分析的各基因模型之間并不十分獨(dú)立,也存在某種關(guān)系,此外,這種方法過于保守,有校正過度的可能[2](即可能會(huì)增加假陰性的發(fā)生率)。因此,該方法并不十分適用于遺傳關(guān)聯(lián)性研究Meta分析結(jié)果的校正,但由于保守,可以最大限度的控制假陽性結(jié)果,該方法被用于全基因組關(guān)聯(lián)研究的顯著性水平的設(shè)定(α=5×10-7)[2]。

      3.2 遞減Bonferroni校正遞減Bonferroni法也稱為Step-down Bonferroni法或Step-down Holm法,最早由Holm提出[3],由Shaffer[4]進(jìn)一步改進(jìn),其后Holland[5]又將該程序進(jìn)行了優(yōu)化,增強(qiáng)了該方法的檢驗(yàn)效能。該方法通過原始P值進(jìn)行排序,排序順序?yàn)榘碢值的大小,設(shè)n為對(duì)應(yīng)P值的序號(hào),然后根據(jù)PAdjust=(m-n+1)×P公式計(jì)算校正后的P值(PAdjust),然后將校正后的P值PAdjust與0.05進(jìn)行比較,若PAdjust小于0.05,則認(rèn)為具有統(tǒng)計(jì)學(xué)意義,即該遺傳位點(diǎn)突變與疾病有關(guān)聯(lián)。

      3.3 置換檢驗(yàn)該方法的原理是以H0為真的情況作為模板,然后計(jì)算出調(diào)整后的P值。先對(duì)未校正的P值進(jìn)行排序,然后根據(jù)基因之間結(jié)構(gòu)上的關(guān)系,多次置換,從而得到Pmin值的經(jīng)過實(shí)證后的虛擬頻數(shù)分布,將從實(shí)際數(shù)據(jù)中得到的P值與置換后的分布相比,從而得出校正后的PAjust。若進(jìn)行了x次置換,得到x個(gè)Pmin,從實(shí)際數(shù)據(jù)得到的P值比y個(gè)Pmin值小,則校正后的Padjust=(y+1)/(x+1)。各檢驗(yàn)之間存在依賴關(guān)聯(lián)時(shí),置換檢驗(yàn)優(yōu)于Bonferroni檢驗(yàn),該方法功能較為強(qiáng)大,但其計(jì)算量較大(置換次數(shù)一般為1000次),增加了普及和使用的難度。也有研究者提出減少其計(jì)算難度的方法,如通過模擬或者將實(shí)證分布與分析分布進(jìn)行擬合[6]。

      3.4 Bayesian分析法從統(tǒng)計(jì)學(xué)角度來說,P值本身并不能說明H0為真的可能性有多大[7]。因此,Bayesian理論可以用來評(píng)估某一檢驗(yàn)H0為真的概率的大小,其公式如下:

      其中(1-β)為統(tǒng)計(jì)效能,π為H0為真的先驗(yàn)概率,P("H0" |"p≤α" )為該檢驗(yàn)有統(tǒng)計(jì)學(xué)意義時(shí)假陽性的概率。上述等式等價(jià)于:

      根據(jù)上述等式可以發(fā)現(xiàn),當(dāng)H0與H1出現(xiàn)的概率相同(即π≈0.5),且統(tǒng)計(jì)效能較高(1-β≈1)時(shí),假陽性概率≈α,而我們通常將α設(shè)定為0.05,因此,上述等式為α設(shè)定為0.05提供了一定的理由。另一方面,當(dāng)(1-β)較小,即研究效能不足時(shí),為了使假陽性概率不變,α必須按比例降低。

      3.5 FDR法FDR法由Benjamin和Hochberg提出[8],故又稱為BH法。假設(shè)同時(shí)對(duì)m個(gè)假設(shè)進(jìn)行檢驗(yàn),其中有m0個(gè)假設(shè)是正確的,m1個(gè)假設(shè)是錯(cuò)誤的,對(duì)m個(gè)假設(shè)檢驗(yàn)完成后,被拒絕的零假設(shè)個(gè)數(shù)記為R,被接受的零假設(shè)個(gè)數(shù)為W。如表1所示,假設(shè)檢驗(yàn)的個(gè)數(shù)m是已知的,被拒絕的零假設(shè)個(gè)數(shù)R是可觀測(cè)的隨機(jī)變量,而U、V、S、T四個(gè)變量是不可觀測(cè)的隨機(jī)變量。

      表1 m個(gè)檢驗(yàn)的假設(shè)檢驗(yàn)結(jié)果

      根據(jù)表1,F(xiàn)DR的定義如下:

      FDR法是通過控制錯(cuò)誤發(fā)現(xiàn)率來進(jìn)行P值調(diào)整。FDR設(shè)定為0.05,將未校正的P值按從小到大的順序進(jìn)行排序,如P1≤P2≤…≤Px≤…≤Pm,Pm為所有未校正P值中最大者,然后選出PAdjust≤(n×0.05)/m的所有情況,并找出其中排序最高的P值(Px,且Px≤Pm),那么認(rèn)為排序?yàn)閞以內(nèi)的檢驗(yàn)被認(rèn)為是具有統(tǒng)計(jì)學(xué)意義。

      3.6 改進(jìn)FDR法該方法首先同F(xiàn)DR法,先進(jìn)行P值排序,然后計(jì)算PAdjust=mp/r,若第r次序號(hào)的Pr大于第r+i(i=1,2,…)次Pr+i時(shí),Pr用Pr+i中最小的值代替[9]。若校正后的PAdjust<0.05,則認(rèn)為具有統(tǒng)計(jì)學(xué)意義。此外,F(xiàn)DR法還有較多的改進(jìn)方法,比如加權(quán)FDR法、依賴性檢驗(yàn)的FDR法及參數(shù)FDR法[7,10,11]等??傊?,F(xiàn)DR法較控制FWER法寬松,允許更多的假陽性存在,同時(shí)也減少了假陰性的存在[2]。

      3.7 FPRP法FPRP法是針對(duì)分子流行病學(xué)研究而研發(fā)出來的[12]。在研究遺傳突變與表型或疾病的關(guān)聯(lián)時(shí),傳統(tǒng)統(tǒng)計(jì)學(xué)方法并不關(guān)注研究的H0和H1的概率,認(rèn)為它們是非隨機(jī)的、未知的,但在研究較多個(gè)不確定的位點(diǎn)或單體型時(shí),H0和H1卻是有概率性的[13]。因此,盡管是設(shè)計(jì)較好、樣本量較大的遺傳關(guān)聯(lián)性研究,也存在較高概率的假陽性結(jié)果(≥95%)[14,15]。FPRP法需要用到先驗(yàn)概率,但比Bayesian法更好理解,實(shí)際上屬于一種Bayesian方法,但又不同于傳統(tǒng)的Bayesian法。設(shè)H1先驗(yàn)概率為λ,F(xiàn)PRP定義為:

      α為顯著性水準(zhǔn),(1-β)為統(tǒng)計(jì)效能。由上述公式可以看出,F(xiàn)PRP與α、(1-β)及λ有關(guān),且λ是影響FPRP最重要因素,此外,確定λ值也是FPRP法的關(guān)鍵步驟。Wacholder等[12]將FPRP的步驟分為4步:

      ①預(yù)設(shè)FPRP臨界值。對(duì)遺傳關(guān)聯(lián)性研究Meta分析而言,F(xiàn)PRP的設(shè)定要較為嚴(yán)格,一般設(shè)定為0.2;

      ②確定H1的先驗(yàn)概率λ。精確設(shè)定λ值是沒有必要的,因此,通常將其分成低(≈0.001)、中(≈0.01)、高(≈0.1)三類;

      ③確定OR值、遺傳模型及統(tǒng)計(jì)效能。一般將OR設(shè)定為1.5。

      ④計(jì)算FPRP值。根據(jù)FPRP定義的公式計(jì)算出FPRP值,然后與預(yù)設(shè)定的FPRP臨界值0.2進(jìn)行比較,若小于臨界值,則認(rèn)為該遺傳突變與表型或疾病之間的關(guān)聯(lián)有統(tǒng)計(jì)學(xué)意義。此外,在進(jìn)行遺傳關(guān)聯(lián)性研究Meta分析的結(jié)果校正時(shí),我們可以將H1先驗(yàn)概率λ的三個(gè)分類均計(jì)算出來,然后進(jìn)行敏感性分析,綜合比較,若計(jì)算出來的FPRP值均小于預(yù)設(shè)定的臨界值,則更加增強(qiáng)結(jié)果的可信度。

      4 小結(jié)

      控制FWER法依賴于進(jìn)行檢驗(yàn)的數(shù)量,因此其邏輯備受詬病,此外控制FWER法較為嚴(yán)格,傾向于引起Ⅱ型錯(cuò)誤。FDR法的方法建立的假設(shè)基礎(chǔ)為:在H0為真時(shí),P值符合(0,1)的均勻分布。但該假設(shè)在基因分型偏倚、人群分層級(jí)存在相關(guān)聯(lián)的檢驗(yàn)統(tǒng)計(jì)量時(shí)并不成立,此外,F(xiàn)DR法控制的是假陽性的期望比例,并不是真實(shí)比例,因此,在遺傳關(guān)聯(lián)性研究Meta分析中應(yīng)用FDR法進(jìn)行校正,可能會(huì)導(dǎo)致誤導(dǎo)性的結(jié)果。Bayesian法由于其理論較難,推廣及普及不易,局限性較為明顯。而FPRP法計(jì)算較為簡(jiǎn)單,其理論也不難理解,假設(shè)前提不復(fù)雜,因此,在遺傳關(guān)聯(lián)性研究及其Meta分析中,推薦讀者使用FPRP法進(jìn)行結(jié)果的校正。值得注意的是,要明確遺傳突變是否與表型或疾病存在真實(shí)關(guān)聯(lián),最主要的方法還是重復(fù)進(jìn)行研究。

      [1] 伍小英,魯婧婧,張晉昕,等. 兩兩比較的Bonferroni法[J]. 循證醫(yī)學(xué),2006,6(6):361-3.

      [2] 嚴(yán)衛(wèi)麗. 復(fù)雜疾病全基因組關(guān)聯(lián)研究進(jìn)展——遺傳統(tǒng)計(jì)分析[J].遺傳,2008,30(5):543-9.

      [3] Holm S. A simple sequentially rejective multiple test procedure[J]. Scand J Statist,1979,6:65-70.

      [4] Shaffer JP. Modified Sequentially Rejective Multiple Test Procedures[J]. Am Stat Assoc,1986,81(395):826-31.

      [5] Holland BS,Copenhaver DP. An improved sequentially rejective Bonferroni procedure[J]. Biometrics,1987,43(2):417-23.

      [6] Dudbridge F,Koeleman BP. Efficient computation of significance levels for multiple associations in large studies of correlated data, including genomewide association studies[J]. Am J Hum Genet,2004,75(3):424-35.

      [7] Al-Chalabi A,Almasy L. Genetics of Complex Human Diseases: A Laboratory Manual[M]. New York: Cold Spring Harbor Laboratory Press,2009.

      [8] Benjamini Y,Hochberg Y. Controlling The False Discovery Rate - A Practical And Powerful Approach To Multiple Testing[J]. J R Stat Soc Ser C Appl Stat,1995,57(1):289-300.

      [9] 張?zhí)灬?鐘文昭,李博. 實(shí)用循證醫(yī)學(xué)方法學(xué)[M]. 第2版.長(zhǎng)沙:中南大學(xué)出版社,2015.

      [10] Benjamini Y,Hochberg Y. Multiple Hypotheses Testing with Weights[J]. SCAND J Statist,1997,24(3):407-18.

      [11] Benjamini Y,Yekutieli D. The control of the false discovery rate in multiple testing under dependency[J]. Ann Statist,2001,29(4):1165-88.

      [12] Wacholder S,Chanock S,Garcia-Closas M,et al. Assessing the probability that a positive report is false: an approach for molecular epidemiology studies[J]. J Natl Cancer Inst,2004,96(6):434-42.

      [13] 余燦清,李立明. 假陽性結(jié)果報(bào)告率在分子流行病學(xué)研究中的應(yīng)用[J]. 中華預(yù)防醫(yī)學(xué)雜志,2009,43(12):1141-2.

      [14] Sterne JA,Davey SG. Sifting the evidence-what's wrong with significance tests?[J]. BMJ,2001,322(7280):226-31.

      [15] Colhoun HM,McKeigue PM,Davey SG. Problems of reporting genetic associations with complex outcomes[J]. Lancet,2003,361(9360):865-72.

      本文編輯:姚雪莉

      Methods of multiple testing adjustments in Meta-analysis of genetic association study

      WENG Hong*, ZHANG Yong-gang, NIU Yu-ming, ZENG Xian-tao.*Center for Evidence-Based and Translational Medicine, Zhongnan Hospital of Wuhan University, Wuhan 430071, China. Corresponding author: ZENG Xian-tao, E-mail: zengxiantao1128@163.com

      There are five genetic models commonly calculated when the Meta-analysis of genetic association study is performed, which could increase the times of statistical tests and probability of false-positive results. In addition, there are multiple loci and multiple phenotypes analyzed in a study, which also could increase the probability of false-positive results. Therefore, the corrected value of test results of each genetic model should be given besides of calculating the result of each genetic model for justifying the results whether are false-positive results when performing a Meta-analysis of genetic association study. The aim of this study is to introduce the adjustment methods of multiple tests.

      Genetic association study; Multiple tests; Adjustment; Meta-analysis

      R4

      A

      1674-4055(2016)12-1409-03

      國(guó)家重點(diǎn)研發(fā)計(jì)劃專項(xiàng)基金(2016YFC0106300)

      1430071 武漢,武漢大學(xué)中南醫(yī)院循證與轉(zhuǎn)化醫(yī)學(xué)中心;2430071 武漢,武漢大學(xué)循證與轉(zhuǎn)化醫(yī)學(xué)中心;3610041 成都,四川大學(xué)華西醫(yī)院期刊社;4442000 十堰,十堰市太和醫(yī)院(湖北醫(yī)藥學(xué)院附屬醫(yī)院)循證醫(yī)學(xué)與臨床研究中心

      曾憲濤,E-mail:zengxiantao1128@163.com

      10.3969/j.issn.1674-4055.2016.12.01

      猜你喜歡
      假設(shè)檢驗(yàn)關(guān)聯(lián)性校正
      劉光第《南旋記》校正
      一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
      機(jī)內(nèi)校正
      四物湯有效成分的關(guān)聯(lián)性分析
      中成藥(2017年3期)2017-05-17 06:09:05
      統(tǒng)計(jì)推斷的研究
      雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
      Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
      統(tǒng)計(jì)學(xué)教學(xué)中關(guān)于假設(shè)檢驗(yàn)問題探討
      如何準(zhǔn)確認(rèn)定排污行為和環(huán)境損害之間的關(guān)聯(lián)性
      CRP檢測(cè)與新生兒感染的關(guān)聯(lián)性
      揭阳市| 赤城县| 南宁市| 泰和县| 如东县| 饶阳县| 铅山县| 股票| 中牟县| 乐陵市| 梁河县| 搜索| 石嘴山市| 泊头市| 土默特右旗| 隆安县| 鹿邑县| 景宁| 藁城市| 南郑县| 西宁市| 措美县| 鄯善县| 建宁县| 柳河县| 怀柔区| 图片| 神农架林区| 沽源县| 荣昌县| 淮南市| 上思县| 合江县| 启东市| 育儿| 乌兰县| 垦利县| 巴中市| 繁峙县| 孙吴县| 海阳市|