• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Wald檢驗實現(xiàn)Cox回歸中自變量影響大小的推斷*

      2017-01-10 03:46:24暢潘輝陳梓聰張晉昕
      中國衛(wèi)生統(tǒng)計 2016年6期
      關(guān)鍵詞:癌胚抗原子集回歸系數(shù)

      劉 暢潘 輝陳梓聰張晉昕△

      基于Wald檢驗實現(xiàn)Cox回歸中自變量影響大小的推斷*

      劉 暢1潘 輝2陳梓聰1張晉昕1△

      目的針對一般研究者在使用Cox回歸時,直接比較標(biāo)準(zhǔn)化偏回歸系數(shù)大小的做法,提出借助Wald檢驗進(jìn)行排序,并用小細(xì)胞肺癌患者隨訪研究的實例加以說明。方法借鑒SNK多重比較法的比較策略,以盡可能少的比較次數(shù),使用Wald檢驗對樣本標(biāo)準(zhǔn)化回歸系數(shù)進(jìn)行假設(shè)檢驗,從而探討總體標(biāo)準(zhǔn)化回歸系數(shù)之間的關(guān)系,形成依影響大小排序的若干子集。結(jié)果選入模型的4個變量被劃分在2個子集內(nèi),可認(rèn)為第1子集中的自變量(實例中的腫瘤大小、年齡)對預(yù)后的影響小于第2子集中的自變量(神經(jīng)元特異性烯醇化酶),自變量癌胚抗原對預(yù)后的影響介于兩個子集之間。結(jié)論基于Wald檢驗對自變量進(jìn)行排序,能夠克服cox回歸模型結(jié)果報告中判斷自變量影響大小的主觀性。

      標(biāo)準(zhǔn)化偏回歸系數(shù) Wald檢驗 預(yù)后 影響程度

      Cox回歸模型分析廣泛應(yīng)用于評估一組自變量對預(yù)后的影響[1]。模型分析過程主要有兩個階段,模型選擇和預(yù)測變量的解釋[2]。在模型選擇階段,主要目標(biāo)是尋找正確的模型。模型選定后,對預(yù)測變量的意義進(jìn)行分析和解釋,將自變量按照對生存結(jié)局的作用大小進(jìn)行比較、獲得其排序,在公共衛(wèi)生、生態(tài)學(xué)、環(huán)境學(xué)、心理學(xué)等領(lǐng)域均有著廣泛的需求[3]。目前最常使用的指標(biāo)為標(biāo)準(zhǔn)化偏回歸系數(shù),或?qū)?yīng)的風(fēng)險比(hazard ratio,HR)值。事先通過對變量或偏回歸系數(shù)進(jìn)行標(biāo)準(zhǔn)化,可使量綱不同的變量得以相互比較。

      研究者在給出分析報告時,通常將標(biāo)準(zhǔn)化偏回歸系數(shù)直接進(jìn)行比較,以體現(xiàn)自變量對預(yù)后的影響大小,這種做法其實不盡合理。原因是標(biāo)準(zhǔn)化偏回歸系數(shù)是由樣本估計出的一個統(tǒng)計量,存在抽樣誤差。樣本的標(biāo)準(zhǔn)化偏回歸系數(shù)取值有差別,也無法據(jù)此直接判斷兩個總體標(biāo)準(zhǔn)化偏回歸系數(shù)是否不同。因此,有必要對其進(jìn)行假設(shè)檢驗,以判斷總體偏回歸系數(shù)的關(guān)系。此外,在考慮自變量對結(jié)局的影響程度時,若干個變量間不一定是A大B小的關(guān)系,不排除A與B對結(jié)局的影響程度同等的情形。本研究旨在針對以上應(yīng)用問題,提出合理的自變量排序方法。

      基本原理

      通過對樣本標(biāo)準(zhǔn)化回歸系數(shù)進(jìn)行假設(shè)檢驗,探討總體標(biāo)準(zhǔn)化系數(shù)的關(guān)系,并將自變量按對預(yù)后的影響程度劃分子集,彼此間差異沒有統(tǒng)計學(xué)意義的變量放在一個子集內(nèi)。

      1.建立模型 根據(jù)資料建立Cox比例風(fēng)險回歸模型,采用逐步回歸法篩選變量,自變量進(jìn)入模型的顯著性水準(zhǔn)為0.05,剔除的顯著性水準(zhǔn)為0.10。

      2.比較策略 為了盡可能減少比較次數(shù),本研究探索一種合適的策略對變量進(jìn)行比較,即借鑒SNK(student-newman-keuls)多重比較法[4-6]的思想,劃分相似性子集。在模型建立以后,將標(biāo)準(zhǔn)化偏回歸系數(shù)按從小到大的順序進(jìn)行排列。第一步,將第一個系數(shù)與最后一個系數(shù)進(jìn)行比較,若無差異,則兩個系數(shù)之間的所有系數(shù)都被視作沒有差異,不必繼續(xù)比較;若有差異,則進(jìn)行下一步。第二步,將第二個系數(shù)與最后一個系數(shù),第一個系數(shù)與倒數(shù)第二個系數(shù)進(jìn)行比較,按第一步的邏輯類推。以下舉例進(jìn)行說明。

      例如,當(dāng)模型中存在5個變量時,先將系數(shù)按大小進(jìn)行排序,假設(shè)β1<β2<β3<β4<β5。

      第一步,考察間隔3個變量的情況,將β1與β5進(jìn)行比較。若無差異,則認(rèn)為其間隔內(nèi)的所有變量都沒有差異,不必做后續(xù)比較;若有差異,進(jìn)行第二步。

      第二步,考察間隔2個變量的情況,將β1與β4,β2與β5進(jìn)行比較。若無差異,則認(rèn)為其間隔內(nèi)的所有變量都無差異,不必做接下來的比較;若有差異,進(jìn)行第三步。

      依此類推。當(dāng)所有系數(shù)間都存在差異時,完整的比較流程如圖1所示。

      圖1 假定5個變量的比較流程示意圖

      3.檢驗方法 目前常用于回歸模型中系數(shù)比較的檢驗有:F檢驗、似然比檢驗、Wald檢驗、計分檢驗等。本文采用Wald檢驗對系數(shù)進(jìn)行檢驗,其優(yōu)點是,只需估計無約束模型。其原理是,測量約束和無約束模型間的距離,從而檢驗約束條件是否成立。Wald統(tǒng)計量的計算公式如下:

      其中,L為線性約束矩陣,β為系數(shù)矩陣,Cov(β)為協(xié)方差陣。由公式可以看出,該方法在計算過程中使用了系數(shù)間的協(xié)方差矩陣,因此可以更好地考慮變量間存在相關(guān)性的情況。在檢驗時,通過設(shè)置不同的L矩陣,可以考察不同的線性約束是否成立。例如,若要檢驗H0∶β2=β3,則令L=(0 1 -1 0 0),相當(dāng)于檢驗Lβ=β2-β3=0是否成立。

      實例分析

      數(shù)據(jù)來源于本課題組收集的小細(xì)胞肺癌患者生存時間的調(diào)查數(shù)據(jù),共計275名小細(xì)胞肺癌患者。其中男性239例,女性36例;年齡最小33歲,最大86歲,平均年齡(62.6±9.3)歲。

      自變量包括年齡、性別、吸煙量(包/年)、腫瘤大小、血紅蛋白、白細(xì)胞計數(shù)、中性粒細(xì)胞計數(shù)、淋巴細(xì)胞計數(shù)、血小板計數(shù)、癌胚抗原(carcino-embryonic antigen,CEA)、神經(jīng)元特異性烯醇化酶(neuron-specific enolase,NSE)、γ-谷氨酰轉(zhuǎn)肽酶、纖維蛋白酶原和白蛋白共14個可疑的影響因素,除性別外均為連續(xù)型變量。結(jié)局變量為患者的生存情況。

      本研究的全部計算在SAS 9.3軟件環(huán)境下實現(xiàn)。

      1.模型的建立

      建立Cox比例風(fēng)險回歸模型,對影響小細(xì)胞肺癌患者生存時間的因素進(jìn)行分析,最終模型中選入4個變量:年齡(Age),腫瘤大?。⊿ize),癌胚抗原(CEA),神經(jīng)元特異性烯醇化酶(NSE)。模型中變量的偏回歸系數(shù)及標(biāo)準(zhǔn)化偏回歸系數(shù)見表1。

      表1 Cox回歸模型參數(shù)估計結(jié)果

      2.標(biāo)準(zhǔn)化偏回歸系數(shù)的檢驗

      按照上文提出的比較策略,對4個標(biāo)準(zhǔn)化偏回歸系數(shù)按照從小到大的順序進(jìn)行排序,記為分別對應(yīng)Size、Age、CEA、NSE4個變量,采用Wald檢驗,分別對系數(shù)進(jìn)行檢驗。檢驗結(jié)果如表2所示。

      表2 標(biāo)準(zhǔn)化偏回歸系數(shù)比較結(jié)果

      3.劃分子集情況

      根據(jù)檢驗結(jié)果,可將自變量劃分為2個子集(見表3),按照從小到大的順序,前3個系數(shù)劃分在1個子集內(nèi),后2個系數(shù)劃分在1個子集內(nèi)??烧J(rèn)為腫瘤大小、年齡、癌胚抗原對患者生存時間的影響程度相近,癌胚抗原、神經(jīng)元特異性烯醇化酶對生存時間的影響程度相近。神經(jīng)元特異性烯醇化酶對預(yù)后的影響大于腫瘤大小、年齡;癌胚抗原對預(yù)后的影響介于2個集合之間。

      圖2 小細(xì)胞肺癌Cox回歸模型中系數(shù)比較流程圖

      表3 自變量按影響程度劃分子集

      討 論

      標(biāo)準(zhǔn)化偏回歸系數(shù)的應(yīng)用歷史已久,由于其易于計算,便于解釋的特性,使它成為目前使用最為廣泛的、描述自變量對結(jié)局影響程度的量化指標(biāo)。然而,標(biāo)準(zhǔn)化偏回歸系數(shù)在結(jié)果報告中的解讀往往過于主觀。不時見到的情形是,建立回歸模型后,直接比較兩個變量的標(biāo)準(zhǔn)化回歸系數(shù)的大小,得出A指標(biāo)強(qiáng)于B指標(biāo)的影響因素的結(jié)論[7,11]。也有學(xué)者在使用標(biāo)準(zhǔn)化偏回歸系數(shù)時,會報告其置信區(qū)間[8-10]。

      研究資料的獲得通常都是基于隨機(jī)抽樣,計算出的標(biāo)準(zhǔn)化偏回歸系數(shù)是由樣本估計出的一個統(tǒng)計量,勢必存在抽樣誤差。因此,比較不同自變量對結(jié)局的影響大小時,應(yīng)借助統(tǒng)計推斷(假設(shè)檢驗或區(qū)間估計)方法。為了指導(dǎo)研究人員正確報告自變量影響大小,統(tǒng)計學(xué)家對標(biāo)準(zhǔn)化偏回歸系數(shù)的置信區(qū)間估計提供了多種方法和建議,包括非中心性區(qū)間估計,Delta法,Bootstrap法等[12]。對標(biāo)準(zhǔn)化系數(shù)進(jìn)行假設(shè)檢驗的研究則未被足夠重視。

      本文提出采用Wald檢驗對Cox回歸模型的標(biāo)準(zhǔn)化偏回歸系數(shù)進(jìn)行假設(shè)檢驗,比較總體標(biāo)準(zhǔn)化回歸系數(shù)的大小。實際上,該方法并不局限于Cox回歸,還可以應(yīng)用于多重線性回歸、logistic回歸等線性回歸模型中。若變量間比較次數(shù)過多,會致假陽性率上升。本研究借鑒SNK方法的思想,提出分級比較的策略,有效地減少了比較次數(shù)。例如,針對一個包含5個自變量的模型,若對全部系數(shù)進(jìn)行檢驗,需要進(jìn)行C25=10次。采用本文提供的比較流程,比較次數(shù)不會超過10次(所有變量均有差異的情況下)。

      線性回歸模型建立以后,將自變量對結(jié)局變量的影響程度大小進(jìn)行排序,是醫(yī)學(xué)研究者都關(guān)心的問題,因其對后續(xù)干預(yù)策略的制訂具有重要指導(dǎo)意義。本文給出的方法對于把握輕重緩急、抓住主要因素,提供了統(tǒng)計學(xué)方法支持。

      [1]Chao YE,Zhao Y,Kupper L L,etal.Quantifying the Relative Importance of Predictors in Multiple Linear Regression Analyses for Public Health Studies.Journal of Occupational and Environmental Hygiene,2008,5(8):519-529.

      [2]Krasikova D,LeBreton J,Tonidandel S.Estimating the relative importance of variables in multiple regression models.International Review of Industrial and Organizational Psychology 2011,Volume 26,2011:119-141.

      [3]孫紅衛(wèi),王玖,羅文海.線性回歸模型中自變量相對重要性的衡量.中國衛(wèi)生統(tǒng)計,2012,29(6):900-902.

      [4]Abdi H,W illiams LJ.Newman-Keuls test and Tukey test.Encyclopedia of Research Design.Thousand Oaks,CA:Sage,2010:1-11.

      [5]Keuls M.The use of the“studentized range”in connection w ith an analysis of variance.Euphytica,1952,1(2):112-122.

      [6]Curran-Everett D.Multiple comparisons:philosophies and illustrations.Am JPhysiol Regul Integr Comp Physiol,2000,279(1):R1-R8.

      [7]Young TK,Gelskey DE.Is noncentral obesity metabolically benign?Implications for prevention from a population survey.JAMA,1995,274(24):1939.

      [8]Cheng S,Rhee E,Larson M,et al.Metabolite Profiling Identifies Pathways Associated W ith Metabolic Risk in Humans.Circulation,2012,125(18):2222-2231.

      [9]Baccarelli A,W right RO,Bollati V,et al.Rapid DNA methylation changes after exposure to traffic particles.American journal of respiratory and critical caremedicine,2009,179(7):572-578.

      [10]Tanaka K,Ogata S,Tanaka H,et al.The relationship between body mass index and uric acid:a study on Japanese adult twins.Environmental health and preventivemedicine,2015,20(5):347-353.

      [11]Tsai A,Aung T,Yip W,et al.Relationship of Intraocular Pressure with Central Aortic Systolic Pressure.Current Eye Research,2015:1-6.

      [12]Jones J,Waller N.Computing confidence intervals for standardized regression coefficients.Psychological Methods,2013,18(4):435-453.

      (責(zé)任編輯:鄧 妍)

      Inference of Strengths of Effects between Predictors in Cox Regression Based on W ald Test

      Liu Chang,Pan Hui,Chen Zicong,et al
      (Departmentof Medical Statistics and Epidemiology,School of Public Health,SunYat-Sen University(510080),Guangzhou)

      ObjectiveTo solve the common problem that standardized regression coefficients are compared w ith each other directly by researchers,we propose a rankingmethod based on Wald test,and illustrate it by a example of small cell lung cancer patients.MethodsLearning Strategies from Student-Newman-Keuls test,make hypothesis tests of sample standardized regression coefficients by Wald testw ith comparing times as few as possible,in order to explore the relationship between population standardized regression coefficients and partition subsets of predictors according to theirmagnitude of effects to the dependent variable.ResultsThe four selected predictors are allocated to two subsets,we can consider that predictors in subset 1(size and age)have less effects on prognosis than predictors in subset2(neuron-specific enolase),while the effects of carcino-embryonic antigen stays between the two subsets.ConclusionRanking predictors based on Wald test can overcome subjectivity of effectsmagnitude judgement in result report of regressionmodels.

      Standardized regression coefficients;Wald test;Prognosis;Effect

      廣東省科學(xué)技術(shù)廳科技計劃項目(2014A020212713)

      1.中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計與流行病學(xué)系(510080)

      2.廣州醫(yī)科大學(xué)附屬第一醫(yī)院轉(zhuǎn)化醫(yī)學(xué)實驗室

      △通信作者:張晉昕,E-mail:zhjinx@m(xù)ail.sysu.edu.cn

      猜你喜歡
      癌胚抗原子集回歸系數(shù)
      體檢查出癌胚抗原偏高如何處置
      人人健康(2024年1期)2024-03-19 08:35:38
      由一道有關(guān)集合的子集個數(shù)題引發(fā)的思考
      直腸癌術(shù)前臨床分期及癌胚抗原預(yù)測術(shù)后復(fù)發(fā)與轉(zhuǎn)移
      拓?fù)淇臻g中緊致子集的性質(zhì)研究
      關(guān)于奇數(shù)階二元子集的分離序列
      薛定諤的 貓與腫瘤標(biāo)志物
      多元線性回歸的估值漂移及其判定方法
      電導(dǎo)法協(xié)同Logistic方程進(jìn)行6種蘋果砧木抗寒性的比較
      多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
      結(jié)直腸癌根治術(shù)后血清癌胚抗原變化趨勢與患者預(yù)后的關(guān)系
      吴川市| 金川县| 新巴尔虎左旗| 抚州市| 札达县| 交城县| 北安市| 连云港市| 常德市| 云阳县| 嘉义市| 元阳县| 易门县| 静宁县| 紫阳县| 察雅县| 弥渡县| 芒康县| 綦江县| 大新县| 嘉鱼县| 平阴县| 柳河县| 屯门区| 弥勒县| 张家港市| 营山县| 宣武区| 朝阳市| 康马县| 平原县| 勃利县| 屯门区| 平陆县| 普宁市| 武义县| 镇雄县| 盐城市| 潮州市| 平南县| 科技|