• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      Poisson回歸中過度離散的檢驗(yàn)方法*

      2011-02-03 03:49:58趙晉芳劉桂芬
      中國衛(wèi)生統(tǒng)計(jì) 2011年2期
      關(guān)鍵詞:均數(shù)方差過度

      曾 平 趙晉芳 劉桂芬

      Poisson回歸中過度離散的檢驗(yàn)方法*

      曾 平1△趙晉芳2劉桂芬2

      在數(shù)理統(tǒng)計(jì)中,Poisson分布有著悠久的歷史,最早可追溯到1838年。對當(dāng)時廣泛研究的二項(xiàng)分布,在事件的發(fā)生概率p很小、試驗(yàn)次數(shù)n很大的情況下,法國數(shù)學(xué)家Poisson〔1〕推導(dǎo)出了二項(xiàng)分布的極限分布,為了紀(jì)念他而稱為Poisson分布。其早期一個著名的應(yīng)用例子是Bortkiewicz(1898)觀察到普魯士的騎兵部隊(duì)中每年被馬踢死的士兵數(shù)服從Poisson分布〔2〕。Poisson回歸也被Ernst(1863)用來計(jì)算血紅細(xì)胞的數(shù)目〔3〕,此后Poisson回歸在農(nóng)業(yè)、生物醫(yī)學(xué)和人口學(xué)等方面得到廣泛應(yīng)用,已經(jīng)成為計(jì)數(shù)資料的基本統(tǒng)計(jì)模型。Poisson回歸在應(yīng)用中需要滿足一個十分重要的假設(shè):事件的條件均值等于條件方差,稱為等離散(equal-dispersion)。然而計(jì)數(shù)資料常表現(xiàn)為事件的方差大于均值,從而使得計(jì)數(shù)數(shù)據(jù)存現(xiàn)出比Poisson分布下名義方差更大的變異。事件的條件方差超過條件均數(shù)稱為過度離散(over-dispersion)。對過度離散的計(jì)數(shù)資料,Poisson回歸常常低估參數(shù)估計(jì)值的標(biāo)準(zhǔn)誤,導(dǎo)致出現(xiàn)較大的統(tǒng)計(jì)量,從而增大Ⅰ類錯誤,夸大解釋變量效應(yīng)。因此對計(jì)數(shù)資料過度離散的識別和檢驗(yàn)就具有重要的意義,這是正確應(yīng)用Poisson回歸的前提之一。

      過度離散檢驗(yàn)

      過度離散檢驗(yàn)(overdispersion test)有基于殘差和樣本均數(shù)方差等多種不同的檢驗(yàn)方法,本文主要介紹其中幾種方法。

      1.O檢驗(yàn)

      O檢驗(yàn)由B?ning提出,O統(tǒng)計(jì)量的計(jì)算為〔4〕:

      式中n為總觀察單位數(shù),s2、ˉ分別為事件數(shù)的方差和均數(shù),在均數(shù)和方差相等的條件下統(tǒng)計(jì)量O近似服從正態(tài)分布。

      2.基于Poisson回歸的殘差檢驗(yàn)

      在滿足Poisson回歸條件方差和均數(shù)相等的前提下,Cameron和Trivedi構(gòu)造如下的回歸方程〔5〕:

      *江蘇省教育廳高校哲學(xué)社會科學(xué)研究基金資助(2010SJB790037)1.徐州醫(yī)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)教研室(221002)

      2.山西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(030001)

      △通訊作者:曾平,E-mail:zengpingsanxing@163.com

      或者,Cameron和Trivedi建議構(gòu)造另外一個回歸方程〔6〕,如下:

      即以((yi-)2-)為應(yīng)變量,為自變量建立不包含常數(shù)項(xiàng)的最小二乘回歸方程,在均數(shù)和方差相等的條件下,對λ=0的檢驗(yàn)等價(jià)于過度離散檢驗(yàn)。

      3.得分檢驗(yàn)

      在Poisson回歸條件方差和均數(shù)相等的前提下,Dean 和 Lawless提出如下的得分檢驗(yàn)〔7〕(score test),統(tǒng)計(jì)量T為

      在均數(shù)和方差相等的條件下T統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。

      4.拉格朗日乘數(shù)檢驗(yàn)

      Greene(2002)介紹了一種基于負(fù)二項(xiàng)模型的過度離散檢驗(yàn)方法,稱為拉格朗日乘數(shù)檢驗(yàn)(lagrange multiplier test,LM)〔8〕。由于 Poisson 回歸可以通過約束負(fù)二項(xiàng)模型的參數(shù)而得到,所以能夠建立拉格朗日乘數(shù)檢驗(yàn)。統(tǒng)計(jì)量為:

      此處的權(quán)重wi取決于所假定的另一種分布,在負(fù)二項(xiàng)分布中,wi=1,因此當(dāng)假定Poisson回歸通過約束負(fù)二項(xiàng)模型的參數(shù)而得到時,拉格朗日乘數(shù)檢驗(yàn)統(tǒng)計(jì)量又可以表示為:

      實(shí)例分析

      為研究影響重癥患者住院期間呼吸機(jī)使用次數(shù)的因素,收集了某醫(yī)科大學(xué)附屬醫(yī)院重癥監(jiān)護(hù)室2006年1~6月間140例病例在10天內(nèi)呼吸機(jī)使用次數(shù)的資料,使用呼吸機(jī)患者的一般情況和臨床指標(biāo)(見表1和表 2)。呼吸機(jī)平均使用次數(shù)為 5.44,方差為33.80,遠(yuǎn)遠(yuǎn)大于平均使用次數(shù),這暗示重癥患者住院期間呼吸機(jī)使用次數(shù)的變異較大。

      表1 呼吸機(jī)使用次數(shù)數(shù)據(jù)連續(xù)指標(biāo)統(tǒng)計(jì)描述

      表2 呼吸機(jī)使用次數(shù)數(shù)據(jù)分類指標(biāo)統(tǒng)計(jì)描述

      表3 呼吸機(jī)使用次數(shù)的過度離散檢驗(yàn)

      經(jīng)過度離散檢驗(yàn),都拒絕呼吸機(jī)使用次數(shù)數(shù)據(jù)不存在過度離散的零假設(shè),表明呼吸機(jī)使用次數(shù)確實(shí)存在較大的變異,此時對于Poisson回歸的應(yīng)用要慎重。對本資料的詳細(xì)統(tǒng)計(jì)分析我們將另文給出。

      討 論

      針對計(jì)數(shù)資料中Poisson回歸遇到的過度離散問題,文中介紹了一系列的檢驗(yàn)方法,它們都充分利用了Poisson分布均數(shù)和方差相等的性質(zhì)。對幾種方法的對比分析,我們認(rèn)為O檢驗(yàn)只涉及到樣本均數(shù)、方差和例數(shù),從公式可見即使方差和均數(shù)相差甚微,只要例數(shù)足夠大,也有可能得到一個較大的O值,得到有統(tǒng)計(jì)學(xué)意義的結(jié)果,可見其只利用了數(shù)據(jù)的若干概況性統(tǒng)計(jì)量,然而應(yīng)該檢驗(yàn)的是事件數(shù)的條件分布,而非簡單的對事件數(shù)直接進(jìn)行檢驗(yàn)。所以基于以上的原因,在實(shí)際應(yīng)用中我們不推薦使用O檢驗(yàn)?;赑oisson回歸的參差檢驗(yàn)、得分檢驗(yàn)和拉格朗日乘數(shù)檢驗(yàn)利用了整個數(shù)據(jù),顯然比O檢驗(yàn)更多地利用了信息,這幾個檢驗(yàn)方法需要首先進(jìn)行Poisson回歸,預(yù)測事件數(shù),但無需建立更為復(fù)雜的計(jì)數(shù)統(tǒng)計(jì)模型。LM檢驗(yàn)則需要模擬負(fù)二項(xiàng)回歸。當(dāng)計(jì)數(shù)資料存在過度離散時,應(yīng)用者可以選擇的策略包括對Poisson回歸本身進(jìn)行適當(dāng)?shù)男U蛘哌x擇其他能夠容納更大變異的計(jì)數(shù)模型,如負(fù)二項(xiàng)回歸〔1〕。本文對患者呼吸機(jī)使用天數(shù)的幾種過度離散檢驗(yàn)結(jié)果一致,然而當(dāng)不同過度離散檢驗(yàn)結(jié)果并不一致時又該如何選擇模型呢?我們建議首先將Poisson回歸作為一種探索性的分析方法,結(jié)合上述的幾種過度離散假設(shè)檢驗(yàn)法和Poisson回歸的Deviance和Pearsonχ2統(tǒng)計(jì)量,以及負(fù)二項(xiàng)回歸中離散參數(shù)的似然比檢驗(yàn)等確定最終分析方案。

      計(jì)數(shù)資料的過度離散來源可能是多方面的,如模型中尚有沒能包含的重要解釋變量,或個體事件的發(fā)生存在相關(guān)性或聚集性,或存在異常影響點(diǎn),或模型本身指定有誤,或者來源于數(shù)據(jù)中存在的過多零計(jì)數(shù)等等。但對橫斷面資料幾乎不可能明確知道過度離散的來源。再則,過度離散作為一種現(xiàn)象只是相對具體的分布而言,相對Poisson分布過度離散的資料并不表示在負(fù)二項(xiàng)分布中也一定存在過度離散。因此對計(jì)數(shù)資料需要仔細(xì)觀察和考慮數(shù)據(jù)可能存在的各種特殊結(jié)構(gòu),以選擇合適的模型。

      1.Cameron AC,Trivedi P.Regression Analysis of Count Data.Oxford University Press,1998.

      2.Lussenhop J.Victor Hensen and the development of sampling methods in ecology.Journal of the History of Biology,1974,7:319-337.

      3.Winkelmann R.Econometric analysis of Count date.fifth edition.Berlin:Springer-Verlag,2008.

      4.B?ning D.A note on test for Poisson overd is persion.Biometrika,81:418-419.

      5.Cameron AC,Pravin KT.Econometric models based on countdata:Comparisons and applicationsof some estimators and tests.Journal of Applied Econometrics,1986,1:29-53.

      6.Colin CA,Trivedi PK.Regression-based tests for overdispersion in poisson models.Journal of The American Statistical Association,1990,46:347-264.

      7.Dean C,Law less JF.Tests for detecting overdispersion in Poisson regression models.Journal of the American Statistical Association,1989,84:467-472.

      8.Greene W.Econometric Analysis.Prentice Hall,2002.

      猜你喜歡
      均數(shù)方差過度
      方差怎么算
      中藥煎煮前不宜過度泡洗
      概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
      過度減肥導(dǎo)致閉經(jīng)?
      計(jì)算方差用哪個公式
      希望你沒在這里:對過度旅游的強(qiáng)烈抵制
      英語文摘(2019年2期)2019-03-30 01:48:32
      方差生活秀
      過度加班,咋就停不下來?
      關(guān)于均數(shù)與偏差
      關(guān)于均數(shù)與偏差
      望江县| 穆棱市| 泾源县| 崇仁县| 北辰区| 商都县| 怀化市| 龙陵县| 怀来县| 鲁山县| 和静县| 任丘市| 封丘县| 武功县| 馆陶县| 怀远县| 泸定县| 克拉玛依市| 洞头县| 开化县| 平度市| 漳平市| 齐河县| 遂溪县| 溆浦县| 苏州市| 宝应县| 怀安县| 怀化市| 综艺| 巫溪县| 屯昌县| 平远县| 枞阳县| 林芝县| 新邵县| 江源县| 昭通市| 武平县| 襄樊市| 达拉特旗|