哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(150086) 趙 晶 所佳寧 羅 瀟 董曉慧 蔡富文 劉美娜
基于零膨脹模型的陽性過敏原數(shù)影響因素研究*
哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(150086) 趙 晶 所佳寧 羅 瀟 董曉慧 蔡富文 劉美娜△
目的探討陽性過敏原數(shù)影響因素是過敏反應(yīng)研究的新角度,利用零膨脹模型進(jìn)行回歸分析,了解陽性過敏原數(shù)的影響因素,為過敏反應(yīng)的早期預(yù)防提供理論依據(jù)。方法收集2010年3月至2011年12月在哈爾濱醫(yī)科大學(xué)附屬第一醫(yī)院過敏反應(yīng)科就診的3191例患者信息。根據(jù)零膨脹、過離散檢驗(yàn)以及擬合指標(biāo)評(píng)價(jià)選取最優(yōu)模型——零膨脹負(fù)二項(xiàng)模型,分析陽性過敏原數(shù)的影響因素。結(jié)果生活地區(qū)和吸煙是出現(xiàn)陽性過敏原的影響因素:生活在城市相對(duì)于農(nóng)村易出現(xiàn)陽性過敏原,吸煙易出現(xiàn)陽性過敏原;性別、過敏史和辛辣食物是影響陽性過敏原數(shù)目多少的因素:男性、有過敏史、不喜好辛辣食物的人陽性過敏原數(shù)更多。結(jié)論應(yīng)用零膨脹模型解釋陽性過敏原數(shù)影響因素更為新穎和細(xì)致,是過敏反應(yīng)研究領(lǐng)域方法學(xué)的突破。預(yù)防過敏反應(yīng)發(fā)生提示應(yīng)關(guān)注城市和吸煙人群,降低過敏反應(yīng)的嚴(yán)重程度應(yīng)關(guān)注男性、有過敏史和不喜好辛辣食物人群。
零膨脹模型 陽性過敏原數(shù) 影響因素
零膨脹(zero-inflated)是指計(jì)數(shù)資料中常常出現(xiàn)的觀測(cè)數(shù)據(jù)0值很多的一種現(xiàn)象,數(shù)據(jù)變異性很大,傳統(tǒng)計(jì)數(shù)模型不能滿足應(yīng)用條件。20世紀(jì)60年代,零膨脹現(xiàn)象就引起了廣泛關(guān)注[1],零膨脹概念首先是由Lambert在1992年提出,將零膨脹模型應(yīng)用于質(zhì)量控制,對(duì)0計(jì)數(shù)部分和非0計(jì)數(shù)部分建立混雜概率分布,建立具有協(xié)變量的零膨脹Poisson模型[2]。還有研究者在零膨脹Poisson模型基礎(chǔ)上構(gòu)建零膨脹負(fù)二項(xiàng)模型,分析銀行信用卡不良消費(fèi)記錄[3]。在本研究中,數(shù)據(jù)為計(jì)數(shù)資料,具有零膨脹、過離散特點(diǎn),零膨脹模型比傳統(tǒng)計(jì)數(shù)模型更適用。
1.研究對(duì)象
研究人群來源于2010年3月至2011年12月在哈爾濱醫(yī)科大學(xué)附屬第一醫(yī)院過敏反應(yīng)科就診的患者,對(duì)研究人群進(jìn)行問卷調(diào)查以及血清過敏原特異性IgE檢測(cè),共收集有效樣本3191例。
2.問卷調(diào)查
采用面訪式調(diào)查,調(diào)查員均是統(tǒng)一培訓(xùn)過的在讀研究生。問卷調(diào)查內(nèi)容包括一般情況、生活飲食習(xí)慣、過敏史和家族史等。
3.實(shí)驗(yàn)室檢測(cè)
應(yīng)用德國(guó)MEDIW ISS“敏篩”定量過敏原檢測(cè)系統(tǒng),進(jìn)行血清過敏原特異性IgE檢測(cè)。血清樣本可檢測(cè)戶塵螨屋塵、矮豚草蒿、魚、牛奶、小麥等19種過敏原[4]。IgE抗體濃度值≥0.35認(rèn)為該過敏原陽性,每個(gè)受試者均可得到陽性過敏原數(shù)。
4.研究方法
零膨脹模型將計(jì)數(shù)數(shù)據(jù)的來源看成兩個(gè)過程:第一個(gè)過程是由生成零計(jì)數(shù)的二項(xiàng)分布支配,此過程個(gè)體取值只能為0,解釋因素是否影響事件的發(fā)生;第二個(gè)過程對(duì)應(yīng)事件發(fā)生數(shù),由計(jì)數(shù)分布支配,此過程個(gè)體的取值可以是0,也可以是正的事件數(shù),解釋因素影響事件數(shù)發(fā)生的多少。零膨脹模型適用于0值很多、過離散的數(shù)據(jù),估計(jì)結(jié)果有效性強(qiáng),沒有偏差,可以得到可靠的假設(shè)檢驗(yàn)與參數(shù)估計(jì)。
(1)零膨脹Poisson回歸模型(ZIP)和零膨脹負(fù)二項(xiàng)回歸模型(ZINB)
零膨脹Poisson回歸模型是將原始數(shù)據(jù)集看做由一個(gè)全0數(shù)據(jù)集與一個(gè)滿足Poisson分布的數(shù)據(jù)集混合而成[2]。
logitπ()i=Giγ,ln()μ=Biβ。Gi和Bi為協(xié)變量向量;γ和β為待估參數(shù),兩者可以一致也可以不同[5]。
零膨脹負(fù)二項(xiàng)回歸模型是將原數(shù)據(jù)集看做一個(gè)全為0的數(shù)據(jù)集與一個(gè)滿足負(fù)二項(xiàng)分布的數(shù)據(jù)集混合而成[6]。
logit(πi)=Giγ,ln(μ)=Biβ+εi。Gi和Bi為協(xié)變量向量;γ和β為待估參數(shù),兩者可以一致也可以不同,εi與自變量無關(guān),exp(εi)服從均值為1的伽馬分布。
零膨脹回歸模型數(shù)據(jù)來源兩部分,logit部分和計(jì)數(shù)部分(如Poisson或負(fù)二項(xiàng)部分)。將單因素logistic回歸分析的參數(shù)估計(jì)作為零膨脹回歸模型Logit部分的參數(shù)初始值;將傳統(tǒng)計(jì)數(shù)回歸分析的參數(shù)估計(jì)作為零膨脹回歸模型計(jì)數(shù)部分的參數(shù)初始值。進(jìn)行零膨脹回歸模型擬合,得到參數(shù)估計(jì)結(jié)果、P值、擬合效果指標(biāo)等,探討陽性過敏原數(shù)影響因素。
(2)最優(yōu)模型的選擇
最優(yōu)模型選擇包括三部分:過離散檢驗(yàn)、零膨脹檢驗(yàn)以及模型擬合效果指標(biāo)比較。
1)采用O檢驗(yàn)判定數(shù)據(jù)是否過離散,統(tǒng)計(jì)量的計(jì)算如下[7],當(dāng)O≥1.96時(shí),數(shù)據(jù)存在過離散。
2)Vuong檢驗(yàn)用于檢驗(yàn)0頻數(shù)是否過多,幫助判定選擇Poisson模型、負(fù)二項(xiàng)模型這類傳統(tǒng)模型或選擇零膨脹模型[8,9]。Vuong統(tǒng)計(jì)量的計(jì)算如下。
f1、f2表示回歸模型的PDF。V≥1.96時(shí),模型應(yīng)選擇f1,V<-1.96則選擇f2,當(dāng)V在-1.96與1.96之間時(shí),說明倆模型均不是最優(yōu)模型。
3)模型擬合指標(biāo),包括AIC、AICC、BIC以及似然比值。數(shù)值越小,擬合效果越好。
1.陽性過敏原數(shù)分布
研究對(duì)象陽性過敏原數(shù)分布情況如表1,0值比例占總例數(shù)的79.41%,其它陽性過敏原數(shù)的比例均較小。
表1 陽性過敏原數(shù)分布
2.變量賦值
本研究自變量的一般情況包括性別、年齡、文化程度、生活地區(qū)、體質(zhì)指數(shù);疾病家族史情況如父親過敏、母親過敏、自身過敏史;生活飲食因素有鍛煉、吸煙、被動(dòng)吸煙、飲酒、生冷食物、油炸食物、辛辣食物、高鹽食物。其中,年齡、體質(zhì)指數(shù)為連續(xù)型變量,文化程度為等級(jí)變量,其余均為二分類變量。變量賦值見表2。
3.最優(yōu)模型的選擇
(1)零膨脹檢驗(yàn)結(jié)果:
表2 變量賦值說明
(2)過離散檢驗(yàn)結(jié)果:
(3)擬合指標(biāo)結(jié)果
運(yùn)用SAS9.1軟件,PROC NLM IXED語句進(jìn)行分析,模型收斂給出四個(gè)擬合指標(biāo):-2LL、AIC、AICC、BIC,各模型擬合指標(biāo)情況見表3。
表3 各模型的擬合指標(biāo)
綜合(1)(2)(3)可知,數(shù)據(jù)零膨脹、過離散,綜合擬合指標(biāo),零膨脹負(fù)二項(xiàng)模型擬合效果較好,選取零膨脹模型為最優(yōu)模型,利用零膨脹負(fù)二項(xiàng)模型進(jìn)行影響因素回歸分析。
4.零膨脹負(fù)二項(xiàng)回歸分析結(jié)果
零膨脹負(fù)二項(xiàng)回歸分析模型包括兩部分,Logit部分和負(fù)二項(xiàng)部分。兩部分參數(shù)初始值設(shè)定依據(jù)為:根據(jù)單因素Logistic回歸分析設(shè)定Logit部分參數(shù)初始值,根據(jù)負(fù)二項(xiàng)回歸設(shè)定負(fù)二項(xiàng)部分參數(shù)初始值。以陽性過敏原數(shù)為應(yīng)變量,表2中變量為解釋變量,進(jìn)行零膨脹負(fù)二項(xiàng)回歸分析。零膨脹負(fù)二項(xiàng)回歸分析Logit部分與負(fù)二項(xiàng)部分結(jié)果分別見表4和表5。參數(shù)意義:Logit部分是以0的發(fā)生為響應(yīng)概率,與Logistic回歸分析參數(shù)意義相同,但正負(fù)相反,參數(shù)可以體現(xiàn)因素是否影響事件的發(fā)生,即本研究中是否具有陽性過敏原。負(fù)二項(xiàng)部分的參數(shù)體現(xiàn)因素影響事件發(fā)生數(shù)的多少,參數(shù)為正,表示隨自變量值變大,應(yīng)變量變大,即陽性過敏原數(shù)更多。
表4 零膨脹負(fù)二項(xiàng)回歸分析Logit部分結(jié)果
零膨脹負(fù)二項(xiàng)回歸分析Logit部分有統(tǒng)計(jì)學(xué)意義的因素有生活地區(qū)和吸煙,生活在城市相對(duì)于農(nóng)村易出現(xiàn)陽性過敏原,吸煙易出現(xiàn)陽性過敏原;零膨脹負(fù)二項(xiàng)回歸分析負(fù)二項(xiàng)部分有統(tǒng)計(jì)學(xué)意義的因素有性別、過敏史和辛辣食物,男性相對(duì)于女性出現(xiàn)陽性過敏原數(shù)更多,有過敏史、不喜好辛辣食物的人出現(xiàn)陽性過敏原數(shù)更多。
表5 零膨脹負(fù)二項(xiàng)回歸分析負(fù)二項(xiàng)部分結(jié)果
相對(duì)于Logistic回歸分析,零膨脹模型從陽性過敏原數(shù)角度研究過敏反應(yīng)的影響因素,能更充分地利用數(shù)據(jù)的有效信息;相對(duì)于傳統(tǒng)的Possion、負(fù)二項(xiàng)回歸分析,零膨脹模型解決了數(shù)據(jù)的零膨脹問題。有模擬數(shù)據(jù)研究,當(dāng)0頻數(shù)比例大于70%時(shí)零膨脹負(fù)二項(xiàng)模型擬合效果優(yōu)于其它模型[10]。在本研究中0頻數(shù)為79.41%,綜合過離散、零膨脹檢驗(yàn)以及擬合指標(biāo)結(jié)果,選取零膨脹負(fù)二項(xiàng)回歸模型為最優(yōu)模型。
城市人口數(shù)量不斷增多、工業(yè)化腳步進(jìn)展加快、空氣質(zhì)量下降、含有有機(jī)化學(xué)物的現(xiàn)代化建筑材料使用廣泛,易釋放大量有害物質(zhì),會(huì)對(duì)身體產(chǎn)生刺激作用,引起過敏反應(yīng),生活在城市發(fā)生過敏反應(yīng)的危險(xiǎn)性高。相關(guān)研究表明吸煙有增加過敏風(fēng)險(xiǎn)的傾向[11]。吸煙時(shí)煙霧中的一氧化碳、尼古丁、煙焦油等有害物質(zhì)不僅對(duì)人體會(huì)產(chǎn)生理化損傷,同時(shí)還會(huì)刺激人體過敏反應(yīng),導(dǎo)致過敏癥狀出現(xiàn)。本研究顯示生活在城市相對(duì)于農(nóng)村易出現(xiàn)陽性過敏原,吸煙易出現(xiàn)陽性過敏原。
有關(guān)過敏性疾病的病例對(duì)照研究報(bào)道,女性是過敏反應(yīng)發(fā)生的保護(hù)因素;也有過敏原皮試研究,男性的陽性率明顯高于女性[12]。有過敏史的人容易疾病反復(fù)、病情加重,控制不好很容易合并多種物質(zhì)過敏。葉世泰主編的變態(tài)反應(yīng)學(xué)一書中從免疫學(xué)角度總結(jié),有過敏史的人形成特異性IgE的能力往往較高[13],陽性過敏原數(shù)較多。辛辣食物中辣椒VC含量高,可以增加人體免疫系統(tǒng)功能;洋蔥大蒜具有抗炎癥作用,可預(yù)防過敏反應(yīng)發(fā)生;姜能減輕過敏引起的炎癥,可以有效緩解過敏癥狀。
1.Johnson NL,Kotz S.Houghton M ifflin.Boston.Distributions in Statistics:Discrete Distributions,1969.
2.Lambert D.Zero-inflated Poisson Regression w ith an Application to Defects in Manufacturing.Technometrics,1992,34:1-14.
3.GreeneW.Accounting for excess zeros and sample selection in Poisson and negative binom ial regression models.Department of Econom ics,Stern School of Business:New York University,1994.
4.趙晶,張莉華,關(guān)媛媛,等.速發(fā)型超敏反應(yīng)疾病影響因素病例對(duì)照研究.中國(guó)公共衛(wèi)生,2013,29(5):654-656.
5.曾平,劉桂芬,曹紅艷.零膨脹模型在心肌缺血節(jié)段數(shù)影響因素研究中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(5):464-466.
6.JosePh M,Hilbe.Negative Binom ial Regression.London:Cambridge Univ Pr,2007:77-96,173-177.
7.Ceppi M,Biasotti B,F(xiàn)enech M,et al.Human Population studies w ith the exfoliated buccalm icronucleus assay:statistical and epidem iological issues.Mutat Res,2010,705(1):11-9.
8.Yau KK,Lee AH,Carrivick PJ.Modeling zero-inflated count series w ith Application to occupational health.Computer Methods Programs Biomedicine,2004,74(l):47-52.
9.Riccardo E,Marionia1,F(xiàn)iona E.Matthews and Carol Brayne.The association between late-life Cognitive test scores and retrospective informant interview data.Int Psychogeriatr,2011,23(2):274-279.
10.徐濤.零頻數(shù)過多資料的統(tǒng)計(jì)學(xué)模型應(yīng)用研究.北京:北京協(xié)和醫(yī)學(xué)院,2011.
11.Nagasaki T,Matsumoto,Nakaji H,et al.Smoking attenuates the age-related decrease in IgE levels and maintains eosinophilic inflammation. Clin Exp Allergy,2013,4(6):608-615.
12.趙玉霞,康健,于潤(rùn)紅.沈陽郊區(qū)農(nóng)民過敏原皮試反應(yīng)陽性率性別差異.中國(guó)公共衛(wèi)生,2000,16(5):471.
13.葉世泰.變態(tài)反應(yīng)學(xué).北京:科學(xué)出版社,1998,38.
(責(zé)任編輯:丁海龍)
國(guó)家重大專項(xiàng)課題(2011ZX08011-005)
△通信作者:劉美娜,E-mail:liumeina369@163.com