徐 香,蔣 娟,朱家明
(1.安徽蚌埠第四人民醫(yī)院,安徽 蚌埠 233010;2.蘭州大學(xué),甘肅 蘭州 730000;3.安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
十九大報(bào)告提出“要像對待生命一樣對待生態(tài)環(huán)境,保護(hù)好生態(tài)環(huán)境就是保護(hù)未來”。生態(tài)環(huán)境的不斷惡化,會(huì)導(dǎo)致一系列空氣污染等現(xiàn)象的發(fā)生,例如PM2.5濃度增高,會(huì)導(dǎo)致各類過敏性疾病的發(fā)生,譬如皮膚過敏、呼吸道過敏、消化道過敏等。過敏性疾病是機(jī)體因變態(tài)反應(yīng)而出現(xiàn)的臨床表現(xiàn)各異的一類免疫反應(yīng)性疾病,包括過敏性鼻炎、支氣管哮喘、蕁麻疹、過敏性結(jié)膜炎等[1],且從新生兒到老年人的各個(gè)年齡階段都可能發(fā)生,往往具有明顯的遺傳傾向。在過敏性疾病中,以速發(fā)型過敏反應(yīng)比較常見,其主要類型有皮膚過敏反應(yīng)、呼吸道過敏反應(yīng)、消化道過敏反應(yīng)及過敏性休克[1]。本文通過對過敏性疾病的相關(guān)影響因素分析,為預(yù)防過敏反應(yīng)及過敏性疾病的治療提供可靠依據(jù),從而有效降低過敏性疾病發(fā)病率。同時(shí)結(jié)合相關(guān)生態(tài)環(huán)境指標(biāo),分析生態(tài)環(huán)境對過敏性疾病發(fā)病率的影響,為相關(guān)政府部門和廣大市民朋友提供合理的建議。
數(shù)據(jù)來源于中國醫(yī)學(xué)臨床案例。為便于解決問題,提出以下假設(shè):⑴假設(shè)數(shù)據(jù)中兒科、耳鼻喉科、呼吸科和皮膚科的患者均是由于自身患有過敏性疾病而進(jìn)行過敏原檢測;⑵假設(shè)數(shù)據(jù)給出的過敏程度可以近似取整,如過敏程度“5(4+)”可近似等于“5”。
劉妍妍等[2]應(yīng)用Hurdle模型分析了具有零膨脹數(shù)據(jù)陽性過敏原數(shù)的影響因素,為預(yù)防過敏反應(yīng)及過敏性疾病提供依據(jù)。羅宇陽等[3]通過采用Logistic回歸分析法探討了南寧市0~24個(gè)月嬰幼兒過敏性疾病的臨床特征及相關(guān)影響因素。崔一帆等[4]采用單因素分析以及Logistic回歸,分析兒童過敏性鼻炎的危險(xiǎn)因素,得出2016年來院就診兒童過敏性鼻炎排名前五位的過敏原。以上研究通過采用不同方法,得出過敏性疾病的相關(guān)影響因素并且為過敏反應(yīng)的預(yù)防提供依據(jù)。G Melioli等[5]通過對不同年齡段過敏性疾病患兒的橫截面研究顯示,食物過敏原特異性IgE(免疫球蛋白E)在幼兒出生早期(2歲以內(nèi))即可從血清檢出,其主要為牛奶和雞蛋,而后期吸入性過敏原特異性IgE逐漸出現(xiàn)且穩(wěn)定。S.P.Nissen等[6]發(fā)現(xiàn)嬰兒早期食物過敏原的致敏率最高,而后期吸入占據(jù)主要地位[7]。以上研究均發(fā)現(xiàn)過敏原隨年齡而變化的規(guī)律,且在血清特異性IgE[8]這個(gè)I型速發(fā)過敏反應(yīng)的標(biāo)志物上發(fā)生變化。
(1)科室分類。通過查閱相關(guān)醫(yī)學(xué)文獻(xiàn),將原數(shù)據(jù)表中科室類別重新分為:兒科、呼吸科、耳鼻喉科、皮膚科、其他科[9]。
(2)設(shè)置其他過敏原。對于前來問診但致病過敏原未知的病人,設(shè)置其他過敏原項(xiàng)。
(3)對過敏疾病分類。首先將所給某醫(yī)院過敏原檢測數(shù)據(jù)依據(jù)科室這一指標(biāo)進(jìn)行過敏性疾病類型的分類,根據(jù)各科室的所占權(quán)重大小將過敏性疾病分成5類:兒科、耳鼻喉科、呼吸科、皮膚科以及其他科,由公式pi=ni/∑ni, 可計(jì)算出各科室出診頻率分別為:兒科0.074,耳鼻喉科0.076,呼吸科0.275,皮膚科0.375,其他科0.2。
(4)對性別的處理。由于性別只有男和女兩種情況,故將性別設(shè)置為虛擬變量,引入0/1,將男性患者設(shè)為1,女性患者設(shè)為0。
(5)對季節(jié)的處理。將一年四個(gè)季節(jié)引入春、夏、秋這3個(gè)虛擬變量,并設(shè)置具有該性質(zhì)為1,否則為0。
(6)對過敏原檢測結(jié)果處理。因數(shù)據(jù)來源中未對調(diào)查結(jié)果作出明確解釋,根據(jù)檢測的IgE濃度[10],可將0~6級過敏原轉(zhuǎn)換為具體分?jǐn)?shù),見表1。
表1 特異性濃度對應(yīng)級別
(7)對年齡處理。將年齡段按5年作為組距,將2 284名過敏患者按組分為20組,分別統(tǒng)計(jì)每組患者數(shù)。
(1)將4年的就診數(shù)據(jù)按照365為量度,使日期數(shù)據(jù)轉(zhuǎn)化為一年中對應(yīng)的天數(shù),作為時(shí)間對過敏性疾病影響因素的相關(guān)數(shù)據(jù);(2)將科室分為5類科室,按照季度,分別對每個(gè)科室的就診量進(jìn)行計(jì)數(shù),作為季節(jié)影響的數(shù)據(jù)基礎(chǔ);(3)統(tǒng)計(jì)各科室的男女就診情況的數(shù)據(jù),作為性別影響因素的數(shù)據(jù)基礎(chǔ);(4)用20組分類的年齡數(shù)據(jù)分別對不同科室的就診量進(jìn)行計(jì)數(shù),作為年齡影響因素的相關(guān)數(shù)據(jù)。通過運(yùn)用Excel、MATLAB等繪制不同類型過敏性疾病與各影響因素之間的散點(diǎn)圖、柱狀圖等,根據(jù)所得結(jié)果進(jìn)行描述性分析。
(1)過敏性疾病與時(shí)間的相關(guān)關(guān)系
運(yùn)用MATLAB對所收集的數(shù)據(jù)進(jìn)行初步處理,把日期時(shí)間通過365天/年的刻度單位化作為x軸,將就診病人的年齡作為y軸繪出5類科室出診次數(shù)散點(diǎn)圖,如圖1所示。
圖1 各科室出診頻率分布散點(diǎn)
由圖1可知,耳鼻喉科和呼吸科在0~50 d、250~365 d之間出診頻率較高,在100~250 d之間較低??傮w上而言,過敏性疾病發(fā)病頻率夏季與秋冬對比,在夏季明顯降低。
(2)過敏性疾病與季節(jié)的相關(guān)關(guān)系(圖2~3)
圖2 不同季節(jié)各科室出診次數(shù) 圖3 不同季節(jié)各科室出診頻率
由圖2可知,全年各季節(jié)皮膚科就診人數(shù)相較于其它科室最多,耳鼻喉科最少。在春夏交替之時(shí),由于草木生長以及花粉的傳播,呼吸科就診的人數(shù)明顯呈現(xiàn)上升趨勢;在秋冬交替之時(shí),就診人數(shù)呈現(xiàn)下降趨勢。其余科室就診人數(shù)全年無明顯波動(dòng)變化。由圖3可知,夏季過敏性疾病發(fā)病率明顯高于冬季,春秋無明顯區(qū)別??梢钥闯觯つw科就診人數(shù)比例在5個(gè)科室中占比最高且四季無明顯波動(dòng)。
(3)過敏性疾病與性別的相關(guān)關(guān)系(圖4)
圖4 各科室男女就診人數(shù)
由圖4可知,男性與女性在皮膚科方面的過敏性疾病發(fā)病人數(shù)有較大差別,女性更加容易患上皮膚性過敏疾病。同時(shí)可以看出其余4種科室出診次數(shù)無明顯波動(dòng)。
(4)過敏性疾病與年齡的相關(guān)關(guān)系(圖5)
圖5 各科室各年齡段就診人數(shù)
由圖5可知,嬰幼兒時(shí)期更加容易患上過敏性疾病,青少年時(shí)期發(fā)病率較低。在26~30、56~60年齡段之間更加容易患上皮膚性過敏疾病,年齡的大小與過敏性疾病存在一定的相關(guān)關(guān)系。橫向?qū)Ρ葋砜?,耳鼻喉性過敏性疾病發(fā)病率在不斷上升(例如鼻炎),皮膚過敏性疾病發(fā)病率最高,其次是呼吸道過敏疾病。
剔除科室就診結(jié)果為空的數(shù)據(jù),對不同的科室進(jìn)行分類,建立解釋變量時(shí)間、季節(jié)、性別與被解釋變量科室之間的函數(shù)關(guān)系。將皮膚科設(shè)為參考類別、性別以及季節(jié)作為因子、年齡作為協(xié)變量,建立多分類的Logistic回歸模型并求出模型,并以二元Logit回歸對兒科相關(guān)變量之間的關(guān)系進(jìn)行檢驗(yàn)。運(yùn)用SPSS和Eviews進(jìn)行求解,通過對運(yùn)行結(jié)果的分析,得出過敏性疾病與時(shí)間、季節(jié)、性別等之間的邏輯回歸方程并作出合理的解釋說明和相互論證。
多分類Logistic回歸模型。對于K個(gè)可能的分類結(jié)果,運(yùn)行K-1個(gè)獨(dú)立二元邏輯回歸模型,在運(yùn)行過程中把其中一個(gè)類別看成是主類別,然后將其它K-1個(gè)類別和我們所選擇的主類別分別進(jìn)行回歸。通過這樣的方式,如果選擇結(jié)果作為主類別,可以得到以下公式
(1)
對公式(1)左右兩邊進(jìn)行指數(shù)化處理得到
Pr(Yi=1)=Pr(Yi=K)eβ1xi,Pr(Yi=2)=Pr(Yi=K)eβ2xi,…,Pr(Yi=K-1)=Pr(Yi=K)eβK-1xi
(2)
其中βi(0<βi<1)為第i個(gè)變量的系數(shù),得到的概率必須加起來等于1,基于這個(gè)事實(shí)可以得到
(3)
將式(3)帶入到式(2)即可得到最終的結(jié)果表達(dá)式
(4)
對季節(jié)、性別、年齡分別引入0/1變量,且輸出類別為兒科:1,呼吸科:2,耳鼻喉科:3,皮膚科:4,其他科:5。為保證xi與輸出結(jié)果Pr(Yi)的一一對應(yīng)關(guān)系,在式(4)右邊xi乘以Yi,得到模型,見式(5)。
(5)
根據(jù)上述分析,運(yùn)用SPSS,分別以各發(fā)病頻率代替各過敏性疾病類型,并將其作為因變量,參考類別為皮膚科;將性別以及春、夏、秋3個(gè)虛擬變量作為因子;由于患者的年齡作為一個(gè)獨(dú)立變量,不受人為控制,但其數(shù)值仍影響著患病結(jié)果,所以將年齡作為協(xié)變量。進(jìn)行多元Logistic回歸,結(jié)果見表2。
表2 擬合優(yōu)度表
由表2可知,原假設(shè)模型能很好地?cái)M合原始數(shù)據(jù),最后一列皮爾遜卡方顯著性值0.996概率較大,原假設(shè)成立,說明模型對原始數(shù)據(jù)的擬合通過檢驗(yàn)。根據(jù)極大似然比檢驗(yàn)表,我們能看到最終進(jìn)入模型的效應(yīng)包括截距、年齡、性別、季節(jié),而且最后一列顯著性值均小于0.05,表明自變量對模型構(gòu)成均有顯著貢獻(xiàn),故根據(jù)參數(shù)估計(jì)值表得出如下模型:
W1=log[p(兒科/皮膚科)]=4.32-0.428x1-0.177x2-0.455x3-0.326x4-0.35x5W2=log[p(耳鼻喉科/皮膚科)]=1.749-0.186x1-0.837x2-0.077x3-0.827x4-0.033x5W3=log[p(其他科/皮膚科)]=0.963-0.496x1-0.79x2-0.940x3-0.459x4-0.007x5W3=log[p(呼吸科/皮膚科)]=-0.354-0.2x1-0.185x2+0.075x3-0.234x4-0.009x5
首先,運(yùn)用Excel對數(shù)據(jù)進(jìn)行初步處理,匯總2013-2017年每年就診病人中各類過敏原致病人數(shù),再利用MATLAB多元回歸工具箱作出每一類由過敏原致病人數(shù)隨時(shí)間變化的多元回歸方程,并作出R2檢驗(yàn)。通過查閱大量文獻(xiàn)資料,將17種過敏原按照生態(tài)環(huán)境的因素進(jìn)行科學(xué)的分類,分為土壤類致病過敏原、空氣類致病過敏原、水資源類致病過敏原。隨后,按照過敏原的三大類分別找取與之對應(yīng)的三大類環(huán)境指標(biāo),并利用相關(guān)系數(shù)進(jìn)行判斷,挑選出與之相關(guān)性程度最高的環(huán)境類指標(biāo)。最后,運(yùn)用灰度預(yù)測模型預(yù)測未來幾年各類過敏原發(fā)病率及環(huán)境因素,再次求出兩者間的相關(guān)系數(shù),檢驗(yàn)是否依然存在合理可靠的相關(guān)關(guān)系。
過敏原檢測結(jié)果變化趨勢。利用Excel進(jìn)行統(tǒng)計(jì)分析,考慮到過敏程度,我們采用求和的方式,統(tǒng)計(jì)匯總得出2013-2017年就診病人中各類過敏原致病人數(shù),并由此得出各類過敏原致病人數(shù)隨時(shí)間變化的多元回歸模型并給出檢驗(yàn)系數(shù)。具體結(jié)果見表3。
表3 過敏原變化趨勢擬合方程
環(huán)境保護(hù)指標(biāo)的選取。根據(jù)查閱的大量文獻(xiàn)資料進(jìn)行綜合考慮,將17種過敏原按受生態(tài)環(huán)境影響因素進(jìn)行科學(xué)的分類[11],最終分為土壤類致病過敏原、空氣類致病過敏原、水資源類致病過敏原3類。具體分類結(jié)果見圖6。
圖6 致病過敏原分類結(jié)果
通過查閱環(huán)境保護(hù)文獻(xiàn)分別選取2個(gè)土壤類環(huán)境保護(hù)指標(biāo):污水排放總量、降水量;2個(gè)空氣類環(huán)境保護(hù)指標(biāo):煙粉塵排放總量、PM2.5;1個(gè)水資源類環(huán)境保護(hù)指標(biāo):廢水主要污染物排放量。查閱相關(guān)數(shù)據(jù)結(jié)果見表4。
表4 環(huán)保指標(biāo)數(shù)據(jù)
將5個(gè)環(huán)境指標(biāo)分別與過敏原指標(biāo)進(jìn)行相關(guān)分析,得出污水排放總量與大多數(shù)過敏原檢測結(jié)果相關(guān),故選取污水排放總量這一環(huán)境保護(hù)指標(biāo)進(jìn)行相關(guān)分析。
相關(guān)性分析:將過敏原指標(biāo)和環(huán)保指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,用相關(guān)系數(shù)法求得兩者之間的相關(guān)性見表5。
表5 相關(guān)系數(shù)
分析可知,除了貓毛、狗上皮、雞蛋白和蝦以外,污水排放總量這一指標(biāo)與其余13個(gè)過敏原指標(biāo)之間均呈現(xiàn)較強(qiáng)的正相關(guān)關(guān)系。
根據(jù)2013-2017年的相關(guān)數(shù)據(jù),利用灰色預(yù)測法預(yù)測出2018年過敏原各項(xiàng)指標(biāo)和5項(xiàng)環(huán)保指標(biāo),如見表6。
表6 2018年數(shù)據(jù)預(yù)測
根據(jù)2018年數(shù)據(jù)預(yù)測表,用2013-2018總計(jì)6年的數(shù)據(jù)做回歸分析和相關(guān)關(guān)系矩陣的求解,得到的結(jié)果可以看出,預(yù)測結(jié)果與原來結(jié)果具有一致性。
多分類的Logisitic回歸在醫(yī)學(xué)領(lǐng)域有著及其重要的地位和影響力。本文采用定量與定性相結(jié)合的方法,運(yùn)用醫(yī)學(xué)領(lǐng)域常用的多分類Logistics回歸模型進(jìn)行分析,提高了所求變量間相關(guān)性的準(zhǔn)確程度[12]。根據(jù)過敏程度評分標(biāo)準(zhǔn),我們將過敏等級(1-6)轉(zhuǎn)化為檢測得分(1-100分),使得原始變量變?yōu)檫B續(xù)性變量,有效區(qū)分了不同過敏程度之間的差異性,使得結(jié)果更加準(zhǔn)確合理。運(yùn)用SPSS,Eviews,MATLAB等多種數(shù)學(xué)軟件進(jìn)行計(jì)算,取長補(bǔ)短,使計(jì)算結(jié)果更加準(zhǔn)確[13]?;谶^敏原多影響因素分析模型的推廣,將時(shí)間、季節(jié)、年齡、性別與過敏原致病類別進(jìn)行邏輯回歸,得到了兩兩間的定量相關(guān)關(guān)系,對今后分析不同類型疾病的病人過敏原檢測結(jié)果之間的差異及環(huán)境對致病概率的影響提供了理論基礎(chǔ)[14]。
河北北方學(xué)院學(xué)報(bào)(自然科學(xué)版)2021年5期