,,,,
(1. 中國(guó)動(dòng)物衛(wèi)生與流行病學(xué)中心,山東青島 266032;2. 青島農(nóng)業(yè)大學(xué),山東青島 266109)
豬鏈球菌2型毒力預(yù)測(cè)模型的建立
劉麗蓉1,單 虎2,康京麗1,李 印1,王幼明1
(1. 中國(guó)動(dòng)物衛(wèi)生與流行病學(xué)中心,山東青島266032;2. 青島農(nóng)業(yè)大學(xué),山東青島266109)
[目的]建立豬鏈球菌2型毒力強(qiáng)弱的預(yù)測(cè)模型,為降低養(yǎng)豬業(yè)的經(jīng)濟(jì)損失提供參考。[方法]本研究以已報(bào)道的國(guó)內(nèi)豬鏈球菌2型分離株的6種主要毒力因子(mrp、epf、sly、orf2、fbps、gapdh)的存在情況為自變量,以毒力強(qiáng)弱為因變量,采用逐步回歸的方法進(jìn)行二分類(lèi)Logistic回歸分析,得出鑒別豬鏈球菌2型毒力強(qiáng)弱的數(shù)學(xué)模型,并通過(guò)ROC曲線評(píng)價(jià)其預(yù)測(cè)效能。[結(jié)果]進(jìn)入回歸方程的指標(biāo)有:mrp(X1)和sly(X3),求得的回歸方程為:P=1/〔1+e-(-5.671+4.642 X1+4.253X3)〕。ROC曲線最佳診斷點(diǎn)為0.5581?;貧w方程對(duì)毒力強(qiáng)弱預(yù)測(cè)的敏感度為93.8%,特異度為94.6%,準(zhǔn)確度為94%。[結(jié)論]聯(lián)合運(yùn)用Logistic回歸和ROC曲線預(yù)測(cè)豬鏈球菌2型毒力的強(qiáng)弱是可行的,mrp和sly 兩個(gè)指標(biāo)獨(dú)立應(yīng)用對(duì)鑒別都有診斷價(jià)值,但二者聯(lián)合起來(lái)診斷價(jià)值更高且預(yù)測(cè)效果更理想。
豬鏈球菌2型;毒力因子;SPSS;Logistic;ROC;Wald檢驗(yàn);模型
豬鏈球菌是一種危害現(xiàn)代養(yǎng)豬業(yè)的重要病原,這在養(yǎng)豬業(yè)發(fā)達(dá)的國(guó)家都有報(bào)道[1]。根據(jù)莢膜抗原成分的差異,豬鏈球菌可分為35個(gè)血清型,其中豬鏈球菌2型流行最為廣泛、致病性最強(qiáng),不僅能引起豬關(guān)節(jié)炎、腦膜炎、肺炎、敗血癥及豬只的突然死亡,導(dǎo)致養(yǎng)豬業(yè)巨大的經(jīng)濟(jì)損失;而且還能致人發(fā)病死亡,對(duì)公共衛(wèi)生尤其是從業(yè)人員的生命安全構(gòu)成了嚴(yán)重威脅,是一種危害嚴(yán)重的人畜共患病病原。豬鏈球菌2型與豬的臨床疾病有一定的相關(guān)性,但并不是所有的2型菌株都具有致病性,部分毒株對(duì)豬毒力較弱。研究表明,豬鏈球菌致病性強(qiáng)弱與毒力因子密切相關(guān)[2],主要包括溶菌酶釋放蛋白(mrp)、胞外因子(epf)、溶血素(sly)、甘油醛-3-磷酸脫氫酶(gapdh)、纖連蛋白/血纖蛋白原結(jié)合蛋白(fbps)、毒力相關(guān)序列(orf2)、其他毒力因子等,其中mrp、epf 和 sly 是豬鏈球菌2 型菌株的主要毒力因子。
本研究旨在構(gòu)建鑒別豬鏈球菌2型毒力強(qiáng)弱的Logistic回歸模型,綜合利用多項(xiàng)測(cè)量得出鑒別豬鏈球菌2型毒力強(qiáng)弱的數(shù)學(xué)模型。為及時(shí)、準(zhǔn)確地預(yù)測(cè)我國(guó)豬鏈球菌2型的流行趨勢(shì),制定合理有效的防控措施提供科學(xué)依據(jù),進(jìn)一步保障相關(guān)從業(yè)人員的健康奠定科學(xué)基礎(chǔ)。
收集匯總以往已發(fā)表及本單位現(xiàn)有的關(guān)于中國(guó)地區(qū)豬鏈球菌2型6種主要毒力因子:溶菌酶釋放蛋白(mrp)、胞外因子(epf)、溶血素(sly)、甘油醛-3-磷酸脫氫酶(gapdh)、纖連蛋白和血纖蛋白原的結(jié)合蛋白(fbps)和毒力相關(guān)序列(orf2)的PCR鑒定結(jié)果情況[3-6]。
2.1 Logistic回歸模型的建立
以6種毒力因子mrp(X1)、epf(X2)、sly(X3)、gapdh(X4)、fbps(X5)和orf2(X6)為自變量,自變量分為陰性組和陽(yáng)性組,分別賦值0和1,毒力強(qiáng)弱為因變量,應(yīng)用SPSS17.0軟件進(jìn)行統(tǒng)計(jì)分析。P<0.05認(rèn)為具有統(tǒng)計(jì)學(xué)顯著性。得到Logistic回歸方程,并在SPSS工作數(shù)據(jù)表中產(chǎn)生含各個(gè)體的預(yù)測(cè)值,然后以每個(gè)個(gè)體的預(yù)測(cè)值組成新變量Pre(predicted probability-1)進(jìn)行ROC分析。
2.2 應(yīng)用ROC曲線評(píng)價(jià)各指標(biāo)對(duì)豬鏈球菌2型毒力強(qiáng)弱的預(yù)測(cè)能力
分別以新變量為檢驗(yàn)變量,以毒力強(qiáng)弱為金標(biāo)準(zhǔn),作ROC曲線分析,得出各檢驗(yàn)變量的曲線下面積(area under the curve,AUC)。
2.3 確定最佳診斷點(diǎn)
根據(jù)臨床實(shí)際,確定所要求的真陽(yáng)性率(或假陽(yáng)性率),使用線性內(nèi)插法求出診斷點(diǎn)。R=x 為設(shè)定的假陽(yáng)性率(或真陽(yáng)性率),P(R=x)為(R=x)對(duì)應(yīng)的診斷點(diǎn),R1為恰好小于(R=x)的假陽(yáng)性率(或真陽(yáng)性率),R2為恰好大于(R=x)的假陽(yáng)性率(或真陽(yáng)性率),P1和 P2分別為R1和R2對(duì)應(yīng)的診斷點(diǎn),根據(jù)線性內(nèi)插法有:
(R1-R2):〔R1-(R=x)〕=(P1- P2):〔P1-P(R=x)〕(1)
3.1 數(shù)據(jù)收集情況
共收集到豬鏈球菌2型117株,其中強(qiáng)毒80株,弱毒37株。毒力因子的分布情況統(tǒng)計(jì)見(jiàn)表1。
表 1 毒力因子分布情況
3.2 Logistic回歸分析結(jié)果和數(shù)學(xué)模型的建立
多因素Logistic回歸分析結(jié)果詳見(jiàn)表2:進(jìn)入回歸方程的指標(biāo)有mrp(X1)、epf(X2)、sly(X3)、gapdh(X4)、fbps(X5)和orf2(X6)。對(duì)引入方程中的每個(gè)自變量偏相關(guān)系數(shù)進(jìn)行統(tǒng)計(jì)檢驗(yàn),即回歸系數(shù)的Wald檢驗(yàn)。
回歸系數(shù)的Wald檢驗(yàn)(顯著性水平為P<0.05):
表 2 多因素logistic回歸分析步驟
從表2可以看出,步驟1中g(shù)apdh的Wald檢驗(yàn)概率p值最大,且大于顯著性水平,不應(yīng)拒絕原假設(shè),認(rèn)為該回歸系數(shù)與0無(wú)顯著差異,它與logitP的線性關(guān)系是不顯著的,不應(yīng)保留在方程中。由于方程中包含了不顯著的解釋變量,考慮重新建模。
同理,步驟2中epf的Wald檢驗(yàn)概率p值最大,且大于顯著性水平,考慮重新建模;步驟3中orf2的Wald檢驗(yàn)概率p值最大,且大于顯著性水平,考慮重新建模;步驟4中fbps的Wald檢驗(yàn)概率p值最大,且大于顯著性水平,考慮重新建模。直至步驟4中各自回歸系數(shù)顯著性檢驗(yàn)的Wald觀測(cè)值對(duì)應(yīng)的概率p值均小于顯著性水平0.05,意味著他們都應(yīng)保留在方程中。
OR值較大的指標(biāo)為mrp,說(shuō)明其對(duì)預(yù)測(cè)豬鏈球菌2型強(qiáng)毒株的價(jià)值最大,求得出的Logistic回歸方程為:P=1/〔1+e-(-5.671+4.642 X1+4.253 X3)〕。其中P代表預(yù)測(cè)概率,e為自然對(duì)數(shù)。
3.3 應(yīng)用ROC曲線評(píng)價(jià)各種指標(biāo)對(duì)豬鏈球菌2型毒力強(qiáng)弱的預(yù)測(cè)能力。
由SPSS17.0輸出的預(yù)測(cè)概率Pre 、mrp(X1)和sly(X3)的ROC曲線下面積(AUC)如表3所示。結(jié)果顯示當(dāng)兩種因素單獨(dú)檢測(cè)時(shí)sly的AUC大于mrp的AUC;而兩種因素聯(lián)合Pre的AUC 均大于各單項(xiàng)檢測(cè)的AUC(ROC曲線如圖1所示),且其檢測(cè)敏感度和特異度比單項(xiàng)檢測(cè)的高。
表 3 Pre、mrp和sly的曲線下面積、敏感度、特異度和95%置信區(qū)間
圖 1 ROC曲線
3.4 確定診斷點(diǎn)
從SPSS輸出的表中查得Pre的ROC曲線坐標(biāo)點(diǎn)如表4所示。
表 4 Pre的ROC曲線坐標(biāo)點(diǎn)
取假陽(yáng)性率R=10%(即取R=0.100)后設(shè)定診斷點(diǎn)。表4數(shù)據(jù)得出:R1=0.054,R2=0.378,P1=0.6125,P2=0.229,帶入公式(1)有:(0.054-0.378):(0.054-0.1)=(0.6125-0.229):〔0.6125-P(R=0.100)〕,可得P(R=0.100)=0.5581。
取假陽(yáng)性率R=10%后求得診斷點(diǎn)為0.5581。預(yù)測(cè)概率值大于或等于0.5581判為陽(yáng)性(即診斷為強(qiáng)毒株),反之為陰性。
根據(jù)該臨界值,強(qiáng)毒株80例中有75例判斷正確,5例判斷錯(cuò)誤;弱毒株37例中35例判斷正確,2例判斷錯(cuò)誤。求得數(shù)學(xué)模型對(duì)豬鏈球菌2型毒力強(qiáng)弱的敏感度為93.8%,特異度為94.6%,準(zhǔn)確度為94%。
4.1 SS2致病性強(qiáng)弱相關(guān)因素分析
研究表明,SS2中存在著一些與毒力相關(guān)的基因,特別是mrp、Sly和epf,這三種毒力因子的表達(dá)對(duì)鏈球菌 2 型菌株的毒力強(qiáng)弱起著決定作用,但決定毒力的主導(dǎo)基因存在地區(qū)差異[7],即在某些地區(qū)以 mrp或epf基因?yàn)橹鳎诹硪恍┑貐^(qū)則以sly 基因?yàn)橹鱗8]。本研究得出的預(yù)測(cè)模型僅以報(bào)道較多的6種毒力因子為致病性相關(guān)的風(fēng)險(xiǎn)因素,旨在從分子水平通過(guò)二手?jǐn)?shù)據(jù)分析,得出中國(guó)地區(qū)SS2毒力預(yù)測(cè)模型。其他與SS2致病性相關(guān)的因素,如帶菌狀態(tài)或其他毒力因子,因報(bào)道較少,很難納入模型中,是本研究的一個(gè)缺憾。
4.2 Logistic回歸分析與ROC曲線分析的意義及在本研究中運(yùn)用的發(fā)現(xiàn)
臨床上僅用一項(xiàng)檢查指標(biāo)進(jìn)行鑒別診斷是片面的、不合理的。許多研究證明,綜合利用多項(xiàng)檢測(cè)指標(biāo)進(jìn)行診斷,能大大提高診斷的準(zhǔn)確性和診斷效率,避免經(jīng)驗(yàn)判斷的主觀性,使得診斷更為科學(xué)化、客觀化[9-11]。Logistic回歸分析屬于概率型非線性回歸,它是研究二分類(lèi)觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法[12]。本研究中,因變量毒力強(qiáng)弱是一個(gè)二分類(lèi)的變量,即強(qiáng)毒與弱毒。采用Logistic回歸模型綜合分析多指標(biāo)變量對(duì)豬鏈球菌2型毒力強(qiáng)弱的診斷價(jià)值,證實(shí)了mrp和sly是診斷毒力強(qiáng)弱的兩個(gè)影響因素。
有很多研究利用多項(xiàng)指標(biāo)聯(lián)合檢測(cè)各種疾病時(shí),大多篩選3~5項(xiàng)指標(biāo),只要其中有一項(xiàng)以上指標(biāo)陽(yáng)性就歸為診斷符合,這種聯(lián)合診斷能提高靈敏度,但特異性下降。本研究通過(guò)繪制ROC曲線,并比較不同檢測(cè)指標(biāo)的曲線下面積(AUC),同時(shí)按照AUC 原則提供“診斷點(diǎn)”,以保證最大限度地區(qū)別豬鏈球菌2型毒力的強(qiáng)弱,用逐步后向Logistic 回歸擬合最佳曲線時(shí),結(jié)果保留mrp和sly 兩個(gè)指標(biāo),epf、gapdh、fbps和orf2(P>0.05)預(yù)測(cè)價(jià)值相對(duì)較小而被剔除。這樣得到的ROC曲線可以從幾何意義上直觀地反映模型擬合情況,通過(guò)曲線下面積定量反映Logistic 模型的擬合效果,以此更好地對(duì)模型優(yōu)度與實(shí)際資料的符合情況進(jìn)評(píng)價(jià)?;貧w方程的預(yù)測(cè)效果比較理想,其預(yù)測(cè)新變量Pre的ROC曲線下的面積(AUC=0.950)均比任何單一指標(biāo)的面積(AUCmrp=0.798,AUCsly=0.826)要大。求得的數(shù)學(xué)模型對(duì)豬鏈球菌2型毒力強(qiáng)弱預(yù)測(cè)的敏感度和特異度明顯高出各單項(xiàng)指標(biāo)預(yù)測(cè)的結(jié)果,Pre 敏感度為93.8%(mrp為97.5%,sly為95.0%),特異度為94.6%(mrp為62.2%,sly為70.3%),彌補(bǔ)了單一的靈敏度高、特異度低的缺陷。說(shuō)明該模型的預(yù)測(cè)效能較好,能預(yù)測(cè)豬鏈球菌2型毒力的強(qiáng)弱。
應(yīng)用Logistic回歸綜合多指標(biāo)信息,根據(jù)ROC曲線確定診斷界值,以達(dá)到同時(shí)提高診斷的敏感度和特異度,是本研究嘗試的一種新的診斷試驗(yàn)評(píng)價(jià)方法。該方法亦可應(yīng)用于其他疾病診斷試驗(yàn)的資料分析中,有著廣泛的應(yīng)用前景。
[1] 耿艷紅,徐軍,王兆山,等.豬鏈球菌病[J].豬業(yè)科學(xué),2005,22(6):30-104.
[2] 鄭升博,華修國(guó),陸偉芳,等.多重PCR方法檢測(cè)豬鏈球菌主要致病血清型及其毒力因子[J].上海交通大學(xué)學(xué)報(bào)(農(nóng)業(yè)科學(xué)版),2010,28(1):53-58.
[3] 何孔旺,倪艷秀,王繼春,等.豬鏈球菌2型的分子流行病學(xué)研究[J].中國(guó)人壽共患病雜志,2002,18(5):45-47.
[4] 馬青霞,何孔旺,陸承平.豬鏈球菌2型及其毒力因手檢測(cè)多重PCR的建立與應(yīng)用[J].中國(guó)獸醫(yī)學(xué)報(bào),2006,26(1):28-31.
[5] 白昀.廣西豬鏈球菌2型毒力因子的研究[D].廣西:廣西大學(xué),2008.
[6] 李春玲,余煒烈,王貴平,等.豬鏈球菌扁桃體分離株的毒力因子分布特征與致病性[J].中國(guó)預(yù)防獸醫(yī)學(xué)報(bào),2009,31(2):104-109.
[7] Gottschalk M,Lebrun A,Wisselink H J,et al. Production of muram inidase-released proteins by Canadian strains of Streptococcus suis capsular type 2 [J]. Can J Vet Res,1998,62:75-79.
[8] Wisselink H J,Smith H E,Stockhofe Z N,et al. Distribution of capsular types and production of muramidase released protein (MRP)and extracellular factor (EF) of Streptococcus suis strains isolated from diseased pigs in seven European countries [J]. Vet Microbiol,2000,74(3):237-248.
[9] 陳櫟江,張文輝,唐恩燕,等. Logistic回歸和ROC曲線分析多種腫瘤標(biāo)志物在鑒別良惡性胸水中的應(yīng)用價(jià)值[J].實(shí)用醫(yī)學(xué)雜志,2009,25(2):238-240.
[10] 劉寶利,楊寶友,鄭桂敏,等. Logistic回歸和ROC曲線綜合評(píng)價(jià)檢測(cè)四種尿蛋白排泄對(duì)早期腎小球疾病的診斷價(jià)值[J].中國(guó)中西醫(yī)結(jié)合腎病雜志,2011,12(8):695-697.
[11] 劉潤(rùn)幸.使用SPSS作多變量觀察值的ROC曲線分析[J].中國(guó)公共衛(wèi)生,2003,19(9):1151-1154.
[12] 孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].2版.北京:人民衛(wèi)生出版社,2005:333.
The Development of Virulence Prediction Model for Streptococcus Suis 2
Liu Lirong1,Shan Hu2,Kang Jingli1,Li Yin1,Wang Youming1
(1. China Animal Health and Epidemiology Center,Qingdao,Shandong 266032;
2. Qingdao Agriculture University,Qingdao,Shandong 266109)
To establish the prediction model of Streptococcus Suis 2 (SS2),and provide the theoryetical reference for reducing losses of pig farming,6 virulence factors of SS2 were selected as independent variables,including mrp,epf,sly,orf2,fbps and gapdh. And the pathogenicity was selected as dependent variables. 2-stage least squares was performed. Then ROC curve was used to evaluate the diagnostic eff ciency after regression model was constructed. The results showed that mrp and sly were remained in the regression model P=1/〔1+e-(-5.671+4.642X1+4.253X3)〕. The best diagnostic point was 0.5581. The sensitivity,specificity and accuracy of the regression equation to detect the pathogenicity of SS2 were 93.8%,94.6% and 94% respectively. These results indicated that it was feasible to use regression model and ROC curve in SS2 predicting. And joint using mrp and sly combined were more effective in diagnostic value for clinical screening than using them alone.
StreptococcusSuis 2;virulence factor;SPSS;Logistic;ROC;Wald test;model
S858.28
:C
:1005-944X(2014)11-0008-04
王幼明,單 虎