• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘的缺血性腦卒中患病風險預(yù)測

      2021-01-06 09:41:40侯玉梅曾慧張晨陽張重陽張利軍高秋燁
      中國老年學雜志 2021年1期
      關(guān)鍵詞:決策樹高脂血癥半胱氨酸

      侯玉梅 曾慧 張晨陽 張重陽 張利軍 高秋燁

      (燕山大學 1經(jīng)濟管理學院,河北 秦皇島 066004;2理學院;3秦皇島市第一人民醫(yī)院)

      在我國,腦卒中的死亡率遠高于世界平均水平,成為居民第一大死亡原因,每年死于腦卒中的患者達188萬〔1〕,是歐美等發(fā)達國家的4~5倍,甚至超越了發(fā)展中國家印度〔2〕。腦卒中的發(fā)病率也由1993年的0.40%上升至2013年的1.23%〔1〕,且以每年8.7%的速度持續(xù)增長;其再入院率大于30%,5年內(nèi)再現(xiàn)率高達54%。同時,腦卒中的患病人群具有年輕化的趨勢〔3〕。目前,腦卒中尚缺乏理想的治療方法,高危個體的早期發(fā)現(xiàn)成為腦卒中防治的關(guān)鍵。相關(guān)研究表明,采取合理規(guī)范的措施控制腦卒中的高危因素,可以延遲或減緩腦卒中的發(fā)生〔4〕。

      針對缺血性腦卒中,國外學者已經(jīng)構(gòu)建了穩(wěn)定的評分方法與預(yù)測模型〔5~10〕,其中專家普遍建議選擇改良的弗明漢腦卒中量表、匯集隊列方程、腦卒中風險計算器等工具進行缺血性腦卒中風險評估〔11〕,但是這些模型主要適用歐美人群,對我國人群的風險預(yù)測效果不佳。國內(nèi)學者更多是對腦卒中發(fā)病因素的探究〔12~15〕。本文利用數(shù)據(jù)挖掘的決策樹與Logistic回歸方法構(gòu)建預(yù)測模型,以此發(fā)掘缺血性腦卒中的發(fā)病規(guī)律,為腦卒中的提前干預(yù)與控制提供依據(jù)。

      1 資料與方法

      1.1資料來源 研究資料來源于河北省合作醫(yī)院開展的居民腦卒中基線調(diào)查數(shù)據(jù)。研究對調(diào)查范圍內(nèi)居民進行長期隨訪來收集數(shù)據(jù),平均隨訪時間為18個月。缺血性腦卒中數(shù)據(jù)來自于隨訪時期內(nèi)出現(xiàn)缺血性腦卒中疾病的患者檔案。非腦卒中數(shù)據(jù)從同一調(diào)查中,抽取無心腦血管疾病的健康人群檔案作為調(diào)查樣本。

      本研究收集的有效樣本數(shù)據(jù)共計1 288例,包括缺血性腦卒中患者數(shù)據(jù)567例,非患者數(shù)據(jù)721例。其中,男性624例(48.4%),女性664例(51.6%),平均年齡(56.30±16.89)歲。調(diào)查內(nèi)容主要涉及:性別、職業(yè)、年齡、心臟病史、高血壓史、糖尿病史、家族史、吸煙史、飲酒史、高同型半胱氨酸癥史、高脂血癥史、高尿酸癥史、動脈粥樣硬化史、頸動脈狹窄史、體重指數(shù)(BMI)、心率、呼吸頻率、收縮壓、舒張壓、腹型狀況、精神狀況。調(diào)查數(shù)據(jù)以最后一次調(diào)查時獲取的資料為參考依據(jù)。

      1.2研究方法 ①數(shù)據(jù)預(yù)處理:數(shù)據(jù)清洗:對原始數(shù)據(jù)集進行整理分析;剔除原始數(shù)據(jù)集中診斷不明,或患有缺血性腦卒中疾病但缺失重要資料而無法配合研究的數(shù)據(jù)。對于超出合理范圍的取值用指定值替代;填補原始數(shù)據(jù)集中的空缺值,標稱空缺值用眾數(shù)代替,體重空缺值參考國際標準體重計算方法,其余空缺值用平均數(shù)代替。

      數(shù)據(jù)變換:將原始數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的,適合用于再處理的數(shù)據(jù)。變換后的數(shù)據(jù)可以提高挖掘的有效性和準確性。如:參照世界衛(wèi)生組織訂立的標準將身高、體重轉(zhuǎn)換為BMI,變換后的BMI為中立可靠的指標,具有參考價值。

      變量說明:吸煙史根據(jù)世界衛(wèi)生組織(WHO)慢性病調(diào)查問卷定義,每天至少吸1支煙,且持續(xù)或累計1年以上;飲酒史定義,每周至少飲酒1次,且持續(xù)或累計6個月以上。

      ②算法選擇:本文采用數(shù)據(jù)挖掘的決策樹算法與Logistic回歸算法構(gòu)建預(yù)測模型,Logistic回歸算法是預(yù)測自變量與因變量之間關(guān)系的新型回歸技術(shù),規(guī)避了傳統(tǒng)回歸中過于嚴格的問題;決策樹算法是一種新的多因素分析方法,決策樹構(gòu)建的模型結(jié)果簡單,易于解釋,且決策樹分析對于數(shù)據(jù)的分布沒有要求。

      ③算法實現(xiàn):本研究中兩種算法均由SPSS23.0統(tǒng)計軟件實現(xiàn),其中,Logistic回歸算法以是否患缺血性腦卒中(是=0,否=1)為因變量,其余樣本變量為協(xié)變量,篩選缺血性腦卒中患病相關(guān)性變量。以P<0.05具有統(tǒng)計學意義,然后將篩選出來的相關(guān)性變量納入Logistic回歸中構(gòu)建預(yù)測模型。決策樹算法采用CHAID卡方自動交互法建立,在篩選缺血性腦卒中患病影響因素主效應(yīng)的同時構(gòu)建交互項,最終將主效應(yīng)與交互項納入回歸算法中再次篩選,同時構(gòu)建缺血性腦卒中患病風險預(yù)測模型。

      將上述構(gòu)建的兩個模型進行對比分析,以預(yù)測概率為評判標準驗證模型的準確率,進行受試者工作特征(ROC)曲線預(yù)測程度擬合。研究中變量賦值及人口統(tǒng)計學特征見表1。

      表1 變量賦值及人口統(tǒng)計學特征〔n(%)〕

      2 結(jié) 果

      2.1Logistic回歸分析 將收集的樣本變量納入Logistic回歸方程中篩選出與缺血性腦卒中患病相關(guān)的危險因素,篩選結(jié)果(見表2)顯示性別、職業(yè)、年齡、高血壓史、糖尿病史、吸煙史、BMI、高同型半胱氨酸癥史、高脂血癥史、收縮壓、舒張壓、精神狀況及心率是缺血性腦卒中發(fā)病的危險因素。據(jù)此,構(gòu)建Logistic回歸模型結(jié)果為:Logistic(Y1)=0.637X1-0.147X2-0.049X3+2.029X4-0.553X5+0.942X6-0.302X7-0.552X8+2.060X9-0.611X10-0.779X11-2.974X12+0.022X13。

      表2 Logistic回歸篩選結(jié)果

      2.2決策樹分析 應(yīng)用軟件SPSS23.0中的決策樹模型,以是否患缺血性腦卒中(是=0,否=1)為因變量,其余變量為協(xié)變量,生長法為CHIND,相關(guān)參數(shù)取默認值構(gòu)建模型,同時采用CHAID卡方自動交互檢查對所有的變量進行篩查,構(gòu)建決策樹(如圖1)。

      圖1 決策樹結(jié)果

      決策樹深度為4層,共計15個節(jié)點,8個終端節(jié)點。通過決策樹可以得出各個變量之間的交互作用及患病危險因素的重要程度。決策樹第一層按照是否具有高血壓史進行劃分,說明高血壓史是缺血性腦卒中患病的第一大危險因素。決策樹第二層無論是否患有高血壓史(權(quán)“0”和權(quán)“1”),結(jié)果都顯示高脂血癥史為第二大危險因素,且高血壓史與高脂血癥史之間具有交互作用。決策樹左側(cè)分支中,不具有高血壓史的人群分支(權(quán)“1”),高同型半胱氨酸癥史是第三大危險因素,性別是第四大危險因素。同時決策樹顯示高脂血癥史與高同型半胱氨酸癥史,高同型半胱氨酸癥史與性別之間存在交互作用。決策樹右側(cè)分支中,具有高血壓史的人群分支(權(quán)“0”),動脈粥樣硬化史是第三大危險因素,高同型半胱氨酸癥史是第四大危險因素。決策樹顯示高脂血癥史與動脈粥樣硬化史,動脈粥樣硬化史與高同型半胱氨酸癥史之間存在交互作用。

      利用構(gòu)建的決策樹可以發(fā)現(xiàn)主效應(yīng)共有5項,它們是高血壓史、高脂血癥史、高同型半胱氨酸癥史、動脈粥樣硬化史、性別;存在交互作用發(fā)生的項有:高血壓史與高脂血癥史、高脂血癥史與高同型半胱氨酸癥史、高同型半胱氨酸癥史與性別、高脂血癥史與動脈粥樣硬化史、動脈粥樣硬化史與高同型半胱氨酸癥史。以是否發(fā)生缺血性腦卒中(是=“0”,否=“1”)為因變量,決策樹模型中的主效應(yīng)及構(gòu)建的交互效應(yīng)為協(xié)變量,納入Logistic模型中進行分析。分析結(jié)果見表3。結(jié)果發(fā)現(xiàn)缺血性腦卒中發(fā)病的主要危險因素是高脂血癥史、高同型半胱氨酸癥史及交互項高血壓史與高脂血癥史、高脂血癥史與高同型半胱氨酸癥史、高同型半胱氨酸癥史與性別。據(jù)此,構(gòu)建的回歸模型為:Logistic(Y2)=-0.987X14-2.306X15+2.850X16+2.027X17+1.010X18。

      2.3模型驗證 為了驗證上述構(gòu)建的兩個模型,繪制ROC曲線進行評估(見圖2)。決策樹模型ROC曲線下面積為0.840(0.817~0.862),標準誤差為0.012,約登指數(shù)為0.750,對應(yīng)的靈敏度為0.877,特異度為0.873。Logistic回歸模型中ROC曲線下面積為0.914(0.899~0.930),AUC面積大于0.9,標準誤差為0.008,約登指數(shù)為0.768,對應(yīng)的靈敏度為0.861,特異度為0.907。

      表3 決策樹下回歸篩選結(jié)果

      圖2 兩種不同方法模型分析擬合效果ROC曲線

      3 討 論

      目前,國內(nèi)的疾病預(yù)測方法使用較多的有神經(jīng)網(wǎng)絡(luò)法、KNN算法、馬氏預(yù)測法等〔16~18〕。本文將決策樹算法與Logistic回歸分析方法運用于缺血性腦卒中患病風險預(yù)測中,在分析缺血性腦卒中患病影響因素的同時,構(gòu)建不同的對比模型,進一步建立和完善了適合中國人群的缺血性腦卒中預(yù)防風險評估工具。與傳統(tǒng)的評分法〔7〕相比,本文對缺血性腦卒中的危險因素進行量化,將評分等級轉(zhuǎn)化為預(yù)測概率,使得缺血性腦卒中的患病風險預(yù)測更加科學;與神經(jīng)網(wǎng)絡(luò)法〔16〕相比,本文建立的模型簡單明了,可以更好地探究發(fā)病規(guī)則;與KNN算法〔17〕相比,KNN算法需要剪輯樣本點,計算量較大,而本文的方法計算簡便,預(yù)測效率更高;與馬氏預(yù)測法〔18〕相比,馬氏預(yù)測是預(yù)測未來幾年人群的發(fā)病概率,而本文是根據(jù)目前實際狀況,及時預(yù)測發(fā)病概率,時效性更強。

      從危險因素來看,高血壓史與高脂血癥史是影響缺血性腦卒中的最主要因素,控制血壓與血脂對缺血性腦卒中的防治與預(yù)防起著非常重要的作用。另外,性別、高同型半胱氨酸癥史等因素也是影響缺血性腦卒中患病的重要因素。從預(yù)測結(jié)果來看,Logistic回歸模型中ROC曲線下的面積為0.914(0.899~0.930),表明該模型分類準確率較高,決策樹模型ROC曲線下的面積為0.840(0.817~0.862),說明分類準確率良好;另外,決策樹模型的靈敏度較高,說明決策樹模型預(yù)測未來真正患者的能力較好,Logistic模型的特異度較高,說明Logistic模型預(yù)測未來非患者的能力更好。對比發(fā)現(xiàn),兩個模型的穩(wěn)定性與預(yù)測準確率均較好,但Logistic回歸分析構(gòu)建的模型綜合性能更佳。這是因為Logistic模型中包含決策樹的建模變量,同時包含更多具有研究意義的變量,使得構(gòu)建的模型更穩(wěn)定。另外,本研究包含的數(shù)據(jù)量有限,可能會導(dǎo)致決策樹結(jié)果不穩(wěn)定,模型結(jié)果失真,研究認為〔19〕,決策樹分析是將所有變量放在同一層面的固定分析,這種決策樹結(jié)構(gòu)的算法存在“順序偏差”,建議決策樹模型與其他模型結(jié)合使用。

      綜上所述,本文建立的模型直觀簡單,對發(fā)病規(guī)律的探究更加完善,居民可以根據(jù)自己的實際健康情況隨時預(yù)測個人缺血性腦卒中患病風險概率,及時預(yù)防缺血性腦卒中的發(fā)生,具有很好的時效性與準確性。但是,由于時間與人力資源有限,所采集的醫(yī)療數(shù)據(jù)無法涵蓋所有可能的危險因素,且SPSS中不利于對參數(shù)不斷調(diào)整。因此,今后的研究中需要對所建立的模型進一步完善。

      猜你喜歡
      決策樹高脂血癥半胱氨酸
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      西安地區(qū)同型半胱氨酸參考區(qū)間的初步建立
      基于決策樹的出租車乘客出行目的識別
      高脂血癥對生化檢驗項目的干擾及消除
      食物不耐受與高脂血癥的關(guān)系
      同型半胱氨酸與慢性心力衰竭合并腎功能不全的相關(guān)性分析
      社區(qū)健康促進模式降低老年高脂血癥的效果
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      86例同型半胱氨酸與腦梗死相關(guān)性分析
      鹤壁市| 宁城县| 河源市| 会东县| 清水县| 杨浦区| 亳州市| 惠州市| 霍山县| 建水县| 黔江区| 岑巩县| 无极县| 宁安市| 平和县| 乌海市| 集贤县| 胶州市| 莎车县| 上栗县| 和政县| 宜良县| 电白县| 华亭县| 潢川县| 开封县| 丰县| 孝昌县| 吴江市| 政和县| 元谋县| 镇原县| 都江堰市| 临洮县| 湖北省| 敦化市| 平陆县| 仲巴县| 大丰市| 喀喇| 清河县|