• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)算法的干眼預(yù)測(cè)模型研究

      2021-09-15 03:24:36蘇佳山程冬梅
      國際眼科雜志 2021年9期
      關(guān)鍵詞:眼表干眼角膜

      張 弛,王 萍,蘇佳山,程冬梅

      0引言

      干眼是指由淚液的量或質(zhì)或流體動(dòng)力學(xué)異常引起的淚膜不穩(wěn)定和(或)眼表損害,從而導(dǎo)致眼部不適癥狀及視功能障礙的一類疾病。其發(fā)病率非常高,根據(jù)流行病學(xué)調(diào)查結(jié)果顯示,世界范圍內(nèi)干眼的發(fā)病率約為 5.5%~33.7%[1-2],其中我國發(fā)病率約為21%~30%,干眼患者有眼部干澀、異物感、燒灼感、視疲勞、視力波動(dòng)等不適,嚴(yán)重者可導(dǎo)致眼表,尤其是角膜組織干燥、角化或融解、穿孔,造成角膜盲。因此干眼的正確有效診斷尤為重要[3]。干眼癥狀無特異性,臨床上診斷干眼,除了臨床癥狀外,還需要結(jié)合各種眼表檢查的客觀參數(shù)綜合判斷,如淚液分泌試驗(yàn)(Schirmer Ⅰ test,SⅠt)、熒光素染色淚膜破裂時(shí)間(FBUT)、非接觸式淚膜破裂時(shí)間(NI-BUT)、淚河高度(TMH)、角膜熒光素鈉染色(FL)評(píng)分、瞼板腺功能評(píng)分(MG-SCORE)等[4]。但這些單個(gè)指標(biāo)的臨床意義有限,哪些指標(biāo)對(duì)干眼的診斷更有參考價(jià)值,它們之間的聯(lián)系又是什么,目前未見相關(guān)報(bào)道。

      數(shù)據(jù)挖掘是生物信息學(xué)的重要內(nèi)容之一,可以將獲得的零散數(shù)據(jù)轉(zhuǎn)換成便于讀寫輸出的信息,再進(jìn)一步用多種數(shù)學(xué)工具進(jìn)行分析建模,從而找出這些數(shù)據(jù)的聯(lián)系和規(guī)律,為臨床診斷、治療提供幫助和參考[5]。本研究擬運(yùn)用數(shù)據(jù)挖掘技術(shù),分析正常人和干眼患者各眼部檢查參數(shù),尋找診斷干眼的相關(guān)性指標(biāo),建立干眼預(yù)測(cè)模型。

      1對(duì)象和方法

      1.1對(duì)象選取2020-03/2021-01于我院確診的干眼患者218例436眼納入干眼組,其中男101例202眼,女117例234眼,年齡20~70(平均41.32±5.13)歲。納入標(biāo)準(zhǔn):(1)符合干眼診斷標(biāo)準(zhǔn),根據(jù)《中國干眼臨床診療專家共識(shí)》(2020)中干眼的診斷標(biāo)準(zhǔn)[6]:1)有下列主觀癥狀之一:干燥感、異物感、燒灼感、視疲勞、畏光、疼痛、流淚、視力波動(dòng)、眼紅;2)眼表疾病指數(shù)(OSDI)問卷評(píng)分≥13分;3)NI-BUT≤10s 或SⅠt≤10mm/5min;(2)年齡18~72歲。排除標(biāo)準(zhǔn):(1)繼發(fā)于系統(tǒng)性紅斑狼瘡(SLE)、類風(fēng)濕性關(guān)節(jié)炎(RA)和系統(tǒng)性硬化癥(SSc)等干眼患者;(2)既往有眼部過敏、手術(shù)、配戴角膜接觸鏡、角結(jié)膜感染性疾病等病史。選取同期在我院進(jìn)行健康體檢的健康人群212例424眼納入正常對(duì)照組,其中男113例226眼,女99例198眼,年齡18~72(平均43.19±6.22)歲。納入標(biāo)準(zhǔn):(1)無干眼癥狀和體征;(2)年齡18~72歲。排除既往有眼部過敏、手術(shù)、配戴角膜接觸鏡、角結(jié)膜感染性疾病等病史者。本研究經(jīng)醫(yī)院倫理委員會(huì)審批通過,所有研究對(duì)象均知情同意。

      1.2方法

      1.2.1檢測(cè)指標(biāo)

      1.2.1.1OSDI問卷評(píng)分采用OSDI問卷進(jìn)行干眼主觀癥狀評(píng)分,問卷內(nèi)容包含眼部癥狀(眼干、灼熱感、異物感、眼痛、畏光和視力波動(dòng)等)、視覺相關(guān)功能、環(huán)境因素。由12個(gè)問題組成,每個(gè)問題評(píng)分0~4分,0分為無癥狀,1分為有時(shí)侯有癥狀,2分為一半時(shí)間有癥狀,3分為絕大多數(shù)時(shí)間有癥狀,4分為總有明顯癥狀。OSDI評(píng)分=(25×總得分?jǐn)?shù))/回答問題數(shù),總分0~100分。

      1.2.1.2SⅠt 無麻醉?xiàng)l件下使用Schirmer試紙(5mm×30mm),頭端內(nèi)折置入受檢者下眼瞼外中1/3交界處的結(jié)膜囊,囑受檢者輕閉眼5min后,測(cè)量5min內(nèi)淚液浸濕試紙的長(zhǎng)度。

      1.2.1.3FBUT 用熒光素鈉試紙觸及下瞼結(jié)膜囊,囑受檢者瞬目3~4次使熒光素涂布于眼表,雙眼平視前方,從末次瞬目至角膜出現(xiàn)首個(gè)黑斑的時(shí)間為淚膜破裂時(shí)間。測(cè)量3次,取平均值。

      1.2.1.4NI-BUT 暗室環(huán)境下,受檢者雙眼自然睜開,使用Keratograph 5M中Placido盤投影至受檢者角膜的表面并對(duì)焦,注視中心紅點(diǎn),再囑其充分瞬目3次后盡可能保持睜眼,自動(dòng)記錄淚膜破裂時(shí)間。測(cè)量3次,取平均值。

      1.2.1.5TMH 暗室環(huán)境下,受檢者在測(cè)試前充分瞬目3次,采用Keratograph 5M拍照記錄淚河高度圖像。測(cè)量3次,取平均值。

      1.2.1.6FL評(píng)分用熒光素鈉試紙觸及受檢者下瞼結(jié)膜囊,將角膜劃分為4個(gè)象限,在裂隙燈鈷藍(lán)光下觀察角膜染色情況。角膜染色在每個(gè)象限的評(píng)分為0~3分:0分為無染色;1分為小于30個(gè)染色點(diǎn);2分為大于30個(gè)點(diǎn)但未融合成片;3分為出現(xiàn)融合或出現(xiàn)絲狀物及潰瘍。4個(gè)象限的得分相加為每眼的總評(píng)分,共0~12分。

      1.2.1.7MG-SCORE 通過Keratograph 5M瞼板腺成像技術(shù)對(duì)瞼板腺結(jié)構(gòu)進(jìn)行評(píng)估,每只眼的上下瞼分別進(jìn)行評(píng)分記錄,評(píng)分標(biāo)準(zhǔn):0分:瞼板腺無缺失;1分:瞼板腺缺失比例<1/3;2分:瞼板腺缺失比例為1/3~2/3;3分:瞼板腺缺失比例>2/3。

      1.2.2預(yù)測(cè)模型的構(gòu)建和驗(yàn)證方法不同的機(jī)器學(xué)習(xí)算法適合于不同的數(shù)據(jù)集,本研究分別使用Random Tree、KNN、Decision Stump、Random Forest、SVM、Na?ve Bayes、C4.5決策樹等機(jī)器學(xué)習(xí)算法構(gòu)建干眼預(yù)測(cè)模型,通過5組交叉驗(yàn)證結(jié)果評(píng)估該模型的預(yù)測(cè)能力,并采用受試者工作特征曲線(receiver operating characteristic curve,ROC)及曲線下面積(area under curve,AUC)評(píng)估各算法的預(yù)測(cè)能力。在5組交叉驗(yàn)證中,將數(shù)據(jù)集分成5個(gè)子集,其中4個(gè)子集作為訓(xùn)練集用于建模,1個(gè)子集作為測(cè)試集檢驗(yàn)?zāi)P?,共進(jìn)行5次計(jì)算,得到5個(gè)值,取平均值即5組交叉驗(yàn)證的結(jié)果。具體流程如下:(1)收集數(shù)據(jù),構(gòu)建用于建模的數(shù)據(jù)集;(2)對(duì)訓(xùn)練集進(jìn)行特征篩選,去除冗余的變量,建立特征子集;(3)使用機(jī)器學(xué)習(xí)算法對(duì)訓(xùn)練集進(jìn)行模型構(gòu)建;(4)對(duì)建立的模型進(jìn)行評(píng)估;(5)使用獨(dú)立測(cè)試集對(duì)模型的預(yù)測(cè)能力進(jìn)行驗(yàn)證。本研究所有的機(jī)器學(xué)習(xí)計(jì)算均在Linux系統(tǒng)下采用開源軟件WEKA進(jìn)行。

      1.2.2.1數(shù)據(jù)庫構(gòu)建分別從干眼組和正常對(duì)照組各隨機(jī)選取100例200眼受檢者的數(shù)據(jù)組成測(cè)試集,其余干眼組118例236眼、對(duì)照組112例224眼受檢者的數(shù)據(jù)作為訓(xùn)練集。

      1.2.2.3機(jī)器學(xué)習(xí)算法

      1.2.2.3.1C4.5決策樹決策樹是一種用來表示判定規(guī)則的樹結(jié)構(gòu)。通過對(duì)訓(xùn)練樣本集訓(xùn)練,可以構(gòu)造出一棵可表達(dá)一定規(guī)則的決策樹,該樹對(duì)樣本空間進(jìn)行了劃分。當(dāng)使用決策樹對(duì)未知樣本預(yù)測(cè)時(shí),該算法利用已生成的樹,從根結(jié)點(diǎn)開始對(duì)樣本的屬性測(cè)試其值,并順著分枝向下移動(dòng),直至達(dá)到某個(gè)葉結(jié)點(diǎn)為止。此葉結(jié)點(diǎn)代表的類即為該樣本的分類結(jié)果[7]。

      1.2.2.3.2KNN KNN即K-最近鄰(K nearest neighbors),適用于分類和回歸的非參數(shù)方法。特征空間中的K個(gè)最接近的訓(xùn)練樣例(即樣本點(diǎn))作為輸入,輸出值有2種情況,當(dāng)N=1時(shí),輸出對(duì)象是簡(jiǎn)單的最近鄰樣本點(diǎn);而當(dāng)它存在K個(gè)值(N≠1時(shí)),輸出值是K個(gè)最近鄰的平均值[8]。

      1.2.2.3.3RandomTree 基本思路:設(shè)屬性集{X=F1,…,Fk,D}為建造樹型提供大體結(jié)構(gòu),其中包括非決策屬性Fi(i=1,2,…,k)和決策屬性D(d1,d2,…,dm)。Fi(x)表示x的屬性Fi值[9]。

      1.2.2.3.4Na?veBayes Na?ve Bayes即樸素貝葉斯算法,是無監(jiān)督學(xué)習(xí)的一種常用算法,通過聯(lián)合概率[P(x,y)=P(x|y)P(y)]建模,運(yùn)用貝葉斯定理求解后驗(yàn)概率[P(y|x)],將后驗(yàn)概率最大者對(duì)應(yīng)的類別作為預(yù)測(cè)類別[10]。

      1.2.2.3.5Bagging Bagging是最常用和最實(shí)用的集成學(xué)習(xí)算法之一,旨在結(jié)合許多弱分類器獲得強(qiáng)分類器,通過建立許多獨(dú)立的訓(xùn)練數(shù)據(jù)集生成一些獨(dú)立的分類器,然后將它們組合起來,以多數(shù)投票構(gòu)建最終的分類器[11]。

      1.2.2.3.6SVM SVM即支持向量機(jī)(support vector machine),是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面[12]。

      1.2.2.3.7DecisionStump Decision Stump也稱單層決策樹。該算法可對(duì)每一列屬性進(jìn)行一次判斷,由一個(gè)內(nèi)部節(jié)點(diǎn)(根節(jié)點(diǎn))與末端節(jié)點(diǎn)(葉節(jié)點(diǎn))直接相連,葉子節(jié)點(diǎn)即最終的分類結(jié)果[13]。

      1.2.2.3.8RandomForest Random Forest即隨機(jī)森林(RF),該方法結(jié)合Bagging和隨機(jī)選擇的特征被獨(dú)立引入,以構(gòu)建具有可控變化的決策樹集合[14]。

      2結(jié)果

      2.1特征篩選采用CFS方法從全體數(shù)據(jù)中篩選出特征子集,該子集包含4個(gè)變量,即SⅠt、NI-BUT、TMH、FL評(píng)分。

      2.2預(yù)測(cè)模型的構(gòu)建和驗(yàn)證采用Random Forest算法進(jìn)行建模時(shí),模型的預(yù)測(cè)準(zhǔn)確率高于其他算法,干眼組和正常對(duì)照組的預(yù)測(cè)準(zhǔn)確率分別為91.8%和85.2%,總預(yù)測(cè)準(zhǔn)確率為88.5%,見表1。模型的驗(yàn)證結(jié)果顯示,Random Forest算法的ROC曲線和AUC面積均優(yōu)于其它算法,見圖1、2。盡管Random Tree和Random Forest算法的干眼預(yù)測(cè)準(zhǔn)確率最高,但與其他算法相比較,各個(gè)算法之間的總預(yù)測(cè)準(zhǔn)確率相差并不是十分大,說明選取的這些算法具有可行性。由于部分機(jī)器學(xué)習(xí)方法的參數(shù)可能對(duì)模型的預(yù)測(cè)準(zhǔn)確率有一定的影響,因此本研究對(duì)Random Forest算法的參數(shù)進(jìn)行了優(yōu)化,結(jié)果顯示,當(dāng)模型參數(shù)numTrees為9時(shí),正常對(duì)照組、干眼組和總預(yù)測(cè)準(zhǔn)確率均大于90%,優(yōu)于其它參數(shù),見圖3,故選擇該參數(shù)條件建立最終的干眼預(yù)測(cè)模型。采用測(cè)試集對(duì)該模型的預(yù)測(cè)準(zhǔn)確率進(jìn)行評(píng)估,結(jié)果顯示,測(cè)試集中正常對(duì)照組、干眼組和總預(yù)測(cè)準(zhǔn)確率分別為91.7%、97.6%和94.6%。

      圖1 不同算法預(yù)測(cè)能力的ROC曲線。

      圖2 不同算法的AUC面積。

      圖3 Random Forest算法參數(shù)優(yōu)化后的預(yù)測(cè)準(zhǔn)確率。

      表1 特征子集采用不同算法的預(yù)測(cè)準(zhǔn)確率%

      2.3特征變量的干眼預(yù)測(cè)準(zhǔn)確率采用Random Forest算法進(jìn)行單因子變量預(yù)測(cè)能力進(jìn)行評(píng)估,結(jié)果顯示,F(xiàn)L評(píng)分和NI-BUT是篩選出的特征變量中干眼預(yù)測(cè)準(zhǔn)確率較高的兩個(gè)變量,均超過74%,見表2,表明這兩個(gè)變量對(duì)干眼的診斷是最重要的。

      表2 單因子變量的預(yù)測(cè)準(zhǔn)確率%

      3討論

      目前對(duì)干眼的診斷指標(biāo)較多,本研究采用診斷干眼常用的檢測(cè)參數(shù),針對(duì)20~70歲受試對(duì)象進(jìn)行檢測(cè),對(duì)得出的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和分析。本研究中通過變量篩選,選擇NI-BUT、SⅠt、TMH和FL評(píng)分4個(gè)特征變量構(gòu)建預(yù)測(cè)模型,得出FL評(píng)分和NI-BUT與干眼有較強(qiáng)相關(guān)性。

      FL評(píng)分是通過染色實(shí)驗(yàn)準(zhǔn)確判斷角膜上皮損傷情況。熒光素衍生物染色若為陽性,提示存在干燥失活的上皮細(xì)胞。眼表細(xì)胞完整性受損時(shí),可被特定染料著色,染色程度與眼表損傷的嚴(yán)重程度具有相關(guān)性。因此,眼表細(xì)胞染色可評(píng)價(jià)上皮細(xì)胞的屏障功能和完整性,本研究顯示FL評(píng)分對(duì)干眼的預(yù)測(cè)準(zhǔn)確性達(dá)82.8%,說明此指標(biāo)可作為干眼嚴(yán)重程度的評(píng)價(jià)指標(biāo)之一。NI-BUT是基于Placido環(huán)投射原理,結(jié)合自動(dòng)分析軟件,檢測(cè)淚膜隨時(shí)間破裂的位點(diǎn)和時(shí)間[15]。FBUT雖然檢查方法便捷,適合臨床使用,但屬于侵入性檢查[11],一定程度影響了淚膜的真實(shí)狀態(tài),因此對(duì)于處于臨界范圍的干眼,診斷會(huì)存在偏差。NI-BUT的重復(fù)性及其與傳統(tǒng)FBUT測(cè)量值的一致性一直存在爭(zhēng)議,但因其操作對(duì)眼表擾動(dòng)小,近年來逐漸在臨床推廣,本研究發(fā)現(xiàn)NI-BUT的預(yù)測(cè)率在70%以上,是干眼的強(qiáng)相關(guān)影響因素。SⅠt是評(píng)估干眼的主要指標(biāo)之一。本研究通過數(shù)據(jù)分析發(fā)現(xiàn),SⅠt在干眼預(yù)測(cè)模型中總預(yù)測(cè)準(zhǔn)確率在60%以上,這已經(jīng)是干眼預(yù)測(cè)模型中相關(guān)影響因素里較強(qiáng)的指標(biāo)了,計(jì)算的結(jié)果可以佐證臨床調(diào)研的試驗(yàn)結(jié)果,說明干眼患者其淚液分泌量相比正常人顯著降低。TMH是角結(jié)膜表面光帶與下瞼瞼緣光帶交界處的淚液的液平高度,可以通過該高度在一定程度范圍內(nèi)反映淚液的分泌量,但它在干眼預(yù)測(cè)模型中總預(yù)測(cè)準(zhǔn)確率只有53.1%,比起其他3個(gè)特征變量,準(zhǔn)確性偏低。

      機(jī)器學(xué)習(xí)的重要目標(biāo)之一是通過分析有限的樣本進(jìn)而對(duì)未知樣本進(jìn)行測(cè)試,得到最精準(zhǔn)的估計(jì)結(jié)果。本研究收集了218例干眼樣本,嘗試用多種機(jī)器學(xué)習(xí)方法構(gòu)建干眼預(yù)測(cè)模型。結(jié)果顯示,Random Forest可以較好地對(duì)干眼患者進(jìn)行識(shí)別。但是,相對(duì)于國內(nèi)干眼患者這個(gè)群體,樣本量偏少。一般當(dāng)樣本量較小或模型過于復(fù)雜時(shí)會(huì)出現(xiàn)過擬合[16],如具有相對(duì)于觀測(cè)次數(shù)太多的參數(shù)存在等。通常過擬合將具有預(yù)測(cè)性能不佳的情況,因?yàn)槠淇梢钥浯笮》▌?dòng)的數(shù)據(jù)[17]。本研究中,為了避免出現(xiàn)過擬合,我們采用獨(dú)立測(cè)試集進(jìn)行外部驗(yàn)證,從而降低過擬合的風(fēng)險(xiǎn)。

      本研究通過數(shù)據(jù)挖掘的計(jì)算及臨床數(shù)據(jù)的處理對(duì)干眼的影響因素進(jìn)行預(yù)測(cè),結(jié)果顯示,Random Forest算法普遍要比其他算法學(xué)習(xí)器具有更加準(zhǔn)確、穩(wěn)定的預(yù)測(cè)效果。對(duì)于部分算法,如支持向量機(jī)等,在實(shí)際操作的時(shí)候,需要選擇相對(duì)應(yīng)的操作參數(shù)[18]。但是這些操作參數(shù)的選取在國際上現(xiàn)在沒有確切的執(zhí)行標(biāo)準(zhǔn),對(duì)于操作者來說,一般是憑借經(jīng)驗(yàn)進(jìn)行選擇,對(duì)于初步接觸算法的操作人員來說具有一定難度。此外,由于參數(shù)的選取數(shù)值不同,會(huì)對(duì)結(jié)果產(chǎn)生很大偏差。建立參數(shù)優(yōu)化模型可以解決參數(shù)選擇的困難,并且在預(yù)測(cè)準(zhǔn)確率時(shí),可以得到最優(yōu)的預(yù)測(cè)方案[19]。本研究中,我們通過變量篩選找出強(qiáng)相關(guān)變量,尋找干眼相關(guān)的新指標(biāo),進(jìn)而用于臨床診斷?;谝陨献兞浚狙芯坎捎貌煌惴ǚ謩e構(gòu)建干眼的預(yù)測(cè)模型,結(jié)果顯示,所建模型的干眼預(yù)測(cè)準(zhǔn)確率均高于75%。說明本研究所選用的特征變量泛化能力很強(qiáng),適用于多種算法。但是考慮到實(shí)際臨床中的假陰性或假陽性,因此有必要追求高預(yù)測(cè)準(zhǔn)確率。通過所建立的預(yù)測(cè)模型,我們可以對(duì)一些干眼初期的疑似病例進(jìn)行判別或預(yù)警,從而達(dá)到早診斷、早干預(yù)的目的。本研究不足之處在于納入樣本量偏少,在今后的研究中,將和其他眼科機(jī)構(gòu)進(jìn)行多中心合作,進(jìn)一步擴(kuò)大樣本量,提高模型的預(yù)測(cè)準(zhǔn)確率。

      猜你喜歡
      眼表干眼角膜
      科教新報(bào)(2023年38期)2023-10-05 19:22:53
      干眼不舒,中醫(yī)外治有妙招
      竟是“干眼”找上門
      愛眼有道系列之十 干眼者怎樣度過秋燥難關(guān)
      愛眼有道系列之三 干眼及其治療防范策略
      眼表抗新生血管治療眼紅、眼干和眼澀立竿見影
      短時(shí)間電腦屏幕閱讀對(duì)大學(xué)生視功能和眼表的影響
      科技視界(2018年33期)2018-02-21 02:30:54
      深板層角膜移植治療角膜病的效果分析
      改良護(hù)眼法對(duì)高原地區(qū)眼表感染的輔助治療效果觀察
      眼表熱化學(xué)燒傷后重度瞼球粘連的療效觀察
      英德市| 班戈县| 沧源| 定州市| 玉田县| 曲水县| 绥棱县| 旬邑县| 互助| 江山市| 钟祥市| 金堂县| 安仁县| 新丰县| 柯坪县| 盐山县| 甘德县| 平利县| 安仁县| 西畴县| 淮北市| 万载县| 灵寿县| 井冈山市| 大丰市| 曲松县| 广州市| 筠连县| 友谊县| 莱芜市| 荔波县| 赤峰市| 芜湖市| 西和县| 汉寿县| 澄迈县| 丽水市| 连城县| 寿光市| 上犹县| 胶南市|