• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于卷積神經(jīng)網(wǎng)絡(luò)的皮膚病診斷多二分類器研究①

      2023-01-29 03:47:56代闖闖欒海晶楊雪瑩過曉冰牛北方陸忠華
      高技術(shù)通訊 2022年10期
      關(guān)鍵詞:銀屑病分類器準確率

      代闖闖 欒海晶 楊雪瑩 過曉冰 牛北方 陸忠華③

      (*中國科學(xué)院計算機網(wǎng)絡(luò)信息中心 北京 100190)

      (**中國科學(xué)院大學(xué) 北京 100049)

      (***聯(lián)想研究院 北京 100094)

      0 引言

      卷積神經(jīng)網(wǎng)絡(luò)是受生物學(xué)上感受野機制啟發(fā)而提出的[1-2]。在20 世紀末,卷積神經(jīng)網(wǎng)絡(luò)LeNet-5[3-5]應(yīng)用到手寫數(shù)字識別領(lǐng)域,除此之外,基于LeNet-5的手寫數(shù)字識別系統(tǒng)被美國很多銀行所使用,用于識別支票上的手寫數(shù)字。目前,隨著計算能力的提高,在基于圖像處理的深度學(xué)習(xí)領(lǐng)域中,新的網(wǎng)絡(luò)模型不斷被提出并得到應(yīng)用。2012 年,AlexNet[6-8]模型的提出證明了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)在復(fù)雜模型下的有效性,該模型結(jié)合圖形處理器(graphics processing unit,GPU)進行并行訓(xùn)練可在有限時間內(nèi)得到預(yù)期的效果[9],并贏得了2012 年ImageNet 圖像分類競賽的冠軍[10]。隨著AlexNet 結(jié)構(gòu)的進一步發(fā)展,2014 年,ILSVRC 競賽中VGG[11-13]模型應(yīng)運而生,僅次于本次競賽中的冠軍GoogLeNet[14-15]。然而,VGG 模型在多個遷移學(xué)習(xí)任務(wù)中的表現(xiàn)要優(yōu)于GoogLeNet,并且從圖像中提取CNN 特征,VGG 模型是首選算法。GoogLeNet模型的提出則證明隨著卷積層數(shù)的增加和網(wǎng)絡(luò)結(jié)構(gòu)的深入,模型的學(xué)習(xí)效果會更佳[16],因此獲得了2014 年ImageNet 圖像分類競賽的冠軍。2015 年,深度殘差網(wǎng)絡(luò)的提出使得更加簡化的卷積結(jié)構(gòu)和更深的網(wǎng)絡(luò)得到應(yīng)用[17]。

      近年來,隨著人工智能和大數(shù)據(jù)科學(xué)的發(fā)展,新的深度學(xué)習(xí)模型尤其是卷積神經(jīng)網(wǎng)絡(luò)模型得到不斷發(fā)展[10,16-17],深度學(xué)習(xí)在圖像識別問題中得到越來越多的應(yīng)用。深度學(xué)習(xí)方法受數(shù)據(jù)驅(qū)動在醫(yī)療領(lǐng)域得到應(yīng)用,因為基于不同的醫(yī)療領(lǐng)域,各數(shù)據(jù)來源和疾病特征不同,需要對現(xiàn)有的模型和分析框架做相應(yīng)的調(diào)整,一些像素過大的圖片數(shù)據(jù)如CT 掃描作為輸入時需要進行信息壓縮或者特征提取再進一步使用網(wǎng)絡(luò)進行學(xué)習(xí)[18],有關(guān)分類診斷如黑色素瘤的良性或惡性的判別需要借助皮膚癌領(lǐng)域?qū)τ诩膊〉募毞种R[19-20]。

      1 神經(jīng)網(wǎng)絡(luò)模型介紹

      1.1 AlexNet

      AlexNet 是Hinton 和他的學(xué)生Alex Krizhevsky在圖像分類挑戰(zhàn)上提出的一種卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,用來對ImageNet 上120 萬張高清圖像中的1000類進行分類,在測試集上實現(xiàn)了37.5%的top1 錯誤率,17.0%的top5 錯誤率。AlexNet 是卷積神經(jīng)網(wǎng)絡(luò)在圖像分類上的一個經(jīng)典的網(wǎng)絡(luò)結(jié)構(gòu),具體的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

      圖1 AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)

      AlexNet 模型中使用了修正線性單元(rectified linear unit,ReLU),ReLU 函數(shù)的公式如下:

      ReLU 函數(shù)曲線如圖2 所示。

      圖2 ReLU 函數(shù)曲線

      通過式(1)和圖2 可以看出,ReLU 函數(shù)非常簡單,在x<0 處取值為0,在其他地方取值為x。ReLU代替了傳統(tǒng)的Tanh 和Logistic 等激活函數(shù),運算速度快,能夠很好地解決梯度消失的問題[21-22]。ReLU函數(shù)最先在Hinton 的ImageNet 的論文中[10]提出,截至目前,已得到了廣泛的應(yīng)用。然而,ReLU 函數(shù)在網(wǎng)絡(luò)模型訓(xùn)練過程中最大的缺點是容易出現(xiàn)“死亡現(xiàn)象”,即如果反向傳播過程中有一個參數(shù)為零,則會導(dǎo)致其后的參數(shù)均無法進行更新,隨后提出的Leak ReLU、PreLU、Random ReLU 等改進版本的激活函數(shù)則可很好地解決這個問題。

      1.2 GoogLeNet

      隨著當前深度學(xué)習(xí)的網(wǎng)絡(luò)規(guī)模的擴大以及訓(xùn)練參數(shù)的增多,在訓(xùn)練過程中容易出現(xiàn)過擬合的現(xiàn)象。除此之外,深度學(xué)習(xí)涉及的數(shù)據(jù)計算量巨大,且隨著卷積層數(shù)的增加使得數(shù)據(jù)計算量上升至指數(shù)級別,因此僅單純地追求模型識別準確率的提高而盲目增加網(wǎng)絡(luò)規(guī)模是不可取的,需要著眼于特征提取模塊的設(shè)計,在基本的特征提取單元上進行一些優(yōu)化操作,然后運用優(yōu)化后的特征提取模塊去構(gòu)建網(wǎng)絡(luò),可能會有利于模型準確率的提高。GoogLeNet 提出了Inception module 的概念,Inception 模塊同時使用1 ×1、3 ×3、5 ×5 等大小不同的卷積核,并將得到的特征映射在深度上拼接起來作為輸出特征映射,一方面使得網(wǎng)絡(luò)層具有更加強大的特征提取功能,另一方面使得網(wǎng)絡(luò)層更深、更寬,結(jié)構(gòu)變得更加稀疏,但參數(shù)量沒有增加,計算量維持在一定范圍內(nèi)[23-26]。Inception 是一種網(wǎng)中網(wǎng)的結(jié)構(gòu),即原來的結(jié)點也是一個網(wǎng)絡(luò)。Inception 一直在不斷發(fā)展,目前已經(jīng)提出了V1[16]、V2、V3[27]、V4。Inception V1 的結(jié)構(gòu)如圖3 所示,模塊中的前置1 ×1 卷積可用來減少特征映射的深度,起到了降維的作用。

      圖3 Inception V1 的模塊結(jié)構(gòu)

      GoogLeNet 是由上圖中的Inception 模塊所構(gòu)建的模型,包含9 個Inception 模塊、5 個池化層、一些卷積層和全連接層構(gòu)成,一共22 層網(wǎng)絡(luò),如圖4 所示。GoogLeNet 由于網(wǎng)絡(luò)的卷積核可共享,計算梯度可累加,因此不會出現(xiàn)梯度消失的現(xiàn)象,其典型代表應(yīng)為ResNet[17,28]。

      圖4 GoogLeNet 網(wǎng)絡(luò)結(jié)構(gòu)[27]

      2 數(shù)據(jù)預(yù)處理及預(yù)分類

      本研究將基于皮膚病圖像數(shù)據(jù)集的特點以及皮膚病的病理特征,提出分割、篩選、分類和分析的框架進行皮膚病的分類。首先對原始數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理及預(yù)分類,預(yù)處理包括對原始圖像的光強調(diào)節(jié)、亮度歸一和切片,預(yù)分類是指通過一個CNN 分類器將圖像塊分成皮膚、毛發(fā)、背景、器官4 類;再對皮膚類圖像塊進行疾病的細分類,分別通過基于AlexNet、GoogLeNet、多二分類器和隨機森林[29]的方法得到相應(yīng)圖像塊的概率向量;最后根據(jù)圖像塊的概率向量從不同的角度進行信息的整合及預(yù)測,最終對相應(yīng)的圖像做確切診斷。整體研究流程如圖5所示。

      圖5 研究整體流程

      由于醫(yī)學(xué)影像數(shù)據(jù)具有來源復(fù)雜以及數(shù)據(jù)采集不夠規(guī)范的特點,將圖像預(yù)處理劃分為如下3步:(1)亮度歸一化調(diào)節(jié);(2)圖像塊分割;(3)圖像塊分類篩選。非線性變換的亮度調(diào)整減輕了圖像采集過程中外部光線因素的不利影響,可提高對圖像識別的準確率。圖像塊分割是指對原始影像數(shù)據(jù)進行切片處理,根據(jù)一致性的規(guī)則從每張圖片中切割出若干小的分塊(256 ×256 像素,RGB 三通道),完成數(shù)據(jù)的規(guī)范化,使得不同像素的醫(yī)學(xué)影像能夠適用于同一個模型。圖像塊分類篩選指的是使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練識別醫(yī)學(xué)影像分割的有效部分,排除干擾信息。本研究使用CNN 對圖像塊進行訓(xùn)練,篩選出皮膚面積占比大于3/4 的有效圖像塊用于進一步的疾病分類。

      對經(jīng)預(yù)處理后篩選出的包含皮膚信息的圖像塊,使用CNN 進行分類,可將其分為白癜風、痤瘡、銀屑病、健康4 類。使用經(jīng)歸一化的四維概率向量表示每一個圖像塊經(jīng)過CNN 預(yù)測后的結(jié)果。研究中使用Caffe[30]深度學(xué)習(xí)框架,并在多個經(jīng)典的CNN 和自定義的網(wǎng)絡(luò)結(jié)構(gòu)進行了測試,最終選取GoogLeNet 和AlexNet 作為本研究的核心網(wǎng)絡(luò),調(diào)整了網(wǎng)絡(luò)訓(xùn)練中的softmax-loss 層,修改參數(shù)權(quán)重提升整個網(wǎng)絡(luò)對皮膚病診斷的敏感度。針對某一病例,均對應(yīng)多個圖像信息,因此需對疾病分類CNN 得到的結(jié)果進行信息的整合。

      2.1 數(shù)據(jù)預(yù)處理

      2.1.1 數(shù)據(jù)集簡介

      數(shù)據(jù)集由128 張2000~4000 像素不等的病人皮膚照片組成。病人的皮膚照片包括了銀屑病、痤瘡和白癜風等3 種皮膚病。圖6 是病人的側(cè)面照片的示例圖。

      圖6 示例圖

      2.1.2 預(yù)處理步驟

      (1) 亮度調(diào)整

      在進行圖像采集時,不同的光線采集條件會對所采集圖像的顏色、亮度等特征產(chǎn)生干擾,因此需對圖像亮度進行歸一化處理。經(jīng)過實驗驗證,當亮度歸一化比例取0.62 時效果最好。亮度調(diào)整的示意圖如圖7 所示。

      圖7 亮度歸一化

      (2) 數(shù)據(jù)集的擴充及實現(xiàn)

      由于深度學(xué)習(xí)需要海量數(shù)據(jù)進行模型訓(xùn)練,因此本實驗利用常規(guī)圖像擴充技術(shù)進行數(shù)據(jù)擴增。數(shù)據(jù)的擴增主要包括圖像的旋轉(zhuǎn)、鏡像、縮放和平移等,本研究中采用了鏡像和旋轉(zhuǎn)兩種方法對常規(guī)圖像進行集合擴增。

      (3) 圖片剪裁

      由于初始數(shù)據(jù)集中圖片的大小不等,且某些網(wǎng)絡(luò)的結(jié)構(gòu)對輸入圖片的大小也有嚴格的要求,實驗中會將初始寬高在2000~4000 像素不等的圖片裁剪成256 ×256 的分塊。圖片剪裁操作的示意圖如圖8 所示。

      圖8 圖片分割

      在圖像塊中,如圖9 中包含背景圖像塊、圖10中健康皮膚的圖像塊和圖11 中包含其他無關(guān)信息的圖像塊,會對判別結(jié)果產(chǎn)生誤導(dǎo),實驗中需要將它們從訓(xùn)練集中剔除。

      圖9 包含背景的圖像塊

      圖10 健康皮膚的圖像塊

      圖11 其他無關(guān)信息的圖像塊

      2.2 數(shù)據(jù)預(yù)分類

      對經(jīng)預(yù)處理后的圖像塊進行疾病的細分類,本研究采用隨機森林和普通的卷積神經(jīng)網(wǎng)絡(luò)等方法并交叉驗證其穩(wěn)定性,最終確定GoogLeNet 作為預(yù)分類的分類模型。經(jīng)多次實驗與交叉驗證,測試集準確率穩(wěn)定在94%左右,實驗的混淆矩陣和準確率如表1 所示。

      表1 預(yù)分類實驗結(jié)果

      經(jīng)圖像塊預(yù)分類后,可得到包含患者皮膚信息的有效圖像塊樣本。經(jīng)人工篩選標記得到健康、銀屑病、痤瘡、白癜風4 類皮膚圖像塊樣本。然后將數(shù)據(jù)集劃分為訓(xùn)練集和測試集,訓(xùn)練集每類包含682個樣本,測試集每類包含76 個樣本。

      3 皮膚病分類的多二分類器設(shè)計

      針對皮膚病的多分類問題,若要通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練獲得一個良好的結(jié)果,則需設(shè)計一個合適的神經(jīng)網(wǎng)絡(luò)。隨著深度學(xué)習(xí)的快速發(fā)展,網(wǎng)絡(luò)結(jié)構(gòu)也不斷更迭,本文旨在不改變網(wǎng)絡(luò)結(jié)構(gòu)的前提下,盡可能提高分類器的準確率。卷積神經(jīng)網(wǎng)絡(luò)相對于其他的分類器來說,可看作是一個特征提取的過程,而一般的分類器往往是通過某些已經(jīng)發(fā)現(xiàn)的特征來進行分類。如果將具有某些共同特征的元素歸到同一類,再進行訓(xùn)練,這些共同的特征可能會更容易地被提取出來,因此擬通過這個網(wǎng)絡(luò)來訓(xùn)練多個二分類器從而實現(xiàn)對初始多分類器的優(yōu)化。

      多個二分類器類似于二叉樹的模型,先將數(shù)據(jù)分成兩類,再對每一類構(gòu)建二分類器,得到的一個“二叉樹”如圖12 所示。將皮膚病分類(白癜風、痤瘡、銀屑病、健康)的四分類的問題,標簽記為1(白癜風)、2(痤瘡)、3(銀屑病)、4(健康),第一個分類器先區(qū)分1(白癜風)、2(痤瘡)和3(銀屑病)、4(健康),再構(gòu)建2 個分類器分別區(qū)分1(白癜風)和2(痤瘡)、3(銀屑病)和4(健康),一個數(shù)據(jù)經(jīng)過2 個分類器即可獲得最終結(jié)果。然而該方法卻存在很多不足之處,由于圖像種類繁多,為每個二分類器單獨設(shè)計網(wǎng)絡(luò)不太現(xiàn)實,數(shù)據(jù)量的變化對網(wǎng)絡(luò)的訓(xùn)練有很大的影響,在數(shù)據(jù)量不足的時候很容易過擬合?;谏窠?jīng)網(wǎng)絡(luò)的多二分類器訓(xùn)練中若某個網(wǎng)絡(luò)中的二分類器出現(xiàn)分類錯誤,該分類器就無法獲得正確的分類結(jié)果。

      圖12 多個二分類器

      為降低分類時的錯誤率,隨后提出一種改進的方法。該方法的主要思想是首先獲得一個二叉樹,針對該二叉樹的每一層只構(gòu)造一個分類器,每個分類器都使用所有的數(shù)據(jù)集,使得每一個節(jié)點的孩子節(jié)點在其所在層對應(yīng)的分類器都屬于不同類別,具體如圖13 所示。對于最后一層若不包含所有標簽類別,將剩余標簽隨意加入兩類中的一類。以四分類為例,則只需要構(gòu)造2 個二分類器,第1 個用于區(qū)分1(白癜風)、2(痤瘡)和3(銀屑病)、4(健康);第2 個用于區(qū)分1(白癜風)、3(銀屑病)和2(痤瘡)、4(健康);經(jīng)過2 個分類器就可以得到結(jié)果。假如第1 個分類器將1(白癜風)、2(痤瘡)標記為0,3(銀屑病)、4(健康)標記為1;第2 個分類器將1(白癜風)、3(銀屑病)標記為0,2(痤瘡)、4(健康)標記為1。若一個數(shù)據(jù),第1 個分類器將其標記為1,第2個分類器也將其標記為1,則不對應(yīng)任何的情況,對于此問題,本研究提出了如下2 種解決方法。

      圖13 改進的多個二分類器

      (1) 對無法分類得出結(jié)果的數(shù)據(jù)再進一步分類。既然是不對應(yīng)任何結(jié)果的情況,那么至少有一個分類器在分類時出現(xiàn)了錯誤。那么由多個二分類器構(gòu)成的分類器則對這個數(shù)據(jù)不太適用,可以將這個難以識別的數(shù)據(jù)再放入多分類器進行判別。

      (2) 對無法分類得出結(jié)果的數(shù)據(jù)不做處理,由于這個數(shù)據(jù)在某個網(wǎng)絡(luò)中出現(xiàn)了錯誤,則多分類網(wǎng)絡(luò)在處理這個數(shù)據(jù)的時候很可能會出現(xiàn)錯誤,實驗中可再定義出一類記為無法判斷,不做任何處理。

      這2 種處理方法各有優(yōu)劣,第1 種不會出現(xiàn)無法判斷的情況,每一個數(shù)據(jù)都能給出一個結(jié)果,而第2 種方法簡單高效,可以對復(fù)雜特征減少誤判,后續(xù)的研究將對這2 種方案分別進行具體實驗分析。

      4 實驗結(jié)果分析

      4.1 AlexNet—實驗結(jié)果分析

      在訓(xùn)練皮膚病四分類(健康、銀屑病、痤瘡、白癜風)的CNN 時,首先嘗試了卷積神經(jīng)網(wǎng)絡(luò)Alex-Net。數(shù)據(jù)集中的訓(xùn)練集每類包含682 個樣本,測試集每類包含76 個樣本,該卷積神經(jīng)網(wǎng)絡(luò)的四分類結(jié)果如表2 所示。綜合實驗結(jié)果計算得到網(wǎng)絡(luò)的準確率是0.8750。

      表2 AlexNet 網(wǎng)絡(luò)四分類結(jié)果

      為了提高準確率,將數(shù)據(jù)集隨機分為三類(去掉健康皮膚的分類)和四類進行十折交叉驗證,三分類實驗結(jié)果為0.8202、0.8465、0.8596、0.8070、0.8356、0.8465、0.8421、0.8246、0.8133、0.8202,平均準確率為0.8320;四分類實驗結(jié)果為0.9049、0.8721、0.9049、0.9114、0.9102、0.9245、0.9213、0.9245、0.9278、0.9235、平均值為0.9125。該實驗表明實驗結(jié)果過分依賴于數(shù)據(jù)集的選取,可能是數(shù)據(jù)集少,不完善所造成的結(jié)果。

      為進一步提高準確率,實驗隨后使用了多二分類的方法,訓(xùn)練3 個二分類網(wǎng)絡(luò)后,針對無法判斷分類結(jié)果的數(shù)據(jù)再使用上述的四分類器,最終的實驗結(jié)果如表3 所示,計算實驗結(jié)果準確率為0.9177;如果將無法判斷的部分不做處理,得到的結(jié)果如表4所示,計算實驗結(jié)果準確率為0.9377。

      表3 AlexNet 多二分類和四分類實驗結(jié)果

      表4 AlexNet 網(wǎng)絡(luò)多二分類實驗結(jié)果

      通過上面的結(jié)果可以發(fā)現(xiàn),使用這個方法對結(jié)果的提升還是比較明顯的,在舍棄數(shù)據(jù)的情況下也可將準確率提升至93%。

      4.2 GoogLeNet-實驗結(jié)果分析

      在訓(xùn)練皮膚病四分類(健康、銀屑病、痤瘡、白癜風)的CNN 時,實驗又嘗試了卷積神經(jīng)網(wǎng)絡(luò)GoogLeNet,當使用GoogLeNet 網(wǎng)絡(luò)時的四分類結(jié)果如表5 所示,計算實驗結(jié)果準確率為0.8849。

      表5 GoogLeNet 網(wǎng)絡(luò)四分類結(jié)果

      為進一步提高準確率,實驗隨后又使用了多二分類的方法,在訓(xùn)練3 個二分類網(wǎng)絡(luò)后,針對無法判斷分類結(jié)果的數(shù)據(jù)再運用四分類器,最終的實驗結(jié)果如表6 所示,計算實驗結(jié)果準確率為0.88196;如果將無法判斷的數(shù)據(jù)不做處理,得到的結(jié)果如表7所示,計算實驗結(jié)果準確率為0.9242。在運用GoogLeNet 進行測試后,發(fā)現(xiàn)在舍棄一部分數(shù)據(jù)后準確率仍能得到顯著提高,即使舍棄數(shù)據(jù)僅占一小部分的比例。

      表6 GoogLeNet 多二分類和四分類實驗結(jié)果

      表7 GoogLeNet 多二分類實驗結(jié)果

      4.3 實驗分析

      綜合來看,多二分類器下AlexNet 和GoogLeNet模型對于準確率的提升效果一致。與普通的分類器相比,多二分類器能夠快速發(fā)現(xiàn)數(shù)據(jù)集的共同特征,在第1 種策略數(shù)據(jù)出錯時至少要有2 個二分類器出錯,降低了誤判的概率,準確率會比直接運用四分類器時高。第2 種策略舍棄的那部分數(shù)據(jù),必定是某個二分類器錯判的數(shù)據(jù),也是模型不易判斷的數(shù)據(jù),該部分數(shù)據(jù)在判斷的時候準確率會較低,舍棄數(shù)據(jù)后準確率會得到提升。與使用AlexNet 的結(jié)果相比,GoogLeNet 的準確率反而較低,所以不是網(wǎng)絡(luò)的結(jié)構(gòu)越復(fù)雜,效果越好。GoogLeNet 雖然在結(jié)構(gòu)上做了不少優(yōu)化,但是其二十幾層的深度要求更多的數(shù)據(jù)去訓(xùn)練,否則帶來的過擬合現(xiàn)象會降低測試集的準確率,因為本實驗數(shù)據(jù)相對較少,很容易出現(xiàn)過擬合現(xiàn)象。

      5 皮膚病診斷

      經(jīng)過對圖像塊的分類,得到了對于每個圖像塊的疾病概率,需將圖像的所有圖像塊信息進行整合以獲取最終的分類結(jié)果。通過對圖像塊的疾病分類預(yù)測得到每個圖像塊對應(yīng)的概率向量如下:

      Patch 1: (P11,P12,P13,P14)

      Patch 2: (P21,P22,P23,P24)

      Patch 3: (P31,P32,P33,P34)

      Patchn: (Pn1,Pn2,Pn3,Pn4)

      其中P11、P12、P13、P14分別是第i個圖像塊被判別為健康、銀屑病、痤瘡、白癜風的概率。然后用式(2)分別算出當前患者患有銀屑病、痤瘡、白癜風的歸一化概率。

      將最大概率所對應(yīng)的皮膚病類別判定為患者所患的疾病類型。圖14 是運用混淆矩陣的方法來展示處理后的效果圖。

      圖14 皮膚病分類

      其中(i,j) 位置上的圖是實際第i類樣本的圖像塊在第j類疾病上對應(yīng)的概率累計值的統(tǒng)計直方圖。通過觀察(x,x)、(y,y)、(z,z) 位置上的直方圖,每個樣本值都較高并均接近于1,說明patches信息的整合是很有效的。

      除了“混淆矩陣”的方法之外,本方法還采用了受試者工作特征(receiver operating characteristic,ROC)曲線來評價分類器的效果,如圖15 所示。在ROC 曲線中代表白癜風的曲線與坐標軸圍成的面積(即AUC 統(tǒng)計量)是0.9707;代表痤瘡的曲線與坐標軸圍成的面積(即AUC 統(tǒng)計量)是0.9668;表示銀屑病的曲線與坐標軸圍成的面積(即AUC 統(tǒng)計量)是0.9234。

      圖15 ROC 曲線

      對概率累計值取softmax 的診斷分類方法準確率可達到90.9836%,現(xiàn)實情況下,閾值的選取會影響分類器的真陽率(true positive rate,TPR)、假陽率(false positive rate,FPR),TPR、FPR 計算公式分別如式(3)、式(4)所示。

      準確率并不是唯一的分類器評價標準。某些情況下TPR 和FPR 的重要程度不同,由于某一種錯誤判斷需要承擔的風險和代價很大,所以不能將提高診斷準確率作為唯一標準,得到高的TPR 才是至關(guān)重要。

      下圖是在皮膚病分類診斷問題中,考察歸一化的概率累計得分在閾值λ 變動下TPR、FPR 和TPRFPR 的變化如圖16 所示(其中從上到下分別對應(yīng)白癜風、痤瘡、銀屑病)。

      圖16 TPR、FPR、TPR-FPR 變化曲線圖

      在現(xiàn)實問題中,可通過構(gòu)造一個關(guān)于TPR、FPR的函數(shù)用優(yōu)化方法確定閾值。記閾值為λ,目標是選取合適的閾值使得TPR 比較大并控制FPR,可如下表示:

      maxλf(TPRλ,FPRλ)

      其中f關(guān)于TPR 單調(diào)遞增,關(guān)于FPR 單調(diào)遞減,可以如式(5)所示。

      最佳閾值λ 的范圍和參數(shù)t的函數(shù)關(guān)系如圖17所示,其中兩條線段分別是最佳閾值的上下界。

      圖17 最佳閾值變化折線圖

      6 結(jié)論

      本研究構(gòu)建了從原始的醫(yī)學(xué)圖像數(shù)據(jù)預(yù)處理到疾病分類判斷的完整流程,并在三類常見皮膚病的診斷問題中得到檢驗。目前的工作仍存在很多問題與不足:(1)分類器過分依賴于計算資源;(2)使用的數(shù)據(jù)集過小,覆蓋的疾病種類有限,過多的網(wǎng)絡(luò)參數(shù)容易產(chǎn)生過擬合的問題;(3)基于圖像的疾病分類判斷未充分利用其他輔助信息,例如病人基本信息、化驗信息等;(4)未使用三類常見皮膚病的分類結(jié)果來研究這些疾病間的聯(lián)系。

      數(shù)據(jù)驅(qū)動的醫(yī)療輔助診斷方興未艾,相信在未來,隨著聯(lián)邦學(xué)習(xí)、集成學(xué)習(xí)等相關(guān)研究應(yīng)用到醫(yī)療影像診斷領(lǐng)域中,其在保護數(shù)據(jù)隱私的前提下會取得更大的進展和應(yīng)用。

      猜你喜歡
      銀屑病分類器準確率
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
      尋常型銀屑病治驗1則
      2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
      高速公路車牌識別標識站準確率驗證法
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
      尋常型銀屑病合并手指Bowen病一例
      鈣泊三醇倍他米松軟膏在銀屑病治療中的應(yīng)用
      宿迁市| 乌兰浩特市| 合水县| 延安市| 上林县| 淮北市| 绥宁县| 新郑市| 新民市| 屏东市| 昂仁县| 微山县| 手游| 措勤县| 花莲市| 乐安县| 抚州市| 日照市| 通州区| 莒南县| 象州县| 军事| 调兵山市| 泰顺县| 津市市| 云林县| 美姑县| 华池县| 汉中市| 曲沃县| 美姑县| 尉犁县| 郴州市| 博客| 绥棱县| 长葛市| 平南县| 昌江| 静乐县| 宾阳县| 水城县|