劉洋洋 唐奇伶
摘要 計算復雜度和時間的限制,如何快速準確地對醫(yī)學圖像分類依舊是個挑戰(zhàn)。本文提出了一種基于多尺度單層自編碼器的醫(yī)學圖像自動分類方法。實驗結(jié)果表明該系統(tǒng)提取到的特征的描述力和最終的識別率明顯優(yōu)于傳統(tǒng)方法。
關鍵詞 醫(yī)學圖像分類 稀疏自編碼器 稀疏表示分類器
0引言
醫(yī)學影像資料己成為輔助醫(yī)生進行臨床診斷、病情跟蹤、教學研究的重要客觀依據(jù)。若將這些數(shù)量巨大的醫(yī)學圖像進行手工分類歸納入醫(yī)院的信息庫中,難度是無法估計的,因此,醫(yī)學圖像自動分類方法的研究具有廣泛的應用前景。對醫(yī)學圖像分類系統(tǒng)來說,分類準確率和速度是兩個非常重要的評價指標,而影響這兩個指標最大因素就是是否提取到有效的醫(yī)學圖像特征。
近年來深度學習技術(shù)中的無監(jiān)督特征學習技術(shù)已經(jīng)成功地被應用于計算機視覺領域。因其不需要依賴于先驗知識,可以自適應地構(gòu)建有效的特征描述,所以靈活性和普遍性較傳統(tǒng)特征提取方法更具有優(yōu)越性。多尺度結(jié)構(gòu)是圖像的一種本質(zhì)屬性,不同的觀察尺度對圖像的度量是非常有用的。稀疏自編碼器(Sparse Auto-encoder,SAE)就是深度學習中最流行的代表性學習方法中的一種,該學習方法能實現(xiàn)良好的性能,并具有較少的調(diào)節(jié)參數(shù)和低的計算代價等優(yōu)點,在圖像特征表達中得到廣泛的運用。
盡管在過去幾年中基于SAE的特征學習算法取得很大進步,但是少有研究多尺度空間特征學習的。在視覺計算中多尺度的處理已經(jīng)被證明明顯優(yōu)于單尺度的版本,包括邊界檢測,圖像分割,對象識別等等。本文中,我們探索多尺度單層SAE網(wǎng)絡在醫(yī)學圖像分類中的應用。據(jù)我們所知,我們的工作是第一次嘗試在單層SAEs中組合多尺度特征學習。在分類階段,我們稀疏表示分類器(Sparse Representation-based Classification,SRC)進行分類,該分類器能夠有效地處理高維數(shù)據(jù),不同約束條件的添加使其更具靈活性。
1分類系統(tǒng)的基本框架
本研究提出的分類框架模型包括特征提取和分類器分類兩個階段。首先利用多尺度的單層SAE產(chǎn)生局部特征檢測器,通過與圖像卷積得到特征映射,然后對這些特征映射進行PCA降維,可以將不同長度的輸入轉(zhuǎn)換成一個固定長度的特征向量,最后采用SRC進行圖像分類,設計方案的整體流程圖如圖1。
1.1特征提取和降維
特征表達在目標識別與圖像分類等視覺任務中起著關鍵作用,我們將利用多尺度的單層SAE從原始醫(yī)學圖像中學習特征表達。SAE是一種自學習神經(jīng)網(wǎng)絡,它符合視覺皮層對外界刺激采用神經(jīng)稀疏表示原則,這既對繁雜冗余的信息提供了簡單表示,又利于上層傳感神經(jīng)抽取刺激中本質(zhì)的特征。SAE E41通過約束使得網(wǎng)絡隱藏層大部分神經(jīng)元的響應都為O,只有少數(shù)神經(jīng)元被激活工作。通過假設輸出值等于輸入值,訓練調(diào)整網(wǎng)絡參數(shù),得到每一層中的權(quán)重,其代價函數(shù)表達如下: