萬志勇, 周小安
(深圳大學 信息工程學院, 廣東 深圳 518000)
膽道閉鎖是嬰兒期常見的嚴重的肝疾病之一,如治療不及時將會危及生命?;加性摷膊〉膵雰簳腥缦?種臨床癥狀:蒼白色素大便、長期性黃疸和尿液呈黑色狀[1]。目前,肝門空腸吻合手術(Kasai手術)是膽道閉鎖的首要治療方法。(引用大便比色卡)手術的時間非常關鍵,在患病嬰兒2個月前進行手術要比2個月后進行手術的成功概率要高。為了提高嬰兒膽道閉鎖的存活率,早期膽道閉鎖的篩查就很有必要了。
目前主要是應用大便比色卡進行膽道閉鎖篩查,這是在1994年日本Matsui醫(yī)生首先提出通過大便顏色來早期篩查膽道閉鎖,通過讓嬰兒的母親每天觀察嬰兒大便的顏色,為早期診斷膽道閉鎖提供了可靠及有效的線索[2]。通過觀察患病嬰兒和健康嬰兒的大便顏色,來制作大便比色卡。將比色卡分為2類:正常組和異常組。圖1中的(1~3)是屬于異常組,大便的顏色包括白陶土色至淺黃色;圖1中的(4~6)為正常組,大便的顏色包括黃色至綠色[3]。家長每天通過對比大便比色卡上的圖片來觀察嬰兒大便的顏色,當觀察到嬰兒大便顏色對應異常組,則需要警惕嬰兒患膽道閉鎖的可能,應該及時到醫(yī)院進行相關的檢查。利用大便比色卡進行膽道閉鎖的篩查,這使得膽道閉鎖患兒的手術時間提前,提高了嬰兒的生存率。
圖1 大便比色卡
目前,卷積神經網(wǎng)絡在圖像識別分類任務中的應用越來越廣泛。研究中常見的模型種類與特征可分述如下。
(1)變積分自動編碼器(VAE)。具體來說,其特殊之處在于設計中試圖將編碼的潛在向量構建為均值和方差的高斯概率分布。
(2)GoogleNet模型。這是有9個相同的并行卷積神經網(wǎng)絡,具有下采樣功能。其執(zhí)行時間比商用硬件上的VGG或ResNet好。
(3)ResNet50模型。是Microsoft研究發(fā)布的高度準確的模型。但其準確性的增加卻是以計算開支為代價的。而且在模型內存成本和執(zhí)行時間上都超過了GoogleNet。模型的優(yōu)點是精度高,缺點是模型相對復雜。
(4)VGG16模型。主要用于大規(guī)模圖像識別的深層次卷積網(wǎng)絡。VGG由牛津大學的研究人員出版。推介亮點在于其簡潔的結構風格。大多數(shù)網(wǎng)絡由簡單級聯(lián)方式的卷積層和丟失層組成。設計優(yōu)勢是簡單性,缺點是高內存和計算成本。
本文中用到的分類模型是GoogleNet InceptionV3。
本論文實驗的數(shù)據(jù)來自深圳市兒童醫(yī)院。其中包括16名患有膽道閉鎖的嬰兒和20名正常的嬰兒。在每天的早晨通過照相機拍照獲得患病和正常嬰兒的大便圖像。被收集到的圖像先經過初步的篩選,而后每張照片再經過醫(yī)生的檢查,從而來標定這張圖像是屬于正常、還是異常。在本文的實驗中,研究一共收集到了2 524張圖像,1 120張是正常的,1 404張圖像是異常的。在數(shù)據(jù)訓練和測試的時候,將正常的圖像標簽設定為1,異常的圖像標簽設定為0。視像標定結果即如圖2所示。同時,又把這些數(shù)據(jù)按7:3的比例劃分訓練集和測試集。
(a)異常(0) (b)正常(1)
本文的組織結構如圖3所示。首先是圖像的獲取,然后是對圖像進行預處理,使得圖像的大小符合模型的輸入特征,接下來調整一系列的參考,讓模型更加擬合真實值。最后即是分類結果預測。
圖3文章整體結構
Fig.3Overallstructureofarticles
本次論文中用到的卷積神經網(wǎng)絡的模型是GoogleNet的InceptionV3。網(wǎng)絡的結果如圖4所示。由圖4可見,網(wǎng)絡是從上至下運行的,上一個的輸出作為下一個的輸入[4]。經過預處理模型的輸入層大小為64641。使用64個55的卷積核對輸入做卷積,然后再使用大小為33、步幅為3的池化。此時得到圖像的輸出大小為202064。接下來,圖像要經過7個inception單元,經過每個單元處理后圖像的特征逐漸增加,運行得到600個33圖像,將這33600的圖像展開為一維圖像,同時又連接一個大小為4 096的全連接層,最后再連接一個Softmax回歸。
本文的所有試驗過程都是在tensorflow平臺上運行的,Adam算法的學習速率設置為0.001。在模型訓練過程中,研究將數(shù)據(jù)分為訓練集和測試集,通過不斷的迭代和參數(shù)調整,最終則在訓練集上獲得了95.1%的準確率,在后面的測試集上又獲得了83.5%的準確率。同以往其它模型對嬰兒大便圖像的識別比較后可知,本文提出的模型方法獲得了最高的準確率。本文模型與其它模型識別準確率的差別對比詳見表1。
表1 與其它模型相比較結果
本次研究提出了一種基于卷積神經網(wǎng)絡中GoogleNet InceptionV3模型來識別嬰兒大便圖像的方法,從而對早期嬰兒膽道閉鎖疾病進行篩查,獲得了不錯的效果。在此過程中,卻仍有亟待改進之處。首先,數(shù)據(jù)集的數(shù)目不足可能會影響到實驗結果的準確性。再就是,未能在不同的卷積神經網(wǎng)絡的模型下對數(shù)據(jù)進行訓練和測試。在后續(xù)的工作中將進一步獲得更多的數(shù)據(jù)來保障訓練需要,而且也將選用不同的卷積神經網(wǎng)絡模型來對數(shù)據(jù)進行訓練,如變積分自編碼(VAE)、VGG16、殘差網(wǎng)絡(Resnet)。
圖4 卷積網(wǎng)絡模型結構
本文基于卷積神經網(wǎng)絡來識別嬰兒的大便圖像,從而對膽道閉鎖進行早期的篩查。通過GoogleNet網(wǎng)絡InceptionV3模型來訓練數(shù)據(jù),對模型的參數(shù)進行適當?shù)男薷?,觀察擬合帶的程度,從而確定最佳的模型參數(shù)。相較之前對大便圖像的識別分類,本文提出的方法獲得了較高的準確率。卷積神經網(wǎng)絡在圖像的分類識別領域有很大的優(yōu)勢,利用卷積神經網(wǎng)絡中的模型來對嬰兒大便圖像進行識別分類,有助于患兒早期膽道閉鎖的診斷,提高了患病嬰兒的存活率[5]。