葉鈞翔
摘要:本文對(duì)已有的高性能卷積神經(jīng)網(wǎng)絡(luò)框架進(jìn)行修改,簡(jiǎn)化網(wǎng)絡(luò)的同時(shí)保留原網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)以及優(yōu)秀性能,利用IDC數(shù)據(jù)集訓(xùn)練得到高性能的病理圖片區(qū)域分類器,可用于實(shí)現(xiàn)病理圖像區(qū)域的自動(dòng)分割。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);病理圖片;區(qū)域分類
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)07-0056-02
1 概述
1.1 應(yīng)用背景
高通量自適應(yīng)性采樣法(HASHI)是一種有效的利用卷積神經(jīng)網(wǎng)絡(luò)的病理圖片區(qū)域分割算法。該算法通過在整張標(biāo)注陽(yáng)性區(qū)域的病理圖片上進(jìn)行常規(guī)采樣,獲取得到標(biāo)注的區(qū)域圖片,將這些圖片作為卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,得到一個(gè)病理圖片區(qū)域分類器。在進(jìn)行病理圖片區(qū)域分割時(shí),該算法使用擬蒙特卡洛法以及梯度插補(bǔ)法對(duì)未標(biāo)注的病理圖片進(jìn)行采樣,并使用訓(xùn)練得到的分類器對(duì)采樣得到的區(qū)域圖片進(jìn)行分類,得到病理圖片的概率熱圖,從而實(shí)現(xiàn)病理圖片的自動(dòng)區(qū)域分割。以卷積神經(jīng)網(wǎng)絡(luò)為模型的分類器作為高通量自適應(yīng)采樣法的主要部分,極大地影響了整個(gè)系統(tǒng)的性能。所以,得到一個(gè)高性能、適應(yīng)應(yīng)用場(chǎng)景的卷積神經(jīng)網(wǎng)絡(luò)模型是提高整體算法性能的關(guān)鍵。
1.2 卷積神經(jīng)網(wǎng)絡(luò)
隨著如VGGNet、GoogLeNet、ResNet等卷積神經(jīng)網(wǎng)絡(luò)模型的提出,以及其預(yù)訓(xùn)練模型和遷移學(xué)習(xí)的廣泛運(yùn)用,這些能較好地解決大多數(shù)應(yīng)用場(chǎng)景中的問題,但由于這些大型模型的輸入分辨率過大以及提取特征針對(duì)性不強(qiáng)的限制,無(wú)法在病理圖片區(qū)域分類這一數(shù)據(jù)集精度高、分辨率小的應(yīng)用場(chǎng)景中直接使用。
針對(duì)上文所述的問題,本文通過對(duì)已有的前沿的卷積神經(jīng)網(wǎng)絡(luò)框架進(jìn)行修改、簡(jiǎn)化,保留原模型的特征以及性能優(yōu)勢(shì),相對(duì)中使用的模型,有更高的復(fù)雜度以及更好的性能。
2 卷積神經(jīng)網(wǎng)絡(luò)構(gòu)架
在嘗試了若干卷積神經(jīng)網(wǎng)絡(luò)特征結(jié)構(gòu)后(如Inception,ResNet),本文選擇了Res2Net作為模型的基本框架結(jié)構(gòu),并將該模式應(yīng)用于深度較淺的輕量級(jí)模型當(dāng)中。本文模型的基本結(jié)構(gòu)如圖1所示。
2.1 關(guān)于Res2Net
Res2Net是在頸狀結(jié)構(gòu)以及殘差塊結(jié)構(gòu)基礎(chǔ)之上改進(jìn)得到的一種網(wǎng)絡(luò)結(jié)構(gòu),它將頸狀結(jié)構(gòu)中單一的卷積層替換為一組卷積層,這些卷積層以分層的類殘差結(jié)構(gòu)相連接,這樣的結(jié)構(gòu)在不增加模型計(jì)算復(fù)雜度的同時(shí)可以豐富網(wǎng)絡(luò)提取的語(yǔ)義信息,提高輸出特征圖可呈現(xiàn)的多尺度性。具體來(lái)講,在Res2Net結(jié)構(gòu)當(dāng)中,輸入的特征圖被分為了若干組,每一組卷積層從一組輸入的特征圖中提取特征,上一級(jí)卷積層輸出的特征圖會(huì)被下一級(jí)作為輸入的一部分。這個(gè)過程會(huì)重復(fù)多次,直到所有的輸入特征圖都被處理完。最后,所有輸出的特征圖拼接在一起,再通過一個(gè)卷積核尺寸為1×1的卷積層實(shí)現(xiàn)多尺度信息的融合。
2.2 模型設(shè)計(jì)
在醫(yī)學(xué)圖像區(qū)域分類的應(yīng)用場(chǎng)景下,樣本圖片的分辨率低,且所呈現(xiàn)的低級(jí)特征較多,高級(jí)特征較少。針對(duì)該特點(diǎn),本文在設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)時(shí)提高了第一個(gè)卷積層中卷積核的初始數(shù)量,并在之后使用Res2Net結(jié)構(gòu)拓展了網(wǎng)絡(luò)的寬度,且在網(wǎng)絡(luò)深度受到輸入圖片分辨率限制的條件下保證輸出特征圖感受域的大小。由于使用Res2Net結(jié)構(gòu),模型在有一定結(jié)構(gòu)復(fù)雜度的同時(shí)有著較小的計(jì)算復(fù)雜度。為了降低模型的計(jì)算復(fù)雜度,在卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)當(dāng)中總會(huì)加入一定數(shù)量的下采樣層來(lái)縮減特征圖的尺寸,去除其中冗余的信息。由于該應(yīng)用場(chǎng)景數(shù)據(jù)集中的樣本圖片所包含的信息精度較高,使用常用的池化層可能會(huì)丟失大量的有用信息,本文使用了步長(zhǎng)為2的卷積層代替了池化層。通過實(shí)驗(yàn)表明,該設(shè)計(jì)能有效地提高模型的性能。與傳統(tǒng)的設(shè)計(jì)方法相同,該模型在最后一個(gè)卷積層后使用了全連接層利用輸出的特征圖進(jìn)行分類。在激活函數(shù)的選擇上,除了輸出層使用的Softmax函數(shù),其它結(jié)構(gòu)均使用LeakyReLU函數(shù),相比于傳統(tǒng)的ReLU函數(shù),LeakyReLU函數(shù)給所有的負(fù)值賦予了一個(gè)非零斜率,可以解決ReLU函數(shù)進(jìn)入負(fù)區(qū)間后神經(jīng)元停止學(xué)習(xí)的情況。
3 實(shí)驗(yàn)及結(jié)果分析
3.1 數(shù)據(jù)集
(1)數(shù)據(jù)集描述。本文使用的原數(shù)據(jù)集包含了162張已經(jīng)標(biāo)注IDC區(qū)域的浸潤(rùn)性導(dǎo)管癌病理圖片,放大倍數(shù)為40x。通過以50×50像素為單位對(duì)病理圖片中的感興趣區(qū)域進(jìn)行不重疊采樣切割,得到共計(jì)277,524張圖片切塊,其中198,738張標(biāo)注為IDC陰性,78,786張標(biāo)注為IDC陽(yáng)性。數(shù)據(jù)集中的樣本示例圖2所示。
之后對(duì)處理過的數(shù)據(jù)集進(jìn)行分層采樣,以6:4的比例將處理過的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,并保證兩者中陰性樣本與陽(yáng)性樣本的比例相同,利于模型的訓(xùn)練以及之后的性能檢驗(yàn)。在訓(xùn)練過程中,圖片將被預(yù)處理縮減為32×32的尺寸。
(2)數(shù)據(jù)增強(qiáng)。數(shù)據(jù)增強(qiáng)是緩解由于數(shù)據(jù)集樣本不足而導(dǎo)致模型欠擬合的一種有效方法,通過對(duì)數(shù)據(jù)集樣本加入噪聲,還可以提高模型的魯棒性和泛化性。本文在訓(xùn)練模型的過程中以batch為單位,對(duì)訓(xùn)練集中的圖片在限定范圍內(nèi)進(jìn)行小幅的隨機(jī)平移、隨機(jī)翻轉(zhuǎn)、隨機(jī)旋轉(zhuǎn)和隨機(jī)放大,并以與原圖片相同的背景色作為變換后缺失部分的填充色,以達(dá)到高強(qiáng)度的實(shí)時(shí)數(shù)據(jù)增強(qiáng),并且保持圖片中關(guān)鍵信息的完整性,直到達(dá)到指定的epoch。
3.2 訓(xùn)練策略
(1)優(yōu)化算法:本文模型使用Adam作為優(yōu)化算法。Adam是一種可以替代傳統(tǒng)隨機(jī)梯度下降過程的一階優(yōu)化算法,它能基于訓(xùn)練數(shù)據(jù)迭代地更新神經(jīng)網(wǎng)絡(luò)權(quán)重,相對(duì)于常用的SGD算法,Adam有著計(jì)算高效、內(nèi)存占用少、快速調(diào)參等優(yōu)勢(shì)。(2)類別平衡:由于病理圖片的數(shù)據(jù)特性,數(shù)據(jù)集中陰性樣本的數(shù)量會(huì)以不同程度地大于陽(yáng)性樣本,所以訓(xùn)練得到的分類器會(huì)出現(xiàn)陰性樣本預(yù)測(cè)正確率高,陽(yáng)性樣本預(yù)測(cè)正確率低的情況,導(dǎo)致分類器的綜合性能不能達(dá)到應(yīng)用場(chǎng)景的需求。本文通過改變代價(jià)函數(shù)中陽(yáng)性樣本的權(quán)值來(lái)緩解該問題,經(jīng)過多次實(shí)驗(yàn)比較,當(dāng)陽(yáng)性樣本的權(quán)值為1.5時(shí)模型的綜合性能較優(yōu)。
3.3 實(shí)驗(yàn)結(jié)果
本文將本文使用的模型與不使用Res2Net的頸狀模型以及傳統(tǒng)淺層網(wǎng)絡(luò)模型通過同樣的訓(xùn)練策略進(jìn)行訓(xùn)練,將訓(xùn)練的過程以及結(jié)果進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果表明使用Res2Net結(jié)構(gòu)的模型較頸狀模型以及傳統(tǒng)淺層網(wǎng)絡(luò)模型在訓(xùn)練過程中能更好地?cái)M合數(shù)據(jù)集的分布情況。對(duì)比傳統(tǒng)的淺層網(wǎng)絡(luò),本文模型有著明顯的性能優(yōu)勢(shì),在經(jīng)過25個(gè)epochs之后優(yōu)勢(shì)擴(kuò)大至近2.15%。在訓(xùn)練結(jié)束后,本文通過模型在測(cè)試集上的混淆矩陣對(duì)各個(gè)模型的性能進(jìn)行評(píng)估,評(píng)估標(biāo)準(zhǔn)使用了正確率(Accuracy)、查全率(Recall)、準(zhǔn)確率(Precision)、F1得分(F1-Score)。圖3所示中的結(jié)果表明使用了Res2Net結(jié)構(gòu)的本文模型在四項(xiàng)標(biāo)準(zhǔn)上都呈現(xiàn)可觀的優(yōu)勢(shì)。
4 結(jié)語(yǔ)
本文使用Res2Net結(jié)構(gòu)設(shè)計(jì)了一個(gè)適用于病理圖片區(qū)域分類應(yīng)用場(chǎng)景的卷積神經(jīng)網(wǎng)絡(luò),利用公開的IDC數(shù)據(jù)集對(duì)該網(wǎng)絡(luò)模型進(jìn)行了訓(xùn)練,得到一個(gè)高性能的病理圖片區(qū)域分類器,通過實(shí)驗(yàn)驗(yàn)證,該分類器相對(duì)使用頸狀模型以及傳統(tǒng)淺層網(wǎng)絡(luò)模型的分類器在各個(gè)評(píng)判標(biāo)準(zhǔn)上有著全面的優(yōu)勢(shì),證明了Res2Net結(jié)構(gòu)在淺層網(wǎng)絡(luò)應(yīng)用的有效性。該模型可以直接在HASHI算法或其它使用區(qū)域分類來(lái)實(shí)現(xiàn)病理圖片區(qū)域分割的算法當(dāng)中,作為高性能的區(qū)域分類器提高算法的整體性能。在未來(lái)的發(fā)展與應(yīng)用當(dāng)中,本文的模型或其設(shè)計(jì)方法可以被應(yīng)用于病理圖片區(qū)域識(shí)別或其它醫(yī)療智能診斷領(lǐng)域。同樣,在各個(gè)不同的應(yīng)用場(chǎng)景中,可以合適地使用如Res2Net等優(yōu)秀網(wǎng)絡(luò)結(jié)構(gòu)來(lái)提高卷積神經(jīng)網(wǎng)絡(luò)的性能。