吳蓉,趙敏,孫通,徐君,姚敏
(南京航空航天大學(xué) 自動化學(xué)院,江蘇 南京 211106)
正電子湮沒技術(shù)(positron annihilation technology, PAT)[1]作為一種非侵入式的核物理技術(shù),是當(dāng)今科學(xué)研究的重點(diǎn)領(lǐng)域之一。該技術(shù)通過回旋加速器獲得半衰期短的核素,該類核素經(jīng)過β+衰變產(chǎn)生正電子,其與附近的電子發(fā)生碰撞,產(chǎn)生一對能量為511 KeV、方向互成180°、呈電中性的γ光子[2]。利用設(shè)備對其進(jìn)行探測并成像獲得被測對象的γ光子圖像。
對γ光子圖像進(jìn)行分類能夠在后續(xù)處理中有針對性地獲得圖像的有效信息。目前,常用的圖像分類算法如K最近鄰[3]、決策樹[4]、支持向量機(jī)[5]等在圖像分類任務(wù)中有不錯的效果。但由于γ光子圖像在快速采集情況下分辨率低且噪聲大的缺點(diǎn),使得上述方法難以獲得理想的分類效果。因此,本文提出利用深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)[6]對γ光子圖像進(jìn)行分類識別,通過訓(xùn)練可提高γ光子圖像分類識別的精度。
卷積神經(jīng)網(wǎng)絡(luò)在很多視覺分類任務(wù)中達(dá)到了甚至超過了人類認(rèn)知,其最大的特點(diǎn)在于局部感知和權(quán)值共享,有效減少了網(wǎng)絡(luò)參數(shù),加快了網(wǎng)絡(luò)訓(xùn)練速度。卷積神經(jīng)網(wǎng)絡(luò)對平移、縮放、旋轉(zhuǎn)等畸變具有不變性,提高了特征的魯棒性和穩(wěn)定性。本文采用構(gòu)建在MATLAB上的卷積神經(jīng)網(wǎng)絡(luò)工具包MatConvNet作為DCNN的平臺。
在分類任務(wù)中,如果僅采用γ光子圖像構(gòu)成樣本空間,由于數(shù)據(jù)量大,實(shí)際上很難實(shí)現(xiàn)。因此,本文采用遷移學(xué)習(xí)(transfer learning)的方法,利用在大規(guī)模數(shù)據(jù)集ImageNet上預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,利用γ光子圖像樣本集對網(wǎng)絡(luò)參數(shù)進(jìn)行不斷地訓(xùn)練與微調(diào),實(shí)現(xiàn)對γ光子圖像的準(zhǔn)確分類。對于γ光子圖像這種小樣本空間,這是一種非常有效的構(gòu)建DCNN分類器的方法。
GATE(geant application for tomographic emission)是一款能夠真實(shí)模擬正電子探測成像系統(tǒng)的仿真軟件。為驗(yàn)證DCNN對γ光子圖像分類識別的有效性,本文構(gòu)建了一系列在設(shè)計(jì)上考慮了工業(yè)應(yīng)用特點(diǎn)的樣本模型:管材空腔呈現(xiàn)一定的幾何形狀,將其截面的γ光子圖像作為訓(xùn)練樣本,圖形上既有差別明顯的,但也容易混淆。
仿真中設(shè)置了23對探測頭,每個(gè)探測頭由1×4個(gè)模塊組成,每個(gè)模塊由8×16個(gè)晶體組成。每個(gè)閃爍晶體分為兩層:內(nèi)層為LSO晶體,外層為LuAP晶體,晶體大小均為1.1mm×2.2mm×10mm,探測器半徑約為69mm。管材模型內(nèi)部填充核素溶液,其活度為每像素2 000Bq,探測器數(shù)量為184×64,掃描時(shí)間為1s,能量分辨率為15%,時(shí)間分辨率為300ps,能量窗口為350~650keV,時(shí)間窗口為10ns。設(shè)計(jì)掃描時(shí)間為1s是考慮工業(yè)應(yīng)用采樣速度快的需求,這會導(dǎo)致圖像重建質(zhì)量下降并使得圖像的識別與分類困難,卻恰好可以驗(yàn)證DCNN的適應(yīng)能力。
設(shè)計(jì)了10組管材模型,如圖1所示。其中形狀相同缺陷方向不同的圖形均容易造成識別錯誤。圖2是對這10組模型的探測數(shù)據(jù)采用極大似然期望值最大[7](maximum likelihood expectation maximization, MLEM)算法重建獲得的第36張切片圖(每類模型有64張切片圖,同一類的每張切片圖存在一定的差別)。
圖1 實(shí)驗(yàn)?zāi)P?/p>
圖2 部分γ光子圖像樣本
由于被測對象的位置差異和探測器結(jié)構(gòu)差異,相鄰切片圖像之間也存在微小差異。為了提高訓(xùn)練數(shù)據(jù)的質(zhì)量和豐富性,本文利用這種差異進(jìn)行數(shù)據(jù)增強(qiáng)(data augmentation)。為此,選取一張γ光子切片圖n時(shí),利用其相鄰的兩張切片n-1和n+1,構(gòu)成RGB 3個(gè)通道的圖像,如圖3所示。
圖3 3張切片構(gòu)成RGB圖像
為了盡可能地增加γ光子圖像的特征,本文采用建立索引表的方式構(gòu)建有索引表的RGB圖像,這樣,就可以在圖像上充分反映出管材內(nèi)的核素濃度分布情況,由此增加了γ光子圖像的細(xì)節(jié)特征。實(shí)際操作如下:獲得由相鄰3張γ光子切片圖生成的RGB圖像中某一張的顏色映射表,并將所有γ光子圖像的灰度級排列與該顏色映射表作一一對應(yīng),生成最終用于訓(xùn)練的γ光子圖像樣本(圖4)。
圖4 經(jīng)過圖像預(yù)處理后的圖像樣本
在10類模型的切片圖中任選30張作為訓(xùn)練集,共有300張訓(xùn)練圖像;再選擇6張作為驗(yàn)證集,共60張驗(yàn)證圖像;再另選擇6張作為測試集,共60張測試圖像。
為了得到γ光子圖像的最佳分類效果,需要對所構(gòu)建的DCNN網(wǎng)絡(luò)中目標(biāo)函數(shù)進(jìn)行權(quán)重規(guī)整,以防止參數(shù)更新過程出現(xiàn)太大的權(quán)值,其相應(yīng)的權(quán)重更新公式為
(1)
其中:β表示權(quán)重衰減因子;η表示學(xué)習(xí)率;ρ表示動量因子。對以上參數(shù)設(shè)置不同的值進(jìn)行訓(xùn)練。
1) 為了比較不同動量對網(wǎng)絡(luò)性能的影響,固定的權(quán)重衰減和學(xué)習(xí)率,設(shè)置動量分別為0.5、0.7、0.9、0.99進(jìn)行了實(shí)驗(yàn)。訓(xùn)練結(jié)果如圖5所示。
從圖5中可以看出,當(dāng)動量取0.5和0.7時(shí),網(wǎng)絡(luò)無法收斂;當(dāng)動量取0.99時(shí),網(wǎng)絡(luò)要么無法收斂,要么精度極低;而當(dāng)動量取0.9時(shí),網(wǎng)絡(luò)不僅快速收斂,而且在驗(yàn)證集上的準(zhǔn)確率較高,因而選擇動量為0.9。
圖5 不同動量對網(wǎng)絡(luò)性能的影響
2) 為了比較不同學(xué)習(xí)率對網(wǎng)絡(luò)性能的影響,固定權(quán)重衰減,設(shè)置動量為0.9,學(xué)習(xí)率分別為0.000 01、0.000 1、0.001、0.01、0.1進(jìn)行實(shí)驗(yàn)。圖6是權(quán)重衰減分別為0.000 5和0.05時(shí)兩組訓(xùn)練結(jié)果。
圖6 不同學(xué)習(xí)率對網(wǎng)絡(luò)性能的影響
從圖6中可以看出:當(dāng)學(xué)習(xí)率取0.000 01、0.01和0.1時(shí),網(wǎng)絡(luò)振蕩比較嚴(yán)重,收斂所需要的時(shí)間較長;當(dāng)學(xué)習(xí)率取0.000 1和0.001時(shí),網(wǎng)絡(luò)收斂速度均比較快,但從驗(yàn)證集上的準(zhǔn)確率來看,學(xué)習(xí)率取0.001更佳。
3) 為了比較不同權(quán)重衰減對網(wǎng)絡(luò)性能的影響,設(shè)置動量為0.9,學(xué)習(xí)率為0.001,權(quán)重衰減分別為0.000 1、0.000 5、0.005、0.05進(jìn)行實(shí)驗(yàn)。其訓(xùn)練結(jié)果如圖7所示。
圖7 不同權(quán)重衰減對網(wǎng)絡(luò)性能的 影響
從圖7可以看出,權(quán)重衰減對網(wǎng)絡(luò)振蕩的影響不大,而當(dāng)權(quán)重衰減為0.000 5時(shí),網(wǎng)絡(luò)在驗(yàn)證集上的準(zhǔn)確率較高。
通過上述反復(fù)實(shí)驗(yàn),最終確定網(wǎng)絡(luò)參數(shù)為:動量為0.9,權(quán)值衰減參數(shù)為5×10-4,學(xué)習(xí)率為0.001。采用該參數(shù)對處理后的γ光子圖像樣本集進(jìn)行訓(xùn)練并分類識別,其在驗(yàn)證集上分類的準(zhǔn)確率可達(dá)到97.34%。將訓(xùn)練好的網(wǎng)絡(luò)在測試集上進(jìn)行測試,發(fā)現(xiàn)在測試集上的準(zhǔn)確率達(dá)到了95.69%。
為了進(jìn)一步驗(yàn)證DCNN對γ光子圖像的分類能力,利用GATE仿真得到掃描時(shí)間為0.1s的γ光子圖像,如圖8中部分圖像所示。與掃描時(shí)間為1s的γ光子圖像相比,其圖像質(zhì)量有明顯下降。利用訓(xùn)練好的網(wǎng)絡(luò)對掃描時(shí)間為0.1s的γ光子圖像進(jìn)行分類識別,發(fā)現(xiàn)其在該樣本集上的分類準(zhǔn)確率也達(dá)到了94.72%。部分分類結(jié)果如圖8所示,表明本文所構(gòu)建的DCNN分類器對正電子圖像有很強(qiáng)的分類能力。
圖8 部分分類結(jié)果示例
γ光子圖像具有分辨率低、噪聲大等特點(diǎn),傳統(tǒng)的圖像分類識別方法很難對其進(jìn)行有效地分類識別。因此,本文提出利用深度卷積神經(jīng)網(wǎng)絡(luò)對其進(jìn)行分類識別。利用建立顏色索引表的圖像預(yù)處理方法,通過對DCNN網(wǎng)絡(luò)參數(shù)的調(diào)整,使得其在γ光子圖像的訓(xùn)練集和測試集上都獲得了令人滿意的結(jié)果。接下來,需要進(jìn)一步擴(kuò)大γ光子圖像樣本庫的數(shù)量及類別,同時(shí)需要在樣本庫中添加更為復(fù)雜的樣本以及與實(shí)際應(yīng)用相關(guān)的樣本,從而進(jìn)一步提高該算法的實(shí)際應(yīng)用價(jià)值。