高春宇 湯秀章 陳欣南 李雨芃 呂建友
(中國原子能科學(xué)研究院 北京市 102413)
2003 年,美國洛斯-阿拉莫斯國家實驗室LANL (Los Alamos National Laboratory) 根據(jù)模擬和實驗結(jié)果,提出利用μ 子的多重庫倫散射現(xiàn)象探測隱藏在集裝箱中的核材料,引起世界上許多科學(xué)家的廣泛關(guān)注,極大地推動了μ 子在核探測領(lǐng)域的研究應(yīng)用。地球上的μ 子大都來自于太空中的宇宙射線,在地球海平面處平均能量為3GeV,平均通量約為10000m·min。μ 子作為一種天然輻射源,沒有輻照危害,同時對高Z 物質(zhì)敏感,穿透能力強,在核材料檢測技術(shù)應(yīng)用中具備天然優(yōu)勢。
根據(jù)μ 子穿過被探測物體后的散射角分布進行成像,LANL 等先后提出了多種圖像重建算法,其中最典型的是PoCA 算法和MLSD 算法。由于天然μ 子的通量有限,為了提高μ 子成像的圖像質(zhì)量,通常需要較長的檢測時間,而在集裝箱、貨物核材料走私檢測等要求時效性的現(xiàn)場應(yīng)用場景,需要快速地進行材料識別。對于μ 子材料識別,清華大學(xué)研究了基于支持向量機的聚類分析和分類器,根據(jù)散射密度的平均值和標(biāo)準(zhǔn)偏差進行物質(zhì)識別。中國科學(xué)技術(shù)大學(xué)通過計算待識別目標(biāo)物與參考物之間散射角的灰色關(guān)聯(lián)度快速識別材料。
為提高宇宙射線μ 子探測核材料的實用性,縮短探測時間,我們提出一種將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于μ 子成像材料識別的方法。利用Geant4 蒙卡程序中的宇宙射線生成器CRY 軟件包,加入角度和能量分布信息模擬產(chǎn)生天然環(huán)境μ 子源,μ 子成像探測器模型由上下兩部分共4 層100cm×100cm 的探測器陣列構(gòu)成,10cm×10cm×10cm 的鋁、鐵、鎢作為被探測樣品放入探測區(qū)域中心,使用PoCA 算法處理模擬數(shù)據(jù)得到μ 子散射角分布,構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的材料識別模型,通過數(shù)據(jù)訓(xùn)練優(yōu)化模型并測試樣品在1 分鐘、2 分鐘、 5 分鐘和10 分鐘不同探測時間下的識別準(zhǔn)確度。
宇宙線μ 子穿過被探測樣品時,會發(fā)生多次小角度的庫倫散射,每次小角度散射都會對粒子運動產(chǎn)生一定的影響,多次散射積累使得μ 子的運動方向產(chǎn)生了偏移,μ 子散射成像利用散射角分布與材料原子序數(shù)的關(guān)系進行成像和識別。根據(jù)莫里埃理論,μ 子的散射角θ 近似服從期望為0 的高斯分布,分布均方根RMS 為:
本文使用Geant4 程序進行宇宙射線μ 子散射成像的蒙特卡羅模擬,建立實驗裝置模型。在模擬中,定義上下兩部分共4 層100cm×100cm 的探測器陣列記錄μ 子的位置信息,上部分探測器用來擬合入射徑跡,下部分探測器用來擬合出射徑跡,每層探測器高度間隔30cm,上下兩部分探測器之間為探測區(qū)域,高度100cm,探測面積100cm×100cm,分別將10cm×10cm×10cm 的鋁、鐵、鎢塊放入探測區(qū)域中心,使用宇宙射線生成器CRY 軟件包,引入海平面宇宙線μ 子能譜及角分布源項進行天然環(huán)境模擬。
考慮到地球海平面處μ 子通量約為10000m·min,模擬顯示在100cm×100cm 的探測區(qū)域上,1 分鐘大約有1600個μ 子能夠穿過四層探測器,重建有效徑跡。在本模型中,1600 條μ 子散射角數(shù)據(jù)等效于1 分鐘的探測時間,依次模擬不同的探測時間,輸出各層探測器記錄的μ 子位置信息。
徑跡重建算法PoCA 假設(shè)μ 子的多次庫倫散射為一次散射的結(jié)果,計算簡單,運算量小,本文使用PoCA 算法處理Geant4 模擬數(shù)據(jù)并重建μ 子徑跡。對經(jīng)過探測區(qū)域的有效μ子的位置信息進行徑跡擬合,重建μ 子入射、出射徑跡,延長入射、出射徑跡得到的交點認(rèn)為是μ 子的近似散射點,即PoCA 點,兩條徑跡的夾角作為μ 子的散射角。
根據(jù)聚類分析的思想,將100cm×100cm 探測區(qū)域劃分為50×50 的網(wǎng)格,每個網(wǎng)格為2cm×2cm,獲取穿過每個網(wǎng)格的所有μ 子的散射角,計算該網(wǎng)格的散射密度。根據(jù)散射密度的定義,得到第i 個網(wǎng)格散射密度的估計值為:
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,通常由卷積層、池化層和全連接層三層結(jié)構(gòu)組成。卷積神經(jīng)網(wǎng)絡(luò)中每個神經(jīng)元只與輸入神經(jīng)元的部分區(qū)域連接,捕獲局部數(shù)據(jù)信息,保證學(xué)習(xí)后的卷積核能夠?qū)植刻卣饔凶顝姷捻憫?yīng)。同時卷積核參數(shù)共享,用同一個卷積核提取特征,進一步減少了參數(shù)的數(shù)量。采用局部連接和權(quán)值共享能夠降低網(wǎng)絡(luò)的復(fù)雜度,提高學(xué)習(xí)速率。
我們將散射密度矩陣作為網(wǎng)絡(luò)的輸入數(shù)據(jù),維度由50×50 重置為1×2500,定義了一個包含兩個卷積層、兩個池化層和一個全連接層的簡單的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。第一個卷積層有64 個(3x3)卷積核,第二個卷積層有32 個(3x3)卷積核,卷積層通過卷積核與輸入數(shù)據(jù)進行卷積計算,以掃描的方式對輸入數(shù)據(jù)進行特征提取。卷積層輸出的特征圖被傳遞至池化層進行特征選擇和信息過濾,進一步降低數(shù)據(jù)維度,加快模型訓(xùn)練速度。如圖1 所示,經(jīng)過多輪卷積層和池化層的處理后,50×50 的散射密度矩陣被抽象成高階特征,由全連接層對提取的特征進行非線性組合以得到預(yù)測輸出,給出分類結(jié)果。由于線性模型的表達能力不夠,最后使用激活函數(shù)Softmax 加入非線性因素,把卷積層輸出結(jié)果做非線性映射。
圖1:基于卷積神經(jīng)網(wǎng)絡(luò)的材料識別模型
卷積神經(jīng)網(wǎng)絡(luò)通過迭代更新網(wǎng)絡(luò)權(quán)重來優(yōu)化模型,一次訓(xùn)練迭代包括前向傳播、損失函數(shù)、反向傳播和參數(shù)更新四個過程。前向傳播是將訓(xùn)練數(shù)據(jù)從輸入層經(jīng)過卷積層、池化層與全連接層逐層變換最終到達輸出層,得到網(wǎng)絡(luò)對輸入數(shù)據(jù)的預(yù)測。根據(jù)損失函數(shù)進行反向傳播,即確定對損失貢獻最大的權(quán)重,并使用交叉熵損失函數(shù)調(diào)整優(yōu)化權(quán)重來減少損失,表達式為:其中η 為學(xué)習(xí)率。由式(10)可知,權(quán)重的更新速度與誤差(a-y)呈線性關(guān)系,當(dāng)誤差大的時候,權(quán)重更新快,當(dāng)誤差小的時候,權(quán)重更新慢。程序重復(fù)這個過程,對每組訓(xùn)練數(shù)據(jù)進行迭代。圖2 給出了模型材料識別的準(zhǔn)確度和損失函數(shù)隨迭代次數(shù)的變化曲線,隨著不斷迭代,準(zhǔn)確度逐漸收斂,最終得到一個最優(yōu)權(quán)重集合,獲得一個訓(xùn)練好的預(yù)測模型,使用該模型執(zhí)行材料分類任務(wù)。
圖2:模型準(zhǔn)確度和損失函數(shù)隨迭代次數(shù)的變化
我們對10cm×10cm×10cm 的鋁、鐵和鎢三種材料分別進行1 分鐘、2 分鐘、5 分鐘和10 分鐘探測時間的模擬,其中每分鐘約有1600 條有效μ 子徑跡。定義材料x正確識別的準(zhǔn)確度為( X={鋁,鐵,鎢}, x∈X):
定義總體準(zhǔn)確度為:
分別用探測時間為1 分鐘、2 分鐘、5 分鐘和10 分鐘的散射密度矩陣測試網(wǎng)絡(luò)的材料識別準(zhǔn)確度。結(jié)果如下:
如表1 所示,取鋁、鐵、鎢作為低、中、高原子序數(shù)的代表材料,探測時間為1 分鐘時,由于μ 子的散射角數(shù)據(jù)量有限,材料識別的準(zhǔn)確度較低。2 分鐘時,由于重核材料鎢與輕核材料鋁的原子序數(shù)相差較大,Δ Z(W, Al)=61,材料識別準(zhǔn)確度均已達到80%;而鐵與鋁、鐵與鎢均容易混淆,鐵的識別準(zhǔn)確度較低。5 分鐘時,μ 子穿過被探測物體的散射角數(shù)據(jù)較多,用來訓(xùn)練網(wǎng)絡(luò)的散射密度矩陣中非零網(wǎng)格的比例有所提高,三種材料識別的準(zhǔn)確度均在80%之上,鋁與鎢的誤報率t(Al,W)、t(W,Al)均為0,鐵與鋁也能較好地區(qū)分,而鐵與鎢之間的誤報率仍在15%。探測時間為10 分鐘時,總體材料識別準(zhǔn)確度達到91.9%。
表1:不同探測時間下識別三種材料的準(zhǔn)確度/%(密度單位:g/cm3)
我們根據(jù)宇宙射線μ 子穿過被探測物體時散射密度與材料原子序數(shù)的相關(guān)性,構(gòu)建了包含兩個卷積層、兩個池化層和一個全連接層的卷積神經(jīng)網(wǎng)絡(luò)材料識別模型,最終測試樣品在不同時間下的識別準(zhǔn)確度。結(jié)果表明,對于10cm×10cm×10cm 的鋁、鐵、鎢的探測樣本,當(dāng)探測時間為1 分鐘、2 分鐘、5 分鐘和10 分鐘時,總體識別準(zhǔn)確度分別為66.4%、79.3%、86.8%和91.9%。
本文證明了采用卷積神經(jīng)網(wǎng)絡(luò)的方法用于μ 子成像材料識別的有效性,目前建立了簡單的網(wǎng)絡(luò)模型,還需要進一步優(yōu)化算法。