黃坤翔,張江梅,王嘉麒,蘇 覃
(1.西南科技大學(xué) 信息工程學(xué)院,四川 綿陽 621000;2.西南科技大學(xué) 核廢物與環(huán)境安全國防重點學(xué)科實驗室,四川 綿陽 621000)
中子探測在許多研究和應(yīng)用領(lǐng)域均有涉及,如粒子物理學(xué)、材料科學(xué)、宇宙射線探測乃至環(huán)境監(jiān)測、油井探測與核醫(yī)學(xué)等[1-2]。由于中子與周圍環(huán)境存在非彈性散射及慢中子的輻射俘獲等作用[3],使得中子射線的產(chǎn)生通常伴隨著大量不易被物理屏蔽的γ光子,而γ射線不僅對人體的危害程度大,同時也會與中子同時作用于閃爍體探測器,進而影響對中子射線的探測效果。因此,不論是對于輻射防護還是對于提高中子探測精度,研究在n/γ混合輻射場中實現(xiàn)n/γ有效甄別均有著重大的意義。
中子和γ射線依據(jù)其脈沖衰減時間不同,一般使用脈沖形狀甄別(PSD)方法進行區(qū)分,其主要可以劃分為時域分析法、頻域分析法和機器學(xué)習法3大類。時域分析法中最為經(jīng)典的甄別方法有電荷比較法[4]、上升時間法[5]、過零時間法[6]和脈沖梯度法[7]4種,雖然這些方法已能滿足大部分工程需求,但對噪聲十分敏感且只能提取單一的時域特征。頻域分析法中常見的有頻率梯度分析法[8]和小波分析法[9]等,它們抗干擾能力強,但對硬件采樣性能要求較高且也僅能提取頻域特征。機器學(xué)習法是近年來新興的方法,以聚類法[10]和人工神經(jīng)網(wǎng)絡(luò)法[11]為代表,其中后者是探索PSD極致性能的重要技術(shù)手段,目前應(yīng)用在n/γ甄別的主流網(wǎng)絡(luò)有BPNN和卷積神經(jīng)網(wǎng)絡(luò)(CNN)兩種。宋海聲等[12]利用電荷比較法與頻率梯度分析法選取學(xué)習樣本,通過BP神經(jīng)網(wǎng)絡(luò)對樣本進行訓(xùn)練后完成n/γ甄別工作。Griffiths等[13]開展了使用一維CNN架構(gòu)進行PSD方法研究,結(jié)果表明比傳統(tǒng)方法效果更好。Lu等[14]設(shè)計了一種基于二維矩陣格式輸入的CNN PSD方法,其甄別性能優(yōu)于電荷比較法和使用一維格式的CNN方法。然而,目前幾乎沒有一種人工神經(jīng)網(wǎng)絡(luò)甄別法本身具備同時保留核脈沖時域和頻域特征的能力。本文受文獻[15]啟發(fā)并參考格拉姆角場(GAF)在其他信號識別領(lǐng)域[16]中對時間序列二維化的應(yīng)用,提出一種基于GAF-CNN的n/γ甄別方法,既能有效保留核脈沖的時域特征,也能通過CNN將頻域特征利用起來。
數(shù)據(jù)采集實驗平臺系統(tǒng)結(jié)構(gòu)如圖1所示,使用239Pu-Be作為中子源為探測器提供n/γ混合輻射場;探測器是由北京玻璃研究院生產(chǎn)的尺寸為φ1.4 cm×2.6 cm的Cs2LiYCl6:Ce3+(CLYC)閃爍體晶體和日本濱松公司生產(chǎn)的R2076光電倍增管(PMT)組成,高壓偏置電源為光電倍增管提供-1 kV的增益電源;使用型號為泰克DPO4034的數(shù)字示波器以2 GS/s的采樣率對輻射脈沖波形進行采集,通過USB總線傳輸?shù)接嬎銠C進行脈沖數(shù)據(jù)樣本的存儲;采集獲取了n/γ總計20 000個脈沖樣本,每個脈沖樣本均為10 000×1的一維序列。
圖1 數(shù)據(jù)采集實驗平臺系統(tǒng)結(jié)構(gòu)
格拉姆角場[17]是將一維時間序列轉(zhuǎn)化成二維圖像的方法,該方法將原本定義在典型笛卡爾坐標系下的時間序列在極坐標系下重新進行表示。通過GAF圖像轉(zhuǎn)換過程,可將時間序列的本質(zhì)特征完整的轉(zhuǎn)化到圖像當中,由于n/γ脈沖樣本是典型的時間序列,因此考慮使用GAF來最大程度地保留n/γ甄別所需的脈沖時域特征,具體轉(zhuǎn)化過程如下。
對于一個給定的一維核脈沖樣本數(shù)據(jù)向量D={d1,d2,…,dn},其由n個按時間順序測量的實測值組成,使用式(1)將該樣本數(shù)據(jù)歸一化到[-1,1]區(qū)間:
(1)
(2)
經(jīng)過式(2)表示后的極坐標編碼具有唯一性和時間相關(guān)性這兩個重要的性質(zhì),因此它可以在[0,π]角度范圍內(nèi)隨著時間戳變化映射為一個隨角度變化彎曲的唯一極坐標曲線,且該曲線相對于笛卡爾坐標系下的原始脈沖序列保留了數(shù)據(jù)間絕對的時間關(guān)系。
使用Gram矩陣G來量化編碼后數(shù)據(jù)間的特征相關(guān)性,其定義為:
(3)
(4)
式中:φi(i=1,…,n)為第i個極坐標點的編碼夾角;n為核脈沖數(shù)據(jù)的長度;I為長度為n的單位行向量。GAF保持高時間依賴性和時間相關(guān)性,其對角線隨時間增加而自左上角到右下角遞進,同時保留了一維核脈沖序列的值與基于時間的位置信息,為神經(jīng)網(wǎng)絡(luò)模型學(xué)習到高層次脈沖形狀特征提供了基礎(chǔ)。以一個中子脈沖樣本為例,圖2為核脈沖的GAF轉(zhuǎn)化過程。
圖2 核脈沖的GAF轉(zhuǎn)化過程
典型的CNN分類器由卷積層、池化層、全連接層及邏輯激活輸出層等部分組成[18]。卷積層通過一組可學(xué)習參數(shù)的濾波器在輸入數(shù)據(jù)上進行滑動卷積操作,這些濾波器也被稱為卷積核,它可將如圖像等輸入數(shù)據(jù)轉(zhuǎn)換為多個特征映射,從而實現(xiàn)不同局部特征的提取過程,卷積一般計算過程如式(5)所示。
(5)
式中:y為輸出的特征映射;σ為非線性激活函數(shù);xi-r,j-c為第i-r行第j-c列的輸入數(shù)據(jù),其中r和c表示卷積核的中心位置,具體取決于卷積核的大小與卷積的步長,通常為奇數(shù);wi,j為卷積核第i行第j列的權(quán)重,為可學(xué)習的參數(shù);b為偏置項;n為輸入數(shù)據(jù)的維度。
池化層是一種下采樣操作,通常與卷積層成對使用,它可以減小卷積層輸出的大量特征圖的空間維度,同時保留重要的特征信息。池化層常用的是最大池化和平均池化兩種方式,前者選擇窗口內(nèi)的最大值作為輸出,后者選擇窗口內(nèi)的平均值作為輸出,基于n/γ核脈沖由于信號微弱從而易受耦合噪聲擾動的特點,本文采用最大池化操作如式(6)所示。
yi,j,k=max(xi+p,j+q,k)
(6)
式中:yi,j,k為輸出特征圖;xi+p,j+q,k為輸入的第i+p行第j+q列第k個通道的特征圖;p和q為池化窗口內(nèi)的坐標步長。
全連接層在CNN中往往使用于末尾,其將前面所有層的輸出結(jié)果按照神經(jīng)元模型規(guī)律進行完全連接,它可以集中卷積池化操作后的所有特征,并將其輸出,通過邏輯激活函數(shù)映射到歸一化區(qū)間用于分類,式(7)為全連接層的邏輯表示:
(7)
式中:xi為輸入的第i個特征向量;yo為輸出的特征映射;n為輸入特征的維度;wi為每個輸入向量對應(yīng)的權(quán)重,為可學(xué)習的參數(shù);f為邏輯激活函數(shù)。
1) 原始脈沖數(shù)據(jù)集預(yù)處理
由于電荷比較法受樣本噪聲等因素影響較大,因此需要對原始脈沖信號進行一系列預(yù)處理操作,其一般過程為:(1) 平滑操作;(2) 基線調(diào)零操作;(3) 歸一化操作[19]。平滑操作采用滑動平均濾波算法對脈沖波形整體進行算術(shù)平均運算,基線調(diào)零操作選取了信號前100個點進行均值計算以得到基線位置,歸一化操作是對脈沖波形進行幅值歸一化,將脈沖幅值縮放到0~1區(qū)間內(nèi)。圖3為預(yù)處理前后的n/γ脈沖波形對比。
a——原始脈沖信號;b——預(yù)處理后的脈沖信號
此外,為防止脈沖堆積對甄別效果產(chǎn)生影響,在預(yù)處理過程中還應(yīng)專門將堆積信號去除,由于所用中子源的強度不高,脈沖堆積僅為小概率事件,因此本文通過人工方式進行堆積樣本的剔除,最終得到樣本個數(shù)為19 971的原始n/γ脈沖數(shù)據(jù)集,數(shù)據(jù)集的維度為19 971×10 000。
2) 電荷比較法實現(xiàn)
電荷比較法根據(jù)中子和γ射線在閃爍體中作用的時間常數(shù)不同,會出具有快慢兩種成分的電荷,即最終n/γ脈沖會產(chǎn)生不同形狀的上升沿和下降沿,可以選擇不同的波形積分窗口等效為電荷量進行甄別[20]:
Q=Qr+Qf
(8)
式中:Q為總積分量;Qr為脈沖上升沿的積分量;Qf為脈沖下降沿的積分量。
通常根據(jù)實際情況,會在Qr、Qf、Qr/Q、Qf/Q和Qr/Qf中選擇一項作為甄別依據(jù),而在實際操作中為提高甄別效果,Qr和Qf往往會在更為寬泛的積分窗口進行變化;本文選擇Qr參數(shù)進行n/γ脈沖甄別,從信號起始位到上升沿的終止位作為最小積分時間窗,以此積分窗口作為下限進行動態(tài)變化,圖4為當積分窗口選為2 000時電荷比較法甄別統(tǒng)計結(jié)果。為評估不同PSD方法性能的強弱,一般定義FOM作為品質(zhì)因子來進行判斷,定義[21]如下:
(9)
圖4 電荷比較法甄別統(tǒng)計結(jié)果
式中:μ1和μ2分別為甄別統(tǒng)計結(jié)果中γ峰和中子峰的峰位;FWHM1和FWHM2分別為甄別統(tǒng)計結(jié)果中γ峰和中子峰的半高寬。根據(jù)式(9)可計算出圖4所示甄別效果的FOM為1.57。
3) 電荷比較法的窗口優(yōu)化
電荷比較法的實際PSD效果在很大程度上受積分窗口選擇的影響,為使得具有最佳的PSD性能,需要對積分窗口參數(shù)進行遍歷和優(yōu)化[14]。本文將積分窗口設(shè)置在[1 500,8 500]范圍內(nèi),以步長為500進行遍歷計算,分別得到不同窗口所對應(yīng)的FOM,以選出FOM最大時所對應(yīng)的積分窗口。圖5為電荷比較法優(yōu)化結(jié)果,當積分窗口選為3 000時,電荷比較法具備最好的甄別效果,此時FOM可達到1.76??梢姶薋OM已經(jīng)能滿足實際使用需求,這是因為實驗所用CLYC探測器的性能本身就十分優(yōu)秀,同時所用中子源提供的混合輻射場也遠高于傳統(tǒng)意義上的弱場,因此電荷比較法能具備不錯的甄別效果。經(jīng)統(tǒng)計,原始數(shù)據(jù)集經(jīng)過最佳性能的電荷比較法甄別后,得到γ脈沖個數(shù)為10 430,中子脈沖個數(shù)為9 541。
圖5 電荷比較法優(yōu)化結(jié)果
1) GAF脈沖數(shù)據(jù)集的制作
GAF脈沖數(shù)據(jù)集的制作過程如圖6所示。首先將原始脈沖數(shù)據(jù)集遍歷,分別讀取每個樣本并進行GAF轉(zhuǎn)化;其次通過窗口優(yōu)化后的電荷比較法對該n/γ樣本進行分類,將γ脈沖的標簽設(shè)為0,中子脈沖的標簽設(shè)為1;最后將該樣本的GAF圖像存儲到本地,循環(huán)往復(fù)直到遍歷完整個原始脈沖數(shù)據(jù)集。
圖6 GAF脈沖數(shù)據(jù)集制作流程圖
在使用GAF將n/γ脈沖樣本轉(zhuǎn)化為GAF圖像的過程中,由于原始樣本較長,導(dǎo)致直接轉(zhuǎn)化后的圖像分辨率高達10 000×10 000,這會極大增加運算開銷,因此需對GAF轉(zhuǎn)化過程增加降維操作。
本文使用傳統(tǒng)的分段近似聚合(PAA)算法,在保留原始一維序列重要特征的情況下將其縮小重塑成長度為100的序列,最終在經(jīng)過GAF轉(zhuǎn)化后得到像素分辨率為100×100、通道數(shù)為3的GAF圖像。在制作完成的GAF脈沖數(shù)據(jù)集中隨機抽取γ和中子各5個樣本,兩種類型的GAF樣本示例如圖7所示。
a——γ脈沖樣本;b——中子脈沖樣本
2) CNN分類模型設(shè)計與實現(xiàn)
CNN在目標檢測、圖像分類等領(lǐng)域展現(xiàn)出了極為優(yōu)秀的性能,它通過多級抽象特征進行有監(jiān)督學(xué)習,最終實現(xiàn)樣本分類。一般來講,使用CNN完成分類任務(wù)需要大量的樣本支持,同時要求樣本信息具備多樣性和完整性,且所預(yù)測的問題必須實際可行。由于n/γ甄別領(lǐng)域能夠獲取較多的樣本量且樣本具有較高的區(qū)分度,具備可預(yù)測性,因此將CNN應(yīng)用于該領(lǐng)域是十分契合的。本文基于大量實驗后,在經(jīng)典的LeNet CNN模型基礎(chǔ)上進行適應(yīng)性修改,最終設(shè)計能高效解決n/γ甄別問題的輕量級分類網(wǎng)絡(luò)框架,該網(wǎng)絡(luò)具有1個輸入層、兩個卷積層、兩個池化層、1個全連接層和1個輸出層,如圖8所示。
圖8 用于n/γ甄別的CNN分類框架
將準備好的n/γ脈沖信號GAF圖像輸入到CNN中,為保證圖像特征的完整性,使用零填充方式進行卷積。卷積過程采用ReLU函數(shù)作為式(5)中的σ非線性激活函數(shù),其定義如式(10)所示,該函數(shù)在提升CNN模型非線性擬合性能的同時,基于其簡單性和計算效率,還有助于提高模型訓(xùn)練的收斂速度。
ReLU=max(0,x)
(10)
將經(jīng)過卷積后的特征圖輸入到最大池化層中以減少數(shù)據(jù)維度,能有效地減少網(wǎng)絡(luò)層數(shù)和訓(xùn)練時間。在連續(xù)兩對卷積池化操作后將特征圖通過扁平層進行一維展寬,將得到一維的全局特征映射輸入到全連接層中,采用Sigmoid函數(shù)作為式(7)中的f邏輯激活函數(shù)。該函數(shù)可將神經(jīng)網(wǎng)絡(luò)的輸出進行概率化表示進而實現(xiàn)分類的目的,其一般形式如式(11)所示。Sigmoid在淺層神經(jīng)網(wǎng)絡(luò)中使用十分廣泛,是解決二分類問題的最佳選擇之一,十分適用于n/γ甄別場景。
(11)
此外,為提高網(wǎng)絡(luò)的泛化能力,在每組卷積池化操作和全連接層后都額外添加了隨機失活層。該層在訓(xùn)練過程中使得每個神經(jīng)元都有一定概率被丟棄,可減少神經(jīng)元之間的依賴性,從而使得CNN模型更加穩(wěn)定。本文將兩組卷積池化操作和全連接層后的隨機失活層概率參數(shù)分別設(shè)為0.25、0.25和0.5,能實現(xiàn)良好的效果。
在完成以上CNN正向推理過程后,需要計算目標與實際結(jié)果的損失值來指導(dǎo)模型的訓(xùn)練過程。本文使用二元交叉熵損失函數(shù)來衡量模型訓(xùn)練的損失值,計算公式為:
(1-yt,i)lg(1-yp,i))
(12)
式中:L為損失值;N為樣本總數(shù);yp,i和yt,i分別為第i個樣本的預(yù)測輸出值和真實標簽值,其值只能為0或1。
通過CNN的反向傳播,使用梯度下降法調(diào)整各層可學(xué)習參數(shù)來降低損失值,重復(fù)正向推理步驟直到損失值減小至預(yù)設(shè)區(qū)間內(nèi)收斂,此時CNN分類器便完成了最終訓(xùn)練。表1列出了CNN分類模型的關(guān)鍵網(wǎng)絡(luò)結(jié)構(gòu)與各層網(wǎng)絡(luò)參數(shù)。
表1 CNN分類模型的關(guān)鍵網(wǎng)絡(luò)結(jié)構(gòu)與各層網(wǎng)絡(luò)參數(shù)
將GAF脈沖數(shù)據(jù)集的70%作為訓(xùn)練集、30%作為測試集,來驗證GAF-CNN甄別方法的效果,其中訓(xùn)練集樣本數(shù)為13 980、測試集樣本數(shù)為5 991。使用TensorFlow Keras平臺搭建CNN模型,以批量大小參數(shù)為16的設(shè)置進行訓(xùn)練,每輪訓(xùn)練對模型進行了874次數(shù)據(jù)投喂;由于數(shù)據(jù)集樣本量足夠大,僅訓(xùn)練3次便可以得到損失值近乎收斂的訓(xùn)練結(jié)果。在相同數(shù)據(jù)集分割配置和相同批量大小等實驗條件下,對使用二維卷積的傳統(tǒng)CNN甄別法進行訓(xùn)練,該方法是將原始脈沖數(shù)據(jù)集的一維樣本序列通過簡單折疊的方式預(yù)處理成二維矩陣[14],再輸入到卷積層進行卷積;經(jīng)實驗,在相同結(jié)構(gòu)的CNN分類模型下需要訓(xùn)練6次才能得到損失函數(shù)相對收斂的訓(xùn)練結(jié)果。圖9為兩種CNN甄別法訓(xùn)練過程中損失值的變化趨勢,可看出GAF-CNN的損失函數(shù)具有更快的收斂速度。
圖9 CNN損失函數(shù)收斂曲線
為評估兩種CNN甄別方法的甄別性能,定義辨別誤差率(DER)來作為評價指標[11],使用式(13)來計算γ射線與中子的DER,即CNN甄別錯誤的樣本數(shù)與數(shù)據(jù)總樣本數(shù)之比。
(13)
式中:Nγ和Nn分別為γ射線與中子的測試樣本數(shù);Nγ-CNN與Nn-CNN分別為使用CNN甄別法甄別后γ射線與中子的測試結(jié)果數(shù)量。表2所列為兩種CNN甄別法的學(xué)習性能對比。由表2可知,兩種CNN甄別法均能達到較低的辨別誤差率水平,對n/γ甄別效果良好,且GAF-CNN的辨別誤差率較傳統(tǒng)CNN甄別法相對降低約38.8%。
表2 兩種CNN甄別法的學(xué)習性能對比
在CNN甄別模型訓(xùn)練結(jié)束后,為探究CNN甄別法和電荷比較法的性能差異,分別對GAF-CNN法與傳統(tǒng)CNN法進行甄別統(tǒng)計測試以獲取FOM。首先將測試集中的樣本輸入模型,使用回調(diào)函數(shù)分別獲取每個樣本在模型最終分類前所輸出的在0~1區(qū)間的正類樣本概率,再將0~1區(qū)間10 000等分進行輸出結(jié)果計數(shù)統(tǒng)計,甄別結(jié)果如圖10所示。由圖6可知,正類樣本被設(shè)置為中子,因此在實際分類中輸出值大于0.5則判定為中子,反之則判定為γ射線。
a——GAF-CNN甄別法;b——傳統(tǒng)CNN甄別法
由圖10可看出,GAF-CNN甄別法的輸出分布相較于傳統(tǒng)CNN甄別法更趨于0和1兩極,結(jié)合圖9中GAF-CNN的損失值收斂速度更快的實際情況,說明使用GAF進行數(shù)據(jù)二維化相比于使用一維樣本折疊成矩陣的二維化方式能夠保留更多維度的脈沖時域信息,而進行卷積操作則有利于保留脈沖的頻域信息,因此在融合了時頻特征后,GAF-CNN能提取更加準確有效的n/γ脈沖形狀特征。
將電荷比較法、傳統(tǒng)CNN甄別法和GAF-CNN甄別法進行綜合性能對比分析,綜合測試后將數(shù)據(jù)列于表3。對測試集中的5 991個脈沖樣本分別使用3種方法進行了甄別處理,均能滿足甄別需求。同時,CNN甄別法相較于電荷比較法的甄別效果明顯提高,在樣本沒有進行專門濾波處理的情形下,其FOM能提升至少兩個數(shù)量級;而GAF-CNN甄別法在輕量級網(wǎng)絡(luò)分類框架上的FOM相對于傳統(tǒng)CNN甄別法有1個數(shù)量級的提升。
表3 3種n/γ PSD方法的性能對比
在處理時間方面,兩種CNN甄別法均比電荷比較法的甄別處理速度更為快捷。其中GAF-CNN法可達到1.2 s,比傳統(tǒng)CNN法耗時稍高,可見為進一步提高甄別性能上限,所輸入的3通道GAF圖像相比于傳統(tǒng)CNN法中輸入的折疊矩陣包含了更多維度的脈沖形狀信息,因此增加了處理脈沖信號的時間。
本文實現(xiàn)了一種基于GAF-CNN的PSD方法,并與傳統(tǒng)CNN甄別法和電荷比較法進行了對比。結(jié)果表明,GAF-CNN能同時獲取脈沖的時頻特征,相比于傳統(tǒng)CNN法具有更低的辨別誤差率。此外,GAF-CNN在甄別品質(zhì)上有著較大的性能突破,在本實驗條件下,僅使用輕量級網(wǎng)絡(luò)模型的FOM便可比電荷比較法提升3個數(shù)量級且比傳統(tǒng)CNN法提升1個數(shù)量級。而在處理時間上,GAF-CNN甄別法比電荷比較法有著明顯地提升。同時,利用TensorFlow框架實現(xiàn)的輕量級GAF-CNN甄別網(wǎng)絡(luò)使得CNN PSD算法的嵌入式部署成為可能,為高性能n/γ復(fù)合探測能譜儀的研制提供了一種新思路。