尤瀚庭 樊港
(東華理工大學(xué)機(jī)械與電子工程學(xué)院 江西省南昌市 330013)
能譜識(shí)別技術(shù)作為核與輻射探測(cè)領(lǐng)域的關(guān)鍵性技術(shù),國(guó)內(nèi)外相關(guān)專(zhuān)家一直致力于該技術(shù)的理論研究與技術(shù)創(chuàng)新。由于探測(cè)器性能、背景噪聲等因素的影響[1],傳統(tǒng)核素識(shí)別在處理復(fù)雜能譜數(shù)據(jù)時(shí),誤差較大,識(shí)別率較低[2]。為了克服這個(gè)難題,近年來(lái)針對(duì)能譜這種高維度、非線(xiàn)性的數(shù)據(jù),全譜分析方法逐漸得到發(fā)展,主要工具有人工神經(jīng)網(wǎng)絡(luò)、粒子群算法、K-L 變換等[3]。
近年來(lái)計(jì)算機(jī)技術(shù)飛速發(fā)展,為了使機(jī)器設(shè)備在處理復(fù)雜數(shù)據(jù)時(shí)具有智能思維能力,人工神經(jīng)網(wǎng)絡(luò)(ANN)在最近三十年中不斷發(fā)展。目前,基于神經(jīng)網(wǎng)絡(luò)的全譜分析方法受到重視。1991年,Olmos 等人[4]首次提出了在伽馬能譜分析中使用人工神經(jīng)網(wǎng)絡(luò)。1995年,Keller等人[5]使用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行核素識(shí)別,從結(jié)果可以看出,人工神經(jīng)網(wǎng)絡(luò)提高了核素識(shí)別速度與準(zhǔn)確度。2015年劉議聰?shù)热薣6]提出了基于人工神經(jīng)網(wǎng)絡(luò)的核素識(shí)別方法,使用主成分分析法(Principal component analysis,PCA)提取主要特征,實(shí)現(xiàn)數(shù)據(jù)降維。2019年Liang 等人應(yīng)用空間填充曲線(xiàn)將1*1024 的伽馬能譜轉(zhuǎn)化為32*32的二維數(shù)據(jù),具有更快的收斂速度和更小的損失函數(shù)[7]。2020年,王瑤等學(xué)者通過(guò)濾波平滑等數(shù)據(jù)處理方法處理放射性核素能譜數(shù)據(jù),研究長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)算法[8]在核素識(shí)別領(lǐng)域的應(yīng)用。
由此可見(jiàn),神經(jīng)網(wǎng)絡(luò)解決伽馬能譜分析問(wèn)題已經(jīng)成為該領(lǐng)域的熱點(diǎn)。本文主要使用神經(jīng)網(wǎng)絡(luò)處理PGNAA技術(shù)探測(cè)銅礦后產(chǎn)生的特征伽馬能譜。由于實(shí)測(cè)數(shù)據(jù)不足,采用MCNP 仿真軟件構(gòu)建數(shù)據(jù)集,通過(guò)設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)模型完成對(duì)模擬伽馬能譜的分析。
圖1:礦石與相關(guān)概念的關(guān)聯(lián)[9]
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量數(shù)據(jù),實(shí)驗(yàn)獲取的數(shù)據(jù)數(shù)量不足以支撐神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,故需要采用模擬的方法構(gòu)建數(shù)據(jù)集。本文采用MCNP 軟件,基于蒙特卡羅方法生成伽馬能譜。MCNP 軟件是國(guó)際公認(rèn)的分析中子和伽馬射線(xiàn)輸運(yùn)問(wèn)題的程序,其主要輸入文件有柵元卡(定義構(gòu)成整個(gè)系統(tǒng)的各個(gè)基本介質(zhì)單元及相應(yīng)的物理信息)、曲面卡(定義組成柵元的曲面信息)、數(shù)據(jù)卡(包含反應(yīng)類(lèi)型、源描述、材料描述等其他信息)。使用MCNP 方法構(gòu)建數(shù)據(jù)集的難點(diǎn)在于MCNP 是基于統(tǒng)計(jì)理論的軟件,如果輸入文件的數(shù)據(jù)卡中礦石元素含量不發(fā)生變化,則基于伯努利大數(shù)定律,最后的結(jié)果會(huì)非常接近,不利于提升神經(jīng)網(wǎng)絡(luò)的魯棒性。因此使用MCNP構(gòu)建數(shù)據(jù)集將礦石樣本不足的問(wèn)題轉(zhuǎn)變?yōu)殂~礦石元素含量如何構(gòu)成。
礦石一般由礦石礦物和脈石礦物組成。礦石礦物又稱(chēng)有用礦物,是可以被利用的金屬或非金屬礦物。脈石是指與有用礦物伴生的無(wú)有用組分且沒(méi)有可用性能的礦物,又稱(chēng)為無(wú)用礦物[9]。因此,銅礦其實(shí)是有用礦物和脈石的組合。本研究選取江西銅礦相關(guān)研究記錄的350條金屬礦物的電子探針探測(cè)結(jié)果,300 條各種脈石的化學(xué)成分分析結(jié)果,通過(guò)按照不同比例混合脈石與金屬礦物得到了1600 條模擬銅礦數(shù)據(jù)。
根據(jù)我國(guó)的采礦技術(shù),銅礦邊界品位一般為0.2%,工業(yè)品位為0.4-0.5%,0.5-1.4%的為低品位礦石,1.4-2%的為中等品位礦石,2%以上的為高品位礦石[10]。由于數(shù)據(jù)集類(lèi)別不均衡,將脈石與低于邊界品位的銅礦作為第一類(lèi),邊界品位到工業(yè)品位(0.2-0.5%)礦石合并為第二類(lèi),將低品位礦石與中等品位礦石(0.5-2%)合并作為第三類(lèi),銅礦品位超過(guò)2%的作為第四類(lèi),以此為標(biāo)準(zhǔn)設(shè)立多分類(lèi)標(biāo)簽。
此外,銅礦床中常伴生有鉛、鋅、鐵等元素,當(dāng)伴生元素達(dá)到一定含量時(shí)不可以忽略其經(jīng)濟(jì)價(jià)值,需要進(jìn)行綜合評(píng)價(jià)和回收考慮。伴生礦物隨主礦產(chǎn)一同開(kāi)采加工,不會(huì)格外產(chǎn)生采礦、運(yùn)輸、破碎等費(fèi)用,但伴生礦物需要分離與提取,某些情況下需要特殊的生產(chǎn)裝置,故需要在核算經(jīng)濟(jì)成本的條件下合理回收。
基于表1,對(duì)每個(gè)模擬數(shù)據(jù)中上述元素含量大于綜合利用標(biāo)準(zhǔn)的設(shè)為正類(lèi),反之為負(fù)類(lèi),構(gòu)建標(biāo)簽數(shù)為5的多標(biāo)簽數(shù)據(jù)集。
表1:常見(jiàn)伴生礦物工業(yè)綜合利用標(biāo)準(zhǔn)[10]
能譜數(shù)據(jù)與時(shí)間序列存在一定相似性。目前,空間填充曲線(xiàn)法、格拉姆角場(chǎng)和馬爾科夫轉(zhuǎn)移場(chǎng)常用于將一維數(shù)據(jù)轉(zhuǎn)換成二維數(shù)據(jù)。其中,格拉姆角場(chǎng)的優(yōu)點(diǎn)是其主對(duì)角線(xiàn)包含原始值與時(shí)間信息,因此可以通過(guò)主對(duì)角線(xiàn)重建序列。本文采用此方法進(jìn)行能譜數(shù)據(jù)二維轉(zhuǎn)換[11]。
對(duì)于一個(gè)待轉(zhuǎn)化的銅礦伽馬能譜序列Y={y1,y2,…,yN},N=1,2,…,1024, 首先將能譜序列Y={y1,y2,…,yN} 中的每一個(gè)值都進(jìn)行規(guī)范化,規(guī)范化后記為中的每一個(gè)值 都在[-1,1]的區(qū)間內(nèi)。規(guī)范化公式如下所示:
使用反三角函數(shù)將每個(gè) 變?yōu)闃O坐標(biāo)系下的角度φi,φi的區(qū)間為[0,π]。對(duì)應(yīng)的極坐標(biāo)半徑ri采用其所在道址數(shù)ni和道址總數(shù)N 的比值表示,因此ri處于(0,1]的區(qū)間內(nèi)。具體公式如下:
利用式(1)和式(2)對(duì)能譜序列進(jìn)行縮放后,將直角坐標(biāo)系中的能譜序列使用極坐標(biāo)表示,通過(guò)每個(gè)點(diǎn)之間的角度和來(lái)進(jìn)行格拉姆求和角場(chǎng)(Gramian Angular Summation Fields,GASF)定義,GASF 如下所示:
通過(guò)GASF 矩陣,一維的銅礦伽馬能譜轉(zhuǎn)化為二維形式,且包含伽馬能譜不同道址的信息之間的聯(lián)系。但從上式可以得知,GASF 矩陣大小為N×N(本文數(shù)據(jù)N為1024,即1024×1024)。對(duì)于銅礦伽馬能譜數(shù)據(jù)來(lái)說(shuō),采樣道址總數(shù)為1024,導(dǎo)致GASF 矩陣維度極大,不利于后續(xù)處理[12]。
從圖2 中可以看到,能譜數(shù)據(jù)中前200 道的計(jì)數(shù)遠(yuǎn)超其他道,在變?yōu)楦窭非蠛徒菆?chǎng)時(shí),其他道址的數(shù)值由于經(jīng)過(guò)壓縮導(dǎo)致GASF 矩陣中200 至1024 道的信息損失嚴(yán)重。為此,借鑒NLP的分詞思想,將能譜進(jìn)行分割,提出分段式GASF 變換。將1024 道的能譜信號(hào)分為16個(gè)64 道的信號(hào),并采用k=2 的PAA 算法[11]進(jìn)行壓縮。此外,由于900 道之后探測(cè)器的探測(cè)效率極低,900 道之后對(duì)應(yīng)的能量段內(nèi)的特征峰幾乎都被統(tǒng)計(jì)漲落淹沒(méi),因此897道至1024道共128道的數(shù)據(jù)采用k=4進(jìn)行壓縮。1024 道的能譜數(shù)據(jù)最終轉(zhuǎn)換為15*32*32 的矩陣,與直接轉(zhuǎn)變相比,該方法可以將GASF 矩陣的數(shù)據(jù)大小縮小約60 倍且保留大部分信息。能譜經(jīng)過(guò)變換后第449~832道的能譜圖像如圖3。
圖2:對(duì)1024 道進(jìn)行GASF 變換的結(jié)果
圖3:能譜449 ~832 道變換結(jié)果
對(duì)比圖2 與圖3,由于分段GASF 方法以每段中數(shù)值最大與最小的點(diǎn)為標(biāo)準(zhǔn)進(jìn)行縮放,避免了不同譜段數(shù)值差距過(guò)大導(dǎo)致的GASF 方法變換過(guò)程中帶來(lái)的信息損失。同時(shí),所有數(shù)據(jù)都被限制到[-1,1]之間,相當(dāng)于對(duì)所有數(shù)據(jù)進(jìn)行了一次規(guī)范化,保證了所有數(shù)據(jù)處于同一數(shù)量級(jí)下,避免數(shù)值過(guò)大的數(shù)據(jù)占據(jù)過(guò)大的權(quán)重,有利于神經(jīng)網(wǎng)絡(luò)的收斂。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以在監(jiān)督模式下自動(dòng)學(xué)習(xí)訓(xùn)練權(quán)重,并不斷從樣本數(shù)據(jù)中提取特征,其對(duì)于圖像識(shí)別有很好的效果。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特性包括稀疏連接、權(quán)值共享、時(shí)間或空間上的下采樣。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、子采樣層和全連接層組成。卷積運(yùn)算后,樣本特征將映射到下一層,然后使用該層提取數(shù)據(jù)特征。卷積層和采樣層交替形成輸入層的特征提取層,然后將特征提取后的數(shù)據(jù)用作新的輸入層,繼續(xù)提取特征。最后,這些特征信息在經(jīng)過(guò)作為分類(lèi)器的全連接層計(jì)算后,在輸出層得到分類(lèi)結(jié)果。
在卷積神經(jīng)網(wǎng)絡(luò)中,設(shè)I(t)為模型輸入,s(t)為卷積映射,K(t)為卷積核,那么卷積運(yùn)算如下所示:
基于卷積神經(jīng)網(wǎng)絡(luò)的銅礦品位分類(lèi)是多分類(lèi)問(wèn)題,有益組分識(shí)別是多標(biāo)簽問(wèn)題。通過(guò)one-hot 編碼,多分類(lèi)任務(wù)標(biāo)簽可以轉(zhuǎn)換為標(biāo)簽個(gè)數(shù)為4 的多標(biāo)簽形式。因此兩個(gè)任務(wù)的損失函數(shù)均選用二元交叉熵?fù)p失函數(shù)(Binary Cross Entropy Loss,BCELoss),其定義如下:
其中yi是第i 個(gè)樣本的真實(shí)標(biāo)簽,值為0 或1,pi表示預(yù)測(cè)第i 個(gè)樣本為正例的概率。使用BCELoss,要求樣本必須屬于[0,1],故本文模型的全連接層全部使用Sigmoid 激活函數(shù)。在Pytorch 架構(gòu)下使用BECWithLogitsLoss,該損失函數(shù)在進(jìn)行損失計(jì)算之前自動(dòng)對(duì)全連接層的輸出進(jìn)行Sigmoid 操作。
經(jīng)過(guò)分段格拉姆角場(chǎng)變換后,神經(jīng)網(wǎng)絡(luò)的輸入從1*1024 轉(zhuǎn)變?yōu)?5*32*32,通過(guò)Pytorch 構(gòu)建如圖4所示的ResNet 神經(jīng)網(wǎng)絡(luò),Resblock1 維持通道數(shù)與圖片高寬不變,Resblock2 則將通道數(shù)翻倍、圖片高寬減半,Resblock2 與最大池化層的不同在于最大池化層只會(huì)使圖片的高寬減半而不增加通道數(shù)。由于圖片高寬僅有32*32,因此在最大池化層與Resblock2 一共5 次圖片高寬減半的作用下,最后可以得到480*1*1 的塊,通過(guò)兩次全連接得到最終的結(jié)果。
圖4:ResNet 網(wǎng)絡(luò)結(jié)構(gòu)
ResNet 在多分類(lèi)與多標(biāo)簽任務(wù)上的準(zhǔn)確率如圖5所示,由圖中可以看出銅礦中多種有益組分識(shí)別任務(wù)比銅礦石品位分類(lèi)任務(wù)的準(zhǔn)確率低,且模型收斂速度更慢。銅礦品位分類(lèi)任務(wù)在230 多個(gè)epoch 左右模型即收斂,準(zhǔn)確率在450epoch 時(shí)達(dá)到94.9%。有益組分識(shí)別任務(wù)在300epoach 左右仍有較大波動(dòng),在訓(xùn)練中還出現(xiàn)了準(zhǔn)確率大幅下降的情況,最終識(shí)別準(zhǔn)確率為93.9%。
圖5:ResNet 對(duì)兩種任務(wù)的準(zhǔn)確率
除了ResNet 網(wǎng)絡(luò),本文還使用了一些常用的機(jī)器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,結(jié)果如表2。
表 2:各種算法識(shí)別準(zhǔn)確率
從表2 中可以看出,深度學(xué)習(xí)對(duì)比傳統(tǒng)機(jī)器學(xué)習(xí)具有較大的優(yōu)勢(shì),而本文提出的分段格拉姆角場(chǎng)變換聯(lián)合ResNet 神經(jīng)網(wǎng)絡(luò)進(jìn)行銅礦能譜識(shí)別的方法準(zhǔn)確率最高。
本文通過(guò)MCNP 仿真軟件構(gòu)建了1600 條銅礦伽馬能譜。由于伽馬能譜各道址之間的計(jì)數(shù)差距極大,提出分段格拉姆角場(chǎng)二維化方法,將一維的能譜數(shù)據(jù)轉(zhuǎn)變?yōu)榘?jì)數(shù)與道址信息的二維數(shù)據(jù),并聯(lián)合ResNet 神經(jīng)網(wǎng)絡(luò)對(duì)伽馬能譜進(jìn)行分析。經(jīng)過(guò)實(shí)驗(yàn),該方法的準(zhǔn)確率最高,對(duì)于MCNP 模擬銅礦伽馬能譜進(jìn)行的銅礦品位分類(lèi)與有益組分識(shí)別任務(wù)準(zhǔn)確率分別達(dá)到94.9%和93.9%。