陳丹丹,賀新福,楊 文,儲根深,白 鶴,胡長軍,*
(1.北京科技大學(xué),北京 100083;2.中國原子能科學(xué)研究院,北京 102413)
核反應(yīng)堆材料的服役性能主要取決于輻照產(chǎn)生的缺陷的動力學(xué)行為,如缺陷的擴(kuò)散、形核、長大、湮滅等,這些長時間尺度的演化行為會引起缺陷尺寸和數(shù)密度分布的變化,從而導(dǎo)致核材料服役性能的退化,如輻照脆化、輻照腫脹等。實體動力學(xué)蒙特卡羅(object kinetic Monte Carlo, OKMC)方法[1-4]和基于平均場速率理論發(fā)展來的團(tuán)簇動力學(xué)(cluster dynamics, CD)方法[2,5-8]是兩種廣泛使用的研究上述問題的方法。前者通過追蹤每個缺陷的隨機(jī)擴(kuò)散和相互作用模擬缺陷的演化;后者則假設(shè)缺陷處于各向同性的均勻介質(zhì)中,通過缺陷反應(yīng)的速率方程跟蹤缺陷濃度的變化。然而,二者均有其優(yōu)點和局限性。OKMC可模擬多種缺陷間的復(fù)雜行為,且可捕獲缺陷間的空間相關(guān)性,但常受限于缺陷間復(fù)雜行為模擬所需的計算時間和計算量。CD方法一般具有很高的計算效率,可模擬很高的輻照劑量和時間尺度。然而,這種方法通常局限于模擬含少量可動缺陷的體系,很難處理復(fù)雜體系的缺陷演化。
空間分辨隨機(jī)團(tuán)簇動力學(xué)(spatially resolved stochastic cluster dynamics, SRSCD)[9-12]是近年來發(fā)展的一種模擬核材料輻照缺陷行為的新方法。它基于隨機(jī)團(tuán)簇動力學(xué)(stochastic cluster dynamics, SCD)[13]發(fā)展而來,將模擬體積劃分為多個體積元,假設(shè)每個體積元內(nèi)部缺陷均勻分布,可聚集和分解,體積元之間存在濃度差及其導(dǎo)致的擴(kuò)散。缺陷間各反應(yīng)的反應(yīng)速率由經(jīng)典的CD方法推導(dǎo)而來,反應(yīng)的選擇和時間增量則由經(jīng)典的KMC算法確定。SRSCD方法一方面避免了CD在缺陷種類和行為復(fù)雜性方面的限制,另一方面減少了與OKMC相比的計算需求。
為擴(kuò)大SRSCD的模擬體積,并解決擴(kuò)大體積后帶來的計算量,最有效的方式就是并行處理。在確定性方法中,并行區(qū)域按相同的時間步長向前推進(jìn),而在KMC方法中,由于每步的時間增量是基于系統(tǒng)中所允許的反應(yīng)的加權(quán)隨機(jī)選擇的,可能會導(dǎo)致并行區(qū)域的異步推進(jìn)。為解決這個問題,Martinez等[14]提出了一種同步并行KMC算法。該算法通過在經(jīng)典KMC算法中增加選擇空事件的可能性,為所有MPI(message passing interface)進(jìn)程選擇同一個時間增量,從而將并行區(qū)域同步向前推進(jìn)。Dunn等將這種同步并行KMC算法應(yīng)用在SRSCD的并行實現(xiàn)中,提出了同步并行SRSCD方法[12]。然而,由于其一維的進(jìn)程拓?fù)浞绞?實際模擬區(qū)域為三維)以及使用了大量的阻塞式點到點通信,使得程序的并行效率較低,很難進(jìn)行大規(guī)模的SRSCD模擬。
本文采用同步并行SRSCD方法,開發(fā)用于模擬核材料輻照損傷的大規(guī)模并行SRSCD程序——MISA-SCD1.0,并將其用于模擬反應(yīng)堆壓力容器(reactor pressure vessel, RPV)鋼模型合金中富Cu團(tuán)簇的析出,以再現(xiàn)富Cu團(tuán)簇在輻照條件下的演化過程,驗證程序的正確性并分析程序的并行性能。
SCD是CD的一種隨機(jī)變體[15],通過將平均場CD限制在有限體積V內(nèi)來將缺陷濃度的演化方程轉(zhuǎn)變?yōu)樵谟邢摅w積V中演化整數(shù)值的缺陷數(shù)量Ni。
(1)
其中:i、j、k分別為不同的缺陷類型;G、R、K分別為體積V內(nèi)的0階反應(yīng)(缺陷產(chǎn)生)、1階反應(yīng)(分解、被阱吸收而湮滅)、2階反應(yīng)(聚集、復(fù)合)的反應(yīng)速率。
SCD通過隨機(jī)抽樣模擬有限體積內(nèi)的缺陷演化過程,從而避免大量微分方程的組合展開,非常適合于處理復(fù)雜缺陷團(tuán)簇的演化問題。若考慮多個這樣的體積元,再加上不同體積元間的缺陷濃度差異以及擴(kuò)散,則隨機(jī)團(tuán)簇動力學(xué)可具有空間分辨率,即SRSCD。
在SRSCD中,認(rèn)為每個體積元內(nèi)的缺陷均勻分布,缺陷可聚集和分解,可動缺陷則可在體積元之間擴(kuò)散,缺陷間的各反應(yīng)的反應(yīng)速率由經(jīng)典的CD方法推導(dǎo)而來,時間增量Δt和反應(yīng)μ的選擇則由經(jīng)典的KMC算法確定。結(jié)合Marian等[13]和Dunn等[9]的工作,給出SRSCD方法中各類反應(yīng)速率的計算如下。
1) 0階反應(yīng)速率
在輻照損傷的情況下,0階反應(yīng)被用來表示初始缺陷或其他注入物的來源。通常其反應(yīng)速率用輻照損傷速率或其他注入物的注入速率表示。
2) 1階反應(yīng)速率
1階反應(yīng)包括分解(即發(fā)射點缺陷)和缺陷被阱吸收而消失。其中,分解反應(yīng)的反應(yīng)速率R為:
(2)
被阱吸收而消失的反應(yīng)速率為:
R=SDiNi
(3)
其中:S為阱強(qiáng)度;Di為缺陷i的擴(kuò)散率。
3) 2階反應(yīng)速率
2階反應(yīng)項解釋了兩種缺陷i和j相互碰撞的各種機(jī)制,如間隙團(tuán)簇(空位團(tuán)簇)對自間隙原子(空位)的吸收、間隙團(tuán)簇與空位團(tuán)簇的復(fù)合等,其反應(yīng)速率R的計算如下:
(4)
對于2階反應(yīng),考慮3種情況:缺陷i和缺陷j均是三維擴(kuò)散(如空位團(tuán)簇);缺陷i和缺陷j中,1個是三維擴(kuò)散,1個是一維擴(kuò)散(如位錯環(huán));缺陷i和缺陷j均是一維擴(kuò)散。
4) 擴(kuò)散速率
在SRSCD中,缺陷的擴(kuò)散由體積元之間的濃度梯度驅(qū)動。假設(shè)擴(kuò)散均勻、恒定,則缺陷i在體積元p、q之間擴(kuò)散的反應(yīng)速率R為:
(5)
MISA-SCD1.0的計算流程如圖1所示,主要包括區(qū)域分解及預(yù)處理、KMC循環(huán)、后處理3部分。
圖1 MISA-SCD1.0的流程圖Fig.1 Flow chart of MISA-SCD1.0
區(qū)域分解及預(yù)處理部分首先根據(jù)進(jìn)程數(shù)將模擬區(qū)域均勻劃分,利用MPI笛卡爾拓?fù)浣⑷S進(jìn)程拓?fù)浣Y(jié)構(gòu),并將相應(yīng)的子模擬區(qū)域及其網(wǎng)格映射到各進(jìn)程上,并為每個進(jìn)程構(gòu)建Ghost區(qū)域,用于存儲鄰居進(jìn)程上與當(dāng)前進(jìn)程鄰接的網(wǎng)格,如圖2所示,其中的網(wǎng)格即為上述體積元。對于每個網(wǎng)格(或進(jìn)程),還需建立其上、下、左、右、前、后6個方向的關(guān)聯(lián)關(guān)系,即存儲其6個鄰接網(wǎng)格(或進(jìn)程)編號,這6個方向也即缺陷擴(kuò)散的6個方向,如圖3所示。
圖2 MISA-SCD1.0的區(qū)域分解示意圖Fig.2 Domain decomposition diagram of MISA-SCD1.0
圖3 網(wǎng)格6個鄰接方向Fig.3 Six adjacent directions of mesh
KMC循環(huán)為整個程序的核心計算部分,采用同步并行KMC算法實現(xiàn),各進(jìn)程在各自負(fù)責(zé)的子區(qū)域塊上獨立選擇反應(yīng)并發(fā)生,并在需要時進(jìn)行通信,以同步缺陷信息。
后處理部分用于統(tǒng)計并輸出模擬的中間結(jié)果和最終結(jié)果。在后處理中,統(tǒng)計各子區(qū)域上每個網(wǎng)格中的缺陷類型及其數(shù)量并輸出。
(6)
圖4 時間異步推進(jìn)示意圖Fig.4 Schematic diagram of time asynchronous advance
D個區(qū)域中的最大總反應(yīng)速率為:
(7)
(8)
(9)
(10)
MISA-SCD1.0中的通信主要發(fā)生在更新缺陷過程,對于1個反應(yīng),當(dāng)反應(yīng)物(參與反應(yīng)的缺陷)和/或產(chǎn)物(反應(yīng)生成的缺陷)所處的網(wǎng)格為Boundary區(qū)域(位于當(dāng)前進(jìn)程且與鄰居進(jìn)程相鄰)的網(wǎng)格和Ghost區(qū)域的網(wǎng)格時,需與鄰居進(jìn)程進(jìn)行點對點通信,以同步反應(yīng)物和/或產(chǎn)物的信息,圖5示出了6種需通信的情況。
在一般操作中,將Boundary區(qū)域和Ghost區(qū)域的缺陷分開發(fā)送/接收,且發(fā)送/接收前,需通信待更新的缺陷個數(shù),以確定接收緩沖區(qū)的大小,則需進(jìn)行2×(6×2+6×2)=48次點到點通信(即分別發(fā)送和接收6個方向的Boundary和Ghost兩個區(qū)域的缺陷信息)。在MISA-SCD1.0中,采用計算與通信重疊、通信合并的方式進(jìn)行通信優(yōu)化,如圖6所示。由于1個進(jìn)程在1個時間步內(nèi)只發(fā)生1個反應(yīng),且允許的反應(yīng)類型是已知的,因此1個時間步內(nèi)待更新缺陷數(shù)目的最大值已知,直接將接收缺陷的緩沖區(qū)設(shè)置為該值,則省去缺陷個數(shù)的通信操作,通信次數(shù)減為2×(6×2)=24次。進(jìn)一步將Boundary區(qū)域和Ghost區(qū)域的缺陷合并發(fā)送,通信次數(shù)最終減為2×(6×1)=12次。
圖5 缺陷更新過程中的通信情況Fig.5 Communication during defect update
圖6 通信優(yōu)化過程Fig.6 Communication optimization process
在進(jìn)行數(shù)據(jù)結(jié)構(gòu)設(shè)計時,鏈表能充分利用內(nèi)存中的碎片空間,在進(jìn)行插入和刪除操作時,比數(shù)組更高效,適用于需頻繁進(jìn)行插入/刪除操作的應(yīng)用。由于KMC算法中,模擬的每步均需經(jīng)過選擇反應(yīng)、更新缺陷、更新反應(yīng)速率這3步,需頻繁更新網(wǎng)格中的缺陷及其可能發(fā)生的反應(yīng),且缺陷和反應(yīng)的數(shù)量是動態(tài)變化的。因此,在MISA-SCD1.0中采用鏈表來存儲頻繁更新的缺陷及其反應(yīng)等信息,而對于網(wǎng)格、進(jìn)程、輸入?yún)?shù)等需頻繁查找的信息則采用數(shù)組存儲。MISA-SCD1.0中,為每個網(wǎng)格創(chuàng)建1個缺陷列表(defectList)和1個反應(yīng)列表(reactionList),如圖7所示。缺陷列表中存儲每種缺陷的屬性(包括缺陷類型、數(shù)量等),反應(yīng)列表中則存儲該網(wǎng)格內(nèi)可能發(fā)生的反應(yīng)及其速率(包括發(fā)生反應(yīng)的反應(yīng)物數(shù)量及類型、產(chǎn)物的數(shù)量及類型、反應(yīng)物及產(chǎn)物所在的網(wǎng)格局部編號、反應(yīng)物及產(chǎn)物所在的進(jìn)程編號、反應(yīng)速率等)。
圖7 每個網(wǎng)格的缺陷列表和反應(yīng)列表Fig.7 Defect list and reaction list for each mesh
RPV是壓水堆中堆壽期唯一不可更換的核心設(shè)備,其服役性能直接影響反應(yīng)堆的安全性。輻照脆化是RPV鋼面臨的主要性能問題,一直是核材料領(lǐng)域關(guān)注的熱點。目前大量研究結(jié)果表明,富Cu團(tuán)簇的析出是導(dǎo)致RPV鋼脆化的主要原因之一。近年來,研究者們選取Fe-Cu合金作為RPV鋼的模型合金,利用模擬和實驗的手段,廣泛研究了富Cu團(tuán)簇的析出機(jī)理[6,16-21]。
為驗證MISA-SCD1.0的正確性,并評估其模擬RPV鋼中缺陷演化的能力,本節(jié)選取了不同Cu含量的Fe-Cu合金,分別模擬了電子輻照和中子輻照下的富Cu團(tuán)簇析出過程,并與實驗結(jié)果和其他類似的模擬結(jié)果進(jìn)行了對比分析。
1) RPV鋼模型合金中富Cu團(tuán)簇析出模擬
MISA-SCD1.0進(jìn)行RPV鋼模型合金(Fe-Cu合金)中富Cu團(tuán)簇析出模擬時,允許的缺陷類型及反應(yīng)如下。
(1) 點缺陷,包括自間隙原子(I)、空位(V)、Cu原子(Cu)。這類缺陷被視為球形,可在三維空間中擴(kuò)散,這類缺陷可形成團(tuán)簇,也可與其反類型的缺陷相互湮滅。
(2) 空位團(tuán)簇,尺寸大于等于2的空位團(tuán)簇為不可動的球形團(tuán)簇??瘴粓F(tuán)簇可吸收單空位、自間隙原子,也可發(fā)射單空位。空位團(tuán)簇也可與Cu原子結(jié)合形成Cu_Vac團(tuán)簇。
(3) 位錯環(huán),尺寸大于等于2的自間隙團(tuán)簇被視為不可動的位錯環(huán)(環(huán)形)。位錯環(huán)可吸收單空位和自間隙原子,也可發(fā)射單空位。位錯環(huán)不與Cu原子結(jié)合。
(4) Cu團(tuán)簇,包括只含Cu原子的純Cu團(tuán)簇,以及同時含有Cu原子和空位的Cu_Vac團(tuán)簇。這類團(tuán)簇視為不可動的球形團(tuán)簇,可發(fā)射、吸收單空位及Cu原子。
所有允許的反應(yīng)類型前面已描述,計算反應(yīng)速率所需的遷移能Em、擴(kuò)散前置因子D0、結(jié)合能Eb,列于表1。其中,尺寸為3~16的空位團(tuán)簇的結(jié)合能參數(shù)以及Cu_Vac團(tuán)簇與Cu原子或空位的結(jié)合能參數(shù)來自Kulikov等的BCC Fe-Cu研究[16]。對于大尺寸的空位團(tuán)簇(n>16)和自間隙團(tuán)簇(n>2),其結(jié)合能Eb(n)由下式給出:
(11)
其中:n為團(tuán)簇尺寸;Ef為點缺陷的形成能;Eb(2)為雙空位或雙間隙團(tuán)簇的結(jié)合能。
對于大尺寸(n>2)的純Cu團(tuán)簇的結(jié)合能則由下式給出:
Eb(n)=Ω-TΔS-
(12)
其中:Ω為Cu在Fe中溶解時的焓變,Ω=6 255kB[6];ΔS為非構(gòu)型熵,ΔS=0.866kB[6];σ為表面能,為0.37 J/m2[20]。
表1 空位、自間隙和Cu的遷移參數(shù)和結(jié)合能參數(shù)Table 1 Migration and binding parameters for vacancies, self-interstitials and Cu
2) 電子輻照Fe-1.34at.%Cu中Cu析出模擬
本實驗中,使用MISA-SCD1.0模擬電子輻照(2.5 MeV)下Fe-1.34at.%Cu中的Cu析出過程。輻照溫度為290 ℃,劑量率為2×10-9dpa/s,模擬體積為400 nm×400 nm×200 nm,網(wǎng)格分辨率為10 nm,其他模擬參數(shù)列于表2,與Christien等[6]采用的參數(shù)相同。
表2 290 ℃電子輻照下Fe-1.34at.%Cu合金中Cu析出模擬的參數(shù)Table 2 Parameters for simulating Cu precipitation in Fe-1.34at.%Cu alloy under electron irradiation at 290 ℃
MISA-SCD1.0模擬獲得的Cu團(tuán)簇的數(shù)密度及平均半徑隨輻照劑量的變化,與類似的模擬結(jié)果以及實驗結(jié)果的對比如圖8所示,圖中,紅色點線為MISA-SCD1.0的模擬結(jié)果,藍(lán)色實線是Christien等[6]采用傳統(tǒng)CD方法獲得的模擬結(jié)果,黑色圓圈是Mathon等[22]用小角中子散射(small-angle neutron scattering, SANS)的表征技術(shù)測量的實驗結(jié)果。由于SANS測量團(tuán)簇半徑的檢測極限約0.5 nm,因此,本文僅將含有10個以上Cu原子(半徑約0.3 nm)的團(tuán)簇(忽略Cu_Vac團(tuán)簇中的空位)記入數(shù)密度和平均半徑的統(tǒng)計中。雖然選取的統(tǒng)計閾值略小于SANS的檢測極限值,但Bai等[20]的工作表明,此閾值的選取并不會影響Cu團(tuán)簇后期結(jié)果的評估。
如圖8a所示,在輻照的初始階段,Cu團(tuán)簇的總數(shù)密度迅速增加,在4 s左右達(dá)峰值,約5×1025m-3。這期間,Cu團(tuán)簇的平均半徑緩慢增加(圖8b)。表明此期間主要是Cu團(tuán)簇的形核和長大階段。隨后Cu團(tuán)簇的演化進(jìn)入粗化階段,平均半徑不斷增大,數(shù)密度逐漸減小。整體上,MISA-SCD1.0的結(jié)果與文獻(xiàn)中傳統(tǒng)CD方法的模擬結(jié)果以及實驗結(jié)果非常吻合。
3) 中子輻照Fe-0.3at.%Cu中的Cu析出模擬
為驗證MISA-SCD1.0模擬中子輻照下的缺陷演化能力,進(jìn)行中子輻照(能量大于1 MeV)Fe-0.3at.%Cu中的Cu析出過程模擬。輻照溫度為300 ℃,劑量率為1.4×10-7dpa/s,模擬體積同樣為400 nm×400 nm×200 nm,網(wǎng)格分辨率為10 nm,位錯密度為5×10-5nm-2,輻照增強(qiáng)因子為7.7×105,其他模擬參數(shù)列于表2。
在中子輻照下,初始缺陷不再像電子輻照那樣只有點缺陷,而是包含點缺陷和它們的小團(tuán)簇。在使用傳統(tǒng)CD方法的中子輻照模擬中,普遍對這種級聯(lián)缺陷(即包含點缺陷和小團(tuán)簇的初始缺陷)進(jìn)行均勻化處理,以級聯(lián)效率的方式引入,而在SRSCD中,則可直接將級聯(lián)缺陷引入到模擬體系中。Bai等[20]的模擬結(jié)果表明,級聯(lián)效率為0.4、空位遷移能為1.0 eV時,獲得的模擬結(jié)果與實驗測量結(jié)果最接近。而曹晗等[23]的分子動力學(xué)模擬結(jié)果表明,級聯(lián)效率為0.4時對應(yīng)的初級離位原子(primary knock-on atom, PKA)的能量約為20 keV。因此,在使用MISA-SCD1.0進(jìn)行本次模擬時,引入20 keV的PKA產(chǎn)生的級聯(lián)缺陷,作為中子輻照的模擬的缺陷產(chǎn)生項。
對于模擬獲得Cu團(tuán)簇,同樣只統(tǒng)計了含有10個以上Cu原子的團(tuán)簇,獲得的中子輻照下的Cu團(tuán)簇的數(shù)密度及平均半徑隨輻照劑量的變化如圖9所示。其中,紅色點線為MISA-SCD1.0的模擬結(jié)果,藍(lán)色實線是Bai等[20]采用傳統(tǒng)CD獲得的模擬結(jié)果,黑色圓圈是Meslin等[21]的SANS實驗測量結(jié)果。如圖9a所示,相較于電子輻照,中子輻照下的Cu團(tuán)簇粗化階段發(fā)生在較高的輻照劑量范圍內(nèi),且Cu團(tuán)簇的平均半徑較電子輻照下的半徑小(圖9b)。整體可看出,MISA-SCD1.0模擬獲得Cu團(tuán)簇數(shù)密度及平均半徑,與CD的模擬結(jié)果和實驗結(jié)果均高度一致。與電子輻照類似,中子輻照下MISA-SCD1.0模擬得到的Cu團(tuán)簇數(shù)密度同樣較CD模擬得到的結(jié)果略大,這主要是因為與平均場相比,MISA-SCD1.0的模擬限制在1個較小的體積內(nèi)。
對MISA-SCD1.0的性能測試在天河2號超算平臺上進(jìn)行,僅使用了CPU核,相關(guān)配置參數(shù)列于表3。
圖8 290 ℃電子輻照下Fe-1.34at.%Cu合金中Cu團(tuán)簇的數(shù)密度(a)和平均半徑(b)隨輻照劑量的變化Fig.8 Irradiation dose-dependent evolution of number density (a) and mean radius (b)of Cu clusters in Fe-1.34at.%Cu during electron irradiation at 290 ℃
圖9 300 ℃中子輻照下Fe-0.3at.%Cu合金中Cu團(tuán)簇的數(shù)密度(a)和平均半徑(b)隨輻照劑量的變化Fig.9 Irradiation dose-dependent evolution of number density (a) and mean radius (b) of Cu clusters in Fe-0.3at.%Cu during neutron irradiation at 300 ℃
表3 天河2號超算平臺的相關(guān)參數(shù)Table 3 Parameters of Tianhe-2 supercomputer
為測試MISA-SCD1.0采用2.3節(jié)中的通信策略的性能提升效果,選取3.1節(jié)中的電子輻照Fe-1.34at.%Cu進(jìn)行實驗。固定每核的模擬體積為100 nm×100 nm×100 nm,網(wǎng)格分辨率為10 nm,模擬缺陷演化0.01 s。在24、48、96、192核上分別測試了通信優(yōu)化前后的程序運(yùn)行時間,如圖10所示。可看到,優(yōu)化后的計算速度有較明顯提升,總體性能較優(yōu)化前提升約30%,表明2.3節(jié)中的通信策略在進(jìn)行大規(guī)模模擬時能帶來良好的計算加速。
圖10 MISA-SCD1.0通信優(yōu)化前后的運(yùn)行時間對比Fig.10 Running time comparison before and after communication optimization in MISA-SCD1.0
為測試MISA-SCD1.0大規(guī)模并行模擬的性能,同樣選取Fe-1.34at.%Cu在290 ℃下的電子輻照模擬,在天河2號超級計算機(jī)上,從強(qiáng)、弱可擴(kuò)展性兩方面對MISA-SCD1.0進(jìn)行測試分析。其中,強(qiáng)、弱可擴(kuò)展的并行效率由下式給出:
(13)
其中:ηstrong和ηweak分別為強(qiáng)、弱可擴(kuò)展性的并行效率;T1和Tn分別為程序在基準(zhǔn)核數(shù)和n核上的運(yùn)行時間;N為n核相對于基準(zhǔn)核數(shù)的倍數(shù)。
在強(qiáng)可擴(kuò)展性測試中,固定總模擬體積為4 800 nm×2 400 nm×2 400 nm,網(wǎng)格分辨率為10 nm,分別測試了MISA-SCD1.0在1 200、2 400、4 800、7 200、9 600核上,模擬缺陷演化0.001 s的程序運(yùn)行時間,并以1 200核為基準(zhǔn),計算程序的并行效率,如圖11所示。可看到,隨著核數(shù)的增加,程序的整體運(yùn)行時間逐漸減少,從1 200核擴(kuò)展到4 800核的運(yùn)行時間下降較快,表現(xiàn)出較好的并行效率,達(dá)70%以上。當(dāng)核數(shù)進(jìn)一步增加時,運(yùn)行時間下降放緩,并行效率下滑。這主要是因為隨著核數(shù)的增加,通信開銷逐漸增加,且單核的計算規(guī)模減小,通信占比增大,使得整體的并行效率呈下降趨勢。但整體上,從1 200核擴(kuò)展到9 600核,并行效率維持在59%以上,表現(xiàn)出良好的強(qiáng)可擴(kuò)展性。
圖11 MISA-SCD1.0的強(qiáng)可擴(kuò)展性測試Fig.11 Strong scalability test of MISA-SCD1.0
在弱可擴(kuò)展性測試中,采取與強(qiáng)擴(kuò)展測試相同的模擬對象和模擬時間,固定每核的模擬體積為200 nm×200 nm×200 nm,網(wǎng)格分辨率同為10 nm。隨著核數(shù)的增加,成倍地擴(kuò)大總模擬體積。分別測試了MISA-SCD1.0在240、480、960、1 920、3 840核上的運(yùn)行時間,并以240核為基準(zhǔn),計算程序的并行效率,獲得的結(jié)果如圖12所示??煽吹剑S著總模擬體積及核數(shù)的增加,程序運(yùn)行時間逐漸增加。這主要是因為,在并行KMC算法中,模擬的每個時間步均需進(jìn)行全局通信以獲得最大總反應(yīng)速率,核數(shù)的增加使得這種全局通信的開銷時間逐漸增加,進(jìn)而導(dǎo)致并行效率逐漸下降。但總體上而言,擴(kuò)展到3 840核時,并行效率仍在64%以上。圖11、12的測試表明,MISA-SCD1.0具有良好的擴(kuò)展性,能開展大規(guī)模的缺陷演化SRSCD模擬。
圖12 MISA-SCD1.0的弱可擴(kuò)展性測試Fig.12 Weak scalability test of MISA-SCD1.0
空間分辨隨機(jī)團(tuán)簇動力學(xué)已發(fā)展成為模擬核材料輻照損傷的一種有效方法,且能近似地考慮缺陷的空間信息。本文基于空間分辨隨機(jī)團(tuán)簇動力學(xué)方法和同步并行KMC方法開發(fā)了用于模擬核材料輻照損傷的大規(guī)模并行程序MISA-SCD1.0,并介紹了其實現(xiàn)細(xì)節(jié),包括程序的計算流程、通信策略以及數(shù)據(jù)結(jié)構(gòu)設(shè)計。通過將MISA-SCD1.0用于模擬不同比例的Fe-Cu合金在電子輻照和中子輻照下的富Cu團(tuán)簇析出過程,并與傳統(tǒng)CD模擬結(jié)果以及實驗結(jié)果進(jìn)行對比,驗證了程序的正確性。在此基礎(chǔ)上,進(jìn)行了程序的強(qiáng)、弱可擴(kuò)展性測試。在強(qiáng)擴(kuò)展性測試中,從1 200核擴(kuò)展到9 600核,并行效率保持在59%以上,在弱擴(kuò)展性測試中,從240核擴(kuò)展到3 840核,并行效率保持在64%以上,表明MISA-SCD1.0具有良好的擴(kuò)展性,能很好進(jìn)行核材料輻照損傷的大規(guī)模并行SRSCD模擬,為材料的宏觀性能預(yù)測提供有力的支撐。