謝 昊,席子昱,吳 瓊
(中國(guó)計(jì)量大學(xué) 材料與化學(xué)學(xué)院,浙江 杭州 310018)
Nd-Fe-B基稀土永磁材料的快速發(fā)展,消耗了大量Pr、Nd、Dy、Tb等稀土元素,而高豐度稀土La、Ce、Y的應(yīng)用并沒(méi)有受到足夠重視。其次稀土元素分離提純的工藝十分復(fù)雜,對(duì)環(huán)境污染嚴(yán)重。因此,混合稀土永磁材料的開(kāi)發(fā)有利于平衡利用稀土資源和保護(hù)生態(tài)環(huán)境,具有重要的戰(zhàn)略意義。
對(duì)于混合稀土永磁材料,有許多研究開(kāi)展了改變Fe和混合稀土含量[1],添加小原子尺寸元素包括Zr、Nb等改變?cè)爻煞趾凸に噮?shù)的方法來(lái)提高磁性能[2]。但是混合稀土永磁材料一般六元合金及以上構(gòu)成,影響因素眾多,需要耗費(fèi)大量的實(shí)驗(yàn)時(shí)間。因此,開(kāi)發(fā)一種以成分和工藝為變量的理論模型,預(yù)測(cè)混合稀土永磁合金磁性能的方法具有重要意義,將成為尋找低成本高性能的磁體的有效工具。
機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)的一個(gè)研究領(lǐng)域,讓計(jì)算機(jī)無(wú)須明確編程就具備學(xué)習(xí)能力(即逐步提高特定任務(wù)的性能)。機(jī)器學(xué)習(xí)經(jīng)過(guò)幾十年的發(fā)展,被廣泛應(yīng)用于許多領(lǐng)域。它可以通過(guò)使用來(lái)自實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)規(guī)則來(lái)構(gòu)建特征和目標(biāo)屬性之間的預(yù)測(cè)模型,為材料設(shè)計(jì)提供明確的指導(dǎo)。Hosokawa等[3]使用神經(jīng)網(wǎng)絡(luò)模型,通過(guò)化學(xué)成分、熔體快淬過(guò)程參數(shù)和熱處理參數(shù),預(yù)測(cè)Sm-Fe-N粉末的磁性能。Xiong等[4]使用了隨機(jī)森林算法(Rondom forest,RF)預(yù)測(cè)多組分塊體金屬玻璃(Bulk metallic glasses,BMG)的玻璃形成能力和彈性模量。同時(shí),李銳等[5]基于(PrNd-La-Ce)2Fe14B快淬磁體的成分和性能數(shù)據(jù),成功利用梯度提升樹(shù)算法(Gradient boosting regression tree,GBRT)構(gòu)建了材料性能預(yù)測(cè)模型,矯頑力和最大磁能積的MAE分別為83 kA/m和9 kJ/m3。
在本文中,我們使用RF算法[6]和GBRT算法[7]成功開(kāi)發(fā)了預(yù)測(cè)模型,使用配方成分和工藝的數(shù)據(jù)來(lái)預(yù)測(cè)(Pr-Nd-La-Ce)2Fe14B基合金的內(nèi)稟矯頑力、剩磁、最大磁能積,這有助于尋找特定磁性能的磁體,有可能從根本上提高混合稀土永磁材料的研究速度。
我們從20篇文獻(xiàn)中尋找了160余條數(shù)據(jù)。由于制備工藝會(huì)影響模型預(yù)測(cè)的準(zhǔn)確性,所以收集的數(shù)據(jù)都是經(jīng)過(guò)同樣的流程,即先電弧熔煉出鑄錠,再將鑄錠切成小塊進(jìn)行熔體快淬,最后對(duì)快淬薄帶樣品進(jìn)行退火。我們將每一個(gè)磁體的成分統(tǒng)一為(PraNdbtLacYdDyeCef)ResFegCohZriBj的形式,約束a+b+c+d+e+f=1,Res+g+h+i+j=100。此基礎(chǔ)上加上快淬速度(v)、是否退火(If anneal)、退火溫度(Anneal temperature)、退火時(shí)間(Anneal time),得到最終的15個(gè)特征。我們預(yù)測(cè)的目標(biāo)屬性分別是內(nèi)稟矯頑力、剩磁、最大磁能積。對(duì)重復(fù)的樣本進(jìn)行剔除后,表1給出了我們搜集到的164條樣本的非空特征值數(shù)量及范圍。從表中可知,未經(jīng)退火處理的磁體有81個(gè),它們的退火溫度和退火時(shí)間都為空值,快淬轉(zhuǎn)速有9個(gè)為空值。
表1 非空特征值的數(shù)量及范圍Table 1 Number and range of non-null features
大部分的機(jī)器學(xué)習(xí)算法無(wú)法在缺失的特征上工作,所以必須對(duì)缺失值進(jìn)行處理。我們將未經(jīng)退火處理樣本的退火溫度和退火時(shí)間都設(shè)置為-1,缺失值的v用中位數(shù)25 m·s-1來(lái)替代。由于數(shù)據(jù)集中的數(shù)據(jù)并非同時(shí)包含3個(gè)目標(biāo)屬性,因此我們訓(xùn)練每個(gè)目標(biāo)屬性預(yù)測(cè)模型的數(shù)據(jù)集并不相同。我們用來(lái)預(yù)測(cè)內(nèi)稟矯頑力、剩磁、最大磁能積的數(shù)據(jù)集大小分別是164,149,154個(gè)。
我們面臨的機(jī)器學(xué)習(xí)任務(wù)是一個(gè)回歸問(wèn)題。可以處理這個(gè)任務(wù)的算法主要包括線性回歸、決策樹(shù)回歸、支持向量機(jī)回歸和一些集成方法??紤]到機(jī)器學(xué)習(xí)算法由于各自的特點(diǎn)在不同的數(shù)據(jù)集上各有優(yōu)勢(shì),本文采用了兩種回歸算法進(jìn)行數(shù)據(jù)學(xué)習(xí),分別是隨機(jī)森林算法和梯度提升樹(shù)算法。
隨機(jī)森林的工作原理是通過(guò)對(duì)特征的隨機(jī)子集進(jìn)行多個(gè)決策樹(shù)的訓(xùn)練,然后對(duì)其預(yù)測(cè)取平均[8]。隨機(jī)森林算法中有兩個(gè)重要參數(shù):一是估計(jì)器的數(shù)量(n_estimators),即決策樹(shù)的數(shù)量;另一個(gè)是最大特征數(shù)量(max_features),即尋找最佳切割時(shí)要考慮的特征數(shù)量。梯度提升樹(shù)算法以弱預(yù)測(cè)模型集合的形式生成預(yù)測(cè)模型,該集合是回歸樹(shù)模型的集合。雖然最初的預(yù)測(cè)誤差很大,但該算法將迭代訓(xùn)練新的弱回歸樹(shù),使預(yù)測(cè)效果更好。每個(gè)新樹(shù)都有助于糾正以前訓(xùn)練過(guò)的樹(shù)所犯的錯(cuò)誤。GBRT算法中有兩個(gè)重要參數(shù):一個(gè)是估計(jì)量的數(shù)量(n_estimators),即弱回歸樹(shù)的數(shù)量;另一個(gè)是學(xué)習(xí)率(learning_rate),即迭代訓(xùn)練弱回歸樹(shù)時(shí)的改進(jìn)速度。
我們的模型將從數(shù)據(jù)中學(xué)習(xí),通過(guò)輸入的特征來(lái)預(yù)測(cè)目標(biāo)屬性。預(yù)測(cè)模型的整體設(shè)置如圖1所示。主要分為3個(gè)過(guò)程。
圖1 在(Pr-Nd-La-Ce)2Fe14B基材料上使用機(jī)器學(xué)習(xí)進(jìn)行預(yù)測(cè)的總體設(shè)置過(guò)程Figure 1 General process for prediction models using machine learning on (Pr-Nd-La-Ce)2Fe14B-based materials
(i)將數(shù)據(jù)集分成兩部分:訓(xùn)練集和測(cè)試集。訓(xùn)練集用于訓(xùn)練模型,測(cè)試集用于評(píng)估訓(xùn)練模型的性能。為了優(yōu)化性能,必須隨機(jī)拆分?jǐn)?shù)據(jù)集。
(ii)建立RF和GBRT模型。使用5折交叉驗(yàn)證對(duì)模型進(jìn)行評(píng)估。通過(guò)隨機(jī)搜索縮小超參數(shù)的范圍,然后用網(wǎng)格搜索找到模型的最佳參數(shù)。訓(xùn)練集模型預(yù)測(cè)的性能指標(biāo)為MSE。MSE表示模型解釋的均方誤差(越低越好),其最小值等于0。
(iii)模型訓(xùn)練完成后,立即評(píng)估模型在測(cè)試集上的預(yù)測(cè)性能。指標(biāo)是RMSE(均方根誤差)和MAE(平均絕對(duì)誤差:越低越好)。
最后,該模型可通過(guò)輸入配方成分、熔體快淬過(guò)程參數(shù)和熱處理參數(shù)來(lái)估計(jì)新材料的目標(biāo)特性,為成分、工藝設(shè)計(jì)提供參考。我們準(zhǔn)備了4個(gè)樣本作為額外的測(cè)試數(shù)據(jù),數(shù)據(jù)來(lái)自我們的實(shí)驗(yàn)室,用于測(cè)試經(jīng)過(guò)訓(xùn)練和優(yōu)化的模型的預(yù)測(cè)能力。
在本文中,所有模型的構(gòu)建都是在Python 3.7中使用scikit-learn開(kāi)源包實(shí)現(xiàn)的。
我們使用了164個(gè)數(shù)據(jù)來(lái)訓(xùn)練Hcj預(yù)測(cè)模型。Hcj的數(shù)據(jù)分布如圖2所示,數(shù)據(jù)的矯頑力Hcj均分布在0~1 760 kA/m范圍內(nèi),其中大部分散布在0~1 100 kA/m范圍內(nèi)。
圖2 Hcj數(shù)據(jù)集的數(shù)據(jù)分布Figure 2 Data distribution of the Hcj dataset
我們?cè)谟?xùn)練集和測(cè)試集之間隨機(jī)拆分?jǐn)?shù)據(jù)集,并使用訓(xùn)練集來(lái)訓(xùn)練我們的模型。為了找到隨機(jī)森林模型參數(shù)的最佳值(n_estimators和max_features),我們使用隨機(jī)搜索,它結(jié)合了n_estimators和max_features來(lái)訓(xùn)練模型,并找到構(gòu)成最佳MSE模型的超參數(shù)。對(duì)于此過(guò)程,我們?yōu)樗心P头謩e選擇了1~15的max_features和1~200的n_estimators。我們訓(xùn)練了兩個(gè)參數(shù)模型的300個(gè)組合,發(fā)現(xiàn)最好的組合是n_estimators為5,max_features為11。為了找到GBRT模型參數(shù)的最佳值,我們先通過(guò)隨機(jī)搜索縮小超參數(shù)的范圍,然后用網(wǎng)格搜索找到模型的最佳參數(shù)。最后發(fā)現(xiàn)最好的組合是n_estimators為16,learning_rate是0.16。
用于訓(xùn)練Br和(BH)max預(yù)測(cè)模型的數(shù)據(jù)數(shù)量分別為149和154。數(shù)據(jù)分布如圖3和圖4所示。Br的范圍在0~1.1 T,其中大部分散布在0.2~1 T范圍內(nèi)。(BH)max的范圍在0~200 kJ/m3,其中大部分分布在0~150 kJ/m3。訓(xùn)練和選擇參數(shù)的過(guò)程與Hcj幾乎相同。隨機(jī)森林構(gòu)建Br和(BH)max模型的最佳超參數(shù)組合(max_features,n_estimators)分別是(12,44)和(7,26),GBRT構(gòu)建Br和(BH)max模型的最佳超參數(shù)組合(learning_rate,n_estimators)分別是(0.15,14)和(0.13,100)。我們使用這些組合作為最佳模型。
圖3 Br數(shù)據(jù)集的數(shù)據(jù)分布Figure 3 Data distribution of the Br dataset
圖4 (BH)max數(shù)據(jù)集的數(shù)據(jù)分布Figure 4 Data distribution of the (BH)max dataset
訓(xùn)練出最佳超參數(shù)的模型后,表2顯示了兩個(gè)算法在訓(xùn)練集上構(gòu)建模型的預(yù)測(cè)性能,結(jié)果表明模型已經(jīng)在訓(xùn)練集上得到了較好的訓(xùn)練。表3顯示了兩個(gè)模型在測(cè)試集上的預(yù)測(cè)性能,基于GBRT算法的Hcj和Br預(yù)測(cè)模型性能更強(qiáng),而基于隨機(jī)森林算法的(BH)max預(yù)測(cè)模型性能更強(qiáng),可能是由于(BH)max預(yù)測(cè)模型中的估計(jì)器數(shù)量設(shè)置過(guò)高,導(dǎo)致了過(guò)擬合。Hcj、Br、(BH)max三個(gè)模型的最好性能指標(biāo)MAE分別為91.8 kA/m、0.047 T和6.583 kJ/m3。此外,在測(cè)試集上的RMSE
表2 基于RF、GBRT的預(yù)測(cè)模型在訓(xùn)練集上的性能
表3 基于RF、GBRT的預(yù)測(cè)模型在測(cè)試集上的性能
和MAE都略高于訓(xùn)練集,這意味著模型可能過(guò)擬合到訓(xùn)練集。然而,由于數(shù)據(jù)集的數(shù)量相對(duì)較少,原則上模型過(guò)度擬合是不可避免的。
圖5是我們實(shí)驗(yàn)室得到的(La0.25Ce0.5Pr0.05Nd0.2)16-xFe78+xB6快淬薄帶磁滯回線圖,x=0~6,快淬速度為25 m/s,未進(jìn)行退火。表4是根據(jù)圖5得到的Hcj數(shù)據(jù),并給出了預(yù)測(cè)值與其比較??梢钥闯?樣本的預(yù)測(cè)結(jié)果與實(shí)驗(yàn)值十分接近,計(jì)算得到MAE為78.0 kA/m,此誤差對(duì)于混合稀土永磁合金的磁性能預(yù)測(cè)是完全可以接受的?;贕BRT的Hcj預(yù)測(cè)模型對(duì)這一快淬速度下的預(yù)測(cè)效果較為優(yōu)異,可能是因?yàn)橛?xùn)練集中在25 m/s的快淬磁體最多。
圖5 MM16-xFe78+xB6快淬薄帶磁滯回線圖Figure 5 Magnetic hysteresis loops of MM16-xFe78+xB6(x=0, 2, 4, 6) ribbons.
表4 最佳模型在實(shí)驗(yàn)數(shù)據(jù)上的預(yù)測(cè)情況
混合稀土永磁材料的開(kāi)發(fā)有利于平衡利用稀土資源和保護(hù)生態(tài)環(huán)境,具有重要的戰(zhàn)略意義。本文中,我們使用隨機(jī)森林算法和梯度提升樹(shù)算法成功開(kāi)發(fā)了三個(gè)預(yù)測(cè)模型分別預(yù)測(cè)混合稀土永磁材料的三個(gè)重要磁特性。我們的研究結(jié)果表明,利用現(xiàn)有文獻(xiàn)中的數(shù)據(jù),采用GBRT建立Hcj預(yù)測(cè)模型可以有效預(yù)測(cè)混合稀土永磁材料的磁性能,Hcj的預(yù)測(cè)值與實(shí)驗(yàn)室測(cè)得數(shù)據(jù)的平均絕對(duì)誤差為78.0 kA/m。
此外,特征的選擇和構(gòu)建是影響性能的最重要的因素。在進(jìn)一步的研究中,其他重要的物理特征參數(shù),如平均晶粒尺寸等信息,應(yīng)該包括在特征中,因?yàn)樗鼈儠?huì)極大地影響目標(biāo)特性,從而進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性與實(shí)用性。