李一航 肖 斌 唐宇超 劉 馥 王小夢 劉 軼
(1.上海大學(xué)理學(xué)院, 上海 200444; 2.上海大學(xué)材料基因組工程研究院, 上海 200444)
高通量第一性原理計算方法[1-2]可用于系統(tǒng)研究大量的材料體系和構(gòu)型, 但龐大的計算量使其成本高、耗時長.機(jī)器學(xué)習(xí)(machine learning, ML)方法[3-4]可以從計算或?qū)嶒灢牧蠑?shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí), 獲得其中隱含的關(guān)聯(lián)規(guī)律, 并用于對未知材料性能的高效預(yù)測.本研究基于高通量第一性原理計算數(shù)據(jù)構(gòu)建機(jī)器學(xué)習(xí)模型, 可加快新材料的能量和結(jié)構(gòu)預(yù)測,指導(dǎo)新材料的實驗合成.
尖晶石材料因其龐大的種類、靈活可調(diào)的組分以及優(yōu)異的物理化學(xué)性質(zhì)而被廣泛應(yīng)用于鋰電池正極[5-6]、光催化劑材料[7-8]、鐵氧體磁性材料[9]和半金屬材料[10]等領(lǐng)域.尖晶石氧化物可分為正尖晶石結(jié)構(gòu)、反尖晶石結(jié)構(gòu)和混合尖晶石結(jié)構(gòu)[11-13].本研究中的正尖晶石氧化物化學(xué)通式為AB2O4, 空間群為Fdm, 其中A, B 陽離子[14]分別處于氧離子形成的四面體間隙(T 位點)和八面體間隙(O 位點)中.通過多種方式, 結(jié)合T/O 位點中心原子TC/OC和T/O 位點環(huán)境原子TE/OE特征構(gòu)建的中心-環(huán)境(center-environment, CE)特征模型, 如圖1 所示.本研究用73 種元素(見圖2)分別替換尖晶石氧化物AB2O4結(jié)構(gòu)的T 位點和O 位點原子, 獲得了5 329(732=5 329)個可能的尖晶石氧化物.圖2 中的灰色背景元素表示沒有研究, 色標(biāo)從藍(lán)色到粉色作為對應(yīng)的單原子基態(tài)總能量的函數(shù), 正方形和圓形代表機(jī)器學(xué)習(xí)預(yù)測為“好”的T 位點和O 位點的穩(wěn)定性元素.
圖1 正尖晶石慣用單胞和CE 特征模型Fig.1 Conventional cell of the normal spinel type and the CE feature models
圖2 正尖晶石氧化物AB2O4 的組成元素Fig.2 Constitution elements of the normal spinel oxides AB2O4
在計算設(shè)計預(yù)測新材料時, 要求新材料必須是熱力學(xué)穩(wěn)定或亞穩(wěn)定的, 而形成能[15-16]的大小是評估新材料是否熱力學(xué)穩(wěn)定的重要判據(jù)之一.為了得到準(zhǔn)確的能量, 需要對預(yù)測結(jié)構(gòu)進(jìn)行充分弛豫, 弛豫后的計算結(jié)構(gòu)可作為未來實驗驗證結(jié)構(gòu)的理論參考依據(jù).本研究使用高通量第一性原理計算方法研究了5 329 個尖晶石氧化物AB2O4結(jié)構(gòu)的形成能和晶格常數(shù), 提出了一種“中心-環(huán)境”(CE)特征模型, 以構(gòu)建同時包含成分和結(jié)構(gòu)信息的特征, 作為機(jī)器學(xué)習(xí)算法的輸入變量.基于密度泛函理論(density functional theory, DFT)計算數(shù)據(jù), 使用隨機(jī)森林算法開發(fā)了機(jī)器學(xué)習(xí)模型, 對尖晶石氧化物結(jié)構(gòu)的DFT 計算數(shù)據(jù)進(jìn)行了學(xué)習(xí)訓(xùn)練, 獲得的機(jī)器學(xué)習(xí)模型可以準(zhǔn)確有效地預(yù)測尖晶石氧化物的形成能和晶格常數(shù).
本研究采用基于贗勢投影綴加波的第一性原理計算方法, 通過VASP(Vienna Abinitio Simulation Package)軟件包[17]進(jìn)行計算.交換關(guān)聯(lián)泛函選取廣義梯度近似-PBE(generalized gradient approximation proposed by Perdew, Burke and Ernzerhof, GGA-PBE), 平面波截斷能為520 eV, 結(jié)構(gòu)優(yōu)化過程中保持能量的收斂精度為1×10-5eV/atom, 力的收斂精度為0.02 eV/°A(1°A=0.1 nm).通過收斂性測試, 布里淵區(qū)采用Monkhorst-Pack 的7×7×7 網(wǎng)格.本研究中尖晶石氧化物形成能的計算公式為
式中:Espinel是尖晶石晶胞的基態(tài)總能量;ET,EO和EO2分別為單個T 位點原子、單個O 位點原子和氧分子的基態(tài)總能量;nT,nO和NO分別為晶胞中T 位點原子、O 位點原子和氧原子的數(shù)量;N為單胞中的總原子數(shù).
本研究結(jié)合元素/單質(zhì)的基本性質(zhì)和尖晶石氧化物的組成與結(jié)構(gòu)信息來構(gòu)造復(fù)合特征.每個構(gòu)成元素選取了元素和相應(yīng)單質(zhì)的55 個基本性質(zhì)[18], 如原子半徑、氧化態(tài)、電負(fù)性等(見表1).
表1 元素和單質(zhì)的基本性質(zhì)Table 1 Fundamental features of elements and simple substances
基于特征工程理念, 本研究構(gòu)造了CE 特征模型, 通過將基本屬性投影到由組分和結(jié)構(gòu)信息組成的基組上來構(gòu)造特征.定義一個由中心原子和周圍環(huán)境原子組成的CE 原子集, 其中環(huán)境原子包括距離中心原子第1 近鄰到第N近鄰的原子(N=1~10).如果只有一個中心原子及其對應(yīng)的環(huán)境原子, 則稱之為單中心CE(single CE, sCE)特征模型; 如果包括兩個中心原子及其對應(yīng)的環(huán)境原子, 則稱之為雙中心CE(dual CE, dCE)特征模型.
CE 特征模型的基本思想是分別定義區(qū)分中心原子和環(huán)境原子, 然后將環(huán)境原子的基礎(chǔ)性質(zhì)以與中心原子距離的倒數(shù)作為權(quán)重進(jìn)行線性加和, 從而實現(xiàn)將化學(xué)成分和結(jié)構(gòu)信息編碼到機(jī)器學(xué)習(xí)特征中.機(jī)器學(xué)習(xí)訓(xùn)練集D包括特征Fi(i=1~55 為性質(zhì)序數(shù))和預(yù)測目標(biāo)T, 具體定義為
特征Fi(i=1~55)包括中心原子特征fC,i和環(huán)境原子特征fE,i, 即
中心原子的基本性質(zhì)pC,i可直接作為該中心原子的特征, 即
環(huán)境原子的特征是根據(jù)每個環(huán)境原子j的基本性質(zhì)pj,i及其到中心原子距離的倒數(shù), 加權(quán)求和而成的復(fù)合屬性特征, 即
式中,ωj為求和權(quán)重, 設(shè)環(huán)境原子j與中心原子的距離為rj, 則
本研究以單中心和雙中心、標(biāo)量和矢量等不同方式將中心原子和環(huán)境原子特征組合,構(gòu)建成多種復(fù)合CE 特征模型.dCE 特征模型分別選取尖晶石氧化物結(jié)構(gòu)的非等效T 位點和O 位點作為中心.TC和TE代表T 位點的中心原子及其周圍環(huán)境, 如圖1(a)中Ⅰ和Ⅱ所示; OC和OE代表O 位點的中心原子及其周圍環(huán)境, 如圖1(a)中Ⅲ和Ⅳ所示.CE-1, CE-3, CE-6 和CE-7 為4 個sCE 特征模型; CE-2, CE-4, CE-5 和CE-8 為4 個dCE 特征模型.在這8 個特征模型中, 分別將T 位點或O 位點定義為中心原子, 并將其第1 近鄰至第10 近鄰的原子分別考慮為環(huán)境原子.弛豫后的原型鎂鋁尖晶石MgAl2O4幾何構(gòu)型信息, 被用作構(gòu)建本研究的尖晶石氧化物結(jié)構(gòu)CE 特征模型時的基礎(chǔ)結(jié)構(gòu).使用固定的原型結(jié)構(gòu)信息來構(gòu)造CE 特征氧化物, 可使機(jī)器學(xué)習(xí)模型更易于預(yù)測和遷移, 不受個別結(jié)構(gòu)弛豫后幾何構(gòu)型變化的影響, 從而避免對新未知結(jié)構(gòu)進(jìn)行昂貴的第一性原理計算.
本研究采用隨機(jī)森林算法訓(xùn)練機(jī)器學(xué)習(xí)模型.采用前述的CE 特征模型作為機(jī)器學(xué)習(xí)模型的輸入變量, 預(yù)測性能包括尖晶石氧化物結(jié)構(gòu)的形成能和晶格常數(shù)等.選取所有數(shù)據(jù)的80%作為訓(xùn)練集, 采用5 折交叉驗證, 通過網(wǎng)格搜索確定最佳超參數(shù).剩余的20%數(shù)據(jù)作為完全獨(dú)立的性能測試集, 并不參與模型訓(xùn)練.將決定系數(shù)(coefficient of determination)R2、平均絕對誤差(mean absolute error, MAE)和均方根誤差(root mean squared error, RMSE)作為機(jī)器學(xué)習(xí)模型性能的評價指標(biāo), 具體定義分別如下:
式中:yi是實驗或計算獲得的目標(biāo)值;是單個樣本yi的預(yù)測值;是所有樣本的預(yù)測值的平均值.
本研究構(gòu)建了8 個基于不同組合方式的CE 機(jī)器學(xué)習(xí)特征模型, 其中包括4 個sCE 特征模型(CE-1, CE-3, CE-6, CE-7)和4 個dCE 特征模型(CE-2, CE-4, CE-5, CE-8).這些CE 特征模型對形成能預(yù)測的相關(guān)系數(shù)R2和RMSE 如表2 所示, 其中環(huán)境原子選取從中心原子的第1 近鄰到第10 近鄰的原子, 收斂結(jié)果以粗體顯示.
表2 8 種CE 特征模型預(yù)測的形成能測試集的相關(guān)系數(shù)R2 和RMSETable 2 Correlation coefficient R2 and RMSE of the predictions of formation energies in the testing data sets by the eight CE feature models
通過對4 個sCE 特征模型的預(yù)測性能進(jìn)行比較發(fā)現(xiàn): ①標(biāo)量特征模型CE-1[TC+TE]預(yù)測的RMSE 在第2 近鄰處收斂于0.252 eV/atom, 而CE-3[OC+OE]預(yù)測的RMSE 在第4 近鄰處收斂于0.166 eV/atom, 這表明T 位點標(biāo)量特征模型的收斂速度比O 位點標(biāo)量特征模型快, 但是后者的預(yù)測精度較高; ②二維矢量特征模型CE-6[TC, TE]預(yù)測的RMSE 收斂于第2 近鄰, 而CE-7[OC, OE]預(yù)測的RMSE 在第4 近鄰處收斂, 二者預(yù)測的RMSE 均約為0.145 eV/atom.可見, T 位點矢量特征模型的收斂速度仍然比O 位點矢量特征模型快, 但二者達(dá)到了相似的精度,且均優(yōu)于標(biāo)量特征模型.綜合考慮收斂性和準(zhǔn)確性, CE-6 是最佳的sCE 特征模型.
通過對4 個dCE 特征模型的預(yù)測性能進(jìn)行比較發(fā)現(xiàn): ①標(biāo)量特征模型CE-5[TC+TE+OC+OE]預(yù)測的RMSE 在第2 近鄰處收斂于0.164 eV/atom; ②矢量特征模型CE-2, CE-4 和CE-8 預(yù)測的RMSE 均收斂于約0.145 eV/atom, 優(yōu)于標(biāo)量特征模型.二維矢量特征模型CE-2[TC+TE, OC+OE]預(yù)測的RMSE 收斂于第1 近鄰, 而CE-4[TC+OC, TE+OE]預(yù)測的RMSE 收斂于第2 近鄰.這表明將中心原子與環(huán)境原子分離的收斂速度快于將T 位點原子與O 位點原子分離的速度.四維矢量特征模型CE-8[TC, TE, OC, OE]預(yù)測的RMSE 收斂于第1 近鄰, 類似于CE-2[TC+TE, OC+OE].因此, 根據(jù)收斂性和準(zhǔn)確性結(jié)果, CE-2[TC+TE,OC+OE]和CE-8[TC, TE, OC, OE]在所有8 個CE 特征模型中具有相似的最佳性能.此外, 四維矢量特征模型CE-8[TC, TE, OC, OE]同時區(qū)分了中心原子、環(huán)境原子以及T 位點、O 位點,其優(yōu)點是可以避免因交換T 位點和O 位點異種元素而產(chǎn)生的特征簡并, 但在二維矢量特征模型CE-2[TC+TE, OC+OE]中則會出現(xiàn)這種特征簡并情況.
本研究中的四維和二維矢量CE 特征模型具有相似的預(yù)測精度.這可能是因為: 一方面很多T 位點和O 位點占據(jù)元素的穩(wěn)定性, 具有近似交換不變的對稱性; 如果這種位點占據(jù)穩(wěn)定性的交換對稱被破壞, 則四維矢量特征模型應(yīng)該比二維矢量特征模型具有更準(zhǔn)確的描述能力和預(yù)測準(zhǔn)確性; 另一方面, 如果訓(xùn)練數(shù)據(jù)數(shù)量有限, 比二維矢量特征模型更復(fù)雜的四維矢量特征模型可能更容易導(dǎo)致過擬合.因此, 在CE 特征模型的實際應(yīng)用中應(yīng)根據(jù)研究結(jié)構(gòu)的復(fù)雜性與可用數(shù)據(jù)集的大小折衷選擇矢量特征模型的維數(shù).如果結(jié)構(gòu)復(fù)雜并且數(shù)據(jù)集很大, 高維CE 特征模型在準(zhǔn)確性和可遷移性方面的表現(xiàn)會更好; 反之, 低維CE 特征模型就能達(dá)到足夠高的預(yù)測精度, 且避免了過擬合.
所有8 種CE 特征模型對晶格常數(shù)預(yù)測的收斂行為類似于形成能, 結(jié)果如表3 所示, 其中環(huán)境原子選取從中心原子的第1 近鄰到第10 近鄰的原子, 收斂結(jié)果以粗體顯示.但是, 對于晶格常數(shù)大于0.7 nm 的結(jié)構(gòu)的預(yù)測精度不如其他結(jié)構(gòu).這可能是由于晶格常數(shù)大于0.7 nm 的結(jié)構(gòu)數(shù)量較少, 從而導(dǎo)致機(jī)器學(xué)習(xí)模型不能對這類結(jié)構(gòu)進(jìn)行很好的學(xué)習(xí).綜合考慮預(yù)測精度和收斂速度, CE-8 特征模型預(yù)測的RMSE 在第1 近鄰處達(dá)到了0.087°A, 表現(xiàn)最佳.
表3 8 種CE 特征模型預(yù)測的晶格常數(shù)測試集的相關(guān)系數(shù)R2 和RMSETable 3 Correlation coefficient R2 and RMSE of the prediction of lattice constants in the testing data sets by the eight CE feature models
綜合考慮晶格常數(shù)預(yù)測結(jié)果的精度和收斂速度, CE-8 特征模型在最近鄰處的預(yù)測結(jié)果最好.圖3 和4 是對5 329 種尖晶石氧化物結(jié)構(gòu)形成能和晶格常數(shù)的DFT 計算結(jié)果的統(tǒng)計分析.5 329 種尖晶石氧化物結(jié)構(gòu)中有141 種是已被實驗合成的結(jié)構(gòu)[19].圖5 是CE-8 特征模型在最近鄰處機(jī)器學(xué)習(xí)預(yù)測結(jié)果的統(tǒng)計, 其中141 個已知實驗結(jié)構(gòu)的形成能以紅色表示.本研究對這些實驗結(jié)構(gòu)進(jìn)行了DFT 計算, 發(fā)現(xiàn)其形成能在-2.999~-0.633 eV/atom 之間, 因此可將研究的尖晶石氧化物結(jié)構(gòu)分為3 類: ①形成能大于-2.999 eV/atom 的更穩(wěn)定(more stable,MS)結(jié)構(gòu); ②形成能介于-2.999~-0.633 eV/atom 之間的穩(wěn)定(stable, S)結(jié)構(gòu); ③形成能小于-0.633 eV/atom 的較不穩(wěn)定(less stable, LS)結(jié)構(gòu).如圖5(a)所示, 本研究中的尖晶石氧化物結(jié)構(gòu)可劃分成361 個MS 結(jié)構(gòu)、4 347 個S 結(jié)構(gòu)和466 個LS 結(jié)構(gòu).此外, 還有155 個結(jié)構(gòu)幾何弛豫不收斂, 主要是含有活性金屬Cs 和重稀土元素, 如Eu, Dy, Er 等.
圖3 8 種CE 特征模型預(yù)測的形成能與DFT 計算結(jié)果的比較Fig.3 Comparisons of the formation energies between the DFT calculations and the predictions of the eight CE feature models
形成能可衡量物質(zhì)的結(jié)合強(qiáng)度, 能作為判斷物質(zhì)是否熱力學(xué)穩(wěn)定的重要判據(jù)之一.本研究通過DFT 計算預(yù)測得到了形成能最大、熱力學(xué)最穩(wěn)定的前20 個尖晶石氧化物, 按熱力學(xué)穩(wěn)定性降低順序分別是YbLu2O4,YbTm2O4,YbEr2O4,YbSc2O4,CaLu2O4,YbHo2O4,YbY2O4,CaTm2O4, YbDy2O4, SrLu2O4, CaEr2O4, YbTb2O4, HfYb2O4, CaHo2O4, SrTm2O4,ThYb2O4, CaSc2O4, EuHo2O4, YbGd2O4和CaY2O4.這些通過DFT 計算預(yù)測得到的最穩(wěn)定的尖晶石氧化物結(jié)構(gòu)的形成能范圍是-3.57~-3.38 eV/atom, 遠(yuǎn)大于本研究實驗結(jié)構(gòu)的形成能范圍(-2.999~-0.633 eV/atom), 所以這些預(yù)測得到的穩(wěn)定尖晶石氧化物結(jié)構(gòu)更有可能被實驗合成.本研究的預(yù)測結(jié)果為將來實驗合成新型的、穩(wěn)定的尖晶石氧化物結(jié)構(gòu)指明了方向.
本研究預(yù)測的尖晶石氧化物的晶格常數(shù)(見圖5(b))也呈正態(tài)分布, 絕大多數(shù)結(jié)構(gòu)的晶格常數(shù)處于0.6~0.7 nm 之間.
圖5 CE-8 特征模型預(yù)測的形成能和晶格常數(shù)的統(tǒng)計分布直方圖Fig.5 Statistical distribution histogram of the formation energies and lattice constants predicted by CE-8 feature model
機(jī)器學(xué)習(xí)預(yù)測的形成能分布如圖6 所示, 其中橫軸和縱軸分別按照T 位點和O 位點組成元素的原子序數(shù)排序.根據(jù)形成能范圍定義的MS, S 和LS 結(jié)構(gòu)在熱圖中分別大致對應(yīng)藍(lán)色、綠色和橘紅色區(qū)域(白色區(qū)域是計算不收斂結(jié)構(gòu)).這3 種區(qū)域呈現(xiàn)出局部聚集的塊狀, 而非稀疏的點樣分布, 表明具有相近原子序數(shù)的結(jié)構(gòu)元素通常形成具有相似穩(wěn)定性的尖晶石氧化物.此外, 除少數(shù)情況外, 大多數(shù)聚集的塊狀呈對角對稱分布.這表明將T 位點或O 位點元素替換為鄰近的元素可以形成穩(wěn)定性相似的結(jié)構(gòu), 即穩(wěn)定性的位點互換不變對稱性.這也解釋了為什么會存在很多穩(wěn)定的反尖晶石和混合尖晶石氧化物.
圖4 8 種CE 特征模型預(yù)測的晶格常數(shù)與DFT 計算結(jié)果的比較Fig.4 Comparisons of the lattice constants between the DFT calculations and the predictions of the eight CE feature models
為便于指導(dǎo)實驗合成新型穩(wěn)定的尖晶石氧化物, 本研究分別針對T 位點和O 位點將73 個置換元素定性地劃分為與穩(wěn)定性有關(guān)的“好”和“壞”元素(見圖2).如圖6 所示: T 位點和O 位點的穩(wěn)定性“好”元素組合可形成更穩(wěn)定的MS 結(jié)構(gòu), 顯示為圖6 中的藍(lán)色區(qū)域; T 位點和O 位點的穩(wěn)定性“壞”元素組合形成了更不穩(wěn)定的LS 結(jié)構(gòu), 顯示為圖6 中的橘紅色區(qū)域; 如果在T 位點和O 位點分別存在穩(wěn)定性“好”元素和“壞”元素, 則形成一般穩(wěn)定的S 結(jié)構(gòu), 顯示為圖6 中的綠色區(qū)域,其穩(wěn)定性與已知的實驗結(jié)構(gòu)相當(dāng).穩(wěn)定性“好”和“壞”元素都呈現(xiàn)出T/O 位點的對稱穩(wěn)定性, 即大多數(shù)元素對于T 位點和O 位點同時都是穩(wěn)定性“好”元素或“壞”元素(見圖2 和6).但也有一些少數(shù)例外: 例如, Ru 是T 位點的穩(wěn)定性“好”元素, 但卻是O 位點的穩(wěn)定性“壞”元素; Sc, Hf, Pa, U 和Np 是O 位點的穩(wěn)定性“好”元素, 但卻是T 位點的穩(wěn)定性“壞”元素.
圖6 機(jī)器學(xué)習(xí)預(yù)測的形成能熱圖Fig.6 Heat map of the formation energies predicted by ML
根據(jù)A, B 陽離子的平均離子半徑, 對預(yù)測的尖晶石晶格常數(shù)進(jìn)行約化, 即將晶格常數(shù)除以(RA+RB)/2, 其中RA和RB分別表示A, B 陽離子的離子半徑.圖7 為根據(jù)A, B 陽離子的平均離子半徑約化后的晶格常數(shù)熱圖.可以看到: 約化后的晶格常數(shù)熱圖顯示出分塊分布的特性, 即原子序數(shù)相近的元素形成的尖晶石氧化物結(jié)構(gòu)具有近似的約化晶格常數(shù); 約化后的晶格常數(shù)顯示出沿對角線的對稱性, 表明將T 位點或O 位點元素替換為鄰近的元素可以具有相近的約化晶格常數(shù)的結(jié)構(gòu).相比于同周期的其他元素, 含堿金屬元素Li, Na, K, Rb, Cs 的尖晶石結(jié)構(gòu)通常具有相對較小的約化晶格常數(shù).這可能是由于堿金屬元素相比同周期元素?fù)碛懈蟮碾x子半徑.此外, 當(dāng)A, B 陽離子的原子序數(shù)均較小時, 其晶體結(jié)構(gòu)比原子序數(shù)均較大時具有明顯更大的約化晶格常數(shù).這可能是由于原子序數(shù)均較小時的元素具有較小的電負(fù)性, 更容易向氧轉(zhuǎn)移電子, 從而導(dǎo)致帶更多負(fù)電的氧離子間排斥力增加, 約化晶格常數(shù)增加.
圖7 根據(jù)A, B 陽離子的平均離子半徑約化后的晶格常數(shù)熱圖Fig.7 Heat map of the lattice constants after reduction of the average ion radius of A and B cations
為了進(jìn)一步獨(dú)立測試驗證本研究結(jié)果的準(zhǔn)確性, 將文獻(xiàn)報道的已被實驗合成的141 個尖晶石氧化物結(jié)構(gòu)的晶格常數(shù)實驗值分別與DFT 計算值和隨機(jī)森林機(jī)器學(xué)習(xí)預(yù)測值進(jìn)行比較, 結(jié)果如圖8 所示.可見, 機(jī)器學(xué)習(xí)預(yù)測點陣常數(shù)的RMSE 為0.04 °A, 比DFT 計算的RMSE(0.09 °A)更低, 進(jìn)一步證實了機(jī)器學(xué)習(xí)模型的預(yù)測有效性.表4 和5 是部分已知尖晶石氧化物結(jié)構(gòu)的形成能和帶隙的實驗值、DFT 計算值以及機(jī)器學(xué)習(xí)預(yù)測值.DFT 計算值與部分實驗值的偏差可能來源于交換相關(guān)密度泛函的近似.由于將DFT 計算值作為目標(biāo)值進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練, 所以機(jī)器學(xué)習(xí)和DFT 計算結(jié)果比較一致.
表4 部分已知尖晶石氧化物結(jié)構(gòu)的形成能的實驗值、DFT 計算值和機(jī)器學(xué)習(xí)預(yù)測值Table 4 Experimental values, DFT calculation values, and ML prediction values of the formation energies of some known spinel oxides (eV·atom-1)
圖8 已被實驗合成的141 個尖晶石氧化物結(jié)構(gòu)的晶格常數(shù)實驗值與DFT 計算值和機(jī)器學(xué)習(xí)預(yù)測值的比較Fig.8 Comparisons of the experimental lattice constants of 141 known spinel oxide structures with the results calculated by DFT and predicted by ML
表5 部分已知尖晶石氧化物帶隙的實驗值、DFT 計算值和機(jī)器學(xué)習(xí)預(yù)測值Table 5 Experimental values, DFT calculation values, and ML prediction values of the band gap of some known spinel oxides eV
本研究通過第一性原理計算和機(jī)器學(xué)習(xí)方法, 系統(tǒng)研究了包含73 種A/B 構(gòu)成元素的5 329 種AB2O4正尖晶石氧化物.根據(jù)141 個已知的尖晶石氧化物結(jié)構(gòu)的形成能范圍(-2.999~-0.633 eV/atom), 將預(yù)測結(jié)構(gòu)分為361 個更穩(wěn)定(MS)結(jié)構(gòu)、4 347 個穩(wěn)定(S)結(jié)構(gòu)和466 個較不穩(wěn)定(LS)結(jié)構(gòu).為指導(dǎo)實驗成分設(shè)計, 提出了與尖晶石氧化物的穩(wěn)定性定性相關(guān)的“好”和“壞”的構(gòu)成元素.常見的穩(wěn)定性“好”元素是Ⅱ, Ⅲ, Ⅳ族元素和稀土元素, 大部分具有對稱的占位穩(wěn)定性.含IA 族堿金屬元素的尖晶石氧化物結(jié)構(gòu)通常具有較大的晶格常數(shù).本研究預(yù)測的穩(wěn)定性尖晶石氧化物結(jié)構(gòu)對進(jìn)一步實驗合成新型尖晶石氧化物具有指導(dǎo)意義.
本研究構(gòu)建了包含成分和結(jié)構(gòu)信息的CE 機(jī)器學(xué)習(xí)特征模型.該模型能夠高效預(yù)測尖晶石氧化物的能量和結(jié)構(gòu)特性, 并獲得與第一性原理方法相當(dāng)?shù)木?通過考察不同的特征構(gòu)建方式, 發(fā)現(xiàn)雙中心CE(dCE)模型的預(yù)測性能通常優(yōu)于單中心CE(sCE)模型, 并且應(yīng)綜合考慮結(jié)構(gòu)的復(fù)雜性和可用數(shù)據(jù)的數(shù)量來選擇復(fù)合特征向量的維數(shù).如果結(jié)構(gòu)復(fù)雜、對稱性很低并且具有大量數(shù)據(jù), dCE 或多中心CE 特征模型的矢量形式將比sCE 模型更加準(zhǔn)確可靠.本研究中的CE 特征模型可推廣用于其他凝聚態(tài)材料能量和結(jié)構(gòu)的機(jī)器學(xué)習(xí)預(yù)測.