• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    低電阻率三元金合金材料的逆向設(shè)計

    2021-05-15 02:38:54王向東徐鵬程劉秀娟陸文聰
    中國材料進展 2021年4期
    關(guān)鍵詞:投影圖模式識別電阻率

    王向東,徐鵬程,盧 天,劉秀娟,陸文聰,

    (1.上海大學(xué) 材料基因組工程研究院,上海 200444)(2.上海大學(xué)理學(xué)院,上海 200444)

    1 前 言

    近年來,機器學(xué)習(xí)(machine learning, ML)或數(shù)據(jù)挖掘已經(jīng)成功地應(yīng)用于材料科學(xué)研究中[1-4]。例如,Xue等[5]報道了如何通過自適應(yīng)設(shè)計加速尋找具有目標性能的新材料,并進行了推理和全局優(yōu)化,以尋找具有極低熱滯后的鎳鈦基形狀記憶合金。何鵬程等[6]報道了模式識別在核殼結(jié)構(gòu)鈷鋁復(fù)合氫氧化物形貌可控合成中的應(yīng)用。由于三元金合金組分和配比的復(fù)雜性,到目前為止,找到一種簡單、有效的方法來設(shè)計具有理想性能的新材料仍然是一項挑戰(zhàn)。我們期望通過ML模型設(shè)計出性能更好的新材料,從而加速對新材料的研究。

    金合金具有接觸電阻低、導(dǎo)電性和導(dǎo)熱性良好、噪音電平低以及抗有機氣氛污染能力良好等優(yōu)良的電學(xué)和化學(xué)性能[7, 8],故金合金在電接觸材料方面具有很好的應(yīng)用前景,尤其是在輕負荷、小接觸壓力使用條件下更能顯示其優(yōu)良的特性[9-11]。電接觸材料一般在電器開關(guān)中使用,電阻率是其重要特性之一,因此研究低電阻率三元金合金具有非常重要的意義。

    本工作采用的材料設(shè)計策略流程如圖1所示。原始數(shù)據(jù)由51個三元金合金樣本組成,利用最大相關(guān)最小冗余(mRMR)結(jié)合XGBoost算法篩選出建模的特征變量,然后應(yīng)用作者實驗室開發(fā)的模式識別逆投影方法設(shè)計了3個低電阻率三元金合金候選樣本,最后通過XGBoost模型估算出候選樣本的電阻率。

    2 實驗方法

    2.1 數(shù)據(jù)集與描述符

    本文原始數(shù)據(jù)來自于材料數(shù)據(jù)科學(xué)平臺(MPDS)數(shù)據(jù)庫[12, 13],它由51個在常溫常壓下的三元金合金樣本組成。在數(shù)據(jù)集中,用化學(xué)符號表示三元金合金(ABC)時,先將Au元素排在A位,然后將其他兩個元素按電負性上升的順序排列,若兩個元素的電負性相同,則再按價電子數(shù)上升的順序排列。對目標值電阻率取負對數(shù),得到其數(shù)值在4~6.8之間。將數(shù)據(jù)集中-lgρ大于5.71(數(shù)據(jù)集的中位數(shù))的劃分為優(yōu)類樣本(good samples),將-lgρ小于5.71的劃分為劣類樣本(bad samples),因此可得到優(yōu)類樣本26個,劣類樣本25個。本工作中共收集了64個特征描述符[14],其中包括62個原子參數(shù)描述符和2個組分描述符。

    2.2 最大相關(guān)最小冗余算法

    mRMR算法是一種濾波式的特征篩選算法,它以不同的方式在相關(guān)性和冗余度之間進行權(quán)衡,并且以互信息作為計算準則來比較特征與類變量之間的相關(guān)性以及特征之間的冗余度,通過最大化特征與類變量的相關(guān)性以及最小化特征之間的冗余度來進行特征選擇[15]。

    最大相關(guān)性原理是指選擇那些與模型具有最大相關(guān)性的特征,相關(guān)性越大,則說明訓(xùn)練出的模型解決問題的能力越強。特征之間的相關(guān)性越大,則冗余度越高。為了減少特征之間的冗余度并使每個特征具有代表性,需要將冗余度降低到最小,這就是最小冗余原理。

    2.3 統(tǒng)計模式識別

    統(tǒng)計模式識別是ML的主要方法之一, 為了實現(xiàn)統(tǒng)計模式識別方法的自動建模,有必要從通過不同方法獲得的眾多投影圖中自動選擇最佳模式識別分類投影圖(二維投影面)[16]。

    2.3.1 最佳投影識別法

    由于不同的計算原理,不同的統(tǒng)計模式識別方法可以獲得不同分類結(jié)果的投影圖。但即使相同的統(tǒng)計模式識別方法也可能具有不同的投影方向,如主成分分析(PCA)方法能得出N(N-1)/2個不同的投影圖, 其中N為特征變量數(shù)。為此, 我們利用最佳投影識別法[17]探索尋找分類最佳的二維投影面, 其原理是在計算了若干個統(tǒng)計模式識別投影后(本工作應(yīng)用了主成分、偏最小二乘、Fisher判別矢量、球形映照等投影),使用迭代方法在每個隱含的投影平面上搜索出最佳分類的投影圖,即在該投影圖上將優(yōu)類樣本在一定范圍內(nèi)聚集, 且使優(yōu)化區(qū)(優(yōu)類樣本分布范圍)混合的劣類樣本的數(shù)量盡可能少。

    2.3.2 逆投影法

    模式識別投影圖上顯示的樣本點的坐標是各原始特征變量的線性組合或是某種沒有實際意義的映像,實際工作中實施的“優(yōu)化樣本”必須由原始特征變量來表示,因此需要通過特定的算法將二維模式識別圖上優(yōu)化區(qū)域中設(shè)計的“優(yōu)化樣本”返回到原始樣本,該過程被稱為“逆投影”[6]。

    逆投影是為二維空間的設(shè)計點找到多維空間的源像。如果沒有約束條件,那么逆投影將有無數(shù)多個解,故逆投影的結(jié)果只有在某些約束條件下才是唯一的。例如,為線性逆投影引入的約束條件是將設(shè)計點在各個投影矢量上的坐標取定值,而為非線性逆投影引入的約束是使逆投影的誤差函數(shù)最小。

    本工作采用線性的模式識別逆投影方法,只需要用戶在投影圖上設(shè)定一個點,就能得到一組由橫縱坐標的投影矢量所決定的聯(lián)立方程組(含2個方程組),如式(1)所示:

    (1)

    其中,xij為第i個投影上的第j個特征變量(有n個),aij和bi是決定模式識別投影的系數(shù),ci是設(shè)計樣本的投影坐標。由式(1)確定的定量關(guān)系只有2個,因此,若想得到唯一解,必須給定n-2個約束條件。本工作進一步采用n-2個變量的平均值代入上面的方程,則可將上面的方程轉(zhuǎn)化為二元一次線性方程組,從而求得該方程組的唯一解。

    3 結(jié)果與討論

    3.1 變量篩選

    變量篩選的目的是去除冗余的自變量,用盡可能少的自變量建立預(yù)報結(jié)果盡可能好的ML模型。為了去除共線性的自變量,本工作計算了所有64個特征描述符(自變量)之間的皮爾遜相關(guān)系數(shù),若2個變量間的皮爾遜相關(guān)系數(shù)大于0.9,則刪除其中一個變量[18]。任意2個描述符x和y之間的皮爾遜相關(guān)系數(shù)(R)的計算如式(2)所示:

    (2)

    利用mRMR算法對44個特征變量進行排序[15]。圖2給出了排序在前15的變量間的皮爾遜相關(guān)系數(shù)熱圖。隨后通過XGBoost算法篩選出與ML的最優(yōu)變量子集[19]。為了評估變量子集,采用實驗值與留一法預(yù)測值之間的相關(guān)系數(shù)(R)來評價變量篩選的效果,最優(yōu)變量子集相應(yīng)的R值最大。從圖3可以看到相關(guān)系數(shù)R與所選變量數(shù)之間的關(guān)系,即R值隨著變量數(shù)先增加,在達到最大值之后逐漸減小。因為最合適的變量數(shù)可能在峰值附近,因此選擇了前11個變量進行了更詳細的計算。從圖3中可以發(fā)現(xiàn),R的趨勢與均方根誤差(RMSE)正好相反,利用前5個變量所建的XGBoost模型擁有最好的表現(xiàn),即最大的R值與最小的RMSE值,故選擇前5個變量進行后續(xù)的ML建模和材料設(shè)計。這5個變量分別為B位組分數(shù)(RB)、C位組分數(shù)(RC)、C位電負性(χC)、B位第二電離能(I2B)、C位第一電離能(I1C)。

    圖2 排序在前15的變量間的皮爾遜相關(guān)系數(shù)熱圖Fig.2 Heat map of Pearson correlation coefficient among the top 15 variables

    圖3 mRMR-XGBoost進行變量篩選Fig.3 Variable screening by mRMR-XGBoost

    3.2 逆向設(shè)計

    利用本實驗室的HyperMiner數(shù)據(jù)挖掘軟件[20],以RB、RC、I2B、χC和I1C為特征變量,電阻率為目標值,經(jīng)過最佳投影計算,得到如圖4所示的最佳模式識別投影圖及逆投影點,對應(yīng)于PCA方法的第一主成分PCA(1)和第三主成分PCA(3)構(gòu)成的投影圖,發(fā)現(xiàn)有明顯的統(tǒng)計分布規(guī)律[6, 21, 22]。圖4中的矩形區(qū)域為優(yōu)化區(qū),其中優(yōu)類樣本約占70.3%,高于總樣本中優(yōu)類樣本所占比例(51%)。由此得出,若要得到低電阻率的三元金合金,則設(shè)計的三元金合金樣本應(yīng)盡可能控制在優(yōu)化區(qū)內(nèi)。圖4中優(yōu)化區(qū)分布范圍可由如下聯(lián)立方程組式(3)和式(4)表示:

    4.530≤0.648[RB]+0.207[RC]+8.531×10-4[EISB]+

    1.005[ENC]+4.358×10-3[EIFC]≤8.322

    (3)

    0.915≤-6.979×10-3[RB]+7.821×10-2[RC]+4.678×10-3

    [EISB]-1.775[ENC]-1.211×10-3[EIFC]≤4.485

    (4)

    在最佳模式識別投影圖中選取3個點作為虛擬樣本(virtual samples),如圖4所示。然后使用模式識別逆投影的方法計算出3個虛擬樣本的特征變量(表1)。最后通過計算歐式距離,得到與虛擬樣本點最接近的候選樣本,如表2所示。

    圖4 最佳模式識別投影圖及逆投影點(虛擬樣本)Fig.4 Optimal pattern recognition projection diagram and inverse projection point(virtual samples)

    表1 逆向設(shè)計的虛擬樣本Table 1 Virtual samples of inverse design

    由表2可知,候選樣本分別由1個前過渡元素和2個后過渡元素組成。依據(jù)Chen等[23]研究中3個過渡元素金屬間化合物的形成規(guī)律,可得出結(jié)論,Rsp(B)/Rsp(C)>1.3的三元合金系能形成三元金屬間化合物(Rsp表示原子偽勢半徑)。因為Rsp(Zr)/Rsp(Cu)為1.38,Rsp(Sc)/Rsp(Cu)為1.35,均大于1.3,所以候選樣本可形成三元合金。

    表2 對應(yīng)虛擬樣本的候選樣本Table 2 Candidate samples corresponding to virtual samples

    3.3 性能估算

    采用4種不同的ML算法,即XGBoost、支持向量回歸(SVR,采用徑向基核函數(shù))[24]、多元線性回歸(MLR)[25]和嶺回歸(KRR)[26],來構(gòu)建-lgρ與特征變量的ML模型。根據(jù)每種算法的留一法交叉驗證的表現(xiàn)篩選-lgρ性能估算模型。從圖5可以看出XGBoost模型擁有最高的R值和最低的RMSE值,分別為0.850和0.331,超過了其他模型的結(jié)果[27]。因此,后續(xù)選擇XGBoost模型進行三元金合金-lgρ的估算。

    圖5 采用不同ML算法測得的三元金合金-lg ρ預(yù)測值(Pred.)與實驗值(Exp.):(a)XGBoost,(b)KRR,(c)MLR,(d)SVRFig.5 Predicted value (Pred.) and experimental value (Exp.) of -lg ρ of ternary gold alloys by using different ML algorithms:(a) XGBoost, (b) KRR, (c) MLR, (d)SVR

    使用XGBoost模型對候選樣本的-lgρ進行估算,可得到3個候選樣本的-lgρ值,如表3所示。從表3中可以看出,候選樣本的-lgρ值均大于原始數(shù)據(jù)集中-lgρ的最大值6.68,故模式識別及其逆投影算法可用于低電阻率三元金合金材料的逆向設(shè)計。

    表3 候選樣本估算值Table 3 Estimated values of candidate samples

    4 結(jié) 論

    本文以設(shè)計低電阻率三元金合金為目標,利用本實驗室的HyperMiner數(shù)據(jù)挖掘軟件,通過模式識別最佳投影找出了形成低電阻率三元金合金的邊界條件,然后應(yīng)用模式識別逆投影方法設(shè)計了3個低電阻率三元金合金候選樣本,最后通過XGBoost模型估算出候選樣本的電阻率。結(jié)果表明,根據(jù)逆投影方法設(shè)計的AuZr1.95Cu0.52、AuZr1.12Cu4和AuSc1.86Cu2.75樣本具有較低的電阻率,其-lgρ預(yù)報值分別為6.718,6.707和6.701,均超過了原始數(shù)據(jù)集-lgρ的最大值6.68。因此,本工作的研究方法可用于指導(dǎo)新材料的理論設(shè)計,有助于實驗數(shù)據(jù)的統(tǒng)計規(guī)律挖掘,用以加快新材料設(shè)計發(fā)展。

    猜你喜歡
    投影圖模式識別電阻率
    基于分裂狀態(tài)的規(guī)范偽括號多項式計算方法
    淺談模式識別在圖像識別中的應(yīng)用
    電子測試(2017年23期)2017-04-04 05:06:50
    第四屆亞洲模式識別會議
    三維電阻率成像與高聚物注漿在水閘加固中的應(yīng)用
    Wendt操作對紐結(jié)和鏈環(huán)影響的若干規(guī)律
    圖解荒料率測試投影圖及制作方法
    虛擬鏈環(huán)的Kauffman尖括號多項式的Maple計算
    隨鉆電阻率測井的固定探測深度合成方法
    海洋可控源電磁場視電阻率計算方法
    第3屆亞洲模式識別會議
    柏乡县| 焉耆| 上杭县| 丽水市| 黑山县| 横峰县| 湘乡市| 淮安市| 横山县| 密山市| 格尔木市| 罗甸县| 平舆县| 福清市| 定兴县| 家居| 钦州市| 双鸭山市| 泽普县| 滨州市| 山阴县| 蓬安县| 屏南县| 白河县| 秦皇岛市| 博乐市| 永丰县| 独山县| 株洲县| 班玛县| 收藏| 敦化市| 伊金霍洛旗| 新宁县| 四会市| 祥云县| 九龙城区| 朔州市| 东平县| 蒲江县| 丰原市|