夏延秋,王 宸,馮 欣,2*
(1.華北電力大學(xué) 能源動力與機(jī)械工程學(xué)院,北京 102206;2.中國科學(xué)院蘭州化學(xué)物理研究所 固體潤滑國家重點(diǎn)實(shí)驗(yàn)室,甘肅 蘭州 730000)
潤滑油是廣泛應(yīng)用于汽車、機(jī)械和冶金等行業(yè)的重要產(chǎn)品,主要由基礎(chǔ)油和添加劑組成.其中添加劑含量占比通常為1%~10%,主要用途是改善基礎(chǔ)油的原有性能或賦予新的性能.潤滑油添加劑的種類繁多,有十幾大類,近萬個品種.一般地說,潤滑油的品種和質(zhì)量往往取決于添加劑的品種和質(zhì)量[1],因而對添加劑的合理生產(chǎn)和使用,已成為有效利用資源,提高設(shè)備性能和節(jié)約能源的重要途徑之一[2-3].
鑒于添加劑在潤滑油品中所起的關(guān)鍵作用,實(shí)際生活中經(jīng)常通過對潤滑油內(nèi)添加劑的種類及含量的識別與剖析,作為判定潤滑油類別歸屬、品質(zhì)和性能的重要依據(jù).不僅適用于出廠油品的質(zhì)量檢測,也可據(jù)此監(jiān)測與評估在用潤滑油的健康等級,還成為對未知油品鑒別與解析的主要手段[4].但是傳統(tǒng)采用的理化測試分析方法多受人為因素影響,耗時長、誤差大且成本高.近年來興起的中紅外光譜分析技術(shù)[5-6],結(jié)合計(jì)算機(jī)技術(shù)和模式識別技術(shù)等近代計(jì)算分析方法,相較于傳統(tǒng)方法,具有無損、快速、高通量和低成本等優(yōu)點(diǎn)[7-8],越來越廣泛應(yīng)用于各種有機(jī)物質(zhì)的定性和定量分析.但在潤滑領(lǐng)域中的應(yīng)用,目前多側(cè)重于油品中單一成分檢測[9-10],針對油品中的微量添加劑多種類同步識別的研究在文獻(xiàn)中尚未見到.
對中紅外光譜數(shù)據(jù)的處理,現(xiàn)應(yīng)用較多的算法有偏最小二乘回歸(PLS)[11]、支持向量機(jī)(SVM)[12]、K近鄰(KNN)[13]和隨機(jī)森林(RF)[14]等.其中KNN和RF可以用于非線性分類[15-18],較適用于樣本容量比較大的類域自動分類問題,且不易發(fā)生過擬合,尤其是所具有的多輸出特點(diǎn)[19-20],為本文解決多種添加劑的種類同步識別問題提供了解決思路.但是此類方法通常需事先讀取所有的訓(xùn)練數(shù)據(jù),而占據(jù)大量的內(nèi)存空間,影響求解效率。為消除干擾及無效信息,降低搜索空間維度,最為行之有效的辦法就是對中紅外光譜特征波段進(jìn)行篩選.常用的特征優(yōu)選方法有后向間隔偏最小二乘法(BiPLS)[21]、蟻群算法(ACO)[22-23]、遺傳算法(GA)[24]和粒子群算法(PSO)[25]等.Liu等[26]利用BiPLS進(jìn)行近紅外光譜的特征優(yōu)選,并結(jié)合PLS建立玉米秸稈中纖維素和半纖維素含量預(yù)測模型,但BiPLS篩選波長耗時長且結(jié)果穩(wěn)定性較差.Zhang等[27]嘗試了改進(jìn)ACO算法對土壤全氮譜的特征提取,但ACO一般需要較長的搜索時間,且易出現(xiàn)停滯現(xiàn)象.文獻(xiàn)[28-29]均利用GA對近紅外光譜進(jìn)行特征選擇,可以較好地解決選擇過程中波段組合數(shù)目多和難以遍歷的問題,但其在有限時間內(nèi)的收斂效率有待提高.二進(jìn)制粒子群算法(BPSO)是PSO的二進(jìn)制版本,具有很強(qiáng)的全局搜索能力,在配電網(wǎng)故障定位和組合優(yōu)化問題方面已得到廣泛應(yīng)用,如文獻(xiàn)[30]用BPSO優(yōu)化了導(dǎo)電材料的分布,但其尚未被引入分類模型和光譜特征優(yōu)選問題中,且隨著算法迭代搜索隨機(jī)性越來越強(qiáng),缺乏后期的局部搜索能力.可見,單一優(yōu)化算法在計(jì)算效率、全局搜索性、通用性和簡潔性方面各具優(yōu)勢.
本文選用KNN算法和RF算法分別建立潤滑油添加劑種類識別基礎(chǔ)分類模型,設(shè)計(jì)并實(shí)現(xiàn)GA-BPSO混合優(yōu)化對光譜全波段的特征波段區(qū)域篩選方法,并以此構(gòu)建增強(qiáng)分類模型.選取實(shí)例進(jìn)行測試,通過對比分析GA-BPSO混合優(yōu)選以及GA和BPSO各自單一應(yīng)用時,兩種基礎(chǔ)模型分別與其對應(yīng)的增強(qiáng)模型之間波段范圍變化及識別結(jié)果差異,考察光譜波段篩選效果和模型識別準(zhǔn)確率情況,驗(yàn)證GA-BPSO優(yōu)選方法的有效性.
測試樣本所用基礎(chǔ)油為PAO-10,選用了T321、T534和T307三種常見設(shè)備潤滑油添加劑[31].其中T321是采用硫黃或單氯化硫及異丁烯為原料制得的含硫添加劑,具有含硫量高、極壓性能好、油溶性好和顏色淺等優(yōu)點(diǎn);T534是烷基二苯胺,一種性能優(yōu)越的高溫抗氧劑;T307是硫代磷酸胺鹽,具有優(yōu)良的極壓抗磨性、抗氧抗腐蝕性能及熱穩(wěn)定性.此三種添加劑多用于配制車輛齒輪油、工業(yè)齒輪油和汽輪機(jī)油等工業(yè)設(shè)備潤滑油.
樣本調(diào)配:三種添加劑均取質(zhì)量分?jǐn)?shù)為1%的量,按照排列組合的方式分別加入基礎(chǔ)油,構(gòu)成8種樣本,并統(tǒng)一進(jìn)行編號,如圖1所示.
Fig.1 The number of test samples 圖1 測試樣本編號
每種樣本采集10條光譜數(shù)據(jù),按照3:1的比例劃分訓(xùn)練集和測試集.
其中訓(xùn)練集數(shù)據(jù)的分布情況如圖2所示.
Fig.2 The distribution of training set data 圖2 訓(xùn)練集數(shù)據(jù)的分布情況
試驗(yàn)樣本數(shù)據(jù)采集儀器為Thermo Scientific Nicolet iS5傅里葉變換紅外光譜儀,光譜范圍:7 800~350 cm?1,采用KBr(溴化鉀)窗片.采集設(shè)置:掃描次數(shù)16次,分辨率4,數(shù)據(jù)間隔1.928 cm?1(掃描速度:0.10~2 cm/s).每個樣本重新裝樣后采集10次光譜數(shù)據(jù),模擬不同采集人員在紅外光譜采集過程中產(chǎn)生的人工誤差.
Min-max標(biāo)準(zhǔn)化處理,也稱離差標(biāo)準(zhǔn)化,是對原始數(shù)據(jù)進(jìn)行線性變換,使處理后的數(shù)據(jù)映射在0~1之間,公式為
其中:Xmax為樣本數(shù)據(jù)的最大值,Xmin為樣本數(shù)據(jù)的最小值,Yi為映射在[0,1]區(qū)間上的投影.
KNN算法的核心思想:已知所有樣本集的類別,那么某個測試樣本的類別,是根據(jù)該樣本在特征空間中距離最近的K個相鄰樣本的占多數(shù)的類別來判斷種類歸屬.可見K的選取和距離計(jì)算是這一算法的關(guān)鍵,本文中經(jīng)過測試確定將參數(shù)n_neighbors設(shè)置為5.
RF算法利用多個決策樹對數(shù)據(jù)進(jìn)行分類,隨機(jī)是核心,一是隨機(jī)在原始訓(xùn)練數(shù)據(jù)中有放回地選取等量的數(shù)據(jù)作為訓(xùn)練樣本,二是在建立決策樹時,隨機(jī)地選取一部分特征建立決策樹.這兩種隨機(jī)使得各個決策樹之間的相關(guān)性小,進(jìn)一步提高模型的準(zhǔn)確性.每棵決策樹之間可以并行化處理,效率相對較高.本文訓(xùn)練集中有60個樣本,每個樣本的特征數(shù)為1 868,需要訓(xùn)練1個包含117棵樹的隨機(jī)森林,訓(xùn)練過程:
(1) 從原始的樣本集n里,利用bootstrap方法提取k個訓(xùn)練集,各個訓(xùn)練集的樣本個數(shù)為n;
(2) 分別學(xué)習(xí)k個訓(xùn)練集,建立k個決策樹模型.為改善決策樹間的差異,對抽取得到的訓(xùn)練樣本集的特征進(jìn)行隨機(jī)的抽取.用網(wǎng)格搜索法優(yōu)化參數(shù)n_estimators、max_depth,最終確定n_estimators=117,max_depth=7;
(3) 將k個決策樹的結(jié)果進(jìn)行組合,形成最終的結(jié)果.
將前面1.3節(jié)中處理后的樣本訓(xùn)練集光譜全波段數(shù)據(jù)分別導(dǎo)入KNN和RF基礎(chǔ)分類模型,輸出均設(shè)置為三種添加劑可能的8種組合方式的種類標(biāo)簽.
PCA的思想是將n維特征映射到k維空間上,k (1) 輸入數(shù)據(jù) 集X={X1,X2,X3,…,Xn},需要降 至k維; (2) 對所有樣本進(jìn)行中心化處理; (3) 計(jì)算樣本的協(xié)方差矩陣XXT,并對協(xié)方差矩陣XXT做特征值分解,計(jì)算其貢獻(xiàn)率,取累積貢獻(xiàn)率大于1的k個特征值對應(yīng)的特征向量W1,W2,W3,…,Wk; (4) 輸出提取的特征值所對應(yīng)的投影矩陣. 中紅外光譜區(qū)域(基本振動區(qū)4 000~400 cm?1)包括了絕大多數(shù)有機(jī)和無機(jī)化合物的化學(xué)鍵振動基頻區(qū),是化合物鑒定的重要區(qū)域.通過光譜鑒定或識別某種物質(zhì),重點(diǎn)在于搜索那些與該物質(zhì)相關(guān)的特征波段區(qū)域.如果可以,盡早排除非相關(guān)部分的無效波段,并解決光譜數(shù)據(jù)中通常存在的部分波段相關(guān)性過強(qiáng)的干擾問題,有必要對光譜數(shù)據(jù)進(jìn)行波段優(yōu)化篩選,剔除高相關(guān)性干擾波段,可以極大提高識別準(zhǔn)確率和工作效率.本文通過分析GA與BPSO兩種仿生優(yōu)化算法各自對有效波段區(qū)域篩選的優(yōu)勢,提出并設(shè)計(jì)了GA-BPSO混合優(yōu)化特征波段篩選方法及實(shí)施方案. GA是一類借鑒生物界的進(jìn)化規(guī)律演化而來的隨機(jī)化搜索方法,原理是隨機(jī)產(chǎn)生一定數(shù)量的初始個體構(gòu)成原始種群,通過選擇、交叉和變異形成新種群,利用適應(yīng)度函數(shù)對個體評估,將適應(yīng)度高的個體遺傳到下一代,直到滿足終止條件,輸出優(yōu)化解.GA的運(yùn)行參數(shù)范圍設(shè)置如表1所示. 表1 GA參數(shù)范圍Table 1 Range of GA parameters 經(jīng)過GA優(yōu)化出的最佳個體染色體為n位0-1編碼組合,若基因編碼為1,建模時包括此波段;若為0,則不包括此波段.原始光譜進(jìn)行離差標(biāo)準(zhǔn)化處理后,將整條光譜 (1 868個數(shù)據(jù)點(diǎn)) 分為25個子區(qū)間,前 7個子區(qū)間分別有74個數(shù)據(jù)點(diǎn),后18個子區(qū)間有75個數(shù)據(jù)點(diǎn),將25個光譜子區(qū)間進(jìn)行0-1二進(jìn)制基因編碼,每個波段為1個基因.經(jīng)過測試確定GA的參數(shù):種群大小25,最大繁殖代數(shù)50,交叉概率為 0.6,變異概率為 0.01.將染色體所代表的訓(xùn)練集光譜波段數(shù)據(jù)分別輸入KNN和RF種類識別基礎(chǔ)分類模型進(jìn)行訓(xùn)練,將測試過程中所得到的準(zhǔn)確率作為適應(yīng)度函數(shù)進(jìn)行區(qū)間篩選,得到優(yōu)化波段區(qū)間組合. 特征選擇問題本質(zhì)上是1個合適的0/1串選擇,串的長度是原始數(shù)據(jù)集中的特征個數(shù)N,0是不被選擇,1則被選擇.尋找一個合適的0/1串最簡單也最全面的方法就是暴力枚舉,也就是把所有的取值都計(jì)算1遍,共有2N種可能,這樣是不現(xiàn)實(shí)的.BPSO是在離散粒子群算法基礎(chǔ)上,約定位置向量和速度向量均為0、1值構(gòu)成.BPSO對每個粒子位置進(jìn)行二進(jìn)制編碼,用sigmoid函數(shù)將速度轉(zhuǎn)換到[0,1]區(qū)間,粒子速度代表每個位置為0或1的概率.則BPSO的速度和位置更新公式為 其中vid為第i個粒子在d維解空間的速度;xid為第i個粒子在d維解空間的位置;w為慣性系數(shù);c1、c2是學(xué)習(xí)因子,均為非負(fù)數(shù);r1、r2為分布在[0,1]區(qū)間的隨機(jī)值;Pid為個體最優(yōu)位置;Pg為全局最優(yōu)位置. BPSO在光譜特征變量篩選時的二進(jìn)制編碼方式:每個粒子對應(yīng)1個二進(jìn)制碼,其中數(shù)值1表示被選中,0則表示未被選中.對應(yīng)測試樣品光譜總波數(shù)點(diǎn)1 868個,則粒子的長度由1 868個0和1的字符串組合而成.尋優(yōu)過程中,每個粒子的位置不斷改變,對應(yīng)的頻率子集隨之變化.初始化粒子群,經(jīng)過測試設(shè)置相關(guān)參數(shù)列于表2中. 表2 BPSO參數(shù)設(shè)置Table 2 Parameter settings of BPSO 將粒子所代表的訓(xùn)練集光譜波段數(shù)據(jù)分別輸入KNN和RF種類識別基礎(chǔ)分類模型進(jìn)行訓(xùn)練,以當(dāng)前所得的總體分類準(zhǔn)確率作為評價函數(shù),更新粒子的適應(yīng)度值、個體極值和群體極值,循環(huán)迭代直到達(dá)到最大迭代次數(shù),得到光譜波段篩選結(jié)果. 顯然,BPSO選取了測試樣品的光譜總波數(shù)點(diǎn),設(shè)置粒子的長度達(dá)到1 868個數(shù)位,其中含有大量的冗余.對此,本文提出并設(shè)計(jì)了一種將GA與BPSO混合進(jìn)行特征波段優(yōu)選的方法,先利用GA篩選出有效光譜組合區(qū)間,再利用BPSO對組合區(qū)間進(jìn)行特征波數(shù)點(diǎn)篩選,從而使粒子的長度被盡可能縮短,兩種模型的設(shè)置參數(shù)列于表3中. 表3 GA-BPSO參數(shù)設(shè)置Table 3 Parameter settings of GA-BPSO 將明顯已經(jīng)縮短的粒子所代表的訓(xùn)練集光譜波段數(shù)據(jù)分別輸入GA-KNN和GA-RF種類識別基礎(chǔ)分類模型進(jìn)行訓(xùn)練,以當(dāng)前所得的總體分類準(zhǔn)確率作為評價函數(shù),更新粒子的適應(yīng)度值、個體極值和群體極值,循環(huán)迭代直到達(dá)到最大迭代次數(shù),得到GA-BPSO光譜波段篩選結(jié)果. 以KNN/RF種類識別基礎(chǔ)分類模型為基礎(chǔ),采用GA-BPSO混合優(yōu)化潤滑油中紅外光譜特征波段篩選,構(gòu)建潤滑油添加劑種類識別增強(qiáng)分類模型,其工作流程見圖3. Fig.3 Flow of GA-BPSO hybrid optimized feature bands enhanced classification model圖3 GA-BPSO混合優(yōu)選特征波段增強(qiáng)分類模型流程圖 將原始光譜數(shù)據(jù)先經(jīng)離差標(biāo)準(zhǔn)化處理,結(jié)果如圖4所示. Fig.4 Standardization of raw spectral data圖4 原始光譜數(shù)據(jù)標(biāo)準(zhǔn)化 圖5所示為兩種基礎(chǔ)模型分別對三種添加劑的種類識別準(zhǔn)確率結(jié)果統(tǒng)計(jì)圖,“o”為測試集樣本中添加劑的實(shí)際種類,“*”為模型預(yù)測輸出的預(yù)測種類,若重合則表示預(yù)測正確.表4列出了兩種基礎(chǔ)模型的種類識別準(zhǔn)確率. 表4 KNN/RF基礎(chǔ)模型種類識別準(zhǔn)確率Table 4 The accuracy of type recognition by KNN/RF basic model 圖6所示為兩種基礎(chǔ)模型經(jīng)PCA降維處理后分別對三種添加劑的種類識別結(jié)果的模糊矩陣圖.表5~6為兩種基礎(chǔ)模型經(jīng)PCA降維處理后的種類識別準(zhǔn)確率. 表5 PCA-KNN分類精度Table 5 Classification accuracy of PCA-KNN 3.3.1 單一GA優(yōu)選光譜特征波段區(qū)間 單一GA優(yōu)選光譜特征波段區(qū)間結(jié)果見圖7.由圖7(a)可知,于KNN基礎(chǔ)模型共篩選出6個區(qū)間,分別是541.899 2~682.677 2 cm?1、827.312 3~1 253.503 cm?1、1 542.773~1 830.115 cm?1、2 265.948~2 408.655 cm?1、3 423.028~3 565.735 cm?1、3 712.298~3 855.005 cm?1,優(yōu)化篩選出的波段長度為原波段長度的35.9%.由圖7(b)可知,于RF基礎(chǔ)模型共篩選出7個區(qū)間,分別是541.899 2~682.677 2 cm?1、970.018 7~1 110.797 cm?1、1 398.138~1 685.48 cm?1、1 832.043~1 974.75 cm?1、3 133.758~3 276.465 cm?1、3 423.028~3 565.735 cm?1、3 865.933~3 999.64 cm?1,優(yōu)化篩選出的波段長度為原波段長度的32.0%. 3.3.2 單一BPSO優(yōu)選光譜特征波段區(qū)間 單一BPSO優(yōu)選光譜特征波段區(qū)間結(jié)果見表7.對KNN基礎(chǔ)模型,原始的1 868個光譜數(shù)據(jù)點(diǎn)被篩減到918個,優(yōu)化篩選出的波段長度為原波段長度的49.1%.對RF基礎(chǔ)模型,原始的光譜數(shù)據(jù)點(diǎn)被篩減到884個,優(yōu)化篩選出的波段長度為原波段長度的47.3%. 表7 單一BPSO特征波段區(qū)間篩選結(jié)果Table 7 Screening results of single BPSO feature band interval Fig.5 The results of type identification by (a) KNN/ (b) RF basic model圖5 (a) KNN和 (b) RF基礎(chǔ)模型種類識別結(jié)果 Fig.6 The obfuscation matrix after PCA dimension reduction processing by (a) KNN and (b) RF圖6 (a) KNN和 (b) RF經(jīng)PCA降維后的模糊矩陣 表6 PCA-RF分類精度Table 6 Classification accuracy of PCA-RF Fig.7 Screening results of single GA feature band interval by (a) KNN and (b) RF圖7 (a) KNN和 (b) RF單一GA特征波段區(qū)間篩選結(jié)果 3.3.3 GA-BPSO混合優(yōu)選光譜特征波段區(qū)間 GA-BPSO混合優(yōu)化光譜特征波段區(qū)間篩選結(jié)果列于表8中.KNN基礎(chǔ)模型的光譜數(shù)據(jù)點(diǎn)已經(jīng)從原始的1 868個光譜數(shù)據(jù)點(diǎn)被篩減到307個,優(yōu)化篩選出的波段長度為原波段長度的16.4%.RF基礎(chǔ)模型的被篩減到295個,為原波段長度的15.8%. 表8 GA-BPSO混合特征波段區(qū)間篩選結(jié)果Table 8 Screening results of GA-BPSO mixed feature band interval 3.4.1 單一GA優(yōu)選的KNN/RF增強(qiáng)分類模型測試結(jié)果 以單一GA優(yōu)選的區(qū)間組合波段作為輸入,兩類增強(qiáng)模型輸出的種類識別結(jié)果如圖8所示,種類識別準(zhǔn)確率列于表9中. 表9 單一GA優(yōu)選特征波段區(qū)間的兩類增強(qiáng)模型種類識別準(zhǔn)確率Table 9 The recognition accuracy of two kinds of enhanced models by the single GA optimizes feature band interval Fig.8 Type recognition results of two kinds of enhanced models by the single GA optimizes feature band interval圖8 單一GA優(yōu)選特征波段區(qū)間的兩類增強(qiáng)模型種類識別結(jié)果 3.4.2 單一BPSO優(yōu)選的KNN/RF增強(qiáng)分類模型測試結(jié)果 以單一BPSO優(yōu)選的區(qū)間組合波段作為輸入,兩類增強(qiáng)模型輸出的種類識別結(jié)果如圖9所示,種類識別準(zhǔn)確率列于表10中. 表10 單一BPSO優(yōu)選特征波段區(qū)間的兩類增強(qiáng)模型種類識別準(zhǔn)確率Table 10 The recognition accuracy of two kinds of enhanced models by the single BPSO optimizes feature band interval 3.4.3 GA-BPSO混合優(yōu)選的KNN/RF增強(qiáng)分類模型測試結(jié)果 將GA-BPSO混合優(yōu)選的區(qū)間組合波段作為輸入,兩類增強(qiáng)模型輸出的種類識別結(jié)果如圖10所示,種類識別準(zhǔn)確率列于表11中. 表11 GA-BPSO混合優(yōu)選特征波段區(qū)間的兩類增強(qiáng)模型種類識別準(zhǔn)確率Table 11 The recognition accuracy of two kinds of enhanced models by the GA-BPSO hybrid optimizes feature band interval 綜合上述各項(xiàng)測試結(jié)果,將光譜全部波段、GA優(yōu)選波段、BPSO優(yōu)選波段和GA-BPSO混合優(yōu)選波段的KNN/RF基礎(chǔ)模型及增強(qiáng)模型,對測試集的20個未知樣品進(jìn)行種類識別,識別準(zhǔn)確率對比如圖11所示. Fig.9 Type recognition results of two kinds of enhanced models by the single BPSO optimizes feature band interval圖9 單一BPSO優(yōu)選特征波段區(qū)間的兩類增強(qiáng)模型種類識別結(jié)果 由圖11中可以看到:1)采用光譜波段優(yōu)選的增強(qiáng)分類模型,識別準(zhǔn)確率均優(yōu)于基礎(chǔ)分類模型.其中GABPSO混合方法進(jìn)行潤滑油添加劑種類識別準(zhǔn)確率最高,且因?qū)嶋H參與模型識別的光譜波長變量數(shù)最少,可使工作效率顯著提高;2)在使用同等優(yōu)選方法的情況下,RF模型的種類識別準(zhǔn)確率要高于KNN模型.其中,GA-BPSO-RF獲得了最優(yōu)的測試結(jié)果. 為此,對GA-BPSO-RF展開進(jìn)一步分析發(fā)現(xiàn),根據(jù)其他理化方法[32]已經(jīng)測得的結(jié)果可知T321在657 cm?1處的C-S-C振動和在1 178 cm-1處的C-S(芳環(huán))振動;T534在1 500 cm?1處的N-H伸縮振動;T307在930~1 110 cm?1處的P-N振動和2 150 cm?1處的P-S-N振動,這些振動點(diǎn)位與本文3.3.1中所列的GA-RF優(yōu)選波段對比,獲得了很好的對應(yīng)關(guān)系,再經(jīng)過BPSO進(jìn)一步優(yōu)選特征波長變量,則使最終的有效波段區(qū)間更加接近并圍繞在真實(shí)的振動點(diǎn)位附近.對比GA-BPSO-RF增強(qiáng)模型與RF基礎(chǔ)模型,添加劑種類識別的準(zhǔn)確率如圖12所示. Fig.10 Type recognition results of two kinds of enhanced models by the GA-BPSO hybrid optimizes feature band interval圖10 GA-BPSO混合優(yōu)選特征波段區(qū)間的兩類增強(qiáng)模型種類識別結(jié)果 Fig.11 Accuracy comparison between KNN/RF base model and enhanced model圖11 KNN/RF基礎(chǔ)模型及增強(qiáng)模型準(zhǔn)確率對比 Fig.12 The results of additive species identification by GABPSO-RF and RF圖12 GA-BPSO-RF和RF對添加劑進(jìn)行種類識別結(jié)果 由圖12明顯可以看到,經(jīng)GA-BPSO混合優(yōu)選波段后,針對T534、T534+T307的種類識別準(zhǔn)確率分別由60%和50%提升至80%和100%,整體分類準(zhǔn)確率由原來的85%提升至97.5%. a.由RF所建的基礎(chǔ)分類模型可以對設(shè)備潤滑油微量添加劑進(jìn)行有效的多種類同步識別,相比于傳統(tǒng)理化分析方法簡單、快速且易于實(shí)現(xiàn). b.GA-BPSO優(yōu)化篩選特征波段,能夠有效削減KNN/RF基礎(chǔ)分類模型的有效波段長度并提高識別準(zhǔn)確率,且明顯優(yōu)于GA和BPSO單獨(dú)使用時的篩選結(jié)果,在極大地減輕運(yùn)行負(fù)擔(dān)的同時,有效提高了模型多種類同步識別的準(zhǔn)確率和穩(wěn)定性. c.GA-BPSO混合方法對特征波段的篩選效果最優(yōu),經(jīng)過其優(yōu)選后構(gòu)造的KNN/RF增強(qiáng)分類模型均比對應(yīng)的基礎(chǔ)分類模型各項(xiàng)性能上有顯著的提高,其中GA-BPSO-RF的測試效果超過GA-BPSO-KNN,可以作為一種高效的潤滑油添加劑微量多種類同步識別的重要手段.2.3 GA-BPSO混合優(yōu)化特征波段篩選
2.4 KNN/RF種類識別增強(qiáng)分類模型構(gòu)建
3 兩類模型測試結(jié)果及分析
3.1 原始光譜數(shù)據(jù)離差標(biāo)準(zhǔn)化處理
3.2 KNN/RF種類識別基礎(chǔ)分類模型測試結(jié)果
3.3 原始光譜特征波段區(qū)間篩選結(jié)果
3.4 KNN/RF種類識別增強(qiáng)分類模型測試結(jié)果
3.5 測試結(jié)果綜合分析
4 結(jié)論