王海燕
(江蘇省大豐中等專業(yè)學校,江蘇 鹽城 224100)
機械零件、構(gòu)件、部件和組件的表面滲碳處理是關(guān)系機械裝置質(zhì)量的重要問題,而加熱爐的穩(wěn)定可靠運行是其中的關(guān)鍵[1]。為了提升加熱爐的連續(xù)工作效率,采用科學可靠的故障診斷方法對加熱爐進行故障診斷成為目前的熱點研究。因為加熱爐的設計和使用過程涉及熱轉(zhuǎn)換、計量和通信等多項功能,所以可能出現(xiàn)的故障類型非常多[2]。如果不能快速準確地識別加熱爐的故障類型,就無法及時進行維修,不僅會給加工企業(yè)造成經(jīng)濟損失,還會導致機械加工生產(chǎn)企業(yè)和銷售企業(yè)之間的矛盾。因此,快速準確地對加熱爐進行故障診斷,對機械加工領(lǐng)域具有十分重要的意義。國內(nèi)、外已經(jīng)對包括加熱爐在內(nèi)的各種機械加工輔助設備的故障診斷進行了廣泛而深入的研究,機器學習的理念和常見方法得到了大量應用。通過將加熱爐常見的故障類型進行統(tǒng)計歸類,進而建立故障數(shù)據(jù)庫,再將未知故障同數(shù)據(jù)庫中的故障類型進行對比,可以得出加熱爐的故障診斷結(jié)果[3]。該文在前人經(jīng)驗的基礎(chǔ)上,綜合考慮故障數(shù)據(jù)特征和不平衡問題,建立基于投票機制的多分類器融合模型,以期更準確、高效地對加熱爐進行故障診斷。
在表面滲碳等熱處理過程中,加熱爐可以通過多類傳感器將狀態(tài)數(shù)據(jù)回傳給控制系統(tǒng)。當加熱爐出現(xiàn)故障時,控制系統(tǒng)端也會表現(xiàn)為數(shù)據(jù)錯誤或異常。從故障數(shù)據(jù)的角度看,加熱爐的常見故障類型如下:爐溫下降或爐溫不正常故障、推拉鏈在送進或拉出途中停止動作故障、升降機及門不上升故障、加熱爐內(nèi)攪拌風扇異常故障、下道工序不動作故障、推拉車橫向移動停車不準故障、推拉車橫向移動停車不準故障以及啟動不了或啟動困難故障。
根據(jù)行業(yè)內(nèi)的統(tǒng)計數(shù)據(jù),這7類故障發(fā)生的占比見表1。
表1 加熱爐7類故障的發(fā)生比例
從表1中的數(shù)據(jù)可以看出,在加熱爐發(fā)生故障的原因中,升降機及門不上升故障占比最高,達33.6%;推拉車橫向移動停車不準故障、啟動不了或啟動困難故障分別排在第二、三位,占比分別為17%、16.4%;下道工序不動作故障占比為13.2%,這也表明了加熱爐故障原因的復雜性。
為了對加熱爐故障進行準確診斷,需要根據(jù)加熱爐故障數(shù)據(jù)對診斷模型進行訓練。但是7類故障發(fā)生的概率不同,導致部分故障類型的數(shù)據(jù)量過少,從而產(chǎn)生和高發(fā)故障類型間的數(shù)據(jù)不平衡問題。為此,該文采用插值算法進行處理,以增加不同類型故障數(shù)據(jù)間的平衡程度。基于插值的數(shù)據(jù)平衡算法原理如圖1所示?;诓逯档臄?shù)據(jù)平衡算法的實現(xiàn)過程如下。
圖1 基于插值的數(shù)據(jù)平衡算法原理
首先,設定少數(shù)數(shù)據(jù)所構(gòu)成的集合為X,該集合中一共有n個樣本。
其次,從少數(shù)數(shù)據(jù)集合中選取樣本xi(i∈[1,n])作為合成新樣本的根樣本。
再次,根據(jù)向上采樣倍率n,選取一個奇數(shù)k(例如取k=3)。將k個鄰域樣本xij作為合成新樣本的輔助樣本,其中xij∈X,j=1,2,...,k。
最后,在根樣本xi和輔助樣本xij間通過插值生成新樣本,插值處理的執(zhí)行公式如公式(1)所示。
式中:xnew代表新樣本;γ代表在0~1取值的隨機數(shù)。
加熱爐故障的智能診斷一般要從機器學習的角度加以解決。為了提升故障診斷的準確率,采用集成學習是比較好的選擇。集成學習的基本原理是將多個分類器進行融合,得到比單一分類器更好的集成模型。
該文設計的集成學習框架是基于投票機制的,采用多個基分類器對訓練集進行訓練,并將各基分類器測試集結(jié)果根據(jù)投票機制進行融合,以確定最終的輸出結(jié)果?;谕镀睓C制的集成學習框架如圖2所示。
圖2 基于投票機制的集成學習框架
該文采用的投票機制分為2類:一類是硬投票機制,另一類是軟投票機制。以二分類問題為例,預測目標為y∈{-1,1},由A、B、C共3個模型對樣本(xi,yi)進行預測,硬投票機制即對模型預測標簽進行投票。設A、B、C模型的預測結(jié)果為1、1、1,因此最后預測結(jié)果為1。軟投票機制是對各基模型預測各類別的概率進行加權(quán)投票,類別概率最高者即為最終結(jié)果,如公式(2)所示。
式中:Pk為基分類器預測故障為類別k的概率,k=1,2,...,m,m為故障總類別個數(shù);wi為各基分類器權(quán)重,i=1,2,...,n,n為基分類器總個數(shù);Ek為加權(quán)投票后預測類別為k的概率;yi為最終結(jié)果。
在加熱爐故障診斷的過程中,該文采用軟投票機制。當然,集成學習算法效果的優(yōu)劣還取決于進一步的基分類器的組合配置和權(quán)重配置。
用于加熱爐故障診斷的集成模型是多個基分類器組合在一起的結(jié)果。構(gòu)建集成模型的標準是故障類型的識別準確率高且為基分類器的多樣化組合,即盡可能用到多個基分類器。
該文以一個二分類問題為例,分析多個基分類器組合在一起的集成效果差異。預測目標為y∈{-1,1},函數(shù)的映射關(guān)系為f,分類器的誤差為ε,則所有分類器誤差關(guān)系如公式(3)所示。
式中:hi(x)為第i個分類器,i=1,2,...,T。
將T個分類器根據(jù)投票機制進行處理,可得誤差關(guān)系,如公式(4)所示。
式中:T為分類器總個數(shù)。
由公式(4)可知,隨著T增大,集成學習的誤差不斷降低。不同基分類器集成后的對比效果見表2。
表2 不同基分類器集成后的對比效果
從表2中的對比結(jié)果可知,基分類器1、基分類器2和基分類器3各自的預測率為66.7%,并且在不同的測試案例上有不同的性能,因此集成模型A的效果達100%?;诸惼?、基分類器5、基分類器6的預測率雖然也達66.7%,但是這三者的性能相同,不滿足多樣化條件,導致集成模型B不起作用。基分類器7、基分類器8、基分類器9的性能較差,集成模型C直接舍棄。
為了驗證該文提出的加熱爐故障診斷方法的有效性,以加熱爐故障數(shù)據(jù)集合為處理對象,選擇其中的10000個數(shù)據(jù)作為樣本數(shù)據(jù),以其中66%的數(shù)據(jù)為訓練數(shù)據(jù)集合,34%的數(shù)據(jù)為測試數(shù)據(jù)集合。
目前,在加熱爐的故障診斷領(lǐng)域,采用很多成熟的方法可以得到基分類器,需要通過試驗選擇基分類器。該文將8種常見的故障診斷方法作為基分類器的候選,分別是NB算法、SVM算法、LR算法、DT算法、BP算法、RF算法、KNN算法以及GBDT算法。針對該文給出的加熱爐7類常見故障的分類標準,上述8種算法對每種故障的診斷準確率見表3。
表3 加熱爐常見故障的8類算法診斷準確率(%)
為了直觀地觀察8類方法對加熱爐7類故障的診斷結(jié)果,將表3中的數(shù)據(jù)繪制成曲線,如圖3所示。
圖3 加熱爐常見故障的8類算法診斷準確率曲線
從表3和圖3可以看出,GBDT方法對加熱爐7類故障的平均診斷準確率最好,為68.46%。其次是KNN方法,對加熱爐7類故障的平均診斷準確率為67.95%。因此選擇這2種方法作為3個基分類器的1選和2選。再將DT方法、BP方法、RF方法分別作為基分類器的3選,從而形成了3種加熱爐故障診斷集成模型,分別為加熱爐故障診斷集成模型A,GBDT+KNN+DT;加熱爐故障診斷集成模型B,GBDT+KNN+BP;加熱爐故障診斷集成模型C,GBDT+KNN+RF。
該文針對加熱爐故障診斷問題進行了研究。首先,對加熱爐常見的故障進行分類,包括爐溫下降或爐溫不正常故障、推拉鏈在送進或拉出途中停止動作故障、升降機及門不上升故障、加熱爐內(nèi)攪拌風扇異常故障、下道工序不動作故障、推拉車橫向移動停車不準故障、推拉車橫向移動停車不準故障以及啟動不了或啟動困難故障。其次,采用基于插值的方法消除各類故障數(shù)據(jù)的不平衡性?;谕镀睓C制建立多分類器融合的集成模型,將各分類器的權(quán)重進行優(yōu)化配置,進行加熱爐的故障診斷。最后,在試驗過程中,根據(jù)8種分類器算法的診斷效果構(gòu)建了3種集成模型,分別為模型A,GBDT+KNN+DT;模型B,GBDT+KNN+BP;模型C,GBDT+KNN+RF。