王占濤,羅 奕,盧新佳,張筵凱
(桂林電子科技大學(xué) 機電工程學(xué)院,廣西 桂林 541004)
現(xiàn)代智能技術(shù)已經(jīng)滲透到多個領(lǐng)域,形成不同的智能生產(chǎn)方法,設(shè)備的操作更加人性化,使現(xiàn)代工業(yè)的生產(chǎn)能力得到極大提高,為傳統(tǒng)行業(yè)實現(xiàn)智能化生產(chǎn)、追上當(dāng)前智能化工業(yè)發(fā)展的潮流提供了有利條件。傳統(tǒng)的故障檢測主要是通過生產(chǎn)現(xiàn)場的巡視人員根據(jù)現(xiàn)場的報警信息進行調(diào)控,故障發(fā)生后,現(xiàn)場巡視人員首先根據(jù)報警信息確定報警的生產(chǎn)線,檢查各類生產(chǎn)設(shè)備及監(jiān)測裝置,確定報警原因及故障點,編寫故障事故處理記錄,為后續(xù)的故障處理提供決策依據(jù)[1-2]。這對現(xiàn)場巡視人員的依賴較大,大量工作依靠人工操作來完成,如離線分析、組分檢測、手動控制等,生產(chǎn)效率低下,生產(chǎn)成本較高。由于人工操作的時效性不足,導(dǎo)致資源利用率不高,對生產(chǎn)水平的高低有較大影響??萍嫉目焖侔l(fā)展逐漸衍生出的人工智能技術(shù),極大改變了工業(yè)生產(chǎn)環(huán)境,且在一定范圍內(nèi)得到推廣和應(yīng)用。不同行業(yè)的關(guān)鍵技術(shù)被遷移、引用到相關(guān)或不同領(lǐng)域內(nèi),使得工業(yè)生產(chǎn)過程的關(guān)鍵技術(shù)——故障檢測也得到了極大的發(fā)展[3]。文獻[4]提出了一種以智能控制單元控制的執(zhí)行機構(gòu),結(jié)合計量、監(jiān)測單元,與經(jīng)典PID控制相比較,該系統(tǒng)具有更小的超調(diào)量,響應(yīng)速率更快等優(yōu)點。文獻[5]提出一種結(jié)合極限學(xué)習(xí)機與D-S證據(jù)理論的故障檢測模型,通過粒子群優(yōu)化算法改善學(xué)習(xí)機模型,形成新的算法,對發(fā)動機的故障數(shù)據(jù)進行學(xué)習(xí)訓(xùn)練,此方法能夠識別發(fā)動機的故障類型,診斷效果優(yōu)良。稀土萃取生產(chǎn)線是一種延伸距離長,故障狀態(tài)的檢測對象數(shù)量多、分布廣的生產(chǎn)系統(tǒng)。基于智能算法的故障檢測方法在復(fù)雜裝備等故障檢測中得到卓有成效的應(yīng)用,但由于稀土生產(chǎn)自動化水平不高,生產(chǎn)效率較低,該方法在稀土萃取故障檢測中的應(yīng)用還不多見,需要根據(jù)稀土萃取工藝設(shè)備及流程自身的特點建立相應(yīng)的智能故障檢測方法。
由于AI技術(shù)的廣泛應(yīng)用和傳感器技術(shù)的迅速發(fā)展,當(dāng)工業(yè)生產(chǎn)系統(tǒng)失穩(wěn)時,大量數(shù)據(jù)的涌現(xiàn),反而給故障檢測的精度和速度帶來更大的挑戰(zhàn)[6-8]。鑒于此,基于貝葉斯算法理論,提出了一種基于改進貝葉斯算法的故障檢測方法。
貝葉斯算法理論總體基于數(shù)理統(tǒng)計學(xué),根據(jù)具體問題搭建合適的模型,通過對收集到的數(shù)據(jù)分析研究,確定在實際生產(chǎn)過程中可能出現(xiàn)的故障類型,以便對相應(yīng)的故障問題做出正確的檢測和后續(xù)處理。傳統(tǒng)的貝葉斯故障檢測算法在大數(shù)據(jù)時代下受到了極大的限制,對于更加復(fù)雜的機械系統(tǒng)誤判率較高[9]。故障檢測方案如圖1所示。
圖1 故障檢測方案
貝葉斯公式[10]是在全概率的前提下得到的,
(1)
其中i=1,2,…,n。
貝葉斯公式最大的優(yōu)點是可以將所有相關(guān)因素動態(tài)地聯(lián)系起來,提高了故障系統(tǒng)判斷的準確性。
定義1對某故障類型定義為TF={TF,i|i=1,2,… }。
定義2對某故障類型所對應(yīng)的特征向量定義為X=(X1,X2,…,Xn),其中X1,X2,…,Xn為相應(yīng)的特征分量。
定義3對于出現(xiàn)的特征向量X,發(fā)生相應(yīng)故障TF,i的概率為P(TF,i|X),根據(jù)貝葉斯公式可知:
(2)
其中:P(X|TF,i)為故障TF,i類型發(fā)生時對應(yīng)的特征向量為X的概率;P(TF,i)為故障類型TF,i發(fā)生時的概率;P(X)為故障發(fā)生時出現(xiàn)對應(yīng)的特征向量X的概率。
假設(shè)特征分量之間相互獨立,那么根據(jù)統(tǒng)計學(xué)中相互獨立事件定義,可得
(3)
(4)
其中:Xj為X的第j個特征分量;P(Xj|TF,i)為表示故障類型TF,i時特征分量Xj發(fā)生的概率。
當(dāng)某故障發(fā)生時,系統(tǒng)會顯示對應(yīng)的異常,檢測設(shè)備會檢測到不同的數(shù)據(jù),表現(xiàn)不同的狀態(tài),相對應(yīng)的特征向量會不相同。實際特征向量的選取主要根據(jù)故障類型來選擇,并且特征向量的選取應(yīng)盡可能地包含所有的故障類型,相互之間要滿足相互獨立的假設(shè)。
定義4θ(TF,i)=p(TF,i)/p(TF,i)為TF,i先驗概率。先驗概率可用下式計算:
(5)
其中D為訓(xùn)練數(shù)據(jù)集合。
定義5相對于特征分量和故障類型,其似然比定義為
(6)
定義6后驗概率定義為
(7)
對于貝葉斯算法,最主要的問題就是分布函數(shù)的確定及先驗概率的選取[11-13]。在實際生產(chǎn)過程中,將故障數(shù)據(jù)分布假設(shè)為正態(tài)分布,選取樣本的頻數(shù)作為先驗概率。ng為用于建立判別函數(shù)的已知分類數(shù)據(jù)中來自第g總體樣本數(shù)。具體的二次判別分類問題可描述為:存在數(shù)據(jù)X,其中有m個樣本x1,x2,…,xm,每個樣本p個屬性,類別數(shù)為g,函數(shù)fg(xm)可以將待測樣本x歸類為g個類別之一,而它所依據(jù)的分類規(guī)則由較高的概率決定。數(shù)學(xué)模型定義為
(8)
其中,Ag、ug分別為類別g的協(xié)方差矩陣和均值向量,其樣本數(shù)表示為ng,由于數(shù)據(jù)的計算十分復(fù)雜,可認為協(xié)方差相等,即
A1=A2=…=Ag=A。
(9)
在計算后驗概率時,需要建立一個判別式y(tǒng)(g|x)。定義后驗概率的計算式為
(10)
其中y(g|x)定義為
y(g|x)=ln(qgfg(x))-Δx,
(11)
Δx是與g無關(guān)的部分。由式(11)可知,存在h,使得y為最大,那么P(g|x)必然也最大,即若y(g|x)=maxy(g|x),則把樣本x歸入第h類中,對于二分類問題,類別總數(shù)g為2。
正則化方法的提出是為了解決貝葉斯的二次判別方法的協(xié)方差矩陣的奇異性問題。通過交叉驗證將參數(shù)λ、γ訓(xùn)練為使分類誤差最小化的參數(shù),其定義為
(12)
Si=ni∑i,
(13)
(14)
其中:ni為第i類故障樣本的訓(xùn)練個數(shù),n為故障數(shù)據(jù)的樣本總數(shù);k為故障類別總數(shù)。
對于分類問題,需將以下目標函數(shù)最小化:
w*=argmin∑L(yi,f(xi,w))+λΩ(w)。
(15)
已知多元正態(tài)分布總體的貝葉斯判別法,利用K-L散度理論,將其重新定義為
DKL(p1|p2)=E(logp1-logp2)=
(16)
目前,稀土加工生產(chǎn)行業(yè)仍然屬于勞動密集型產(chǎn)業(yè),生產(chǎn)效率不高,自動化水平較低,對人力依賴性較大[14-16]。萃取生產(chǎn)工序主要將各種不同稀土元素與有機溶劑充分溶解,萃取裝置主要包括電動機、攪拌軸、皮帶及攪拌罐體。根據(jù)在某稀土萃取生產(chǎn)車間故障監(jiān)測設(shè)備得到的數(shù)據(jù)進行分析,故障主要集中于皮帶和電動機這兩部分。電力作為驅(qū)動裝置,是保證系統(tǒng)平穩(wěn)工作的根本因素,電壓是否正常決定了稀土萃取生產(chǎn)設(shè)備是否能夠正常運行。當(dāng)供電電壓達不到額定電壓時,會導(dǎo)致電動機轉(zhuǎn)速發(fā)生變化,從而影響皮帶的傳動效率及轉(zhuǎn)速,進而導(dǎo)致攪拌設(shè)備發(fā)生故障,影響萃取效果[17-18]。而皮帶作為電動機與加工設(shè)備之間橋梁,是稀土萃取生產(chǎn)設(shè)備能夠順利工作的決定因素。采用的三相異步電動機的額定功率為3 kW,額定電壓為380 V,額定電流為6 A,額定轉(zhuǎn)速為200 r/min。根據(jù)監(jiān)測設(shè)備采集到的電壓數(shù)據(jù),結(jié)合電氣原理,將電信號轉(zhuǎn)換為轉(zhuǎn)速信號。對轉(zhuǎn)速及電壓的數(shù)據(jù)進行信息融合,將融合數(shù)據(jù)隨時間的變化建模為預(yù)測變量的函數(shù),分析基于貝葉斯理論與加入K-L散度后的貝葉斯算法間的區(qū)別,得到的擬合曲線如圖2所示。
圖2 擬合曲線
為了更直觀地顯示基于貝葉斯理論的故障分類,將從生產(chǎn)線生產(chǎn)運作系統(tǒng)采集到的故障數(shù)據(jù)進行可視化。數(shù)據(jù)可視化圖如圖3所示。
圖3 數(shù)據(jù)可視化圖
在進行仿真實驗時,可能有一些表示各種故障數(shù)據(jù)的隨機輸入。由于相同的隨機條件可對2個故障來源都產(chǎn)生影響,若忽略仿真數(shù)據(jù)的相關(guān)性,可能會導(dǎo)致錯誤的結(jié)論。為了盡可能地模擬稀土生產(chǎn)的情況,需要考慮兩兩輸入之間的相關(guān)性對仿真結(jié)果的影響。因此,在進行算法仿真前,需要有條件地進行數(shù)據(jù)采集,本研究采取的策略是嘗試不同的可能性,以確定模型的相關(guān)性。
圖4表示故障數(shù)據(jù)與故障類型之間的線性關(guān)系強度(數(shù)據(jù)在散點圖中沿著最小二乘直線排列的松緊度)。對于不同攪拌裝置,選用不同長度的皮帶相連接,生產(chǎn)過程中所選用的電壓等級也不同。從圖4(a)可看出,電動機與皮帶數(shù)據(jù)分布相對分散,關(guān)聯(lián)性不強,說明數(shù)據(jù)可能造成誤判;從圖4(b)可看出,數(shù)據(jù)集中程度較大,說明電動機與皮帶數(shù)據(jù)關(guān)聯(lián)性較好,在數(shù)學(xué)原理上,也體現(xiàn)了電動機和皮帶相關(guān)數(shù)據(jù)一一對應(yīng)的關(guān)系,能夠形成數(shù)據(jù)空間,為下一步故障判別提供依據(jù),這種相關(guān)性由基礎(chǔ)二元正態(tài)分布的參數(shù)決定。將具有相關(guān)性的樣本數(shù)據(jù)進一步進行二次判別。
圖4 故障因素非相關(guān)性、相關(guān)性圖
皮帶與電動機相關(guān)參數(shù)的變化決定了采樣數(shù)據(jù)的變化,因此也從理論上證明了故障的產(chǎn)生是由皮帶和電動機相關(guān)參數(shù)的變化造成的。為方便表示,在實驗中,將故障分為皮帶故障、電動機故障。
在參數(shù)學(xué)習(xí)和約束條件之間進行迭代,逐漸將公平約束添加到優(yōu)化中,利用top-k模式判別器進行約束。在每次迭代中,學(xué)習(xí)受公平性約束的最大似然參數(shù),并使用更新的參數(shù)在下一次迭代中將k個模式添加到約束集合。重復(fù)該過程,直到搜索算法不再找到判別模式為止。
通過檢查模式分類器在搜索期間訪問的所有可能模式的歧視分數(shù)來表示誤判概率,分數(shù)越小,歧視程度越低,誤判率越低。表1為數(shù)據(jù)統(tǒng)計分數(shù),使用了判別和發(fā)散兩級啟發(fā)式及0.01、0.05和0.1三個閾值。
表1 數(shù)據(jù)統(tǒng)計分數(shù)
通過對數(shù)據(jù)不斷的處理,剔除相關(guān)性較小的數(shù)據(jù),獲得更加準確的貝葉斯判斷模型。表2為該模型δ=0.1時剩余的識別模式數(shù)量,其中λ決定了數(shù)據(jù)修復(fù)步驟中公平性和準確性之間的權(quán)衡。從表2可看出,只要在客觀上保持一定程度的準確性,該方法就能有效地進行故障檢測。
表2 剩余數(shù)據(jù)統(tǒng)計判斷
通過采集的故障數(shù)據(jù),根據(jù)經(jīng)驗,首先定義錯誤類別,f1表示皮帶出現(xiàn)故障的分數(shù),f2表示電動機出現(xiàn)故障的分數(shù),分數(shù)越相近,表明故障檢測結(jié)果越準確。采集10組故障信號,利用改進的貝葉斯故障檢測模型對其進行故障分類,結(jié)果如表3所示。
表3 貝葉斯二次判別檢測結(jié)果
從表3可看出,除了第3組和第6組數(shù)據(jù),其它組數(shù)據(jù)都能正確判定。第3組和第6組數(shù)據(jù)的后驗概率分別為0.100 356、0.098 876,后驗概率較小,所以造成誤判。通過對相應(yīng)的原始數(shù)據(jù)及故障分數(shù)進行分析,可能是屬于原分組時的錯分樣品,即單純使用數(shù)據(jù)將其分類成2種錯誤類別,很容易發(fā)生誤判的情況,因此,要盡量避免使用單純的數(shù)據(jù)。
對二次判別分析中的貝葉斯估計進行了理論和算法上的改進。將正則化和貝葉斯理論相結(jié)合,改變函數(shù)散度,提出了一種改進貝葉斯算法的故障檢測方法。實驗仿真分析結(jié)果表明,此算法比傳統(tǒng)的貝葉斯算法優(yōu)良,且誤分類較少。