王雪潔, 韋 穎, 袁寶紅
(安徽三聯(lián)學(xué)院,安徽 合肥 230601)
當(dāng)今社會已經(jīng)跨入了基于大數(shù)據(jù)的AI時(shí)代,人工智能快速發(fā)展,并在人們的生活和生產(chǎn)中得到了廣泛的應(yīng)用。工業(yè)生產(chǎn)過程中可能出現(xiàn)問題的復(fù)雜性也在不斷提高,這里的復(fù)雜性指的是:生產(chǎn)過程中的輸入輸出包含兩個(gè)或者更多個(gè)變量,呈現(xiàn)多輸入多輸出的關(guān)系,此外變量之間還存在耦合影響,變量本身具有已知或未知的時(shí)變性。這樣的復(fù)雜工業(yè)過程,其間的變量多,變量間的關(guān)系復(fù)雜,想要保證生產(chǎn)的順利進(jìn)行,必須將系統(tǒng)的故障率維持在較低水平,所以故障診斷技術(shù)對當(dāng)今的工業(yè)生產(chǎn)具有作用顯而易見。目前各種故障診斷的方法[1][2],如基于知識、基于解析模型、基于數(shù)據(jù)驅(qū)動的方法等都得到了較多的研究,而單一的某種方法不盡完美,故提出了一種基于多層免疫模型的混合式故障診斷方法。
傳統(tǒng)的免疫算法是從醫(yī)學(xué)中免疫突破演化而來,把免疫學(xué)中的抗原當(dāng)作待優(yōu)化問題,抗體當(dāng)作待優(yōu)化問題的可行解,免疫記憶細(xì)胞為可行解中較好的解或最優(yōu)的那部分解,最優(yōu)的抗體對抗原具有最佳的親和力。針對工業(yè)生產(chǎn)的復(fù)雜型,系統(tǒng)中各節(jié)點(diǎn)之間的相關(guān)性,可能產(chǎn)生故障種類的多樣性,設(shè)計(jì)了多層免疫模型。
多層免疫模型設(shè)計(jì)為三個(gè)層次,第一層為固有層,第二層為網(wǎng)絡(luò)傳播層,第三層為自適應(yīng)層,如圖1所示。
圖1 多層免疫算法模型
固有層包含自體庫和故障知識庫,自體庫中存放了系統(tǒng)無故障情況下的特征向量,故障知識庫則存放了已知的故障類型,以對應(yīng)的B細(xì)胞以及抗體的形式保存,當(dāng)故障出現(xiàn)時(shí),可進(jìn)行故障的快速定位和分類??贵w檢測的具體步驟為:
Step1:定義待測數(shù)據(jù)為抗原;
Step2:自體庫比較,如果抗原與自體庫匹配結(jié)束,否則進(jìn)入Step3;
Step3:讀取已有故障知識庫中的抗體,計(jì)算親和力并比較;
Step4:如果親和力大于閾值,則有能檢測出抗原的抗體,輸出相應(yīng)的故障類型,否則進(jìn)入Step5;
Step5:若所有抗體比較完成,則提呈抗原至網(wǎng)絡(luò)傳播層,否則返回step3。
網(wǎng)絡(luò)層是基于免疫細(xì)胞之間可以相互刺激或協(xié)調(diào)而建立的,故障產(chǎn)生的原因不一定在故障源,也可能在節(jié)點(diǎn)處(如傳感器故障)。所以該層中每個(gè)免疫細(xì)胞可對應(yīng)一個(gè)傳感器,如圖2所示是由5個(gè)免疫細(xì)胞對應(yīng)的免疫網(wǎng)絡(luò)結(jié)構(gòu),比如說免疫細(xì)胞5同時(shí)和免疫細(xì)胞2、3、4都建立著相互的關(guān)系,所以5的狀態(tài)取決于2、3、4當(dāng)前的狀態(tài),2、3、4的變化會帶動5的變化,所以網(wǎng)絡(luò)層有益于故障的動態(tài)定位。
圖2 免疫網(wǎng)絡(luò)結(jié)構(gòu)圖
由于網(wǎng)絡(luò)層的存在,可以進(jìn)行具有關(guān)聯(lián)性變量進(jìn)行判斷,經(jīng)過網(wǎng)絡(luò)傳輸層相應(yīng)的故障抗原對應(yīng)的特征變量可以被篩選出。
網(wǎng)絡(luò)層將已特征提取的抗原信息傳遞到自適應(yīng)層,在該層中對傳統(tǒng)的免疫算法加入免疫優(yōu)勢(Immunodominance)算子[3],首先構(gòu)建免疫優(yōu)勢算法:
自適應(yīng)層是多層免疫模型的最底層,其中嵌入的免疫優(yōu)勢算法(Immunodominance Clone Algorithm, IDCA)對固有層知識庫的建立起到至關(guān)重要的作用,所以先對該算法尋優(yōu)的有效性進(jìn)行仿真測試。選擇常用標(biāo)準(zhǔn)函數(shù)中的Rosenbrock函數(shù)和Rastrigin函數(shù)進(jìn)行算法性能測試,圖3和圖4為兩種函數(shù)在實(shí)驗(yàn)過程中的最佳收斂曲線圖。
圖3 Rosenbrock收斂曲線
圖4 Rastrigin收斂曲線
并將大量多次測試得到的結(jié)果和一般免疫算法(General Immune Algorithm,GIA)在尋優(yōu)率方面進(jìn)行了比較如表1所示。由表1可見,IDCA從平均最優(yōu)值、收斂代數(shù)、達(dá)優(yōu)率等方面均優(yōu)于GIA。
表1 IDCA/GIA標(biāo)準(zhǔn)函數(shù)測試比較
TE(Tennessee Eastman)過程是基于真實(shí)工業(yè)過程,由美國伊斯曼公司創(chuàng)建出來的過程控制模型案例,該模型案例的建立為工業(yè)過程控制的各種方法研究提供了基于現(xiàn)實(shí)的仿真基礎(chǔ)[4]。TE過程是閉環(huán)控制過程,過程中包含反應(yīng)器、冷凝器、氣液分離器、循環(huán)壓縮機(jī)和汽提塔,此外材料主要包含8種,A、B、C、D是氣體,B為惰性組分,G和H為液態(tài)產(chǎn)物,F(xiàn)是副產(chǎn)品,其反應(yīng)過程為[5]:
TE仿真平臺可以仿真正常的工作情況和21個(gè)預(yù)設(shè)的故障。其中,故障1~7的產(chǎn)生是由于過程變量的階躍變化,如進(jìn)料成分的變化,故障8~12產(chǎn)生是由于過程變量的隨機(jī)變化,故障13、14、15、21的產(chǎn)生與緩慢漂移及與閥門的粘滯和位置有關(guān),其余為未知故障。分別選取三類主要故障中的故障1、9、13進(jìn)行基于多層免疫模型的故障診斷實(shí)驗(yàn)。
TE過程包含的11個(gè)控制變量和41個(gè)測量變量,共52個(gè),所以用多層免疫模型進(jìn)行仿真時(shí)抗體的編碼長度為52。為提高故障診斷的準(zhǔn)確率,故障診斷前首先對欲判斷的故障進(jìn)行特征選擇。采用基于免疫優(yōu)勢算法的SVM進(jìn)行的特征選擇,這是一種典型的Wrapper方法特征選擇,免疫優(yōu)勢算法的高效搜索能力有助于SVM核函數(shù)的確定,進(jìn)行特征選擇[6]。
下面先以故障1為例介紹特征選擇的結(jié)果,特征選擇參數(shù)設(shè)置:抗體種群規(guī)模為50,變異因子0.08,迭代次數(shù)設(shè)為600,抗體編碼長度52,選取正常數(shù)據(jù)160組,故障數(shù)據(jù)800組。特征選擇的情況如圖5所示,由圖5可知階躍變化產(chǎn)生的故障1對應(yīng)的變量1和44為特征變量,如此可對故障1進(jìn)行編碼的時(shí)候?qū)?yīng)變量1和44的基因位編碼為1其它的基因位編碼為0。
圖5 故障1特征選擇結(jié)果
特征選擇之后用基于多層免疫模型的故障診斷方法對故障1、9、13進(jìn)行故障識別,識別的準(zhǔn)確率如表2所示。
表2 故障識別準(zhǔn)確率
由表2可知,所有故障的平均準(zhǔn)確率達(dá)到了93.83%,且三種故障每種的獨(dú)立識別的準(zhǔn)確率都達(dá)到了90%以上,尤其是故障1準(zhǔn)確率達(dá)到了100%。由此可見,多層免疫模型可以對TE模型的故障進(jìn)行識別,并且平均診斷率較高。
根據(jù)人體免疫學(xué),在傳統(tǒng)免疫算法的基礎(chǔ)上,設(shè)計(jì)了用于故障診斷的多層免疫算法,常見的故障可在固有層中進(jìn)行診斷,新故障類型在網(wǎng)絡(luò)傳播層中確定出特征變量后,進(jìn)入自適應(yīng)層,利用自適應(yīng)層中的免疫優(yōu)勢算法進(jìn)行故障識別,同時(shí)將新的故障信息存儲在固有層的故障知識庫中。經(jīng)仿真實(shí)驗(yàn)基于多層免疫模型的故障診斷方法在TE過程的故障診斷中起到了良好的作用。
多層免疫模型對于故障診斷還有研究發(fā)展的空間,通過研究可知在單種故障診斷中該模型起到了不錯的效果,但在多種故障及故障分類中還有應(yīng)用研究的空間,可在以后的研究中完成。