分段最小二乘支持向量機(jī)的故障診斷

2018-02-13 01:28:52呂寧姜懷斌

哈爾濱理工大學(xué)學(xué)報(bào) 2018年6期

呂寧姜懷斌

摘?要：在啤酒發(fā)酵過程中，為了建立精準(zhǔn)的傳感器溫度故障診斷模型，在標(biāo)準(zhǔn)支持向量機(jī)（SVM）的基礎(chǔ)上提出了分段最小二乘支持向量機(jī)的方法，該方法首先利用模糊C聚類（FCM）對(duì)樣本進(jìn)行聚類分析，達(dá)到劃分發(fā)酵階段和建立局部模型的目的，然后采用最小二乘支持向量機(jī)（LS-SVM）的方法對(duì)各類樣本進(jìn)行建模。實(shí)驗(yàn)結(jié)果表明，使用該方法建立的啤酒發(fā)酵過程溫度故障診斷模型具有較高的準(zhǔn)確性。經(jīng)過比較，該方法建立的模型的泛化能力要強(qiáng)于其他SVM方法建立的模型。

關(guān)鍵詞：支持向量機(jī);模糊C均值聚類;最小二乘支持向量機(jī);啤酒發(fā)酵;建模

DOI：10.15938/j.jhust.2018.06.017

中圖分類號(hào)： TP206.3

文獻(xiàn)標(biāo)志碼： A

文章編號(hào)： 1007-2683（2018）06-0094-06

Abstract：In the process of beer fermentation?in order to establish the precise temperature sensor fault diagnosis model?on the basis of standard support vector machineSVM）?We proposed piecewise least square support vector machine method?first using fuzzy c-means clusteringFCM） of the sample of poly class analysis to divide fermentation stage and the establishment of local model.?Then the least square support vector machineLS-SVM） method is used for modeling of various types of samples.?The experimental results show that the model has a high accuracy in the process of temperature fault diagnosis of beer fermentation process.?After comparison?the proposed method establishes the model's generalization ability better than other SVM methods to build the model.

Keywords：support vector machine;fuzzy C mean clustering;least squares support vector machine; beer fermentation;modeling

0?引?言

對(duì)于間歇過程，多操作階段是其一個(gè)固有特性，過程中的非線性與過程的各階段往往是密不可分的。這就導(dǎo)致了一個(gè)問題，我們通過對(duì)過程整體的運(yùn)行狀況進(jìn)行建模分析，不能夠準(zhǔn)確的進(jìn)行判斷運(yùn)行情況，由于過程分為多個(gè)階段，每一個(gè)階段，它的主導(dǎo)變量與過程特征都會(huì)不同，由于操作過程的變化，過程之間一些變量的相互關(guān)系也無法判斷是否隨時(shí)間不斷變化，它呈現(xiàn)一定的分階段性。所以，對(duì)于它的統(tǒng)計(jì)建模與在線監(jiān)控，我們要整體進(jìn)行建模分析還要對(duì)每一階段進(jìn)行細(xì)致分析[1-3]。

啤酒發(fā)酵過程一般分為四個(gè)階段：主酵階段，后酵階段、還原階段、貯酒階段，每一個(gè)階段對(duì)溫度控制的要求都很嚴(yán)格，直接關(guān)系到啤酒發(fā)酵的質(zhì)量。想要建立局部模型，我們就需要對(duì)發(fā)酵階段進(jìn)行劃分，由于過程的階段性密不可分，直接進(jìn)行階段劃分，難度很大，聚類分析是將數(shù)據(jù)進(jìn)行分類，將相似性大的數(shù)據(jù)歸為一類，而類別之間數(shù)據(jù)的差異較大，這一特性滿足啤酒發(fā)酵過程階段劃分的要求，所以本文通過對(duì)樣本數(shù)據(jù)進(jìn)行聚類分析，將發(fā)酵過程劃分為幾個(gè)不同的階段。聚類分析分為兩種，硬聚類、模糊聚類，由于硬聚類直接將各類別的隸屬度規(guī)定為0跟1兩個(gè)值，這就使得樣本與樣本之間的關(guān)系被割裂，因此，這種方法不能得到理想的聚類結(jié)果，Ruspini將Zadeh模糊數(shù)學(xué)理論引入聚類分析，提出模糊劃分的概念，模糊聚類表現(xiàn)了樣本與樣本之間的聯(lián)系，建立了數(shù)據(jù)樣本對(duì)類別的不確定性描述，可對(duì)類別間有交叉的數(shù)據(jù)集進(jìn)行有效的聚類[4-7]。

由于間歇過程自身復(fù)雜的特點(diǎn)，人們對(duì)該過程的監(jiān)測(cè)進(jìn)行了長(zhǎng)期的研究，主成分回歸（PCR），主成分分析（PCA），支持向量機(jī)（SVM），偏最小二乘（PLS）和獨(dú)立分量分析（ICA）等一系列多元統(tǒng)計(jì)分析建模方法已經(jīng)成為間歇過程和連續(xù)化工過程的常用的建模與監(jiān)測(cè)方法，并且取得了很多成功的案例。支持向量機(jī)（Support Vector Machine，SVM）方法是Vapnik等提出的，采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則代替經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則，對(duì)小樣本、非線性、高維數(shù)、局部極小等問題給了很好的處理方法，泛化能力很強(qiáng)。SVM方法也為發(fā)酵過程故障診斷提供了一個(gè)嶄新的途徑[8-10]。

大量的矩陣運(yùn)算是SVM學(xué)習(xí)過程的一個(gè)特點(diǎn)，這也導(dǎo)致了一個(gè)問題，訓(xùn)練速度緩慢且訓(xùn)練時(shí)間長(zhǎng)，這勢(shì)必會(huì)使SVM泛化能力受到影響，針對(duì)此種情況，基于本文研究的實(shí)際情況，在這里采用最小二乘支持向量機(jī)（LS-SVM），它將SVM中的二次規(guī)劃問題轉(zhuǎn)換成求解線性方程的問題，這樣使得計(jì)算復(fù)雜度降低，計(jì)算速度也加快[11]。

本文提出將FCM聚類和LS-SVM相結(jié)合的建模方法。該方法首先利用FCM對(duì)樣本進(jìn)行聚類分段，然后對(duì)各段樣本建立LS-SVM模型。在MATLAB2009Ra軟件中，使用現(xiàn)場(chǎng)數(shù)據(jù)建立了啤酒發(fā)酵過程的分段故障診斷模型，經(jīng)過與其他SVM建模方法比較，此方法建立的模型具有較高的泛化能力[12]。

1?模糊C均值聚類算法

啤酒的釀制，就是控制各種參數(shù)使其達(dá)到某種發(fā)酵的效果，發(fā)酵的過程被劃分為很多階段，在每個(gè)階段一些生物量的值都有不同的變化，所以可以根據(jù)生物量的不同變化來劃分發(fā)酵的階段，但這種劃分由于每次試驗(yàn)的相同階段過程會(huì)隨時(shí)間發(fā)生變化而顯得極其復(fù)雜，而且同一試驗(yàn)的相鄰階段之間也沒有明確劃分原理，這就要求試驗(yàn)人員有扎實(shí)的實(shí)驗(yàn)基礎(chǔ)，否則劃分不精確會(huì)對(duì)建模精度產(chǎn)生極大影響。聚類分析的方法在上述劃分的問題上有其獨(dú)特的優(yōu)勢(shì)，它能使相同階段中的對(duì)象顯示出最大的相似度，而使不同階段中的對(duì)象顯示出最大的差異性，從而能完全顯示出不同階段的數(shù)據(jù)分布特性，利用聚類算法的原理去分析啤酒發(fā)酵的過程，提取發(fā)酵過程中每個(gè)階段的數(shù)據(jù)信息，完全能夠?qū)崿F(xiàn)發(fā)酵階段的自動(dòng)劃分[13-15]。

FCM算法首先由Dunn提出，經(jīng)過Bezdek等完善和推廣，其用于發(fā)酵過程數(shù)據(jù)分類的基本思想是，根據(jù)發(fā)酵過程數(shù)據(jù)與C個(gè)聚類中心間的加權(quán)相似性測(cè)度，對(duì)目標(biāo)函數(shù)進(jìn)行迭代最小化，以確定其最佳的類別。其目標(biāo)函數(shù)如下：

3?基于FCM和LS-SVM的建模方法

基于FCM和LS-SVM的建模過程可以劃分成兩個(gè)過程進(jìn)行分析，結(jié)構(gòu)如圖1所示。階段一，F(xiàn)CM把整個(gè)輸入樣本空間劃分為若干個(gè)互相分離的區(qū)域，區(qū)域數(shù)量根據(jù)具體研究對(duì)象決定，每個(gè)獨(dú)立的階段擁有不同特征。階段二，對(duì)不同階段應(yīng)用相異的LS-SVM進(jìn)行建模。上述方法與全局LS-SVM模型方法有很大差異。全局LS-SVM模型雖然也是在整個(gè)研究樣本空間中操作，但是能在每個(gè)階段都能得到充分訓(xùn)練還不能保證，該過程的操作步驟為：

1）將采集的訓(xùn)練樣本進(jìn)行[0，1]歸一化處理，目的是避免各種不同特征數(shù)據(jù)之間的數(shù)量級(jí)相差太大以至于造成誤差;

2）將樣本數(shù)據(jù)輸入到FCM聚類算法中，輸出為每個(gè)樣本對(duì)每個(gè)階段的隸屬度的值，將樣本數(shù)據(jù)劃分為幾類;

3）基于第2步中已按照階段劃分的幾類訓(xùn)練樣本，分別采用LS-SVM對(duì)模型進(jìn)行訓(xùn)練，分別得到每個(gè)階段的估計(jì)函數(shù)f（x），模型訓(xùn)練結(jié)束;

4）將訓(xùn)練結(jié)果應(yīng)用于LS-SVM模型中，根據(jù)整個(gè)過程階段的劃分原則，將不同階段的測(cè)試數(shù)據(jù)輸

入，得到預(yù)測(cè)樣本的輸出量;

5）模型的泛化能力使用測(cè)試樣本進(jìn)行測(cè)試。

建立LS-SVM分類器模型，在分類問題上，支持向量機(jī)通常只考慮兩類，yi=1表示該樣本屬于一類，yi=-1表示該樣本屬于第二類，處理多類分類問題時(shí)，需要將多類分類問題轉(zhuǎn)換為兩類分類問題，本文采用“一對(duì)多”方法，該方法用一個(gè)LS-SVM分類器將每一類與剩下的所有類別作區(qū)分，因此需建立的LS-SVM分類器與故障類型的數(shù)目相一致[19～22]。

4?啤酒溫度故障診斷仿真實(shí)驗(yàn)

啤酒發(fā)酵是一個(gè)對(duì)溫度控制相當(dāng)嚴(yán)格的過程，對(duì)于溫度傳感器的準(zhǔn)確性有較高的要求，啤酒發(fā)酵溫度控制采用PID控制，準(zhǔn)確的溫度狀態(tài)反饋將直接影響到PID控制的運(yùn)行，所以能夠及時(shí)的檢測(cè)出溫度傳感器的故障，并且迅速的確定問題的原因就顯得尤為重要，溫度傳感器通常有如表1常見的故障現(xiàn)象。

使用基于FCM和LS-SVM的方法，建立啤酒發(fā)酵過程溫度故障診斷模型。采用5批生產(chǎn)數(shù)據(jù)，每一小時(shí)采樣一次數(shù)據(jù)，每一批次共360個(gè)溫度數(shù)據(jù)，代表一個(gè)完整的發(fā)酵過程，數(shù)據(jù)被分成兩部分：4批次數(shù)據(jù)用于建立模型，1批數(shù)據(jù)用于測(cè)試，故障數(shù)據(jù)為實(shí)驗(yàn)過程中曾出現(xiàn)的數(shù)據(jù)，建模中采用RBF核函數(shù)，RBF核函數(shù)即K（x，y）=exp[-‖x-y‖2/2σ2]，能夠更好地反映發(fā)酵過程的非線性特點(diǎn)。

啤酒發(fā)酵過程一般分為四個(gè)階段：主酵階段，后酵階段、還原階段、貯酒階段，所以根據(jù)實(shí)際情況，使用FCM將整個(gè)樣本空間劃分為四個(gè)區(qū)域，如圖2，由圖可以看出，0h～140h為主酵階段，140h～270h為后酵階段，270h～310h為還原階段，310h～360h為貯酒階段。

實(shí)驗(yàn)仿真采用Matlab2009Ra軟件，F(xiàn)CM的參數(shù)為：聚類數(shù)目C=4，加權(quán)指數(shù)m=2，迭代終止參數(shù)ε=0.001，對(duì)大迭代次數(shù)t=100。經(jīng)過多次實(shí)驗(yàn)，對(duì)LS-SVM模型，主酵階段的參數(shù)選擇為σ=211和C=4500，后酵階段的參數(shù)選擇為σ=124和C=3200，還原階段的參數(shù)選擇為σ=148和C=5500，貯酒階段的參數(shù)選擇為σ=34和C=5000。鑒于故障類型，每一個(gè)階段需要構(gòu)建2個(gè)分類器，每一個(gè)故障對(duì)應(yīng)一個(gè)分類器，故障數(shù)據(jù)逐一輸入到2個(gè)分類器中，直到將故障數(shù)據(jù)正確分類。

圖3和圖4是按表1的故障類型采用LS-SVM對(duì)故障的分類，其中標(biāo)簽號(hào)1代表故障屬于該類別，-1代表故障不屬于該類別，橫坐標(biāo)為采樣點(diǎn)數(shù)，縱坐標(biāo)為故障標(biāo)號(hào)。

圖3為在主酵階段（階段一）人為引進(jìn)故障，在0～100h引入故障二，圖a表示全局LS-SVM對(duì)故障的診斷，圖b為分段LS-SVM對(duì)故障的診斷。

圖4為在后酵階段（階段二）人為引進(jìn)故障，在140～220h引入故障一，圖c表示全局LS-SVM對(duì)故障的診斷，圖d為分段LS-SVM對(duì)故障的診斷。

由圖3、圖4可以看出，全局LS-SVM對(duì)于發(fā)酵過程的故障診斷，存在比較嚴(yán)重的誤報(bào)與漏報(bào)現(xiàn)象，對(duì)發(fā)酵過程進(jìn)行分段，針對(duì)每一段進(jìn)行故障診斷，大大提高了診斷的準(zhǔn)確率。

表2為以故障一為故障數(shù)據(jù)，得出的診斷結(jié)果時(shí)間，從中可以得出結(jié)論，對(duì)發(fā)酵過程分段處理，使得模型的運(yùn)算復(fù)雜度降低，診斷的速度也得到了提高。

5?結(jié)?論

本文首先闡述了啤酒發(fā)酵過程的階段性，指出對(duì)其分段處理的必要性，之后對(duì)每個(gè)階段進(jìn)行建模處理，聚類算法FCM因其有更獨(dú)特的優(yōu)勢(shì)而被采用;在此基礎(chǔ)上，又詳細(xì)闡述對(duì)啤酒發(fā)酵每階段的建模過程和方法，應(yīng)用FCM和LS-SVM相結(jié)合的方式，利用在現(xiàn)場(chǎng)采集到的數(shù)據(jù)，建立了整個(gè)啤酒發(fā)酵過程的模型，通過這個(gè)模型對(duì)出現(xiàn)的故障進(jìn)行診斷處理，該模型保證了診斷結(jié)果的準(zhǔn)確性，與全局建模方式比較，具有更強(qiáng)的泛化能力，此方法建立的故障診斷模型，對(duì)故障的診斷與分類更加準(zhǔn)確，進(jìn)而可以根據(jù)故障診斷的結(jié)構(gòu)精準(zhǔn)迅速的去斷定故障原因，加以排除。

參考文獻(xiàn)：

[1]?張旭.?青霉素間歇過程故障診斷方法研究[D].沈陽(yáng)：沈陽(yáng)理工大學(xué)，2012.

[2]?熊偉麗，王肖，陳敏芳，徐保國(guó).?基于加權(quán)LS-SVM的青霉素發(fā)酵過程建模[J]. 化工學(xué)報(bào)，2012（9）：2913-2919.

[3]?CHIANG L H，RUSSELL F L，BRAATZ R D.Fault detection and diagnosis in industrial systems[J].Springer，2001（9）：317-335.

[4]?L.in C T，Juang C F，LiCP.Temperature Control with a Neural Fuzzy Inference Network [J].IEEE Trans.Stst.Man，Cybern.1999，C（29）：440-451.

[5]?劉樹啟，徐光憲，劉建輝.啤酒發(fā)酵過程監(jiān)控系統(tǒng)研究[J]，遼寧工程技術(shù)大學(xué)學(xué)報(bào)，2002，21（2）：224-226.

[6]?陽(yáng)同光，桂衛(wèi)華.基于 KPCA 與 RVM 感應(yīng)電機(jī)故障診斷研究[J].電機(jī)與控制學(xué)報(bào)，2016，20（9）：89-95.

[7]?張志艷，馬宏忠，楊存祥，等.?小波包與樣本熵相融合的PMSM失磁故障診斷[J].電機(jī)與控制學(xué)報(bào)，2015，19（02）：26-32.

[8]?VAAG P.et al.Charaeterization of a Beer Foam Protein Originating From Barley[J].EBC Congress，1999，25：157-166.

[9]?楊奎河，單甘霖，趙玲玲.基于最小二乘支持向量機(jī)的故障診斷方法[J].計(jì)算機(jī)應(yīng)用研究，2007（7）：99-101.

[10]邊莉，邊晨源.?采用交叉熵支持向量機(jī)和模糊積分的電網(wǎng)故障診斷[J].電機(jī)與控制學(xué)報(bào)，2016，20（2）：112-120.

[11]MARCU T?KOPPEN-SELIGER B?STUCHER R.?Design of Fault Detection for a Hydraulic Looper Using Dynamic Neural Networks[M]. 16.OXFORD?2008，192-213.

[12]VAAG P.et al.Charaeterization of a Beer Foam Protein Originating From Barley[J].EBC Congress，1999，25：157-166.

[13]蔡艷寧，胡昌華，汪洪橋，等.基于自適應(yīng)動(dòng)態(tài)無偏 LSSVM 的故障在線監(jiān)測(cè)[J].機(jī)電工程，2013（1）：56-57.

[14]高學(xué)金，王普，孫崇正，易建強(qiáng)，張亞庭，張會(huì)清.?分階段建立發(fā)酵過程模型的方法的研究和應(yīng)用[J]. 系統(tǒng)仿真學(xué)報(bào)，2007，11：2574-2577.

[15]楊小梅，劉文琦，楊俊.?基于分階段的LSSVM發(fā)酵過程建模[J]. 化工學(xué)報(bào)，2013，09：3262-3269.

[16]EL-TAWEEL Gh S，HELMY A K.An Edge Detection Scheme Based on Least Squares Support Vector Machine in a Contourlet HMT Domain[J].Applied Soft Computing Journal，2014，32（6）：211-223.

[17]王強(qiáng)，陳歡歡，王珽.一種基于多類支持向量機(jī)的故障診斷算法[J].電機(jī)與控制學(xué)報(bào)，2009，02：302-306.

[18]張繼軍，馬登武，鄧力，范庚. LS-SVM參數(shù)估計(jì)與稀疏化方法研究及應(yīng)用[J]. 系統(tǒng)仿真學(xué)報(bào)，2014，05：1113-1117.

[19]HIROFUMI Osada，HIDEKI Tanemura.Strong Markov Property of Determinantal Processes with Extended Kernels[J].Stochastic Processes and their Applications，2016，41：686-702.

[20]公彥杰.?基于LS-SVM建立發(fā)酵過程動(dòng)態(tài)模型的研究及軟件實(shí)現(xiàn)[D].北京工業(yè)大學(xué)，2010.

[21]劉斌，蘇宏業(yè)，王強(qiáng).一種基于最小二乘支持向量機(jī)的預(yù)測(cè)控制算法[J].控制與決策，2010（8）：173-177.

[22]武俊峰，艾嶺.一種基于改進(jìn)聚類算法的模糊識(shí)別辨識(shí)[J].哈爾濱理工大學(xué)學(xué)報(bào)，2010（3）：1-5.

（編輯：王?萍）