者 娜,劉才學(xué),楊泰波,何 攀,簡 捷,王廣金
(中國核動力研究設(shè)計院,成都 610200)
隨著核電站反應(yīng)堆運行時間的推移,反應(yīng)堆某些零部件可能會因沖擊、振動等因素而發(fā)生脫落。同時,在核電站反應(yīng)堆安裝或檢修時,存在著將金屬件遺留在反應(yīng)堆系統(tǒng)內(nèi)的風(fēng)險。這些金屬部件會在冷卻劑的帶動下不斷游動而與壓力邊界產(chǎn)生碰撞,若不能及時將其發(fā)現(xiàn),將使壓力邊界遭到嚴(yán)重破壞而危及反應(yīng)堆安全。為了保證核電站反應(yīng)堆系統(tǒng)的安全性,通常核電現(xiàn)場會采用松脫部件監(jiān)測系統(tǒng)來對撞擊信號進行監(jiān)測,以識別是否存在松脫部件[1]。但在實際情況中,監(jiān)測系統(tǒng)可能會因為現(xiàn)場復(fù)雜的工況條件、環(huán)境因素等而記錄大量非撞擊信號的信號,即脈沖尖峰信號、噪聲信號、自檢信號、噪聲波動信號、通道閃斷信號。因此有必要從監(jiān)測系統(tǒng)采集到的信號中將真實撞擊信號識別出來,以便于后期進一步的松脫部件確認(rèn)。在國外,金屬撞擊信號識別過程主要依靠專家利用自身身經(jīng)驗對監(jiān)測系統(tǒng)所采集的數(shù)據(jù)進行分析以得出結(jié)論,可靠性依賴于專家的分析水平,并且無法避免數(shù)據(jù)量大耗時過長的缺點,一旦反應(yīng)堆存在金屬松脫部件,可能由于無法實時給出診斷結(jié)論而導(dǎo)致嚴(yán)重的后果,對核電運行安全產(chǎn)生威脅。在國內(nèi),研究人員在采集端系統(tǒng)抗信號誤報警方法研究方面做了大量工作,取得了一些進展,但目前核電站監(jiān)測系統(tǒng)由于外界干擾或其他因素導(dǎo)致的系統(tǒng)誤報警、誤觸發(fā)問題仍然未得到有效解決,大量干擾信號導(dǎo)致的“誤觸發(fā)”給診斷人員及時給出診斷結(jié)論帶來了極大困難,因此,有必要利用智能識別手段來快速識別監(jiān)測系統(tǒng)已采集到的單個通道信號是否為金屬撞擊信號。反應(yīng)堆松脫部件的診斷主要包括金屬撞擊信號識別和綜合診斷兩個過程,診斷結(jié)果的準(zhǔn)確程度與能否準(zhǔn)確識別金屬撞擊信號直接相關(guān)。六類信號中,撞擊信號來自外界真實撞擊,而其余信號并非由撞擊產(chǎn)生,如由于采集板卡的自激勵脈沖而產(chǎn)生的脈沖尖峰信號,監(jiān)測系統(tǒng)為定期進行自身性能檢驗而通過力錘器產(chǎn)生的自檢信號,由于監(jiān)測通道受外界運行環(huán)境影響而產(chǎn)生的噪聲波動信號,由于電荷轉(zhuǎn)換器過載保護導(dǎo)致的通道閃斷。與干擾信號頻率分布雜亂無規(guī)律相比,實際的金屬撞擊信號中包含了多種頻率成分,且存在于某一較寬頻帶范圍內(nèi),若采用全頻帶范圍內(nèi)的單一特征作為信號特征,將很難全面描述撞擊信號與監(jiān)測系統(tǒng)所采集的其他信號之間的差異,這給金屬撞擊信號的識別工作帶來一定的困難,進而影響后續(xù)松脫部件的精確診斷。
變分模態(tài)分解[2]是近些年國內(nèi)外學(xué)者廣泛關(guān)注的一種信號分解方法,它能將信號按照其頻率自低到高的順序,自適應(yīng)地分解為一定數(shù)目的固有模態(tài)分量(IMF),且分解過程中各分量頻帶無需人為干預(yù),非常適用于處理非線性、非平穩(wěn)信號。本文擬采用VMD方法將信號分解為若干個頻帶的分量并提取信號特征,以實現(xiàn)對信號的全面描述。但經(jīng)VMD處理后得到的信號特征維數(shù)過高,支持向量機等智能分類方法分類準(zhǔn)確率會隨著特征維數(shù)的上升而下降,且支持向量機這類智能算法的分類準(zhǔn)確率很大程度上取決于模型參數(shù)的的選擇[3-5]。因此,需要尋找一種新的算法來進行信號的智能分類。
隨機森林[6]是在20世紀(jì)80年代提出的分類樹算法基礎(chǔ)上發(fā)展起來的一種無需調(diào)參的智能分類算法,它通過多棵分類樹的組合來實現(xiàn)分類,在處理高維數(shù)據(jù)方面具有明顯的優(yōu)勢。
針對上述問題,筆者提出了一套新的反應(yīng)堆撞擊信號識別方法,采用VMD方法對信號進行分解得到各IMF分量信號,分別提取各分量信號的時域、頻域特征構(gòu)成原始信號特征向量,將原始信號特征向量作為輸入,信號類型作為輸出,建立隨即森林分類模型來實現(xiàn)反應(yīng)堆金屬撞擊信號的識別。
Dragomiretskiy等[7]于2014年提出了一種新的信號處理方法—變分模態(tài)分解,作為一種新的信號處理方法,變分模態(tài)分解具有自適應(yīng)、非遞歸特點,該方法在變分框架內(nèi)來實現(xiàn)多成分信號的分解,通過迭代搜索變分模型的最優(yōu)解,確定各個模態(tài)分量的帶寬及其頻率中心,從而自適應(yīng)地實現(xiàn)包含多成分的信號中各個分量的有效分離,為從不同頻帶細(xì)致描述非線性且包含多種頻率成分的金屬撞擊信號提供了條件。
假定各個模態(tài)分量μk是頻率中心為wk的有限帶寬,則約束變分模型可表示為[8]
(1)
式中,k為最終分解得到的分量個數(shù)。
為獲得上述約束變分問題的最優(yōu)解,引入二次懲罰參數(shù)α和拉格朗日乘子λ(t),將上述問題轉(zhuǎn)換為非約束變分問題來求解。其中,二次懲罰參數(shù)可很大程度上減少高斯噪聲帶來的影響,而拉格朗日乘子是常用的一種保持約束嚴(yán)格執(zhí)行的方式[9]。增廣的拉格朗日函數(shù)可表示為
(2)
至此,初始的變分問題可通過拉格朗日法的交替方向乘子來實現(xiàn)求解,具體步驟如下:
步驟1 初始化μk、ωk、λ和n為0;
步驟2n=n+1,執(zhí)行整個算法循環(huán);
步驟4k=k+1,返回步驟3,重復(fù)至k=K時首個內(nèi)層循環(huán)結(jié)束;
步驟6k=k+1,返回步驟5,直至k=K時內(nèi)層第二個循環(huán)結(jié)束;
隨機森林算法是以CART決策樹作為弱分類器的一種組合分類算法,其本質(zhì)是一種由隨機生成的若干個決策樹組成的強分類器[10]。它在實現(xiàn)分類時要經(jīng)歷兩個過程,分別為生成決策樹過程和投票過程,其原理是針對原始樣本集,每次選擇樣本構(gòu)成一個容量小于原始訓(xùn)練樣本集的訓(xùn)練子集并對應(yīng)生成一棵決策樹,再由N個決策樹構(gòu)成隨機森林完成對原始訓(xùn)練樣本的分類訓(xùn)練。其中,選擇子集的和生成決策樹的過程均是隨機的。
隨機森林是一種典型的Bagging方法,它應(yīng)用自助法(bootstrap)重采樣技術(shù)生成多個決策樹分類器。決策樹的生長步驟如下:
步驟1 從由M個樣本數(shù)據(jù)構(gòu)成的初始訓(xùn)練集數(shù)據(jù)中有放回地隨機選擇樣本數(shù)據(jù)構(gòu)成一個樣本數(shù)量為N(N 步驟2 針對具有K個特征屬性的樣本子集,在單棵決策樹的各個節(jié)點處,隨機地從K個特征屬性中選擇m個特征屬性,并且以節(jié)點不純度最小為標(biāo)準(zhǔn)從上述特征屬性中選擇某個特征屬性進行分裂生長,重復(fù)上述過程直至該決策樹遍歷所有的特征屬性。在整個森林的生長過程中m將保持恒定。 隨機森林中的單棵決策樹從根節(jié)點開始對訓(xùn)練樣本子集進行劃分,它是一種自上而下遞歸分裂產(chǎn)生的二叉樹。決策樹分裂過程,是以分裂節(jié)點不純度最小為原則分裂為兩個節(jié)點,規(guī)則不變依次分裂直至滿足分支終止規(guī)則時分裂終止。 隨機森林采用的CART決策樹在節(jié)點處隨機選擇特征屬性的過程中,其選擇標(biāo)準(zhǔn)為各個節(jié)點Gini不純度最低。Gini不純度可表示為 (3) 式中:G(i)為節(jié)點i的不純度,設(shè)Pw是節(jié)點i上樣本屬于w類(假設(shè)樣本的特征屬性數(shù)量為W)的頻率。 圖1為單棵決策樹的結(jié)構(gòu)示意圖,t0為根節(jié)點,ti(i≥1)表示分裂節(jié)點,Nt表示終端節(jié)點。 圖1 決策樹結(jié)構(gòu)示意Fig.1 Decision tree structure 生成若干個決策樹后,由全部決策樹構(gòu)成隨機森林分類器。采用隨機森林分類器對樣本數(shù)據(jù)進行分類時,最終的分類結(jié)果是通過對各決策樹的分類結(jié)果進行投票來確定的,投票過程可表示如下 (4) 式中:nt為構(gòu)成隨機森林的決策樹個數(shù);I(*)為性函數(shù);nhi,C為決策樹hi對預(yù)測類樣本C的分類結(jié)果;nhi是決策樹hi的葉子結(jié)點數(shù)。 經(jīng)投票后,生成混淆表CM,它是一個nc×nc表。表中的元素cm(ω≠∈)表示類型ω被分類為類型∈的次數(shù),僅當(dāng)(ω=∈)時,cm(ω,ω)表示類型ω被分類正確的個數(shù)。隨機森林分類正確率CRT為 (5) 隨機森林的分類原理決定了它在處理數(shù)據(jù)時,能夠避免由于模型輸入數(shù)據(jù)維數(shù)上升而使得分類精度下降的情況,保證了在原始信號特征維數(shù)較大的情況下,仍能獲得良好的分類效果。 本研究采用VMD和隨機森林相結(jié)合的方法進行反應(yīng)堆金屬撞擊信號的識別,具體流程如下: 步驟1 對原始信號進行VMD分解,得到分解后的N個固有模態(tài)分量信號; 步驟2 針對每一個IMF分量信號,提取16個時域特征量[11],如峭度、方根幅值、偏斜度指標(biāo)等,時域特征參數(shù)反映了信號時域振動幅值、能量以及時間序列分布情況,同時根據(jù)式(6)、式(7)和式(8),提取3個時域特征量,式(6)為標(biāo)準(zhǔn)差計算公式,式(7)為衡量數(shù)據(jù)穩(wěn)態(tài)變化的指標(biāo),式(8)為衡量信號突變的程度。針對各IMF分量信號頻譜,提取13個頻域特征量[12],如重心頻率、均方頻率、頻率方差等,它們反映了振動信號頻譜集中程度、主頻帶位置的變化等頻域情況,將上述32個指標(biāo)作為此IMF的特征; (6) (7) F3=max{|xi|}/F2 (8) 步驟3N個固有模態(tài)分量信號的特征構(gòu)成一個包含N×32個元素的特征向量,作為原始信號的特征向量; 步驟4 將上述過程提取的原始信號特征向量作為輸入,信號類別作為輸出,建立隨機森林模型,利用測試樣本驗證模型分類的準(zhǔn)確程度。 圖2為反應(yīng)堆金屬撞擊信號識別流程圖。 圖2 反應(yīng)堆金屬撞擊信號識別流程Fig.2 Recognition process of reactor metal impact signal 數(shù)據(jù)來源為國內(nèi)某核電站現(xiàn)場LPMS監(jiān)測系統(tǒng)記錄的數(shù)據(jù),LPMS系統(tǒng)主要由加速度傳感器、信號調(diào)理、數(shù)據(jù)采集卡(A/D轉(zhuǎn)換)、數(shù)字信號處理芯片、計算機構(gòu)成。加速度傳感器布置在反應(yīng)堆壓力容器頂部和底部,監(jiān)測系統(tǒng)的采樣頻率為50 kHz,采樣時間為1 s。本研究中獲得的樣本包含六種信號類型數(shù)據(jù),信號類型分別為撞擊信號、自檢信號、噪聲信號、脈沖尖峰信號、通道閃斷信號、噪聲波動信號,六類信號時域波形如圖3所示。將樣本分為訓(xùn)練集和測試集,其中訓(xùn)練集樣本容量和測試集樣本容量分別為800和240,樣本數(shù)量如表1所示。 表1 各類信號樣本數(shù)量 筆者以金屬撞擊信號為例,說明VMD分解和特征提取過程。首先對原始信號進行VMD分解,研究表明[13],模態(tài)分量的分解層數(shù)影響著VMD分解結(jié)果的合理性,理論上經(jīng)VMD分解后得到的各個模態(tài)分量信號的頻率分布情況為由低到高,當(dāng)最后一個分量信號的中心頻率第一次達(dá)到最大值時的分解層數(shù)即為最佳分解層數(shù),本研究中通過觀察最后一個分量信號的中心頻率確定出VMD最佳分解層數(shù)為4,信號分解后得到由低頻到高頻分布的4個IMF分量,如圖4所示。然后求取各個IMF分量信號的頻譜,結(jié)果如圖5所示。 其次,根據(jù)特征計算公式提取撞擊信號IMF1分量信號的19個時域特征量,以及13個頻域特征量,依次提取IMF2、IMF3及IMF4的相同特征。將從4個IMF分量信號及其頻譜中提取出的128個特征量作為原始信號的一組特征向量。同理,對脈沖尖峰信號、噪聲信號、自檢信號、噪聲波動信號以及通道閃斷信號提取特征向量。六類信號各自的128個特征的特征值如圖6所示。 (a) 撞擊信號 (b) 脈沖尖峰信號 (c) 噪聲信號 (d) 自檢信號 (e) 噪聲波動信號 (f) 通道閃斷信號圖3 原始信號時域波形Fig.3 Tine-domain waveform of original signals (a) IMF1 (b) IMF2 (c) IMF3 (d) IMF4圖4 撞擊信號各IMF分量信號Fig.4 IMF components of impact signal (a) IMF1 (b) IMF2 (c) IMF3 (d) IMF4圖5 撞擊信號各IMF分量信號頻譜Fig.5 Frequency spectrum of IMF components of impact signal 由圖6可以看出,不同類型信號經(jīng)VMD分解后提取的特征在數(shù)值上和變化情況上存在明顯的差異,說明本研究所采用的特征提取方法提取出的特征的在全面表征原始信號所含的信息方面是有效的。 將上述過程提取出的訓(xùn)練集特征作為輸入,訓(xùn)練集樣本信號對應(yīng)的類別標(biāo)簽作為輸出,建立隨機森林模型,其中隨機森林模型的決策樹個數(shù)為500(默認(rèn)參數(shù))。將測試集特征作為隨機森林模型輸入,進行預(yù)測分類。為對比和評估模型分類效果,采用將訓(xùn)練集特征作為輸入向量建立的支持向量機模型和從未經(jīng)VMD分解的原始信號中提取的相同特征作為輸入建立的隨機森林模型來對測試集進行分類,其中,SVM的核函數(shù)為徑向基核函數(shù),采用網(wǎng)格法進行參數(shù)尋優(yōu),懲罰參數(shù)c為84,核函數(shù)參數(shù)g為0.1,分類結(jié)果如圖7所示。 (a) 撞擊信號(b) 脈沖尖峰信號(c) 噪聲信號 (d) 自檢信號(e) 噪聲波動信號(f) 通道閃斷信號圖6 六類信號特征值Fig.6 Eigenvalues of six kinds of signals (a) VMD_SVM模型(b) RF模型(c) VMD_RF模型圖7 三類模型分類結(jié)果Fig.7 Classification results of three models 從圖7可以看出,三類模型均能實現(xiàn)六種信號的分類,但明顯可以看出,三類模型中,本研究提出的方法建立的VMD_RF模型在實現(xiàn)上述信號分類時錯分樣本最少。計算三種模型分類結(jié)果的分類誤差,誤差計算結(jié)果如表2所示。 表2 三類模型分類誤差 從表2可以發(fā)現(xiàn),三類模型中支持向量機分類模型的分類誤差最大,為17.01%,RF模型的分類誤差為7.47%,而VMD_RF分類模型的誤差僅為2.90%,進一步說明了VMD分解后提取的信號特征更全面地表征了原始信號的信息,同時說明在實現(xiàn)反應(yīng)堆金屬撞擊信號識別方面,VMD_RF模型的識別效果要優(yōu)于單一的隨機森林模型和支持向量機模型。 通過實際工程實例驗證表明,采用基于變分模態(tài)分解和隨機森林的方法進行反應(yīng)堆金屬撞擊信號識別是有效的。本研究主要結(jié)論如下: (1) 利用變分模態(tài)分解將原始信號分解為多個分量信號,能夠?qū)崿F(xiàn)從多頻帶角度描述包含多個頻率成分的原始信號。 (2) 提出的基于變分模態(tài)分解的反應(yīng)堆金屬撞擊信號特征提取新方法提取的特征可以更全面地表征原始信號所含的特征信息,解決了由于特征信息不足而導(dǎo)致的識別精度低的問題。 (3) 構(gòu)造的VMD_RF分類模型,可實現(xiàn)反應(yīng)堆金屬撞擊信號的識別,并獲得良好的識別效果,避免了由于特征維數(shù)上升后模型構(gòu)建不合理而產(chǎn)生的識別精度下降的缺陷,為后續(xù)松脫部件的進一步確定奠定了良好基礎(chǔ)。2.2 投票過程
2.3 基于VMD_RF的反應(yīng)堆金屬撞擊信號識別方法
3 反應(yīng)堆金屬撞擊信號識別分析
3.1 數(shù)據(jù)獲取
3.2 識別結(jié)果及分析
4 結(jié) 論