楊少梅, 王廉茹
(華北電力大學 經(jīng)濟與管理學院,河北 保定 071003)
近年來,中國風電裝機容量不斷上升。2020年中國風電新增裝機容量7 167 MW,風電累計裝機容量達到281.72 GW[1]。風電裝機量的增加,使得如何減少運行而維護成本已成為風電場面臨的日益嚴峻的挑戰(zhàn)[2]。我國風電裝備通常在運轉(zhuǎn)5年之內(nèi)出現(xiàn)關(guān)鍵故障[3]。工作壽命在20年的風電機組運維成本大約占風場收入的10%~15%,海上風電機組則高達20%~25%[4]。在我國,多數(shù)采用計劃檢修和事后檢修的方式來處理風電機組的故障。其中計劃維修是指機組運行2 500 h或5 000 h后進行例行維護,無法準確掌握機組的運行狀態(tài)并發(fā)現(xiàn)問題;事后維修的缺點是設(shè)備維修耗時太長且維修費用昂貴[5]。
為了保證電力系統(tǒng)運行的安全,風力發(fā)電機組的早期故障檢測顯得尤為重要[6]。研究表明,風力發(fā)電機組變速箱是一個容易發(fā)生故障的關(guān)鍵部件[7]。目前,風力發(fā)電機組齒輪箱故障預(yù)測的研究主要集中在振動信號分析和聲發(fā)射信號[8],但對齒輪箱溫度的研究較少。潤滑系統(tǒng)作為齒輪箱的核心系統(tǒng)之一,具有傳遞載荷、適應(yīng)接觸速度、散熱、減少摩擦等功能[9]。如果潤滑系統(tǒng)的油溫過高,齒面潤滑不良,然后過熱,導致齒輪磨損、擦傷、微點蝕、點蝕等典型故障[10]。如果能準確預(yù)測油溫的趨勢,可以提前采取維修措施,實現(xiàn)齒輪箱的早期維修。
目前,深度學習方法是時間序列預(yù)測領(lǐng)域最流行的預(yù)測方法,并得到了學術(shù)界的廣泛認可[11]。劉躍飛等利用支持向量機(Support Vector Machine, SVM)對齒輪箱油溫進行預(yù)測并基于此設(shè)定預(yù)警閾值[3],Qing等利用長-短期記憶(Long Short-Term Memory, LSTM)方法建立了太陽輻照度的預(yù)測模型[12]。結(jié)果表明,LSTM的預(yù)測效果優(yōu)于傳統(tǒng)的淺層神經(jīng)網(wǎng)絡(luò)。Li等[13]將遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent neural network, RNN)作為主要預(yù)測因子,對滾動軸承的狀態(tài)趨勢進行預(yù)測。
聚類經(jīng)驗?zāi)B(tài)分解(Ensemble empirical mode decomposition, EEMD)是經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition, EMD)的改進方法,其計算步驟如下:
(1)假設(shè)x(t)是原始信號,將隨機白噪聲信號nj(t)加到x(t)上:
xj(t)=x(t)+nj(t)
(1)
式中:xj(t)為添加噪聲后的信號;j為整數(shù)且j∈[1,M];M表示試驗次數(shù)。
(2)利用EMD分解為一系列固有模態(tài)函數(shù)(IMF):
(2)
式中:ci,j為第j次試驗的第i個IMF;rNj為第j次試驗的剩余部分;Nj為第j次試驗得到的IMFs數(shù)量。
(3)如果j (4)得到I=min(N1,N2, …,NM),同時計算分解的相應(yīng)IMF的集合平均值作為最終結(jié)果: (3) 式中:i=1, 2, …,I。 (5)ci(i=1, 2, …,I)表示IMF的平均值。 Alcaraz和Rieta 在2010年提出了一種新的時間序列信息量量化方法[14],即樣本熵(Sample entropy, SE)。計算步驟如下: (1)將序列x(1),x(2), …,x(N)構(gòu)建成m維向量: Xm(i)=[x(i),x(i+1),…,x(i+m-1)] (4) 式中:i是整數(shù),且i∈[1,N-m+1]。 (2)d[Xm(i),Xm(j)]是向量Xm(i)和向量Xm(j)間的距離,計算方法如式(5): d[Xm(i),Xm(j)]=max|x(i+k)-x(j+k)| (5) 式中:k為整數(shù),且k∈[1,m-1], 1≤i,j≤N-m+1,i≠j。 (3)設(shè)置相似性容忍值r。d[Xm(i),Xm(j)] (6) 計算平均值,方法如式(7): (7) 計算m+1處的向量,根據(jù)式(8): (8) 同樣,計算平均值: (9) (4)序列的樣本熵表示為 (10) 實際上,N取一個有限值,其結(jié)果估計如式(11): SampEn(m,r,N)=-ln[Am(r)/Bm(r)] (11) 變分模態(tài)分解(Variational mode decomposition, VMD)由Dragomiretskiy和Zosso于2014年提出[15]。它是一種新的信號分解估計方法。其核心思想是在原始信號的基礎(chǔ)上構(gòu)造一組N個不同的帶限本征模函數(shù)(BLIMF),使每個BLIMF的估計帶寬之和最小。BLIMF的公式如式(12): vi(t)=Ui(t)cos(wi(t)) (12) 式中:Ui(t)和ωi(t)分別表示BLIMF分量的瞬時振幅和瞬時相位。 VMD算法的步驟如下: (3)更新每個BLIMF分量和中心頻率: (13) (14) 式中:β為次要的懲罰因素。 (4)拉格朗日算子通過以下公式迭代更新: (15) 式中:τ表示噪聲容忍參數(shù)。 (5)確定是否符合下列終止條件: (16) 式中:ξ為判別值。如果符合,則停止迭代。通過對每個分量進行傅立葉逆變換,得到最終分解的時域BLIMF分量集。 LSTM神經(jīng)網(wǎng)絡(luò)最早由Schmidhuber和Hochreiter提出[16],由于能更好地發(fā)現(xiàn)長期依賴關(guān)系而被廣泛用于處理序列信息,如語音識別、機器翻譯等。LSTM每個神經(jīng)元的結(jié)構(gòu)包括一個記憶儲存 (Cell) 和三個門控 (Gates) 設(shè)置,Cell記錄神經(jīng)元狀態(tài), 輸入門 (Input Gate) 和輸出門 (Output Gate) 用來接收、輸出參數(shù)和修正參數(shù), 遺忘門 (Forget Gate) 用來控制上一單元狀態(tài)的被遺忘程度[17]。 綜上所述,本文的研究主要由三部分組成,如圖1所示。 圖1 油溫預(yù)測流程圖Fig. 1 Flow chart of oil temperature prediction system 第一部分,分解。將原始數(shù)據(jù)輸入模型,通過EEMD得到多個復(fù)雜度和非線性度較低的IMF分量。第二部分,重構(gòu)。本節(jié)分為兩個步驟,首先用VMD對上一步得到的IMF1分量進行進一步分解,得到新的分量。同時,利用SE對剩余子序列的相似度進行量化,并對相似度較高的子序列進行整合。第三部分,預(yù)測。將IMF1再次分解后的序列和重建得到的新的子序列輸入到LSTM神經(jīng)網(wǎng)絡(luò)中,得到每個子序列的預(yù)測結(jié)果。將各子序列的預(yù)測結(jié)果相加,得到最終的預(yù)測結(jié)果。 本文選取來自某風電場的三組1 000個采樣點的SCADA(監(jiān)控與數(shù)據(jù)采集)系統(tǒng)采集的油溫數(shù)據(jù),油溫數(shù)據(jù)為每分鐘讀取一次,三組數(shù)據(jù)分別間隔10 min、30 min鐘、50 min取值,對模型的有效性進行驗證。SCADA系統(tǒng)采集的油溫數(shù)據(jù)#1和#2來自不同的齒輪箱,數(shù)據(jù)#1和#3來自同一齒輪箱。表1顯示了這些油溫時間序列的統(tǒng)計分析。原油溫度數(shù)據(jù)的波動特征如圖2~圖4所示。 在本研究中,將選取前800個樣本點作為訓練數(shù)據(jù),將后200個樣本點將作為測試集來驗證該模型的性能。 表1 數(shù)據(jù)基本信息Tab.1 Statistical description of datasets 圖2 數(shù)據(jù)集#1原始數(shù)據(jù)Fig. 2 Raw oil temperature data #1 圖3 數(shù)據(jù)集#2原始數(shù)據(jù)Fig. 3 Raw oil temperature data #2 圖4 數(shù)據(jù)集#3原始數(shù)據(jù)Fig. 4 Raw oil temperature data #3 本研究采用了3個經(jīng)典指標,即平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)。此外,還采用了MAE(PMAE)、RMSE(PRMSE)和MAPE(PMAPE)的改善率,可以直接比較不同模型的優(yōu)缺點。 (17) 式中:D(i)表示數(shù)據(jù)的真實值;D′(i)表示數(shù)據(jù)的預(yù)測值;n表示樣本數(shù)量。 (18) 式中:下標1表示基準模型,下標2表示比較模型。 本研究提出的預(yù)測模型的第一步是應(yīng)用EEMD對原始數(shù)據(jù)進行分解。圖5顯示了#1分解前后的結(jié)果。經(jīng)過EEMD處理后,原始序列被分解成10個子序列。與原始序列相比,子序列具有更明顯的波動規(guī)律,有助于預(yù)測模型更好地把握數(shù)據(jù)波動特征。 圖5 數(shù)據(jù)集#1分解圖Fig. 5 Decomposition result of dataset #1 在得到3個數(shù)據(jù)集的分解結(jié)果后,計算了所有子序列的樣本熵。如圖6所示,所有子序列的樣本熵顯示出類似的趨勢??梢钥闯鯥MF1的樣本熵比其他子序列的樣本熵要高得多。這表明IMF1遠比其他子序列復(fù)雜。因此,對IMF1進行再分解是提高預(yù)測精度的合理嘗試。 圖6 序列樣本熵值Fig. 6 Sample entropy of each sequence 利用VMD對IMF1進行分解。圖7是對數(shù)據(jù)集#1的IMF1的再分解結(jié)果以及對應(yīng)于每個序列的光譜。從圖7可以看出,具有高復(fù)雜性的IMF1被分解為5個子序列。與IMF1相比,子序列波動更為規(guī)律。此操作可進一步提高預(yù)測的準確性。 圖7 數(shù)據(jù)集#1中IMF1分解結(jié)果Fig. 7 Decomposition result of IMF1 of dataset #1 本節(jié)中的另一個步驟是集成IMFs和R(IMF1除外)。根據(jù)樣本熵的結(jié)果,將相似的子序列整合成一個新的序列Fm。重構(gòu)的結(jié)果總結(jié)在表2中。 表2 序列重構(gòu)Tab.2 Result of sequence reconstruction 3.3.1 實驗Ⅰ:比較不同預(yù)測方法 為了證明LSTM在油溫預(yù)測中具有有效的預(yù)測性能,本文將LSTM與BP、SVM、ELM和WOA-ELM等幾種經(jīng)典神經(jīng)網(wǎng)絡(luò)進行了比較。此外,還將LSTM方法與門控神經(jīng)網(wǎng)絡(luò)RNN進行了比較,證明了LSTM方法的優(yōu)越性。對數(shù)據(jù)集#1、#2、#3用不同方法進行預(yù)測,結(jié)果如表3所示。 表3 不同模型的預(yù)測誤差Tab.3 Prediction error of different models 3.3.2 實驗Ⅱ:驗證分解方法的有效性 為了驗證所提出的二次分解模型可以提高神經(jīng)網(wǎng)絡(luò)模型預(yù)測的準確度,選用BP模型作為基準模型,分別用BP模型預(yù)測的結(jié)果與EEMD-BP和EEMD-VMD-BP的預(yù)測結(jié)果進行對比,圖8是一個散點圖,給出了加入分解后的模型與基準模型之間的對比,表4給出了這些模型的誤差對比結(jié)果,表5給出了不同模型之間預(yù)測誤差的提升率。 3.3.3 實驗Ⅲ:比較不同模型對二次分解后的新序列進行預(yù)測的誤差 為了驗證所提出模型的先進性和創(chuàng)新性,有必要將所提出的模型與現(xiàn)有模型進行比較。包括進行二次分解后的BP、SVM、EIM、WOA-ELM和RNN。這些采用時間序列預(yù)測方法的先進模型在風速、大氣污染物濃度和負荷預(yù)測中是有效的。與這些模型的比較驗證了所提出的EEMD-VMD-LSTM模型的應(yīng)用價值。圖9~圖11顯示了6個相關(guān)模型的預(yù)測結(jié)果和誤差結(jié)果。圖12給出了6個相關(guān)模型的MAE、MAPE和RMSE結(jié)果,可以看出本文所提出的模型的優(yōu)越性。 表4 不同模型的預(yù)測誤差Tab.4 Prediction error of different models 表5 不同模型的預(yù)測誤差改善率Tab.5 Prediction error improvement rate of different models(%) 圖8 不同模型預(yù)測效果對比Fig. 8 Comparison of prediction results of different models 圖9 數(shù)據(jù)集#1的預(yù)測結(jié)果和誤差Fig. 9 Prediction results and errors of dataset #1 圖10 數(shù)據(jù)集#2的預(yù)測結(jié)果和誤差Fig. 10 Prediction results and errors of dataset #2 圖11 數(shù)據(jù)集#3的預(yù)測結(jié)果和誤差Fig. 11 Prediction results and errors of dataset #3 圖12 不同模型的誤差結(jié)果Fig. 12 Error results of different models 油溫預(yù)測對于齒輪箱的實時檢測以及后續(xù)的故障診斷非常有用。本文提出了一種基于二次分解方法和LSTM網(wǎng)絡(luò)相結(jié)合的油溫預(yù)測模型。首先,利用EEMD對原始序列進行預(yù)處理。然后,對每個子序列進行重構(gòu),用VMD分解樣本熵最高的IMF1。同時,計算了剩余子序列的樣本熵,并將熵值相近的序列進行了綜合。然后,利用LSTM對各子序列進行預(yù)測。根據(jù)實驗結(jié)果和討論,得出如下結(jié)論: 本文提出的預(yù)測模型具有良好的預(yù)測性能。在三個比較實驗中,本文提出的模型的預(yù)測結(jié)果好于其他模型。實驗結(jié)果證明,該模型能準確地捕捉齒輪箱油溫的波動規(guī)律,具有較強的自適應(yīng)能力。此外,引入樣本熵彌補了分解算法造成的操作冗余,提高了預(yù)測效率。該模型可為齒輪箱油溫提供更可靠、更有效的預(yù)測信息,實現(xiàn)了風電機組齒輪箱狀態(tài)的實時檢測,能提前預(yù)防齒輪磨損、擦傷、微點蝕、點蝕等典型故障的發(fā)生。 該模型能準確預(yù)測齒輪箱的油溫序列,為齒輪箱的實時檢測提供了有意義的參考。今后將考慮將其運用到風機齒輪箱油溫預(yù)測及故障診斷中。1.2 樣本熵(SE)
1.3 變分模態(tài)分解(VMD)
1.4 長短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)
1.5 預(yù)測模型結(jié)構(gòu)
2 數(shù)據(jù)來源及評價指標
2.1 數(shù)據(jù)來源
2.2 評價指標
3 模型有效性驗證
3.1 序列分解
3.2 輸入重構(gòu)
3.3 油溫預(yù)測
4 結(jié) 論