(東方電氣新能科技(成都)有限公司,四川德陽 618000)
隨著我國風(fēng)力發(fā)電的大力推廣和平價上網(wǎng)的逐步推行,風(fēng)電行業(yè)尤其是各主機廠,不得不開始關(guān)注成本。降本,除了降低制造成本,運行和維護(以下簡稱運維)成本也是不得不考慮的點。其中,大部件更換成本從幾萬到上百萬不等。受設(shè)計、制造工藝以及后期運維質(zhì)量影響,實際上,大部件的更換頻率并不低。
為了降低這部分費用,各大主機廠家、諸多高校和一些業(yè)主都在進行故障早期預(yù)警相關(guān)的研究。如,劉軒的《風(fēng)力發(fā)電機溫升故障預(yù)警方法研究》[6]、陸超的《基于EEMD-PCA的風(fēng)電軸承故障預(yù)警方法》[7]等。在基于SCADA數(shù)據(jù)進行的研究方面,大數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)等技術(shù)均得到相關(guān)應(yīng)用,如文獻[2,8]。劉軒的《風(fēng)力發(fā)電機溫升故障預(yù)警方法研究》提出了一種加權(quán)主成分分析法,解決了傳統(tǒng)主成分分析法沒有考慮各主成分的權(quán)重問題。但沒有考慮到,溫度轉(zhuǎn)速等模擬量并非0-1這樣的狀態(tài)量,即沒有考慮時間累加效應(yīng)。此外,分類算法在故障識別中也得到大量應(yīng)用,如文獻[9-10]。然而,分類算法依賴大量可靠的標(biāo)記樣本,這樣的樣本并不容易大量獲取。這無疑增加了實現(xiàn)的難度。因此,本研究將在已有研究基礎(chǔ)上,從實際應(yīng)用的角度,提出一種結(jié)合相關(guān)性分析、長短期記憶及正態(tài)分布思想的風(fēng)力發(fā)電機故障預(yù)測解決方案,并進行實際應(yīng)用。
為方便驗證預(yù)測方案的有效性,應(yīng)選擇發(fā)生過主要部件(如主軸承)溫度異常機組從故障時刻(包含)往前一個月的數(shù)據(jù)以及該機組此前穩(wěn)定運行期間至少一年的數(shù)據(jù)。數(shù)據(jù)的粒度為10分鐘一個點。
SCADA數(shù)據(jù)在產(chǎn)生和存儲過程中均可能異常。如,傳感器松動極易產(chǎn)生瞬間極大值。因此,必須對極端數(shù)據(jù)進行清洗。首先求得每一維數(shù)據(jù)的上下四分位數(shù),再通過四分位數(shù)求得上下邊界,完成對異常數(shù)據(jù)的清洗。公式如下:
其中,k∈[1.5,3],與數(shù)據(jù)的集中程度有關(guān),這里我們?nèi)=1.5。upq,lowq分別是排序后的上下四分位數(shù)。uplimit,lowlimit是求出的上下邊界,即合理的數(shù)據(jù)應(yīng)在上下邊界內(nèi)。對邊界外的數(shù)據(jù)進行剔除。
一臺機組上的傳感器有幾十到上百個,數(shù)據(jù)就可能達到上百維。輸入維度過大不僅會導(dǎo)致模型過大,同時還會造成精度下降。因此,必須進行有效的特征選擇。首先,基于經(jīng)驗[11]選取針對具體部件溫度的相關(guān)性較大的若干維度數(shù)據(jù)。假設(shè)要監(jiān)測的部位是主軸后軸承,根據(jù)經(jīng)驗,我們可以大致選出風(fēng)速、功率、環(huán)境溫度、機艙溫度、轉(zhuǎn)速、主軸前軸承溫度這些相關(guān)量。
再利用相關(guān)性分析對上一步選取的經(jīng)驗維度進行進一步的分析,實現(xiàn)進一步降維。相關(guān)性計算采用的是皮爾遜相關(guān)系數(shù)。
圖1中,區(qū)域顏色越藍(lán),表示兩兩相關(guān)性越強。由圖1可知,與主軸后軸承溫度相關(guān)性由強到弱的量分別是前軸承溫度->機艙溫度->環(huán)境溫度->轉(zhuǎn)速->功率->風(fēng)速。顯然,我們應(yīng)首先剔除風(fēng)速這個最不相關(guān)的變量。
圖1 輸入數(shù)據(jù)各維度相關(guān)性Fig.1 Correlation of various dimensions of input data
此外,環(huán)境溫度和機艙溫度存在很強的相關(guān)性,并且,軸承的直接外環(huán)境是機艙,因此,我們可以進一步剔除環(huán)境溫度這一變量。最后,基于實際應(yīng)用場景,我們對前后軸承均需要實施監(jiān)測。因此,前后軸承溫度不宜作為彼此輸入?yún)?shù)。針對主軸后軸承溫度,我們最終使用機艙溫度,功率和轉(zhuǎn)速作為輸入數(shù)據(jù)。
由于各輸入數(shù)據(jù)的數(shù)值范圍差異較大,因此,有必要進行歸一化處理。歸一化能加快收斂速度,在一定程度上能提高模型精度。由于數(shù)據(jù)基本滿足正態(tài)分布,本項目采用的是均值方差歸一化。
圖2 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.2 Schematic diagram of LSTM network structure
長短期記憶(Long Short-Term Memory),簡稱LSTM。是在循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural Network)的基礎(chǔ)上,增加了時間序列上各時刻數(shù)據(jù)的不同權(quán)重。解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)梯度可能會消失的問題。(如圖2)
本文使用多層LSTM,輸入為前文確定的機艙溫度、功率、轉(zhuǎn)速,輸出為主軸后軸承溫度。使用數(shù)據(jù)為貴州遵義某風(fēng)場11#機組歷史運行數(shù)據(jù),選擇2019年全年數(shù)據(jù)作為訓(xùn)練和測試樣本。使用參數(shù)搜索算法,設(shè)定網(wǎng)絡(luò)層數(shù)在2~12層之間,初始學(xué)習(xí)率0.0005~0.01之間,優(yōu)化控制器采用Adam和SGD,隨機生成8組參數(shù)組合。最終發(fā)現(xiàn),在本問題下,最佳網(wǎng)絡(luò)層數(shù)為4層,最佳學(xué)習(xí)率為0.001,優(yōu)化器Adam比SGD更容易收斂。
該機組在7月14日由監(jiān)控系統(tǒng)發(fā)出主軸后軸承高溫報警信號,溫度超過設(shè)定限制50℃。因此,選擇2020年5月至7月16日數(shù)據(jù)作為驗證集。
理論上,在給定工況下,部件溫度應(yīng)該符合某一正態(tài)分布。進而,實際值與預(yù)測值(理論值)的差值(以下簡稱殘差)也應(yīng)符合正態(tài)分布。圖3為訓(xùn)練集上殘差分布直方圖。
由圖3可知,實際殘差基本符合均值為0的某一正態(tài)分布?;谛「怕适录舅枷隱3],通過查概率表可知,殘差落在(μ-3σ,μ+3σ)以外的概率小于千分之三,殘差落在(μ-2σ,μ+2σ)以外的概率小于百分之三。這里,我們只關(guān)心溫升,即實際值超過理論值。因此,將μ+2σ作為初級預(yù)警線,將μ+3σ作為嚴(yán)重警告線。
圖3 訓(xùn)練集上殘差分布直方圖Fig.3 Histogram of residual distribution on the training set
使用訓(xùn)練好的模型預(yù)測理論溫度值,并計算實際值與健康值之間的殘差。繪制殘差曲線,如圖4。
圖4 測試集上殘差隨時間變化曲線Fig.4 The residuals on the test set change with time
從圖中可以明顯看出故障發(fā)展的趨勢。早期殘差基本處在“初級預(yù)警”線下,即實際數(shù)據(jù)和理論健康數(shù)據(jù)很接近。后期逐漸突破“初級預(yù)警線”(黃色),直至突破“嚴(yán)重警告線”(紅色)。同時,可以看到,使用此模型可以讓我們提前兩三個月發(fā)現(xiàn)故障趨勢。(圖中紅色箭頭所指位置為實際故障報警時刻)
基于此方法,我們快速搭建了模型批量訓(xùn)練的平臺。開發(fā)了基于實時數(shù)據(jù)采集、預(yù)警的軟件,并配套開發(fā)了可視化界面。目前已在超過5個風(fēng)場部署運行,界面示如圖5。
圖5 產(chǎn)品應(yīng)用某界面Fig.5 A certain interface of product application
提出了一種基于經(jīng)驗和相關(guān)性分析的特征選擇方法,一種結(jié)合循環(huán)神經(jīng)網(wǎng)絡(luò)和正態(tài)分布的小概率事件思想的故障早期預(yù)測方法。并在此基礎(chǔ)上,對方法進行了實際應(yīng)用。
本項目未針對時間序列的長度對預(yù)測準(zhǔn)確性的影響展開研究。在兼顧高效性能的前提下,尋找這一長度值。
此外,在理論上,訓(xùn)練集為機組健康狀況下運行數(shù)據(jù)。相近環(huán)境中的相同機型應(yīng)可以共用模型。以上兩點值得進一步研究。