• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Apriori算法和卷積神經(jīng)網(wǎng)絡(luò)的風(fēng)電機組故障診斷模型

      2022-10-25 01:31:50張李煒李孝忠
      天津科技大學(xué)學(xué)報 2022年5期
      關(guān)鍵詞:項集故障診斷卷積

      張李煒,李孝忠

      (天津科技大學(xué)人工智能學(xué)院,天津 300457)

      近些年,隨著新能源的熱度越來越高,世界各國都在積極發(fā)展綠色能源.風(fēng)能作為規(guī)模較為成熟、產(chǎn)業(yè)鏈較為完善的綠色能源,具有能源儲量大、開發(fā)成本相對較低的優(yōu)勢,因此全球風(fēng)電機組的裝機容量逐年增加.但是,由于工作環(huán)境惡劣、工況多變的原因,風(fēng)電機組在運行中后期故障頻發(fā),維護成本也不斷增加,所以做好風(fēng)電機組的故障診斷工作可以有效降低運營和維護的成本,提高機組運行效率[1-2].

      目前,風(fēng)電機組故障診斷的方法主要為基于解析模型與基于數(shù)據(jù)驅(qū)動的故障診斷方法[3].基于解析模型的故障診斷方法是早期的研究方向,由于早期傳感器還不夠成熟,不能獲取機組的準(zhǔn)確狀態(tài),只能通過研究機組本身的物理模型來進行故障診斷.隨著大數(shù)據(jù)、人工智能等新興信息技術(shù)的發(fā)展,大量學(xué)者開始將重心轉(zhuǎn)移到基于數(shù)據(jù)驅(qū)動的故障診斷研究中.金曉航等[4]通過使用稀疏自編碼神經(jīng)網(wǎng)絡(luò)對 SCADA(supervisory control and data acquisition)的數(shù)據(jù)進行模型訓(xùn)練與故障預(yù)測,能夠使風(fēng)電機組的異常狀態(tài)在出現(xiàn)初期被發(fā)現(xiàn);但是,判定數(shù)據(jù)出現(xiàn)異常的閾值是人為設(shè)定的,而且根據(jù)經(jīng)驗設(shè)定的閾值也不總是準(zhǔn)確的.任建亭等[5]提出一種基于深度變分自編碼網(wǎng)絡(luò)的風(fēng)電齒輪箱故障預(yù)警方法,通過深度變分自編碼網(wǎng)絡(luò)與SCADA數(shù)據(jù)結(jié)合,在學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)特征的同時挖掘數(shù)據(jù)的分布規(guī)則;但是,輸入到網(wǎng)絡(luò)模型中的SCADA數(shù)據(jù)特征參數(shù)完全依靠人的先驗知識,具有一定的主觀性.Reder等[6]意識到對 SCADA數(shù)據(jù)進行特征選取的重要性,提出一種基于數(shù)據(jù)驅(qū)動的關(guān)聯(lián)天氣條件與風(fēng)電渦輪機故障的學(xué)習(xí)框架,通過Apriori算法挖掘和解釋 SCADA特征參數(shù)與故障之間的相關(guān)性,但是沒有將特征選取結(jié)果結(jié)合故障診斷模型進行診斷.靳志杰等[7]提出一種基于特征選取的XGBoost風(fēng)電機組故障診斷方法,比傳統(tǒng)機器學(xué)習(xí)算法準(zhǔn)確率更高;但是,其特征選取算法時間效率低下,即使只獲取 6個特征參數(shù)的重要指數(shù),也需消耗近 4h.

      本文提出一種基于Apriori算法和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的風(fēng)電機組故障診斷模型.在該模型中,使用 k均值聚類(kmeans)算法對SCADA數(shù)據(jù)進行聚類,將聚類結(jié)果輸入 Apriori算法的關(guān)聯(lián)規(guī)則算法中進行提升度排序,然后進行特征選取并使用模型驗證,最后用卷積神經(jīng)網(wǎng)絡(luò)模型進行故障診斷.使用愛爾蘭某風(fēng)電場真實SCADA數(shù)據(jù)進行實驗,實驗表明本文模型診斷效果比其他兩種神經(jīng)網(wǎng)絡(luò)模型更好.

      1 基于 k-means算法與 Apriori算法的特征選取

      1.1 數(shù)據(jù)預(yù)處理

      SCADA是安裝在大型風(fēng)電機組上的一套用于監(jiān)測風(fēng)電機組運行狀態(tài)的傳感器系統(tǒng).SCADA監(jiān)測的零部件包括發(fā)電機、主軸、齒輪箱、變流器、控制柜等,具體采集的數(shù)據(jù)為 100多個離散特征數(shù)據(jù)(如某子系統(tǒng)或者零部件的狀態(tài)、動作等)或者連續(xù)特征數(shù)據(jù)(如機組發(fā)電功率、轉(zhuǎn)速等).

      第一步工作是將SCADA原始數(shù)據(jù)進行預(yù)處理,主要是將一些不合理數(shù)據(jù)進行剔除,例如在傳輸過程中產(chǎn)生的無效數(shù)據(jù)、在維修或者保養(yǎng)機組過程中產(chǎn)生的異常數(shù)據(jù)等[8].第二步工作是將篩選后的 SCADA數(shù)據(jù)結(jié)合機組狀態(tài)的運行數(shù)據(jù)進行故障狀態(tài)標(biāo)記.

      1.2 特征選取

      SCADA系統(tǒng)采集的數(shù)據(jù)十分豐富,在針對某一故障進行分析時,僅僅依靠專家經(jīng)驗或者簡單的相關(guān)性分析可能會遺漏相關(guān)性較弱的數(shù)據(jù),或者是將冗余數(shù)據(jù)當(dāng)作相關(guān)性數(shù)據(jù),這些都將降低模型的準(zhǔn)確性[9].因此,本文使用k-means算法與Apriori算法相結(jié)合,評估故障的相關(guān)性特征數(shù)據(jù).

      k-means算法是一種迭代求解的無監(jiān)督學(xué)習(xí)算法[10-11],目的是將某一故障所有數(shù)據(jù)的每一個特征進行聚類,然后定義其閾值,最后將特征數(shù)據(jù)全部替換成該特征數(shù)據(jù)所處的類別,以便為下一步 Apriori算法的運用提供合適的輸入數(shù)據(jù).

      Apriori算法是在一個數(shù)據(jù)集中發(fā)現(xiàn)項集之間的有趣關(guān)聯(lián)或者相互聯(lián)系[12].其評價指標(biāo)如下:

      (1)支持度計數(shù):指包含特定項集事務(wù)的個數(shù).在數(shù)學(xué)上,項集 X的支持度計數(shù)可以表示為σ( X ) =| { ti|X ? ti, ti∈ T }|.

      (2)支持度:項集X與項集Y同時發(fā)生的概率稱為X→Y關(guān)聯(lián)規(guī)則的支持度,可表示為s(X → Y ) =σ(X ∪ Y ) /N.

      (3)置信度:如果項集 X發(fā)生,項集 Y也發(fā)生的概率稱為X→Y關(guān)聯(lián)規(guī)則的置信度,可表示為c(X → Y ) =σ( X ∪ Y ) /σN.

      (4)提升度:項集X發(fā)生對項集Y發(fā)生的概率產(chǎn)生多少變化稱為X→Y的提升度,可表示為l(X → Y ) = c (X ∪ Y ) /σ(Y)[13].

      Apriori算法是使用一種逐層搜索的迭代方法,其目標(biāo)是找出支持度大于等于最小支持度并且置信度大于等于最小置信度的所有規(guī)則,其中最小支持度與最小置信度分別對應(yīng)支持度和置信度的閾值.整體算法大致分為兩步:

      (1)頻繁項集的產(chǎn)生:尋找滿足最小支持度的所有項集,把這些項集稱作頻繁項集.

      (2)規(guī)則的產(chǎn)生:從上一步頻繁項集中提取滿足高置信度的規(guī)則,把這些規(guī)則稱作強規(guī)則.

      2 故障診斷模型

      2.1 卷積神經(jīng)網(wǎng)絡(luò)

      卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、隱藏層、全連接層和輸出層組成,其中隱藏層主要是由卷積層、激活層和池化層組成[14].

      2.1.1 卷積層

      卷積層由多個卷積核組成,每個卷積核對輸入數(shù)據(jù)進行掃描,進而提取不同的特征,這步操作即為卷積.卷積運算公式為

      2.1.2 激活層

      激活層是將卷積層的輸出結(jié)果進行非線性映射.卷積完成后,通常會在后面加入偏置,再引入非線性激活函數(shù),這里偏置可表示為 b,激活函數(shù)可表示為g(),然后得到經(jīng)過激活函數(shù)運算的結(jié)果為

      CNN一般選取ReLU函數(shù)作為激活函數(shù).

      2.1.3 池化層

      特征圖經(jīng)過激活函數(shù)后進入池化層,主要操作為池化,是一種降采樣操作.池化層的輸出可表示為

      其中p()表示池化函數(shù).常用的池化操作有最大值池化法和平均值池化法.

      CNN常被用于圖像識別領(lǐng)域,由于圖像是二維數(shù)據(jù),所以使用二維卷積神經(jīng)網(wǎng)絡(luò);而本文處理的數(shù)據(jù)是在時間上有關(guān)聯(lián)的序列數(shù)據(jù),為一維數(shù)據(jù),所以本文使用一維卷積神經(jīng)網(wǎng)絡(luò).一維卷積神經(jīng)網(wǎng)絡(luò)與二維卷積神經(jīng)網(wǎng)絡(luò)類似,都具有 CNN局部連接與權(quán)值共享的特性,局部連接可以減少模型所需的參數(shù),權(quán)值共享則能很好地避免模型過擬合[15].

      2.2 建模流程

      故障診斷模型構(gòu)建流程如圖1所示.

      圖1 故障診斷模型構(gòu)建流程Fig.1 Construction process of fault diagnosis model

      本文基于 Apriori算法和 CNN實現(xiàn)風(fēng)電機組的故障診斷,具體步驟如下:

      (1)數(shù)據(jù)預(yù)處理部分對采集的風(fēng)電機組 SCADA數(shù)據(jù)進行篩選、剔除,減少異常數(shù)據(jù)對后續(xù)實驗的影響.

      (2)將預(yù)處理后的數(shù)據(jù)結(jié)合風(fēng)電機組狀態(tài)的運行數(shù)據(jù)進行狀態(tài)標(biāo)記.

      (3)選定某一故障,將該故障的所有數(shù)據(jù)按特征參數(shù)輸入k-means算法進行聚類,然后將所有特征數(shù)據(jù)替換成聚類后的類別作為輸出結(jié)果.

      (4)將步驟(3)的輸出結(jié)果作為 Apriori算法的輸入,得到每個特征與該故障的相關(guān)度,然后結(jié)合診斷模型的準(zhǔn)確性和消耗時間選擇特征集.

      (5)按照特征集獲取數(shù)據(jù),再將數(shù)據(jù)劃分訓(xùn)練樣本與測試樣本后輸入診斷模型進行訓(xùn)練與測試.

      3 實 驗

      3.1 數(shù)據(jù)集

      實驗所使用的數(shù)據(jù)為愛爾蘭某風(fēng)電場2014年5月1日至2015年4月9日的SCADA數(shù)據(jù),其中包括49028條63個特征的運行數(shù)據(jù)、27398條風(fēng)能轉(zhuǎn)換器(WEC)狀態(tài)數(shù)據(jù)和 1850條遠(yuǎn)程終端單元(RTU)狀態(tài)數(shù)據(jù).WEC對應(yīng)與機組本身直接相關(guān)的狀態(tài)數(shù)據(jù),RTU對應(yīng)機組連接到電網(wǎng)的功率控制數(shù)據(jù).該數(shù)據(jù)集覆蓋了風(fēng)電機組的正常與異常運行狀態(tài).實驗分別對交流器饋電(故障 A)與發(fā)電機勵磁(故障B)兩種故障進行診斷.

      3.2 特征選取

      使用k-means算法對兩種故障的27個初步選取的特征進行聚類,初始的聚類中心從 3個增加到10個,然后使用輪廓系數(shù)評判聚類效果.將 k-means的輸出結(jié)果輸入 Apriori算法:首先進行獨熱編碼;然后尋找頻繁項集,輸出最小支持度大于等于 0.5、最大長度為 2的頻繁項集;最后尋找強規(guī)則,輸出最小置信度大于等于0.7的規(guī)則.提升度反映特征變量與發(fā)生故障之間的相關(guān)性,故障 A和故障 B的提升度見表1和表2.

      表1 故障A的提升度Tab.1 Lift of fault A

      表2 故障B的提升度Tab.2 Lift of fault B

      續(xù)表

      由表1和表2可知:有22個特征與故障A之間是強規(guī)則關(guān)系,但只有19個特征的提升度大于1,所以故障A的特征從這19個特征中選??;同樣,有16個特征與故障B之間是強規(guī)則關(guān)系,但只有13個特征的提升度大于1,所以故障 B的特征從這13個特征中選取.

      3.3 模型驗證

      使用CNN與長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)對上述所選的特征進行驗證.使用準(zhǔn)確率、精準(zhǔn)率、召回率和F1值作為特征選取的評價指標(biāo),結(jié)果如圖2—圖5所示.

      圖5 故障B-LSTM的評價指標(biāo)Fig.5 Evaluation indicator of fault B-LSTM

      由圖2和圖3可知:在CNN與LSTM兩個模型中加入了第 20—第 22個特征后,故障 A在 LSTM模型中的準(zhǔn)確率、精準(zhǔn)率和召回率出現(xiàn)了小幅度降低,而在 CNN模型中的則基本保持不變.這表明第20—第22個特征與故障A相關(guān)度不高.在CNN與LSTM 兩個模型中,各指標(biāo)均在第 16個特征之前呈增長趨勢,在第 16個特征之后趨于平緩,說明第17—第 19個特征帶給模型的作用微乎其微,與其提升度相對應(yīng),第17—第19個特征的提升度只比1高0.01左右,所以故障A選擇第1—第16個特征作為故障診斷模型的輸入?yún)?shù).

      圖2 故障A-CNN的評價指標(biāo)Fig.2 Evaluation indicator of fault A-CNN

      圖3 故障A-LSTM的評價指標(biāo)Fig.3 Evaluation indicator of fault A-LSTM

      由圖4和圖5可知:在CNN與LSTM兩個模型中,故障B在加入了第14—第16個特征之后,準(zhǔn)確率與 F1值均趨于平緩,召回率與精準(zhǔn)率出現(xiàn)小幅度變化,但總體趨于平緩,所以故障B還是按照提升度選取第1—第13個特征作為模型參數(shù).

      圖4 故障B-CNN的評價指標(biāo)Fig.4 Evaluation indicator of fault B-CNN

      3.4 模型診斷

      根據(jù)上述驗證結(jié)果,基于Apriori算法故障A選取第1—第16個特征,故障B選取第1—第13個特征,然后結(jié)合CNN模型進行故障診斷,并與LSTM、多層感知器神經(jīng)網(wǎng)絡(luò)(multilayer perceptron,MLP)和支持向量機(support vector machine,SVM)模型的結(jié)果進行對比,結(jié)果見表3.

      表3 故障診斷結(jié)果Tab.3 Results of fault diagnosis

      在故障 A中,CNN模型的準(zhǔn)確率、精準(zhǔn)率與 F1值均為最高,僅召回率稍低于SVM模型.MLP模型為單一的神經(jīng)網(wǎng)絡(luò)模型,利用線性層對時序數(shù)據(jù)進行信息提取較為困難,所以效果是 4個模型中最差的.SVM 模型是 4個模型中唯一的機器學(xué)習(xí)算法,綜合前 4個指標(biāo)來看,其效果僅次于本文基于Apriori算法的CNN模型,但SVM模型的優(yōu)勢就是不用訓(xùn)練神經(jīng)網(wǎng)絡(luò),所以耗時最短.LSTM 作為循環(huán)神經(jīng)網(wǎng)絡(luò)的代表,在準(zhǔn)確率上差強人意但耗時最長.

      在故障 B中,CNN、LSTM、SVM 模型的準(zhǔn)確率均不低于0.9,其中CNN模型最高,同時精準(zhǔn)率與F1值同樣最高.與其他兩個神經(jīng)網(wǎng)絡(luò)模型相比,CNN模型在耗時上有明顯的優(yōu)勢.

      4 結(jié) 語

      本文提出了一種基于Apriori算法和卷積神經(jīng)網(wǎng)絡(luò)的風(fēng)電機組故障診斷模型,將k-means聚類算法與Apriori算法的關(guān)聯(lián)規(guī)則算法結(jié)合起來進行特征選取,并使用兩種神經(jīng)網(wǎng)絡(luò)模型進行驗證,然后將選取后的特征運用到卷積神經(jīng)網(wǎng)絡(luò)模型中進行故障診斷.最后采取真實風(fēng)電場的 SCADA數(shù)據(jù)進行實驗,并使用另外兩種神經(jīng)網(wǎng)絡(luò)和一種機器學(xué)習(xí)算法進行對比實驗,實驗結(jié)果表明本文方法效果最好,準(zhǔn)確率最高.但是,本文方法的精準(zhǔn)率不高,說明該模型容易將正常運行的狀態(tài)判定為故障狀態(tài),后續(xù)還需進一步提高模型的精準(zhǔn)率.

      猜你喜歡
      項集故障診斷卷積
      基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      基于傅里葉域卷積表示的目標(biāo)跟蹤算法
      因果圖定性分析法及其在故障診斷中的應(yīng)用
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
      基于LCD和排列熵的滾動軸承故障診斷
      基于WPD-HHT的滾動軸承故障診斷
      機械與電子(2014年1期)2014-02-28 02:07:31
      一種頻繁核心項集的快速挖掘算法
      計算機工程(2014年6期)2014-02-28 01:26:12
      高速泵的故障診斷
      河南科技(2014年3期)2014-02-27 14:05:48
      南乐县| 封开县| 咸丰县| 海安县| 宜春市| 诏安县| 塘沽区| 苍梧县| 图片| 潢川县| 沙雅县| 诸暨市| 延津县| 思茅市| 宝清县| 浦江县| 朝阳县| 扎囊县| 盈江县| 施秉县| 府谷县| 高阳县| 南靖县| 宁晋县| 买车| 陆河县| 余姚市| 贡山| 揭西县| 磐安县| 盐津县| 汝州市| 长治县| 盐源县| 清流县| 通渭县| 高青县| 哈密市| 惠安县| 武隆县| 栾城县|