• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    采用核主元成分分析和隨機森林的電梯故障診斷

    2014-08-02 10:32:22李偉賀陳志軍鄭建軍
    化工自動化及儀表 2014年1期
    關鍵詞:決策樹電梯故障診斷

    李偉賀 陳志軍 鄭建軍

    (新疆大學電氣工程學院,烏魯木齊 830047)

    電梯屬于特種設備,其結構復雜、可靠性要求高,國家對其質量和安全提出了嚴格的要求,電梯故障診斷技術成為了電梯行業(yè)技術改造的重心之一。電梯發(fā)生故障時輕則可能會造成財產損失,重則造成人員傷亡,所以電梯的安全問題變得尤為重要。統計表明,電梯事故占重大特種設備事故總數的21%,電梯運行的安全問題已經引起社會大眾的廣泛關注,據對運行了5~10年的電梯進行故障統計,一部電梯平均每年發(fā)生36.5次機械、電氣等一般故障,以及33次沖頂、夾人等對設備和人身安全危害較大的事故[1],電梯的安全問題受到社會的廣泛關注。

    電梯是一種高維、強非線性和強耦合的特殊機電設備,其故障具有突發(fā)性、多樣性、不確定性、并存性及漸進性等特點,難以使用物理和數學模型準確描述故障部位和原因,而且在實際中不可能采集各種電梯的所有特征信號,多年來國內外學者對其故障診斷進行了研究并提出了多種故障診斷算法。Niu G等為了實時、快速診斷電梯曳引機故障,使用了貝葉斯理論決策融合多個智能分類器的診斷結果,有效調高了故障診斷的準確率,在實踐中取得了較好的效果[2]。針對電梯系統復雜、難以建模和具有離散時間動態(tài)系統的典型特征,宗群等采用了隨機自動機的離散事件動態(tài)系統(DEDS)故障診斷方法、BP神經網絡及神經網絡模糊Petri(FFPTN)模型等方法,完成了對電梯門系統的故障診斷[3]。但神經網絡屬于傳統統計學方法中的樣本數目無窮大漸進理論,在實際中對復雜機械設備故障診斷時,需要大量的故障數據,這在實際應用中是很困難的,從而制約了神經網絡在智能故障診斷中的進一步應用與發(fā)展[4]。因電梯制動器失效而引發(fā)電梯傷人事件,針對電梯制動器故障特點,Wang P等將小波包變換和支持向量機相結合應用于電梯制動器故障診斷,有效實現了電梯制動器的狀態(tài)監(jiān)測和故障診斷[5]。SVM(Support Vector Machine)采用結構風險最小化原則,具有很強的泛化能力,克服了神經網絡學習方法中網絡結構難以確定、收斂速度慢、過學習與欠學習以及訓練時需要大量數據樣本等缺點,但其模型參數的選擇影響了模型學習能力和最終診斷準確率[6,7]。

    針對上述問題,筆者利用核主元成分分析在高維空間具有較強的特征選取能力和隨機森林優(yōu)秀的故障辨識能力,通過核主元成分分析法將原始特征樣本映射到高維特征空間提取主元,構造新的特征樣本,再利用隨機森林模型進行電梯急停故障診斷。

    1 核主元成分分析①

    核主成分分析(KPCA)是線性主成分分析(PCA)的非線性擴展算法,采用非線性的方法抽取主成分,即KPCA是通過映射函數Φ:Rm→F把原始向量x映射到高維空間F,在F上進行PCA分析。KPCA不僅適合于解決非線性特征提取問題,而且它還能比PCA提供更多的特征數目和更高的特征質量。

    對于給定的樣本x1,x2,…,xN∈Rm,通過非線性映射函數Φ映射到高維特征空間F,Φ(xi)的協方差矩陣為:

    (1)

    其中C為協方差矩陣,對C進行特征值分解,得到:

    λV=CV

    (2)

    式中λ、V——C的特征值矩陣和特征向量。

    特征向量V∈span{Φ(x1),Φ(x2),…,Φ(xN)},存在a1,…,an,使得:

    (3)

    其中ai為常系數。定義核矩陣K和核函數為:

    (4)

    將式(3)、(4)代入式(1),將求特征向量V轉化為求核矩陣K的特征值和特征向量:

    Nλa=Ka

    (5)

    設ak表示λk對應的特征向量,樣本Φ(x)在F中vk方向的投影為:

    (6)

    2 隨機森林

    2.1 決策樹算法

    決策樹分為分類樹與回歸樹,顧名思義,一個用于分類,一個用于回歸。此處從模式識別的角度闡述決策樹的分類功能。決策樹可以視為一個樹狀預測模型,它是由節(jié)點和有向邊組成的層次結構,如圖1所示。樹中包含3個節(jié)點:根節(jié)點、內部節(jié)點、葉節(jié)點。決策樹只有一個根節(jié)點,是全體訓練集的集合。樹中的每個內部節(jié)點都是一個分裂問題,它將到達該節(jié)點的樣本按某個特定的屬性進行分割,可以將數據集合分割成兩塊或若干塊。每個葉節(jié)點是帶有分裂標簽的數據集合,從決策樹的根節(jié)點到葉節(jié)點的每一條路徑都形成一個類;決策樹的算法很多,例如ID3算法及CART(Classification and Regression Tree)算法等。這些算法均采用自上而下的貪婪算法,每個內部節(jié)點選擇分類效果最好的屬性進行分裂節(jié)點,可以分為兩個或若干個子節(jié)點,繼續(xù)此過程,直到這棵決策樹能夠將全部訓練樣本準確分類,或所有屬性都被用盡為止。

    圖1 決策樹分類原理

    2.2 隨機森林

    隨機森林是Leo Breiman于2001年提出來的,是結合Breimans 的“Bootstrap aggregating”和Ho的“random subspace method”思想建造多個決策樹的分類器。建立隨機森林的基本思想是:通過自助法(bootstrap)重采樣技術,不斷生成訓練樣本和測試樣本,由訓練樣本生成多個分類樹組成隨機森林,測試數據的分類結果按分類樹投票多少形成的分數而定。因此隨機森林具有很高的分類準確率,對異常值和噪聲具有很好的容忍度,且不容易出現過擬合。

    隨機森林作為一種非線性建模工具,目前廣泛運用于數據挖掘、生物信息學(醫(yī)學診斷)及經濟金融等領域。近年來,隨機森林在故障診斷領域也開始嶄露頭角。Yang B S等將隨機森林與遺傳算法相結合應用于電機故障診斷,并將該方法分別與采用SVM、ART-KNN和CART的診斷結果進行對比,結果表明:隨機森林診斷速度更快,精度更高[8]。胡青等將KPCA-RF模型成功運用于變壓器故障診斷,診斷結果表明:隨機森林診斷效果理想,而且抗干擾能力強[9]。

    隨機森林具有以下優(yōu)點:

    a. 只有3個參數,使用默認的參數即可得到很好的效果;

    b. 能夠對特征的的重要性定量判斷,有利于進行特征選擇操作;

    c. 運行速度非常快,避免過擬合問題,分類精度高,穩(wěn)定性好;

    d. 能夠處理部分數據丟失問題;

    e. 隨機森林保留了多值分類的特性,適合處理多值分類問題[10]。

    隨機森林算法實現步驟為:

    a. 采用bootstrap重采樣技術從原始數據集中抽取ntree個訓練集,每個訓練集的大小約為原始數據集的2/3。

    b. 為每一個bootstrap訓練集分別建立CART,共產生ntree棵決策樹構成一片“森林”,這些決策樹均不進行剪枝。在每棵樹生長過程中,并不選擇全部M個屬性中的最優(yōu)屬性作為內部節(jié)點進行分裂,而是從隨機選擇的mtry≤M個屬性中選擇最優(yōu)屬性進行分裂。

    c. 集合ntree棵決策樹的預測結果,采用投票的方式決定新樣本的類別。

    隨機森林在訓練過程中的每次bootstrap抽樣,將有約1/3的數據未被抽中,這部分數據被稱為袋外(out-of-bag)數據。隨機森林利用這部分數據進行內部的誤差估計,產生OOB誤差(out-of-bag error)。Breiman通過實驗證明:OOB誤差是無偏估計,近似于交叉驗證得到的誤差。

    3 基于KPCA-RF模型的電梯急停故障診斷

    利用核主元成分分析方法對特征樣本進行降維處理,消除特征之間的相關性,提取達到需要的累積貢獻率主元特征,再利用隨機森林對提取的主元進行電梯急停故障診斷?;贙PCA-RF模型的電梯急停故障診斷具體步驟為:

    a. 對特征樣本進行歸一化處理,歸一到[0,1]之間,以消除量綱影響,有助于加快診斷模型訓練速度。歸一化公式為:y=(ymax-ymin)·(x-xmin)/(xmax-xmin)+ymin。

    b. 實際采樣時可能引入一定的噪聲,為了檢驗模型的抗干擾能力,對采樣特征樣本加入隨機噪聲。設D1為加入噪聲前的試驗特征樣本矩陣,加入噪聲后的試驗特征樣本矩陣D2(i,j)=D1(i,j)×[1+α×rands(1)],噪聲控制系數α=0.0、0.2、0.5、0.8;rands(1)用于生成-1~1的隨機函數。

    c. 利用公式(1)~(6)進行核主元選取,并確定核主元數量,得到新的特征樣本矩陣D3。

    d. 選擇適當的RF模型參數:樹節(jié)點預選的變量個數mtry和隨機森林中決策樹的個數ntree,使用訓練集訓練RF模型,完成RF模型的建立。

    e. 使用測試集檢驗訓練好的RF模型,并適當調整相關參數。

    f. 使用建立好的KPCA-RF模型進行故障診斷。

    4 實驗結果與對比

    4.1 算例驗證

    筆者采用加州大學的UCI機器學習數據庫Wine數據集(該數據集包含3種不同品質葡萄酒,共178組樣本,每個樣本包含13個特征),來驗證KPCA-RF模型的分類性能。其中特征樣本的降維結果如圖2所示。

    圖2 KPCA進行特征樣本降維結果

    由圖2可知,使用KPCA能夠有效對特征樣本進行降維,其中降維后的前8個主元的累積貢獻率就高達90%,所以取前8個主成分取代初始樣本集,作為隨機森林的輸入。從圖3分類正確率隨KPCA主元個數變化曲線可明顯看出,特征向量的主元個數為8時,達到最優(yōu)的診斷準確率96%。在最優(yōu)主元個數附近,當減小主元個數時,引起信息丟失,從而導致識別率下降;當增大主元個數時,識別率也會下降,因為提取的更多特征中包含冗余的信息,從而導致分類性能的惡化,因此,KPCA有助于消除特征樣本的非線性,提取有效特征樣本,提高分類器分類速度。

    圖3 分類正確率隨KPCA主元個數變化曲線

    由圖4 KPCA-RF模型的預測分類結果可知,在90組測試樣本中,只有兩組未能正確識別,KPCA-RA模型識別準確率高達97.8%。

    圖4 基于KPCA-RF模型的預測分類結果

    4.2 電梯急停故障診斷

    為了驗證KPCA-RF診斷模型的魯棒性、快速性和診斷準確率,將KPCA-RF與BPNN、SVM、LSSVM分別進行電梯急停故障診斷對比實驗研究。

    在以上理論基礎之上,進行實驗驗證。以33個正常樣本和7個故障樣本作為訓練樣本,取另外任意8個作為測試樣本(包括5個正常和3個故障)。其中,特征樣本是以最優(yōu)小波包技術和時域特征提取的9個特征參數,時域特征量為4個(即Z向的峭度、X和Y向的峰峰值,曳引機溫度),頻特征量為5個小波包能量譜,經歸一化處理后作為KPCA-RF模型的輸入量,輸出量為電梯轎廂急停狀態(tài)評估結果。

    評估實驗結果見表1,在運行速度上,KPCA-RF性能與BPNN相當,在評估準確率上,KPCA-RF性能與SVM相當。模型的評估準確率受到噪聲控制系數α影響,當特征樣本數據中不包含噪聲(α=0)或噪聲較小(α=0.2)時,4種模型均能達到很高的評估準確率。當特征樣本數據噪聲較大(α=0.5、0.8)時,4種模型的評估準確率均出現下降,但KPCA-RF模型評估準確率下降幅度不大,顯示出KPCA-RF模型具有更好的魯棒性和更高的穩(wěn)定性。

    表1 故障診斷結果對比

    5 結束語

    采用基于核主元成分分析和隨機森林算法相結合的電梯急停故障診斷的新方法,具有較高的評估準確率。仿真結果表明,在有噪聲干擾的情況下,采用KPCA-RF模型進行電梯急停故障診斷,在抗干擾能力及故障診斷準確率等方面有明顯的優(yōu)勢,在實際工程應用中有很高的應用和參考價值。

    猜你喜歡
    決策樹電梯故障診斷
    一種針對不均衡數據集的SVM決策樹算法
    決策樹和隨機森林方法在管理決策中的應用
    電子制作(2018年16期)2018-09-26 03:27:06
    被困電梯以后
    基于決策樹的出租車乘客出行目的識別
    電梯不吃人
    被困電梯,我不怕
    因果圖定性分析法及其在故障診斷中的應用
    乘電梯
    小說月刊(2015年4期)2015-04-18 13:55:18
    基于肺癌CT的決策樹模型在肺癌診斷中的應用
    基于LCD和排列熵的滾動軸承故障診斷
    舟曲县| 梁平县| 景德镇市| 和林格尔县| 忻城县| 通州市| 玉山县| 白城市| 肥西县| 塘沽区| 泾川县| 汉沽区| 儋州市| 吴忠市| 铜川市| 平远县| 山东| 苍南县| 聂拉木县| 肇东市| 德格县| 龙江县| 安徽省| 祁阳县| 潍坊市| 永昌县| 城市| 县级市| 军事| 拉萨市| 丹寨县| 班戈县| 余庆县| 东乡| 丰城市| 丁青县| 石狮市| 永登县| 濮阳市| 林芝县| 惠州市|