張杜瑋 王偉 劉光俊
(中車青島四方機(jī)車車輛股份有限公司 山東省青島市 266111)
由于列車高速運(yùn)行,為保證安全性及經(jīng)濟(jì)型車內(nèi)封閉性較好,但空氣流通卻是一個(gè)大問題。因此,空調(diào)系統(tǒng)則承擔(dān)這一重要任務(wù),它既能保證車內(nèi)盡快的空氣流通,又可以乘客保證乘客乘車的舒適性。隨著出行人員對乘車體驗(yàn)越來越重視,保證空調(diào)系統(tǒng)的正常運(yùn)轉(zhuǎn)為乘客提供一個(gè)舒適的乘車體驗(yàn)至關(guān)重要。
通過對空調(diào)相關(guān)數(shù)據(jù)進(jìn)行綜合分析,分析空調(diào)運(yùn)轉(zhuǎn)與哪些參數(shù)密切相關(guān),找到空調(diào)故障時(shí)變化最明顯的參數(shù),根據(jù)參數(shù)變化建立空調(diào)故障預(yù)判模型,進(jìn)行空調(diào)故障預(yù)判。在工業(yè)上,有許多學(xué)者將聚類算法用于離群點(diǎn)檢測[1],以發(fā)現(xiàn)工業(yè)控制系統(tǒng)中的異常數(shù)據(jù),極大地提高工業(yè)控制系統(tǒng)的安全防護(hù)能力。
可以通過聚類發(fā)現(xiàn)空調(diào)數(shù)據(jù)內(nèi)在的模式或者空調(diào)故障類的特點(diǎn),首先對空調(diào)數(shù)據(jù)進(jìn)行聚類,分析各類的聚類中心找出異常類別,與業(yè)務(wù)部門確認(rèn)該類是否是真正異常。如果該類確實(shí)異常,則將故障類進(jìn)行標(biāo)記,然后用分類算法進(jìn)行分類,建立空調(diào)故障的模型。空調(diào)故障模型建立的流程圖如圖1所示。
3.1.1 訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)選取
訓(xùn)練數(shù)據(jù):2017-10-01 到2017-10-07 空調(diào)全量數(shù)據(jù),共20 列車608355 條記錄。
測試數(shù)據(jù):2017-10-08 到2017-10-13 空調(diào)全量數(shù)據(jù),共748058 條記錄。
3.2.1 聚類分析
通過肘部法則可以確定聚類的最佳個(gè)數(shù)[2]??照{(diào)數(shù)據(jù)對應(yīng)的聚類模型平均畸變程度隨聚類個(gè)數(shù) 的變化趨勢圖如圖2所示。
從圖中可以看出k 值從5 到6 時(shí),平均畸變程度變化最大。超過6 以后,平均畸變程度變化顯著降低,因此肘部就是k=6。因此最終選擇的模型為k=6 對應(yīng)的聚類模型。
K=6 時(shí)聚類中心點(diǎn)如表1所示。
其中,類別5,制冷系統(tǒng)2 低壓壓力中心點(diǎn)為15.18,相比其他類別聚類中心點(diǎn)在[-1,1]之間明顯存在異常,這說明類別5 里面可能存在異常數(shù)據(jù)。因此,為進(jìn)一步確認(rèn),查詢原始數(shù)據(jù)如表2所示。
從表2中開始看出,該類數(shù)據(jù)都為CR400AF2004 列車04 車廂的數(shù)據(jù),空調(diào)控制方式都為集控,制冷系統(tǒng)1 低壓壓力都為4080,溫度檢測值與目標(biāo)溫度值的差值范圍為-6℃~2℃,與業(yè)務(wù)專家確認(rèn)制冷系統(tǒng)1 低壓壓力數(shù)據(jù)確實(shí)存在異常,實(shí)際為壓力傳感器發(fā)生故障。
圖1:空調(diào)故障模型建立的流程圖
圖2:肘部法確定最佳K 值
3.2.2 基于異常數(shù)據(jù)標(biāo)簽化的決策樹模型構(gòu)建
通過對空調(diào)特征數(shù)據(jù)的分析,進(jìn)一步進(jìn)行聚類分析,找出異常數(shù)據(jù),并將聚類后得到的異常數(shù)據(jù)標(biāo)記為1,其余類別的數(shù)據(jù)標(biāo)記為0,使用標(biāo)記后的2017-10-01 到2017-10-07 的空調(diào)數(shù)據(jù),利用CART 決策樹算法[3]進(jìn)行模型訓(xùn)練,得到?jīng)Q策樹模型如圖3。
通過決策樹模型可以看出,只要變量X[6]<=2720,就把空調(diào)歸為正常數(shù)據(jù),X[6]代表變量“制冷系統(tǒng)2 低壓壓力”,由此抽象出空調(diào)異常檢測的規(guī)則:制冷系統(tǒng)2低壓壓力 > 2720Kpa,則報(bào)出“空調(diào)壓力異?!?。
表1:各類別聚類中心展示表
表2:部分原始數(shù)據(jù)表
表3:部分空調(diào)故障預(yù)警報(bào)表
圖3:空調(diào)故障預(yù)警決策樹模型
首先利用測試集驗(yàn)證模型效果,最終從748058 條數(shù)據(jù)中檢測出3459 條異常數(shù)據(jù),部分?jǐn)?shù)據(jù)展示如表所示3。
與業(yè)務(wù)部門確認(rèn)該數(shù)據(jù)確實(shí)為異常數(shù)據(jù),為壓力傳感器故障,目前已經(jīng)更換壓力傳感器,2017-10-22~2017-11-13 CR400AF2004列車04 車廂已經(jīng)不再出現(xiàn)該現(xiàn)象。由此說明模型確實(shí)能檢測出異常(壓力傳感器異常),且效果良好。
通過對空調(diào)數(shù)據(jù)挖掘分析,通過聚類算法分離出來異常數(shù)據(jù),并進(jìn)行打標(biāo)簽,用于帶標(biāo)簽的數(shù)據(jù)進(jìn)行決策樹分析,最終得到故障預(yù)警規(guī)則,并實(shí)現(xiàn)對于空調(diào)故障的預(yù)警,是一種可以推廣的空調(diào)故診斷新方法。