胡 迪
(成都錦城學(xué)院 四川 成都 610000)
互聯(lián)網(wǎng)已經(jīng)在物聯(lián)網(wǎng)、無線通信、移動設(shè)備、電子商務(wù)和智能制造等領(lǐng)域收集了海量數(shù)據(jù),這種數(shù)據(jù)的增長速度呈指數(shù)級[1]。這樣的爆炸式增長使得這些領(lǐng)域?qū)τ诖髷?shù)據(jù)的概念和力量產(chǎn)生了認(rèn)識。大數(shù)據(jù)不僅有望為這些領(lǐng)域提供新的思路,以處理和發(fā)現(xiàn)有價值的信息,而且還有可能促進(jìn)這些領(lǐng)域?qū)ζ渌I(lǐng)域的影響,例如工業(yè)控制系統(tǒng)的狀態(tài)監(jiān)測和故障診斷領(lǐng)域[2]。在現(xiàn)代工業(yè)中,機(jī)器變得越來越自動化、精確和高效,使得機(jī)器的健康狀況監(jiān)測變得更加困難。為了全面檢查機(jī)器的健康狀況,需要使用狀態(tài)監(jiān)測系統(tǒng)收集機(jī)器的實(shí)時數(shù)據(jù),并通過多個位移傳感器獲取大量的機(jī)械數(shù)據(jù),由于數(shù)據(jù)的收集速度普遍快于診斷分析數(shù)據(jù)的速度,因此如何從機(jī)械大數(shù)據(jù)中有效地提取特征并準(zhǔn)確識別相應(yīng)的健康狀況已成為當(dāng)前亟須解決的研究問題。智能故障診斷能夠快速有效地處理大量采集到的機(jī)械振動信號并提供準(zhǔn)確的故障診斷結(jié)果,因此它可能成為處理工業(yè)控制系統(tǒng)中大數(shù)據(jù)的一種工具[3]。
傳統(tǒng)的智能故障診斷框架包括3個主要步驟:信號采集、特征提取和選擇以及故障分類[4]。在信號采集步驟中,振動信號被廣泛采用,因?yàn)樗鼈兲峁┝藱C(jī)械故障的內(nèi)在信息。在第2步中,特征提取旨在使用信號處理技術(shù)從采集的信號中提取代表性特征,如時域統(tǒng)計(jì)分析、傅里葉譜分析和小波變換。然而,傳統(tǒng)的人工智能技術(shù)無法直接從原始數(shù)據(jù)中提取和組織判別信息。因此,智能診斷方法中的大量實(shí)際工作都被用于特征提取算法的設(shè)計(jì),以從信號中獲取具有代表性的特征。但是特征通常是根據(jù)特定的診斷問題提取和選擇的,可能不適用于其他問題,在處理新的診斷任務(wù)時可能需要重新設(shè)計(jì)特征提取算法。
為了克服傳統(tǒng)智能故障診斷方法中的弱點(diǎn),需要采用先進(jìn)的人工智能技術(shù)來自適應(yīng)地學(xué)習(xí)特征,而非手動提取和選擇特征。這將使智能故障診斷方法減少對先驗(yàn)知識或人工的依賴,從而可以更快地應(yīng)用于新的場景,實(shí)現(xiàn)真正的人工智能故障診斷。無監(jiān)督特征學(xué)習(xí)是一種有潛力克服傳統(tǒng)方法弱點(diǎn)的技術(shù),它的基本思想是訓(xùn)練人工智能技術(shù)去學(xué)習(xí)一個非線性函數(shù),將原始數(shù)據(jù)從原始空間轉(zhuǎn)換到特征空間[5]。因此,無監(jiān)督特征學(xué)習(xí)是一組算法,研究如何利用未標(biāo)記的原始數(shù)據(jù)很好地訓(xùn)練人工智能技術(shù),從而自動學(xué)習(xí)分類所需的判別特征。受無監(jiān)督特征學(xué)習(xí)思想的啟發(fā),提出了一種新的智能故障診斷框架。該框架直接從原始機(jī)械振動信號中學(xué)習(xí)特征,并使用分類器對整個工業(yè)控制系統(tǒng)故障進(jìn)行分類。該框架的優(yōu)勢在于,特征是使用通用學(xué)習(xí)程序從原始信號中自動學(xué)習(xí)得到,而不是由診斷人員手動提取。
圖1 基于大數(shù)據(jù)分析的工業(yè)控制系統(tǒng)的故障檢測框架
稀疏濾波是一種無監(jiān)督學(xué)習(xí)算法,它可以自適應(yīng)地學(xué)習(xí)輸入數(shù)據(jù)的特征。與傳統(tǒng)的信號濾波算法不同,稀疏濾波不僅可以去除噪聲,還可以提取輸入數(shù)據(jù)中的有用信息,從而獲得更加緊湊、更具代表性的特征。其基本思想是,將輸入數(shù)據(jù)表示為一個稀疏的線性組合形式,其中每個組件(即濾波器)具有高度的稀疏性,即大部分權(quán)重都是零。這些稀疏的濾波器是自適應(yīng)地學(xué)習(xí)的,可以從輸入數(shù)據(jù)中提取出最有代表性的特征。稀疏濾波的實(shí)現(xiàn)使用一種稱為L1正則化的方法來促進(jìn)稀疏性[10-12]。L1正則化是指在目標(biāo)函數(shù)中添加一個L1范數(shù)懲罰項(xiàng),以鼓勵大部分權(quán)重為零。通過這種方式,稀疏濾波可以自適應(yīng)地學(xué)習(xí)濾波器,同時保持高度的稀疏性。
Softmax回歸是一種用于多分類問題的機(jī)器學(xué)習(xí)算法,主要將輸入數(shù)據(jù)分為2個以上的互斥類別,并給出每個類別的概率預(yù)測。它是邏輯回歸的一種推廣,可以將邏輯回歸擴(kuò)展到處理具有多個類別的問題,其目標(biāo)是學(xué)習(xí)一個可以將輸入向量映射到每個可能的類別的概率分布的模型。Softmax回歸首先對每個可能的類別計(jì)算一個得分,然后將這些得分作為輸入,通過一個Softmax函數(shù),將它們轉(zhuǎn)換為概率分布,最終確定輸入向量所屬的類別,并且將每個得分除以所有得分之和,從而確保它們都在0和1之間,并且它們的總和為1。
在第1階段,首先訓(xùn)練稀疏濾波并獲得其權(quán)重矩陣W,然后使用經(jīng)過訓(xùn)練的稀疏過濾來捕獲每個樣本的局部特征,最后對這些局部特征進(jìn)行平均,從而得到每個樣本的學(xué)習(xí)特征。
圖2 稀疏過濾訓(xùn)練過程示意圖
fov(S)=EDET
(1)
其中,E是方差矩陣cov(S)的特征向量的正交矩陣,D是其特征向量的對角矩陣。因此,可以獲得白化的訓(xùn)練片段集SWhite:
(2)
(3)
本方法使用平均的方式而不是直接合并的方式來得到特征:
(4)
平均的方式有助于增強(qiáng)不同片段彼此共享的判別特征并抑制由噪聲引起的隨機(jī)特征。
(5)
其中,θ=[θ1,θ2,…,θK]T為Softmax回歸模型的參數(shù),所有類別標(biāo)簽上的概率總和為l。經(jīng)過訓(xùn)練后,hθ(xi)中最大的概率值對應(yīng)了特征fi最終屬于的故障狀況標(biāo)簽。
在2個學(xué)習(xí)階段之后,使用測試樣本來驗(yàn)證所提出的方法。對于每個測試樣本,首先將其交替劃分為多個片段,然后使用訓(xùn)練好的稀疏過濾模型從片段中獲取局部特征。接下來,通過對這些局部特征進(jìn)行平均來獲得每個測試樣本的學(xué)習(xí)特征。最后,測試樣本的故障狀況由經(jīng)過訓(xùn)練的 Softmax 回歸模型使用學(xué)習(xí)到的特征來決定。
為了驗(yàn)證工業(yè)控制系統(tǒng)故障檢測方法,采用振動信號數(shù)據(jù)集來對工業(yè)控制系統(tǒng)的故障做模擬,對該框架進(jìn)行訓(xùn)練并測試。MFPT是一個常用的用于故障診斷和狀態(tài)監(jiān)測研究的數(shù)據(jù)集。該數(shù)據(jù)集由美國賓夕法尼亞州貝克利大學(xué)的Machinery Failure Prevention Technology(MFPT)中心收集和發(fā)布。MFPT數(shù)據(jù)集的收集過程涵蓋了多個工業(yè)設(shè)備,包括齒輪箱、軸承、齒輪和軸等。為了模擬真實(shí)工業(yè)環(huán)境中的故障情況,這些設(shè)備在不同的工況下運(yùn)行,并引入了多種常見的故障類型,如齒面磨損、軸承松動和齒輪缺陷等。采集數(shù)據(jù)集時,每個設(shè)備都安裝了用于測量振動信號的傳感器,這些傳感器以恒定的采樣頻率記錄振動數(shù)據(jù)。數(shù)據(jù)集中的振動信號以時間域和頻域2種形式提供。時間域數(shù)據(jù)是指原始的時域振動信號,頻域數(shù)據(jù)是通過對時間域信號進(jìn)行傅里葉變換得到的頻譜特征。MFPT數(shù)據(jù)集還提供了故障標(biāo)簽信息,用于指示每個設(shè)備在每個時間點(diǎn)是否存在故障。這些標(biāo)簽信息對于訓(xùn)練和評估機(jī)械故障診斷算法非常重要,可以幫助研究人員建立準(zhǔn)確的故障預(yù)測模型。
用該數(shù)據(jù)集進(jìn)行訓(xùn)練和測試時:
(1)數(shù)據(jù)集準(zhǔn)備:獲取MFPT軸承數(shù)據(jù)集并將其分為訓(xùn)練集和測試集(訓(xùn)練集與測試集比例為8∶2),其中訓(xùn)練集用于訓(xùn)練模型,而測試集用于評估模型的性能。
(2)數(shù)據(jù)預(yù)處理:對原始振動信號進(jìn)行預(yù)處理,包括去除噪聲、歸一化和濾波等。
(3)特征提取:使用稀疏濾波從預(yù)處理的振動信號中提取局部判別特征,將這些局部特征平均為信號的學(xué)習(xí)特征。
(4)模型訓(xùn)練:使用訓(xùn)練集和學(xué)習(xí)特征來訓(xùn)練 Softmax 回歸模型。訓(xùn)練過程中,通過反向傳播算法來更新模型參數(shù)。
(5)模型評估:使用測試集來評估訓(xùn)練好的模型的性能。
在實(shí)驗(yàn)中,使用準(zhǔn)確率、精確率、召回率和F1值4個指標(biāo)進(jìn)行模型評估,如表1所示。可以看出,實(shí)驗(yàn)中大部分測試樣本都被正確分類,準(zhǔn)確率達(dá)到了0.95,表明模型對于故障和非故障樣本的分類效果較好,能夠較準(zhǔn)確地對樣本進(jìn)行分類。精確率和召回率都比較接近,分別為0.94和0.96,表明系統(tǒng)在正確判別故障和非故障樣本方面表現(xiàn)都優(yōu)秀。F1值是精確率和召回率的調(diào)和平均值,綜合考慮了模型的精確率和召回率。F1值為0.95,說明該方法具有良好的綜合故障診斷性能,能夠較好地平衡精確率和召回率之間的關(guān)系。
表1 MFPT數(shù)據(jù)集對模型訓(xùn)練和評估結(jié)果
在工業(yè)控制系統(tǒng)的大數(shù)據(jù)處理中,特征提取是智能故障診斷中的一個重要步驟。為了減少該過程對先驗(yàn)知識和專業(yè)診斷知識的依賴,提出了一種基于無監(jiān)督特征學(xué)習(xí)思想的兩階段學(xué)習(xí)方法。該方法的第1階段使用稀疏濾波器以無監(jiān)督方式自適應(yīng)地學(xué)習(xí)機(jī)械振動信號的代表性特征。在第2階段中,使用了一個雙層網(wǎng)絡(luò)的Softmax回歸器來自動分類機(jī)械的健康狀況。由于所提出的方法使用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特征,因此不依賴先驗(yàn)知識和人工干預(yù),可能更適用于處理海量信號的狀態(tài)監(jiān)測和故障診斷領(lǐng)域。未來,擬將訓(xùn)練好的模型部署到實(shí)際工業(yè)控制系統(tǒng)中進(jìn)行故障診斷,該過程可能需要不斷優(yōu)化和改進(jìn)模型以提高其性能和穩(wěn)定性。