劉佩瑤,臧陽陽,楊 洛,張 晨,楊 揚
(1.清華大學工業(yè)工程系,北京 100084;2.中國航空綜合技術研究所,北京 100028;3.成都飛機工業(yè)(集團)有限責任公司,成都 610091)
數(shù)控銑床切削在智能制造中應用非常廣泛,準確高效的過程監(jiān)控和異常檢測,對于及時發(fā)現(xiàn)異常、保證產(chǎn)品質(zhì)量和提高生產(chǎn)效率具有重要的意義[1]。傳統(tǒng)制造過程的數(shù)據(jù)采集和監(jiān)控主要針對于零件加工完成后的形位公差、幾何尺寸等質(zhì)量數(shù)據(jù)[2-3]或同源傳感器采集到的過程數(shù)據(jù)[4-5]。隨著信息技術的發(fā)展,使得實時收集數(shù)控系統(tǒng)、振動平臺、遙感設備等不同系統(tǒng)產(chǎn)生的多源數(shù)據(jù)流并對其進行監(jiān)控成為可能。如何對多源數(shù)據(jù)進行融合分析,實現(xiàn)制造過程的智能化控制,已成為現(xiàn)代質(zhì)量控制領域的研究熱點之一[6]。
根據(jù)數(shù)據(jù)融合的層次,現(xiàn)有多源數(shù)據(jù)融合的研究可分為數(shù)據(jù)層融合、特征層融合和決策層融合三類。例如,璩晶磊等[7]基于模糊證據(jù)理論的數(shù)據(jù)層融合方法,實現(xiàn)制造過程質(zhì)量數(shù)據(jù)的精確采集和監(jiān)控;LIU等[8]將數(shù)據(jù)層融合與系統(tǒng)退化建模結合,對退化單元的狀態(tài)進行監(jiān)控。當多源傳感器是異質(zhì)時,只能在特征層和決策層進行融合。WANG、梁曉瑩等[9-10]從多源信號分別提取特征并將這些特征融合成單一的特征變量,用于生產(chǎn)過程異常的識別。李浩平等[11]通過多個卷積神經(jīng)網(wǎng)絡輸出的決策層融合,對銑刀狀態(tài)進行準確監(jiān)測。雖然采用以上多源信號融合的方法,在一定程度上可以使異常檢測的精度有所提高,但會導致特征的復雜化和維度增長。大量的冗余信息和相關性將會降低異常檢測的準確性,多源數(shù)據(jù)的有效融合至關重要。
對此,本文針對數(shù)控銑床切削過程,提出一種基于ID3算法的混合特征融合方法。通過對比表明了ID3算法在融合特征方面的優(yōu)勢,并結合實驗分析驗證了該方法的有效性和可行性。
本文提出的基于混合特征融合的過程監(jiān)控算法框架如圖1所示。在數(shù)據(jù)層,首先利用NC代碼觸發(fā)將多源傳感器采集到的信號同步,采用動態(tài)時間規(guī)整(DTW)將時間序列分割成多個樣本;在特征層,根據(jù)不同過程變量的物理意義提取其統(tǒng)計分布特征、時域特征、頻域特征或熵特征,并基于ID3算法的思想對混合特征進行選擇融合;在決策層,將融合得到的特征(HFF)輸入到4個訓練模型中,并對4個輸出進行決策層的融合,實現(xiàn)對多源數(shù)據(jù)的精準異常檢測。
圖1 基于混合特征融合的過程監(jiān)控算法
目前,數(shù)控銑削過程數(shù)據(jù)的采集集中在數(shù)控系統(tǒng)內(nèi)嵌的傳感器以及外置的傳感器兩方面。其中,內(nèi)嵌的數(shù)據(jù)(如主軸電流、主軸轉速等)與NC代碼運行的時間標記一致,外置的數(shù)據(jù)(如振動信號、聲發(fā)射信號等)無時間標記。因此首先要將這些多源信號在時間上對齊[12]。由于外置信號在切削開始時往往會產(chǎn)生顯著的振幅,因此可以將振幅起始點與NC代碼觸發(fā)的時間點對齊,從而實現(xiàn)多源數(shù)據(jù)的配準,該振幅起始點可以通過設置一個稍大于一般環(huán)境噪聲的振幅作為閾值找到。假設對齊后的p維多源時間序列表示為:
X={x(j,t)}j=1,…,p;t∈Tj
(1)
式中,x(j,t)為第j個變量在t時刻記錄的數(shù)據(jù)。對于不同的過程變量j=1,…p,其采樣時間序列Tj={t1,t2,…,tnj}長度可能不同,這取決于測量該變量的傳感器的采樣頻率是否相同。當采樣頻率不同時,可對高采樣頻率的變量進行降采樣或對低采樣頻率的變量進行插值,以此保證不同變量的序列長度一致,便于后續(xù)的序列分割和特征提取。特殊地,當采樣頻率相同時,有n1=n2=…=np=n,此時X∈Rp×n。
圖2 二維時間序列的滑動窗口工作示意圖
(2)
表1 最優(yōu)子序列分割算法
提取多源數(shù)據(jù)的多種特征可以提高異常識別的精度和效率,有利于模型可解釋性和異常診斷。本文選取如表2所示的統(tǒng)計分布特征、時域特征、頻域特征、熵特征共18種混合特征。
表2 多源數(shù)據(jù)18個特征
表中,Φ(f)表示單邊功率譜密度函數(shù),自變量為頻率f,因變量為功率譜Φ。Wm(r)、Bm(r)、Dm(r)表示不同計算方法[14-16]得到的平均相似率,其中m為劃分子序列個數(shù),r表示相似度比較的閾值。
為了提高模型的學習性能與檢測精度,需對上述混合特征進行選擇融合。本文基于ID3算法的思想來選取信息增益最大的特征屬性進行融合,在減少線性相關性較大的特征的同時去除無用的冗余特征,得到最有差異和富有信息的特征[17]。具體步驟如下:
(1)計算樣本集D的信息熵為:
H(D)=-p0log2p0-p1log2p1
(3)
式中,p0和p1分別表示樣本集中正常樣本和異常樣本的比例。H(D)越大,表明樣本的不確定性越大。
(2)若特征屬性Ak(k=1,…,K)被選為分類屬性,則利用k劃分異常數(shù)據(jù)集的條件熵為:
(4)
(3)計算特征屬性Ak的信息增益為:
Gain(Ak)=H(D)-H(D|k)
(5)
(6)
式中,y(i,k)表示第i個子序列的第k個特征,該矩陣中的每一行代表對應子序列的融合特征向量。
為提高模型魯棒性,將Y和對應子序列的異常標簽作為多個二分類器的輸入進行多模型訓練。本文選取邏輯回歸(LR)、支持向量機(SVM)、高斯樸素貝葉斯(GNB)、梯度下降決策樹(GBDT)四個模型對異常進行實時監(jiān)控[18]。決策層融合時,當4個模型中有3個以上輸出異常則觸發(fā)警報。
為評估HFF的異常檢測效果,本文采用誤報率(FAR)和漏報率(FPR)作為兩個評估指標,如式(7)和式(8)所示。其中,F(xiàn)AR代表誤報異常子序列數(shù)量(FN)占所有異常子序列數(shù)量(FN+TN)的比重,F(xiàn)PR代表漏報異常子序列(FP)數(shù)量占所有正常子序列數(shù)量(FP+TP)的比例。
(7)
(8)
模型驗證實驗在某航空單位的一臺龍門銑床上進行,該銑床的額定主軸轉速為2000 r/min,額定功率為18.5 kW,額定電壓為380 V。銑削刀具型號為60R3,刀桿長60 mm,直徑3 mm,被加工的零件為鋁合金材料,是一個長寬高各為200 mm,150 mm和60 mm的空心立方體結構 ,該結構的設計模仿了航空產(chǎn)品中常見的薄壁高剛的空心網(wǎng)格結構,實驗切削參數(shù)如表3所示。
表3 數(shù)控銑床切削參數(shù)
薄壁零件的加工過程中易出現(xiàn)“彈刀”異常。彈刀是指刀具因受力過大而產(chǎn)生幅度相對較大的振動,造成工件過切和損壞刀具等現(xiàn)象。這種異?,F(xiàn)象的及時發(fā)現(xiàn),在一定程度上可以保證加工過程的安全,控制產(chǎn)品質(zhì)量,降低加工成本。為獲得較好的多源數(shù)據(jù)融合效果,實驗采集的數(shù)據(jù)包括兩部分,分別是:①振動信號3種:主軸振動信號PA(m/s2),零件左端振動信號LA(m/s2)以及零件右端振動信號RA(m/s2);②數(shù)控系統(tǒng)數(shù)據(jù)3種:主軸轉速N(r/min),主軸電流I(占用機床的百分比:A/%)和主軸功率P(占用機床的百分比:kW%)。加工過程和數(shù)據(jù)采集系統(tǒng)如圖3所示。
圖3 實驗設計和數(shù)據(jù)采集
同時,實驗還收集了零件內(nèi)表面的圖像數(shù)據(jù)用于判斷彈刀是否發(fā)生。當彈刀發(fā)生時,刀具的劇烈震顫會在零件表面留下明顯的劃痕。圖4表示某零件加工過程中收集得到的6維時間序列和其發(fā)生彈刀的零件內(nèi)表面圖。
(a) 6維時間序列
(b) 發(fā)生彈刀的零件內(nèi)表面
為驗證本文基于混合特征融合的數(shù)控銑床異常檢測的有效性,分別進行了滑動窗口長度對子序列分割的影響、融合特征個數(shù)在不同模型下對異常檢測精度的影響、HFF與其他特征降維方法的異常檢測精度對比3個實驗。算法仿真環(huán)境均為:編程語言為Python,實驗機器配置為32.0 GB內(nèi)存,Core(TM) i9-9900K處理器,Windows操作系統(tǒng)。實驗結果如下:
(1)滑動窗口長度對子序列分割的影響。為比較不同滑動窗口長度對子序列分割的影響,進行了DTW序列相似度的對比分析。由圖5可知,當該曲線的全局最小點對應的窗口長度即為最優(yōu)的窗口長度,計算得到l*=4.71×105。
圖5 不同滑動窗口長度下的DTW歐式距離
根據(jù)該l*,可將所有時間序列分割為128個子序列,即Xi∈Rp×l*,i=1,…,128,根據(jù)彈刀的0/1信息可將其分為63個異常子序列和65個正常子序列。進一步將其分為訓練集(80%)和測試集(20%)。
(2)融合特征個數(shù)對異常檢測精度的影響。對于每個子序列Xi,按照表1對不同的物理量提取其代表性的特征,例如,對于PA、LA、RA,提取其統(tǒng)計分布特征和時域特征;對于N、I、P,提取其頻域特征和熵特征。一共得到3×11+3×7=54個特征。基于ID3算法對這些特征進行逐步選取融合,圖6表示不同特征個數(shù)下不同模型在測試集上的誤報率和漏報率。對于LR、SVM和GBDT來說,當HFF含有11個特征分類效果最好,且GBDT可實現(xiàn)最低誤報率和最低漏報率,分別為FAR=0.035,F(xiàn)PR=0.021。對于GNB來說,其漏報率和誤報率隨著特征個數(shù)的增加而減少,即其分類效果隨著特征個數(shù)的增加而變好,但始終弱于其他3個分類器的最優(yōu)分類結果,其可能原因是高斯分布假設不被滿足。
(a) 誤報率 (b) 漏報率
基于上述分析,采用前11個特征構建HFF,即HFF={Npeak,Iskew,Irms,Pskew,Pkurt,Ppeak,RAvf,Nskew,Pform,PAfc,PAmsf}。這表明Npeak(主軸轉速的峰值特征)時關鍵特征,即它包含的數(shù)據(jù)異常信息量最大,因此在實際銑削過程中,若檢測到彈刀的發(fā)生,可通過及時降低主軸轉速來避免彈刀的持續(xù)發(fā)生,確保工件的質(zhì)量。另外,11個特征中不包含LA(零件左端振動信號),這是由于LA和RA線性相關度高,從而造成該變量及其特征的冗余。
(3)HFF與其他方法的異常檢測精度對比。為進一步探究上述方法構造的HFF用于異常檢測的有效性,將HFF與主成分分析(PCA)、線性判別分析(LDA)兩種特征降維方法進行對比。決策層融合后,3種方法在測試集上的誤報率和漏報率如表4所示。
表4 HFF和LDA、PCA的異常檢測結果對比 (%)
從表4可以看出,HFF的漏報率和誤報率都是最低的,遠遠強于PCA和LDA,表明了基于ID3算法融合得到的混合特征用于異常檢測的優(yōu)越性,這得益于混合特征的可解釋性和融合方法的信息最大化。
針對數(shù)控銑床切削過程的多源數(shù)據(jù)監(jiān)控問題,通過基于ID3算法的混合特征融合提高了異常檢測的精度,得到以下結論:
(1)采用適當?shù)幕瑒哟翱趯r間序列進行分割,有利于異常的完整性和異常檢測的效率;
(2)合適的融合特征個數(shù)可以一定程度上提升分類模型的性能,在本文的實驗中11個特征個數(shù)是最優(yōu)的;
(3)通過對HFF與PCA、LDA的比較,對多個模型的決策融合后, HFF的誤報率和漏報率明顯更小,更適合用于多源特征融合;
(4)本文提出的基于ID3算法的混合特征融合方法能夠準確識別數(shù)控銑床的彈刀異常,并為異常的診斷和處理提供了方向。該算法在其他工業(yè)場景中的應用是未來研究重點。