余永維 杜柳青 易小波 陳 罡
(1.重慶理工大學機械工程學院, 重慶 400054; 2.重慶高金實業(yè)有限公司, 重慶 401122)
數(shù)控機床運動精度預測能發(fā)現(xiàn)數(shù)控裝備潛在的失效模式,避免突發(fā)性失效,實現(xiàn)數(shù)控機床可靠性增長[1]。至今,國內外學者在誤差建模與補償[2-3]、精度檢測與辨識[4-6]等方面取得了較多研究成果,而對精度隨時間演化規(guī)律的研究較少。粟時平等[7]基于多體系統(tǒng)理論對數(shù)控機床加工精度進行了預測;胡占齊等[8]基于多體運動學原理對超重型數(shù)控機床的維護周期進行了預測;王民等[9]基于斜置錐臺試件對五軸數(shù)控機床的加工精度進行了預測。
數(shù)控機床在使用過程中不斷受到各種作用力的影響,系統(tǒng)內部各要素之間及與外部系統(tǒng)的相互作用具有明顯的非線性特征,數(shù)控機床運動精度演化過程可視為一種具有混沌特征的復雜非線性過程,數(shù)控機床運動精度時間序列展示了精度的動態(tài)演化過程。近年來,深度學習技術在圖像識別、模式識別等領域顯出巨大潛力[10-15]。深度學習方法以數(shù)據驅動、自動地從數(shù)據中提取特征,對于分析非結構化、模式不明多變、跨領域的數(shù)據有顯著優(yōu)勢[16-17]。 此外,與時序相關聯(lián)的無限深度學習網絡在學習新信息的同時能保持歷史信息,即能夠動態(tài)記憶歷史信息,自動提取動態(tài)時間序列的時空特征[18-19]。
本文針對使用條件(使用頻率、加工零件、加工工藝參數(shù)等)基本一致的數(shù)控機床,提出基于時序深度學習網絡的數(shù)控機床運動精度預測模型,采用深度學習方法自動提取精度時間序列的時空特征,對數(shù)控機床的精度衰退進行準確預測,以掌握數(shù)控機床精度保持性和精度狀態(tài)。
數(shù)控機床運動誤差劣化是一個漸變的動態(tài)時間序列,當前的運動精度狀態(tài)與之前歷史狀態(tài)相互關聯(lián)。長短時記憶 (Long short-term memory,LSTM)網絡是一種全互連的循環(huán)式神經網絡(Recurrent neural networks,RNNs),神經元之間存在反饋連接,即具有“時間參數(shù)”,能夠動態(tài)記憶歷史信息,在學習新信息的同時保持歷史信息留存持久化。長短時記憶(LSTM)單元結構如圖1所示。
圖1 基于LSTM的時序深度學習網絡Fig.1 LSTM-based sequential deep learning network
每一個LSTM隱含層含有一個記憶單元,其由輸入門、輸出門、遺忘門和記憶單元組成。LSTM通過以上門控單元來控制歷史信息對當前信息的影響程度,使得網絡模型能夠較長時間保存并傳遞信息。
在當前t時刻,LSTM單元輸入有:t時刻的輸入信號Xt、t-1時刻LSTM單元的輸出ht-1(歷史信號)、t-1時刻記憶單元的狀態(tài)Ct-1(記憶信號);輸出為:t時刻LSTM單元的輸出信號ht、t時刻記憶單元的狀態(tài)Ct。
t時刻,LSTM的輸入門、遺忘門、輸出門、記憶單元的狀態(tài)分別為
it=σ(Wiht-1+Wixt+bi)
(1)
ft=σ(Wfht-1+Wfxt+bf)
(2)
ot=σ(Woht-1+Woxt+bo)
(3)
ct=ftct-1+ittanh(Wcht-1+Wcxt+bc)
(4)
t時刻,LSTM的輸出信號為
ht=ottanh(ct)
(5)
式中,Wi、Wf、Wo、Wc分別為輸入門、遺忘門、輸出門和記憶細胞的權值矩陣;bi、bf、bo、bc分別為各門狀態(tài)的偏置;tanh表示激活函數(shù)。
輸入信號Xt=(x1,x2,…,xt-1,xt,xt+1,…)為數(shù)控機床精度連續(xù)時間序列,將LSTM的反饋結構在時間維度上展開,在每一時刻,LSTM展開為一個深度學習網絡中的一層,隨著時間的不斷運行,網絡的深度可以無限深,即形成基于LSTM單元的時序深度學習網絡,如圖1所示,其計算輸出序列H=(h1,h2,…,ht-1,ht,ht+1,…)。
LSTM無限深度學習網絡本質上是一個動力學系統(tǒng),網絡狀態(tài)隨時間演化是這種網絡的本質屬性,其耦合了“時間參數(shù)”,能完全自動地從海量時序數(shù)據中學習到數(shù)據中蘊含的抽象時空特征。而數(shù)控機床運動精度演化是一個動態(tài)的時間序列,當前狀態(tài)與歷史狀態(tài)相互關聯(lián)。因此,數(shù)控機床運動精度劣化過程與無限深度學習系統(tǒng)特性高度契合,有利于實現(xiàn)運動精度動態(tài)行為演化及預測。
基于LSTM無限深度學習網絡的數(shù)控機床運動精度預測模型如圖2所示,其包括輸入層、隱含層和輸出層。輸入層以運動精度時間序列為自變量,實現(xiàn)數(shù)據標準化、訓練集劃分等;輸出層進行數(shù)據反標準化、計算預測輸出等;機床運動精度預測模型在網絡方向可有多個LSTM隱含層,每個 LSTM隱含層在時間維度方向展開形成時序無限深度學習網絡,自動挖掘運動精度序列時空特征。
圖2 基于LSTM無限深度學習網絡的數(shù)控機床運動精度預測模型Fig.2 Motion precision prediction model of NC machine tools based on LSTM infinite deep learning network
除預測模型的時間窗口長度L′外,還需確定模型的 3個主要參數(shù),即隱含層數(shù)、每個隱含層節(jié)點數(shù)及學習率。隱含層數(shù)即深度學習網絡中LSTM 層的個數(shù),在訓練樣本充足條件下,深度學習模型的非線性擬合能力隨隱含層數(shù)的增加而上升,但深度學習模型的復雜程度及訓練時間及計算量也將隨之增加。本文采用多層網格搜索方法確定隱含層數(shù)、每個隱含層節(jié)點數(shù)以及學習率等參數(shù)。
預測模型的時間窗口長度L′為LSTM在時間維度上形成深度學習網絡時的展開步數(shù),也即用于運動精度預測的精度時間序列長度。過短的歷史序列長度會引起預測經驗知識的缺失,影響模型預測準確性;過長的歷史序列長度又會加大模型訓練及優(yōu)化難度,也影響模型預測準確性。
根據Takens嵌入定理,如果重構的運動精度時間序列嵌入相空間滿足L>2d+1(L為嵌入維數(shù),d為吸引子分維數(shù)),則其與原精度系統(tǒng)的相空間軌跡具有相同的幾何特性[20]。此嵌入維數(shù)即是預測模型的最優(yōu)時間窗口長度L′。基于相空間重構原理,采用虛假最近鄰點法計算最小嵌入維數(shù)L,即為最優(yōu)時間窗口長度L′,基本思想是:當重構相空間維數(shù)從L增加到L+1,如相空間沒有虛假的最近鄰點,則認為幾何結構被完全打開。
設XL是Xi的最近鄰點,兩點之間的距離為
(6)
式中τ——延遲時間
當維數(shù)增加到L+1時,距離為‖S(L+1)i‖(L+1)。
數(shù)控機床運動精度原始時間序列經Zscore方法標準化后為X=(x1,x2,…,xn),前m個時間樣本點為訓練集Xx=(x1,x2,…,xm),m以后樣本點為測試集Xc=(xm+1,xm+2,…,xn),其中m 如時間窗口分割長度為L′,模型輸入樣本集為X=(X1,X2,…,Xk,…,XL),其中輸入向量Xk=(xk,xk+1,…,xm-L+k+1),則在t時刻,模型輸入向量Xt=(xt-L+1,xt-L,…,xt),對應的LSMT隱藏層輸出為H=(ht-L+1,ht-L,…,ht),預測輸出為yt+1=Wyht+by,Wy、by分別為輸出層權值和偏置。 LSTM網絡采用BPTT(Back propagation through time)算法進行訓練,步驟如下: (1)前向計算。根據式(1)~(5)計算每個LSTM單元的輸入門、遺忘門、輸出門和記憶單元的狀態(tài)及模型輸出ht。 (3)根據相應的誤差項,計算每個權重的梯度,然后更新每個權值。 權值更新算法為 (4)重復步驟(1)~(3),直到模型預測的均方根誤差收斂為止。 均方根誤差RMSE收斂判別式為 式中v——訓練次數(shù) λ——極小閾值,一般設為小于0.01 兩軸插補的圓運動精度能全面地反映數(shù)控機床運動精度演化狀態(tài),采用描述數(shù)控機床圓運動精度的圓度誤差來驗證與優(yōu)化基于無限深度學習網絡的運動精度預測方法。 以某企業(yè)大型數(shù)控龍門加工中心為對象,該機床主要加工大型船舶發(fā)動機缸體,為評估機床精度狀態(tài),需定期對機床作運動精度檢測分析以評估機床精度狀態(tài),測試時機床作半徑為200 mm、進給速度為1 000 mm/min的兩軸插補圓運動,用Renishaw QC20型球桿儀在線測量機床的圓度誤差。以其近5年定期測試獲得的245個圓運動誤差為實驗樣本,將各時間點的圓度誤差前后相減,標準化后得到該龍門加工中心245個圓度誤差增量時間序列X=(x1,x2,…,x245)。以前230個數(shù)據Xx=(x1,x2,…,x230)為訓練樣本,后15個數(shù)據為測試樣本。 對圓度誤差增量時間序列,用虛假最近鄰點法求得最小嵌入維數(shù)L=8,此即預測模型的時間窗口分割長度。因此,模型輸入樣本集為X=(X1,X2,…,Xk,…,X8),Xk=(xk,xk+1,…,xk+223),則在t時刻,模型輸入Xt=(xt-7,xt-6,…,xt)。 采用多層網格搜索并交叉驗證,優(yōu)化隱含層數(shù)、學習率等超參數(shù)。當LSTM隱含層數(shù)為2、每個隱含層節(jié)點數(shù)為16、學習率0.05時,預測模型的訓練集擬合精度達到最高。對預測模型中權重矩陣按均值為0、 方差為1的高斯分布隨機初始化,偏置項均初始化為 0。采用BPTT方法,正向測試新得到的各層權值參數(shù);反向修正預訓練獲得的初始權值;迭代526次時,模型預測的均方根誤差收斂,獲得最優(yōu)預測模型。 用訓練好的LSTM深度學習模型對230時刻點以后的運動精度數(shù)據進行預測,采用5步預測,即模型輸入為X230=(xt-7,xt-6,…,xt)=(x223,x224,…,x230)時,依次迭代預測后5個時刻點的輸出y231至y235,以此類推,預測結果如圖3a所示。該龍門加工中心圓度誤差增量預測值與實際值變化趨勢較一致,預測最大絕對誤差為0.065 μm(圖3b),說明本文方法有較好的預測效果。 圖3 圓度誤差預測結果Fig.3 Prediction results of roundness error 為評價預測模型的準確性,定義預測相對誤差 Er=(t-yt)/t×100% 相對誤差最大為5.05%,結果表明預測結果能夠很好地反映該檢測運動精度變化量的趨勢和規(guī)律,預測精度較高。 用非平穩(wěn)ARIMA時間序列預測法和3層BP神經網絡預測法作對比實驗,部分實驗結果如表1所示。ARIMA方法的最大相對誤差為14.85%,BP神經網絡預測方法為18.17%??梢?,本文方法預測精度明顯優(yōu)于其他兩種方法,說明了本文方法的有效性。 表1 預測相對誤差比較Tab.1 Method comparison % 為進一步驗證本文方法的有效性及適應性,對超高速數(shù)控磨床、數(shù)控車床、數(shù)控銑床等10臺數(shù)控機床作同樣的分析實驗,提取運動精度周期檢測數(shù)據,均得到了比較準確的結果,步長為5時,預測最大相對誤差不大于7.96%,各機床預測最大相對誤差數(shù)據如表2所示。ARIMA方法的最大相對誤差為15.29%,BP神經網絡預測方法為19.90%。 表2 各機床預測最大相對誤差Tab.2 Maximum error of machine tool prediction % 利用時序無限深度學習網絡強大的時空特征自動提取能力,提出了一種基于LSTM無限深度學習網絡的數(shù)控機床運動精度建模與預測方法,實驗證明可以很好地預測數(shù)控機床精度的衰退趨勢,有較高的預測精度和魯棒性,圓度誤差增量預測差相對誤差不大于7.96%,優(yōu)于傳統(tǒng)的ARIMA時序方法和BP網絡預測方法。2.3 深度學習預測模型訓練方法
3 實驗
4 結束語