王 謙 周圣強(qiáng)
(宿州職業(yè)技術(shù)學(xué)院 安徽宿州 234101)
熱誤差補(bǔ)償?shù)那疤崾悄軌驅(qū)δ骋粶囟葓?chǎng)的機(jī)床熱誤差進(jìn)行準(zhǔn)確地預(yù)測(cè),然后根據(jù)預(yù)測(cè)值進(jìn)行熱誤差補(bǔ)償,這就要求所建立的熱誤差模型要具有較高的準(zhǔn)確性。熱誤差建模是建立起運(yùn)動(dòng)軸熱誤差與各個(gè)熱敏感點(diǎn)溫度值之間的關(guān)系所依托的數(shù)學(xué)模型的過程,因此建模所依托的數(shù)學(xué)理論在熱誤差建模和補(bǔ)償中至關(guān)重要。熱誤差建模依托的數(shù)學(xué)理論常用的有多元線性回歸理論、滯后變量理論、神經(jīng)網(wǎng)絡(luò)理論、支持向量機(jī)理論等。支持向量機(jī)理論是近期發(fā)展起來的一種數(shù)學(xué)分析方法,常用于對(duì)小樣本數(shù)據(jù)的分類和回歸,支持向量回歸算法能夠通過對(duì)小樣本數(shù)據(jù)的學(xué)習(xí)建立決策函數(shù),從而實(shí)現(xiàn)對(duì)未知數(shù)據(jù)的預(yù)測(cè)。文章在已做研究工作(以BV850數(shù)控加工中心為例,為其組建了溫度和熱誤差集成檢測(cè)系統(tǒng),并通過一定的方法篩選出兩個(gè)熱敏感點(diǎn)S1和S6)的基礎(chǔ)上,對(duì)熱誤差建?,F(xiàn)有理論進(jìn)行了大量的閱讀和研究,分析和闡述了運(yùn)用多元線性回歸理論、分布滯后理論和最小二乘支持向量回歸機(jī)理論對(duì)加工中心主軸熱誤差建立預(yù)測(cè)數(shù)學(xué)模型的方法。
多元線性回歸是在進(jìn)行熱誤差建模時(shí)經(jīng)常被國(guó)內(nèi)外學(xué)者使用的一種統(tǒng)計(jì)學(xué)中的傳統(tǒng)方法。它是在掌握大量觀察數(shù)據(jù)的基礎(chǔ)上,用統(tǒng)計(jì)方法尋求多輸入和單輸出之間的函數(shù)關(guān)系,該方法以假設(shè)因變量和自變量成線性關(guān)系為應(yīng)用基礎(chǔ),假定線性回歸成立于因變量和自變量之間,建立回歸函數(shù)表達(dá)式。
以多個(gè)熱敏感點(diǎn)的測(cè)量溫度值為自變量,以加工中心主軸熱誤差為因變量建立模型,便可建立主軸熱誤差的多元線性回歸函數(shù)模型。假設(shè)加工中心篩選出了k個(gè)熱敏感點(diǎn),有n個(gè)測(cè)量值,其通用表達(dá)式為:
式中,yi為熱誤差測(cè)量值,xi1,xi2,…,xik為熱溫度敏感點(diǎn)溫度測(cè)量值,b0,b1,…,bk為回歸系數(shù),ei是與實(shí)際觀察值yi存在的偏差,也稱為殘差。
多元線性回歸模型中的回歸系數(shù)可利用最小二乘法[1]求得,最小二乘法是擬合其系數(shù)的一種常用方法,參數(shù)b0,b1,b2,…,bk的最小二乘估計(jì)為:
式(2)中
通常情況下,在多元線性回歸模型建立后要進(jìn)行擬合精度評(píng)估,通過殘差平方和計(jì)算出模型標(biāo)準(zhǔn)差,可用來評(píng)定全部觀測(cè)值與回歸估計(jì)值的偏離程度,其計(jì)算公式為:
多元線性回歸模型的精準(zhǔn)度在很大程度上會(huì)受到溫度測(cè)量數(shù)據(jù)的影響,因此,該模型在實(shí)驗(yàn)和建模中對(duì)傳感器的質(zhì)量提出了較高的要求。另外,該模型的精準(zhǔn)度還會(huì)受到多重共線性問題的影響,使用這項(xiàng)技術(shù)要面對(duì)的一個(gè)難點(diǎn)就是如何合理選擇建模用溫度變量。
將上述建模理論應(yīng)用于加工中心主軸熱誤差建模,以主軸熱誤差為因變量,以熱敏感點(diǎn)S1和S6的溫度值為自變量建立多元線性函數(shù),就是建立加工中心主軸熱誤差的多元線性回歸模型,其表達(dá)式為:
式(4)中,ΔZi—數(shù)控加工中心主軸軸向熱誤差第i次預(yù)測(cè)值,b0—常數(shù)項(xiàng)系數(shù),通過分析計(jì)算實(shí)驗(yàn)數(shù)據(jù),使用最小二乘法求解式(4)中的b0,b1,b2,可求出最終表達(dá)式。
若在函數(shù)表達(dá)式中因變量不僅會(huì)受到若干解釋變量當(dāng)前值的影響,還會(huì)受到解釋變量若干滯后值的影響,則這種關(guān)系的數(shù)學(xué)模型可以用分布滯后模型來描述。分布滯后模型是在多元線性回歸模型的基礎(chǔ)上發(fā)展而來的,在多元回歸模型的基礎(chǔ)上分布滯后模型的建模自變量新納入了解釋變量的滯后項(xiàng)。由于在數(shù)控機(jī)床熱誤差檢測(cè)實(shí)驗(yàn)中,溫度值的采集在溫度傳感器上通常表現(xiàn)出一定的滯后反應(yīng),考慮到在熱傳導(dǎo)過程中機(jī)床主軸溫度存在的這種時(shí)滯性,在機(jī)床熱誤差建模中采用分布滯后模型,將有助于提高數(shù)控機(jī)床熱誤差建模的精度。
分布滯后模型的通用表達(dá)式為:
式(5)中,Yt—因變量α0—常數(shù),n—最大滯后期u—外生變量個(gè)數(shù),由于在實(shí)驗(yàn)中有較多的數(shù)據(jù)測(cè)量值,可采用簡(jiǎn)單的權(quán)宜估計(jì)法實(shí)現(xiàn)滯后階數(shù)n的確定。取,n=1,2,…,i,對(duì)不同條件下的i采用最小二乘法來進(jìn)行擬合,當(dāng)有一個(gè)滯后變量的系數(shù)改變符號(hào),或滯后變量的回歸系數(shù)開始變得統(tǒng)計(jì)不顯著時(shí),最終的滯后階數(shù)就是i-1。
式(5)中,由于xt與xt-1,xt-2,…,xt-n相關(guān)性很強(qiáng),多重共線性問題有可能會(huì)出現(xiàn)[2],從而導(dǎo)致對(duì)該模型回歸系數(shù)βi的估計(jì)不夠準(zhǔn)確。雖然對(duì)單個(gè)βi的估計(jì)存在一定偏差,但是對(duì)因變量yt構(gòu)成長(zhǎng)期影響的是分布滯后模型βi的和以及xt的變化,因此在整體上并不影響分布滯后模型yt的估計(jì)精度:
實(shí)際應(yīng)用中協(xié)方差項(xiàng)通常為負(fù)數(shù),在這些項(xiàng)同時(shí)為負(fù)值且絕對(duì)值很大時(shí),Var)一般小于,因此βi的和有著較高的估計(jì)精度。式(6)中自變量和自變量的滯后項(xiàng)一般成正相關(guān)。
自變量和自變量的滯后項(xiàng)通常成正相關(guān),將上式及上述建模理論應(yīng)用于數(shù)控加工中心主軸熱誤差建模,設(shè)定滯后期為2階,可得數(shù)控加工中心主軸熱誤差分布滯后回歸模型的表達(dá)式為:
式(7)中,ΔZi—加工中心第i次主軸軸向熱誤差的預(yù)測(cè)值,b0—常數(shù)項(xiàng)系數(shù),通過分析計(jì)算實(shí)驗(yàn)數(shù)據(jù),使用最小二乘法求解式(7)中的b0,b1,…b6,可求出最終表達(dá)式。
傳統(tǒng)的統(tǒng)計(jì)理論是已知樣本的分布形式,通過對(duì)大量數(shù)據(jù)的運(yùn)算分析,確定相應(yīng)參數(shù),以實(shí)現(xiàn)統(tǒng)計(jì)建模。支持向量回歸機(jī)是一種新興的基于數(shù)據(jù)的機(jī)器學(xué)習(xí)方法,能夠在數(shù)據(jù)分布未知的情況下通過對(duì)少量樣本的分析學(xué)習(xí)實(shí)現(xiàn)對(duì)未知數(shù)據(jù)的預(yù)測(cè)。
統(tǒng)計(jì)學(xué)家Vapnik建立了一種專門分析機(jī)器學(xué)習(xí)在小樣本情況下的規(guī)律的理論,即統(tǒng)計(jì)學(xué)習(xí)理論,支持向量機(jī)就是在此理論基礎(chǔ)上發(fā)展形成的一種新的機(jī)器學(xué)習(xí)算法。支持向量機(jī)能夠根據(jù)有限的樣本信息通過最小化結(jié)構(gòu)風(fēng)險(xiǎn)原理來進(jìn)行機(jī)器學(xué)習(xí),提高泛化能力,在解決小樣本、高維數(shù)、非線性等復(fù)雜問題上有特有的優(yōu)勢(shì),在解決模式識(shí)別、函數(shù)擬合等機(jī)器學(xué)習(xí)問題上表現(xiàn)出了優(yōu)秀的性能[3]。將支持向量回歸機(jī)模型用于數(shù)控機(jī)床的熱誤差建模,不光能提高模型的精度和泛化能力,還能減小模型對(duì)數(shù)據(jù)量的需求,節(jié)約實(shí)驗(yàn)成本。
最小二乘支持向量機(jī)是支持向量機(jī)的一種擴(kuò)展,該方法將損失函數(shù)替換為最小二乘線性系統(tǒng),用等式約束替換不等式約束,從而可以用線性運(yùn)算的方法進(jìn)行運(yùn)算,經(jīng)由這個(gè)適當(dāng)?shù)奶幚?,該模型的?jì)算復(fù)雜度得到大大降低,求解速度得到顯著加快。
回歸分析就是對(duì)測(cè)量數(shù)據(jù)進(jìn)行函數(shù)估計(jì),它的最終目的是通過對(duì)已知數(shù)據(jù)的計(jì)算分析尋求能夠反映輸入輸出關(guān)系的函數(shù)關(guān)系
設(shè)訓(xùn)練樣本集D=k=1,2,…,}N,xk∈Rn,yk∈R,yk為輸出數(shù)據(jù),xk為輸入數(shù)據(jù)。原始空間(權(quán)ω空間)里的函數(shù)估計(jì)問題能夠轉(zhuǎn)化為求解下式:
約束條件為:yk=ωTφ(xk)+b+ek,k=1,2,…,N。
式中,φ(xk):Rn→Rnh為核空間映射函數(shù),ω∈Rnk為權(quán)矢量,ek∈R為誤差變量,γ為可調(diào)函數(shù),b為偏差量,SSE誤差和規(guī)則化量之和為損失函數(shù)J。
為解決原始空間中線性不可分的問題,可以引入核空間映射函數(shù),核空間映射函數(shù)可以通過在原始空間里抽取特征,完成從原始空間里的樣本到高維特征空間里的向量的映射。根據(jù)式(8),拉格朗日函數(shù)可定義為:
L(ω,b,e;a)=
式(9)中,ak∈R為拉格朗日乘子。
優(yōu)化上式,讓L對(duì)ω,b,ek,ak求偏導(dǎo)數(shù)并令其為0,消去變量ω,e,可得矩陣方程:
根據(jù)Mercer條件,存在核函數(shù)Ψ(xk,xl)和映射函數(shù)φ,使得:
則最小二乘支持向量機(jī)的函數(shù)估計(jì)為:
通過式(12)可求解出a,b,滿足Mercer條件的任意對(duì)稱函數(shù)均可選作核函數(shù)Ψ(xk,xl),可采用線性核、多項(xiàng)式核、RBF核等。
對(duì)于非線性映射的特征空間,其內(nèi)積計(jì)算量是驚人的,而通過核函數(shù)的轉(zhuǎn)換能巧妙地解決這個(gè)問題,只要找到滿足條件的核函數(shù),就能把輸入空間中線性不可分問題映射到一個(gè)特征空間而成為線性可分的問題,從而使非線性問題得到簡(jiǎn)化[4,5]。要進(jìn)行加工中心主軸熱誤差非線性支持向量回歸機(jī)的建模,必須選擇最佳核函數(shù)將加工中心溫度測(cè)量值序列映射到高維特征空間,然后對(duì)決策函數(shù)進(jìn)行求解。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)和高斯徑向基(RBF)核函數(shù)等,其表達(dá)式如下所示:
(1)線性核函數(shù):
(2)多項(xiàng)式核函數(shù):
表示一個(gè)d階多項(xiàng)式核
(3)RBF核函數(shù):
式(15)中,σ為核函數(shù)的寬度,將1/σ2記為參數(shù)敏感系數(shù)g。在核函數(shù)中,一般選擇RBF核,RBF核用于建模具有訓(xùn)練速度快、精度高等優(yōu)點(diǎn)。文章也優(yōu)先選擇RBF核用于熱誤差建模,訓(xùn)練結(jié)果的預(yù)測(cè)精度和穩(wěn)健性取決于參數(shù)敏感系數(shù)g和懲罰系數(shù)的取值。
(1)多元線性回歸模型具有建??旖荨⒂?jì)算方便、結(jié)構(gòu)簡(jiǎn)單等特點(diǎn),基本上能夠滿足普通數(shù)控機(jī)床熱誤差補(bǔ)償精度的要求。但是采用多元線性回歸模型進(jìn)行建模,在建模樣本不是很充分的情況下,多重共線性的問題有可能會(huì)出現(xiàn),導(dǎo)致計(jì)算結(jié)果不穩(wěn)定,得到的結(jié)果跟理想值相差較大。
(2)由于加工中心結(jié)構(gòu)的影響,溫度傳感器對(duì)溫度的測(cè)量具有滯后的效應(yīng)。分布滯后模型將自變量、自變量的滯后項(xiàng)均納入建模,體現(xiàn)了溫度傳感器對(duì)溫度采集的滯后現(xiàn)象,使擬合精度得到了一點(diǎn)提升,但分布滯后模型沒有將因變量的滯后項(xiàng)也納入建模,而因變量的滯后項(xiàng)才能對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測(cè),所以分布滯后模型的精度不高。
(3)支持向量機(jī)可以通過對(duì)小樣本數(shù)據(jù)的學(xué)習(xí)達(dá)到預(yù)測(cè)未來數(shù)據(jù)的目的,它具有非線性映射理論基礎(chǔ),利用核函數(shù)代替高維非線性映射,在解決非線性問題上表現(xiàn)優(yōu)秀。在支持向量機(jī)的基礎(chǔ)上進(jìn)行擴(kuò)展形成最小二乘支持向量機(jī),它通過適當(dāng)?shù)淖儞Q大大簡(jiǎn)化了支持向量機(jī)的計(jì)算復(fù)雜度,降低了計(jì)算成本。在數(shù)控機(jī)床的熱誤差建模中采用最小二乘支持向量回歸機(jī),不光能保證良好的建模精度和泛化能力,還能減小模型對(duì)數(shù)據(jù)量的需求,節(jié)約實(shí)驗(yàn)成本。