張旭剛 敖秀奕 張 華 江志剛
1.武漢科技大學冶金裝備及控制教育部重點實驗室,武漢,4300812.武漢科技大學機械傳動與制造工程湖北省重點實驗室,武漢,430081
我國制造業(yè)飛速發(fā)展,大量機電產(chǎn)品目前正處在報廢的高峰期,為了節(jié)約資源、減少環(huán)境污染,對退役的機電產(chǎn)品進行回收再利用非常有必要。對于廢舊機電產(chǎn)品中已失效但還有利用價值的零部件,可對其進行再制造修復后重新利用。再制造企業(yè)的主要目的是為了盈利,如果廢舊零部件再制造的成本高于重新再利用后產(chǎn)生的收益或者高于同類原件新品的制造費用,那么就沒有必要對其進行再制造,因此,在進行再制造之前,對廢舊零部件再制造成本進行準確預測尤為關鍵。由于廢舊零部件失效形式不同,失效的程度也各有差異,而失效特征又是影響再制造成本的關鍵因素,因此從失效特征的角度對再制造成本進行分析預測非常重要。
關于再制造成本預測問題,國內外學者進行了廣泛的研究。文獻[1]根據(jù)采購、工藝、材料恢復和營銷四個方面,計算出了再制造的成本效益;文獻[2]在某些假設的前提下通過對汽車引擎回收、拆卸、清潔、庫存管理等方面的分析對再制造成本進行了估算;文獻[3]采用三種策略找到了回收件回收質量與再制造總成本之間的規(guī)律;文獻[4]基于實例推理的方法建立了液壓缸再制造成本估算模型;文獻[5]通過對汽車零部件再制造的例子,提出了一個綜合的再制造成本管理系統(tǒng);文獻[6]在再制造成本與再制造率的基礎上建立了利潤最大化模型;文獻[7]結合射頻識別(radio frequency identification,RFID)技術和RFID標簽成本等因素,建立了廢舊產(chǎn)品回收過程中各個供應者的集中和分散供應鏈模型,有助于節(jié)約再制造回收成本。
以上研究從成本、環(huán)境、資源、技術、工藝等方面對再制造成本展開研究,但未考慮失效特征對廢舊零部件再制造成本的影響。文獻[8]雖然建立了零部件失效類型與再制造成本的二元線性回歸模型,但其所用的函數(shù)方法卻難以表達出再制造成本真實的隨機波動性。最小二乘支持向量機回歸(LS-SVR)模型具有運算速度快、預測精度高的特點,可有效解決該問題[9]。
基于以上分析,本文從廢舊零部件失效特征的角度出發(fā),采用LS-SVR方法對再制造成本預測展開研究,然而實際再制造過程中,廢舊零部件的再制造成本需要經(jīng)過一系列的加工才能得到,其過程較為復雜,獲取大量已完成再制造零件的成本信息代價太大,相對來講大量還未進行再制造的廢舊零部件信息是可以輕易得到的,因此,本文將半監(jiān)督思想引入LS-SVR算法,將少量已完成再制造的廢舊零部件和大量未完成再制造的零部件信息作為實驗樣本,建立基于半監(jiān)督最小二乘支持向量機回歸(semi-supervised learning based on LS-SVR,SLS-SVR)的廢舊零部件再制造成本預測模型。
機電產(chǎn)品在使用過程中,受其材料性能、所處環(huán)境、載荷等因素的影響,即使是同一種零件,其失效特征也各有不同,因此單個零件的具體再制造成本也有差異。在進行預測之前,必須先對各個零件的失效特征進行評估。廢舊零部件再制造成本預測框架如圖1所示。
圖1 廢舊零部件再制造成本預測框架Fig.1 Remanufacturing cost predicting frame
對失效特征進行評估是廢舊零部件成本預測的前提和基礎,分析每個零部件的失效形式和失效程度并對其進行合理的量化和表達是再制造成本預測的第一步。
廢舊機電產(chǎn)品最常見的失效特征有磨損、斷裂和變形三種。據(jù)統(tǒng)計,廢舊機床零部件這三大失效特征造成的失效比例達75%以上。不同的零部件,其各個部位磨損量、裂紋量、變形量也各有不同,這三種失效特征一起構成了影響再制造成本的三大因素。經(jīng)過對退役產(chǎn)品的回收、拆卸、清洗、檢測等一系列工序,可得到每一個廢舊零件各部位磨損量、裂紋量和變形量的具體數(shù)據(jù),但由于這三種失效特征性質不同、單位不同,在進行計算前,必須先對數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)轉化為量綱一的純數(shù)值,使各類數(shù)據(jù)具有可比性。
在實際再制造過程中,廢舊零部件的質量狀況各有差異,傳統(tǒng)對損傷程度的描述過于模糊,難以準確預測廢舊零部件的再制造成本,因此需先將損傷程度進行分區(qū)間量化,再進行歸一化處理,最后利用處理后的數(shù)值對再制造成本進行預測[10]。以軸類零部件為例,表1給出了三種主要失效特征的損傷量區(qū)間及量化方法[11-12],在“min-max標準化”方法的基礎上,利用模糊綜合評價法對各損傷量區(qū)間分別作線性變換,將原數(shù)據(jù)映射到[0,1]區(qū)間。
由表1可知,不同失效程度都有其對應的損傷量區(qū)間。例如某零件磨損量為v,當0 表1 軸類零件主要失效特征量化及歸一化 本文基于廢舊零部件的失效特征建立再制造成本預測模型,分別用xa、xb、xc分別表示廢舊零部件的磨損、裂紋和變形失效特征;不同部位的失效特征具有差異性,如xa={xa1,xa2,xaj,…,xan},表示不同部位不同形式磨損量的歸一化值。令第i個樣本的輸入為xi=(xia,xib,xic),第i個樣本的輸出量yi表示對應零件的實際再制造成本。給定已知再制造成本的樣本集L={(x1,y1),(x2,y2),…,(xm,ym)},其中xi∈Rn,yi∈R(i=1,2,…,m),為了找到失效特征與再制造成本之間的依賴關系,在高維特征空間利用最小二乘支持向量機建立失效特征與再制造成本之間的線性回歸模型[13],可表示為 f(x)=wT·φ(x)+b (1) 式中,f(x)為預測的再制造成本;φ(x)為將輸入空間X(失效特征)的三個非線性屬性參數(shù)(磨損、裂紋、變形)映射到高維特征空間,將原樣本空間的非線性擬合問題轉變?yōu)楦呔S特征空間中線性擬合問題的函數(shù)[14];w為權值向量;b為偏置。 為了求系數(shù)wT和b,根據(jù)結構風險最小化原則,回歸問題可表達為以下約束優(yōu)化問題: (2) ξ=(ξ1,ξ2,…,ξm)T 式中,ξ為對應于已知再制造成本的樣本集L的松弛變量;γ為正則化調節(jié)參數(shù)。 為求上述優(yōu)化問題,構造Lagrange函數(shù),將約束問題轉化為無約束問題: (3) 其中,Lagrange乘數(shù)α∈R。為滿足Karush-Kuhn-Tucker (KKT)條件,對式(3)中w、b、ξ、α求偏導,并令其為0,消元去掉w、ξ,可得到下列線性方程組(矩陣形式): (4) y=(y1,y2,…,ym)T Z=(φ(x1),φ(x2),…,φ(xm)) K(x,xi)=(φ(x))T·φ(xi) 式中,em為包含m個元素的全1列向量;Im為m階單位矩陣;K為滿足Mercer定理的核函數(shù)。 求得線性方程組(式(4))的解α=(α1,α2,…,αm)和b,則再制造成本預測模型為 (5) 若采用標準的有監(jiān)督LS-SVR算法,需要大量已知再制造成本的零部件作為樣本,由于成本獲取代價較大,導致實際的樣本量不能滿足標準LS-SVR的要求,因此考慮將半監(jiān)督思想引入LS-SVR算法中,在只有少量已知再制造成本樣本的前提下,加入大量未知再制造成本的樣本幫助訓練。 半監(jiān)督學習最普遍的一種學習方式是自訓練(self-training),在self-training LS-SVR學習的過程中,首先用少量有標簽樣本訓練出一個初始回歸器,然后回歸器再對無標簽樣本進行標記,最后將置信度最高的無標記樣本加入有標簽樣本集中重新訓練并更新回歸器,以提高LS-SVR的訓練精度[15]。但由于最初的有標簽樣本太少,初始回歸器精度難免偏低,必然會得到相當數(shù)量偏差較大的標簽,如此循環(huán)下去,LS-SVR的精度不增反降?;诖?,引入k最近鄰(k-nearest neighbor,kNN)算法幫助LS-SVR做預篩選,kNN算法先從未進行再制造零件樣本集中選出置信度較高的部分樣本,然后利用LS-SVR對這部分樣本做置信度估算,選出置信度最高的樣本加入已知再制造成本樣本集中,重新訓練LS-SVR,通過多次迭代,逐步提高模型精度。 圖2給出了本次實驗算法的完整流程,輔學習器kNN和主學習器LS-SVR對未知再制造成本的樣本集U進行多層篩選,找出置信度最高的樣本加入已知再制造成本的樣本集L中,通過多次迭代,提高模型的預測精度。初始狀態(tài)下,首先,利用樣本集L分別訓練LS-SVR和kNN,并從樣本集U中隨機選出部分樣本組成樣本集U′;其次,kNN對U′中的樣本進行置信度評估,選出置信度最高的前三個樣本組成樣本集W;然后,LS-SVR對W中的樣本進行置信度評估,選出具有最高置信度的樣本添加到樣本集L中,同時在樣本集U中刪除該樣本。迭代多次后,LS-SVR的學習精度將得到提高[16]。 圖2 廢舊零部件再制造成本預測算法流程Fig.2 Flowchart of remanufacturing cost forecast 具體計算步驟如下。 (1)參數(shù)的初始設定。①確定已完成再制造零件的樣本集L和未進行再制造的樣本集U及迭代次數(shù)T;②確定核函數(shù)的類型及γ和σ2(σ為核函數(shù)寬度參數(shù))的值;③kNN算法中歐氏距離測度dis和k值的設定。 (2)利用已知再制造成本集L分別訓練LS-SVR和kNN得到初始回歸模型G、F,從未進行再制造的零部件集U中隨機選擇u個樣本組成樣本集U′。 (3)利用F預測出U′中每一個樣本的再制造成本yu,其中yu=F(xu),然后通過(xu,yu)訓練kNN,得到新的回歸模型F′。 (4)在已知再制造成本的樣本集L中找到與xu最相近的k個樣本,組成u個臨近樣本集Ωu,然后分別計算Ωu在F、F′上的均方差,并求其差值Δu: (6) 式(6)中,max(Δu)對應的xu即為具有最高置信度的未知再制造成本的樣本,按置信度從大到小依次排序,從中挑選置信度最高的前N(N (5)利用初始回歸模型G預測出W中每一個樣本xj的再制造成本yj,其中yj=G(xj),然后把(xj,yj)加入到已知再制造成本的樣本集L中構成新的已知樣本L′,并用L′訓練LS-SVR得到新的回歸模型G′。 (6)計算樣本集L在G′上的均方誤差Ei: (7) (7)將得到的最優(yōu)樣本(xj,yj)加入L中, 并在未知再制造成本U中刪除xj。 (8)返回步驟(2),循環(huán)訓練T次,輸出其回歸參數(shù)α和b,得到最終的回歸模型。 (9)利用測試樣本判斷回歸模型的精度。 渦輪蝸桿是機床上重要的傳動組件,也是容易失效的組件之一。本文以廢舊普通圓柱蝸桿為研究對象,經(jīng)過對廢舊蝸桿的分析測量,其主要失效形式為磨損、裂紋和變形,具體失效特征見表2。 表2 廢舊渦輪蝸桿的失效特征 經(jīng)歸一化處理后得到了50組數(shù)據(jù),利用這些數(shù)據(jù)進行訓練和測試,其中訓練樣本包含10組已知再制造成本的零部件和35組未知再制造成本的零件,測試樣本為5組已知再制造成本,訓練與測試樣本數(shù)據(jù)見表3~表5。 為了說明SLS-SVR的優(yōu)越性,采用測試樣本的均方誤差(MSE)衡量其回歸估計性能: 表3 訓練樣本數(shù)據(jù)集L 表4 訓練樣本數(shù)據(jù)集U 表5 測試樣本數(shù)據(jù)集C (8) 在MATLAB環(huán)境下,借助LS-SVMLAB工具箱,利用表3~表5的樣本數(shù)據(jù),分別對SLS-SVR和LS-SVR預測方法進行訓練和測試,測試結果見表6。 由表6可知,由于SLS-SVR的預測模型將未知再制造成本的數(shù)據(jù)加入到了訓練中,所以其所得的預測成本與實際成本相差更小,最大誤差僅為4.9%,平均誤差只有2.88%,最小均方差eMSE,min=0.706,預測結果更加理想;LS-SVR預測模型僅采用了已知再制造成本的10個樣本進行訓練,訓練結果相對較差,最大誤差為7.3%,平均誤差為6.26%,最小均方差eMSE,min=2.716。圖3更直觀地反映了兩種預測模型的預測結果與真實值的差距。 表6 預測值與相對誤差 圖3 再制造成本預測結果與實際結果對比圖Fig.3 Comparison of remanufacturing cost between forecast results and actual results 經(jīng)過訓練和測試,SLS-SVR的預測模型精度更高,將廢舊零部件的失效特征輸入該模型,即可準確地預測出該零部件的再制造成本。 本文在分析零部件失效特征的基礎上,針對再制造樣本數(shù)量少的問題,結合半監(jiān)督學習與最小二乘支持向量機,并采用kNN作為輔學習器建立了基于失效特征的廢舊零部件再制造成本預測模型。案例分析表明,該模型不僅解決了樣本量少的問題,而且具有運算速度快,預測精度高的特點,可為再制造企業(yè)快速判斷廢舊零部件的再制造成本和再制造性提供理論依據(jù)。 失效特征只是影響再制造成本的一個方面,影響廢舊零部件再制造成本的因素還有很多,如再制造工藝、剩余壽命、資源環(huán)境影響等方面。未來將研究失效特征與再制造工藝、剩余壽命及資源環(huán)境影響相融合的再制造成本預測方法。1.3 考慮失效特征的再制造成本預測模型
1.4 算法流程及步驟
2 案例分析
2.1 參數(shù)選擇
2.2 預測結果分析
3 結語