彭來湖,孫海濤,李建強,胡旭東
(1.浙江理工大學浙江省現(xiàn)代紡織裝備技術(shù)重點實驗室,浙江 杭州 310000;2.浙江理工大學龍港研究院,浙江 溫州 325000;3.浙江大學生物醫(yī)學工程與儀器科學學院,浙江 杭州 310000)
laihup@zstu.edu.cn;2365046290@qq.com;wzcnljq@126.com;xdhu@zstu.edu.cn
印刷生產(chǎn)作為典型的離散型制造行業(yè)[1],逐漸趨于訂單式生產(chǎn)模式。物料需求計劃(Material Requirement Planning,MRP)作為生產(chǎn)過程中重要的物資計劃管理模式[2-3],在物料采購中起著指導作用。但是,生產(chǎn)工序的損耗值主要通過工程經(jīng)驗直接確定,致使物資計劃管理存在隨意性等問題。
目前,國內(nèi)外學者針對MRP在印刷生產(chǎn)應(yīng)用過程中的工序損耗值確定問題的研究較為匱乏,但損耗值預(yù)測方法的研究較多。何丹萍等[4]和吳麗娜等[5]采用神經(jīng)網(wǎng)絡(luò)進行損耗預(yù)測,但主要采用經(jīng)驗公式設(shè)置超參數(shù),致使模型泛化性較差。袁義生等[6]提出一種優(yōu)化支持向量機的預(yù)測方法,但易收斂到局部最優(yōu)。同時,以上研究在進行特征選取時,均由執(zhí)行者根據(jù)工程經(jīng)驗所得,忽略了特征選取對預(yù)測結(jié)果的影響。
本文以預(yù)測精確為判定依據(jù),考慮MRP在印刷生產(chǎn)中的具體應(yīng)用,進行印刷工序損耗值預(yù)測方法研究。首先采用皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient,PCC)量化分析影響因素真實性,其次通過支持向量機回歸算法(Support Vector Regression,SVR)進行模型訓練,最后采用布谷鳥搜索算法(Cuckoo Search,CS)進行超參數(shù)智能尋優(yōu)。
在印刷工序的物料采購中,主要基于物料清單、物料基本信息、訂單與工單情況、申購單與采購單情況等信息,通過分析MRP的實際應(yīng)用過程,得到凈采購和生產(chǎn)需求,實現(xiàn)物料動態(tài)平衡,并生成采購計劃和生產(chǎn)計劃,而在整個MRP的運算過程中,主要分為物料需求和損耗兩個部分。
印刷生產(chǎn)包括構(gòu)思設(shè)計、電雕制版、印前處理、調(diào)色對版、印制小樣及簽樣印刷6 個過程,查看文獻[7]—文獻[9]及進行實際的現(xiàn)場調(diào)研發(fā)現(xiàn),企業(yè)在印刷生產(chǎn)過程中,較大的損耗點主要出現(xiàn)在調(diào)色對版環(huán)節(jié)時對調(diào)色和套印的調(diào)機損耗,而不同工單的色數(shù)要求對應(yīng)了不同的承印物損耗值。目前,一般企業(yè)主要通過設(shè)置上機損耗值和色數(shù)損耗控制該損耗值,但在實際生產(chǎn)過程中,由于采用廢料去套色、打樣等人為控制方法,導致設(shè)置的理論值無法滿足實際需求。
印刷工序中所涉及的物料眾多,本文基于文獻分析,以及后續(xù)搭建模型在印刷工序中的普適性,主要選取承印物損耗作為印刷生產(chǎn)損耗的研究對象;而承印物的損耗與印刷上色過程中承印物正面上色數(shù)、反面上色數(shù)、正反面上色總數(shù)等具有一定聯(lián)系。夏自由[8]提出,批量生產(chǎn)時根據(jù)不同的印刷數(shù)量自定義調(diào)整合理的放數(shù),以減少換墨和換紙操作,可以減少物料損耗。故工單預(yù)產(chǎn)數(shù)量也可以影響印刷過程的損耗數(shù)量。
根據(jù)印刷工序中損耗影響因素與損耗值之間的相關(guān)性,可將損耗預(yù)測問題轉(zhuǎn)化為求解特征值和標簽Bloss之間的回歸問題。為提高損耗預(yù)測結(jié)果的實用性,Bloss可換算成對應(yīng)工單的同規(guī)格印刷件數(shù)值,使得預(yù)測的損耗結(jié)果可以直接累加到工單預(yù)產(chǎn)印刷件數(shù)量上。通過對累加后的印刷件數(shù)量的物料理論需求計算,代替原來的物料理論需求和損耗,得到新的Ball:
損耗預(yù)測整體方案流程圖如圖1所示,利用PCC量化特征值和標簽之間的關(guān)聯(lián)性,采用SVR進行回歸問題求解,采用CS對模型中的超參數(shù)進行最優(yōu)解選取。然后通過優(yōu)化后的SVR模型對數(shù)據(jù)進行訓練,將訓練后的損耗模型對印刷工序損耗進行預(yù)測,輸入特征值,輸出損耗預(yù)測值。
圖1 損耗預(yù)測方案流程圖Fig.1 Flow chart of loss prediction scheme
3.2.1 特征值選取
在損耗預(yù)測模型搭建中,特征值的選取直接影響預(yù)測結(jié)果的準確性,為確定相關(guān)損耗影響因素的真實性,將該問題轉(zhuǎn)化為求解每一個損耗影響因素與損耗值之間相關(guān)性的問題;而PCC作為衡量兩個變量之間關(guān)系密切程度的方法,可用于該問題的求解。通過計算特征值中每一項與之間的相關(guān)系數(shù),當結(jié)果大于等于0.7時,表示該影響因素與損耗值高度相關(guān)。
3.2.2 特征值標準化
不同的損耗因素之間數(shù)值大小相差較大,承印物正面上色數(shù)、反面上色數(shù)、正反面上色總數(shù)較工單預(yù)產(chǎn)數(shù)量在數(shù)值上會存在上百甚至上千倍的差距,易導致在進行模型訓練時,影響損耗值目標結(jié)果,使模型無法學習其他的損耗影響特征。為了消除不同特征值的量綱對最終結(jié)果的影響,對數(shù)據(jù)集中特征值數(shù)據(jù)進行標準化處理,使特征值之間具有可比性。
3.2.3 構(gòu)建SVR損耗預(yù)測模型
支持向量機回歸算法可用于解決回歸問題,是一種常用于數(shù)據(jù)趨勢預(yù)測的數(shù)學模型[10],相比傳統(tǒng)的算法,如正規(guī)方程算法、隨機梯度下降算法、嶺回歸算法等,它具有更好的預(yù)測與擬合的效果,基本的函數(shù)表達式如下:
布谷鳥搜索算法是一種通過模擬某些種屬布谷鳥的寄生育雛,有效求解最優(yōu)化問題的算法。在進行最優(yōu)解搜索過程中,主要采用局部隨機游走和全局探索性隨機游走的平衡組合,由宿主鳥發(fā)現(xiàn)外來鳥蛋的概率Pa控制,在解決局部最優(yōu)問題和提高泛化性方面具有較好的效果。局部隨機游走函數(shù)表示如下:
因此,可將求解模型超參數(shù)的最優(yōu)解問題轉(zhuǎn)換為求解CS中布谷鳥最優(yōu)鳥巢位置的問題,實現(xiàn)對模型的優(yōu)化,優(yōu)化流程圖如圖2所示。
圖2 CS優(yōu)化SVR流程圖Fig.2 SVR flow chart of CS optimization
首先,初始化CS和SVR模型,設(shè)置鳥巢數(shù)量、最大迭代數(shù)量、尋優(yōu)維度、宿主鳥發(fā)現(xiàn)外來鳥蛋的概率Pa和SVR超參數(shù)等參數(shù),采用預(yù)測值與真實值之間的決定系數(shù)作為CS的適應(yīng)度函數(shù),分別計算CS中每個鳥巢對應(yīng)的適應(yīng)度值,并選取其中適應(yīng)度值最接近1的作為最優(yōu)鳥巢位置xbest。
選取溫州某印刷企業(yè)的560 條歷史工單數(shù)據(jù)進行實驗驗證,將數(shù)據(jù)集中承印物正面上色數(shù)、反面上色數(shù)、正反面上色總數(shù)、工單預(yù)產(chǎn)數(shù)量與損耗值通過PCC方法,分別得到對應(yīng)的相關(guān)系數(shù)為0.965、0.714、0.984、0.996。根據(jù)皮爾遜相關(guān)系數(shù)的性質(zhì),可以得出選取的四個影響因素與損耗值存在高度的相關(guān)性,可作為損耗值預(yù)測模型的特征值進行模型的搭建。
對特征值數(shù)據(jù)進行標準化處理后,設(shè)定CS中的鳥巢數(shù)為20 個,最大迭代數(shù)為200 次,Pa為0.25;SVR的懲罰系數(shù)C為[0,200],高斯核系數(shù)γ為[0,50]。輸入訓練集,輸出如圖3所示的迭代次數(shù)與對應(yīng)適應(yīng)度值的曲線圖。
圖3 迭代次數(shù)與對應(yīng)適應(yīng)度值曲線圖Fig.3 Curve of iteration times and corresponding fitness values
通過圖3中的曲線輸出,選取最高點對應(yīng)的懲罰系數(shù)和高斯核系數(shù)作為SVR模型中超參數(shù)的設(shè)置,輸入測試集得到圖4中的預(yù)測結(jié)果。
圖4 優(yōu)化后SVR模型損耗預(yù)測結(jié)果Fig.4 Loss prediction results of optimized SVR model
從圖4中可以看出,印刷工序的損耗值預(yù)測結(jié)果與真實值較為接近。為進一步衡量印刷損耗模型預(yù)測結(jié)果和真實結(jié)果之間的吻合度及模型預(yù)測偏差,選擇決定系數(shù)、平均絕對百分誤差和均方根誤差作為模型的評價目標,通過實驗得到相應(yīng)的結(jié)果分別為0.995、0.005、1.969。
4.3.1 與其他優(yōu)化算法進行對比
為驗證在解決印刷工序損耗值預(yù)測問題中,采用CS方法優(yōu)化SVR的優(yōu)越性,本文選取其他主流的優(yōu)化算法,如遺傳算法(Genetic Algorithm,GA)、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)進行對比分析,通過設(shè)置相同的迭代數(shù)、種群數(shù)量和適應(yīng)度函數(shù)等,得到迭代次數(shù)與對應(yīng)適應(yīng)度值的曲線圖如圖5所示。
圖5 其他優(yōu)化方法的調(diào)參曲線圖Fig.5 Parameter adjustment curve of other optimization methods
從圖5中可以看出,GA和PSO在迭代調(diào)參過程中,隨著迭代次數(shù)的增多,整體曲線呈不斷波動變化,針對多個局部范圍內(nèi)的超參數(shù)設(shè)定,分別存在多個不同的最優(yōu)解,易使優(yōu)化過程陷入局部最優(yōu)的情況,從而導致模型超參數(shù)最優(yōu)解選取有誤。與圖3對比,選用CS具有更好的泛化性和通用性,不易陷入局部收斂,更適用于解決本文所提的損耗預(yù)測問題。
4.3.2 與其他回歸算法對比
為進一步驗證本文采用SVR解決印刷損耗回歸問題的優(yōu)越性,本文與其他主流的機器學習回歸算法,如正規(guī)方程算法、隨機梯度下降算法和嶺回歸算法進行對比分析,得到圖6中的預(yù)測結(jié)果。從圖6可以看出,三種回歸模型相對SVR模型存在較多吻合度低的異常點,部分工單數(shù)據(jù)的損耗值預(yù)測與真實值相差較大,不適用于當下的應(yīng)用環(huán)境。
圖6 其他回歸算法的損耗預(yù)測結(jié)果Fig.6 Loss prediction results of other regression algorithms
4.3.3 與其他特征值選取對比
為驗證本文采用相關(guān)性較高的承印物正面上色數(shù)、反面上色數(shù)、正反面上色總數(shù)、工單預(yù)產(chǎn)數(shù)量四個特征值解決印刷工序損耗預(yù)測問題的優(yōu)越性,根據(jù)四個特征值相關(guān)系數(shù)按照從大到小的順序排序,以表1中選取特征值的分別搭建三個優(yōu)化后的SVR回歸模型。
表1 模型特征值選取Tab.1 Model eigenvalue selection
模型輸出如表2所示的評價指標對比結(jié)果,基于計算結(jié)果得到本文采用模型的決定系數(shù)大于模型1、模型2和模型3,以及平均絕對百分誤差和均方根誤差小于模型1、模型2和模型3的結(jié)果,因此具有更好的吻合度和精確度。實驗驗證了采用本文提出的特征值選取方案解決印刷工序中損耗值預(yù)測問題相比采用1—3 個特征值更具優(yōu)越性。
表2 評價指標對比Tab.2 Comparison of evaluation indicators
本文提出了一種基于PCC和CS優(yōu)化SVR的印刷工序損耗值預(yù)測方法,用于解決MRP在印刷生產(chǎn)應(yīng)用過程中印刷工序損耗值確定的問題,同時該方法量化了特征值選取的過程,兼顧了特征選取對預(yù)測結(jié)果的直接影響。
從實驗數(shù)據(jù)可以看出,本文提出的損耗預(yù)測方法的決定系數(shù)、平均絕對百分誤差和均方根誤差分別為0.995、0.005、1.969,相較其他的優(yōu)化算法、回歸算法和特征值選取方案,具有更好的泛化性和預(yù)測精度。用該方法代替經(jīng)驗值設(shè)定,可以有效地提高物資計劃管理的科學性、精準性和決策效率,為后續(xù)相關(guān)問題的研究提供了解決思路和技術(shù)支持。