褚菲,彭闖,賈潤達,陳韜,陸寧云
(1 地下空間智能控制教育部工程研究中心,江蘇徐州221116; 2 中國礦業(yè)大學(xué)信息與控制工程學(xué)院,江蘇徐州221116;3東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽110819; 4 薩里大學(xué)化學(xué)與工藝工程系,英國吉爾福德;5 南京航空航天大學(xué)自動化學(xué)院,江蘇南京210016)
隨著經(jīng)濟的迅猛發(fā)展以及國際產(chǎn)品市場的競爭日趨激烈,產(chǎn)品質(zhì)量的標(biāo)準(zhǔn)與要求也變得越來越高[1-5]。特別是在間歇生產(chǎn)過程中,產(chǎn)品質(zhì)量的穩(wěn)定不僅直接關(guān)乎企業(yè)的經(jīng)濟效益,而且也是實現(xiàn)間歇過程生產(chǎn)優(yōu)化的前提[6-9]。精確的質(zhì)量預(yù)測則是確保間歇過程安全運行、獲得高質(zhì)量產(chǎn)品的必要條件,隨著數(shù)據(jù)技術(shù)的迅速發(fā)展,數(shù)據(jù)驅(qū)動方法[10-16]因其建模速度快、模型精度高、成本效益好等優(yōu)點正成為過程建模的主流,被廣泛地應(yīng)用于間歇過程的產(chǎn)品質(zhì)量預(yù)測[17-18]。數(shù)據(jù)驅(qū)動建模的前提是要擁有充足的過程數(shù)據(jù),這是實現(xiàn)精準(zhǔn)預(yù)測的必要條件[5]。在實際間歇生產(chǎn)過程中,不同的產(chǎn)品規(guī)格應(yīng)采用特定的操作條件甚至設(shè)備進行生產(chǎn),操作狀態(tài)需要頻繁更新,數(shù)據(jù)驅(qū)動模型的性能會降低,此時則需要重新構(gòu)建新過程。但是,新過程由于運行時間相對較短而無法獲得豐富的過程數(shù)據(jù),難以建立準(zhǔn)確可靠的數(shù)據(jù)驅(qū)動模型[19-20]。
大數(shù)據(jù)時代的背景下,在現(xiàn)代間歇工業(yè)過程中有很多使用相同或相似的工藝原理生產(chǎn)相同或相似規(guī)格產(chǎn)品的相似過程[20],這些過程中存在著大量相似的歷史數(shù)據(jù)沒有得到充分利用,造成了資源的浪費。針對上述問題,一些學(xué)者提出了遷移學(xué)習(xí)的概念,遷移學(xué)習(xí)方法因其可以利用相似源域的知識來幫助完成目標(biāo)域的學(xué)習(xí)任務(wù)而越來越受到重視[21-23]。Shen 等[24]為了克服收集長期循環(huán)數(shù)據(jù)的成本高昂這一困難,針對訓(xùn)練數(shù)據(jù)集數(shù)據(jù)少的問題,通過融合轉(zhuǎn)移學(xué)習(xí)和集成學(xué)習(xí),提出了一種基于深度學(xué)習(xí)模型 DCNN-ETL(deep convolutional neural networks with ensemble learning and transfer learning)的容量估計方法,使得復(fù)雜神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程在目標(biāo)任務(wù)中使用相對較小的訓(xùn)練數(shù)據(jù)集即可進行收斂。Shao等[25]開發(fā)了一個用于機械故障診斷和分類的深度遷移學(xué)習(xí)框架,通過使用遷移學(xué)習(xí)來加速深度神經(jīng)網(wǎng)絡(luò)CNN(convolutional neural networks)的訓(xùn)練,結(jié)果證明遷移學(xué)習(xí)能夠明顯提高深度模型的性能。Liu 等[26]利用遷移學(xué)習(xí)開發(fā)了一種領(lǐng)域自適應(yīng)極限學(xué)習(xí)機DAELM (adaptive extreme learning machine),通過利用不同工況下的有用信息,并將其遷移到現(xiàn)有的軟測量系統(tǒng)中,有效提高了模型的預(yù)測范圍和預(yù)測精度。數(shù)據(jù)遷移作為遷移學(xué)習(xí)技術(shù)的一種形式,能夠充分利用舊過程的數(shù)據(jù)和模型,并將有用的數(shù)據(jù)信息遷移到新過程中以輔助其建模和控制。Jaeckle等[27]提出了一種用于數(shù)據(jù)遷移的EPCR(extended principal component regression)方法,該方法通過結(jié)合兩個相似過程的輸出數(shù)據(jù)矩陣來建立PCR(principal component regression)模型,利用相似生產(chǎn)過程已有的數(shù)據(jù)信息進行有效預(yù)測。但是,此方法在遷移時沒有合理利用相似過程的輸入數(shù)據(jù), 而這些輸入數(shù)據(jù)中也很可能存在許多可以輔助新過程建模的有效信息。針對這個方法存在的不足,García 等[28]隨后提出了JYPLS (Joint-Y partial least squares)方法,首先在同一空間建立相似過程的聯(lián)合質(zhì)量指標(biāo),然后利用所有相似過程的數(shù)據(jù)進行建模,而且JYPLS 模型只要求相似過程具有相同的質(zhì)量指標(biāo)構(gòu)成,對于輸入變量矩陣沒有任何限制。
此外,針對JYPLS 方法不適用于非線性較強的間歇過程,Chu 等[5]在該模型上引入核函數(shù),提出了一種改進的過程遷移的JYKPLS (Joint-Y kernel partial least squares)方法,成功地應(yīng)用于非線性新間歇過程的產(chǎn)品質(zhì)量預(yù)測,大大提高了建模效率和產(chǎn)品質(zhì)量的預(yù)測精度。然而,在實際應(yīng)用中進一步發(fā)現(xiàn),雖然JYKPLS 方法可以描述過程數(shù)據(jù)的非線性關(guān)系,但是針對具有多尺度非線性特性的間歇過程,JYKPLS 方法的應(yīng)用效果并不理想,存在局部擬合精度不高,模型參數(shù)匹配困難等問題[29-33],特別是當(dāng)通過遷移學(xué)習(xí)利用相似舊過程的數(shù)據(jù)進行建模時,由于相似過程之間必然存在差異,使得包含兩個相似過程的建模數(shù)據(jù)集在多尺度方面的問題更加嚴(yán)重,嚴(yán)重影響產(chǎn)品質(zhì)量預(yù)測精度的進一步提高。
本文針對過程數(shù)據(jù)不足,且具有強非線性和多尺度特性的間歇過程,將遷移學(xué)習(xí)方法與多尺度核學(xué)習(xí)方法相結(jié)合,提出了一種基于多尺度核JYMKPLS(Joint-Y multi-scale kernel partial least squares)遷移學(xué)習(xí)模型的間歇過程產(chǎn)品質(zhì)量在線預(yù)測方法。本文通過遷移學(xué)習(xí)在解決新間歇過程數(shù)據(jù)不足難以精準(zhǔn)建模的基礎(chǔ)上,旨在解決間歇過程數(shù)據(jù)具有多尺度特性且在過程遷移建模時由于過程數(shù)據(jù)之間的差異性表現(xiàn)得尤為突出的問題。由于單個尺度的核函數(shù)難以對所有樣本進行高效的映射,本文在遷移學(xué)習(xí)的基礎(chǔ)上引入了多尺度核函數(shù)的方法,通過改變核的尺度的大小更好地擬合數(shù)據(jù)變化劇烈和變化平緩的趨勢,充分地反映了數(shù)據(jù)樣本的分布特性,改善了新模型的泛化性,從而實現(xiàn)對產(chǎn)品質(zhì)量的精準(zhǔn)預(yù)測。
核學(xué)習(xí)方法以非線性特征提取的方式,能夠?qū)⒆宰兞客ㄟ^非線性的方式映射到高維空間,并在其中利用線性運算進行特征提取[29-34]。核函數(shù)有很多種類型,每一種核函數(shù)都有不同特性的映射效果,針對具體的樣本空間來選擇不同類型的核函數(shù)一般能夠獲得較為滿意的非線性映射。然而,由于噪聲的存在以及工業(yè)過程日趨復(fù)雜多變,使得過程樣本數(shù)據(jù)分布更加不規(guī)則、不平坦。在這種情況下,單一核函數(shù)的方法具有很大的局限性,過程的所有數(shù)據(jù)樣本難以用一個特定的核函數(shù)對整體進行有效的映射[35]。
近年來有學(xué)者提出了多核學(xué)習(xí)的方法,而多尺度核方法作為其中的一種[29],通過設(shè)置不同的核參數(shù)大小來構(gòu)造多個尺度大小的核函數(shù),能夠?qū)^程不同的局部特征分別進行高效的映射。這種方法具有非常多的尺度選擇性,因此具有很強的靈活性。高斯核函數(shù)作為常用核函數(shù)的一種,不僅能夠多尺度化,而且具有普遍的無限逼近能力,具體形式如下所示:
其中,σ表示核函數(shù)的尺度參數(shù),本文將其多尺度化后如下所示:
其中,σ1<σ2<…<σn,當(dāng)σ 較小時,對變化劇烈的數(shù)據(jù)樣本具有更好的映射效果;當(dāng)σ較大時,對變化平緩的數(shù)據(jù)樣本具有更好的映射效果。由此可構(gòu)造出新的多尺度核函數(shù)如下所示,其中多個尺度采用直接加權(quán)的形式:
其中,k 代表所選核函數(shù)的尺度的數(shù)量,各個尺度核函數(shù)的寬度參數(shù)用σi(i = 1,2,…,k)來表示?;诟咚箯较蚧撕瘮?shù)的多尺度核的學(xué)習(xí)方法主要是通過調(diào)整各個尺度核函數(shù)中的核參數(shù),更好地擬合不均勻數(shù)據(jù)的變化特征,以達到最優(yōu)解。
考慮到在現(xiàn)代工業(yè)生產(chǎn)中,使用相同或相似的工藝原則生產(chǎn)相同或相似規(guī)格的獨立生產(chǎn)過程是普遍存在的。也就是說,對于一個新的目標(biāo)工藝過程,雖然它與舊工藝過程有著不同的設(shè)備、原材料和操作條件,但是過程之間各變量的相關(guān)關(guān)系往往是相接近的,它們共享著相似的內(nèi)在機理,且它們的過程數(shù)據(jù)的協(xié)方差結(jié)構(gòu)具有相似性,從這個意義上說,這兩個過程具有一定的相似性。近年來,遷移學(xué)習(xí)方法因其可以利用相似源域的知識來幫助完成目標(biāo)域的學(xué)習(xí)任務(wù)而越來越受到重視[21-23]。考慮到新過程剛投入運行,過程數(shù)據(jù)不足以建立較為精準(zhǔn)的數(shù)據(jù)驅(qū)動模型,而舊過程已經(jīng)投入運行了很久,擁有充足的過程數(shù)據(jù)但尚未被利用,造成了數(shù)據(jù)資源的閑置與浪費。因此,如果能夠通過遷移學(xué)習(xí)的方法將實際工業(yè)過程中可用的相似過程的數(shù)據(jù)進行整合和利用,依靠這些閑置的數(shù)據(jù)信息來促進新過程的快速高效建模,不僅能夠提高產(chǎn)品質(zhì)量的預(yù)測精度,而且還能提高企業(yè)和社會的經(jīng)濟效益。如圖1所示,在本文中,假定有兩個相似間歇過程:新 過 程B 和 舊 過 程A,XA,XB∈RI×J×K和YA,YB∈RI×J分別為兩個過程的輸入變量矩陣和質(zhì)量指標(biāo)輸出矩陣,J 是過程變量數(shù),K 是采樣時間,I是生產(chǎn)的批次數(shù)量。
圖1 兩個相似過程數(shù)據(jù)Fig.1 Two similar process datasets
JYPLS 方法屬于線性建模范疇,難以對非線性系統(tǒng)固有的特性進行準(zhǔn)確高效的描述。為此,文獻[5]中提出了一種新的JYKPLS 算法,通過在JYPLS算法中引入核學(xué)習(xí)方法建立新過程的遷移學(xué)習(xí)模型,能夠較好地描述新舊間歇過程的非線性特性,提高模型的預(yù)測精度。該方法雖然可以在一定程度上解決非線性問題,但是考慮到工業(yè)過程中存在數(shù)據(jù)分布不均勻的特性,單個尺度的核函數(shù)往往難以準(zhǔn)確擬合所有樣本數(shù)據(jù)的變化趨勢。為此,本文將多尺度核函數(shù)技術(shù)應(yīng)用到JYPLS 算法,提出了一種新的基于多尺度核的JYMKPLS算法,通過改變核函數(shù)的尺度的大小能夠更好地擬合數(shù)據(jù)變化劇烈和變化平緩的趨勢,可以更好地解決復(fù)雜的非線性分析問題,從而進一步提高質(zhì)量預(yù)測的精度,JYMKPLS的模型結(jié)構(gòu)如圖2所示。
用原始空間中定義的核函數(shù)來替代內(nèi)積運算,則可構(gòu)成如下形式的核矩陣:
圖2 JYMKPLS模型結(jié)構(gòu)Fig.2 The structure of JYMKPLS model
本文選用了高斯核進行多尺度化,并采用下式進行核矩陣元素的計算:
其中,多個尺度高斯核函數(shù)的寬度參數(shù)分別用σl(l = 1,2,…,m)表示。尺度個數(shù)m與核函數(shù)模型的復(fù)雜度直接相關(guān),m越多,則構(gòu)造的多尺度核函數(shù)模型越復(fù)雜,學(xué)習(xí)訓(xùn)練的時間也越長,尺度個數(shù)m 過多或過少都不利于使模型獲得良好的泛化性。由于某一寬度的高斯核函數(shù)可以將某一特定分布的樣本有效地向高維特征空間映射,因此輸入空間中訓(xùn)練樣本的特征分布的數(shù)量可以看作尺度個數(shù)的最優(yōu)選擇。目前常用的方法有模糊聚類分析方法,其可以通過劃分原始空間的樣本來確定相對最優(yōu)的尺度個數(shù)。此外,核函數(shù)的合成系數(shù)以及核參數(shù)的大小的尋優(yōu)方法越復(fù)雜,模型復(fù)雜度越高,學(xué)習(xí)訓(xùn)練的時間也越長。針對一些具體問題,對核參數(shù)的選取,合成系數(shù)的設(shè)定,目前還沒有形成一個合理統(tǒng)一的模式[29]。本文在突出多尺度核優(yōu)勢的前提下,為了降低模型復(fù)雜度和學(xué)習(xí)時間,暫且采用直接求和的方式來構(gòu)造核模型的合成系數(shù)[31]。同時,為保證模型精度,利用訓(xùn)練樣本建立JYMKPLS回歸模型,利用優(yōu)化算法對核寬度參數(shù)σl進行尋優(yōu),計算擬合誤差作為評價指標(biāo),選取最優(yōu)精度模型所對應(yīng)的參數(shù)作為最優(yōu)結(jié)果。在此算法中,由于只計算原始低位空間的核函數(shù)就可以得到高維空間的核函數(shù)矩陣KA和KB,因此沒有必要知道非線性映射函數(shù)的顯式表達式Φ(?)。在執(zhí)行JYMKPLS 算法之前,通常需要對這兩個核矩陣進行中心化處理,公式如下:
其中,1I是I×I維的矩陣,其元素都為1,I則表示I×I維度的單位矩陣。
如果從原始空間到高維空間的映射Φ:xi∈RN→Φ(xi)∈H 已知,憑借樣本映射ΦA(chǔ)、ΦB和輸出樣本YA、YB則可以在高維空間中直接使用JYPLS 建模,那么就可以利用拉格朗日方法分析準(zhǔn)則函數(shù)得到如下所示:
但是ΦA(chǔ)、ΦB通常都是未知的,wJ則不能通過式(8)直接計算得到,不過可以利用核函數(shù)來巧妙地避開該映射,將式(8)轉(zhuǎn)化成式(9)。
(4)計算YAi,YBi的得分向量uAi= YAiqJi,uBi=YBiqJi。
(5)對uAi和uBi進行收斂性判斷,若步驟(4)中的得分向量都具有收斂性,再根據(jù)式(13)進行核矩陣和輸出矩陣的縮減,否則返回到步驟(2)。
(6)然后令i=i+1,重復(fù)步驟(2)~步驟(6)提取主成分直到A 的主成分全部提取結(jié)束,主成分?jǐn)?shù)量可以由交叉驗證確定。
給定某個間歇生產(chǎn)過程,假設(shè)它有J 個過程變量,在一個批次內(nèi)有K 個采樣時間點,共收集I 個批次數(shù),就構(gòu)成了典型的間歇過程三維數(shù)據(jù)X(I × J ×K)。在進行過程傳遞模型的建立之前,本文采取圖3 所示的方法按批次方向?qū)⑤斎刖仃嘪A,XB∈RI×J×K展 開 成XA,XB∈RI×KJ形 式,對 應(yīng) 的輸出變量矩陣為YA,YB∈RI×J。
圖3 相似過程數(shù)據(jù)的批次展開Fig.3 Batch-unfolding of similar process data
將JYPLS 過程遷移模型與多尺度核方法相結(jié)合,不僅能夠解決新間歇過程因沒有充足的過程建模數(shù)據(jù)而影響建模效率的問題,而且同時考慮到數(shù)據(jù)具有多尺度特性的問題,通過改變核的尺度的大小來更好地擬合數(shù)據(jù)變化劇烈和變化平緩的趨勢,能夠充分地反映數(shù)據(jù)樣本的分布特性,可以進一步提高質(zhì)量預(yù)測的精度。
JYMKPLS離線建模步驟如下:
(1)數(shù)據(jù)展開。采用批次展開的方式將新間歇過程B 和與其相似的舊間歇過程A 的矩陣XA,XB∈RI×J×K依次展開成XA,XB∈RI×KJ。
(2)數(shù)據(jù)預(yù)處理。將兩個過程的輸入矩陣XA,XB的每一列數(shù)據(jù)分別按照零均值和單位方差進行歸一化;同樣,對輸出矩陣YA,YB也進行標(biāo)準(zhǔn)化處理,將其聯(lián)合得到Y(jié)J=[YA; YB]。
(3)確定尺度個數(shù)m。對輸入樣本進行聚類,選擇分類個數(shù)作為相對最優(yōu)的尺度個數(shù)m。
(4)確定核函數(shù)寬度參數(shù)σl(l = 1,2,…,m)。利用新舊過程的學(xué)習(xí)樣本建立JYMKPLS模型,計算擬合誤差作為評價指標(biāo),利用優(yōu)化算法尋找最優(yōu)核寬度參數(shù)σl(l = 1,2,…,m),使得擬合誤差最小,選取誤差最小模型所對應(yīng)的核寬度參數(shù)作為最優(yōu)結(jié)果。
(5)計算核矩陣。通過式(4)進行非線性映射,利用式(6)的多個尺度的核函數(shù)在高維空間中分別計算并得到核函數(shù)矩陣KA和KB。
(6)通過式(7)中心化核矩陣KA和KB。
(7)使用輸入核矩陣KA和KB以及聯(lián)合輸出矩陣YJ運行JYMKPLS算法。
(8)計算JYMKPLS模型的回歸系數(shù):
其中,TJ=[TA; TB]是舊間歇過程A 和新間歇過程B 過程潛變量的聯(lián)合矩陣,是建立質(zhì)量預(yù)測模型最為關(guān)鍵的變量。
(9)將預(yù)測樣本代入JYMKPLS 模型,得到回歸方程為:
其中,xnew是新過程B 的新采樣數(shù)據(jù),xj代表第j批次的輸入訓(xùn)練數(shù)據(jù),knew是新的批次數(shù)據(jù)對應(yīng)的核向量, e 是預(yù)測誤差,ynew為新采樣數(shù)據(jù)的預(yù)測結(jié)果。
本文基于JYMKPLS過程遷移模型,為間歇過程產(chǎn)品質(zhì)量提供了在線預(yù)測方法的完整框架和算法流程,包括基于JYMKPLS 的預(yù)測模型的離線建立,在線模型更新和數(shù)據(jù)剔除,該方法的流程圖如圖4所示。
圖4 基于JYMKPLS過程遷移模型的批次過程質(zhì)量預(yù)測及更新流程Fig.4 Batch process quality prediction and update process based on JYMKPLS process transfer model
得到離線質(zhì)量模型之后,該模型可用于下一批次產(chǎn)品的質(zhì)量預(yù)測。在新的批次運行時,由于該批次過程沒有完全結(jié)束,只能得到操作周期開始到當(dāng)前時刻的不完整的輸入數(shù)據(jù)xformer。為了預(yù)測當(dāng)前時刻下最終的產(chǎn)品質(zhì)量,可以通過預(yù)估計[7]的方法對當(dāng)前時刻之后的數(shù)據(jù)部分xafter進行填補,構(gòu)成與預(yù)測值y?new相對應(yīng)的輸入數(shù)據(jù)xnew=[xformer; xafter]。然后,通過核函數(shù)獲得核向量knew,將完整的輸入數(shù)據(jù)xnew和knew代入預(yù)測模型即可得到預(yù)測值y?new。
其中,xj代表第j 批次的輸入訓(xùn)練數(shù)據(jù),knew表示過程新產(chǎn)生的新批次的輸入數(shù)據(jù)所對應(yīng)的核向量,e為預(yù)測誤差,y?new代表新過程新采集到的數(shù)據(jù)所對應(yīng)的預(yù)測輸出值。
由于新過程建模數(shù)據(jù)的稀缺性,現(xiàn)有的新過程數(shù)據(jù)集也無法描述整個新過程的特征。因此,在每個批次結(jié)束時,需要不斷地利用新獲得的數(shù)據(jù)xnew和ynew補充到新過程的建模數(shù)據(jù)集XB和YB,進一步增加建模信息,從而有效提高預(yù)測模型的準(zhǔn)確性。通過這兩個增廣矩陣可以離線更新預(yù)測模型,模型更新方法如式(17)所示:
在生產(chǎn)過程前期,由于新過程數(shù)據(jù)不足,舊過程的數(shù)據(jù)有助于新過程模型的建立,但是由于相似過程之間必然存在差異,舊過程的數(shù)據(jù)不可能包含新過程的所有過程信息,隨著新過程數(shù)據(jù)的補充和積累,建模數(shù)據(jù)集中舊過程的數(shù)據(jù)反而會影響模型精度的進一步提高。因此,需要在適當(dāng)?shù)臅r刻對舊過程數(shù)據(jù)進行逐步剔除,本文檢測了連續(xù)m 個批次的最終質(zhì)量偏差,通過設(shè)置穩(wěn)定性閾值εstable來判斷誤差是否收斂至穩(wěn)定階段從而決定是否進行數(shù)據(jù)剔除(εstable的值是趨近于0 的預(yù)設(shè)常數(shù))。數(shù)據(jù)剔除的原則是對舊過程數(shù)據(jù)集中偏差較大的數(shù)據(jù)優(yōu)先處理,具體方法和步驟如下。
(2)收集所有最新批次的最終質(zhì)量的預(yù)測偏差,判斷連續(xù)采樣批次中Δj偏差小于閾值εstable的批次數(shù)是否大于等于n 個,如果是,則轉(zhuǎn)到步驟(3)進行數(shù)據(jù)選擇和剔除,否則返回到步驟(1)。
(3)計算新舊過程數(shù)據(jù)之間的相似度,從舊過程數(shù)據(jù)集中選取與新過程數(shù)據(jù)偏差最大的舊數(shù)據(jù)進行剔除,計算相似度的公式如式(18)所示:
其中,‖ ? ‖2是歐幾里得度量,XˉB是新過程數(shù)據(jù)的平均值,d(xAj,XB)表示過程數(shù)據(jù)之間的歐氏距離,相似度用S(xAj)表示,其范圍是0~1。
青霉素生產(chǎn)過程是一種典型的間歇工業(yè)過程,其主要通過微生物發(fā)酵的途徑進行生產(chǎn),過程本身具有非線性的特性。而青霉素的終點濃度是衡量生產(chǎn)效益的最重要的指標(biāo),因此,對其進行質(zhì)量預(yù)測十分重要。本文通過Pensim2.0 仿真軟件按照設(shè)定生成的數(shù)據(jù)來驗證本文算法,過程反應(yīng)周期和采樣間隔分別設(shè)定為400 h 和0.5 h。然后,選取了通風(fēng)率等六個輸入變量和青霉素濃度這一個輸出變量建立預(yù)測模型對青霉素濃度進行質(zhì)量預(yù)測。本文采用仿真軟件按照表1設(shè)置的工作條件分別生成40 個批次的數(shù)據(jù)作為舊過程A 已有的大量過程數(shù)據(jù),生成55 個批次的數(shù)據(jù)作為新過程B 產(chǎn)生的過程數(shù)據(jù),其中5 個作為剛投入運行的新過程B 已有的過程數(shù)據(jù),剩余50個批次的數(shù)據(jù)用作數(shù)據(jù)更新和數(shù)據(jù)測試。同時,為了增加實驗實際應(yīng)用的可信度,將2%的測量噪聲分別加到過程的輸入變量和輸出質(zhì)量指標(biāo)上。提取舊過程A中40個批次數(shù)據(jù)中的6個輸入變量和最終質(zhì)量,形成舊過程數(shù)據(jù)集矩陣XA(40 × 6 × 800)和YA(40 × 1),同樣,可以得到新過程數(shù)據(jù)集矩陣XB(55× 6 × 800)和YB(55× 1)。
表1 過程A和B的工作條件Table 1 Working conditions for batch processes A and B
圖5 基于KPLS和MKPLS的青霉素最終濃度預(yù)測結(jié)果Fig.5 The prediction result of the final concentration of penicillin in each batch based on KPLS and MKPLS
為了更清晰地表明新過程B由于數(shù)據(jù)稀缺導(dǎo)致數(shù)據(jù)驅(qū)動建模精度低下的問題,更好地突出多尺度核學(xué)習(xí)方法在質(zhì)量預(yù)測中的優(yōu)勢,本節(jié)只用到新過程B 的數(shù)據(jù),將MKPLS 模型與傳統(tǒng)的KPLS 模型進行了比較,測試了這兩種方法的預(yù)測效果。
首先為了充分地驗證兩個模型在整個工況范圍內(nèi)的最終質(zhì)量預(yù)測能力,保持建模數(shù)據(jù)集不變,并且不進行模型的在線更新和舊數(shù)據(jù)的剔除,實驗將新過程B 的50 個批次的數(shù)據(jù)分為5 個批次的建模數(shù)據(jù)集和45 個批次的測試數(shù)據(jù)集,構(gòu)建最終質(zhì)量預(yù)測模型。利用兩種方法對測試數(shù)據(jù)集的最終質(zhì)量進行了預(yù)測,評價指標(biāo)為預(yù)測值的均方根誤差RMSE 和平均相對預(yù)測誤差MPRE。由圖5 和表2 可得實驗結(jié)果如下,新過程在剛投入生產(chǎn)的前期階段,擁有很少的建模數(shù)據(jù),在不進行模型更新的前提下基于這兩種數(shù)據(jù)驅(qū)動建模方法的預(yù)測精度都不理想,但是MKPLS 建模方法的預(yù)測效果要略優(yōu)于KPLS 建模方法的預(yù)測效果,這表明即使在少量數(shù)據(jù)的情況下,相比于單尺度核方法,多尺度核方法能夠較好地抓取數(shù)據(jù)特征,具有更高的精度。
兩種方法的均方根誤差和平均相對預(yù)測誤差值如表2所示。
考慮模型更新的情況,本實驗將新過程B 的55個批次的數(shù)據(jù)分為5 個批次的建模數(shù)據(jù)集,45 個批次的更新數(shù)據(jù)集,5 個批次的測試數(shù)據(jù)集三個部分,測試數(shù)據(jù)集中5 個批次最終濃度預(yù)測值的RMSE 是量化預(yù)測性能的評價指標(biāo)。利用建模數(shù)據(jù)集構(gòu)建初始的最終質(zhì)量預(yù)測模型,每次對測試數(shù)據(jù)集中的所有測試樣本進行預(yù)測后,計算預(yù)測結(jié)果的RMSE,然后向訓(xùn)練數(shù)據(jù)集中添加一批更新數(shù)據(jù)集以重建質(zhì)量預(yù)測模型,再次對測試集的最終濃度進行預(yù)測,直到更新數(shù)據(jù)集中的所有數(shù)據(jù)都放入建模數(shù)據(jù)集中。兩種方法測試數(shù)據(jù)集的RMSE 如圖6 所示,隨著新批次數(shù)據(jù)的不斷產(chǎn)生,建模數(shù)據(jù)不斷增多,兩種預(yù)測方法的精度隨著模型更新都在不斷提高,在第25批次之后,達到了較為穩(wěn)定的精度。對比兩種預(yù)測方法的均方根誤差,可以看出在進行該生產(chǎn)過程的質(zhì)量預(yù)測時,基于MKPLS的建模方法的預(yù)測效果明顯優(yōu)于基于KPLS 的建模方法,而且隨著建模數(shù)據(jù)越來越多,基于MKPLS的建模方法的預(yù)測效果的優(yōu)勢會更加明顯。
1.3 技術(shù)培訓(xùn)與質(zhì)量控制 本研究的6名測查人員均經(jīng)過北京婦幼保健院的Gesell神經(jīng)心理發(fā)育測查的技能培訓(xùn)并取得證書,臨床測查經(jīng)驗豐富。實驗前6名測查員測查結(jié)果一致性檢驗合格。
表2 兩種預(yù)測方法的評價指標(biāo)對比Table 2 The evaluation index comparison of two prediction methods
圖6 帶有模型更新的KPLS模型和MKPLS模型的RMSEFig.6 RMSE of KPLS model and MKPLS model with model updates
考慮到新過程B初期建模數(shù)據(jù)少導(dǎo)致建模精度很低甚至無法建模的情況,為了突出過程遷移在最終質(zhì)量預(yù)測中的優(yōu)勢,更為了突出多尺度核方法在解決批次過程訓(xùn)練樣本中普遍存在的數(shù)據(jù)分布不均勻的多尺度特性問題上的優(yōu)勢,本節(jié)將JYMKPLS模型、JYKPLS 模型以及傳統(tǒng)的KPLS 模型的預(yù)測效果進行了比較。
首先,為了充分驗證在新過程數(shù)據(jù)不足的情況下,JYMKPLS 模型在整個工況范圍內(nèi)的最終質(zhì)量預(yù)測能力,保持建模數(shù)據(jù)集不變,并且暫且不進行模型的在線更新和舊數(shù)據(jù)的剔除。該實驗中,用到舊過程A 的所有數(shù)據(jù)和新過程B 的50 個批次的數(shù)據(jù),將新過程B的50個批次的數(shù)據(jù)分為5個批次的建模數(shù)據(jù)集和45個批次的測試數(shù)據(jù)集,用以構(gòu)建最終質(zhì)量預(yù)測模型。其中,傳統(tǒng)的KPLS 建模方法只利用新過程B 的5 個批次數(shù)據(jù)進行建模,而JYKPLS 和JYMKPLS 過程遷移建模方法則利用相似舊過程A的40個批次的過程數(shù)據(jù)和新過程B的5個批次的過程數(shù)據(jù)進行建模。利用三種方法對測試數(shù)據(jù)集的最終質(zhì)量進行了預(yù)測,評價指標(biāo)為預(yù)測值的均方根誤差RMSE 和平均相對預(yù)測誤差MPRE。實驗的結(jié)果如圖7 和表3 所示,在新過程運行初期,擁有很少的建模數(shù)據(jù)的情況下, JYKPLS 和JYMKPLS 過程遷移建模方法的整體預(yù)測效果要明顯優(yōu)于KPLS 建模方法的預(yù)測效果。同時,基于JYMKPLS的建模方法的預(yù)測精度要略優(yōu)于基于JYKPLS 的建模方法的預(yù)測精度。
三種預(yù)測方法的均方根誤差以及平均相對預(yù)測誤差如表3所示。
表3 三種預(yù)測方法的評價指標(biāo)對比Table 3 The evaluation index comparison of three prediction methods
三種預(yù)測方法的平均均方根誤差如表4 所示(無數(shù)據(jù)剔除)。
表4 三種預(yù)測方法的平均均方根誤差對比Table 4 Comparison of mean RMSE of three prediction methods
圖7 基于KPLS、JYKPLS和JYMKPLS的青霉素最終濃度預(yù)測結(jié)果Fig.7 Prediction results of final penicillin concentration for each batch based on KPLS,JYKPLS and JYMKPLS
圖8 帶有模型更新的三種模型的RMSEFig.8 RMSE of the three models with model updates
考慮模型更新情況,本實驗用到新過程B 的55個批次的數(shù)據(jù),將其分為三部分,5 個批次的建模數(shù)據(jù)集,45個批次的更新數(shù)據(jù)集,5個批次的測試數(shù)據(jù)集。然后根據(jù)KPLS、JYKPLS、JYMKPLS 三種建模方法構(gòu)建初始的最終質(zhì)量預(yù)測模型。其中,傳統(tǒng)的KPLS 建模方法只利用新過程B 的5 個批次數(shù)據(jù)進行建模,而JYKPLS 和JYMKPLS 過程遷移建模方法則利用相似舊過程A 的40 個批次的過程數(shù)據(jù)和新過程B 的5 個批次數(shù)據(jù)進行建模。測試數(shù)據(jù)集中5個批次最終濃度預(yù)測值的RMSE是量化預(yù)測性能的評價指標(biāo),每次對測試數(shù)據(jù)集中的所有測試樣本進行預(yù)測后,計算預(yù)測結(jié)果的RMSE,并向訓(xùn)練數(shù)據(jù)集中添加一批更新數(shù)據(jù)集用以重建預(yù)測模型,再次預(yù)測它們的最終濃度,直到更新數(shù)據(jù)集中的所有數(shù)據(jù)都放入建模數(shù)據(jù)集中。如圖8(a)和表4所示,隨著新批次數(shù)據(jù)的不斷產(chǎn)生,建模數(shù)據(jù)不斷增多,三種預(yù)測方法的精度隨著模型更新都在不斷提高,在第25批次之后,達到了較為穩(wěn)定的精度。對比三種預(yù)測方法的均方根誤差,可以看出在對新過程B 的前期進行質(zhì)量預(yù)測時,相較于KPLS 方法,引入相似舊過程A 的過程數(shù)據(jù)進行遷移建模的JYKPLS 方法和JYMKPLS 方法能夠明顯地降低預(yù)測誤差。同時,由于引入了多個尺度的核函數(shù)來更好地擬合數(shù)據(jù)的變化特征,使得JYMKPLS 方法相較于JYKPLS 方法在降低預(yù)測誤差方面更加明顯。此外,由于在第25批次之后,JYKPLS 方法和JYMKPLS 方法都已達到了較為穩(wěn)定的精度,精度受到舊過程數(shù)據(jù)的影響,此時須考慮數(shù)據(jù)剔除情況,如圖8(b)所示,通過上文所提的剔除判定方法,在誤差穩(wěn)定幾個批次之后進行數(shù)據(jù)剔除,可以看出在第30 個批次以后,二者的預(yù)測誤差都進一步降低。總體上,隨著模型更新和數(shù)據(jù)剔除的進行,基于JYMKPLS建模方法的預(yù)測精度不斷提高,而且預(yù)測精度明顯優(yōu)于另外兩種建模方法。
針對間歇過程數(shù)據(jù)大都具有強非線性和多尺度特性的問題,為了對數(shù)據(jù)不足的新間歇過程建立更加精準(zhǔn)的產(chǎn)品質(zhì)量預(yù)測模型,提出了一種基于多尺度核JYMKPLS 遷移學(xué)習(xí)模型的產(chǎn)品質(zhì)量在線預(yù)測方法。該方法綜合了遷移學(xué)習(xí)建模和多尺度核學(xué)習(xí)方法的優(yōu)點,既能在減少數(shù)據(jù)資源浪費的同時,遷移相似舊過程充足的過程數(shù)據(jù)到新過程中以輔助和加速新過程的建模,又兼顧了間歇過程訓(xùn)練樣本中普遍存在的多尺度特性,提升了模型泛化性。此外,提出模型在線更新和數(shù)據(jù)剔除,在每個生產(chǎn)周期結(jié)束時,通過在線持續(xù)改善遷移模型對新間歇過程的匹配程度,以消除相似過程間的差異性給遷移學(xué)習(xí)帶來的不利影響,進而不斷地提高產(chǎn)品質(zhì)量的預(yù)測精度。本文通過仿真將該方法應(yīng)用于青霉素生產(chǎn)過程,結(jié)果顯示,與傳統(tǒng)的KPLS 方法和基于過程遷移的JYKPLS 方法相比,該方法在加快新過程建模速度的同時,具有更高的預(yù)測精度和良好的泛化性能,能夠進一步提高新批次產(chǎn)品質(zhì)量的預(yù)測精度。
符 號 說 明
B——模型的回歸系數(shù)矩陣
e——ynew的預(yù)測誤差
I——I × I單位矩陣
KA,KB——分別為A、B過程的核函數(shù)矩陣
knew——B過程的新的批次數(shù)據(jù)對應(yīng)的核向量
qJi——聯(lián)合輸出變量的負(fù)載矩陣
S(·)——數(shù)據(jù)之間的相似度
tA,tB,tJ——分別為A、B 過程輸入數(shù)據(jù)的得分向量和關(guān)聯(lián)主成分
uA,uB——分別為過程輸出數(shù)據(jù)的得分向量
XA,XB——分別為A、B過程的輸入數(shù)據(jù)矩陣
xformer,xafter——分別為xnew中已存在數(shù)據(jù)樣本和未知數(shù)據(jù)樣本
xi——第i 批次的輸入訓(xùn)練數(shù)據(jù)
xnew——B過程在線獲取的新的批次的數(shù)據(jù)樣本
YA,YB,YJ——分別為A、B 過程的輸出數(shù)據(jù)矩陣和聯(lián)合輸出矩陣
ynew,——分別為B 過程在線采集的新生產(chǎn)批次的輸出樣本值及其預(yù)測值
βj——第j批次的預(yù)測偏差
Δj——前后批次間預(yù)測偏差的差值
εstable——穩(wěn)定閾值
σ——核參數(shù)
Φ(?)——非線性變換函數(shù)
下角標(biāo)
A——與過程B相似的舊間歇生產(chǎn)過程
after——之后的,未知的
B——新間歇生產(chǎn)過程
former——之前的,已知的
i——提取的潛變量的序號
J——聯(lián)合矩陣
j——批次數(shù)
new——新過程B的當(dāng)前運行批次
old——舊過程A的數(shù)據(jù)