楊建文, 陳祥光, 金懷平
(北京理工大學(xué) 化學(xué)與環(huán)境學(xué)院, 北京 100081)
?
多階段金霉素發(fā)酵過(guò)程產(chǎn)品質(zhì)量控制
楊建文, 陳祥光, 金懷平
(北京理工大學(xué) 化學(xué)與環(huán)境學(xué)院, 北京 100081)
為提高金霉素產(chǎn)品質(zhì)量和產(chǎn)量,提出了一種基于動(dòng)態(tài)階段劃分的多階段質(zhì)量預(yù)測(cè)控制系統(tǒng). 對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行主元分析得到的負(fù)載矩陣進(jìn)行聚類(lèi),結(jié)合先驗(yàn)知識(shí)得到各階段聚類(lèi)中心;通過(guò)計(jì)算實(shí)時(shí)數(shù)據(jù)的負(fù)載矩陣與各階段聚類(lèi)中心值間的歐式距離,動(dòng)態(tài)劃定各階段間的界限. 同時(shí)基于關(guān)聯(lián)向量機(jī)算法,為發(fā)酵過(guò)程每個(gè)階段建立相應(yīng)的質(zhì)量預(yù)測(cè)模型. 在金霉素間歇生產(chǎn)過(guò)程中,根據(jù)發(fā)酵進(jìn)程所處的階段和質(zhì)量變量的實(shí)時(shí)預(yù)測(cè)值,對(duì)發(fā)酵生產(chǎn)過(guò)程實(shí)施相應(yīng)控制策略. 通過(guò)實(shí)際應(yīng)用表明,采用多階段質(zhì)量預(yù)測(cè)控制方法可改善生產(chǎn)過(guò)程的穩(wěn)定性,提高產(chǎn)品質(zhì)量.
金霉素發(fā)酵;階段劃分;關(guān)聯(lián)向量機(jī);質(zhì)量預(yù)測(cè)
金霉素(chlortetracycline, CTC)是一種廣譜類(lèi)抗生素,是金色鏈霉菌發(fā)酵過(guò)程的次級(jí)代謝產(chǎn)物,屬于補(bǔ)料間歇多階段工業(yè)生產(chǎn)過(guò)程. 因?yàn)樵撨^(guò)程具有時(shí)變、非線性、生產(chǎn)周期長(zhǎng)和不穩(wěn)定等特征,其優(yōu)化控制問(wèn)題一直是過(guò)程控制領(lǐng)域的研究熱點(diǎn). 當(dāng)生產(chǎn)進(jìn)程從一個(gè)階段過(guò)渡到另一個(gè)階段時(shí),其輸入量、環(huán)境條件、過(guò)程特征量等都發(fā)生了變化,導(dǎo)致控制策略也要隨之改變,而過(guò)程控制效果的好壞將直接影響產(chǎn)品最終的品質(zhì)和產(chǎn)量[1]. 在金霉素的生產(chǎn)中,因?yàn)闊o(wú)法準(zhǔn)確判斷發(fā)酵過(guò)程菌株生長(zhǎng)的各個(gè)階段,通常將該發(fā)酵過(guò)程規(guī)定為4個(gè)固定時(shí)長(zhǎng)的階段,然后按照發(fā)酵時(shí)間對(duì)應(yīng)的階段實(shí)施相應(yīng)的控制策略. 這種做法簡(jiǎn)單可操作性強(qiáng),但有時(shí)會(huì)造成生產(chǎn)不穩(wěn)定,有一定局限性.
在多階段間歇補(bǔ)料過(guò)程的不同階段的數(shù)據(jù)特征中含有潛在的階段信息,本文歸納現(xiàn)場(chǎng)專(zhuān)家的操作知識(shí),采用主元分析(principal component analysis, PCA)負(fù)載矩陣聚類(lèi),基于計(jì)算歐式距離的方法動(dòng)態(tài)地劃分發(fā)酵過(guò)程的各個(gè)階段,同時(shí)也給出了軟過(guò)渡區(qū)間的判別方法及其在過(guò)程控制中的作用[2]. 同時(shí)基于該動(dòng)態(tài)階段劃分方法,結(jié)合非線性回歸的關(guān)聯(lián)向量機(jī)(relevance vector machine, RVM)算法,提出了對(duì)發(fā)酵過(guò)程質(zhì)量進(jìn)行預(yù)測(cè)控制的新方法[3],并給出了所提出預(yù)測(cè)控制方法在工業(yè)生產(chǎn)中應(yīng)用的結(jié)果.
1.1 數(shù)據(jù)預(yù)處理
在間歇生產(chǎn)過(guò)程中,采樣信息經(jīng)常會(huì)受到多種擾動(dòng)、模型退化、傳感器失效和數(shù)據(jù)采集系統(tǒng)誤差等的影響. 這些對(duì)正常信息的污染一般表現(xiàn)為高頻噪聲、異常、漂移、偏置和漏值,因此無(wú)論是基于數(shù)據(jù)驅(qū)動(dòng)建模還是在線采樣數(shù)據(jù)作為模型的輸入,都需要對(duì)數(shù)據(jù)做預(yù)處理,使有效信息盡可能落入模型最敏感的輸入?yún)^(qū)域.
預(yù)處理的首要工作是展開(kāi)三維數(shù)據(jù)集Xi(IJKi),這里I為罐批數(shù),J為過(guò)程變量數(shù),Ki為第i罐批發(fā)酵時(shí)間采樣點(diǎn)長(zhǎng)度.
本文結(jié)合先驗(yàn)的過(guò)程階段劃分將三維數(shù)據(jù)展開(kāi)二維數(shù)據(jù)陣列,每批金霉素發(fā)酵過(guò)程數(shù)據(jù)(用xi(KiJ)表示)展開(kāi)成如下形式,其中上標(biāo)數(shù)字表示4個(gè)生產(chǎn)階段
Xi(KiJ)=
(1)
而全部訓(xùn)練數(shù)據(jù)按上述方法展開(kāi)成二維建模數(shù)據(jù)矩陣,如圖1所示.
其數(shù)學(xué)表達(dá)式為
(2)
在應(yīng)用基于數(shù)據(jù)驅(qū)動(dòng)建立的模型時(shí),通常檢測(cè)噪聲會(huì)導(dǎo)致模型估計(jì)的重大誤差. 在本文中通過(guò)采用逐塊移動(dòng)窗口、線性濾波和數(shù)據(jù)縮放消除檢測(cè)噪聲[4]. 其中逐塊移動(dòng)窗口就是采樣預(yù)設(shè)定的N個(gè)的數(shù)據(jù)點(diǎn),N為窗口長(zhǎng)度,然后用最新數(shù)據(jù)點(diǎn)取而代之. 如此周期性地訓(xùn)練模型,用公式表達(dá)為
(3)
(4)
間歇生產(chǎn)過(guò)程中各變量的檢測(cè)值取值范圍不統(tǒng)一,因此進(jìn)行規(guī)范化有利于消除其數(shù)據(jù)中的系統(tǒng)性干擾,降低最小化技術(shù)性偏置對(duì)最終結(jié)果的影響. 其規(guī)范化計(jì)算式為
(5)
(6)
(7)
1.2 間歇過(guò)程階段劃分
(8)
(9)
(10)
(11)
(12)
1.3 質(zhì)量預(yù)測(cè)模型的建立
(13)
(14)
式中αs是超參數(shù). 對(duì)下式進(jìn)行優(yōu)化運(yùn)算可以到αs和σs,ε的最優(yōu)值,即
(15)
然后加權(quán)向量ws的后驗(yàn)概率用式(16)計(jì)算為
(16)
在此所述的“相關(guān)向量”就是指那些與ws非0元素組成的列. 式中的方差和均值可以分別用公式表示為
(17)
(18)
式中:
(19)
式中:RV為相關(guān)向量數(shù)量,而
2.1 金霉素發(fā)酵過(guò)程
金霉素發(fā)酵生產(chǎn)工藝一般需要金色鏈霉菌歷經(jīng)沙土孢子管、母斜面、子斜面、一級(jí)種子罐、二級(jí)種子罐,最后移種到發(fā)酵罐進(jìn)行培育. 菌株移植到發(fā)酵罐之前,首先要對(duì)發(fā)酵罐進(jìn)行消毒;然后灌入培養(yǎng)基;接著進(jìn)行高溫滅菌;最后按15%的接種量將金色鏈霉菌菌株移種到發(fā)酵罐中. 在發(fā)酵培養(yǎng)期間,補(bǔ)充含葡萄糖底料、純豆油和蛋白胨營(yíng)養(yǎng)物質(zhì),供菌株新陳代謝所需;根據(jù)金霉素發(fā)酵進(jìn)程,通過(guò)注入氨水調(diào)節(jié)發(fā)酵罐中的pH值,鼓入空氣調(diào)節(jié)溶解氧,以及輸入冷水或熱水調(diào)節(jié)溫度,為菌株提供適宜的環(huán)境. 圖2為金霉素生產(chǎn)的過(guò)程示意圖.
工業(yè)金霉素生產(chǎn)時(shí)間根據(jù)調(diào)度的安排,通常由2個(gè)時(shí)間周期組成,即90 h左右的短周期和115 h左右的長(zhǎng)周期. 為了增強(qiáng)所建模型的魯棒性和準(zhǔn)確性,提出了在訓(xùn)練數(shù)據(jù)中選取能涵蓋各種生產(chǎn)條件下的150批次發(fā)酵過(guò)程數(shù)據(jù),并按照1.1節(jié)所提出的預(yù)處理方法對(duì)數(shù)據(jù)進(jìn)行建模預(yù)處理和實(shí)時(shí)數(shù)據(jù)的預(yù)處理. 由于實(shí)際生產(chǎn)條件所限,可供選擇的可測(cè)過(guò)程參數(shù)如表1所示. 基于本課題組構(gòu)建的質(zhì)量預(yù)測(cè)控制系統(tǒng)軟件平臺(tái),本文所提方法在金霉素發(fā)酵過(guò)程中獲得應(yīng)用.
表1 金霉素生產(chǎn)過(guò)程可測(cè)變量
2.2 在線質(zhì)量預(yù)測(cè)
金霉素發(fā)酵是典型的多階段補(bǔ)料間歇過(guò)程,它的運(yùn)行可以簡(jiǎn)單定義為停滯、生長(zhǎng)、穩(wěn)定和衰亡4個(gè)階段. 在本文提出的方案中,將金霉素效價(jià)作為關(guān)鍵的指示性質(zhì)量變量,對(duì)其進(jìn)行在線預(yù)測(cè),并根據(jù)它的變化和發(fā)酵進(jìn)程所處的過(guò)程階段給出適時(shí)的控制策略. 其中在線階段質(zhì)量預(yù)測(cè)的實(shí)施步驟總結(jié)如下:
① 指定移動(dòng)窗口的寬度為60 min,質(zhì)量預(yù)測(cè)間隔為20 min,模型計(jì)算間隔為5 min;
② 規(guī)范化計(jì)算時(shí)間點(diǎn)采樣到的過(guò)程輸入變量,計(jì)算此時(shí)刻的加權(quán)負(fù)載矩陣與相鄰階段聚類(lèi)中心的歐氏距離,判斷其所屬階段;
③ 判斷是否是質(zhì)量預(yù)測(cè)時(shí)間點(diǎn). 如果是則根據(jù)過(guò)程所屬的發(fā)酵階段,調(diào)用質(zhì)量預(yù)測(cè)模型對(duì)質(zhì)量進(jìn)行預(yù)測(cè),否則直接跳到⑤;
④ 根據(jù)質(zhì)量預(yù)測(cè)結(jié)果和發(fā)酵進(jìn)程所處過(guò)程階段,實(shí)施相應(yīng)的生產(chǎn)控制策略;
⑤ 窗口向前移動(dòng)一個(gè)5 min的計(jì)算步長(zhǎng);
⑥ 判斷計(jì)算時(shí)間點(diǎn)是否到來(lái):是,則回到②;否,則繼續(xù)等待.
在質(zhì)量預(yù)測(cè)的過(guò)程中,存在兩處需要對(duì)結(jié)果進(jìn)行加權(quán)求和的運(yùn)算:一處是當(dāng)發(fā)酵進(jìn)程在兩個(gè)階段的軟過(guò)渡區(qū)間時(shí);另一處是計(jì)算質(zhì)量預(yù)測(cè)值時(shí). 當(dāng)判斷發(fā)酵進(jìn)程處在過(guò)渡區(qū)間時(shí),質(zhì)量預(yù)測(cè)值簡(jiǎn)化為與距離相關(guān)的兩個(gè)階段預(yù)測(cè)值的加權(quán)和,即
(20)
式中:di,di+1分別為處在過(guò)渡區(qū)間的輸入向量與相鄰兩個(gè)階段的聚類(lèi)中心的歐式距離;y(t),ysi(t)和ysi+1(t)分別為過(guò)渡區(qū)質(zhì)量預(yù)測(cè)值,當(dāng)前輸入變量在前一階段預(yù)測(cè)模型中的質(zhì)量值和當(dāng)前輸入變量在后一階段預(yù)測(cè)模型中的質(zhì)量值. 而移動(dòng)窗口所覆蓋預(yù)測(cè)間隔點(diǎn)的實(shí)時(shí)質(zhì)量預(yù)測(cè)值的計(jì)算為
(21)
式中:m(t)為加權(quán)質(zhì)量值;f(t)為預(yù)測(cè)質(zhì)量值;ΔT=20 min;α0、α-1、α-2和α-3為加權(quán)系數(shù),且有α0+α-1+α-2+α-3=1,其隨所處階段的變化而變化. 從試驗(yàn)結(jié)果中歸納出各階段的加權(quán)系數(shù)如表2所表示.
表2 加權(quán)系數(shù)階段值
基于階段劃分的質(zhì)量預(yù)測(cè)精度更高,對(duì)發(fā)酵過(guò)程的控制效果更好. 圖3和表3分別是40組測(cè)試數(shù)據(jù)在3種階段劃分方法中用式(22)所示的均方根誤差方法來(lái)進(jìn)行的預(yù)測(cè)效果與實(shí)測(cè)值之間的差值對(duì)比圖和均值表. 3種方法分別是固定階段劃分情況下的質(zhì)量預(yù)測(cè),動(dòng)態(tài)階段劃分情況下的質(zhì)量預(yù)測(cè)和沒(méi)有階段劃分的質(zhì)量預(yù)測(cè). 分別表示為在發(fā)酵進(jìn)程的4個(gè)階段下的對(duì)比.
(22)
Tab.3 Mean RMSE comparison table of different CTC fermentation stages
階段誤差均值固定階段動(dòng)態(tài)階段無(wú)階段停滯239765230478218282生長(zhǎng)502856494219564724穩(wěn)定390314340256443385衰亡428969348956446977
從圖3(a)~3(d)中看出不同的階段對(duì)質(zhì)量變量的預(yù)測(cè)精度會(huì)有變化. 首先,在停滯階段由于菌株量少,產(chǎn)生的效價(jià)較少,沒(méi)有階段過(guò)渡的沖擊,所以3種情況下的均方根誤差較接近. 在生長(zhǎng)階段,盡管各方法的均方根誤差的波動(dòng)都較大,基于動(dòng)態(tài)階段劃分相對(duì)誤差幅度較小,固定階段劃分次之,無(wú)階段劃分方法最差. 發(fā)酵進(jìn)入中后期,基于動(dòng)態(tài)階段劃分質(zhì)量預(yù)測(cè)的均方根誤差體現(xiàn)出了其較其他兩種方法的優(yōu)勢(shì),預(yù)測(cè)誤差小,波動(dòng)小. 過(guò)程階段進(jìn)程的質(zhì)量預(yù)測(cè)精度高于無(wú)階段劃分的預(yù)測(cè),動(dòng)態(tài)階段劃分又優(yōu)于固定階段劃分的質(zhì)量預(yù)測(cè). 因此,基于階段劃分的質(zhì)量預(yù)測(cè)精度更高,對(duì)發(fā)酵過(guò)程的控制效果更好
2.3 結(jié)果討論
對(duì)金霉素發(fā)酵過(guò)程的動(dòng)態(tài)階段劃分,充分反映發(fā)酵進(jìn)程的實(shí)時(shí)狀態(tài),這有利于對(duì)發(fā)酵過(guò)程實(shí)施具有針對(duì)性的控制策略. 在最大化金霉素產(chǎn)量的前提下,發(fā)酵的每個(gè)階段都有其具體的生產(chǎn)控制環(huán)境,其目的是使菌株充分適應(yīng)發(fā)酵罐的環(huán)境、促進(jìn)菌株的大量繁殖、維持菌株的成長(zhǎng)、促進(jìn)其進(jìn)行新陳代謝產(chǎn)生金霉素、縮短菌株自溶時(shí)間. 在圖4中,將固定階段劃分和動(dòng)態(tài)階段劃分中階段平均周期的時(shí)間長(zhǎng)度進(jìn)行了對(duì)比. 對(duì)比結(jié)果表明,相比經(jīng)驗(yàn)的階段劃分,動(dòng)態(tài)階段劃分體現(xiàn)了其劃分的準(zhǔn)確性和時(shí)變性.
基于階段動(dòng)態(tài)劃分,有針對(duì)性地對(duì)每批次發(fā)酵進(jìn)程實(shí)施適時(shí)適度的控制策略,避免由于硬性階段劃分帶來(lái)的生產(chǎn)波動(dòng),使整個(gè)發(fā)酵生產(chǎn)處于一個(gè)平穩(wěn)的過(guò)程. 表4是按照本文所提方案進(jìn)行的40批試驗(yàn)的發(fā)酵生產(chǎn)結(jié)果與同期同容量發(fā)酵罐按照固定階段劃分的發(fā)酵生產(chǎn)結(jié)果的對(duì)比.
表4 金霉素發(fā)酵的效能對(duì)比
盡管本文提出的方法在建模的準(zhǔn)確性和階段劃分的實(shí)時(shí)性上還有進(jìn)一步改進(jìn)的地方,但其在減少控制的隨機(jī)性,降低工人的勞動(dòng)強(qiáng)度,提高生產(chǎn)效率,節(jié)能降耗,增加生產(chǎn)利潤(rùn)方面效果顯著.
提出一種基于階段劃分質(zhì)量預(yù)測(cè)控制系統(tǒng),該方案成功地應(yīng)用在工業(yè)金霉素發(fā)酵過(guò)程中. 該方案首先是對(duì)歷史批次數(shù)據(jù)進(jìn)行逐批次的展開(kāi);其次利用PCA進(jìn)行負(fù)載矩陣聚類(lèi)分析,得到4個(gè)階段的聚類(lèi)中心均值以及類(lèi)半徑和核半徑的值,并在初始的4個(gè)發(fā)酵階段間,新增加了3個(gè)過(guò)渡區(qū)間;最后在4個(gè)階段和軟過(guò)渡的基礎(chǔ)上,建立以效價(jià)為質(zhì)量變量的質(zhì)量預(yù)測(cè)和階段性過(guò)程控制. 在實(shí)際生產(chǎn)過(guò)程中,該方案能動(dòng)態(tài)劃分金霉素發(fā)酵過(guò)程,有效地預(yù)測(cè)產(chǎn)品質(zhì)量,對(duì)發(fā)酵過(guò)程的節(jié)能降耗具有重要意義.
[1] Nomikos P, MacGregor J F. Multivariate SPC charts for monitoring batch processes[J]. Technometrics, 1995,37(1):41-59.
[2] Zhao C, Wang F, Lu N, et al. Stage-based soft-transition multiple PCA modeling and on-line monitoring strategy for batch processes[J]. Journal of Process Control, 2007,17(9):728-741.
[3] Tipping M E. Sparse Bayesian learning and the relevance vector machine[J]. The Journal of Machine Learning Research, 2001,1:211-244.
[4] Liu X, Kruger U, Littler T, et al. Moving window kernel PCA for adaptive monitoring of nonlinear processes[J]. Chemometrics and Intelligent Laboratory Systems, 2009,96(2):132-143.
[5] Ge Z, Zhao L, Yao Y, et al. Utilizing transition information in online quality prediction of multiphase batch processes[J]. Journal of Process Control, 2012,22(3):599-611.
[6] Ge Z, Song Z, Zhao L, et al. Two-level PLS model for quality prediction of multiphase batch processes[J]. Chemometrics and Intelligent Laboratory Systems, 2014,130:29-36.
(責(zé)任編輯:李兵)
Multistage-Based Quality Prediction for CTC Fermentation
YANG Jian-wen, CHEN Xiang-guang, JIN Huai-ping
( School of Chemical Engineering and Environment, Beijing Institute of Technology, Beijing 100081, China )
In order to improve the quality of chlortetracycline fermentation, a multiphase quality prediction system based upon dynamically dividing phase of the culture was proposed. By clustering the PCA loading matrices of history dataset to obtain the clustering center of each phase, the fermentation phase can be divided online through calculating the Euclidean between current loading matrix and these ones; while quality prediction was modeled for each phase of the chlortetracycline fermentation with relevance vector machine algorithm. During chlortetracycline fermentation batch, a corresponding control strategy was implemented on the fermentation production in terms of the information of phase and quality value. The validity and reliability of the improvement of product quality and product yield of the proposed method was illustrated by applying it to the real chlortetracycline fermentation.
CTC fermentation; phase-division; relevance vector machine; quality prediction
2014-07-29
博士后科學(xué)基金資助項(xiàng)目(20100480208)
楊建文(1975—),男,博士生,E-mail:yangjianwen@bit.edu.cn.
陳祥光(1953—),男,教授,博士生導(dǎo)師,E-mail:xgc1@bit.edu.cn.
TP 273
A
1001-0645(2016)04-0423-06
10.15918/j.tbit1001-0645.2016.04.016