郭宇飛,石 拓,徐慶陽(yáng)
(1.天津現(xiàn)代職業(yè)技術(shù)學(xué)院,天津 300350;2.天津科技大學(xué) 生物工程學(xué)院,天津 300457)
異亮氨酸發(fā)酵過(guò)程中濃度近紅外預(yù)測(cè)模型的建立
郭宇飛1,石 拓2,徐慶陽(yáng)2
(1.天津現(xiàn)代職業(yè)技術(shù)學(xué)院,天津 300350;2.天津科技大學(xué) 生物工程學(xué)院,天津 300457)
利用近紅外分析儀和相關(guān)近紅外軟件,建立谷氨酸棒桿菌發(fā)酵過(guò)程中異亮氨酸質(zhì)量濃度的近紅外預(yù)測(cè)模型.結(jié)合偏最小二乘法,在波數(shù)為7 400~9 100 cm-1,減去一條直線作為光譜預(yù)處理的條件下,獲得異亮氨酸質(zhì)量濃度最優(yōu)近紅外預(yù)測(cè)模型.該模預(yù)測(cè)偏差(RPD)為3.36,交叉驗(yàn)證誤差均方根(RMSECV)為1.73 g/L,決定系數(shù)(R2)為0.997.通過(guò)外部驗(yàn)證,該模型能夠較好地檢測(cè)發(fā)酵過(guò)程中異亮氨酸的質(zhì)量濃度.
近紅外;預(yù)測(cè)模型;異亮氨酸;谷氨酸棒桿菌
在發(fā)酵行業(yè)生產(chǎn)中,實(shí)時(shí)了解發(fā)酵過(guò)程中目的產(chǎn)物、底物、菌體濃度以及副產(chǎn)物的信息,對(duì)于整個(gè)發(fā)酵過(guò)程控制來(lái)說(shuō)具有極其重要的意義,這不僅能夠在發(fā)酵過(guò)程中穩(wěn)定每批次目的產(chǎn)物產(chǎn)量,而且還能夠提高每批次發(fā)酵產(chǎn)物的轉(zhuǎn)化率和反應(yīng)器的利用率[1].另外,在發(fā)酵過(guò)程中產(chǎn)生的副產(chǎn)物會(huì)降低目的產(chǎn)物的合成,而使得目的產(chǎn)物轉(zhuǎn)化率降低,造成能源的浪費(fèi).再者,在發(fā)酵過(guò)程中由于溶氧電極、pH電極等設(shè)備發(fā)生異常后,造成發(fā)酵參數(shù)改變,很難實(shí)時(shí)了解發(fā)酵過(guò)程情況,可能會(huì)出現(xiàn)目的產(chǎn)物減少、副產(chǎn)物增加,甚至導(dǎo)致發(fā)酵失敗的情況.建立一種快速檢測(cè)發(fā)酵液中各組分含量的方法,對(duì)于實(shí)現(xiàn)整個(gè)發(fā)酵過(guò)程自動(dòng)控制是非常必要的[2].
近紅外光譜檢測(cè)具有對(duì)樣品無(wú)損傷、快速、安全和無(wú)需前處理等優(yōu)點(diǎn),已經(jīng)廣泛應(yīng)用于食品、醫(yī)藥、生物、化工和礦業(yè)等領(lǐng)域.另外,作為一種二級(jí)分析方法,近紅外光譜結(jié)合多元校正模型可以實(shí)現(xiàn)多組分同時(shí)測(cè)定,因此在發(fā)酵過(guò)程監(jiān)測(cè)和自動(dòng)控制方面具有無(wú)可比擬的優(yōu)勢(shì)[3-4].為了更有效地提取近紅外光譜包含的信息,必須對(duì)光譜進(jìn)行相應(yīng)的處理以消除或減少噪音的影響.常用的光譜預(yù)處理方法包括一階導(dǎo)數(shù)(First derivative,1st)、二階導(dǎo)數(shù)(Second derivative,2nd)、標(biāo)準(zhǔn)正態(tài)變換(Standard normal variate,SNV)、多元散色校正(Multivariate scatter correction,MSC)、小波變換(Wavelet transform,WT)和傅里葉變換(Fourier transform,F(xiàn)T)等[5-6].
1.1 主要儀器
Tensor 37近紅外分析儀,德國(guó)Bruker儀器公司;OPUS 7.0近紅外分析軟件,德國(guó)Bruker儀器公司;高效液相色譜,日本島津公司(SHIMADZU, LC-20AT).
1.2 菌 株
L-異亮氨酸產(chǎn)生菌WYJ1,由天津科技大學(xué)生物工程學(xué)院代謝工程研究室篩選并保藏.
1.3 培養(yǎng)基及培養(yǎng)條件
1.3.1 斜面培養(yǎng)基
酵母粉5 g/L,蛋白胨10 g/L,牛肉膏10 g/L,NaCl 2.5 g/L,MgSO4·7H2O 0.5 g/L,KH2PO41 g/L,瓊脂20 g/L,pH 7.0~7.2,121 ℃滅菌時(shí)間20 min.
1.3.2 種子培養(yǎng)基
葡萄糖40 g/L,玉米漿40 mL/L,KH2PO42 g/L,MgSO4·7H2O 2 g/L,MnSO4·H2O 2.5 mg/L,F(xiàn)eSO4·7H2O 5 mg/L,VH0.5 mg/L,VB10.2 mg/L,pH 7.0~7.2,115 ℃滅菌15 min.
1.3.3 發(fā)酵培養(yǎng)基
葡萄糖50 g/L,玉米漿20 mL/L,豆餅水解液20 mL/L,MgSO4·7H2O 2 g/L,MnSO4·H2O 30 mg/L,K2HPO43 g/L,F(xiàn)eSO4·7H2O 30 mg/L,VH0.3 mg/L,VB10.3 mg/L,pH 7.0~7.2,115 ℃滅菌15 min.
1.3.4 種子培養(yǎng)條件
從培養(yǎng)一定時(shí)間的含有異亮氨酸生產(chǎn)菌的斜面上刮一滿環(huán)菌苔,分別接種于3 瓶1 000 mL的三角瓶中(每瓶含100 mL種子培養(yǎng)基),在32 ℃,轉(zhuǎn)速200 r/min條件下振蕩培養(yǎng)14 h.
1.3.5 發(fā)酵培養(yǎng)條件
將3 個(gè)三角瓶中的種子培養(yǎng)液按照體積分?jǐn)?shù)10%的接種量接入到5 L發(fā)酵罐中,發(fā)酵罐中總體積為3 L.發(fā)酵溫度為32 ℃,以體積分?jǐn)?shù)25%的氨水調(diào)節(jié)發(fā)酵過(guò)程中的pH值,控制pH值在7.0左右,發(fā)酵周期為40 h.
1.4 發(fā)酵液中氨基酸質(zhì)量濃度的測(cè)定
發(fā)酵液中異亮氨酸質(zhì)量濃度用高效液相色譜進(jìn)行分析測(cè)定.色譜的分離條件:Agilent C18(15 mm×4.6 mm,3.5 μm),衍生劑為2,4-二硝基氟苯,衍生方法為柱前衍生,流動(dòng)相為體積分?jǐn)?shù)50%的乙腈(去離子水配制)和4.1 g/L的醋酸鈉溶液,柱溫33 ℃,流動(dòng)相流速1 mL/min,檢測(cè)波長(zhǎng)360 nm.
1.5 異亮氨酸質(zhì)量濃度近紅外預(yù)測(cè)模型的建立
1.5.1 樣品采集
在谷氨酸棒桿菌發(fā)酵生產(chǎn)異亮氨酸過(guò)程中,從發(fā)酵4 h時(shí)開(kāi)始,每30 min用10 mL EP管收集發(fā)酵液樣品,并將收集好的樣品于-80 ℃下保存,用于異亮氨酸質(zhì)量濃度的檢測(cè)和近紅外光譜的掃描.
1.5.2 近紅外光譜掃描
將1 mL發(fā)酵液樣品加入2 mm的石英比色杯中,利用Tensor 37近紅外掃描儀在波數(shù)4 000~12 000 cm-1處對(duì)發(fā)酵液樣品進(jìn)行掃描(在掃描過(guò)程中,以去離子水作為掃描背景,掃描次數(shù)為64 次).
1.5.3 近紅外光譜前處理
對(duì)采集得到的發(fā)酵液樣品近紅外光譜進(jìn)行預(yù)處理,利用OPUS 7.0軟件進(jìn)行分析預(yù)處理,光譜的預(yù)處理方法主要包括以下幾種:一階導(dǎo)數(shù)(Firstderivative,1st)、二階導(dǎo)數(shù)(Second derivative,2nd)、矢量歸一化(Vector normalization,SNV)、多元散射校正(Multiplicative scatter correction,MSC)、最小-最大歸一化(Min-max normalization)、減去一條直線(Straight line subtraction)、1st+SNV、1st+MSC和1st+減去一條直線等[7-9].
1.5.4 近紅外校正模型的建立[10]
采用偏最小二乘(Partial least-squares,PLS)的方法建立谷氨酸棒桿菌發(fā)酵過(guò)程中異亮氨酸質(zhì)量濃度的校正模型.以交叉檢驗(yàn)(Cross-validation)的方法作為模型的檢驗(yàn)方法,此種檢驗(yàn)方法適用于樣品數(shù)量較少或適中的樣品模型的建立.在OPUS 7.0分析軟件中,按照一定比例將發(fā)酵液樣品分為校正集和檢驗(yàn)集,且校正集的樣品數(shù)量要遠(yuǎn)遠(yuǎn)大于檢驗(yàn)集的樣品數(shù)量.
2.1 異亮氨酸原始近紅外光譜
發(fā)酵過(guò)程中選取的發(fā)酵液樣品(共180 個(gè))采用Tensor 37 Bruker近紅外分析儀在4 000~12 000 cm-1處掃描后采集的原始光譜如圖1所示.從整體光譜圖來(lái)看:發(fā)酵液樣品在7 400~9 100 cm-1處光譜較為平整且穩(wěn)定,能夠充分體現(xiàn)樣品間差異,有利于提取光譜和濃度相關(guān)性的有效信息;雖然4 000~7 400 cm-1和7 400~10 500 cm-1也有吸收峰,但是吸收峰不穩(wěn)定且沒(méi)有規(guī)律,有效信息提取比較困難,特征光譜變量也難以利用,不適合建立校正模型.因此首選在7 400~9 100 cm-1建立校正模型.
2.2 樣品的劃分
采用軟件OPUS 7.0對(duì)180 個(gè)樣品進(jìn)行分析,分為校正集(134 個(gè))和檢驗(yàn)集(46 個(gè)),見(jiàn)表1.校正集和檢驗(yàn)集的樣品濃度范圍、平均數(shù)和標(biāo)準(zhǔn)差對(duì)評(píng)價(jià)校正模型的可靠性和準(zhǔn)確性非常重要.一般要求校正集范圍應(yīng)包括檢驗(yàn)集范圍,但不能超過(guò)校正模型預(yù)測(cè)范圍.本論文校正集異亮氨酸質(zhì)量濃度為0.84~35.12 g/L,檢驗(yàn)集為0.98~33.46 g/L,符合要求.另外,校正集和檢驗(yàn)集的平均數(shù)和標(biāo)準(zhǔn)差應(yīng)該比較接近,保證所選樣品均勻分布,此處選擇的平均數(shù)和標(biāo)準(zhǔn)差差別較小.
圖1 異亮氨酸原始近紅外光譜Fig.1 Original NIR spectra of isoleucine
樣品分類樣品數(shù)/個(gè)質(zhì)量濃度/(g·L-1)平均數(shù)/(g·L-1)標(biāo)準(zhǔn)差/(g·L-1)模型校正集(Calibrationset)1340.84~35.1212.656.46外部檢驗(yàn)集(Validationset)460.98~33.4611.927.44
2.3 異亮氨酸質(zhì)量濃度近紅外預(yù)測(cè)模型的建立
采用近紅外分析軟件OPUS 7.0,分別在全波長(zhǎng)和7 400~9100 cm-1波數(shù)范圍內(nèi)選擇原始光譜和不同光譜預(yù)處理的方法建立異亮氨酸質(zhì)量濃度PLS最優(yōu)校正模型,模型各參數(shù)結(jié)果如表2所示.結(jié)果表明:在相同光譜預(yù)處理?xiàng)l件下7 400~9 100 cm-1波數(shù)范圍內(nèi)所建立模型RMSECV值均小于全波長(zhǎng),這說(shuō)明全波長(zhǎng)可能存在一些噪音,噪音對(duì)模型預(yù)測(cè)效果有一定的影響.當(dāng)光譜預(yù)處理為減去一條直線時(shí),相比其他預(yù)處理RMSECV值最小為1.73 g/L,決定系數(shù)達(dá)到0.997,選擇該模型為優(yōu)化后的校正模型.
表2 不同光譜預(yù)處理的異亮氨酸質(zhì)量濃度模型
異亮氨酸模型校正集和檢驗(yàn)集各參數(shù)見(jiàn)表3.用偏最小二乘法建模時(shí),要注意維數(shù)的選擇,維數(shù)過(guò)多將導(dǎo)致過(guò)擬合現(xiàn)象;反之,維數(shù)過(guò)少將導(dǎo)致模型預(yù)測(cè)能力差.如圖2所示,隨著維數(shù)的增加,RMSECV值逐漸降低;當(dāng)維數(shù)為9時(shí),RMSECV值為1.73 g/L;當(dāng)維數(shù)進(jìn)一步增大時(shí),RMSECV雖有所降低,但是降低幅度小.因此模型校正集的維數(shù)確定為9.
表3 異亮氨酸質(zhì)量濃度的PLS校正模型
圖2 異亮氨酸質(zhì)量濃度模型維數(shù)與RMSECV關(guān)系Fig.2 Relationship of the number of latent variables and RMSECV in the isoleucine concentration model
在PLS模型的樣品校正集和檢驗(yàn)集中,異亮氨酸質(zhì)量濃度預(yù)測(cè)值與實(shí)際值比較如圖3所示.其中校正集的RMSECV為1.73 g/L,擬合方程:y=0.997 2x+0.015 6,R2=0.997,偏移量為0.147;檢驗(yàn)集RMSEP為1.82 g/L,其擬合方程為y=0.986 8x+0.045 1,R2=0.992,偏移量為0.241.表3中異亮氨酸PLS模型校正集的RPD值為3.36.以上都說(shuō)明該P(yáng)LS模型具有很好的預(yù)測(cè)能力.
2.4 異亮氨酸質(zhì)量濃度近紅外預(yù)測(cè)模型的驗(yàn)證
為了進(jìn)一步驗(yàn)證構(gòu)建模型的預(yù)測(cè)能力,以谷氨酸棒桿菌發(fā)酵生產(chǎn)異亮氨酸的發(fā)酵液作為該模型的外部檢驗(yàn)對(duì)所建模型進(jìn)行檢驗(yàn),結(jié)果如圖4所示.雖然預(yù)測(cè)值與實(shí)際值之間存在著一定誤差,但從異亮氨酸近紅外模型對(duì)整個(gè)發(fā)酵過(guò)程的預(yù)測(cè)情況分析,所得預(yù)測(cè)值與實(shí)際值的總體趨勢(shì)基本相同,可用于檢驗(yàn)谷氨酸棒桿菌發(fā)酵過(guò)程中異亮氨酸質(zhì)量濃度的變化.
圖3 校正集和檢驗(yàn)集中異亮氨酸質(zhì)量濃度預(yù)測(cè)值和實(shí)際值 Fig.3 Predicted and experimental concentration of isoleucine in calibration and validation set
圖4 谷氨酸棒桿菌發(fā)酵過(guò)程中異亮氨酸質(zhì)量濃度曲線Fig.4 Concentration curve of isoleucine in Corynebacterium glutamicun fermentation
對(duì)谷氨酸棒桿菌發(fā)酵生產(chǎn)異亮氨酸過(guò)程中異亮氨酸質(zhì)量濃度進(jìn)行近紅外分析,成功建立了谷氨酸棒桿菌發(fā)酵生產(chǎn)異亮氨酸質(zhì)量濃度的近紅外模型.通過(guò)外部檢驗(yàn),驗(yàn)證了所建模型的準(zhǔn)確性.說(shuō)明該模型可以用于預(yù)測(cè)谷氨酸棒桿菌發(fā)酵過(guò)程中異亮氨酸的質(zhì)量濃度變化,同時(shí)為谷氨酸棒桿菌發(fā)酵過(guò)程控制提供了理論依據(jù).筆者建立的異亮氨酸質(zhì)量濃度近紅外預(yù)測(cè)模型是基于5 L發(fā)酵罐發(fā)酵中的異亮氨酸質(zhì)量濃度,所選樣品數(shù)量有限,之后的研究可以進(jìn)一步增加樣品數(shù),從而完善預(yù)測(cè)模型,使所建模型更加準(zhǔn)確.發(fā)酵過(guò)程中產(chǎn)物濃度近紅外預(yù)測(cè)模型的建立對(duì)于發(fā)酵過(guò)程控制有著重要意義,尤其是多種產(chǎn)物濃度近紅外模型的建立,將大大提高產(chǎn)物的檢測(cè)效率,為發(fā)酵過(guò)程的自動(dòng)化控制提供有力幫助.
[1] AMIN G, SHAHABY A, ALLAH A M. Glutamic acid and by-product synthesis by immobilized cells of the bacteriumCorynebacteriumglutamicum[J]. Biotechnology letter, 1993, 15(11):1123-1128.
[2] MACALONEY G, DRAPER I, PRESTON J, et al. At-line control and fault analysis in an industrial high cell densityEscherichiacolifermentation using NIR spectroscopy[J]. Food and bioproducts processing, 1996, 74(4):212-220.
[3] HERRERA J, GUESALAGA A, AGOSIN E, et al. Shortwave-near infrared spectroscopy for non-destructive determination of maturity of wine grapes[J]. Measurement science and technology, 2003, 14(5):689-697.
[4] SIESLER H W, OZAKI Y, KAWATA S, et al. Near-infrared spectroscopy: principles, instruments, applications[J]. Journal of chemometrics, 2010, 16(12):636-638.
[5] SISTARE F S, PIERRE B L, MOJICA C A, et al. Process analytical technology an investment in process knowledge[J]. Organic process research and development, 2005, 9(3):332-336.
[6] RATHORE A S, WINKLE H. Quality by design for biopharmaceuticals[J]. Nature biotechnology, 2009, 27(1):26.
[7] ORLANDINI S, PINZAUTI S, FURLANETTO S. Application of quality by design to the development of analytical separation methods[J]. Analytical and bioanalytical chemistry, 2013, 405(2/3):443-450.
[8] JEDRZEJEWSKI P M J, VAL I J, POLIZZI K M, et al. Applying quality by design to glycoprotein therapeutics: experimental and computational efforts of process control[J]. Pharmaceutical bioprocessing, 2013(1):51-69.
[9] WALSH K B, LONG R L, MIDDELTON S G. Use of near infra-red spectroscopy in evaluation of source-sink manipulation to increase the soluble sugar content of stonefruit[J]. Journal of horticultural science and biotechnology, 2007, 82:316-322.
[10] YING Y B, LIU Y D, WANG J P, et al. Fourier transform near-infrared determination of total soluble solids and available acid in intact peaches[J]. Transaction american society of agriculture engineers, 2005, 48:229-234.
(責(zé)任編輯:朱小惠)
Establishment of near-infrared prediction model of concentration in the isoleucine fermentation
GUO Yufei1, SHI Tuo2, XU Qingyang2
(1.Tianjin Modern Vocational Technology College, Tianjin 300350, China; 2.College of Biotechnology, Tianjin University of Science and Technology, Tianjin 300457, China)
The near-infrared spectrum scanning analysis was carried out using near infrared analyzer and related software, and the optimal prediction model for isoleucine concentration was established using near-infrared spectroscopy combining with partial least squares method under conditions of a straight line minus at wavenumber between 7 400 cm-1and 9 100 cm-1. The value of root mean square error of cross validation (RMSECV), determination coefficient (R2) and residual prediction error (RPD) was 1.73 g/L, 0.997 and 3.36, respectively. Through external validation, the model could well predict the concentration of isoleucine in the fermentation process.
near-infrared; prediction model; isoleucine;Corynebacteriumglutamicun
2017-04-24
郭宇飛(1962—),女,江蘇連云港人,高級(jí)工程師,碩士,研究方向?yàn)榉治鰴z測(cè),E-mail:yufeiguo@sina.com.通信作者:徐慶陽(yáng)副研究員,E-mail: xuqingyang@tust.edu.cn.
TQ922
A
1674-2214(2017)03-0138-05