朱斌斌,孫麗慧,鄭裕國(guó)
(浙江工業(yè)大學(xué)生物與環(huán)境工程學(xué)院,浙江 杭州,310014)
(S)-4-氯-3-羥基丁酸乙酯((S)-CHBE)是一種非常有前景的手性基元物質(zhì),它是合成治療高膽固醇血癥和混合型高脂血癥藥物阿托伐他汀鈣的關(guān)鍵手性中間體。利用生物催化羰基不對(duì)稱(chēng)還原4-氯乙酰乙酸乙酯(COBE)合成(S)-CHBE的反應(yīng)成本低、反應(yīng)條件溫和、產(chǎn)量高、產(chǎn)物光學(xué)純度高,成為制備(S)-CHBE的重要方法[1-2]。在生物法合成(S)-CHBE中,菌體的產(chǎn)酶條件控制例如培養(yǎng)基成分[3]、培養(yǎng)條件[4]、接種量[5]對(duì)細(xì)胞產(chǎn)酶有顯著影響,因此菌體產(chǎn)酶條件的優(yōu)化對(duì)于生物法合成(S)-CHBE有重要意義。
菌體的發(fā)酵產(chǎn)酶過(guò)程中,多個(gè)培養(yǎng)因素對(duì)酶活的影響存在高度復(fù)雜性和非線性[6]。針對(duì)高度非線性關(guān)系之間的優(yōu)化問(wèn)題,人們提出了多種優(yōu)化算法概念,如模擬退火法[7],遺傳算法[8-9],粒子群算法[10]等。粒子群算法(Particle Swarm Optimization,PSO)是一種進(jìn)化算法,它實(shí)現(xiàn)容易,精度高,全局收斂[11-12]。算法從隨機(jī)解出發(fā),通過(guò)迭代尋找最優(yōu)解,并且通過(guò)適應(yīng)度來(lái)評(píng)價(jià)解的品質(zhì)。PSO算法的適應(yīng)度函數(shù)的選擇直接影響算法性能,國(guó)內(nèi)外很多學(xué)者利用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行擬合,并且將擬合后的ANN模型作為優(yōu)化算法的適應(yīng)度函數(shù)[6,13-14],但是 ANN 是大樣本啟發(fā)式算法,存在學(xué)習(xí)速度慢,網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜等缺陷。Vapnik等人在統(tǒng)計(jì)學(xué)習(xí)理論的理論基礎(chǔ)上提出了支持向量機(jī)(Support Vector Machine,SVM)模型,它遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structural Risk Minimization,SRM)原理,對(duì)于小樣本,高維度,非線性等問(wèn)題有較好的擬合能力[15],因此利用SVM模型作為優(yōu)化算法的適應(yīng)度函數(shù)對(duì)于處理小樣本數(shù)據(jù)集的優(yōu)化有良好的應(yīng)用前景,對(duì)于構(gòu)建產(chǎn)酶培養(yǎng)條件優(yōu)化模型也是一種新的嘗試。
本研究以實(shí)驗(yàn)室篩選到的1株紅球菌Rhodococcus sp.作為實(shí)驗(yàn)對(duì)象,構(gòu)建SVM-PSO優(yōu)化模型對(duì)菌體產(chǎn)酶條件進(jìn)行優(yōu)化。
1.1.1 菌種
紅球菌Rhodococcus sp.,實(shí)驗(yàn)室篩選保藏菌種。
1.1.2 培養(yǎng)基
種子培養(yǎng)基:100 g黃豆芽加入1 L蒸餾水煮沸30 min,用紗布過(guò)濾冷卻后加入40 g葡萄糖,用蒸餾水補(bǔ)滿1 L,保持自然pH值,115℃滅菌待用。
初始發(fā)酵培養(yǎng)基:葡萄糖35.0 g/L,酵母粉15.0 g/L,KH2PO42.5 g/L,NaCl 1.0 g/L,pH 6.0,115 ℃滅菌待用。
1.2.1 菌體培養(yǎng)
從斜面中挑出部分菌種接入種子培養(yǎng)基中,30℃培養(yǎng)8 h。發(fā)酵培養(yǎng)基成分均按照實(shí)驗(yàn)設(shè)計(jì)配置,150 r/min的搖床上培養(yǎng)24 h,每組實(shí)驗(yàn)變量設(shè)計(jì)3個(gè)平行實(shí)驗(yàn)。
1.2.2 羰基還原酶酶活的定義與測(cè)定方法
酶活定義:30℃,pH 7.0條件下,每分鐘催化底物COBE產(chǎn)生1 μmol的CHBE所需的酶量定義為1個(gè)酶活力單位(U)。
測(cè)定方法:取30 mL培養(yǎng)24 h的菌液,離心收集菌體,菌體經(jīng)生理鹽水洗滌后懸浮于10 mL磷酸鈉緩沖液(0.1 mmol/L,pH 7.0)中,加入 60 mmol/L COBE及0.40 g輔助底物,30℃,180 r/min水浴搖床中反應(yīng)30 min,用等體積乙酸乙酯萃取,無(wú)水Na2SO4干燥,氣相色譜分析產(chǎn)物的生成量。
GC檢測(cè):美國(guó)Agilent 7890氣相色譜儀,HP-5極性色譜柱(30 m ×0.32 mm ×0.25 μm)。柱溫120℃,保留 2.5 min,以 50℃/min程序升溫至165℃,保持1.2 min。載氣為氮?dú)?,流?.0 mL/min,進(jìn)樣量 1 μL,分流比 50∶1,檢測(cè)器溫度為250℃,進(jìn)樣口溫度為230℃。
1.3.1 Plackett-Burman設(shè)計(jì)
采用單因素實(shí)驗(yàn)確定發(fā)酵過(guò)程中葡萄糖和酵母粉的添加量、初始pH、培養(yǎng)溫度、接種量、裝液量、磷酸鹽是發(fā)酵產(chǎn)酶過(guò)程中的重要影響因素。利用minitab15.0軟件設(shè)計(jì)Plackett-Burman設(shè)計(jì)表(N=12)考察以上實(shí)驗(yàn)因素對(duì)發(fā)酵產(chǎn)酶過(guò)程的影響,獲得產(chǎn)酶條件中的顯著影響因子。
1.3.2 正交試驗(yàn)設(shè)計(jì)
利用SPSS17.0設(shè)計(jì)5因素4水平的L16(45)正交設(shè)計(jì)表,進(jìn)一步考察顯著影響因子對(duì)發(fā)酵產(chǎn)酶過(guò)程的影響。
1.3.3 SVM回歸模型
SVM模型的擬合原理源于對(duì)數(shù)據(jù)的分類(lèi)問(wèn)題。模型對(duì)于小樣本、高維度、非線性的數(shù)據(jù)集有較好的擬合能力。以正交試驗(yàn)數(shù)據(jù)為樣本對(duì)SVM模型進(jìn)行訓(xùn)練,通過(guò)調(diào)整模型參數(shù)獲得較好的SVM回歸模型。SVM回歸模型擬合精度取決于核函數(shù)的選擇和參數(shù)的調(diào)整,常用的徑向基函數(shù)(Radial Basis Function,RBF)的參數(shù)在有效范圍內(nèi)改變時(shí)不會(huì)使空間復(fù)雜度變大,而且辨識(shí)效果較好[16],因此本文選用RBF作為核函數(shù),程序運(yùn)行環(huán)境為MATLAB R2010a。
1.3.4 粒子群優(yōu)化算法(PSO)
PSO算法是基于群體智能的隨機(jī)優(yōu)化算法,在對(duì)函數(shù)最優(yōu)解的搜索過(guò)程中,粒子個(gè)體通過(guò)一定規(guī)律向群體中較優(yōu)粒子位置靠近,并將當(dāng)前的最優(yōu)位置信息共享給其他個(gè)體,保證算法最終收斂的解全局最優(yōu)[17]。PSO算法以適應(yīng)度函數(shù)判斷粒子位置的優(yōu)劣,從而引導(dǎo)粒子趨向于適應(yīng)度函數(shù)的最優(yōu)解,通常適應(yīng)度函數(shù)即為待求解的函數(shù)。本文通過(guò)SVM模型對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行擬合,利用PSO算法搜索擬合函數(shù)模型的最優(yōu)解。
1.3.5 ANN神經(jīng)網(wǎng)絡(luò)模型建立
采用反向傳播(BP)方法建立ANN模型。模型中含有輸入層,隱含層和輸出層,以4個(gè)顯著影響因素值為輸入值,以實(shí)驗(yàn)獲得發(fā)酵液體積酶活為輸出值構(gòu)建網(wǎng)絡(luò)模型,其中隱含層和輸出層的傳遞函數(shù)分別為tansig函數(shù)和purling函數(shù),同時(shí)用trainbr算法訓(xùn)練網(wǎng)絡(luò),當(dāng)均方差(MSE)達(dá)到1×10-4時(shí),網(wǎng)絡(luò)停止訓(xùn)練。
采用Plackett-Burman設(shè)計(jì)考察不同發(fā)酵影響因素對(duì)菌體產(chǎn)酶量的影響。實(shí)驗(yàn)安排兩組空項(xiàng)考察實(shí)驗(yàn)的偶然誤差,每組實(shí)驗(yàn)安排3個(gè)平行樣取均值,實(shí)驗(yàn)結(jié)果如表1。對(duì)Plackett-Burman設(shè)計(jì)表中的參數(shù)因子,高低水平及分析結(jié)果見(jiàn)表2。
表1 Plackett-Burman設(shè)計(jì)及實(shí)驗(yàn)結(jié)果Table 1 Design matrix and result obtained by Plackett-Burman
表2 Plackett-Burman設(shè)計(jì)因子、水平及效應(yīng)Table 2 Analysis of factorial design of Plackett-Burman design
PB實(shí)驗(yàn)分析因子設(shè)計(jì)結(jié)果表明,A(溫度),C(pH),E(酵母粉添加量),G(葡萄糖添加量)4個(gè)因素的P值均小于0.05,證明相較于其他因素,其對(duì)菌體產(chǎn)酶過(guò)程中的影響顯著,因此可以作為菌體產(chǎn)酶過(guò)程中的主要決定因素。以正交試驗(yàn)進(jìn)一步考察它們對(duì)于發(fā)酵產(chǎn)酶的影響,同時(shí)綜合考慮其余因素的效應(yīng)值和成本,控制后續(xù)實(shí)驗(yàn)的培養(yǎng)基的裝液量40 mL/250 mL,KH2PO42.5 g/L,(NH4)2HPO42.5 g/L,接種量1%(v/v)。
通過(guò)預(yù)實(shí)驗(yàn)確定顯著影響因子的考察范圍為酵母粉10~55 g/L、葡萄糖 20~65 g/L、溫度 25~40℃、pH 4.0~10.0。設(shè)計(jì)L16(45)的正交試驗(yàn)進(jìn)一步探究顯著影響因子對(duì)發(fā)酵產(chǎn)酶條件的影響。兩組模型的擬合值與實(shí)驗(yàn)值如表3。
表3 正交試驗(yàn)及模型擬合結(jié)果Table 3 Orthogonal experiment design and fitting result
實(shí)驗(yàn)結(jié)果表明,SVM回歸模型和ANN模型的擬合值與實(shí)驗(yàn)值的最大誤差分別為0.8%和4.4%,說(shuō)明SVM回歸模型在影響因子設(shè)定的水平范圍內(nèi)對(duì)實(shí)驗(yàn)值有更好的擬合精度。為了進(jìn)一步驗(yàn)證2組模型對(duì)實(shí)驗(yàn)規(guī)律的重現(xiàn)能力,即模型的泛化性能。隨機(jī)設(shè)計(jì)16組實(shí)驗(yàn),利用2組擬合模型對(duì)16組實(shí)驗(yàn)結(jié)果進(jìn)行預(yù)測(cè),將每組實(shí)驗(yàn)的因素水平值作為模型的輸入,輸出值即為模型的預(yù)測(cè)值。SVM回歸模型與ANN擬合模型對(duì)實(shí)驗(yàn)結(jié)果預(yù)測(cè)值與實(shí)驗(yàn)值的比較見(jiàn)圖2。
圖2 ANN和SVM模型預(yù)測(cè)酶活比較Fig.2 Comparison of predicted enzyme activity by ANN and SVM model
表4 兩組模型的預(yù)測(cè)誤差比較Table 4 Comparison of predictions error of models
通過(guò)對(duì)兩組擬合模型預(yù)測(cè)值與實(shí)驗(yàn)值誤差比較發(fā)現(xiàn)SVM回歸模型具有較低的RMSE和SEP,證明SVM回歸模型對(duì)于實(shí)驗(yàn)有更強(qiáng)的預(yù)測(cè)能力。這可能是因?yàn)镾VM模型擬合源于對(duì)數(shù)據(jù)的最優(yōu)分類(lèi)問(wèn)題,模型在系統(tǒng)中尋找到一個(gè)最優(yōu)分類(lèi)面,使超平面有較好的分類(lèi)精度,同時(shí)使得分類(lèi)面兩側(cè)的空白區(qū)域最大,因此模型可以基于小樣本數(shù)據(jù)獲得良好的精度和外推性能,而ANN模型是大樣本啟發(fā)算法,需要大量樣本數(shù)據(jù)才能保證模型的精度。因此選用SVM回歸模型作為PSO優(yōu)化算法的適應(yīng)度函數(shù)構(gòu)建SVM-PSO優(yōu)化模型。同時(shí)在對(duì)正交試驗(yàn)的極差分析中發(fā)現(xiàn)4個(gè)顯著影響因素的最優(yōu)水平為酵母粉25.0 g/L,葡萄糖50.0 g/L,培養(yǎng)溫度30.0℃,初始pH 8.0,在此條件下進(jìn)行實(shí)驗(yàn)獲得的單位體積菌液酶活達(dá)到256.13 U/L。
以SVM回歸模型作為PSO優(yōu)化算法的適應(yīng)度函數(shù)建立SVM-PSO優(yōu)化模型。隨機(jī)產(chǎn)生16組4維向量作為SVM-PSO優(yōu)化模型的初始種群開(kāi)始全局有尋優(yōu)。在模型獲得的最優(yōu)條件下進(jìn)行3次重復(fù)實(shí)驗(yàn)取平均值,SVM-PSO模型的迭代次數(shù)與預(yù)測(cè)值和實(shí)驗(yàn)值的結(jié)果如表5。
表5 SVM-PSO預(yù)測(cè)結(jié)果Table 5 SVM-PSO model predict optimal culture conditions
優(yōu)化后的最佳產(chǎn)酶培養(yǎng)條件為葡萄糖47.7 g/L,酵母粉28.7 g/L,培養(yǎng)溫度32.0℃,初始pH值7.4,預(yù)測(cè)酶活為280.27 U/L,實(shí)驗(yàn)的最高酶活達(dá)到299.19 U/L,比優(yōu)化前的256.13 U/L提高16.81%。
PSO是一種全局優(yōu)化算法,因此在SVM-PSO模型尋優(yōu)過(guò)程中,不論初始群體的優(yōu)劣,只要迭代足夠的次數(shù),均收斂于相同的全局最優(yōu)解。為了考察SVM-PSO模型的全局收斂性,隨機(jī)選擇2組16行4列向量作為優(yōu)化模型初始種群開(kāi)始全局搜索,2組模型迭代次數(shù)與歸一化后的適應(yīng)度函數(shù)值的關(guān)系如圖3。
圖3 SVM-PSO模型收斂過(guò)程Fig.3 Converge process of SVM-PSO
實(shí)驗(yàn)結(jié)果表明,2組模型隨著迭代數(shù)的增加適應(yīng)度函數(shù)值逐漸增大,且最后收斂于相同的迭代解,證明初始種群的選擇不影響優(yōu)化模型的尋優(yōu)結(jié)果,模型具有良好的全局收斂性。同時(shí),2組模型的適應(yīng)度函數(shù)值最終在1.1521附近微小波動(dòng),表明通過(guò)對(duì)正交實(shí)驗(yàn)數(shù)據(jù)的分析,模型預(yù)測(cè)培養(yǎng)基優(yōu)化后的酶活將比正交實(shí)驗(yàn)最大酶活理論上最高提高15.21%。
優(yōu)化后的培養(yǎng)條件為葡萄糖47.7 g/L,酵母粉28.7 g/L,培養(yǎng)溫度32.0℃,初始pH值7.4,裝液量40 mL/250 mL,KH2PO42.5 g/L,(NH4)2HPO42.5 g/L,接種量1%(v/v),在優(yōu)化后的條件下進(jìn)行實(shí)驗(yàn)獲得的最高酶活達(dá)到299.19 U/L,比優(yōu)化前的256.13 U/L實(shí)際提高16.82%,證明構(gòu)建的SVM-PSO優(yōu)化模型對(duì)基于小樣本實(shí)驗(yàn)數(shù)據(jù)的無(wú)目標(biāo)函數(shù)優(yōu)化問(wèn)題有良好的處理能力。
[1] YasoharaY,N Kizaki,J Hasegawa,et al.Synthesis of optically active ethyl 4-chloro-3-hydroxybutanoate bymicrobial reduction[J].Applied Microbiology and Biotechnology,1999,51(6):847-851.
[2] 鐘萍,孫志浩.微生物法制備(S)-4-氯-3-羥基丁酸乙酯的研究[J]. 工業(yè)微生物,2005,35(2):7-8.
[3] 張明,吳景發(fā).釀酒酵母不對(duì)稱(chēng)催化合成(S)-4-氯-3-羥基丁酸乙酯[J].精細(xì)化工學(xué)報(bào),2004,34(1):034-063.
[4] Liu J F,Z J Zhang,A T Li,et al.Significantly enhanced production of recombinant nitrilase by optimization of culture conditions and glycerol feeding[J].Applied Microbiology and Biotechnology,2011,89(3):665-672.
[5] Kaliaperumal T,S Kumar,S N Gummadi,et al.Asymmetric synthesis of(S)-CHBE using Candida parapsilosis ATCC 7330[J].Journal of Industrial Microbiology & Biotechnology,2010,37(2):159-165.
[6] Singh V,M.Khan,S Khan,et al.Optimization of actinomycin V production by Streptomyces triostinicus using artificial neural network and genetic algorithm[J].Applied Microbiology and Biotechnology,2009,82(2):379-385.
[7] Cunha F M,A L G Bacchin,A C L Horta,et al.Indirect method for quantification of cellular biomass in a solidscontaining medium used as pre-culture for cellulase production[J].Biotechnology and Bioprocess Engineering,2012,17(1):100-108.
[8] Franco-Lara E,H Link,D Weuster-Botz.Evaluation of artificial neural networks for modelling and optimization of medium composition with a genetic algorithm[J].Process Biochemistry,2006,41(10):2 200-2 206.
[9] Desal K M,S K Akolkar,Y P Badhe,et al.Optimization of fermentation media for exopolysaccharide production from Lactobacillus plantarum using artificial intelligence-based techniques[J].Process Biochemistry,2006,41(8):1 842-1 848.
[10] Babaei M.A general approach to approximate solutions of nonlinear differential equations using particle swarm optimization[J].Applied Soft Computing,2013,13(7):3354-3365.
[11] 栗偉,蘇宏業(yè),劉瑞蘭.粒子群優(yōu)化算法在催化裂化模型參數(shù)估計(jì)中的應(yīng)用[J].化工學(xué)報(bào),2010,61(8):1 927-1 932.
[12] 王博,孫玉坤,嵇小輔,等.基于PSO-SVM逆的賴氨酸發(fā)酵過(guò)程軟測(cè)量[J].化工學(xué)報(bào),2012,(9):3 000-3 007.
[13] Huang J,L H Mei,J Xia.Application of artificial neural network coupling particle swarm optimization algorithm to biocatalytic production of GABA[J].Biotechnology and Bioengineering,2007,96(5):924-931.
[14] Fang,B S,H W Chen,X L Xie,et al.Using genetic algorithms coupling neural networks in a study of xylitol production:medium optimisation[J].Process Biochemistry,2003,38(7):979-985.
[15] Pouteau R,A Collin.Spatial location and ecological content of support vectors in an SVM classification of tropical vegetation[J].Remote Sensing Letters,2013,4(7):686-695.
[16] 高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京:機(jī)械工業(yè)出版社,2007:78-108.
[17] Mariano A P,Costa C B B,D D de Angelis,et al.Optimisation of a fermentation process for butanol production by particle swarm optimisation(PSO)[J].Journal of Chemical Technology and Biotechnology,2010,85(7):934-949.