郁惠蕾?gòu)堉锯x李春秀錢(qián)小龍郭 飛許建和
(1 華東理工大學(xué)生物反應(yīng)器工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200237;2 華東理工大學(xué)常熟研究院,蘇州百福安酶制劑有限公司,江蘇 215000)
大數(shù)據(jù)時(shí)代工業(yè)酶的發(fā)掘、改造和利用
許建和,本科畢業(yè)于清華大學(xué)化學(xué)系,華東理工大學(xué)與京都大學(xué)聯(lián)合培養(yǎng)博士。1995年起歷任華東理工大學(xué)助研、副研、教授。任教育部長(zhǎng)江學(xué)者特聘教授, 生物反應(yīng)器工程國(guó)家重點(diǎn)實(shí)驗(yàn)室主任,兼上海生物制造協(xié)同創(chuàng)新中心主任。亞洲生物技術(shù)聯(lián)合會(huì)執(zhí)委,第一屆亞洲生物技術(shù)大會(huì)共同主席。長(zhǎng)期從事生物催化與生物化工研究,曾主持1項(xiàng)“973計(jì)劃”課題、2項(xiàng)“863計(jì)劃”課題和7項(xiàng)國(guó)家自然科學(xué)基金。公開(kāi)發(fā)明專(zhuān)利60多項(xiàng),授權(quán)40項(xiàng),多項(xiàng)技術(shù)轉(zhuǎn)讓企業(yè)。
E-mail:jianhexu@ecust.edu.cn
郁惠蕾1張志鈞1李春秀1錢(qián)小龍2郭 飛2許建和1
(1 華東理工大學(xué)生物反應(yīng)器工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200237;2 華東理工大學(xué)常熟研究院,蘇州百福安酶制劑有限公司,江蘇 215000)
從當(dāng)今的生物信息大數(shù)據(jù)出發(fā),提出有別于傳統(tǒng)方法的工業(yè)酶挖掘新思路。在此基礎(chǔ)上結(jié)合最新研究成果,簡(jiǎn)要介紹幾種典型工業(yè)酶的設(shè)計(jì)和改造新策略。
隨著資源、環(huán)境問(wèn)題的日益加劇,可持續(xù)發(fā)展已成為全社會(huì)的共同目標(biāo)。當(dāng)今社會(huì)對(duì)“可持續(xù)發(fā)展”、“綠色化學(xué)”以及“環(huán)境友好制造”的呼聲越來(lái)越高。以節(jié)能、降耗、減排和高效生產(chǎn)為目標(biāo),基于工業(yè)酶催化劑的綠色制造過(guò)程也越來(lái)越多地受到學(xué)術(shù)界和產(chǎn)業(yè)界的關(guān)注。微生物基因組學(xué)、分子與結(jié)構(gòu)生物學(xué)、生物信息學(xué)及計(jì)算生物學(xué)等現(xiàn)代生物技術(shù)的迅猛發(fā)展,為酶的分子設(shè)計(jì)、高效制備以及生產(chǎn)應(yīng)用提供了科學(xué)基礎(chǔ)和技術(shù)支撐,使得更多工業(yè)規(guī)模的生物催化合成成為可能。
大數(shù)據(jù)開(kāi)啟了一次重大的時(shí)代轉(zhuǎn)型,正在改變我們的生活和了解世界的方式,同時(shí)也成為新發(fā)明和新服務(wù)的源泉。在生物技術(shù)領(lǐng)域,由于測(cè)序技術(shù)成本的大幅下跌,人們獲得基因序列的速度是10年前無(wú)法想象的。如何才能在最短的時(shí)間內(nèi),從海量的基因數(shù)據(jù)資源中迅速鑒別并獲得工業(yè)上有用的目標(biāo)酶基因和活性酶蛋白?基因挖掘(genomic mining)就是根據(jù)催化特定反應(yīng)的需要,從文獻(xiàn)中尋找相關(guān)酶的同源基因序列,并以此作為基因探針,在基因組數(shù)據(jù)庫(kù)中進(jìn)行序列比對(duì),篩選獲得同源酶的編碼信息,繼而進(jìn)行酶的批量異源表達(dá)和高通量篩選,最終獲得催化性能更優(yōu)的新型生物催化劑(1.0版)。隨著結(jié)構(gòu)生物學(xué)的迅猛發(fā)展,人們對(duì)蛋白質(zhì)結(jié)構(gòu)的認(rèn)識(shí)逐步加深,加上基因組學(xué)和蛋白質(zhì)組學(xué)所提供的大量結(jié)構(gòu)與功能信息,酶的分子改造也從以往的隨機(jī)突變,逐漸發(fā)展到半理性或理性設(shè)計(jì)等更精準(zhǔn)的方法,甚至可以利用計(jì)算機(jī)從頭設(shè)計(jì)自然界不存在的酶??傊?,生物催化劑的設(shè)計(jì)和制備已經(jīng)變得越來(lái)越簡(jiǎn)單,從而使得各行各業(yè)對(duì)特定酶的要求也變得更加迫切和可行。
目前已有眾多的數(shù)據(jù)庫(kù)公布了酶的基因序列、蛋白質(zhì)序列、蛋白質(zhì)性質(zhì)、蛋白質(zhì)結(jié)構(gòu)等信息,首先簡(jiǎn)單介紹一下這些可用于工業(yè)酶挖掘和改造的“大數(shù)據(jù)”。
1.1酶基因序列庫(kù)
根據(jù)基因組測(cè)序計(jì)劃統(tǒng)計(jì)網(wǎng)站GOLD(http://www.genomesonline.org/)截止到2016年1月9日的統(tǒng)計(jì)數(shù)據(jù),已有7826種生物的全基因組完成測(cè)序,有33 630個(gè)全基因組測(cè)序項(xiàng)目在進(jìn)行中;另有626個(gè)宏基因組測(cè)序項(xiàng)目正在進(jìn)行或已完成。截止到2015年12月,美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)網(wǎng)站登記的基因序列有1.89億條,堿基數(shù)量累計(jì)達(dá)到了2039億對(duì)(http://www.ncbi.nlm. nih.gov/genbank/statistics)。而全基因組鳥(niǎo)槍法測(cè)序數(shù)據(jù)庫(kù)(whole genome shotgun, WGS)記錄的來(lái)自個(gè)體和宏基因組的序列已有3.17億條,堿基數(shù)量累計(jì)1.2978萬(wàn)億對(duì)。在如此龐大的基因組數(shù)據(jù)庫(kù)中無(wú)疑包含著海量的工業(yè)酶基因資源。
1.2酶蛋白質(zhì)信息庫(kù)
根據(jù)Uniprot數(shù)據(jù)庫(kù)(http://www. uniprot.org)的統(tǒng)計(jì),截至2016年1月,已有明確功能標(biāo)注的蛋白質(zhì)序列數(shù)目達(dá)到55萬(wàn)條,未標(biāo)注的蛋白質(zhì)序列超過(guò)了5527萬(wàn)條(表1),由此可知其中標(biāo)注功能的蛋白質(zhì)僅占約1%,而絕大多數(shù)(約99%)蛋白質(zhì)的功能尚屬未知,有待研究解析。在已有明確功能標(biāo)注的蛋白質(zhì)序列中,屬于六大酶類(lèi)的序列約有26.5萬(wàn)條,其中 氧化還原酶3.9萬(wàn)條,轉(zhuǎn)移酶9.1萬(wàn)條,水解酶6.5萬(wàn)條,裂合酶2.4萬(wàn)條,異構(gòu)酶1.4萬(wàn)條,連接酶3.1萬(wàn)條。在未標(biāo)注功能的蛋白質(zhì)中,被預(yù)測(cè)為六大酶類(lèi)的共約715.1萬(wàn)條,其中氧化還原酶172.3萬(wàn)條,轉(zhuǎn)移酶218.0萬(wàn)條,水解酶159.0萬(wàn)條,裂合酶61.6萬(wàn)條,異構(gòu)酶43.4萬(wàn)條,連接酶60.8萬(wàn)條。其中每一類(lèi)還有各種亞類(lèi)的統(tǒng)計(jì),例如圖1是預(yù)測(cè)的氧化還原酶亞類(lèi)的分布情況。
表1 Uniprot數(shù)據(jù)庫(kù)中統(tǒng)計(jì)的蛋白質(zhì)序列數(shù)
?
KAZLAUSKAS R J, BORNSCHEUER U T. Finding better protein engineering strategies. Nature Chem Biol, 2009, 5(8): 526-529.
?
HILVERT D, HOUK K N, STODDARD B L, et al. De novo computational design of retro-aldol enzymes. Science, 2008, 319 (5868): 1387-1391.
?
GIGER L, CANER S, OBEXER R, et al. Evolution of a designed retro-aldolase leads to complete active site remodeling. Nature Chem Biol, 2013, 9(8): 494-498.
?
NI Y, LI C X, ZHANG J, et al. Efficient reduction of ethyl 2-oxo-4-phenylbutyrate at 620 g/L by a bacterial reductase with broad substrate spectrum. Adv Synth Catal, 2011, 353(8): 1213-1217.
?
NI Y, LI C X, WANG L J, et al. Highly stereoselective reduction of prochiral ketones by a bacterial reductase coupled with cofactor regeneration. Org Biomol Chem, 2011, 9(15): 5463-5468.
?
NI Y, PAN J, MA H M, et al. Bioreduction of methyl o-chlorobenzoylformate at 500 g/L without external cofactors for efficient production of enantiopure clopidogrel intermediate. Tetrahedron Lett, 2012, 53(35): 4715-4717.
?
ZHANG Y J, ZHANG W X, ZHENG G W, et al. Identification of an ε-keto ester reductase for the efficient synthesis of an (R)-α-Lipoic acid precursor. Adv Synth Catal, 2015, 357: 1697-1702.
?
ZHANG C S, ZHANG Z J, LI C X, et al. Efficient production of (R)-o-chloromandelic acid by deracemization of o-chloromandelonitrile with a new nitrilase mined from Labrenzia aggregate. Appl Microbiol Biotechnol, 2012, 95(1): 91-99.
?
HOHNE M, SCHATZLE S, JOCHENS H, et al. Rational assignment of key motifs for function guides in silico enzyme identification. Nat Chem Biol, 2010, 6(11): 807-813.
另外,Brenda (http://www.brendaenzymes.org)是一個(gè)用戶友好的酶數(shù)據(jù)庫(kù)(圖2)。可以用目標(biāo)酶的名字、酶學(xué)委員會(huì)(EC)編號(hào)或者序列搜索,進(jìn)入與目標(biāo)酶屬于同一EC編號(hào)的酶數(shù)據(jù)集,其中包含該酶的各種來(lái)源信息、最適pH、最適溫度、動(dòng)力學(xué)參數(shù)、催化反應(yīng)和三維結(jié)構(gòu)鏈接,甚至還有已報(bào)道的突變體等信息。
圖1 預(yù)測(cè)的氧化還原酶的亞類(lèi)分布情況
1.3酶結(jié)構(gòu)數(shù)據(jù)庫(kù)
圖2 Brenda酶綜合信息系統(tǒng)主頁(yè)
根據(jù)蛋白質(zhì)數(shù)據(jù)庫(kù)PDB(http:// www.rcsb.org/pdb/home/home.do)統(tǒng)計(jì),截止到2015年12月,已公布的蛋白質(zhì)結(jié)構(gòu)總數(shù)已達(dá)到114 741個(gè),其中絕大多數(shù)(102 306個(gè),約89%)是通過(guò)X射線衍射法獲得的,其次是通過(guò)核磁共振譜(11 145個(gè),約10%)和冷凍電鏡法(926個(gè),約1%)獲得。按六大 酶類(lèi)分別統(tǒng)計(jì),各類(lèi)酶的已知結(jié)構(gòu)數(shù)總計(jì)60 443個(gè),按Uniprot名字刪除重復(fù)和其突變體結(jié)構(gòu)后總數(shù)為6525個(gè),占已標(biāo)注酶蛋白質(zhì)總數(shù)的2.46%。六大酶類(lèi)已有結(jié)構(gòu)信息公開(kāi)的統(tǒng)計(jì)數(shù)據(jù)見(jiàn)表2,其中以水解酶、轉(zhuǎn)移酶和氧化還原酶這三類(lèi)酶為主。這些結(jié)構(gòu)信息的公布,為蛋白質(zhì)的結(jié)構(gòu)功能關(guān)系研究和理性設(shè)計(jì)改造提供了重要信息。
在筆者前一綜述文章“后基因組時(shí)代工業(yè)酶資源的挖掘和應(yīng)用”(參見(jiàn)《生物產(chǎn)業(yè)技術(shù)》2011年01期)中已經(jīng)介紹,基因挖掘是一種后基因組時(shí)代更加快速、高效地獲取新酶的方法,它極大地縮短了新酶的開(kāi)發(fā)周期,從常規(guī)的2~3年可縮短至2~3個(gè)月,甚至2~3周。下面具體介紹幾種酶的基因挖掘策略。
表2 PDB數(shù)據(jù)庫(kù)中六大酶類(lèi)蛋白結(jié)構(gòu)公布的情況
2.1從已測(cè)序的微生物基因組中挖掘目標(biāo)酶基因
隨著基因測(cè)序技術(shù)的飛速發(fā)展,越來(lái)越多的微生物基因組被測(cè)序,其中有一部分基因的開(kāi)放閱讀框所編碼的酶潛在功能已被預(yù)測(cè),但可能未經(jīng)實(shí)驗(yàn)證實(shí);另有大量開(kāi)放閱讀框所編碼的酶信息仍未被注釋或?qū)嶒?yàn)研究。一方面可以直接將已注釋的假想酶基因進(jìn)行克隆表達(dá),并通過(guò)活力檢測(cè)來(lái)獲得所需的候選生物催化劑;另一方面還可通過(guò)對(duì)未注釋酶的開(kāi)放閱讀框進(jìn)行比對(duì)分析,并與已報(bào)道類(lèi)似酶的保守序列進(jìn)行比較,找到具有潛在功能的目標(biāo)新酶編碼序列,進(jìn)而通過(guò)克隆表達(dá)來(lái)獲得結(jié)構(gòu)/功能全新的目標(biāo)生物催化劑。后者的風(fēng)險(xiǎn)相對(duì)較大(成功率較低),但創(chuàng)新性更強(qiáng),比較容易獲得知識(shí)產(chǎn)權(quán)。
例如,倪燕等通過(guò)對(duì)Bacillus sp.的基因組進(jìn)行分析,發(fā)現(xiàn)其中有13個(gè)潛在的羰基還原酶開(kāi)放閱讀框,通過(guò)對(duì)這些潛在的酶基因進(jìn)行克隆表達(dá),發(fā)現(xiàn)其中一個(gè)酶(FabG)能夠?qū)⒏邼舛龋?20g/L)的2-羰基-4-苯基丁酸乙酯高立體選擇性地還原為光學(xué)純(S)-2-羥基-4-苯基丁酸乙酯(光學(xué)純度>99%)。另外一個(gè)還原酶(yueD)則對(duì)4-氯-3-羰基丁酸乙酯表現(xiàn)出很高的催化活性,通過(guò)在兩相反應(yīng)體系中進(jìn)行分批補(bǔ)料反應(yīng),濃度高達(dá)215 g/L(1.3mol/L)的底物可被完全轉(zhuǎn)化,產(chǎn)物(R)-4-氯-3-羥基丁酸乙酯的得率和對(duì)映體光學(xué)純度分別為97.3%和99.6%。還有一個(gè)還原酶(YtbE)能夠耐受高濃度的鄰氯苯甲酰甲酸甲酯,并將500g/L的底物完全轉(zhuǎn)化為光學(xué)純(R)-鄰氯扁桃酸甲酯,后者是世界第二大暢銷(xiāo)藥氯吡格雷的關(guān)鍵手性中間體。
2.2基于探針酶序列的基因挖掘
?
SEFFERNICK J L, SAMANTA S K, LOUIE T M, et al. Investigative mining of sequence data for novel enzymes: a case study with nitrilases. J Biotechnol, 2009, 143(1): 17-26.
?
MAK W S, TRAN S, MARCHESCHI R, et al. Integrative genomic mining for enzyme function to enable engineering of a non-natural biosynthetic pathway. Nature Commun, 2015, 6: 10005.
?
SAVILE C K, JANEY J M, MUNDORFF E C, et al. Biocatalytic asymmetric synthesis of chiral amines from ketones applied to sitagliptin manufacture. Science, 2010, 329(5989): 305-309.
?
ALVIZO O, NGUYEN L J, SAVILE C K, et al. Directed evolution of an ultrastable carbonic anhydrase for highly efficient carbon capture from flue gas. Proc Natl Acad Sci USA, 2014, 46(111): 16436-16441.
?
WARDEN A C, WILLIAMS M, PEAT T S, et al. Rational engineering of a mesohalophilic carbonic anhydrase to an extreme halotolerant biocatalyst. Nature Commun, 2015, 6: 10278.
?
KONG X D, LI L, CHEN S, et al. Engineering of an epoxide hydrolase for efficient bioresolution of bulky pharmaco substrates. Proc Natl Acad Sci USA, 2014, 111 (44): 15717-15722.
?
KONG X D, MA Q, ZHOU J H, et al. A smart library of epoxide hydrolase variants and the top hits for synthesis of (S)-β-blocker precursors. Angew Chem Int Ed, 2014, 53(26): 6641-6644.
?
LIST B, PUPO G. Enzyme microtuning for the synthesis of β-blocker precursors. Synfacts, 2014, 10(8): 866.
?
LUO X J, KONG X D, ZHAO J, et al. Switching a newly discovered lactonase into an efficient and thermostable phosphotriesterase by simple double mutations His250Ile/Ile263Trp. Biotechnol Bioeng, 2014, 111(10): 1920-1930.
當(dāng)催化某類(lèi)反應(yīng)的相關(guān)酶(或多肽)基因序列已有文獻(xiàn)報(bào)道后,就可以利用此序列作為基因探針(或稱(chēng)模板)在公共基因組數(shù)據(jù)庫(kù)中進(jìn)行檢索,找到與探針序列具有一定同源性的候選酶基因,進(jìn)而根據(jù)檢索到的基因序列設(shè)計(jì)引物,利用PCR擴(kuò)增法獲得編碼這些酶的DNA,并將它們進(jìn)行克隆表達(dá),最后通過(guò)目標(biāo)底物進(jìn)行活性篩選,即可能獲得所需要的具有特定催化功能的生物催化劑(圖3)。例如,筆者所在實(shí)驗(yàn)室從基因組數(shù)據(jù)庫(kù)中挑選、規(guī)劃了1000多種結(jié)構(gòu)多樣、功能各異的醇脫氫酶/羰基還原酶(圖4),目前已經(jīng)成功制備了600多種凍干酶制劑,可以滿足我國(guó)醫(yī)藥化工企業(yè)對(duì)部分工業(yè)生物催化劑的定制服務(wù)需求。最近,利用上述酶庫(kù)為(R)-硫辛酸生產(chǎn)企業(yè)量身定制的ε-羰基還原酶,可高效催化還原330g/L的8-氯-6-羰基辛酸乙酯,產(chǎn)物光學(xué)純度>99%,已申請(qǐng)國(guó)際專(zhuān)利(PCT/CN2015/073615),并成功實(shí)現(xiàn)技術(shù)轉(zhuǎn)移和產(chǎn)業(yè)化應(yīng)用。
又如,為了尋找能夠催化鄰氯扁桃腈水解制備鄰氯扁桃酸的腈水解酶,張陳勝等以扁桃腈水解酶基因的保守序列為探針在基因數(shù)據(jù)庫(kù)中進(jìn)行比對(duì)篩選,選取序列同源性在40%~70%的基因進(jìn)行克隆表達(dá),并根據(jù)它們對(duì)鄰氯扁桃腈的活力和對(duì)映選擇性進(jìn)行篩選,最終獲得的重組腈水解酶能夠耐受300mmol/L鄰氯扁桃腈,產(chǎn)物的得率和光學(xué)純度分別為94.5%和96.5%。
圖3 基于探針序列信息從基因組數(shù)據(jù)庫(kù)中挖掘新酶的技術(shù)路線
圖4 醇脫氫酶/羰基還原酶“千酶庫(kù)”的分子進(jìn)化樹(shù)
2.3基于序列和結(jié)構(gòu)信息相結(jié)合的新酶基因挖掘
從已測(cè)序微生物基因組中直接克隆酶的基因并進(jìn)行異源表達(dá),或者基于探針酶的序列在基因數(shù)據(jù)庫(kù)中挖掘目標(biāo)酶的技術(shù)業(yè)已成熟并取得了較好的應(yīng)用效果,不過(guò)其前提條件是未知酶的功能已經(jīng)被預(yù)測(cè)注釋?zhuān)蛘叽呋囟ǖ孜镛D(zhuǎn)化的酶基因序列已經(jīng)公開(kāi)報(bào)道。然而,針對(duì)某些特定的底物,僅僅基于催化類(lèi)似反應(yīng)的酶的序列信息所挖掘得到的酶,往往無(wú)法催化目標(biāo)底物的轉(zhuǎn)化,或者雖能催化反應(yīng)卻不能達(dá)到預(yù)期的效果。如果能將基因挖掘和結(jié)構(gòu)分析等相關(guān)信息結(jié)合起來(lái),將有望顯著提高基因挖掘的效率。
由于轉(zhuǎn)氨酶在有機(jī)合成領(lǐng)域具有重要的應(yīng)用,近年來(lái)這類(lèi)酶受到越來(lái)越多研究者的關(guān)注,然而大多數(shù)已報(bào)道的轉(zhuǎn)氨酶都是S-選擇性的,而R-選擇性的轉(zhuǎn)氨酶則非常少。德國(guó)Born scheuer等為了獲得R-選擇性的轉(zhuǎn)氨酶,首先對(duì)文獻(xiàn)報(bào)道的S-選擇性轉(zhuǎn)氨酶的結(jié)構(gòu)進(jìn)行分析,找到可將S-選擇性轉(zhuǎn)氨酶轉(zhuǎn)變?yōu)镽-選擇性轉(zhuǎn)氨酶所需要的突變位點(diǎn)和替代氨基酸,根據(jù)這些相關(guān)信息在基因數(shù)據(jù)庫(kù)中搜索已經(jīng)含有這些氨基酸突變位點(diǎn)的基因序列,將這些潛在的目標(biāo)酶基因在大腸桿菌中進(jìn)行克隆表達(dá),并基于對(duì)目標(biāo)底物的催化效果進(jìn)行篩選,最終得到17個(gè)能催化合成一系列(R)-胺的R-選擇性轉(zhuǎn)氨酶,產(chǎn)物的對(duì)映體過(guò)量值達(dá)到99%以上。
2.4計(jì)算介導(dǎo)的基因挖掘
在構(gòu)建非天然長(zhǎng)鏈醇的生物合成途徑中,Siegel等提供了一種新的生物信息學(xué)和分子模擬相結(jié)合的功能酶基因組挖掘方法。通過(guò)這種計(jì)算介導(dǎo)的基因挖掘方法獲得的酶GEO175是常規(guī)篩選所得酶活力的75倍,該計(jì)算介導(dǎo)的基因組功能酶挖掘新方法如圖5所示,包括以下幾個(gè)步驟:①通過(guò)序列比對(duì)得到2082個(gè)酮異戊酸脫羧酶(KIVD)的同源酶(genomic enzyme orthologues,GEOs),剔除彼此同源性大于90%及真核來(lái)源的GEOs,以增加候選酶在大腸桿菌中的可溶性表達(dá)概率;②用Rosetta Comparative Modeling同源建模,用TMalign算法進(jìn)一步篩選后共獲得239個(gè)GEOs,這239個(gè)序列間同源性約20%;③將這239個(gè)GEOs與C8底物進(jìn)行分子對(duì)接,顯示GEO175酶的界面能(interface energy)最低,即最有可能催化C8底物;④根據(jù)界面能及同源性高低,挑選10個(gè)GEOs進(jìn)行動(dòng)力學(xué)表征,結(jié)果6個(gè)酶獲得了可溶蛋白,3個(gè)酶對(duì)酮酸具有可檢測(cè)的活性。
近年來(lái),隨著現(xiàn)代生物科學(xué)尤其是結(jié)構(gòu)生物學(xué)的快速發(fā)展,定向進(jìn)化與理性設(shè)計(jì)相結(jié)合的半理性分子設(shè)計(jì)方法陸續(xù)出現(xiàn)(圖6),例如對(duì)鄰近有限位點(diǎn)進(jìn)行組合隨機(jī)突變的CASTing方法、QSAR、外顯子改組等。大量計(jì)算方法如ProSAR、SCHEMA、Rosseta等的應(yīng)用,大大提高了突變體設(shè)計(jì)分析的效率和準(zhǔn)確性。同時(shí),在突變體文庫(kù)的構(gòu)建方面也出現(xiàn)了迭代飽和突變、簡(jiǎn)化密碼子表、基于簡(jiǎn)并密碼子的限制性文庫(kù)方法等。這些技術(shù)在增加酶的底物多樣性和改變酶的各種性能方面已獲得許多成功應(yīng)用。
圖5 計(jì)算介導(dǎo)基因組功能酶挖掘流程
在酶的分子改造中最具代表性的案例之一,是糖尿病藥物西他列汀合成用酶的分子改造?;诘鞍踪|(zhì)結(jié)構(gòu),通過(guò)分子模擬和點(diǎn)飽和突變對(duì)節(jié)桿菌轉(zhuǎn)氨酶進(jìn)行重新設(shè)計(jì),最終通過(guò)多輪特定環(huán)境下的定向進(jìn)化所獲得的突變酶有27個(gè)突變位點(diǎn),具有較廣的底物適應(yīng)范圍、較高的活性和很強(qiáng)的環(huán)境耐受能力(反應(yīng)溫度45~50℃、50% DMSO、底物濃度200g/L),而傳統(tǒng)的定向進(jìn)化方法幾乎不可能得到具備如此多性能優(yōu)勢(shì)的酶。該酶替代了原有工藝中的貴金屬釕催化劑,解決了高壓生產(chǎn)過(guò)程的危險(xiǎn)性和高成本等問(wèn)題,使現(xiàn)有設(shè)備的生產(chǎn)能力提高56%,反應(yīng)產(chǎn)率提高10%~13%,廢物的產(chǎn)生量降低了19%。Merck和Codexis公司也因此獲得了2010年美國(guó)總統(tǒng)綠色化學(xué)挑戰(zhàn)獎(jiǎng)。
圖6 酶的蛋白質(zhì)工程改造策略
另一典型案例是碳酸酐酶的分子改造。為了解決氣候變暖的問(wèn)題,需要處理工業(yè)尾氣中的CO2,碳酸酐酶可顯著提高CO2的捕集效率,但其應(yīng)用仍受限于工業(yè)苛刻條件下酶的穩(wěn)定性。Alvizo等采用定向進(jìn)化技術(shù),結(jié)合高通量篩選和ProSAR,分析識(shí)別有益突變點(diǎn)和飽和突變等策略,通過(guò)多輪突變獲得的突變體可以耐受極端高溫(107℃)和堿性條件(4.2 mol/L堿性胺溶劑、pH >10.0),比天然酶的穩(wěn)定性提高了4 000 000倍。在工業(yè)示范規(guī)模下,利用這一突變酶CO2的捕集效率提高了25倍。最近澳大利亞科學(xué)家通過(guò)理性設(shè)計(jì)改變碳酸酐酶Ⅱ表面的18個(gè)氨基酸殘基獲得高度耐鹽的酶變體,在高鹽條件下(>3mol/L鈉鹽)其催化活性和解折疊溫度,比野生酶明顯增加。分子動(dòng)力學(xué)計(jì)算表明,酶與鈉離子形成高度有序的鈉離子水化層,對(duì)酶在高鹽環(huán)境中的穩(wěn)定性起關(guān)鍵作用。這是首次通過(guò)改造普通酶而獲得極端酶的耐受性,類(lèi)似的策略對(duì)于生物催化劑的耐受性改造具有參考意義。
圖7 環(huán)氧水解酶的催化反應(yīng)及產(chǎn)物釋放通道示意
筆者所在實(shí)驗(yàn)室前期篩選獲得的巨大芽孢桿環(huán)氧水解酶BmEH,能催化苯基環(huán)氧底物制備β-阻斷劑等藥物的手性環(huán)氧中間體,但當(dāng)苯環(huán)上帶有大位阻取代基時(shí),酶的催化活力則變得很低(<1%),從而成為制約該酶產(chǎn)業(yè)化應(yīng)用的一大瓶頸問(wèn)題。為了解決上述BmEH工業(yè)化應(yīng)用的難題,筆者所在實(shí)驗(yàn)室首先解析了該酶與底物類(lèi)似物的復(fù)合物晶體結(jié)構(gòu),發(fā)現(xiàn)3個(gè)位點(diǎn)存在底物類(lèi)似物,其中Zone 2被確定為催化反應(yīng)位點(diǎn),Zone 1為底物進(jìn)入通道,Zone 3為假定的釋放產(chǎn)物通道,但它在野生酶分子中被大位阻氨基酸(Met145,Phe128)所阻塞。通過(guò)將兩個(gè)關(guān)鍵的界面氨基酸突變?yōu)轶w積較小的丙氨酸,即拓展了Zone 3的產(chǎn)物通道,所得突變酶催化大位阻萘基底物的活力提高近900倍,從而證實(shí)了筆者提出的“產(chǎn)物釋放通道”假說(shuō)(圖7)。在了解環(huán)氧水解酶底物進(jìn)入、催化反應(yīng)及產(chǎn)物釋放機(jī)理的基礎(chǔ)上,筆者進(jìn)一步針對(duì)底物結(jié)合位點(diǎn)周?chē)陌被嵩O(shè)計(jì)了小巧的半飽和突變庫(kù),并利用一系列臨床上有用的大位阻底物進(jìn)行活力篩選,最終達(dá)到每一種底物都能找到高活力突變體的目的(圖8)。最終,利用定點(diǎn)突變所獲得的環(huán)氧水解酶突變體,成功實(shí)現(xiàn)了一系列大位阻β-阻斷劑藥物環(huán)氧中間體的酶促水解拆分,并制備獲得了一系列洛爾類(lèi)心血管藥物的關(guān)鍵手性中間體。這一成果受到《Synfacts》期刊特邀專(zhuān)家的亮點(diǎn)評(píng)述,指出作者通過(guò)活性中心兩個(gè)關(guān)鍵位點(diǎn)的微調(diào),極大地拓展了酶的底物譜,建立了高效的環(huán)氧水解拆分反應(yīng)途徑。
圖8 環(huán)氧水解酶及其突變體的底物譜
現(xiàn)代農(nóng)業(yè)由于過(guò)量使用有機(jī)磷農(nóng)藥給食品安全和環(huán)境凈化帶來(lái)很大挑戰(zhàn)。有機(jī)磷水解酶OPHC2是β-內(nèi)酰胺酶家族的一員,但是關(guān)于它在自然進(jìn)化過(guò)程中是如何獲得磷酸三酯水解活力的問(wèn)題,目前尚未有任何報(bào)道。為了探索其所催化各種反應(yīng)之間的內(nèi)在進(jìn)化關(guān)系,筆者所在實(shí)驗(yàn)室以食油假單胞菌中的有機(jī)磷水解酶PoOPH為研究對(duì)象,該酶具有很高的酯酶和內(nèi)酯酶活力,但僅有很低的磷酸三酯水解活力。通過(guò)多序列比對(duì)分析發(fā)現(xiàn),活性口袋周?chē)?50位的組氨酸和263位的異亮氨酸在所有的有機(jī)磷水解酶中高度保守,因此筆者推測(cè)這兩個(gè)氨基酸對(duì)該類(lèi)酶的催化活力和底物專(zhuān)一性具有關(guān)鍵作用?;诖?,筆者構(gòu)建了這兩個(gè)位點(diǎn)的定點(diǎn)飽和突變庫(kù),并分別考察了它們的酯酶、內(nèi)酯酶和磷酸三酯酶活力,結(jié)果表明:將這兩個(gè)位點(diǎn)的氨基酸突變?yōu)槠渌?lèi)型的氨基酸均會(huì)顯著降低原有的酯酶和內(nèi)酯酶活力,而本來(lái)極低的磷酸三酯酶活力則獲得顯著的提升。特別值得一提的是,雙突變體H250I/I263W催化甲基對(duì)硫磷和乙基對(duì)氧磷的水解活力比野生酶分別提高了6962倍和106倍,而其原有的酯酶和內(nèi)酯酶活力卻顯著降低,酶的底物專(zhuān)一性發(fā)生了107倍的逆轉(zhuǎn)。
2015年7月,美通社在線發(fā)布《2014年全球工業(yè)酶行業(yè)研究報(bào)告及未來(lái)三年預(yù)測(cè)》。近年來(lái),全球工業(yè)酶制劑市場(chǎng)規(guī)模逐年增加,年產(chǎn)值增長(zhǎng)率為5%,2014年已達(dá)42.2億美元的規(guī)模。目前,全球工業(yè)酶市場(chǎng)基本上是寡頭壟斷。在2014年,諾維信作為工業(yè)用酶巨頭,占據(jù)了44%的市場(chǎng)份額;而杜邦公司和DSM分別占據(jù)20%和6%的市場(chǎng)份額。全球各地區(qū)需求呈現(xiàn)較大差異,歐洲和北美地區(qū)對(duì)工業(yè)酶的需求量最大,占據(jù)80%,而中國(guó)僅占9.4%。
在市場(chǎng)需求擴(kuò)大和政策利好的雙重刺激下,2014年中國(guó)的工業(yè)酶制劑產(chǎn)量已達(dá)116.57萬(wàn)噸并保持10%年產(chǎn)量增長(zhǎng)趨勢(shì),預(yù)計(jì)2017年產(chǎn)量將達(dá)到154.87噸。通過(guò)引進(jìn)國(guó)外先進(jìn)的設(shè)備、優(yōu)良的菌株以及新型酶制劑的開(kāi)發(fā),中國(guó)已開(kāi)始進(jìn)入酶制劑工業(yè)的快速發(fā)展期。但在酶制劑研發(fā)的原始創(chuàng)新方面尚有一定差距,多數(shù)企業(yè)的自主開(kāi)發(fā)能力還十分有限。
若能抓住當(dāng)今大數(shù)據(jù)、互聯(lián)網(wǎng)+的時(shí)代機(jī)遇,充分利用好全球共享共用的生物信息資源,掌握工業(yè)酶設(shè)計(jì)和改造的核心技術(shù),并將之轉(zhuǎn)化為具有我國(guó)自主知識(shí)產(chǎn)權(quán)的工業(yè)酶實(shí)體資源,則可望從源頭上引領(lǐng)我國(guó)生物催化學(xué)科的快速崛起,推進(jìn)生物制造產(chǎn)業(yè)的高起點(diǎn)和跨越式發(fā)展。
10.3969/j.issn.1674-0319.2016.02.006