蔡海鶯,李楊 ,張輝,馮鳳琴
1 浙江大學(xué)食品科學(xué)與營(yíng)養(yǎng)系,浙江 杭州 310058
2 浙江大學(xué)馥莉食品研究院,浙江 杭州 310058
隨著現(xiàn)代基因工程和生物工程理論和技術(shù)的高速發(fā)展,無論是基礎(chǔ)研究領(lǐng)域,還是生物醫(yī)藥、農(nóng)業(yè)、環(huán)保和食品等應(yīng)用領(lǐng)域,利用異源表達(dá)系統(tǒng)生產(chǎn)更高水平的目的重組蛋白都已成為研究熱點(diǎn)和重點(diǎn)。相對(duì)于原始基因在自身宿主的表達(dá),利用異源宿主表達(dá)重組蛋白具有許多優(yōu)點(diǎn):首先,異源表達(dá)可能顯著提高目的蛋白的表達(dá)量[1];其次,異源表達(dá)中通常所選的宿主具有相對(duì)透徹的研究背景,以及成熟的發(fā)酵和分離純化工藝,有利于提高生產(chǎn)效率、節(jié)約成本;另外,異源表達(dá)中通常所選的宿主具有生物安全性,在食品和醫(yī)藥方面,有利于避免使用病原宿主而引發(fā)的潛在風(fēng)險(xiǎn)[2]。
1977年,Genentech公司的Itakura等[3]首次完成基因的異源表達(dá),將化學(xué)合成的人體蛋白生長(zhǎng)抑素基因以和 β-半乳糖苷酶基因融合的形式在原核生物大腸桿菌E. coli中表達(dá),并得到具有功能活性的生長(zhǎng)抑素。隨著生物技術(shù)不斷發(fā)展,絕大多數(shù)的基因都能通過PCR (Polymerase chain reaction) 和 RT-PCR (Reverse transcription -Polymerase chain reaction) 等核酸擴(kuò)增技術(shù)得到,但是基因合成并不能被完全替代。人們把PCR擴(kuò)增技術(shù)獲得的完整基因克隆到表達(dá)載體并轉(zhuǎn)化到表達(dá)宿主后發(fā)現(xiàn),克隆的基因經(jīng)常不能表達(dá)出重組蛋白,或僅僅表達(dá)出很低水平的重組蛋白。研究人員通過各種手段一定程度地緩解了這一問題,如提高宿主的分泌能力,使用蛋白酶缺陷的宿主,提高基因的拷貝數(shù),采用強(qiáng)的啟動(dòng)子,融合表達(dá),共表達(dá)分子伴侶等。但是這些手段都忽略一個(gè)潛在但又非常重要的問題,采用PCR擴(kuò)增的編碼蛋白基因在不同的生物體內(nèi)對(duì)應(yīng)的DNA序列可能差異巨大。而這些編碼重組蛋白的核酸序列在其他生物體內(nèi)表達(dá)時(shí),可能在轉(zhuǎn)錄、翻譯等不同表達(dá)水平受到各種因素的限制。因此,從不同角度對(duì)基因序列進(jìn)行優(yōu)化或者重新根據(jù)蛋白序列進(jìn)行基因設(shè)計(jì)以提高蛋白重組表達(dá)的效率逐漸成為現(xiàn)代生物技術(shù)的研究熱點(diǎn)之一。但目前基因設(shè)計(jì)和優(yōu)化理論尚不完善,各種優(yōu)化效果參差不齊,本文根據(jù)現(xiàn)有報(bào)道,系統(tǒng)綜述了基因設(shè)計(jì)對(duì)重組蛋白表達(dá)影響的研究進(jìn)展。
不同物種的基因在密碼子使用上存在著明顯的偏好性,甚至同物種內(nèi)不同功能的基因其密碼子使用頻率也存在較大的差異,密碼子偏愛性對(duì)重組蛋白的異源表達(dá)具有深刻復(fù)雜的影響[4]。在原核生物內(nèi),密碼子使用頻率已經(jīng)被鑒定為影響翻譯的基因序列元件中重要的要素[5]。密碼子偏愛性在真核生物內(nèi)同樣是影響蛋白表達(dá)水平的關(guān)鍵因素之一。目前,密碼子偏愛性影響蛋白表達(dá)的主要機(jī)制已基本確定,生物體偏愛的密碼子與體內(nèi)對(duì)應(yīng)的 tRNA的豐度基本呈正相關(guān),而tRNA的豐度決定在蛋白翻譯延伸的過程中可用的氨基酸數(shù)量,從而影響了蛋白合成的效率[6]。
一方面異源表達(dá)系統(tǒng)具有自己的獨(dú)特優(yōu)勢(shì),另一方面,由于不同生物的密碼子偏愛性存在差異,異源表達(dá)可能原始編碼重組蛋白的基因從偏愛的密碼子變成影響翻譯的稀有密碼子。如何降低這一風(fēng)險(xiǎn)已成為異源表達(dá)系統(tǒng)的重要步驟之一。
1.2.1 改造宿主
既然已知 tRNA的缺乏可能導(dǎo)致對(duì)應(yīng)的稀有密碼子在蛋白表達(dá)過程中使翻譯速率降低甚至終止,從而使蛋白水平顯著降低,研究者為了避免蛋白表達(dá)在翻譯環(huán)節(jié)受到限制,應(yīng)用了一種在宿主體內(nèi) (通常是細(xì)菌) 通過質(zhì)粒補(bǔ)充稀有密碼子對(duì)應(yīng)的 tRNA的策略進(jìn)行蛋白表達(dá)的優(yōu)化[7]。這種方法在E. coli中應(yīng)用非常成功(例如pRARE2),許多外源蛋白在E. coli中表達(dá)量都顯著提高[8]。同時(shí),在異源宿主中共表達(dá)特殊的tRNA能在一定程度上修飾宿主的密碼子偏愛性效應(yīng)并提高目的蛋白的表達(dá)量的現(xiàn)象,也間接證明密碼子偏愛性是通過控制可用的tRNA豐度影響蛋白的翻譯過程。該方法已被廣泛用作密碼子優(yōu)化提高蛋白表達(dá)的策略之一。
1.2.2 稀有密碼子替換
為了使外源基因在異源表達(dá)系統(tǒng)內(nèi)有效表達(dá),通過優(yōu)化基因的密碼子是十分有效的方法。擁有所用宿主的稀有密碼子越多的基因,越難在該宿主中表達(dá)出理想水平的重組蛋白,另外,如果稀有密碼子出現(xiàn)在靠近蛋白的 N-端部分,或者以成串形式出現(xiàn),則蛋白的翻譯速率將進(jìn)一步降低[9]。密碼子優(yōu)化策略有幾種,一種是選用高頻使用的密碼子替代基因中存在的已選宿主的稀有密碼子[10]??梢酝ㄟ^定點(diǎn)突變的方法逐步把原始基因改成預(yù)期的基因序列,能有效地降低成本。另外,這種方法的優(yōu)點(diǎn)還包括不需要對(duì)基因轉(zhuǎn)錄后的 mRNA序列作出較大改動(dòng),假設(shè)原始基因的mRNA在進(jìn)化過程中已經(jīng)具有比較合理的結(jié)構(gòu),那么這種方法能降低由于mRNA大幅度改變帶來的不良影響。另一種方法是在排除原始基因中的稀有密碼子的基礎(chǔ)上進(jìn)行重新合成,同時(shí)使密碼子組成頻率更接近宿主[11]。這種方法除了能對(duì)密碼子進(jìn)行修飾,還能根據(jù)研究者需要對(duì)基因序列進(jìn)行其他方面的優(yōu)化,包括限制性酶切位點(diǎn)改造、mRNA穩(wěn)定性優(yōu)化等。
1.2.3 異源表達(dá)宿主的選擇或同源表達(dá)
密碼子的偏愛性與物種的親緣關(guān)系有一定的相關(guān)性,親緣關(guān)系近的物種具有相對(duì)類似的密碼子偏愛性,為了降低密碼子偏愛性對(duì)蛋白表達(dá)影響的風(fēng)險(xiǎn),較為簡(jiǎn)單的方法是在與基因宿主有類似密碼子偏愛性的異源表達(dá)宿主中表達(dá)這一基因。
利用同源表達(dá) (Homologous expression)技術(shù)發(fā)掘生物體自身的蛋白,尤其是酶資源,受到越來越多的關(guān)注。同源表達(dá)技術(shù)可以用來表達(dá)在其他異源表達(dá)系統(tǒng)中難以表達(dá)的蛋白,顯著提高該蛋白的產(chǎn)量。Mayfield等[12]在黃孢原毛平革菌Phanerochaete chrysosporium中成功表達(dá)了啟動(dòng)子改造后的自身蛋白錳過氧化氫酶基因。Jia等[13]在洋蔥伯克霍爾德氏菌Burkholderiacepacia通過同源表達(dá)的方式過量表達(dá)了該菌株自身的脂肪酶基因。同源表達(dá)與異源表達(dá)相比,具有以下幾方面的優(yōu)點(diǎn):1) 基因來源于自身,表達(dá)菌株并不是嚴(yán)格意義上的轉(zhuǎn)基因,在應(yīng)用領(lǐng)域 (尤其是食品) 更容易推廣;2) 表達(dá)的蛋白與宿主有更好的相容性,更有可能獲得較高的表達(dá)水平;3) 需要較少的基因修飾,如密碼子和密碼子環(huán)境方面的修飾等。
隨著對(duì)蛋白表達(dá)研究的不斷深入,研究人員發(fā)現(xiàn)即使宿主中高表達(dá)的基因中也存在一定的稀有密碼子。這引發(fā)了人們對(duì)密碼子和蛋白表達(dá)關(guān)系的新思考。由于核糖體對(duì) mRNA不同區(qū)域的翻譯速率存在差異,并且蛋白質(zhì)在核糖體能夠進(jìn)行翻譯時(shí)折疊,Thanaraj等提出假設(shè),翻譯動(dòng)力學(xué)可能影響新生肽鏈的折疊過程。他們進(jìn)一步研究發(fā)現(xiàn),高級(jí)結(jié)構(gòu)或結(jié)構(gòu)域之間的連接區(qū)域和蛋白域邊界 (Protein domain boundary) 通常由RNA上翻譯緩慢的區(qū)域編碼 (圖 1),同時(shí)組成這部分區(qū)域的氨基酸也大多是能夠通過與核糖體的新生肽鏈通道發(fā)生粘連作用而減緩翻譯速率的[14-15]。因此,蛋白合成與蛋白的體內(nèi)折疊并不是獨(dú)立的兩個(gè)過程,而是有著非常密切的相關(guān)性。另外,Komar等[16]通過體外翻譯實(shí)驗(yàn)證明同義密碼子之間的更換并不是嚴(yán)格的沉默突變,它能夠影響蛋白質(zhì)翻譯延伸的速率,從而導(dǎo)致蛋白質(zhì)折疊和功能發(fā)生變化。這表明基因核苷酸序列也一定程度上決定了重組蛋白的結(jié)構(gòu)和功能。上述研究表明,密碼子的優(yōu)化必須與蛋白的高級(jí)結(jié)構(gòu)聯(lián)系起來,如果通過一味地替換稀有密碼子來提高重組蛋白的表達(dá)可能會(huì)起到適得其反的結(jié)果。目前仍有很多蛋白不能通過密碼子優(yōu)化來實(shí)現(xiàn)高效表達(dá)也可能是欠缺這方面的考慮。
圖1 新生肽鏈翻譯的不連續(xù)性與翻譯時(shí)折疊相關(guān)[15]Fig. 1 Local discontinuous translation actively coordinates co-translational folding of the nascent chain[15].
既然連接蛋白高級(jí)結(jié)構(gòu)元件的域邊界區(qū)能夠偏好地使用一系列特定的氨基酸,同時(shí)采用稀有的密碼子編碼這些氨基酸來幫助蛋白的合理折疊,Angov等[17]提出了一種被稱為密碼子協(xié)調(diào)化 (Codon harmonization) 的密碼子優(yōu)化規(guī)則,將基因在原始宿主內(nèi)通過編碼蛋白域邊界密碼子的選擇,間接調(diào)控蛋白折疊的機(jī)制復(fù)制到需要異源表達(dá)的宿主。密碼子協(xié)調(diào)化首先需要通過密碼子使用頻率和蛋白的二級(jí)結(jié)構(gòu)來確定mRNA的慢速翻譯區(qū)域,即編碼蛋白結(jié)構(gòu)元件的連接或終止區(qū)域;然后通過同義密碼子替換使結(jié)構(gòu)基因在新的宿主中每個(gè)位置的密碼子使用頻率與原始宿主的盡量相符。
這種優(yōu)化方法對(duì)于提高重組蛋白的異源表達(dá)已被多次證明十分有效。由于惡性瘧原蟲Plasmodium falciparum結(jié)構(gòu)基因 AT含量高達(dá)80%[18],因此利用E. coli異源系統(tǒng)高效表達(dá)這類基因編碼的蛋白異常艱難。Darko等[19]利用密碼子協(xié)調(diào)化的優(yōu)化方法,分別獲得了編碼惡性瘧原蟲菌株 FVO的主裂殖子表面蛋白 1 (Merozoite surface protein,MSP1) 的 C端部分 42 kDa的蛋白片段 MSP142(FVO) 基因的兩種優(yōu)化基因FMP003和LSA-NRCH,分別對(duì)應(yīng)在預(yù)測(cè)的蛋白域連接區(qū)域改變了一個(gè)密碼子和對(duì)全序列的密碼子協(xié)調(diào)化優(yōu)化,兩種基因都成功實(shí)現(xiàn)了惡性瘧原蟲 MSP142(FVO) 蛋白片段的可溶性表達(dá)。Angov等[17]在Darko等研究的基礎(chǔ)上,系統(tǒng)比較了 3種惡性瘧原蟲疫苗候選蛋白 MSP142(FVO)、MSP142 (3D7) 和 MSP142 (Camp) 的原始基因和密碼子協(xié)調(diào)化優(yōu)化基因在E. coli的表達(dá)情況,結(jié)果表明通過優(yōu)化的基因序列都能顯著提高蛋白的表達(dá)量和可溶性,對(duì)應(yīng)的蛋白表達(dá)水平提高了4~1 000倍不等。另外,他們還比較了對(duì)編碼 MSP142 (FVO)的基因分別采取不同的優(yōu)化方法的優(yōu)化效果,結(jié)果顯示密碼子協(xié)調(diào)化獲得的序列LSA-NRCH在E. coli的表達(dá)量明顯高于對(duì)應(yīng)的替換所有稀有密碼子的優(yōu)化方法獲得的序列 LSA-NRCE。Chowdhury等[20]通過密碼子協(xié)調(diào)化的優(yōu)化方法成功地在E. coli表達(dá)系統(tǒng)中高效表達(dá)了惡性瘧原蟲蛋白Pfs48/45,而且獲得的重組蛋白 CH-rPfs48/45能夠被對(duì)應(yīng)的天然蛋白的抗原決定簇的單克隆抗體識(shí)別。
因此,密碼子協(xié)調(diào)化是現(xiàn)有密碼子優(yōu)化策略的一個(gè)重要補(bǔ)充,有望幫助目前難以在異源表達(dá)系統(tǒng)中重組表達(dá)的蛋白實(shí)現(xiàn)高效表達(dá),尤其是需要可溶性、功能性表達(dá)的蛋白。
除了密碼子使用頻率的非隨機(jī)性外,越來越多的證據(jù)表明密碼子環(huán)境 (Codon context)也影響密碼子與反義密碼子之間的識(shí)別,從而影響翻譯延伸的速率。最早的證據(jù)來源于對(duì)無義突變密碼子的研究,研究者發(fā)現(xiàn)無義突變抑制子 (Suppressor) 對(duì)無義密碼子的抑制效率明顯地受到附近核苷酸的影響[21]。同樣的現(xiàn)象也發(fā)生在抑制子對(duì)錯(cuò)義突變包括移碼突變的抑制[22-23]。顯然,機(jī)體抑制子對(duì)無義密碼子的抑制活性受密碼子環(huán)境影響表明終止密碼子的翻譯終止同樣是環(huán)境依賴性的。另外,對(duì)大腸桿菌蛋白的編碼序列的統(tǒng)計(jì)分析顯示,密碼子對(duì)(Codon pair) 同樣具有很高的偏愛性。實(shí)際統(tǒng)計(jì)得到的3 721 (612) 種密碼子對(duì)與以61種密碼子使用頻率計(jì)算得到的對(duì)應(yīng)密碼子對(duì)的隨機(jī)期望值 (Random expectation) 相比,部分密碼子對(duì)的實(shí)際出現(xiàn)頻率高于預(yù)測(cè)值,稱為被過度代表的 (Overrepresented);部分密碼子對(duì)的實(shí)際出現(xiàn)頻率低于預(yù)測(cè)值,稱為代表不足的(Underrepresented)[24-27]。越來越多的實(shí)驗(yàn)表明位于翻譯核糖體表面的 A和 P位點(diǎn)相鄰的氨酰tRNA之間的相容性,可能是引起翻譯過程中密碼子環(huán)境效應(yīng)的原因[28]。這種相容性可能通過改變翻譯速率,從而成為調(diào)節(jié)蛋白表達(dá)的重要因子之一。
進(jìn)一步的統(tǒng)計(jì)分析證明了這個(gè)結(jié)論,在大腸桿菌基因組內(nèi),密碼子對(duì)利用模式與基因的表達(dá)水平存在相關(guān)性,相對(duì)于低水平表達(dá)的基因,編碼高水平表達(dá)的蛋白基因,傾向于包含較多高頻出現(xiàn)但代表不足的密碼子對(duì)。其中,高頻的密碼子對(duì)可能保證了基因使用的是高頻的密碼子,從而有利于基因的翻譯表達(dá)[24-25]。和密碼子偏愛性類似,不同生物的密碼子對(duì)使用頻率之間也有明顯差異,具有各自的密碼子對(duì)偏愛性 (Codon pair bias)[27-29],因此,編碼重組蛋白的目的基因需要在外源的表達(dá)系統(tǒng)中表達(dá)時(shí),密碼子對(duì)偏愛性可能是影響蛋白重組表達(dá)的重要因素之一。
如果需要在大腸桿菌中高效重組表達(dá)某一外源基因,對(duì)密碼子對(duì)進(jìn)行優(yōu)化可能是不可或缺的一環(huán)。Hatfield等[30]利用密碼子對(duì)偏愛性,發(fā)明了一種新型的基因設(shè)計(jì)優(yōu)化方法 CODA(Computationally optimized DNA assembly)。在E. coli中對(duì)編碼釀酒酵母Ty3反轉(zhuǎn)座子GAG基因的衣殼部分片段進(jìn)行優(yōu)化表達(dá)的結(jié)果顯示,相對(duì)于原始基因在E. coli中的表達(dá),盡管優(yōu)化該基因片段的密碼子使用頻率 (密碼子優(yōu)化)的方法能顯著提高目的蛋白的表達(dá)水平,但是在密碼子優(yōu)化基礎(chǔ)上進(jìn)行密碼子對(duì)偏愛性的優(yōu)化,既避免過度代表密碼子對(duì)的出現(xiàn)的優(yōu)化方法,還能使蛋白表達(dá)在密碼子優(yōu)化的水平上獲得進(jìn)一步的提高。
同樣地,利用密碼子對(duì)偏愛性,科學(xué)家還設(shè)計(jì)了有目的地使蛋白表達(dá)顯著降低的應(yīng)用系統(tǒng)。接種減毒活疫苗是用來預(yù)防病毒、細(xì)菌和原蟲等病原引起的流行性疾病的常用策略之一。Coleman等[31]通過合成性減毒病毒工程(Synthetic attenuated virus engineering,SAVE)的方法,重新設(shè)計(jì)合成了經(jīng)過密碼子對(duì)同義替換處理的編碼脊髓灰質(zhì)炎病毒衣殼蛋白的DNA大分子。在保證其他影響翻譯的因素 (如密碼子使用頻率、RNA二級(jí)結(jié)構(gòu)等) 不變的情況下,在接種的小鼠中提高代表不足的密碼子對(duì)同義替換的基因設(shè)計(jì)引起對(duì)應(yīng)病毒衣殼蛋白的翻譯速率明顯下降,從而導(dǎo)致包含該氨基酸依賴變化的脊髓灰質(zhì)炎病毒毒性減弱;反之,提高過度代表的密碼子對(duì)的基因設(shè)計(jì)則提高了對(duì)應(yīng)病毒衣殼蛋白的翻譯水平。令人意外的是,這種結(jié)果與前期研究者在E. coli系統(tǒng)中獲得的結(jié)論,即代表不足的密碼子對(duì)有利于蛋白的翻譯剛好相反。隨后,Muller等[32]利用SAVE方法通過全基因組范圍的密碼子對(duì)替換,對(duì)流感病毒株A/PR/8/34進(jìn)行病毒毒性減弱的理性設(shè)計(jì)。與Coleman等的結(jié)果類似,相對(duì)于野生型的流感病毒,通過使用代表不足的密碼子對(duì)替換設(shè)計(jì)的病毒在小鼠中的毒性顯著減弱。上述結(jié)果可能暗示在哺乳動(dòng)物小鼠體內(nèi)密碼子偏愛性對(duì)蛋白表達(dá)的作用模式與原核生物E. coli的模式非常不同。這可能跟密碼子環(huán)境保守性有關(guān),高等真核生物相比其他種類生物只有較低的密碼子環(huán)境保守性[27]。但是,這并不能解釋接下來的實(shí)驗(yàn)結(jié)果。Coleman等[33]還通過密碼子對(duì)替換的基因設(shè)計(jì)對(duì)肺炎鏈球菌Streptococcus pneumoniae進(jìn)行毒性減弱,他們?cè)诒WC氨基酸序列不變的基礎(chǔ)上盡量使用代表不足的密碼子對(duì)重新編碼S. pneumoniae的血清 3型 (SP3) 的溶血素(Pneumolysin,ply) 基因。與野生型或者ply缺失的ΔplySP3菌種相比,密碼子對(duì)改造菌種的溶血素蛋白表達(dá)量明顯降低,并且對(duì)小鼠的毒性以及在肺中引起的炎癥反應(yīng)都顯著性下降。這表明同樣屬于原核生物的S. pneumoniae和E. coli,密碼子對(duì)對(duì)于蛋白表達(dá)的作用模式也非常不同。
綜上所述,密碼子對(duì)偏愛性與蛋白表達(dá)存在明顯的相關(guān)性,因此,通過對(duì)密碼子對(duì)偏愛性進(jìn)行優(yōu)化是提高異源表達(dá)重組蛋白的重要環(huán)節(jié)之一。然而,不同生物體內(nèi),由于密碼子對(duì)偏愛性對(duì)蛋白翻譯過程的作用模式可能不同,相關(guān)的作用機(jī)理也比較模糊,因此,應(yīng)針對(duì)不同的生物自身特點(diǎn)來進(jìn)行密碼子對(duì)偏愛性的優(yōu)化。
與密碼子協(xié)調(diào)化理論對(duì)應(yīng),研究發(fā)現(xiàn)高級(jí)結(jié)構(gòu)或結(jié)構(gòu)域之間的連接區(qū)域和蛋白域邊界往往由RNA上翻譯緩慢的區(qū)域編碼,因此編碼組成這部分區(qū)域的氨基酸序列也經(jīng)常存在能夠使翻譯速率降低的密碼子對(duì)。經(jīng)統(tǒng)計(jì)計(jì)算分析,編碼人免疫缺陷病毒衣殼蛋白和釀酒酵母 Ty3反轉(zhuǎn)座子 GAG的衣殼部分片段的基因序列在蛋白邊界區(qū)都不同程度地存在過度代表的密碼子對(duì)[30],這些密碼子對(duì)被認(rèn)為在翻譯過程中,通過降低翻譯速率而有意暫停,來保證有足夠的時(shí)間來完成新生肽鏈的高級(jí)結(jié)構(gòu)和結(jié)構(gòu)域的折疊。
Trinh等[34]在保證密碼子使用頻率在哺乳動(dòng)物細(xì)胞中相對(duì)穩(wěn)定的情況下,通過對(duì)抗Her2/Neu單鏈抗體 (Single chain variable region fragment,ScFv) 中連接重鏈可變區(qū) (VH) 和輕鏈可變區(qū) (VL) 之間的接頭,以及單鏈抗體與人抗鼠鐵傳遞蛋白受體 IgG3重鏈 CH3的接頭(GGGGS)3兩處編碼序列進(jìn)行密碼子對(duì)優(yōu)化,并轉(zhuǎn)染大鼠細(xì)胞進(jìn)行表達(dá),結(jié)果顯示,優(yōu)化序列中單個(gè)核苷酸的改變使得該融合蛋白表達(dá)提高30倍以上,并且通過對(duì)mRNA定量分析證實(shí)蛋白表達(dá)量的提高完全由翻譯效率提高實(shí)現(xiàn)。然而,與實(shí)驗(yàn)預(yù)期相反的是,密碼子對(duì)的優(yōu)化是將過度代表的密碼子對(duì)換成代表過少的密碼子對(duì),而前期的研究表明代表過少的密碼子對(duì)在E. coli中是有利于翻譯的,但作為蛋白域邊界的接頭需要翻譯有意的暫停來幫助蛋白高級(jí)結(jié)構(gòu)的折疊。因此,Trinh等認(rèn)為對(duì)于該實(shí)驗(yàn)表達(dá)的融合蛋白可能在接頭處不需要翻譯暫停太長(zhǎng)時(shí)間。然而,根據(jù)Coleman等和Muller等的研究結(jié)果,這種解釋可能并不妥當(dāng),而可能是由于不同生物中,密碼子對(duì)作用于蛋白翻譯的模式并不相同,與E. coli相反,在哺乳動(dòng)物中,過度代表的密碼子對(duì)有利于蛋白的翻譯。如果這一結(jié)論成立的話,則能與密碼子協(xié)調(diào)化的結(jié)論相呼應(yīng),即高級(jí)結(jié)構(gòu)或結(jié)構(gòu)域之間的連接區(qū)域和蛋白域邊界需要一些降低翻譯的因素,如稀有密碼子、密碼子對(duì)等,以便提供蛋白的高級(jí)結(jié)構(gòu)或結(jié)構(gòu)域在翻譯時(shí)充分正確地折疊。但是,由于相關(guān)的研究還較少,這一假設(shè)還需要進(jìn)一步驗(yàn)證。
研究表明,基因GC含量是基因設(shè)計(jì)和優(yōu)化的重要指標(biāo)[35],不同物種間基因組的 GC含量有顯著差異,在宿主中表達(dá)某些其他來源的基因時(shí)很容易引起人們的注意。GC含量通常間接對(duì)基因表達(dá)進(jìn)行調(diào)控和影響。
蛋白的表達(dá)調(diào)控分為轉(zhuǎn)錄水平和翻譯水平,一般來說,轉(zhuǎn)錄水平起關(guān)鍵作用,但是同時(shí),翻譯的效率與mRNA的降解直接相關(guān),因此,也間接影響著轉(zhuǎn)錄后水平的調(diào)控。如原核生物中,存在稀有密碼子的mRNA由于翻譯延伸過程受到影響,使得mRNA得不到更多核糖體結(jié)合后的有效保護(hù),也將導(dǎo)致mRNA的降解從而使積累水平顯著降低,蛋白表達(dá)已被多次證明與 mRNA穩(wěn)定性相關(guān)[36-37]。但是對(duì)于mRNA穩(wěn)定性的優(yōu)化比較困難,缺乏比較成熟的理論體系,相反,過高的mRNA穩(wěn)定性意味著過高的 GC含量及穩(wěn)定的二級(jí)結(jié)構(gòu)等不利于蛋白翻譯的因素。
研究顯示核糖體僅僅能夠與單鏈RNA結(jié)合并起始翻譯[38],另外,較大的折疊自由能可能減緩核糖體的延伸從而降低翻譯效率[39]。因此,mRNA如果形成大而穩(wěn)定的二級(jí)結(jié)構(gòu)如發(fā)卡結(jié)構(gòu)和莖環(huán)結(jié)構(gòu),尤其是起始密碼子附近的穩(wěn)定二級(jí)結(jié)構(gòu),將會(huì)影響mRNA在翻譯過程中核糖體的結(jié)合和延伸,從而降低翻譯的效率和最終的蛋白表達(dá)水平[39-41]。
Kudla等[42]構(gòu)建了包含 154種不同隨機(jī)密碼子同義突變的GFP蛋白突變體庫,通過對(duì)其在大腸桿菌中的蛋白表達(dá)水平,研究mRNA折疊自由能對(duì)翻譯效率的影響。結(jié)果表明,在排除密碼子偏愛性因素后,GFP蛋白表達(dá)豐度與轉(zhuǎn)錄的mRNA的前40個(gè)核苷酸片段的折疊自由能顯著相關(guān)。Tuller等[39]通過對(duì)大腸桿菌和釀酒酵母轉(zhuǎn)錄組的研究發(fā)現(xiàn),mRNA的前40核苷酸片段的平均自由能明顯小于下游長(zhǎng)度為40的核苷酸片段的平均自由能,表明生物在進(jìn)化過程中可能要求更有效的翻譯起始,從而驅(qū)使mRNA起始密碼子附近二級(jí)結(jié)構(gòu)穩(wěn)定性降低。這種進(jìn)化選擇性在其他物種中同樣存在[43]。另外,Tuller等[39]還發(fā)現(xiàn)mRNA的41~80核苷酸的平均自由能明顯大于其他長(zhǎng)度為 40的核苷酸片段的平均自由能,這可能是生物體通過這段核苷酸片段形成自身的穩(wěn)定結(jié)構(gòu),防止其與核糖體結(jié)合位點(diǎn)的核苷酸序列形成潛在的有害結(jié)構(gòu)的一種保護(hù)翻譯有效起始的策略。Desmit等[44]通過對(duì)噬菌體MS2的外殼蛋白基因的同義密碼子突變體在大腸桿菌中的表達(dá),定量分析了翻譯起始區(qū)的mRNA二級(jí)結(jié)構(gòu)與翻譯效率的關(guān)系,結(jié)果表明翻譯起始區(qū) mRNA折疊自由能每增大1.4 kcal/mol,對(duì)應(yīng)的蛋白翻譯起始率和表達(dá)量則降低10倍。但是,必須指出的是,只有當(dāng)翻譯的起始受到 mRNA二級(jí)結(jié)構(gòu)影響,或者該mRNA與核糖體的親和度較低的時(shí)候,這種比例關(guān)系才會(huì)存在。
因此,在基因序列設(shè)計(jì)和優(yōu)化的時(shí)候,合理地利用翻譯起始區(qū)的mRNA二級(jí)結(jié)構(gòu)的規(guī)律將有效提高目的蛋白的異源表達(dá)水平。上述推斷已被國內(nèi)外研究者多次應(yīng)用并證明有效。Punginelli等[45]通過突變大腸桿菌甲酸脫氫酶N的亞基G (FdnG) 信號(hào)肽的第一個(gè)精氨酸 (R5),降低了翻譯起始區(qū)強(qiáng)穩(wěn)定性莖環(huán)結(jié)構(gòu)的形成,顯著減小了mRNA該區(qū)域折疊自由能,使目的蛋白的表達(dá)水平最高提高了60倍。王珊珊等[41]對(duì)近平滑假絲酵母的(R)-羰基還原酶基因的mRNA翻譯起始區(qū)中+1~+78 區(qū)進(jìn)行二級(jí)結(jié)構(gòu)的優(yōu)化,使酶蛋白在大腸桿菌的表達(dá)水平比優(yōu)化前提高了4~5倍。通過mRNA二級(jí)結(jié)構(gòu)優(yōu)化,尤其是翻譯起始區(qū)的二級(jí)結(jié)構(gòu)優(yōu)化提高目的蛋白的異源表達(dá)在基因工程領(lǐng)域的應(yīng)用已受到越來越多的重視。
其他要素或優(yōu)化方法還包括檢查單核苷酸重復(fù)和密碼子重復(fù),核對(duì)核糖體結(jié)合位點(diǎn),起始密碼子環(huán)境,終止密碼子及其環(huán)境,避免內(nèi)含子、隱蔽剪接位點(diǎn)、AT富含區(qū)、內(nèi)部核糖體進(jìn)入位點(diǎn) (IRES)、重組位點(diǎn)等不利元件,選擇合適的UTR序列和信號(hào)肽序列,合理設(shè)計(jì)酶切位點(diǎn)、接頭、融合基因、檢測(cè)和純化標(biāo)簽等 (如表 1),使基因進(jìn)一步優(yōu)化,檢查無誤后進(jìn)行基因合成,以備后續(xù)的遺傳轉(zhuǎn)化和表達(dá)。
表1 其他影響蛋白表達(dá)的基因設(shè)計(jì)因素Table 1 Other gene design factors that influence protein expression
目前,越來越多的物種被發(fā)展成重組蛋白表達(dá)系統(tǒng),研究比較深入并且應(yīng)用相對(duì)廣泛的表達(dá)系統(tǒng)包括大腸桿菌表達(dá)系統(tǒng)、枯草芽胞桿菌表達(dá)系統(tǒng)、鏈霉菌表達(dá)系統(tǒng)、畢赤酵母表達(dá)系統(tǒng)、釀酒酵母表達(dá)系統(tǒng)、昆蟲表達(dá)系統(tǒng)、哺乳動(dòng)物表達(dá)系統(tǒng)和植物表達(dá)系統(tǒng)等,另外,一些細(xì)胞的細(xì)胞器 (如葉綠體和線粒體等) 也被用于重組蛋白表達(dá)。利用細(xì)胞作為異源表達(dá)宿主生產(chǎn)重組蛋白被形象地稱為細(xì)胞工廠,分子農(nóng)業(yè),細(xì)胞生物反應(yīng)器等?;蛟O(shè)計(jì)有助于原始基因難以表達(dá)的蛋白在異源重組系統(tǒng)內(nèi)表達(dá),以及提高目的蛋白的表達(dá)量。同樣,高效異源重組表達(dá)能使異源表達(dá)系統(tǒng)宿主作為生物反應(yīng)器生產(chǎn)除蛋白多肽外的其他代謝中間產(chǎn)物。本實(shí)驗(yàn)室結(jié)合傳統(tǒng)的微生物篩選及菌種誘變等方法,利用重組表達(dá)系統(tǒng)高效表達(dá)sn-1,3專一性脂肪酶蛋白,并對(duì)其進(jìn)行酶制劑化,以用于功能油脂 1,3-二油酸-2-棕櫚酸甘油三酯 (OPO) 的酶法制備。本實(shí)驗(yàn)室在sn-1,3專一性脂肪酶的微生物高效表達(dá)方面已取得一定進(jìn)展,今后將在 sn-1,3專一性脂肪酶在模式生物中的重組表達(dá)方面,結(jié)合蛋白和宿主自身特點(diǎn),進(jìn)一步利用基因設(shè)計(jì)和優(yōu)化提高脂肪酶的表達(dá)。
盡管通過異源表達(dá)系統(tǒng)提高重組蛋白的表達(dá)量的報(bào)道已不勝枚舉,但是絕大多數(shù)的蛋白還不能通過異源系統(tǒng)表達(dá)實(shí)現(xiàn)產(chǎn)業(yè)化之路。通過基因工程和生物工程的手段,不斷改善和優(yōu)化目的蛋白異源重組表達(dá),還是今后發(fā)展的重要研究領(lǐng)域。另外,盡管人們?cè)诨蛟O(shè)計(jì)和優(yōu)化方面已獲得很多成功,對(duì)影響基因在轉(zhuǎn)錄和翻譯表達(dá)水平的各種影響因素及其作用機(jī)制的研究也取得長(zhǎng)足進(jìn)步,但是由于這些影響因素之間并非獨(dú)立存在,它們往往相互作用,構(gòu)成圍繞蛋白表達(dá)調(diào)控的動(dòng)態(tài)網(wǎng)絡(luò),而目前的基因設(shè)計(jì)分析和優(yōu)化手段并不能達(dá)到從整體上完全掌控和調(diào)節(jié)這些因素,更多的是從單個(gè)因素或者少數(shù)幾個(gè)較為重要的因素進(jìn)行優(yōu)化和設(shè)計(jì)。因此,現(xiàn)行的優(yōu)化和設(shè)計(jì)方法都不同程度地存在局限性,目前還沒有非常成熟基因優(yōu)化理論。因此,利用基因設(shè)計(jì)優(yōu)化策略提高異源宿主蛋白表達(dá)的方法應(yīng)該被看作是必要條件,而不是充分條件,同時(shí)還應(yīng)該考慮細(xì)胞、個(gè)體及環(huán)境等其他因素在基因轉(zhuǎn)錄、翻譯等表達(dá)水平的影響。
[1]Valero F. Heterologous expression systems for lipases: a review. Methods Mol Biol, 2012, 861:161?178.
[2]Schuster E, Dunn-Coleman N, Frisvad JC, et al.On the safety ofAspergillus niger--a review. Appl Microbiol Biotechnol, 2002, 59(4/5): 426?435.
[3]Itakura K, Hirose T, Crea R, et al. Expression inEscherichia coliof a chemically synthesized gene for the hormone somatostatin. Science, 1977,198(4321): 1056?1063.
[4]Fiers W, Grosjean H. Codon usage. Nature, 1979,277(5694): 328?328.
[5]Lithwick G, Margalit H. Hierarchy of sequence-dependent features associated with prokaryotic translation. Genome Res, 2003,13(12): 2665?2673.
[6]Karlin S, Mrazek J, Campbell A, et al.Characterizations of highly expressed genes of four fast-growing bacteria. J Bacteriol, 2001,183(17): 5025?5040.
[7]Brinkmann U, Mattes RE, Buckel P. High-level expression of recombinant genes inEscherichiacoliis dependent on the availability of the dnaY gene product. Gene, 1989, 85(1): 109?114.
[8]Zdanovsky AG, Zdanovskaia MV. Simple and efficient method for heterologous expression of clostridial proteins. Appl Environ Microbiol,2000, 66(8): 3166?3173.
[9]Clarke TFt, Clark PL. Rare codons cluster. PLoS ONE, 2008, 3(10): e3412.
[10]Komar AA, Guillemet E, Reiss C, et al. Enhanced expression of the yeast Ure2 protein inEscherichia coli: the effect of synonymous codon substitutions at a selected place in the gene. Biol Chem, 1998, 379(10): 1295?1300.
[11]Mellitzer A, Weis R, Glieder A, et al. Expression of lignocellulolytic enzymes inPichia pastoris.Microb Cell Fact, 2012, 11(1): 61.
[12]Mayfield MB, Kishi K, Alic M, et al.Homologous expression of recombinant manganese peroxidase inPhanerochaete chrysosporium. Appl Environ Microbiol, 1994,60(12): 4303?4309.
[13]Jia B, Yang JK, Liu WS, et al. Homologous overexpression of a lipase fromBurkholderia cepaciausing the lambda Red recombinase system. Biotechnol Lett, 2010, 32(4): 521?526.
[14]Thanaraj TA, Argos P. Ribosome-mediated translational pause and protein domain organization. Protein Sci, 1996, 5(8): 1594?1612.
[15]Zhang G, Ignatova Z. Folding at the birth of the nascent chain: coordinating translation with co-translational folding. Curr Opin Struct Biol,2011, 21(1): 25?31.
[16]Komar AA, Lesnik T, Reiss C. Synonymous codon substitutions affect ribosome traffic and protein folding duringin vitrotranslation. FEBS Lett, 1999, 462(3): 387?391.
[17]Angov E, Hillier CJ, Kincaid RL, et al.Heterologous protein expression is enhanced by harmonizing the codon usage frequencies of the target gene with those of the expression host.PLoS ONE, 2008, 3(5): e2189.
[18]Weber JL. Analysis of sequences from the extremely A+T-rich genome ofPlasmodium falciparum. Gene, 1987, 52(1): 103?109.
[19]Darko CA, Angov E, Collins WE, et al. The clinical-grade 42-kilodalton fragment of merozoite surface protein 1 ofPlasmodium falciparumstrain FVO expressed inEscherichia coliprotectsAotus nancymaiagainst challenge with homologous erythrocytic-stage parasites.Infect Immun, 2005, 73(1): 287?297.
[20]Chowdhury DR, Angov E, Kariuki T, et al. A potent malaria transmission blocking vaccine based on codon harmonized full length Pfs48/45 expressed inEscherichia coli. PLoS ONE, 2009,4(7): e6352.
[21]Bossi L, Ruth JR. The influence of codon context on genetic code translation. Nature, 1980,286(5769): 123?127.
[22]Gaber RF, Culbertson MR. Codon recognition during frameshift suppression inSaccharomyces cerevisiae. Mol Cell Biol, 1984, 4(10):2052?2061.
[23]Bossi L, Roth JR. Four-base codons ACCA,ACCU and ACCC are recognized by frameshift suppressor sufJ. Cell, 1981, 25(2): 489?496.
[24]Boycheva S, Chkodrov G, Ivanov I. Codon pairs in the genome ofEscherichiacoli.Bioinformatics, 2003, 19(8): 987?998.
[25]Gutman GA, Hatfield GW. Nonrandom utilization of codon pairs inEscherichia coli. Proc Natl Acad Sci USA, 1989, 86(10): 3699?3703.
[26]Irwin B, Heck JD, Hatfield GW. Codon pair utilization biases influence translational elongation step times. J Biol Chem, 1995,270(39): 22801?22806.
[27]Moura GR, Pinheiro M, Freitas A, et al.Species-specific codon context rules unveil non-neutrality effects of synonymous mutations.PLoS ONE, 2011, 6(10): e26817.
[28]Buchan JR, Aucott LS, Stansfield I. tRNA properties help shape codon pair preferences in open reading frames. Nucleic Acids Res, 2006,34(3): 1015?1027.
[29]Moura G, Pinheiro M, Arrais J, et al. Large scale comparative codon-pair context analysis unveils general rules that fine-tune evolution of mRNA primary structure. PLoS ONE, 2007, 2(9): e847.
[30]Hatfield GW, Roth DA. Optimizing scaleup yield for protein production: Computationally Optimized DNA Assembly (CODA) and Translation Engineering. Biotechnol Annu Rev,2007, 13: 27?42.
[31]Coleman JR, Papamichail D, Skiena S, et al.Virus attenuation by genome-scale changes in codon pair bias. Science, 2008, 320(5884):1784?1787.
[32]Mueller S, Coleman JR, Papamichail D, et al.Live attenuated influenza virus vaccines by computer-aided rational design. Nat Biotechnol,2010, 28(7): 723?726.
[33]Coleman JR, Papamichail D, Yano M, et al.Designed reduction ofStreptococcus pneumoniaepathogenicity via synthetic changes in virulence factor codon-pair bias. J Infect Dis, 2011, 203(9):1264?1273.
[34]Trinh R, Gurbaxani B, Morrison SL, et al.Optimization of codon pair use within the(GGGGS)3 linker sequence results in enhanced protein expression. Mol Immunol, 2004, 40(10):717?722.
[35]Baca AM, Hol WG. Overcoming codon bias: a method for high-level overexpression of Plasmodium and other AT-rich parasite genes inEscherichia coli. Int J Parasitol, 2000, 30(2):113?118.
[36]Mitarai N, Sneppen K, Pedersen S. Ribosome collisions and translation efficiency: optimization by codon usage and mRNA destabilization. J Mol Biol, 2008, 382(1): 236?245.
[37]Tanaka M, Tokuoka M, Shintani T, et al.Transcripts of a heterologous gene encoding mite allergen Der f 7 are stabilized by codon optimization inAspergillus oryzae. Appl Microbiol Biotechnol, 2012, 96(5): 1275?1282.
[38]Desmit MH, Vanduin J. Control of prokaryotic translational initiation by messenger-RNA secondary structure. Progr Nucl Acid Res Mol Biol, 1990, 38: 1?35.
[39]Tuller T, Waldman YY, Kupiec M, et al.Translation efficiency is determined by both codon bias and folding energy. Proc Natl Acad Sci USA, 2010, 107(8): 3645?3650.
[40]Freischmidt A, Liss M, Wagner R, et al. RNA secondary structure andin vitrotranslation efficiency. Protein Expr Purif, 2012, 82(1): 26?31.
[41]Wang S, Zhang R, Geng Y, et al. Improved expression and catalytic efficiency of(R)-carbonyl reductase inEscherichia coliby secondary structure optimization of mRNA translation initiation region. Chin J Biotech,2009, 25(12): 1907?1913 (in Chinese).
王珊珊, 張榮珍, 耿亞維, 等. mRNA翻譯起始區(qū)二級(jí)結(jié)構(gòu)優(yōu)化提高(R)-羰基還原酶的表達(dá)及催化效率. 生物工程學(xué)報(bào), 2009, 25(12):1907–1913.
[42]Kudla G, Murray AW, Tollervey D, et al.Coding-sequence determinants of gene expression inEscherichia coli. Science, 2009,324(5924): 255?258.
[43]Zhou T, Wilke CO. Reduced stability of mRNA secondary structure near the translation-initiation site in dsDNA viruses. BMC Evol Biol, 2011, 11.
[44]Desmit M H, Vanduin J. Secondary structure of the ribosome binding-site determines translational efficiency - a quantitative-analysis. Proc Natl Acad Sci USA, 1990, 87(19): 7668?7672.
[45]Punginelli C, Ize B, Stanley NR, et al. mRNA secondary structure modulates translation of Tat-dependent formate dehydrogenase N. J Bacteriol, 2004, 186(18): 6311?6315.
[46]Gu T, Tan S, Gou X, et al. Avoidance of long mononucleotide repeats in codon pair usage.Genetics, 2010, 186(3): 1077?1084.
[47]Tats A, Tenson T, Remm M. Preferred and avoided codon pairs in three domains of life.BMC Genomics, 2008, 9: 463.
[48]Agaisse H, Lereclus D. STAB-SD: a Shine-Dalgarno sequence in the 5' untranslated region is a determinant of mRNA stability. Mol Microbiol, 1996, 20(3): 633?643.
[49]Kozak M. Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes. Cell, 1986,44(2): 283?292.
[50]Gingold H, Pilpel Y. Determinants of translation efficiency and accuracy. Mol Syst Biol, 2011, 7:481.
[51]Sun J, Chen M, Xu J, et al. Relationships among stop codon usage bias, its context, isochores, and gene expression level in various eukaryotes. J Mol Evol, 2005, 61(4): 437?444.
[52]Pacho F, Zambruno G, Calabresi V, et al.Efficiency of translation termination in humans is highly dependent upon nucleotides in the neighbourhood of a (premature) termination codon. J Med Genet, 2011, 48(9): 640?644.
[53]Kamo K, Kim AY, Park SH, et al. The 5'UTR-intron of the Gladiolus polyubiquitin promoter GUBQ1 enhances translation efficiency inGladiolusandArabidopsis. BMC Plant Biol,2012, 12: 79.
[54]Nishikubo T, Nakagawa N, Kuramitsu S, et al.Improved heterologous gene expression inEscherichia coliby optimization of the AT-content of codons immediately downstream of the initiation codon. J Biotechnol, 2005, 120(4):341?346.
[55]Attal J, Theron MC, Puissant C, et al. Effect of intercistronic length on internal ribosome entry site (IRES) efficiency in bicistronic mRNA. Gene Expr, 1999, 8(5/6): 299?309.
[56]Wang J, Lu C, Min D, et al. A mutation in the 5'untranslated region of the BRCA1 gene in sporadic breast cancer causes downregulation of translation efficiency. J Int Med Res, 2007, 35(4):564?573.
[57]Koda A, Minetoki T, Ozeki K, et al. Translation efficiency mediated by the 5' untranslated region greatly affects protein production inAspergillus oryzae. Appl Microbiol Biotechnol, 2004, 66(3):291?296.
[58]Klatt S, Konthur Z. Secretory signal peptide modification for optimized antibody-fragment expression-secretion inLeishmania tarentolae.Microb Cell Fact, 2012, 11: 97.
[59]Futatsumori-Sugai M, Tsumoto K. Signal peptide design for improving recombinant protein secretion in the baculovirus expression vector system. Biochem Biophys Res Commun, 2010,391(1): 931?935.
[60]Pozzuolo S, Breme U, Salis B, et al. Efficient bacterial expression of fusion proteins and their selective processing by a recombinant Kex-1 protease. Protein Expr Purif, 2008, 59(2):334?341.