郭雯雯 , 劉 萌 , 白仲虎 , 楊艷坤 *, 戴曉峰
(1.江南大學(xué) 糧食發(fā)酵工藝與技術(shù)國家工程實驗室,江蘇 無錫 214122;2.江南大學(xué) 工業(yè)生物技術(shù)教育部重點實驗室,江蘇 無錫 214122;3.江南大學(xué) 糖化學(xué)與生物技術(shù)教育部重點實驗室,江蘇 無錫 214122)
大腸桿菌中dAb一級結(jié)構(gòu)與可溶性表達關(guān)聯(lián)
郭雯雯1,2,3, 劉 萌1,2,3, 白仲虎1,2,3, 楊艷坤*1,2,3, 戴曉峰1,2,3
(1.江南大學(xué) 糧食發(fā)酵工藝與技術(shù)國家工程實驗室,江蘇 無錫 214122;2.江南大學(xué) 工業(yè)生物技術(shù)教育部重點實驗室,江蘇 無錫 214122;3.江南大學(xué) 糖化學(xué)與生物技術(shù)教育部重點實驗室,江蘇 無錫 214122)
抗體類藥物研發(fā)是藥物發(fā)展的一個重要研究方向,目前已有許多抗體在原核表達體系中成功表達。人們通常采用“試錯法”優(yōu)化表達系統(tǒng),提高蛋白質(zhì)產(chǎn)量,但該方法費時費力且成功率低,因此迫切需要探索氨基酸組成與蛋白質(zhì)可溶性表達水平之間的關(guān)聯(lián),以指導(dǎo)表達系統(tǒng)的選擇或蛋白質(zhì)分子的定向改造。在單域抗體dAb分子的C端末尾添加一個氨基酸,發(fā)現(xiàn)單個氨基酸的改變足以引起蛋白質(zhì)可溶性表達量發(fā)生顯著變化。通過層次聚類、Cluster Omega對dAb氨基酸序列與表達水平分別進行分類,發(fā)現(xiàn)兩者分類一致的比例達到70%,證明了氨基酸序列與蛋白質(zhì)表達水平間的關(guān)聯(lián)。通過對65個CDR隨機突變的dAb分子進行線性建模分析其可溶性表達量,發(fā)現(xiàn)對dAb胞外質(zhì)量分?jǐn)?shù)有顯著影響作用的氨基酸組合為S(絲氨酸),R(精氨酸),N(天冬酰胺),D(天冬氨酸),Q(谷氨酰胺),Y(酪氨酸),F(xiàn)(苯丙氨酸),G(甘氨酸),對 dAb 胞內(nèi)質(zhì)量分?jǐn)?shù)有顯著影響作用的氨基酸組合為 G,R,C(半胱氨酸),N,S,Y,K(賴氨酸),A(丙氨酸),對dAb蛋白質(zhì)總量有顯著影響的組合為 R,S,G,N,Y,C,Q,F(xiàn),T(蘇氨酸)。 其中 R、S和 G 的含量顯著影響dAb的可溶性表達量且該影響不受分布位置的影響。蛋白質(zhì)的極性亦是其可溶性表達水平的顯著影響因素。
dAb;氨基酸組成;可溶性表達;聚類分析;線性建模
自從20世紀(jì)70年代現(xiàn)代生物技術(shù)的起步,大腸桿菌(Escherichia coli)因其培養(yǎng)成本低、生長速度快、易于實現(xiàn)生物反應(yīng)器內(nèi)高密度細胞培養(yǎng)、易于工程改造等優(yōu)點[1],成為表達外源基因重組蛋白質(zhì)中最廣泛使用的宿主細胞[2]。在外源蛋白質(zhì)重組表達研究中,得到一定量的蛋白質(zhì)純品是首要解決的問題[3]。然而大部分真核來源的蛋白質(zhì)在大腸桿菌中的可溶性表達水平很低[4],例如,超過90%具有藥用價值的蛋白質(zhì)因在大腸桿菌中的表達水平過低而使其應(yīng)用停留在了臨床開發(fā)的初級階段[5]。
提高外源蛋白質(zhì)可溶性表達水平的方法有很多,包括使用弱啟動子、降低誘導(dǎo)溫度[6]、優(yōu)化培養(yǎng)基[7]、與分子伴侶共表達[8-9]以及融合表達[10]等。但是由于表達系統(tǒng)的組件與蛋白質(zhì)本身的關(guān)系暫未研究清楚,我們往往只能通過“試錯法”不斷嘗試各種組合,耗時較長并且不易得到很好的效果[11]。
自20世紀(jì)90年代以來,生物信息學(xué)的學(xué)者發(fā)現(xiàn)蛋白質(zhì)的一級結(jié)構(gòu)對于該蛋白質(zhì)在大腸桿菌中的過表達有重大影響[12-13],并且發(fā)表了一系列利用數(shù)據(jù)庫中的信息結(jié)合數(shù)學(xué)分析方法、基于蛋白質(zhì)的一級結(jié)構(gòu)來預(yù)測蛋白質(zhì)的表達水平的文章,成功構(gòu)建了一些準(zhǔn)確率較高的預(yù)測模型。例如Wilkinson-Harrison預(yù)測模型[14],多重線性擬合模型[15],基于SI的 模型[16],基于 SVM 的 模 型[17-18],PROSO 模 型[19],SOLpro模型[20]以及PROSOII模型[21]等。這些預(yù)測模型可以顯著減少表達系統(tǒng)優(yōu)化過程中提高外源蛋白質(zhì)可溶性表達水平的“試錯法”的步驟,然而由于上述研究中采用的數(shù)據(jù)均來自不同研究機構(gòu),數(shù)據(jù)的均一性及有效性差,在具體實施過程中的預(yù)測準(zhǔn)確率低,截至目前應(yīng)用并不廣泛[18]。因此,選擇合適的分子模型并保證所得數(shù)據(jù)的有效性是構(gòu)建預(yù)測模型過程中需要注意的兩大重要因素。
單域抗體(domain antibody,dAb)分子作為抗原抗體結(jié)合的最小單位,其相對分子質(zhì)量小,無糖基化修飾,易于在原核體系中高效表達[22];保守區(qū)氨基酸比例高,可變區(qū)內(nèi)某些氨基酸的變化不影響其與抗原的結(jié)合能力,因此是研究蛋白質(zhì)一級結(jié)構(gòu)與其表達水平關(guān)聯(lián)的理想素材。表達系統(tǒng)中影響蛋白質(zhì)可溶性表達水平的因素有很多[23],且各個影響因素之間存在不同程度的交互影響,是一個典型的多變元生物過程。因此作者以dAb作為分子模型,采用逐步線性回歸分析的方法分析各個因素的影響程度,找出關(guān)鍵影響因子,從而指導(dǎo)蛋白質(zhì)分子的定向改造以提高其可溶性表達水平,并在分子生物學(xué)層面上就其機理研究提供理論指導(dǎo)方向。
1.1.1 宿主菌和質(zhì)粒 大腸桿菌BL21(DE3):購自北京全式金生物技術(shù)有限公司;質(zhì)粒pBW:作者所在實驗室保存。
1.1.2 主要試劑和藥品 分子生物學(xué)相關(guān)試劑:ThermoFisher公司;胰蛋白胨,酵母提取物:OXOID公司;異丙基硫代半乳糖苷(IPTG):Sigma-Aldrich(中國)公司;HRP-Protein A:武漢博士德生物工程有限公司;四環(huán)素(tetracycline),蛋白質(zhì)定量試劑盒:生工生物工程(上海)股份有限公司;ELISA相關(guān)試劑:鄭州博賽生物技術(shù)股份有限公司;其他藥品均為國產(chǎn)分析純。
1.1.3 培養(yǎng)基配制 LB培養(yǎng)基(g/L):酵母提取物5,蛋白胨 10,NaCl 10;pH 7.0,加入 1.5 g/L 瓊脂糖即為固體培養(yǎng)基;TB/SB搖瓶培養(yǎng)基(g/L):酵母提取 物 24, 蛋 白 胨 12,KH2PO42.31,K2HPO4·3H2O 12.55,甘油 10;pH 7.0。
1.1.4 主要耗材和儀器 PCR儀:A500,杭州朗基科學(xué)儀器有限公司;酶標(biāo)儀:EZ Read 800,英國Biochrom公司;洗板機:ST-96W,南京科華生物技術(shù)有限公司;冷凍離心機:ST16R,美國ThermoFisher公司;高通量細胞破碎儀:Precellys 24,法國Bertin公司;深孔板:48孔,常州英德生物科技有限公司。
1.2.1 菌株構(gòu)建
1)C端添加單個氨基酸重組菌株的構(gòu)建:所用引物委托蘇州金維智生物科技有限公司合成,序列見表1。目的片段經(jīng)PCR擴增并用NdeI/XhoI雙酶切后,連接到表達載體pBW上,再導(dǎo)入表達宿主E.coli BL21(DE3)。從轉(zhuǎn)化平板上挑選單克隆進行測序驗證,驗證正確的菌株保存為甘油菌。
表1 dAb C端添加單個氨基酸所用引物序列Table 1 Primer sequences used in adding an amino acid to the C-terminal of dAb
2)CDR區(qū)隨機突變菌株的構(gòu)建:在dAb的三個互補決定區(qū) (complementarity-determining region,CDR,亦稱為超級可變區(qū))各隨機挑選5個氨基酸(總計15個氨基酸)進行隨機突變,突變時排除稀有密碼子突變,最終得到含約107個突變序列的文庫,從中隨機挑選65個菌株作為本實驗的隨機突變株。
1.2.2 平行發(fā)酵方法 取無菌48孔深孔板,加入1 mL含15 μg/mL四環(huán)素的LB培養(yǎng)基。從-80℃冰箱中取出各株菌的甘油菌,各吸取10 μL加入相應(yīng)的培養(yǎng)孔中,置于30℃搖床,230 r/min培養(yǎng)16 h,此為種子液。取10 μL種子液轉(zhuǎn)接至含15 μg/mL四環(huán)素的1 mL TB/SB中,于30℃培養(yǎng)7 h后,加入IPTG至終濃度為0.1 mmol/L,于23℃培養(yǎng)。16 h后將菌液轉(zhuǎn)移至1.5 mL離心管,10 000 g離心 10 min,分離上清液及菌體沉淀并保存。
1.2.3 菌體處理方法 上述菌體重懸于1.0 mL PBS中,全部轉(zhuǎn)移至裝有0.5 cm3玻璃珠的破碎管,通過Precellys 24高通量細胞破碎儀進行破碎。破碎程序為:6 000 r/min連續(xù)振蕩20 s后,間隔2 min,重復(fù)此操作4次。振蕩完成后,10 000 g離心10 min,分離上清液留存待測。
1.2.4 直接ELISA法檢測目的產(chǎn)物質(zhì)量分?jǐn)?shù) 以作者所在實驗室保存的scFv純品為標(biāo)準(zhǔn)品,按一定比例稀釋至不同質(zhì)量濃度后,各取50 μL加入酶標(biāo)板(Corning,USA)。另將樣品稀釋至合適的倍數(shù)后,以PBS為空白對照,TB/SB為陰性對照 (樣品為菌體裂解液時,以對照菌體裂解液為陰性對照),各取50 μL加入酶標(biāo)板,37℃溫育1 h后用洗板機洗滌五遍,每孔加入300 μL 5%脫脂牛奶,溫育及洗滌同上。每孔加入 50 μL稀釋 1 500倍的 HRPProtein A,溫育及洗滌同上。加入100 μL顯色液,37℃避光 15 min后,每孔加入 100 μL 2 mol/L H2SO4終止反應(yīng),用酶標(biāo)儀讀取A450/620。以標(biāo)準(zhǔn)品質(zhì)量濃度為橫坐標(biāo),以相應(yīng)讀數(shù)為縱坐標(biāo)作出標(biāo)準(zhǔn)曲線后,代入稀釋樣品讀數(shù)計算質(zhì)量分?jǐn)?shù)。
前期實驗中所有菌株均未檢測到明顯包涵體,因此本研究主要關(guān)注dAb的可溶性表達量。本研究中發(fā)酵上清液中dAb質(zhì)量分?jǐn)?shù)為胞外可溶性蛋白質(zhì)量分?jǐn)?shù),菌體破碎后上清液中dAb質(zhì)量分?jǐn)?shù)為胞內(nèi)可溶性蛋白質(zhì)量分?jǐn)?shù),兩者之和為dAb的可溶性表達量。
1.2.5 Bradford法測定蛋白質(zhì)總量 參照試劑盒說明書制作BSA蛋白質(zhì)標(biāo)準(zhǔn)曲線,測定各樣品的A595值后代入標(biāo)準(zhǔn)曲線計算蛋白質(zhì)質(zhì)量分?jǐn)?shù),用于計算每微克總蛋白質(zhì)中dAb的納克數(shù)。
1.2.6 數(shù)據(jù)分析 探索在dAb的C端添加一個氨基酸對其可溶性表達量影響的研究,采用t檢驗分析表達量變化的顯著性(以P<0.05為顯著)。
我們研究蛋白質(zhì)兩方面性質(zhì)對其可溶性表達量的影響:1)每種氨基酸的含量;2)蛋白質(zhì)帶電性、極性、憎水性、酸性、堿性。按照Vector NTI軟件的分類,帶電氨基酸包括 R、K、D、C、H(組氨酸)、Y(酪氨酸)及E。酸性氨基酸包括D和E(谷氨酸)。堿性氨基酸包括 K 和 R。 極性氨基酸為 N、T、C、G、Q、S和 Y。 疏水氨基酸 A、V、L(亮氨酸)、I(異亮氨酸)、F和W。我們采用R package從以下兩個層面進行分析(顯著性以P<0.05作為篩選標(biāo)準(zhǔn))。第一個層面:采用層次聚類法將蛋白質(zhì)表達數(shù)據(jù)分成高表達和低表達兩類,然后在這兩類數(shù)據(jù)之間進行t檢驗,方差分析以找出顯著影響蛋白質(zhì)可溶性表達量的影響因素。第二個層面:分別建立線性模型,然后從全模型開始逐一減掉一個影響因素,最終根據(jù)AIC值(越小越好)選擇最佳的影響因素組合。
另外,通過 Cluster Omega(http://www.ebi.ac.uk/Tools/msa/clustalo/),根據(jù)氨基酸序列信息對這66株菌進行了分類,并將該結(jié)果與蛋白質(zhì)可溶性表達分類結(jié)果進行比對分析,計算其一致性比例。該比例越高代表蛋白質(zhì)可溶性表達與其氨基酸組成的關(guān)聯(lián)越緊密。
有文獻表明,少量氨基酸的改變便足以影響蛋白質(zhì)的可溶性表達水平發(fā)生顯著變化[5]。為探索單個氨基酸對本研究所用dAb可溶性表達水平的影響,我們設(shè)計進行此部分實驗。因dAb N端的酶切位點NdeI經(jīng)酶切后具有ATG起始位點,因此我們在dAb的C端進行改造。采用表1中的特異性引物,以原始dAb分子為模板,經(jīng)PCR擴增出C端增加一個氨基酸約438 bp的條帶,見圖1。經(jīng)NdeI/XhoI雙酶切連接至pBW載體并導(dǎo)入BL21(DE3)宿主后,單克隆測序正確。
圖1 dAb C端添加一個氨基酸的PCR擴增結(jié)果Fig.1 PCR amplifications of dAb gene after adding an amino acid at the end of C-terminal
由于本研究中隨機突變的dAb分子是在原始dAb的CDR進行改造,造成各突變分子對互補抗原的結(jié)合能力不同,因此常用的用抗原包被酶標(biāo)板捕獲抗體分子的間接ELISA在本研究中并不適用。針對于本研究的樣品,我們采用直接ELISA法,用包含dAb分子的樣品直接包被酶標(biāo)板,而蛋白質(zhì)與酶標(biāo)板之間的吸附性無特異性,因此消除了因與包被抗原結(jié)合能力不同而造成的信號差異。為保持測定方法一致,采用直接ELISA測定dAb可溶性表達量。
將直接ELISA的A450/620讀數(shù)帶入標(biāo)準(zhǔn)曲線公式計算,得出樣品中的dAb質(zhì)量分?jǐn)?shù),并以各樣品的總蛋白質(zhì)量為標(biāo)準(zhǔn)進行均一化,所得數(shù)據(jù)見圖2。
由圖2可知,添加一個氨基酸便足以引起dAb可溶性表達水平的顯著變化。其中添加G、P(脯氨酸)、C及Q造成的變化最為顯著,其表達量分別為4.53±0.70、4.12±0.32、3.81±0.32、3.78±0.22 ng/μg,均顯著 (P<0.01)高于原始分子的表達量1.17±0.02 ng/μg;添加 L、F、M(甲硫氨酸)、W(色氨酸)、Y、I及H的dAb的可溶性表達量雖然提高的幅度不大,但其表達量的變化也具有統(tǒng)計學(xué)意義(P<0.02)。
由于ELISA法中所用的酶標(biāo)抗原HRP-Protein A是與dAb的恒定區(qū)結(jié)合,為不影響兩者之間的結(jié)合并使突變分子之間具有足夠大的差異,我們選擇在dAb分子的三個CDR進行隨機突變。
2.3.1 聚類分析證明氨基酸組成與可溶性表達水平具有很大關(guān)聯(lián) 層次聚類分析顯示dAb株菌的高水平表達與低水平表達顯著不同,根據(jù)氨基酸序列信息對66株菌進行分類,同樣得到具有顯著差異的兩個組。對比這兩組分類結(jié)果發(fā)現(xiàn),分類一致的菌株有46株,一致性可達70%,說明氨基酸組成與蛋白質(zhì)的可溶性表達水平間確實存在著關(guān)聯(lián),見表2。
2.3.2 線性建模揭示顯著影響dAb可溶性表達水平的氨基酸組成 為研究20種氨基酸的組成對dAb可溶性表達水平的影響,我們以每種氨基酸的數(shù)目為變量進行逐步回歸分析,結(jié)果見表3。
圖2 dAb C端添加不同氨基酸后的可溶性表達量Fig.2 Soluble expression amount of dAb after adding different amino acid to the C-terminal
表2 氨基酸序列與可溶性表達水平分類結(jié)果Table 2 Clustering results based on amino acid sequences and soluble expression amounts
表3 顯著影響dAb可溶性表達量的氨基酸組合及其影響效果Table 3 Amino acids that have significantly affection on soluble expression levels of dAbs
我們發(fā)現(xiàn),顯著影響dAb可溶性胞外質(zhì)量分?jǐn)?shù)的變量組合為 S、R、N、D、Q、Y、F 和 G 的含量 (p=0.001 683),其中單個氨基酸影響顯著的有S(正相關(guān),p=0.000 623)、R(負相關(guān),p=0.001 229)、N(正相關(guān),p=0.018 052)、D(正相關(guān),p=0.030 956)和 Q(正相關(guān),p=0.046 071);顯著影響dAb胞內(nèi)質(zhì)量分?jǐn)?shù)的變量組合為 G、R、C、N、S、Y、K 和 A 的含量(p=0.001 851),其中單個氨基酸影響顯著的有G(正相關(guān),p=0.012 2)、R(負相關(guān),p=0.015 1)、C(正相關(guān),p=0.019 5)、N(正相關(guān),p=0.029 6)和 S(正相關(guān),p=0.034 9);顯著影響dAb可溶性表達水平的變量為R、S、G、N、Y、C、Q、F 和 T 的含量(p=0.000 718 6),其中單個氨基酸影響顯著的有 R(負相關(guān),p=0.000 793)、S(正相關(guān),p=0.006 407)和 G(正相關(guān),p=0.027 663)。 我們對影響胞外、胞內(nèi)和蛋白質(zhì)總量的氨基酸進行了比較,發(fā)現(xiàn)R、S、G、N和Y的含量對蛋白質(zhì)可溶性表達的影響是不受檢測位置變化所影響的,見圖3,其中R、S和G具有顯著影響(p=0.000 806)。
在對蛋白質(zhì)帶電性、極性、疏水性、酸性、堿性的分析中我們發(fā)現(xiàn),極性顯著影響dAb的可溶性表達水平(p=0.021 42)。
圖3 影響dAb胞內(nèi)、胞外及可溶性表達量的因素的文氏圖Fig.3 Venny diagram of factors affecting dAb soluble expression
蛋白質(zhì)氨基酸組成與其可溶性表達水平的關(guān)聯(lián)研究有很多,但是各研究的結(jié)論并不太一致。例如Science上發(fā)表的一篇文章通過研究81種不同的蛋白質(zhì),提出提高平均電荷量、降低形成轉(zhuǎn)角的氨基酸數(shù)目及C的數(shù)目等可減少包涵體的形成[14];也有針對G耦聯(lián)受體蛋白質(zhì)的研究指出,提高正電荷含量可提高包涵體表達量[15]。再如一項從TargetDB數(shù)據(jù)庫中挑選27 267個蛋白質(zhì)并研究其性質(zhì)與高通量分析限速步驟的研究得出,蛋白質(zhì)疏水性越強越不利于蛋白質(zhì)的表達[24];而另外一項探索C.elegans基因組10 167個ORF表達情況的研究發(fā)現(xiàn),蛋白質(zhì)疏水性強并不一定代表蛋白質(zhì)的表達量低,但是疏水性弱的蛋白質(zhì),其可溶性表達水平較高[25]。以上可歸因于各研究采用的研究對象、數(shù)據(jù)來源及分析方法等的不一致,而本研究通過構(gòu)建dAb隨機突變庫,在固定的大腸桿菌表達體系中進行高通量平行發(fā)酵與檢測將有效避免這些問題。
通過對66個dAb分子氨基酸組成和可溶性表達量的分析發(fā)現(xiàn),極性與蛋白質(zhì)的可溶性表達量呈顯著正相關(guān), 即 N、S、C、G、T、Q 和 Y 數(shù)目的總和與蛋白質(zhì)可溶性表達量呈正相關(guān),可能是由于蛋白質(zhì)折疊后極性氨基酸更容易暴露于溶劑中[26],增加了蛋白質(zhì)與溶劑之間的相互作用,提高了可溶性,從而間接提高了蛋白質(zhì)的可溶性表達。
我們發(fā)現(xiàn)R的數(shù)目與蛋白質(zhì)可溶性表達量顯著負相關(guān),與翻譯過程中正電荷氨基酸可降低大腸桿菌蛋白質(zhì)翻譯速率的報道一致[12]。在dAb分子C端添加G與對該分子進行隨機突變的結(jié)果均顯示,G的數(shù)目與dAb可溶性表達量呈顯著正相關(guān),我們認(rèn)為這可能是由于G相對分子質(zhì)量小且具有極性。極性分子S對dAb的可溶性表達量的顯著正相關(guān),與我們發(fā)現(xiàn)極性顯著影響蛋白質(zhì)可溶性表達的結(jié)論相吻合。在7個極性氨基酸分子當(dāng)中,C含量的增加易于在蛋白質(zhì)內(nèi)部形成二硫鍵,而二硫鍵在大腸桿菌的周質(zhì)空間難以正確形成,從而提高了蛋白質(zhì)不正確折疊的風(fēng)險,理論上不利于蛋白質(zhì)可溶性表達;T、Q和Y各項物理、化學(xué)性質(zhì)比較穩(wěn)定,加上G、S對可溶性表達的正向作用以及R的負影響,因此,在通過定向改造氨基酸而提高蛋白質(zhì)表達水平方面,我們建議嘗試提高G、S、T、Q和Y中個別氨基酸或氨基酸組合的含量,并減少R的含量。
本研究實現(xiàn)了根據(jù)蛋白質(zhì)的氨基酸組成,指導(dǎo)提高蛋白質(zhì)可溶性表達水平的定向改造,可大大提高工作效率,降低獲得一定量蛋白質(zhì)純品的難度,從而推進蛋白質(zhì)的結(jié)構(gòu)研究以及實際應(yīng)用。
[1]MAKINO T,SKRETAS G,GEORGIOU G:Strain engineering for improved expression of recombinant proteins in bacteria[J].Microbial Cell Factories,2011,10:32.
[2]GRASLUND S,NORDLUND P,WEIGELT J,et al:Protein production and purification[J].Nature Methods,2008,5(2):135-146.
[3]PETI W,PAGE R.Strategies to maximize heterologous protein expression in Escherichia coli with minimal cost[J].Protein Expression and Purification,2007,51(1):1-10.
[4]PELEG Y,UNGER T.Resolving bottlenecks for recombinant protein expression in E.coli[J].Methods in Molecular Biology,2012,800:173-186.
[5]TREVINO S R,SCHOLTZ J M,PACE C N.Amino acid contribution to protein solubility:Asp,Glu,and Ser contribute more favorably than the other hydrophilic amino acids in RNase Sa[J].Journal of Molecular Biology,2007,366(2):449-460.
[6]MAKRIDES S C.Strategies for archieving high-level expression of genes in Escherichia coli[J].Microbiology Review,1996,60(3):512-538.
[7]STUDIER F W.Protein production by auto-induction in high-density shaking cultures[J].Protein Expression and Purification,2005,41(1):207-234.
[8]SONODA H,KUMADA Y,KATSUDA T,et al.Effects of cytoplasmic and periplasmic chaperones on secretory production of single-chain Fv antibody in Escherichia coli[J].Journal of Bioscience and Bioengineering,2011,111(4):465-470.
[9]ENTZMINGER K C,CHANG C,MYHRE RO,et al.The Skp chaperone helps fold soluble proteins in vitro by inhibiting aggregation[J].Biochemistry,2012,51(24):4822-4834.
[10]SUN W,XIE J,LIN H,et al.A combined strategy improves the solubility of aggregation-prone single-chain variable fragment antibodies[J].Protein Expression and Purification,2012,83(1):21-29.
[11]CHANG C C,SONG J,TEY B T,et al.Bioinformatics approaches for improved recombinant protein production in Escherichia coli:protein solubility prediction[J].Briefings in Bioinformatics,2014,15(6):953-962.
[12]PRICE W N,HANDELMAN S K,EVERETT J K,et al.Large-scale experimental studies show unexpected amino acid effects on protein expression and solubility in vivo in E.coli[J].Microbial Informatics and Experimentation,2011,1(1):6.
[13]TIANY,DEUTSCHC,KRISHNAMOORTHYB.Scoringfunctiontopredictsolubilitymutagenesis[J].Algorithms for Molecular Biology,2010,5:33.
[14]WILKINSON D L,HARRISON R G.Predicting the solubility of recombinant proteins in Escherichia coli[J].Biotechnology(N Y),1991,9(5):443-448.
[15]KIEFER H,VOGEL R,MAIER K.Bacterial expression of G-protein-coupled receptors:prediction of expression levels from sequence[J].Receptors and Channels,2000,7(2):109-119.
[16]IDICULA T S,BALAJI P V.Understanding the relationship between the primary structure of proteins and its propensity to be soluble on overexpression in Escherichia coli[J].Protein Science,2005,14(3):582-592.
[17]IDICULA T S,KULKARNI A J,KULKARNI B D,et al.A support vector machine-based method for predicting the propensity of a protein to be soluble or to form inclusion body on overexpression in Escherichia coli[J].Bioinformatics,2006,22(3):278-284.
[18]CHAN W C,LIANG P H,SHIH Y P,et al.Learning to predict expression efficacy of vectors in recombinant protein production[J].BMC Bioinformatics,2010,11 Suppl 1:S21.
[19]SMIALOWSKI P,MARTIN G A J,MIKOLAJKA A,et al.Protein solubility:sequence based prediction and experimental verification[J].Bioinformatics,2007,23(19):2536-2542.
[20]MAGNAN C N,RANDALL A,BALDI P.SOLpro:accurate sequence-based prediction of protein solubility[J].Bioinformatics,2009,25(17):2200-2207.
[21]SMIALOWSKI P,DOOSE G,TORKLER P,et al.PROSO II--a new method for protein solubility prediction[J].FEBS Journal,2012,279(12):2192-2200.
[22]HOLT L J,HERRING C,JESPERS L S,et al.Domain antibodies:proteins for therapy[J].Trends in Biotechnology,2003,21(11):484-490.
[23]GUSTAFSSON C,MINSHULL J,GOVINDARAJAN S,et al.Engineering genes for predictable protein expression[J].Protein Expression and Purification,2012,83(1):37-46.
[24]GOH C S,LAN N,DOUGLAS S M,et al.Mining the structural genomics pipeline:identification of protein properties that affect high-throughput experimental analysis[J].Journal of Molecular Biology,2004,336(1):115-130.
[25]LUAN C H,QIU S H,F(xiàn)INLEY J B,et al.High-throughput expression of C.elegans proteins[J].Genome Research,2004,14(1):2102-2110.
[26]LESSER G J,ROSE G D.Hydrophobicity of amino acid subgroups in proteins[J].Proteins,1990,8(1):6-13.
會議名稱(中文):國際生物化學(xué)學(xué)會第六屆年會
所屬學(xué)科:化學(xué)生物學(xué),生物技術(shù)與生物工程
開始日期:2017-10-17
結(jié)束日期:2017-10-20
所在城市:上海市 黃浦區(qū)
具體地點:華東理工大學(xué)
主辦單位:華東理工大學(xué)、生物反應(yīng)器工程國家重點實驗室
E-MAIL:icbs2017@chemical-biology.org
會議網(wǎng)站:http://icbs2017.ecust.edu.cn/
會議背景介紹:ICBS2017年會旨在全球范圍內(nèi)召集生物化學(xué)領(lǐng)域的各前沿領(lǐng)導(dǎo)者、技術(shù)推動者、領(lǐng)域新星、學(xué)員以及做出貢獻的研究者們,分享激動人心的研究突破和最新技術(shù)、討論目前存在的挑戰(zhàn)及未來發(fā)展方向、以期提高生物化學(xué)的社會影響力。本次會議將提供面對面的交流互動、技術(shù)探討,以促進商業(yè)聯(lián)系和未來的合作;邀請具有重要貢獻的學(xué)科建設(shè)者、青年科學(xué)家和技術(shù)先驅(qū)者代表,并為其提供一個交互平臺;且將從所有提交的演講摘要中選擇部分進行報告交流。
為促進生物化學(xué)研究者的職業(yè)發(fā)展,我們將遵照歷屆ICBS的傳統(tǒng),在會議上選出“國際生物化學(xué)學(xué)會青年生物化學(xué)學(xué)者”的獲獎?wù)摺4送?,ICBS2017的預(yù)會議部分將由年輕的研究人員和學(xué)生共同組織,預(yù)會議將動員下一代年輕科學(xué)者,提出創(chuàng)新的方法來迎接科學(xué)的重大挑戰(zhàn)。
Correlation Between Protein Primary Sequence Structure and Soluble Expression Level of dAbs in Escherichia coli
GUO Wenwen1,2,3, LIU Meng1,2,3, BAI Zhonghu1,2,3, YANG Yankun*1,2,3, DAI Xiaofeng1,2,3
(1.National Engineering Laboratory for Cereal Fermentation Technology,Jiangnan University,Wuxi 214122,China;2.The Key Laboratory of Industrial Biotechnology,Ministry of Education,School of Biotechnology,Jiangnan University,Wuxi 214122,China;3.The Key Laboratory of Carbohydrate Chemistry and Biotechnology,Ministry of Education,School of Biotechnology,Jiangnan University,Wuxi 214122,China)
Lots of antibody drug have been successfully expressed in the prokaryotic system.Lacking knowledge on the process mechanism of recombinant protein expression has forcedresearchers to use"trial and error"to improve soluble production,which is time and labor consuming with low success rate.Adding different amino acids to the C-terminal of a dAb often results in significant variation of soluble expression levels.The amino acid sequence of dAbs highly concords with their soluble expression levels,with a consistency being 70%.Through analyzing the soluble expression and sequence data of 65 dAbs using clustering and linear modeling,we show that certain amino acids panel could significantly affect the soluble expression of dAbs,with the specific amino acids composition in these panels being(S,R,N,D,Q),(G,R,C,N,S) and(R,S,G),respectively,in the supernatant,pellet and total amount.In addition,polar was found a vital factor affecting the soluble production of dAb.These results may be helpful in orthomutation.
dAb,amino acid panel,soluble expression,clustering analysis,linear modeling
Q 815
A
1673—1689(2017)09—0951—08
2015-03-27
國家863計劃項目(2015AA020802);國家973計劃項目(2013CB733602);中央高?;究蒲袠I(yè)務(wù)費專項資金項目(JUSRP51401A)。
*通信作者:楊艷坤(1978—),男,河北石家莊人,理學(xué)博士,副教授,碩士研究生導(dǎo)師,主要從事微生物學(xué)、基因工程、分子遺傳、蛋白質(zhì)的分離純化及特性等方面的研究。E-mail:yangyankun@jiangnan.edu.cn
郭雯雯,劉萌,白仲虎,等.大腸桿菌中dAb一級結(jié)構(gòu)與可溶性表達關(guān)聯(lián)[J].食品與生物技術(shù)學(xué)報,2017,36(09):951-958.