曲 戈,張 錕,蔣迎迎,孫周通
(中國科學(xué)院 天津工業(yè)生物技術(shù)研究所,天津 300308)
2018年10月3日,諾貝爾化學(xué)獎(jiǎng)揭曉。獎(jiǎng)金一半授予Frances H.Arnold教授,表彰她在“酶定向進(jìn)化”(“the directed evolution of enzymes”)領(lǐng)域的卓越貢獻(xiàn);另一半頒給了George P.Smith和Gregory P.Winter教授,獎(jiǎng)勵(lì)他們?cè)凇岸嚯募翱贵w的噬菌體展示”(“the phage display of peptides and antibodies”)技術(shù)方面的開創(chuàng)性工作與應(yīng)用(圖 1)[1]。地球生命的多樣性彰顯了自然進(jìn)化的力量,而2018年諾貝爾化學(xué)獎(jiǎng)的3位得主以“掌控了進(jìn)化的方式,并用它謀求為人類帶來最大福祉”,將自然進(jìn)化發(fā)展為:可控制、可加速、可應(yīng)用的人工進(jìn)化[2]——通過定向進(jìn)化的非天然酶廣泛應(yīng)用于生物燃料、醫(yī)藥中間體等領(lǐng)域;而采用噬菌體展示技術(shù)篩選出的抗體可以對(duì)抗自身免疫疾病,甚至治愈癌癥。本文主要從生命化學(xué)的角度出發(fā),綜述定向進(jìn)化以及噬菌體展示技術(shù)發(fā)展過程中的關(guān)鍵技術(shù)及應(yīng)用,并對(duì)未來發(fā)展方向進(jìn)行展望。
圖1 2018年諾貝爾化學(xué)獎(jiǎng)3位得主:Frances H.Arnold(左,現(xiàn)任美國加州理工學(xué)院Linus Pauling講席教授),George P.Smith(中,美國密蘇里大學(xué)榮譽(yù)退休教授)以及Gregory P.Winter(右,現(xiàn)任MRC分子生物學(xué)研究所所長)[2]Figure 1 The Nobel Prize in Chemistry 2018 has been awarded to Frances H.Arnold (California Institute of Technology),and George P.Smith (University of Missouri) and Gregory P.Winter (Medical Research Council (MRC) Laboratory of Molecular Biology (LMB))[2]
地球生命普遍存在著進(jìn)化現(xiàn)象。以我們?nèi)祟悶槔徒?jīng)歷了一條“早期猿人→能人→直立人→智人→現(xiàn)代人”的進(jìn)化路線(圖2)。進(jìn)化需要兩個(gè)基本要素——突變與選擇?;蛲蛔兺请S機(jī)發(fā)生的,但自然選擇卻是有方向性的。達(dá)爾文在《物種起源》中詳細(xì)闡述了自然選擇是進(jìn)化的內(nèi)驅(qū)動(dòng)力,而進(jìn)化的方向則是更好地適應(yīng)生存環(huán)境。與之類似,酶定向進(jìn)化也包括兩個(gè)基本要素——突變與篩選。但突變可以是隨機(jī)發(fā)生的,也可以是定點(diǎn)發(fā)生的;而篩選則會(huì)施加一個(gè)人為偏好的方向,因此稱之為“定向”。酶定向進(jìn)化主要通過蛋白質(zhì)工程等手段,對(duì)編碼基因進(jìn)行反復(fù)的突變、表達(dá)和篩選,誘使蛋白質(zhì)等生物分子的結(jié)構(gòu)及功能發(fā)生定向改變,從而在短時(shí)間內(nèi)在實(shí)驗(yàn)室里完成自然界需要成千上萬年的進(jìn)化,而定向進(jìn)化的方向則是最終獲得性能改進(jìn)或具有新功能的蛋白質(zhì)[3]。
圖2 人類進(jìn)化過程示意圖[1]Figure 2 The evolution of human being[1]
這種人為模擬自然進(jìn)化過程既可在活細(xì)胞體內(nèi)(invivo)進(jìn)行,或是在體外(invitro)進(jìn)行。通常情況下分為4步:1)突變:通過分子生物學(xué)技術(shù),在編碼目的蛋白的基因上引入隨機(jī)突變位點(diǎn);2)表達(dá):將突變基因轉(zhuǎn)化至宿主菌,并借助宿主體內(nèi)蛋白表達(dá)系統(tǒng)合成突變體蛋白;3)篩選:使用特異的化學(xué)反應(yīng)等手段篩選目標(biāo)突變體,舍棄不符合要求的突變體;4)循環(huán):基于篩選得到的最優(yōu)突變體,引入新的突變位點(diǎn),進(jìn)入下一輪“突變-篩選”的循環(huán),直至獲得預(yù)期性能的蛋白質(zhì)(圖 3)。
圖3 酶定向進(jìn)化流程示意圖[1]Figure 3 The workflow of the directed evolution of enzyme[1]
前文概述了酶的定向進(jìn)化,然而這項(xiàng)技術(shù)本身,又是如何“進(jìn)化”的呢?時(shí)間追溯到1953年,James D.Watson和Francis H.Crick發(fā)現(xiàn)了DNA雙螺旋結(jié)構(gòu)(兩人因此獲得1962年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)),開啟了分子生物學(xué)時(shí)代。隨后誕生于20世紀(jì)70年代的DNA重組技術(shù)為利用生物工程手段的研究和應(yīng)用奠定了重要基石[4]。在此基礎(chǔ)上,定向進(jìn)化領(lǐng)域的先驅(qū)們開發(fā)了一系列經(jīng)典的進(jìn)化策略與技術(shù)(圖 4):1978年,Michael Smith首次提出定點(diǎn)突變技術(shù)(Site-Specific Mutagenesis,SSM,憑此貢獻(xiàn)獲得1993年諾貝爾化學(xué)獎(jiǎng)),揭開了蛋白質(zhì)改造與設(shè)計(jì)的新篇章[5]。1985年James A.Wells團(tuán)隊(duì)開發(fā)了寡核苷酸飽和突變(Oligonucleotide-based Saturation Mutagenesis,OSM)技術(shù)[6],實(shí)現(xiàn)基因序列的單點(diǎn)飽和突變;1989年David W.Leung團(tuán)隊(duì)最先提出易錯(cuò)PCR(error-prone Polymerase Chain Reaction,epPCR)概念[7],隨后應(yīng)用于體外抗體改造篩選[8]。1993年,本屆諾貝爾化學(xué)獎(jiǎng)獲得者之一的Frances H.Arnold教授提出酶分子定向進(jìn)化的概念,通過使用多輪epPCR(Sequential epPCR,SepPCR)技術(shù),連續(xù)反復(fù)地對(duì)枯草桿菌蛋白酶E(Subtilisin E)編碼基因進(jìn)行隨機(jī)突變,并經(jīng)逐步積累正向突變,最終獲得可在高濃度有機(jī)溶劑二甲基甲酰胺(DMF)中穩(wěn)定存在且表現(xiàn)出活性的突變體[9]。定向進(jìn)化領(lǐng)域的另外一位先驅(qū)Willem P.C.Stemmer教授,于1994年開創(chuàng)了用于單基因或多基因間重組的DNA混組(DNA shuffling)技術(shù),可加速有益突變的積累以及組合兩個(gè)或多個(gè)已優(yōu)化的參數(shù),并成功提高了β-內(nèi)酰胺酶的活性[10],為定向進(jìn)化領(lǐng)域做出了開拓性貢獻(xiàn)。定向進(jìn)化領(lǐng)域的第三位開拓者M(jìn)anfred T.Reetz教授,于1997年首次將定向進(jìn)化技術(shù)應(yīng)用在酶的不對(duì)稱催化改造領(lǐng)域[11],將銅綠假單胞菌來源的脂肪酶對(duì)映體選擇性由2%提升至81%;隨后又發(fā)現(xiàn)對(duì)手性選擇有益的突變位點(diǎn)主要集中在底物結(jié)合口袋區(qū)域,由此提出了組合活性中心飽和突變策略(Combinatorial Active-site Saturation Test,CAST)[12]及迭代飽和突變技術(shù)(Iterative Saturation Mutagenesis,ISM)[13],極大精簡了突變體庫的構(gòu)建規(guī)模,從而提高了篩選效率。Romas J.Kazlauskas團(tuán)隊(duì)統(tǒng)計(jì)分析并比較了位于活性中心和遠(yuǎn)離活性中心的氨基酸位點(diǎn)突變對(duì)酶的活性、底物選擇性、對(duì)映體選擇性及穩(wěn)定性的影響,指出前者更有利于改造酶的底物選擇性及對(duì)映體選擇性,從統(tǒng)計(jì)學(xué)的角度進(jìn)一步支持了CAST方法的可靠性[14]。因此CAST方法廣泛應(yīng)用于酶的立體/區(qū)域選擇性、底物譜、催化效率等參數(shù)的改造[15-16]。
圖4 定向進(jìn)化技術(shù)發(fā)展歷程Figure 4 Pioneering technologies in the directed evolution
除此之外,還有一些衍生技術(shù)也被廣泛應(yīng)用于定向進(jìn)化領(lǐng)域。比如,Ulrich Schwaneberg教授在單點(diǎn)飽和突變的基礎(chǔ)上,開發(fā)了序列飽和突變技術(shù)(Sequence saturation Mutagenesis,SeSaM),通過引入通用堿基避免了突變偏差,提高了突變效率[17];從進(jìn)化的角度出發(fā),基于序列保守性分析,Steven A.Benner課題組設(shè)計(jì)了REAP分析方法(Reconstructed Evolutionary Adaptive Path,REAP),使聚合酶可接受3′端氨基化(dNTP-ONH2)的三磷酸底物[18];Peter J.Schaap教授利用基于結(jié)構(gòu)的多重序列比對(duì)技術(shù),開發(fā)了3DM策略(3D-Multiple sequence alignment,3DM),應(yīng)用于酶催化活性和對(duì)映體選擇性等參數(shù)改造[19];Gjalt W.Huisman團(tuán)隊(duì)將統(tǒng)計(jì)學(xué)方法與定向進(jìn)化技術(shù)相結(jié)合,提出PROSAR策略(Protein Sequence Activity Relationships,PROSAR),可加速突變體設(shè)計(jì)優(yōu)化速度,成功提升了脫鹵酶的工作效率[20];為提高隨機(jī)突變效率,Miguel Alcalde開發(fā)了MORPHING技術(shù)(Mutagenic Organized Recombination Process by HomologousinvivoGrouping,MORPHING),成功改造了過氧化酶和環(huán)化酶等酶的催化性能[21];孫周通教授在CAST方法的基礎(chǔ)上,通過理性選擇3種氨基酸密碼子作為飽和突變的建構(gòu)單元,開發(fā)了三密碼子飽和突變策略(Triple Code Saturation Mutagenesis,TCSM)[22-23],通過構(gòu)建“小而精”的突變體庫,可大大降低篩選工作量,成功應(yīng)用于酶的立體選擇性、區(qū)域選擇性、底物譜拓展及熱穩(wěn)定性等酶參數(shù)的定向改造[24-25]。
酶定向進(jìn)化技術(shù)經(jīng)歷了近50年的發(fā)展變革,期間Michael Smith、Frances H.Arnold、Willem P.C.Stemmer、Manfred T.Reetz等先驅(qū)做了一系列開創(chuàng)性工作,極大豐富了該技術(shù)的研究及應(yīng)用范疇[26-28]。近年來定向進(jìn)化技術(shù)廣泛應(yīng)用于生物催化劑改造。通過定向進(jìn)化這一人工過程,可有效馴服天然酶在環(huán)境(包括酸堿性、溫度、有機(jī)溶劑等)耐受性、立體/區(qū)域選擇性、底物特異性、催化效率及產(chǎn)物抑制性等方面存在的缺點(diǎn),使得自然界成千上萬年的進(jìn)化歷程可在實(shí)驗(yàn)室短時(shí)間內(nèi)完成。從而拓展了生物催化劑的應(yīng)用范疇,使其廣泛應(yīng)用于食品工業(yè)、醫(yī)藥衛(wèi)生、精細(xì)化工及生物能源等諸多領(lǐng)域[27-28]。
通過定向進(jìn)化技術(shù),極大拓展了蛋白質(zhì)的應(yīng)用領(lǐng)域。以Frances H.Arnold團(tuán)隊(duì)近年來的工作成果為例,通過使用定向進(jìn)化技術(shù)改造的細(xì)胞色素C氧化酶,可提高碳-硅鍵形成的催化效率[29],以及實(shí)現(xiàn)了傳統(tǒng)化學(xué)上難以合成的高能高張力小分子碳環(huán)的生物合成[30],可應(yīng)用于制備醫(yī)藥中間體等工業(yè)領(lǐng)域。除此之外,表1列舉了定向進(jìn)化技術(shù)的其他關(guān)鍵應(yīng)用,比如賦予30億年來逆轉(zhuǎn)錄酶原本不存在的校對(duì)功能[31];實(shí)現(xiàn)P450單加氧酶區(qū)域選擇性、立體選擇性和底物適配性等多參數(shù)改造[25];增強(qiáng)CRISPR-Cas9核酸酶可識(shí)別的序列范圍及精準(zhǔn)度[32]等。
表1 酶定向進(jìn)化技術(shù)的應(yīng)用節(jié)選Table 1 Applications of the directed evolution of enzymes
與Frances H.Arnold分享今年諾貝爾化學(xué)獎(jiǎng)的George P.Smith開發(fā)的噬菌體展示技術(shù)是一種基于定向進(jìn)化的高通量篩選技術(shù),大大拓展了定向進(jìn)化技術(shù)在抗體多肽改造篩選方面的應(yīng)用。該技術(shù)通常分為三步:1)基因融合:利用基因工程技術(shù)將外源基因片段插入噬菌體特定蛋白基因;2)外源蛋白擴(kuò)增與展示:帶有外源蛋白的噬菌體侵染宿主菌進(jìn)行擴(kuò)增,并將外源蛋白展示在噬菌體表面;3)生物淘洗:篩選與靶分子特異性結(jié)合的噬菌體(圖5)。
圖5 噬菌體展示技術(shù)示意圖[1]Figure 5 The workflow of phage display[1]
圖6 使用噬菌體展示定向進(jìn)化抗體的原理[1]Figure 6 The principle for the directed evolution of antibodies using phage display[1]
Gregory P.Winter和George P.Smith共享了一半的諾貝爾化學(xué)獎(jiǎng)。他在George P.Smith教授開發(fā)的噬菌體展示技術(shù)的基礎(chǔ)上,開創(chuàng)了噬菌體展示定向進(jìn)化抗體技術(shù)。該技術(shù)通常分為四步:1)將抗體抗原結(jié)合位點(diǎn)的遺傳信息插入到噬菌體DNA中,創(chuàng)建具有多樣性的抗體庫;2)通過靶抗原篩選出對(duì)特定抗原具有強(qiáng)附著性的噬菌體;3)在進(jìn)行下一輪篩選之前,將隨機(jī)突變引入到附著目標(biāo)抗體的噬菌體上;4)隨著新一代抗體突變體的出現(xiàn),抗體會(huì)更特異并更加強(qiáng)力地附著在目標(biāo)蛋白質(zhì)上(圖 6)。
將噬菌體開發(fā)為簡單、靈敏的實(shí)驗(yàn)載體的構(gòu)想具有悠久歷史。1966年,Joseph Haimovich、Michael Sela和O.M?kel?提出將小分子半抗原通過化學(xué)修飾方法連接到活體噬菌體表面,修飾后的噬菌體能夠被相應(yīng)的抗體滅活,從而簡化特異性抗體的檢測[49-50]。1982年,Renato Dulbecco表明免疫原性多肽可與噬菌體或其他病毒的外殼蛋白融合并展示在噬菌體表面,得到具有新的抗原性和免疫原性的病毒顆粒,并提出展示(Display)的概念[51]。1985年,George P.Smith將限制性內(nèi)切酶EcoR I上的一段基因片段(57個(gè)氨基酸)插入到絲狀噬菌體M13的衣殼蛋白基因III中,該片段成功展示在噬菌體表面,且能夠被特異性抗體所識(shí)別,George P.Smith將該技術(shù)命名為“噬菌體展示”(“Phage display”)[52]。1989年,Richard A.Lerner和同事把噬菌體展示技術(shù)和抗體工程結(jié)合起來,把鼠源抗體識(shí)別抗原的可變區(qū)(Fragment of antigen binding,F(xiàn)ab)的DNA片段克隆到噬菌體的衣殼蛋白基因中,從而在噬菌體表面展示了抗體的結(jié)構(gòu)[53]。1990年,Gregory P.Winter等通過在噬菌體表面展示免疫球蛋白輕鏈和重鏈可變區(qū)基因的單鏈抗體(Single-chain variable fragment,scFV),篩選了一種溶菌酶的抗體[54]。在前人基礎(chǔ)上,Richard A.Lerner和Gregory P.Winter分別于1991年和1992年成功利用噬菌體展示了人源抗體片段(Human antibody libraries,圖7)[55-56]。
圖7 噬菌體展示技術(shù)發(fā)展歷程Figure 7 The development of phage display technology
噬菌體展示技術(shù)可以應(yīng)用于大小不同、性質(zhì)不同的結(jié)構(gòu)和序列未知蛋白的表面展示和篩選,從而拓展了它的應(yīng)用范圍,尤其是在疾病的診斷和治療領(lǐng)域。以噬菌體展示技術(shù)在治療性抗體研發(fā)領(lǐng)域的應(yīng)用為例,在George P.Smith和Gregory P.Winter教授開發(fā)噬菌體展示抗體庫篩選技術(shù)前,抗體研發(fā)的方向是獲得人鼠嵌合抗體以降低免疫原性[57- 58]。而使用噬菌體展示抗體庫篩選技術(shù)可以得到全人源抗體,從而徹底解決異源抗體的免疫原性問題,且該技術(shù)操作簡單,可應(yīng)用于多種類型抗體的篩選?!鞍⑦_(dá)木(Adalimumab)”是第一個(gè)基于該技術(shù)研發(fā)的單抗,并于2002年被FDA批準(zhǔn)用于治療類風(fēng)濕性關(guān)節(jié)炎(圖7)。以阿達(dá)木單抗為活性成分的藥物修美樂(Humira)是2013年世界最暢銷的藥物之一,其全球銷售額達(dá)到96億美元,表2展示了部分已商業(yè)化的抗體[59- 60]。
除此之外,表3節(jié)選了噬菌體展示技術(shù)的具體應(yīng)用實(shí)例。比如定向進(jìn)化提高DNA聚合酶的反轉(zhuǎn)錄活力[61];研發(fā)于2009年被FDA批準(zhǔn)用于治療遺傳性血管性水腫的艾卡拉肽(Ecallantide)[62]等。
表2 應(yīng)用噬菌體展示技術(shù)研發(fā)的部分上市抗體藥物Table 2 Phage display-derived drugs approved by FDA or EMA
表3 噬菌體展示技術(shù)應(yīng)用實(shí)例節(jié)選Table 3 Applications of the phage display
前文綜述了定向進(jìn)化技術(shù)在酶的改造和多肽及抗體進(jìn)化領(lǐng)域中的應(yīng)用,但其潛力還遠(yuǎn)沒有被挖掘,其主要瓶頸在于如何建立高效、快速的篩選方法[16,26,68-70]。許多定向進(jìn)化策略試圖通過建立針對(duì)特定改造靶點(diǎn)的高質(zhì)量突變體文庫來解決篩選問題[71],雖然獲得了極大成功,然而隨著擬突變位點(diǎn)數(shù)目的增加,篩選規(guī)模呈指數(shù)級(jí)增長。以NNK(N:A,T,C和G;K:T和G)簡并密碼子為例,設(shè)定95%庫覆蓋度,如果同時(shí)突變10個(gè)位點(diǎn)時(shí),需篩選3.4×1015個(gè)轉(zhuǎn)化子[16],假如一個(gè)蛋白質(zhì)全長為350個(gè)氨基酸,隨機(jī)突變?yōu)?0種天然氨基酸,那么突變體庫的多樣性為20350。篩選是重要瓶頸,因此需要設(shè)計(jì)開發(fā)更加高效的建庫策略或者高通量篩選方法來解決酶定向進(jìn)化的篩選問題。目前常見的篩選方法包括:平板篩選法、微孔板篩選法、熒光活化細(xì)胞分選法及液滴微流控等[72]。這幾種方法的篩選通量各不相同,平板篩選最高為104,微孔板篩選最高為105,細(xì)胞分選法通過流式細(xì)胞儀可以超過108[72],而液滴微流控可達(dá)1.7×109以上[73]。噬菌體展示技術(shù)是一項(xiàng)特異性多肽或蛋白的高通量篩選技術(shù),不僅可以用于抗體或多肽的篩選,也可以用于酶突變庫及疫苗等高通量篩選,如1991年,John McCafferty等人在噬菌體表面成功展示了堿性磷酸酶,證明了可以在噬菌體表面展示有活性的酶[74]。除了噬菌體表面展示技術(shù),還包括細(xì)菌表面展示技術(shù)以及酵母表面展示技術(shù)等,基本原理都是利用DNA重組技術(shù),將目標(biāo)蛋白質(zhì)富集在宿主(如噬菌體、細(xì)菌、酵母)表面進(jìn)行篩選[75- 76],篩選規(guī)模達(dá)109~1010 [77]。
以Frances H.Arnold、George P.Smith和Gregory P.Winter教授為代表的科學(xué)家們通過馴服進(jìn)化的力量,促進(jìn)了“綠色化學(xué)和醫(yī)藥產(chǎn)業(yè)”的快速發(fā)展,更好地為人類社會(huì)謀求福祉,因此他們獲得2018年諾貝爾化學(xué)獎(jiǎng)實(shí)至名歸!除了上述3位獲獎(jiǎng)人外,還有很多科學(xué)家也在各自領(lǐng)域取得了開拓性成果,為酶定向進(jìn)化和噬菌體展示技術(shù)做出了不可磨滅的貢獻(xiàn),我們同樣也應(yīng)當(dāng)向他們致敬!
當(dāng)今人工智能技術(shù)的快速發(fā)展,對(duì)酶定向進(jìn)化領(lǐng)域帶來了深刻變革,從頭設(shè)計(jì)蛋白質(zhì)的時(shí)代已然來臨[78]:過去在實(shí)驗(yàn)室進(jìn)行的濕實(shí)驗(yàn)工作流程(圖 3),如今可以通過計(jì)算生物學(xué)開發(fā)的算法和程序模擬自然界蛋白質(zhì)的進(jìn)化軌跡,預(yù)測酶活性位點(diǎn)并考察特定位點(diǎn)突變對(duì)其穩(wěn)定性、蛋白折疊及與底物結(jié)合等方面的影響,從而對(duì)酶進(jìn)行精準(zhǔn)設(shè)計(jì)與改造,并將繁重的篩選工作轉(zhuǎn)移至計(jì)算機(jī)上進(jìn)行[79]。依賴CPU/GPU高性能計(jì)算處理能力,借助機(jī)器學(xué)習(xí)等智能算法,實(shí)現(xiàn)計(jì)算機(jī)虛擬定向進(jìn)化(insilicodirected evolution),快速準(zhǔn)確地預(yù)測目標(biāo)突變體。這種理性設(shè)計(jì)的策略已經(jīng)在環(huán)氧水解酶[80- 81]及天冬氨酸裂解酶[82]等酶的設(shè)計(jì)改造上取得了成功。依賴計(jì)算機(jī)技術(shù),通過人工智能驅(qū)動(dòng)酶定向進(jìn)化將成為未來發(fā)展的重要方向。