汪亮,徐澍
(中國(guó)藥科大學(xué)基礎(chǔ)醫(yī)學(xué)與臨床藥學(xué)學(xué)院,江蘇 南京 210009)
“人類(lèi)基因組計(jì)劃”的完成,為闡明基因組功能以及在遺傳變異和生物表型之間建立因果聯(lián)系提供了可能,而高效、簡(jiǎn)便和精準(zhǔn)的基因編輯系統(tǒng)是將這一可能付諸實(shí)現(xiàn)的重要工具。許多以此為目標(biāo)的基因編輯系統(tǒng)被開(kāi)發(fā)和應(yīng)用,從2012年開(kāi)始大規(guī)模應(yīng)用的成簇規(guī)律間隔短回文重復(fù)系統(tǒng)(clustered regularly interspaced short palindromic repeats-CRISPR associated nuclease 9,CRISPR-Cas)[1]到 以 前 的 轉(zhuǎn)錄激活樣效應(yīng)因子核酸酶系統(tǒng)(Transcription activator-like effector nuclease,TALEN)[2]和鋅指核糖核酸酶系統(tǒng)(Tincfinger nuclease,ZFN)[3]等。這類(lèi)基因編輯工具可以在DNA鏈上產(chǎn)生雙鏈斷裂(DSB),從而在編碼基因中誘導(dǎo)插入缺失(indels),使之移碼突變,繼而解析闡明特定基因和調(diào)控元件的功能。但這種“切割”技術(shù)存在兩大問(wèn)題,首先,“切割”是不可逆轉(zhuǎn)的,無(wú)法應(yīng)用于與致死性突變相關(guān)的基因;另外,DSB的形成可能導(dǎo)致未知的細(xì)胞毒性。
相比于基因編輯,調(diào)控基因表達(dá)不會(huì)像“分子剪刀”一樣切割基因組DNA。因此,不會(huì)造成DNA雙鏈斷裂,可避免在特定基因上產(chǎn)生某種永久突變從而對(duì)宿主產(chǎn)生不利的影響[4]。由于基因的選擇性表達(dá)出現(xiàn)在生物體生命進(jìn)程中的各個(gè)階段,所以人為的控制基因表達(dá)的激活或抑制會(huì)影響細(xì)胞正常功能甚至相關(guān)的生命進(jìn)程。因此,使精準(zhǔn)地調(diào)控靶標(biāo)基因使之能夠適時(shí)、適量、適度地表達(dá),對(duì)疾病的發(fā)生發(fā)展進(jìn)程、致病基因功能的研究以及基因治療方面有顯著的作用。已有研究表明,細(xì)菌中發(fā)現(xiàn)的天然DNA結(jié)合結(jié)構(gòu)域(DBDs),如TetR、LacI和LexA等也常作為招募效應(yīng)分子的結(jié)構(gòu)域用來(lái)調(diào)控基因的表達(dá)[5]。如今,CRISPR/dCas9系統(tǒng)、人工構(gòu)建的TALEs(Transcriptional activator-like effectors)、人工構(gòu)建的ZFs(Zinc fingers)、miRNA和siRNA等非編碼小RNA等可以通過(guò)相應(yīng)不同地機(jī)制調(diào)控靶標(biāo)基因的表達(dá)[6-8]。下面將介紹幾種調(diào)控基因表達(dá)技術(shù)的研究進(jìn)展。
RNA干擾(RNA interference,RNAi)是一種存在于真核生物中相對(duì)保守且廣泛存在的轉(zhuǎn)錄后的調(diào)節(jié)機(jī)制,通過(guò)特異性降解靶標(biāo)mRNA從而實(shí)現(xiàn)靶標(biāo)基因沉默。其形成過(guò)程及作用機(jī)制如圖1。
如圖1所示,當(dāng)siRNA與Argonaute(Ago)蛋白和多種酶結(jié)合形成RNA誘導(dǎo)沉默復(fù)合物(RNA-inducing silencing complex,RISC)后,其中的解旋酶利用ATP供能解開(kāi)siRNA雙鏈,釋放的反義鏈通過(guò)堿基互補(bǔ)配對(duì)識(shí)別并結(jié)合靶標(biāo)Mrna,再利用核酸內(nèi)切酶切割mRNA,隨后被降解的mRNA被宿主細(xì)胞中的RNA酶降解,從而實(shí)現(xiàn)靶標(biāo)基因沉默[9]。除了介導(dǎo)mRNA的切割外,siRNA還可以在RNA依賴(lài)的RNA聚合酶的作用下,以靶標(biāo)mRNA為模板作為合成dsRNA的引物,合成新的dsRNA。dsRNA再一次被Dicer切割產(chǎn)生更多的siRNA,接著再經(jīng)以上循環(huán)作用于靶標(biāo)mRNA。如此往復(fù),不斷級(jí)聯(lián)放大了RNAi的效果[10]。
圖1 形成過(guò)程及作用機(jī)制圖
目前,RNAi已被廣泛用于基因組中的篩選,其結(jié)果可通過(guò)Project Achilles[11]和GenomeRNAi[12]等數(shù)據(jù)資源中獲取。金海玲等通過(guò)促進(jìn)真菌寄生蟲(chóng)對(duì)dsRNA和siRNA的吸收,開(kāi)發(fā)出用于產(chǎn)生新RNA殺菌劑的新型系統(tǒng),稱(chēng)為環(huán)境RNAi[13]。另外,patisiran,全球第一個(gè)RNAi生物技術(shù)藥物,已經(jīng)被用于治療成人患者的遺傳性ATTR淀粉樣變性第1階段或第2階段多發(fā)性神經(jīng)病(一種退行性神經(jīng)疾病)[14]。
microRNA(miRNA)是一類(lèi)由自身基因組編碼的長(zhǎng)約20-24nt的單鏈非編碼小RNA分子,通過(guò)靶向mRNA充當(dāng)轉(zhuǎn)錄后調(diào)控因子實(shí)現(xiàn)對(duì)靶標(biāo)基因的調(diào)節(jié)[15],在許多生物學(xué)過(guò)程中具有重要的作用,包括發(fā)育,分化,細(xì)胞增殖,代謝和炎癥以及人類(lèi)疾病等[16]。在細(xì)胞核內(nèi),大部分miRNA在RNA聚合酶II(很少部分由RNA聚合酶III)的作用下轉(zhuǎn)錄出不同長(zhǎng)度的初級(jí)產(chǎn)物pri-miRNA。隨后,pri-miRNA被核酸內(nèi)切酶Drosha和輔助因子DGCR8剪切成約70個(gè)堿基的miRNA前體pre-miRNA。pre-miRNA在轉(zhuǎn)運(yùn)蛋白Exportin 5的幫助下,從細(xì)胞核內(nèi)運(yùn)輸?shù)郊?xì)胞胞質(zhì)中。在核酸內(nèi)切酶Dicer及其輔助因子的作用下pre-miRNA被剪切加工成miRNA:miRNA*配對(duì)分子[17]。接著,miRNA:miRNA*配對(duì)分子與Ago等多種蛋白結(jié)合形成RISC(過(guò)程類(lèi)似于siRNA)。隨后,miRNA:miRNA*配對(duì)分子中穩(wěn)定性較強(qiáng)的miRNA*被快速降解,穩(wěn)定性較弱的miRNA形成成熟的miRNA進(jìn)而引導(dǎo)RISC進(jìn)行靶標(biāo)基因的識(shí)別[18]。miRNA通過(guò)序列完全或不完全的互補(bǔ)配對(duì),結(jié)合靶標(biāo)mRNA的3’UTR,導(dǎo)致靶標(biāo)mRNA被切割或翻譯抑制,從而下調(diào)相應(yīng)蛋白的表達(dá)。
自20世紀(jì)90年代以來(lái),在臨床前研究和臨床試驗(yàn)中,兩種基于miRNA的治療工具已顯示出希望,分別是miRNAmimetics和antimiRs[14]。越來(lái)越多的miRNA已經(jīng)用于治療各種疾病,包括代謝綜合征,自身免疫性疾病和癌癥等[14]。Miravisen作為第一個(gè)針對(duì)miRNA的藥物,目前已經(jīng)進(jìn)入治療丙型肝炎病毒的II期實(shí)驗(yàn)[14]。
鋅指蛋白(Zinc finger protein,ZFP)普遍存在于真核生物基因組中,人類(lèi)基因組中有近1%的序列編碼含有鋅指結(jié)構(gòu)的蛋白[19]。ZFP作為對(duì)基因調(diào)控起重要作用的轉(zhuǎn)錄因子,通過(guò)折疊形成“手指”樣結(jié)構(gòu),特異性地識(shí)別靶標(biāo)結(jié)構(gòu),在生物體多種生命過(guò)程中發(fā)揮重要作用。由于ZFP的DBDs中含有與靶標(biāo)DNA雙螺旋結(jié)構(gòu)互補(bǔ)的獨(dú)特結(jié)構(gòu),其“指型”結(jié)構(gòu)與DNA雙螺旋的大溝吻合,通過(guò)α螺旋結(jié)構(gòu)與DNA堿基發(fā)生特異性接觸介導(dǎo)其特異性識(shí)別并結(jié)合靶標(biāo)基因。ZF與DNA結(jié)合必須三個(gè)條件:(1)ZFP的α螺旋位于DNA雙螺旋的大溝內(nèi);(2)ZFP攜帶正電荷的區(qū)域接近磷酸骨架;(3)鋅指(Zincfinger,ZF)間的接頭結(jié)構(gòu)相對(duì)固定(ZF為構(gòu)成ZFP的基本單元)[20]。ZFP作為基因表達(dá)調(diào)控工具的關(guān)鍵點(diǎn)是可以通過(guò)人工設(shè)計(jì)改變鋅指結(jié)構(gòu),以特異性識(shí)別特定的靶標(biāo)序列。對(duì)于不同的靶標(biāo)位點(diǎn),需要?jiǎng)?chuàng)建不同的ZFP,通過(guò)將ZFP與不同功能的結(jié)構(gòu)域融合,可以構(gòu)建出不同用途的人工合成的DBDs,從而實(shí)現(xiàn)對(duì)基因組的定點(diǎn)修飾或調(diào)控[21]。
已有研究表明,以ZF為核心構(gòu)建了一種可調(diào)控的合成生物學(xué)系統(tǒng),用于調(diào)節(jié)真核生物的轉(zhuǎn)錄[8]。目前,仍有很多靶標(biāo)序列不知道哪種ZFP能與之高效結(jié)合,研究人員已開(kāi)發(fā)出多種方案用于ZFP的構(gòu)建和篩選。如模塊組裝(Modular assembly,MA)方案、雙鋅指模塊組裝方案、寡聚文庫(kù)構(gòu)建(ligomerized pool engineering,OPEN)方案和上下文依賴(lài)組裝 (context-dependent assembly,CoDA)方案[21]?;蛘撸部梢酝ㄟ^(guò)商業(yè)購(gòu)買(mǎi)工程鋅指,如Sangamo生物科學(xué)公司和Sigma-Aldrich 公司合作開(kāi)發(fā)的鋅指結(jié)構(gòu)合成平臺(tái)CompoZr。
轉(zhuǎn)錄激活樣效應(yīng)因子(Transcription activator like effectors,TALEs)是由黃單胞菌分泌的影響宿主植物防御反應(yīng)相關(guān)基因表達(dá)的效應(yīng)蛋白,TALEs能夠特異性識(shí)別并結(jié)合宿主植物中靶標(biāo)基因的啟動(dòng)子序列,發(fā)揮類(lèi)似于真核生物轉(zhuǎn)錄因子的作用干預(yù)宿主植物靶標(biāo)基因的轉(zhuǎn)錄,以便于黃單胞菌在宿主中繁殖[22]。隨后,研究人員便將其作為基因表達(dá)調(diào)控工具進(jìn)行深入研究。由不同數(shù)量的重復(fù)單元構(gòu)成的DBDs形成了TALEs的特殊結(jié)構(gòu)從而實(shí)現(xiàn)了對(duì)靶標(biāo)基因的特異性識(shí)別與結(jié)合。一般情況下,TALEs的每個(gè)重復(fù)單元由34個(gè)序列高度保守的氨基酸組成。但第12和13位的兩個(gè)氨基酸序列可變,構(gòu)成了重復(fù)單元可變區(qū)(RVDs)。一個(gè)重復(fù)單元上的一個(gè)RVD特異性識(shí)別一個(gè)堿基對(duì)[22]。所以理論上說(shuō),研究人員可以利用這一特征設(shè)計(jì)出與任意靶標(biāo)結(jié)合的TALEs。同樣,TALEs也可以通過(guò)人工設(shè)計(jì)改變RVDs結(jié)構(gòu),以特異性識(shí)別特定的靶標(biāo)序列。TALEs與具有激活或抑制功能的結(jié)構(gòu)域融合,就能夠讓相對(duì)應(yīng)的靶標(biāo)基因激活或抑制。
目前,David Bikard等借助天然的AvBs3設(shè)計(jì)出TALEs的中央重復(fù)結(jié)構(gòu)域,靶向靶標(biāo)基因的啟動(dòng)子序列,最后成功激活了植物基因的表達(dá)[7]。張鋒等利用融合VP64激活結(jié)構(gòu)域的TALEs成功激活了了SOX2和KLF4的表達(dá)[23]。另外,Jeffrey C Miller和René Geissler的研究團(tuán)隊(duì)使用了融合VP64激活結(jié)構(gòu)域的不同的TALEs激活了人類(lèi)細(xì)胞中相關(guān)基因的表達(dá)[24,25]。雖然TALEs理論上可以靶向識(shí)別任何序列,但其合成與裝配往往也具有一定的難度和限制。相應(yīng)地,研究人員開(kāi)發(fā)了多種用于人工構(gòu)建高效TALEs的方案,主要包括:(1)Golden Gate(GG)克隆法;(2)連續(xù)克隆組裝法;(3)利用基因固相合成的高通量技術(shù)法;(4)長(zhǎng)粘末端的LIC(ligation‐independent clonging)組裝方法等[26]。
CRISPR/Cas9系統(tǒng)起源于細(xì)菌和古細(xì)菌中,為抵抗病毒、噬菌體等的入侵而形成的一種遺傳適應(yīng)性免疫防御系統(tǒng),可以有效地切割細(xì)胞內(nèi)的外源DNA[27]。該系統(tǒng)特異性識(shí)別并結(jié)合靶標(biāo)不是利用蛋白與靶標(biāo)基因間的相互作用而是利用RNA與靶標(biāo)間的堿基互補(bǔ)配對(duì)引導(dǎo)Cas核酸內(nèi)切酶對(duì)靶標(biāo)序列進(jìn)行雙鏈切割[1]。該系統(tǒng)由CRISPR RNA復(fù)合體和Cas9核酸內(nèi)切酶組成。自然狀態(tài)下,前者由crRNA(CRISPR-derived RNA,crRNA)和 反 式 激 活 RNA(Trans-activating RNA,tracrRNA)組成,目前,研究人員已經(jīng)將其簡(jiǎn)化為一條導(dǎo)向RNA(single guide RNA,sgRNA)[28]。通過(guò)對(duì)該系統(tǒng)的升級(jí)改造,CRISPR/Cas9系統(tǒng)已不僅限于作為基因編輯工具,還是一種重要的基因調(diào)控工具。研究人員發(fā)現(xiàn)將Cas9蛋白切割活性域RuvC1第10位天冬氨酸突變?yōu)楸彼?D10A)和HNH第840位組氨酸突變?yōu)楸彼?H840A)后,將失去核酸內(nèi)切酶活性,成為不能切割DNA但可以在sgRNA的引導(dǎo)下與特異靶標(biāo)序列結(jié)合的dCas9(catalytically dead Cas9,dCas9)[6]。此外,將dCas9蛋白與轉(zhuǎn)錄調(diào)控因子融合后,dCas9可以將這些調(diào)控因子引導(dǎo)到啟動(dòng)子區(qū)域、調(diào)控區(qū)域或編碼區(qū)域,對(duì)靶標(biāo)基因進(jìn)行精確定點(diǎn)調(diào)控而不造成DNA損傷,可用于研究轉(zhuǎn)錄因子或輔助轉(zhuǎn)錄因子對(duì)特定基因的影響[27,29]。
將dCas蛋白與轉(zhuǎn)錄激活結(jié)構(gòu)域融合構(gòu)成了轉(zhuǎn)錄激活工具CRISPRa(CRISPR activation)。在原核生物中,David Bikard等在大腸桿菌中發(fā)現(xiàn)將RNA聚合酶ω亞基與dCas9融合可以使報(bào)告基因激活約3倍[6]。Lingjun Yu等在溶桿菌中發(fā)現(xiàn)ω亞基與dCas9融合顯著激活了5個(gè)基因共表達(dá)[30]。在真核細(xì)胞中,Luke A Gilbert等發(fā)現(xiàn),VP64激活結(jié)構(gòu)域與dCas9融合除了激活報(bào)告基因外還可以激活被沉默的內(nèi)源基因或者上調(diào)已激活基因的表達(dá)[31]。隨后,研究人員開(kāi)發(fā)出了SunTag、VP64-p65-Rta(VPR)和 SAM 等系統(tǒng)[31-33],擴(kuò)大了該系統(tǒng)的應(yīng)用。
不僅能用于轉(zhuǎn)錄激活,還可以用于轉(zhuǎn)錄抑制。將dCas蛋白與轉(zhuǎn)錄抑制結(jié)構(gòu)域融合構(gòu)成了轉(zhuǎn)錄抑制工具CRISPRi(CRISPR interference)。 研 究 表 明,CRISPRi系 統(tǒng)可以通過(guò)干擾轉(zhuǎn)錄的起始和延伸來(lái)高效地抑制靶標(biāo)基因轉(zhuǎn)錄[6]。亓磊等發(fā)現(xiàn)在大腸桿菌中單獨(dú)的dCas9就能通過(guò)sgRNA引導(dǎo)識(shí)別并結(jié)合特定的靶標(biāo)基因,有效地抑制基因的表達(dá)[34]。雖然該系統(tǒng)在細(xì)菌,酵母和其他原核細(xì)胞中能夠顯著抑制基因的表達(dá),但在哺乳動(dòng)物細(xì)胞中的基因表達(dá)抑制效率較差。為了提高轉(zhuǎn)錄抑制能力,亓磊和張鋒等研究團(tuán)隊(duì)將抑制結(jié)構(gòu)域KRAB與dCas9融合。這種增強(qiáng)的CRISPRi系統(tǒng)依靠KRAB募集不同的組蛋白修飾因子,通過(guò)形成異染色質(zhì)的方式抑制基因表達(dá)[31,35]。CRISPRi特異地抑制靶標(biāo)基因轉(zhuǎn)錄并且可以調(diào)控轉(zhuǎn)錄水平的能力得到了廣泛的應(yīng)用。如全基因組內(nèi)基因篩選、敲低特定基因轉(zhuǎn)錄以研究基因功能、通過(guò)分析代謝途徑利用CRISPRi調(diào)控必需基因轉(zhuǎn)錄水平提高代謝物產(chǎn)量或減少副產(chǎn)物的分泌等[36-39]。
由于非編碼小RNA以RNA為靶標(biāo)且在細(xì)胞質(zhì)中發(fā)揮作用,因此其沉默作用不受細(xì)胞倍性,染色質(zhì)構(gòu)象和基因座可及性的影響。相對(duì)于其他技術(shù),非編碼小RNA不需要遞送外源蛋白以及其他調(diào)控蛋白,簡(jiǎn)化了基因工程,所以對(duì)于特定的細(xì)胞模型可能特別有利[40]。但由于大量位置靶標(biāo),這可能會(huì)導(dǎo)致非編碼小RNA的脫靶效應(yīng)較高,往往限制其應(yīng)用,尤其是當(dāng)目的基因?yàn)橹械然虻退奖磉_(dá)的必需基因時(shí)[41]。并且基于非編碼小RNA的療法仍處于開(kāi)發(fā)的早期階段,大多數(shù)處于臨床前研究中,很少進(jìn)入臨床試驗(yàn)。
盡管人工合成的DBDs能夠達(dá)到CRISPR系統(tǒng)類(lèi)似的水平,但往往需要通過(guò)復(fù)雜的克隆去實(shí)現(xiàn)激活或抑制基因的功能。相比于其他技術(shù),人工合成的DBDs與靶標(biāo)的特異性結(jié)合依賴(lài)蛋白質(zhì)與DNA間的相互作用,因此易受表觀(guān)遺傳狀態(tài)的影響。目前也無(wú)法實(shí)現(xiàn)對(duì)任意一段序列設(shè)計(jì)出相應(yīng)理想的DBDs[42]。
CRISPR/dCas9系統(tǒng)相對(duì)于其他基因表達(dá)調(diào)控技術(shù),具有設(shè)計(jì)簡(jiǎn)單,效率高、適應(yīng)性廣等優(yōu)點(diǎn),從而應(yīng)用更為廣泛。如Prashant Mali將熒光蛋白與CRISPR/dCas9系統(tǒng)融合用于基因定位,研究基因組的動(dòng)力學(xué)特征和三維結(jié)構(gòu)[34]Silvana Konermann和Piyush K Jain將光遺傳工具與CRISPR/dCas9系統(tǒng)融合,實(shí)現(xiàn)通過(guò)光誘導(dǎo)抑制基因表達(dá)[35,43]。但CRISPR/dCas9仍然存在一些局限性,如脫靶,較難遞送等問(wèn)題。Mazhar Adli等發(fā)現(xiàn)染色質(zhì)的結(jié)構(gòu)和動(dòng)力學(xué)特征可以影響dCas9與靶標(biāo)基因的結(jié)合,這可能會(huì)改變其影響基因表達(dá)的能力[44]。另外,一些與不同細(xì)胞類(lèi)型特異性表觀(guān)遺傳修飾相關(guān)的基因和跨細(xì)胞周期階段差異調(diào)節(jié)的相關(guān)基因,CRISPR/dCas9的效果可能會(huì)有所不同。因此在這種情況下,針對(duì)特定細(xì)胞類(lèi)型的文庫(kù)可能更加精確[45]。隨著生物技術(shù)以及大數(shù)據(jù)的發(fā)展,越來(lái)越多的基因及其功能將被發(fā)現(xiàn),癌癥等尚未克服疾病的發(fā)生發(fā)展機(jī)制將被更加清楚地認(rèn)識(shí),醫(yī)療人員進(jìn)而能從源頭上制定解決方案,做到真正的對(duì)癥下藥。越來(lái)越多的頑疾也將被攻克。最后,希望有更多更好的基因調(diào)控工具被研發(fā)出來(lái)造福與人類(lèi)。