陳映宏 劉 超
中國科學(xué)院動物研究所干細(xì)胞與生殖生物學(xué)國家重點(diǎn)實(shí)驗室,北京 100101
DNA甲基化是被研究得最多的表觀遺傳修飾之一,組成DNA的4種堿基均可發(fā)生甲基化修飾。哺乳動物中胞嘧啶甲基化主要發(fā)生在一些基因5'區(qū)域的CpG島上,由S-腺苷甲硫氨酸提供甲基基團(tuán),由DNA甲基轉(zhuǎn)移酶(DNA methyltransferases, DNMTs)催化,在胞嘧啶第5位碳原子上加上一個甲基基團(tuán),形成 5-甲基胞嘧啶(5mC)[1-2]。DNMT1、DNMT3A/B和DNMT3L負(fù)責(zé)生成和維持5mC:DNMT1以半甲基化的DNA為模板維持DNA全甲基化狀態(tài);DNMT3A/B和DNMT3L作為從頭甲基化酶可以催化DNA發(fā)生從頭甲基化[3-4]。5mC機(jī)制是研究得最成熟和理解得最透徹的表觀遺傳修飾之一,在哺乳動物基因組中,大約60%~80%的CpG二核苷酸的胞嘧啶被甲基化[2,5-6]。5mC在基因的表達(dá)調(diào)控、染色質(zhì)的結(jié)構(gòu)變化、基因印跡、X染色體失活和基因組穩(wěn)定性等生命過程中起著極為重要的作用[7]。近期發(fā)現(xiàn)的5mC通過TET家族蛋白氧化形成的5-羥甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)及其進(jìn)一步氧化產(chǎn)生的代謝衍生物5-甲?;奏?5-formylcytosine, 5fC)和5-羧基胞嘧啶(5-carboxylcytosine, 5caC)也參與眾多的生命過程[8-12]。
6mA于1968年在細(xì)菌中被鑒定[13]出來,是原核生物中最普遍的DNA修飾。早期的研究發(fā)現(xiàn)6mA存在于原核生物中參與調(diào)節(jié)DNA復(fù)制的起始:以大腸桿菌為例,大腸桿菌復(fù)制起始位點(diǎn)oriC包含11個GATC/CTAG重復(fù)序列,腺嘌呤被DNA腺嘌呤甲基轉(zhuǎn)移酶(DNA adenine methyltransferase, Dam)催化形成6mA,起始DNA的復(fù)制。復(fù)制后半甲基化oriC位點(diǎn)無法再次起始復(fù)制,直到Dam將oriC位點(diǎn)恢復(fù)成全甲基化狀態(tài),進(jìn)而起始下一輪DNA復(fù)制[14-15]。6mA參與堿基錯配修復(fù):在細(xì)菌DAN復(fù)制中存在堿基錯配,例如A-C錯配,6mA允許DNA錯配識別機(jī)制(MutHLS mismatch repair complex)區(qū)分模板鏈和新合成的子鏈,然后堿基錯配修復(fù)系統(tǒng)以甲基化的母鏈為模板去替換未甲基化子鏈上的錯配堿基[16]。由Dam介導(dǎo)的對于基因表達(dá)調(diào)控序列中GATC基序的腺嘌呤的不同甲基化修飾狀態(tài)均參與基因的表達(dá)調(diào)控,如位于大腸桿菌agn43基因上游的操縱子的全甲基化GATC基序可以調(diào)控該結(jié)構(gòu)基因的表達(dá),位于大腸桿菌dnaA基因啟動子的全甲基化GATC基序可以調(diào)控該基因的表達(dá),位于IS10轉(zhuǎn)座子的啟動子區(qū)的半甲基化GATC基序有利于IS10轉(zhuǎn)座子表達(dá)轉(zhuǎn)座酶,位于pap基因上游激活序列(upstream activating sequence, UAS)的全甲基化或未甲基化GATC基序可以調(diào)控該基因處于不同狀態(tài)[17]。在細(xì)菌和古生菌中,6mA還作為限制性修飾(restriction-modification systems)系統(tǒng)(Types I、II、III)的一部分參與防止噬菌體和質(zhì)粒等外源DNA的入侵。具體而言,宿主細(xì)胞DNA中存在的6mA可以阻止DNA甲基化敏感的限制性內(nèi)切酶對其基因組的消化。相比之下,外源的非6mA甲基化DNA在進(jìn)入宿主細(xì)胞時會被限制性內(nèi)切酶降解。此外6mA在調(diào)節(jié)細(xì)菌類核分離、細(xì)菌毒素的分泌、細(xì)菌接合、細(xì)菌細(xì)胞周期等多種生命活動過程中扮演了重要的角色[18-20]。
在過去的幾十年中,6mA逐漸被報道存在于多種低等[21]和高等真核生物[4]中。通常,原核生物中6mA含量(6mA/dA)高于真核生物。
低等真核生物如衣藻(Chlamydomonas reinhardi)[22]、團(tuán)藻(Stylonichiamytilius)[23]、雙小核草履蟲(Paramecium Aurelia)[24]、梨狀四膜蟲(Tetrahymena pyriformis)[25]、 嗜熱四膜蟲(Tetrahymena thermophila)[26]等綠藻類和原生動物的基因組都有6mA存在。以嗜熱四膜蟲等具纖毛原生動物為例,其顯著特征是在同一細(xì)胞內(nèi)存在一大一小兩種不同的細(xì)胞核:二倍體生殖核和多倍體營養(yǎng)核。6mA僅在營養(yǎng)核中被發(fā)現(xiàn),而生殖核中未檢測到6mA存在;6mA主要分布于ApT回文序列中,6mA含量為0.8%,還發(fā)現(xiàn)6mA存在于相鄰兩個核小體之間的連接DNA中[27-29]。由于研究技術(shù)的限制,6mA在真核生物基因組中的精確含量和分布模式一直鮮有報道。直到2015年Fu等使用特異性抗體與限制性內(nèi)切酶結(jié)合高通量測序技術(shù),即6mA-IP-seq(6mA-immunoprecipitation sequencing)、6mACLIP-exo(6mAchromatin immunoprecipitation followed by exonuclease digestion)、6mA-RE-seq(restriction enzyme-based 6mA sequencing),發(fā)現(xiàn)衣藻84%的基因中存在6mA,并且他們發(fā)現(xiàn)6mA主要位于轉(zhuǎn)錄起始位點(diǎn)(transcription start site, TSS)周圍的ApT回文序列中,6mA主要位于TSS位點(diǎn)并在TSS位點(diǎn)上下游呈現(xiàn)雙峰分布,這種分布模式與基因的轉(zhuǎn)錄激活相關(guān)[30]。這些結(jié)論與先前在嗜熱四膜蟲的研究中得出的結(jié)論具有相似性[28]
在真菌界中也發(fā)現(xiàn)了6mA的存在。1986年Rogers等采用高效液相色譜法分析產(chǎn)黃青霉菌(Penicillium chrysogenum)的堿基成分,發(fā)現(xiàn)產(chǎn)黃青霉菌基因組中存在6mA,但不存在5mC[31]。2017年Mondo等采用單分子實(shí)時測序技術(shù)(single-molecule real-time sequencing,SMRT-seq)對16種不同真菌的基因組進(jìn)行單分子長讀長測序,從單堿基分辨率水平上分析全基因組范圍內(nèi)6mA的含量與分布模式,發(fā)現(xiàn)在雙核菌亞界[子囊菌門(Ascomycota)和擔(dān)子菌門(Basidiomycota)]中6mA含量較低,為0.048%~0.210%,而在早期分化系真菌基因組中6mA含量高達(dá)2.8%。同時該研究發(fā)現(xiàn)在早期分化系真菌基因組中,幾乎所有的6mA都對稱分布于ApT回文序列中,這與嗜熱四膜蟲和衣藻中的發(fā)現(xiàn)類似。其中80.0%~99.6%的6mA密集地分布在進(jìn)化保守基因與活躍表達(dá)基因的TSS位點(diǎn)周圍并形成甲基化腺嘌呤簇(methylated adenine clusters, MACs)。對比分析發(fā)現(xiàn)6mA與5mC的分布呈現(xiàn)負(fù)相關(guān)關(guān)系,6mA主要富集于TSS位點(diǎn),5mC更多的分布于重復(fù)元件(repetitive elements, REs)[32]。
對于高等真核生物而言,也早已有證據(jù)表明在蚊子[33]和水蠟蟲[34-35]中存在6mA。之前對于秀麗隱桿線蟲DNA甲基化的研究中,由于有關(guān)5mC存在的實(shí)驗缺乏可重復(fù)性[36]以及未檢測到胞嘧啶DNA甲基轉(zhuǎn)移酶的線蟲同源物,因此秀麗隱桿線蟲中可能不存在DNA甲基化[37]。Greer和Shi等人使用SMRT-seq和超高效液相色譜—三重四極桿串聯(lián)質(zhì)譜技 術(shù)(ultra-high performance liquid chromatographytriplequadrupole mass spectrometry, UHPLC-MS/MS)等多種方法,發(fā)現(xiàn)秀麗隱桿線蟲基因組DNA中比較均勻地分布著6mA,未發(fā)現(xiàn)明顯的富集區(qū)域,6mA的含量在0.01%~0.40%之間,分析發(fā)現(xiàn)6mA顯著定位在AGAA和GAGG基序[38]。
前期研究發(fā)現(xiàn)果蠅基因組中5mC的含量極低[39]。Zhang等用6mA特異抗體和斑點(diǎn)印跡實(shí)驗在果蠅胚胎發(fā)育的早期階段發(fā)現(xiàn)了強(qiáng)烈的6mA信號。隨后他們使用UHPLC-MRM-MS/MS檢測果蠅胚胎發(fā)育不同階段的6mA含量變化,發(fā)現(xiàn)在0.75hr階段DNA中6mA的含量達(dá)到峰值為0.07%,到4~16hr階段DNA中6mA的含量達(dá)到極低值為0.001%[40]。
早在1983年就有間接的證據(jù)表明6mA可能存在于哺乳動物中[34,41-42]。2006年Ratel等檢測小鼠多種組織發(fā)現(xiàn)小鼠中幾乎不存在6mA修飾[43]。但在2016年Wu等利用SMRT-ChIP研究哺乳動物小鼠胚胎干細(xì)胞組蛋白變體H2A.X的沉積區(qū)域[44]時發(fā)現(xiàn)了小鼠胚胎干細(xì)胞基因組中存在6mA,并且6mA主要位于組蛋白變體H2A.X的沉積區(qū)域的基因間區(qū),存在于多種基序中[45]。2017年Schiffers等利用UHPLC-MS檢測了目前報道的多種具有表觀遺傳相關(guān)性的DNA甲基化修飾,高靈敏度的質(zhì)譜分析表明6mA極有可能不存在于小鼠基因組中[46]。對斑馬魚和豬基因組中的6mA的研究表明,兩者卵細(xì)胞基因組中的6mA含量顯著高于精子基因組中的6mA,兩者早期胚胎發(fā)育過程中6mA的含量能夠積累到較高水平0.10%~0.17%,當(dāng)胚胎發(fā)育到囊胚期的時候6mA的含量下降到極低水平0.006%~0.050%,這說明6mA在脊椎動物胚胎發(fā)育過程中是一種動態(tài)的表觀遺傳修飾。隨后對6mA在斑馬魚基因組中的分布進(jìn)行研究發(fā)現(xiàn)6mA在斑馬魚基因組中普遍存在,富集于外顯子和基因間區(qū),并且80%左右的6mA分布于重復(fù)元件,尤其分布在簡單重復(fù)序列中[47]。2016年Koziol等報道6mA以非常低的水平(0.00009%)存在于非洲爪蟾中,并且在轉(zhuǎn)錄起始位點(diǎn)缺失[48]。
2018年Xiao等利用“華夏一號”的測序數(shù)據(jù)[49],分析鑒定出6mA廣泛存在于人類基因組中,6mA總含量約為0.051%,其中X染色體(0.023%)和Y染色體 (0.024%)的含量最低,線粒體(0.184%)中含量最高,6mA富集于外顯子并與基因的激活表達(dá)相關(guān),富集基序為[G/C]AGG[C/T][50]。Xie等應(yīng)用UHPLC-MS/MS等技術(shù)發(fā)現(xiàn)惡性膠質(zhì)瘤干細(xì)胞中6mA的水平相比于正常的人類星形膠質(zhì)細(xì)胞升高了100多倍,6mA富集于基因間區(qū)并與H3K9me3和H3K27me3共定位在異染色質(zhì)區(qū)域[51]。
在高等植物中也發(fā)現(xiàn)了6mA的存在。Vanyushin等在1988年報道了6mA存在于黃化小麥幼苗的線粒體DNA中[52]。2018年Zhou等采用質(zhì)譜,6mA-IP-seq和SMRT-seq等技術(shù)發(fā)現(xiàn)在水稻基因組中6mA含量達(dá)0.2%,6mA主要分布于水稻基因組約20%的基因中和14%的轉(zhuǎn)座子元件并富集在GAGG基序,并且6mA的分布與基因體區(qū)域中CG位點(diǎn)的5mC和轉(zhuǎn)座子的CHH位點(diǎn)的5mC密切相關(guān)[53]。
在2002年Ashapkin等利用限制性內(nèi)切酶消化的方法發(fā)現(xiàn)6mA存在于擬南芥Drm2基因的一些GATC基序中[54],但他們并未闡明6mA在全基因組范圍的分布特征。隨后在2018年發(fā)現(xiàn)6mA廣泛存在于擬南芥基因組中并富集于著絲粒周圍的異染色質(zhì)區(qū)域,6mA在外顯子的富集程度高于基因間區(qū),此外6mA在TSS位點(diǎn)附近也呈現(xiàn)出類似于衣藻中的雙峰分布模式,6mA在擬南芥的不同組織器官中的含量具有異質(zhì)性,6mA含量最高達(dá)0.138%,最低為0.006%,并且在擬南芥的發(fā)育過程中6mA的含量是動態(tài)變化的[55]。表1總結(jié)了6mA在部分原核生物和真核生物中的含量與富集基序。
表1 6mA在部分原核生物和真核生物中的含量與富集基序
續(xù)表
這些文章所報道的極低含量的6mA,是進(jìn)化的殘余,或是細(xì)胞內(nèi)的異常修飾,還是實(shí)驗樣本中有細(xì)菌污染或者支原體污染,仍然有探究的余地。
在真核生物中6mA富集的基序具有一定的進(jìn)化保守性,如AGG基序相對高頻率地存在于擬南芥、水稻、線蟲、非洲爪蟾和人類基因組中,這提示我們真核生物保守的AGG基序可能具有類似的生物功能,或者有類似的識別AGG基序的機(jī)制存在。6mA富集的基序和相關(guān)的生物學(xué)功能之間的精確的關(guān)系還有待確定。但是6mA富集的基序在同一物種內(nèi)或不同物種間仍然存在很大的異質(zhì)性,這啟示我們在進(jìn)化的過程中可能出現(xiàn)了多種添加、去除和識別6mA的酶類并且可能存在多種調(diào)控6mA動態(tài)變化的機(jī)制。
真核生物中6mA甲基轉(zhuǎn)移酶方面的研究長期以來都是空白。有研究分析了真核生物中DNA甲基化的酶系,預(yù)測了多種可能參與6mA修飾的結(jié)構(gòu)域[19][56]。
有報道稱植物蛋白Wadmtase參與小麥線粒體6mA修飾[57],而Wadmtase是一種Mg2+- Ca2+依賴的酶,屬于tRNA甲基轉(zhuǎn)移酶TRM11家族,該家族蛋白甲基化tRNA上的鳥嘌呤形成m2G[56],因此Wadmtase是否真正參與6mA修飾還需更多證據(jù)進(jìn)行證明。
在線蟲中敲除Damt-1基因能降低6mA的水平,而過表達(dá)該基因能增加6mA的水平。DAMT-1是在真核生物中保守的MT-A70家族蛋白的同源物[38],METTL3和METTL14是MT-A70家族蛋白的兩個同源物,二者作為甲基轉(zhuǎn)移酶形成異二聚體介導(dǎo)mRNA產(chǎn)生m6A,而METTL3和METTL14也能在體外修飾DNA產(chǎn)生微弱的6mA[58];而且哺乳動物METTL4也與線蟲DAMT-1是同源物[19],并且Kweon等最近也鑒定了小鼠METTL4也可以催化6mA的形成,在小鼠中敲除METTL4基因后導(dǎo)致新生小鼠整體發(fā)育不良和面部畸形(包括下頜畸形和無眼畸形),也會導(dǎo)致成年小鼠在10~12周就表現(xiàn)出垂死狀態(tài)和造血功能異常[59];可見MT-A70家族蛋白在6mA的甲基化中扮演了重要的角色,因而研究人員推測該家族蛋白也許還包含其他未被鑒定的6mA甲基轉(zhuǎn)移酶。
在胃癌和肝癌組織中鑒定了N6AMT1是6mA的甲基轉(zhuǎn)移酶[50],相反的是在惡性膠質(zhì)瘤干細(xì)胞中敲除N6amt1基因和體外實(shí)驗均未發(fā)現(xiàn)6mA的水平變化[51],結(jié)合先前發(fā)現(xiàn)的N6AMT1作為哺乳動物翻譯終止因子eRF1的谷氨酰胺特異的甲基轉(zhuǎn)移酶[60],N6AMT1是否普遍作為哺乳動物6mA的甲基轉(zhuǎn)移酶還存在爭議,需要更多的實(shí)驗證據(jù)闡明其功能。
表觀遺傳修飾往往是受到動態(tài)調(diào)控的可逆過程,DNA甲基化也不例外。在真核生物中存在6mA甲基轉(zhuǎn)移酶,則必定存在6mA去甲基酶。AlkB家族是進(jìn)化保守的、Fe(Ⅱ)和α-酮戊二酸依賴的雙加氧酶家族。AlkB家族蛋白具有廣泛的底物和多種功能,在大腸桿菌中AlkB雙加氧酶通過對腺嘌呤1號和6號氮原子進(jìn)行氧化脫烷基作用逆轉(zhuǎn)DNA的烷基化損傷發(fā)揮DNA損傷修復(fù)的作用,6mA也是AlkB雙加氧酶的底物,在氧化作用下經(jīng)過中間產(chǎn)物HO-6mA生成腺嘌呤[61-62]。哺乳動物AlkB雙氧酶家族共有9個成員,ALKBH1-8和FTO,其中ALKBH5和FTO是mRNAm6A的去甲基酶,ALKBH2和ALKBH3均參與DNA 1mA和3mC的去甲基化[63-64]。ALKBH1及其同源物在多種真核生物中被發(fā)現(xiàn)具有6mA去甲基酶的作用。在線蟲中發(fā)現(xiàn)AlkB家族蛋白同源物NMAD-1參與6mA的去甲基化,敲除Nmad-1基因或體外實(shí)驗發(fā)現(xiàn)6mA的水平顯著變化[38]。
在果蠅中發(fā)現(xiàn)DMAD參與調(diào)節(jié)6mA的去甲基化,并證明了DMAD促進(jìn)果蠅早期生殖細(xì)胞分化,是果蠅發(fā)育所必需的蛋白,DMAD是果蠅CG2083基因編碼的一種含有多個功能結(jié)構(gòu)域并且進(jìn)化高度保守的蛋白,DMAD類似于哺乳動物TET家族蛋白,但在果蠅體內(nèi)卻并不參與催化5mC形成5hmC;更值得注意的是DMAD含有與細(xì)菌6mA去甲基化酶AlkB家族蛋白具有相似的DSBH(double-strand α-helix)結(jié)構(gòu)域。在果蠅胚胎發(fā)育的早期DMAD低表達(dá),而在后期高表達(dá),此外胚胎發(fā)育過程中DMAD介導(dǎo)的6mA去甲基化還與轉(zhuǎn)座子表達(dá)抑制相關(guān)[40]。
在小鼠中Alkbh1基因缺失導(dǎo)致胚胎致死和產(chǎn)仔率下降80%,在Alkbh1基因純合缺失的小鼠胚胎干細(xì)胞系中發(fā)現(xiàn)6mA的含量增加,體外實(shí)驗發(fā)現(xiàn)重組ALKBH1蛋白能有效降低6mA的含量,因此在小鼠中ALKBH1作為去甲基酶調(diào)節(jié)6mA的動態(tài)變化[45]。此外Kweon等通過斑點(diǎn)雜交實(shí)驗發(fā)現(xiàn)小鼠ALKBH4能有效地使雙鏈DNA上的6mA發(fā)生去甲基化,但對單鏈上的6mA去甲基化效果不顯著[59]。
人類ALKBH1蛋白與小鼠ALKBH1蛋白的序列同源性很高,在胃癌和肝癌組織發(fā)現(xiàn)6mA含量降低的同時ALKBH1表達(dá)上調(diào),因而研究人員推測ALKBH1是6mA的去甲基酶;敲降和異位表達(dá)ALKBH1均能使6mA含量降低,結(jié)合體外實(shí)驗進(jìn)一步證明ALKBH1是人類6mA的去甲基酶[50]。Xie等也用多種方法鑒定了ALKBH1是6mA的去甲基酶作為轉(zhuǎn)錄激活因子識別6mA富集位點(diǎn)移除6mA從而解除6mA對基因表達(dá)的抑制作用,敲降A(chǔ)LKBH1導(dǎo)致6mA含量增加從而抑制抑癌基因的表達(dá),進(jìn)而促進(jìn)惡性膠質(zhì)瘤干細(xì)胞的存活,因此ALKBH1可以作為潛在的癌癥治療靶點(diǎn)[51]。
Zhou等利用CRISPR/Cas9等技術(shù)鑒定了ALKBH1在水稻中的同源基因OsALKBH1(LOC_Os03g60190—)是水稻6mA的去甲基酶[53]。以上發(fā)現(xiàn)的哺乳動物ALKBH1及其在果蠅和水稻中的同源物蛋白都具有相似的DSBH結(jié)構(gòu)域作為核心催化結(jié)構(gòu)域,提示我們更多具有6mA去甲基化作用的含有DSBH結(jié)構(gòu)域的雙加氧酶在真核生物中還有待被發(fā)現(xiàn)。此外,果蠅去甲基酶DMAD是TET家族蛋白的類似物這一事實(shí)也提示我們,在基因組5mC含量極低或者缺失的真核生物中TET家族蛋白及其同源物或類似物可能不參與5mC動態(tài)調(diào)節(jié),而參與6mA的代謝調(diào)節(jié)。
目前已經(jīng)在小鼠中發(fā)現(xiàn)了2種6mA閱讀蛋白ASXL1和MPND,兩者都是哺乳動物中與原核生物6mA閱讀蛋白具有同源結(jié)構(gòu)域的蛋白。體外Pull-down實(shí)驗證明ASXL1和MPND能結(jié)合含有6mA的雙鏈DNA[59]。當(dāng)ASXL1和MPND與6mA結(jié)合時,E3泛素連接酶TRIP12會識別這兩種蛋白并促進(jìn)它們通過泛素化途徑降解,從而維持6mA抑制基因表達(dá)的狀態(tài)。
RNA m6A的相關(guān)調(diào)節(jié)酶:包括編碼器(writers)—m6A甲基轉(zhuǎn)移酶METTL3、METTL14、WTAP、KIAA1429,消碼器(erasers)—m6A去甲基酶FTO、ALKBH5和閱讀器(readers)—m6A 閱 讀 蛋 白 YTHDF1、YTHDF2、YTHDC1、HNRNPA2B1、HNRNPC等已經(jīng)有大量相關(guān)研究報道[65]。對于真核生物中6mA的甲基轉(zhuǎn)移酶、去甲基酶和閱讀蛋白已經(jīng)有一些報道。不同生物中的6mA調(diào)節(jié)酶如表2所示。
表2 6mA的甲基轉(zhuǎn)移酶、去甲基酶和閱讀蛋白表
目前對于6mA修飾在真核生物中的功能的報道較少。已有的研究表明6mA參與基因和轉(zhuǎn)座子表達(dá)的激活或抑制、跨代遺傳與胚胎發(fā)育、組蛋白修飾與核小體定位、癌癥與精神類疾病等生理病理過程。
嗜熱四膜蟲在營養(yǎng)生長、分化和增殖過程中生殖核的DNA處于轉(zhuǎn)錄失活狀態(tài),營養(yǎng)核的DNA處于轉(zhuǎn)錄激活狀態(tài),而6mA只存在于營養(yǎng)核中,因此研究人員推測6mA是營養(yǎng)核基因轉(zhuǎn)錄激活所需要的[26]。隨后的研究也發(fā)現(xiàn)在四膜蟲中6mA與RNA聚合酶II(Pol II)轉(zhuǎn)錄的基因高度相關(guān),但6mA并不是四膜蟲活躍轉(zhuǎn)錄基因的一個明確標(biāo)記[87]。早期分化譜系的真菌中6mA的分布并不是隨機(jī)的而是與基因的功能相關(guān)的,主要體現(xiàn)在6mA的分布位點(diǎn)與5mC的分布位點(diǎn)呈現(xiàn)明顯的負(fù)相關(guān)性以及6mA在TSS位點(diǎn)富集與基因的激活具有正相關(guān)性[32]。對于衣藻[30]、線蟲[38]和果蠅[40]的研究也表明6mA的積累與基因或轉(zhuǎn)座子的表達(dá)成正相關(guān)。
對于小鼠胚胎干細(xì)胞的研究發(fā)現(xiàn)6mA的含量與LINE-1(Long Interspersed Nuclear Element-1) 轉(zhuǎn) 座 子的進(jìn)化年齡負(fù)相關(guān),6mA在年輕的全長LINE1(young full-length LINE-1 <1.5 million years old)轉(zhuǎn)座子上富集并與LINE1轉(zhuǎn)座子及其鄰近的增強(qiáng)子和基因的沉默直接相關(guān),結(jié)合先前在人類ES細(xì)胞中的研究表明年輕的全長LINE1轉(zhuǎn)座子被5mC所沉默[81],由此猜測6mA與5mC可能在ES細(xì)胞中共同調(diào)節(jié)某些基因的沉默,并且6mA在哺乳動物中的表觀遺傳效應(yīng)可能與5mC有一定的相似之處。通過分析6mA去甲基化酶基因Alkbh1基因敲除的ES細(xì)胞的轉(zhuǎn)錄組數(shù)據(jù)并結(jié)合RT-qPCR實(shí)驗,結(jié)果表明Alkbh1基因敲除導(dǎo)致的6mA積累抑制了X染色體上基因的轉(zhuǎn)錄;由于LINE1在X染色體上富集,這也為闡明LINE1轉(zhuǎn)座子在X染色體失活過程中的功能提供了新的線索[45]。在小鼠大腦皮層中,壓力誘導(dǎo)的6mA的動態(tài)變化與神經(jīng)元功能和發(fā)育相關(guān)基因以及LINE轉(zhuǎn)座子表達(dá)水平呈負(fù)相關(guān)[69]。最新的研究表明小鼠基因組中6mA的富集可以維持Polycomb基因沉默[59]。在人類中6mA含量增加可以抑制抑癌基因的表達(dá)從而促進(jìn)惡性膠質(zhì)瘤干細(xì)胞的存活[51]。以上研究均表明6mA的積累與基因或轉(zhuǎn)座子的表達(dá)成正相關(guān)或者負(fù)相關(guān),但在水稻中發(fā)現(xiàn)位于啟動子區(qū)的6mA使基因沉默,而位于基因體的6mA則與基因的活化相關(guān)[53]。在擬南芥中,6mA的含量與基因的表達(dá)水平以及營養(yǎng)生長向再生生長的轉(zhuǎn)變成正相關(guān)[55]。因此,研究人員推測6mA在真核生物中的轉(zhuǎn)錄調(diào)控效應(yīng)可能具有物種、時間和空間多樣性。
6mA的含量在果蠅、斑馬魚和豬的胚胎發(fā)育的不同階段是高度動態(tài)變化的,6mA在胚胎發(fā)育的早期含量較高,當(dāng)胚胎發(fā)育到囊胚期時6mA下降到極低水平,這種動態(tài)變化可能在促進(jìn)早期胚胎的發(fā)育中發(fā)揮重要作用[40][47]。而與此相反的是,5mC在受精后的早期胚胎中大規(guī)模的被擦除,在隨后的發(fā)育過程中胚胎基因組DNA重新甲基化并逐漸恢復(fù)到高水平[66-68]。早期胚胎發(fā)育過程中,5mC缺失的時候6mA可能作為替代性的表觀修飾標(biāo)記起到一定的補(bǔ)充作用或者發(fā)揮特殊的作用,6mA是否作為5mC的一個互補(bǔ)的表觀遺傳標(biāo)記而發(fā)揮作用還需要進(jìn)一步探究。
值得注意的是6mA主要對稱地分布在嗜熱四膜蟲、衣藻和真菌的ApT回文序列中,這種對稱分布也許與DNA的復(fù)制相關(guān),而在其他真核生物中還沒有關(guān)于6mA分布于類似回文序列的報道;更進(jìn)一步的研究在線蟲中發(fā)現(xiàn)6mA具有隔代遺傳的表型,因而推測6mA可能是一種可跨代攜帶和傳遞的表觀遺傳標(biāo)記[38]。
在人類基因組中6mA與組蛋白甲基化修飾H3K9me3和H3K27me3共定位在異染色質(zhì)區(qū)域[51]。6mA與組蛋白甲基化修飾的相互關(guān)系及兩者是否共同作用于異染色質(zhì)的形成過程等問題具有較大的研究價值。衣藻基因組中發(fā)現(xiàn)單個6mA位點(diǎn)專一地標(biāo)記相鄰兩個核小體之間的連接DNA,6mA修飾位點(diǎn)的位置有助于核小體的精確定位,首次揭示了6mA在真核生物核小體定位中具有功能意義[30]。隨后研究人員在四膜蟲中發(fā)現(xiàn)含有6mA的連接DNA的兩側(cè)通常是包含H2A.Z變體的核小體[87]。
在環(huán)境壓力下小鼠大腦中6mA含量受到動態(tài)調(diào)控,慢性壓力可誘導(dǎo)6mA在小鼠前額葉皮質(zhì)(prefrontal cortex, PFC)中積累,腦中總的6mA水平在響應(yīng)壓力時顯著升高,并發(fā)現(xiàn)6mA與自閉癥和精神分裂癥相關(guān),第一次證明了哺乳動物腦中6mA的含量變化與神經(jīng)精神類疾病存在聯(lián)系[69]。
與鄰近正常組織相比,胃癌和肝癌組織中6mA的含量更低,并伴隨著甲基轉(zhuǎn)移酶N6AMT1的下調(diào)和去甲基酶ALKBH1的上調(diào),這說明6mA含量降低可以促進(jìn)腫瘤發(fā)生[50]。ATAC-seq和H3K9me3、ChIP-seq等方法獲得的實(shí)驗數(shù)據(jù)表明高水平的6mA能夠降低染色質(zhì)的可接近性并促進(jìn)異染色質(zhì)區(qū)域的形成,抑制多個抑癌基因的表達(dá)從而促進(jìn)惡性膠質(zhì)瘤干細(xì)胞的存活,這說明在癌癥的進(jìn)展中6mA作為一種抑制性的表觀遺傳標(biāo)記發(fā)揮作用[51]。因此,6mA的含量降低與上升可能在不同類型的癌癥中發(fā)揮促癌作用。
與真核生物中高度豐富的5mC相比,6mA水平在真核基因組中占比極低,因此只能通過高度靈敏的技術(shù)檢測[19]。自1971年以來報道的在一些高等植物的質(zhì)體、線粒體或細(xì)胞核中存在的6mA,主要是通過限制性內(nèi)切酶消化的方法被間接的檢測得出的,早期的檢測方法無法對6mA含量進(jìn)行精確測定也無法確定6mA在基因組中的分布模式[33-35,52],因此限制了6mA的研究進(jìn)程。近些年來幾項新技術(shù)的出現(xiàn)使6mA的研究有復(fù)蘇的趨勢,以下對這些方法進(jìn)行簡單的總結(jié)。
早在1983年Chhaya等使用特異性的抗體結(jié)合其實(shí)驗室所開發(fā)的高靈敏度的免疫化學(xué)方法[70]在人類胎盤、大鼠精子、2種雌性的處于妊娠期的水蠟蟲和黑腹果蠅的DNA中檢測到了6mA的存在[34]?,F(xiàn)今使用商業(yè)化的抗6mA的特異性抗體結(jié)合斑點(diǎn)雜交實(shí)驗對實(shí)驗材料中DNA是否含有6mA進(jìn)行定性和半定量分析,果蠅、線蟲、小鼠等基因組中6mA的發(fā)現(xiàn)使用了這種方法。6mA特異性抗體結(jié)合免疫熒光染色可以對DNA中的6mA進(jìn)行半定量分析,Liu等用這種方法檢測了斑馬魚和豬的胚胎基因組6mA的動態(tài)變化[47]。這種方法的缺點(diǎn)是目前的6mA抗體無法區(qū)分6mA與mRNAm6A,需要用RNase消化掉mRNAm6A;此外,6mA抗體對DNA 1mA也有一定的識別作用,隨后需要結(jié)合更加靈敏的檢測技術(shù)進(jìn)一步檢測6mA的具體含量和動態(tài)變化。
在表觀遺傳學(xué)研究中,高通量測序技術(shù)被廣泛用于探究表觀遺傳學(xué)修飾的含量與分布[71]。Weber等人將免疫共沉淀(immunoprecipitation)技術(shù)和下一代測序(next generation sequencing, NGS)技術(shù)相結(jié)合,已經(jīng)用于在哺乳動物基因組中檢測5mC[72]。6mA特異性抗體用于6mA-DNA免疫沉淀再結(jié)合高通量測序手段(6mAIP-Seq)已經(jīng)是研究6mA的基本方法。6mA-IP-seq利用抗6mA的抗體富集測序文庫中的含有6mA修飾DNA片段[85],然后利用下一代測序技術(shù)對富集得到的DNA片段進(jìn)行測序,然后通過分析測序數(shù)據(jù)繪制6mA在全基因組內(nèi)的修飾圖譜,6mA-IP-seq的缺點(diǎn)是無法達(dá)到單堿基的分辨率[19]。6mA-IP-Seq結(jié)合核酸外切酶消化的方法(6mA-CLIP-exo-seq)能夠提高分辨率,6mACLIP-exo-seq雖然能夠在6mA-IP-Seq的基礎(chǔ)上提高識別6mA的分辨率,但這兩種基于抗體的檢測方法從原理上限制了它們,使其都無法做到完全從單堿基的水平上以高分辨率識別6mA。
基于限制性內(nèi)切酶的6mA測序(6mA-RE-seq)能夠達(dá)到單堿基分辨率,但這種方法依賴于限制性內(nèi)切酶的序列識別特異性,只能檢測到有限的6mA修飾基序(motif sites),而無法得到全基因組范圍內(nèi)的6mA甲基化修飾圖譜。Fu等使用6mA-IP-seq和6mA-CLIP-exo-seq在衣藻基因組中確定了6mA富集基序是CATG和GATC,隨后用對6mA修飾不敏感的限制性內(nèi)切酶CviAII(25℃,識別CATG)和DpnII(37℃,識別GATC)處理衣藻的基因組DNA,并加以超聲處理,非甲基化CATG或GATC基序的DNA片段將被消化,分別生成帶有CATG或GATC末端的約300bp的片段,甲基化CATG或GATC基序能夠抵抗限制性內(nèi)切酶的消化因而存留于超聲處理后產(chǎn)生的DNA片段的內(nèi)部,隨后將消化后的片段的末端連上接頭序列,然后經(jīng)PCR擴(kuò)增構(gòu)建DNA文庫用于高通量測序。CATG或GATC基序在DNA片段內(nèi)部和外部的比例就代表了6mA甲基化和未甲基化的相對比例[30]。
單分子實(shí)時測序技術(shù)(SMRT-seq)是由Pacific Biosciences公司開發(fā)的第三代高通量測序技術(shù),其原理是基于邊合成邊測序的思想,不經(jīng)過PCR,以SMRT芯片為載體進(jìn)行測序反應(yīng),SMRT芯片上包含多個孔狀納米光電結(jié)構(gòu),DNA聚合酶與DNA模板和測序引物結(jié)合在一起形成復(fù)合物并被固定在每個納米孔的玻璃底板上,加入四色熒光基團(tuán)標(biāo)記的dNTPs后進(jìn)行互補(bǔ)DNA鏈的合成,參加反應(yīng)的單個dNTP上與其焦磷酸基團(tuán)相連的特定的熒光基團(tuán)被從測序小孔底部入射的激光激發(fā)產(chǎn)生相應(yīng)的熒光脈沖,同時熒光信號被檢測系統(tǒng)記錄,隨后熒光基團(tuán)標(biāo)記的焦磷酸基團(tuán)被DNA聚合酶切割脫落使熒光信號淬滅,再進(jìn)入下一輪反應(yīng);若DNA模板鏈存在甲基化修飾,根據(jù)DNA聚合酶的動力學(xué)特征,當(dāng)合成反應(yīng)進(jìn)行到修飾位點(diǎn)時子鏈上的堿基加入所需時間相比于未修飾位點(diǎn)會出現(xiàn)延長;熒光檢測系統(tǒng)根據(jù)熒光脈沖的類型和出現(xiàn)兩次熒光脈沖的間隔時間判斷新加入的dNTP的種類以及記錄模板DNA上的修飾位點(diǎn)[73-74,84]。利用單分子實(shí)時測序技術(shù)在大腸桿菌基因組中獲得了單堿基分辨率的全基因組甲基化腺嘌呤圖譜[75-76]。實(shí)際上,目前所報道的有關(guān)高等真核生物6mA的研究中基本都會用到SMRT-seq。SMRT-seq的優(yōu)點(diǎn)是能對提取并處理好的基因組DNA直接進(jìn)行測序,無須PCR的擴(kuò)增步驟,能夠產(chǎn)生長讀長的讀段(reads)并且能夠檢測基因組序列高度重復(fù)區(qū)域的甲基化修飾。其缺點(diǎn)是不能很好地區(qū)分1mA和6mA,所以一般需要結(jié)合LC-MS/MS排除1mA的干擾。
超高效液相色譜—三重四極質(zhì)譜(ultra-high performance liquid chromatography-triple-stage quadrupole mass spectrometry, UHPLC-MS/MS)將高效液相色譜技術(shù)與質(zhì)譜技術(shù)相結(jié)合,可以檢測含量很低的6mA靈敏核苷酸修飾[10],具有高靈敏度和高精確度的優(yōu)點(diǎn),一般用來進(jìn)一步確定SMRT測序所得結(jié)果的可靠性。簡而言之,其原理就是超高效液相色譜(UHPLC)分離消化的DNA與質(zhì)譜檢測相結(jié)合,通過使用串聯(lián)質(zhì)譜儀(MS / MS)在檢測到特定的核苷酸修飾之后,使用在目的樣品中同時分析的標(biāo)準(zhǔn)曲線實(shí)現(xiàn)定量分析[19]。由于6mA特異性抗體檢測和單分子實(shí)時測序等技術(shù)無法區(qū)分6mA、1mA,而UHPLC-MS/MS法能夠通過色譜和分子質(zhì)量差異區(qū)分6mA、1mA從而排除1mA的干擾。因此目前6mA在真核生物的發(fā)現(xiàn)過程中大多數(shù)都使用了UHPLC-MS/MS法。值得注意的是,運(yùn)用UHPLC-MS/MS法檢測真核生物6mA時,需要排除任何來自支原體或細(xì)菌DNA的潛在污染。
實(shí)際上,所有的檢測方法都應(yīng)該注意樣本的細(xì)菌污染程度,細(xì)菌污染造成6mA的假陽性結(jié)果應(yīng)當(dāng)被排除。但是很多文獻(xiàn)都沒有提到這一點(diǎn),僅有極少數(shù)文獻(xiàn)中提到他們排除了細(xì)菌污染對于所測得的6mA數(shù)據(jù)的影響[53]。
6mA是一種在細(xì)菌中發(fā)揮重要作用的DNA修飾,它參與細(xì)菌DNA復(fù)制起始,堿基錯配修復(fù),轉(zhuǎn)錄與轉(zhuǎn)座,保護(hù)細(xì)菌基因組免于外源DNA的侵入和細(xì)菌毒素的分泌等生命活動。近年來對于真核生物的6mA修飾的研究逐漸增多,特別是哺乳動物6mA修飾已經(jīng)吸引了眾多研究人員的關(guān)注但仍然方興未艾。已報道的真核生物6mA能夠跨代傳遞并與基因表達(dá)、轉(zhuǎn)座子表達(dá)、核小體定位和組蛋白修飾等眾多生物功能相關(guān),也與癌癥和精神疾病等病理過程相關(guān);多個研究證據(jù)表明6mA可以被動態(tài)調(diào)節(jié),6mA也具有調(diào)節(jié)功能,因此闡明與6mA功能相關(guān)的上游和下游調(diào)控機(jī)制很有研究價值。
目前發(fā)現(xiàn)6mA在不同物種中的含量、分布和功能具有較大的異質(zhì)性和一定的相似性, 我們還需要在更多的真核生物中去探索6mA的含量和分布,尋找更為普遍的規(guī)律。6mA的功能是否具有保守性也尚未闡明,如果6mA的功能是保守的,那么理論上應(yīng)該存在具有保守結(jié)構(gòu)域的甲基化酶、去甲基化酶和閱讀蛋白;就目前已經(jīng)鑒定存在的6mA的甲基化酶和去甲基化酶而言,仍然需要進(jìn)一步研究它們調(diào)節(jié)6mA的催化機(jī)制;真核生物中存在6mA的甲基化酶和去甲基化酶說明6mA是可以被動態(tài)調(diào)控的,這也從側(cè)面證明了6mA在真核生物中具有重要的生物學(xué)作用。6mA的閱讀蛋白已經(jīng)在小鼠中被發(fā)現(xiàn), 6mA的閱讀蛋白是否在其他哺乳動物中也存在,以及這些蛋白的6mA識別位點(diǎn)與下游通路仍然有待研究;6mA的調(diào)節(jié)蛋白在真核生物中的鑒定和功能闡釋將使人們對6mA修飾的調(diào)控機(jī)制產(chǎn)生新的理解。現(xiàn)已報道的6mA與癌癥和精神疾病相關(guān),6mA與眾多人類疾病的關(guān)聯(lián)未來將得到更進(jìn)一步的研究。