杜曉悅,劉淑英
(內(nèi)蒙古農(nóng)業(yè)大學(xué)獸醫(yī)學(xué)院/農(nóng)業(yè)部動(dòng)物臨床診療技術(shù)重點(diǎn)實(shí)驗(yàn)室/內(nèi)蒙古自治區(qū)基礎(chǔ)獸醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,內(nèi)蒙古呼和浩特 010018)
儲(chǔ)藏著遺傳信息的DNA,需要通過轉(zhuǎn)錄和翻譯才能表達(dá),進(jìn)而行使其生物學(xué)功能。轉(zhuǎn)錄是基因表達(dá)中的重要一環(huán),轉(zhuǎn)錄因子(transcription factor,TF)通過識別特定的DNA序列以控制染色質(zhì)和轉(zhuǎn)錄,以形成指導(dǎo)基因組表達(dá)的復(fù)雜系統(tǒng)[1]。真核生物轉(zhuǎn)錄起始過程十分復(fù)雜,有一個(gè)裝配的過程,RNA聚合酶必須借助TF的裝配才能選擇性的結(jié)合到啟動(dòng)子上,共同參與轉(zhuǎn)錄起始的過程[2]。在過去相當(dāng)長的一段時(shí)間里,研究者們認(rèn)為TF的作用只發(fā)揮在轉(zhuǎn)錄起始水平上,隨著對其功能研究的深入,發(fā)現(xiàn)TF在轉(zhuǎn)錄起始的前后也可以通過與基本轉(zhuǎn)錄復(fù)合體的相互作用而發(fā)揮重要的功能[3-4],其中TF在對特定基因的染色質(zhì)結(jié)構(gòu)的組裝方面起著至關(guān)重要的作用,可使基因的染色質(zhì)結(jié)構(gòu)處于開放的有利于轉(zhuǎn)錄的狀態(tài),或者形成更加緊密的閉合結(jié)構(gòu)而不能進(jìn)行轉(zhuǎn)錄。
TF是指除RNA聚合酶外,參與轉(zhuǎn)錄及轉(zhuǎn)錄調(diào)節(jié)的一類蛋白質(zhì)。TF通過直接與特定的DNA序列和其他輔助蛋白相互作用,控制基因的“開關(guān)”,以精密調(diào)控細(xì)胞分化和組織發(fā)育等重要生物學(xué)過程[5-6],此外對于特定的途徑,如免疫反應(yīng)也有一定的調(diào)節(jié)作用[7]。TF含有轉(zhuǎn)錄激活域和DNA結(jié)合域,其中DNA結(jié)合域按照結(jié)構(gòu)特征可以分為鋅指、螺旋-轉(zhuǎn)角-螺旋、螺旋-環(huán)-螺旋和亮氨酸拉鏈。根據(jù)TF的作用特點(diǎn)可分為兩類,一類為通用轉(zhuǎn)錄因子(general transcription factor,GTF),它們與RNA聚合酶共同組成轉(zhuǎn)錄起始復(fù)合體時(shí),轉(zhuǎn)錄才能在正確的位置開始[8];另一類為特異轉(zhuǎn)錄因子(special transcription factor,STF),是在特異的組織細(xì)胞中表達(dá)或在特定條件下被激活的一類TF。
真核生物中TF對基因的表達(dá)調(diào)控至關(guān)重要。目前,NCBI的GenBank里收錄了519 607個(gè)TFs,其中真核生物TFs有497 792個(gè)。隨著對TF調(diào)控基因表達(dá)理解的不斷加深,研究者們發(fā)現(xiàn)TF異常表達(dá)導(dǎo)致的調(diào)控錯(cuò)誤可導(dǎo)致人類與動(dòng)物疾病的發(fā)生[9-10],因此TF也成為了很多疾病的治療靶標(biāo)。真核生物TF與DNA之間的相互作用對于DNA復(fù)制[11]、重組和修復(fù)[12]、轉(zhuǎn)錄[13]和病毒組裝[14]等許多生物學(xué)過程具有關(guān)鍵調(diào)控作用。目前,針對TF與DNA互作的研究已開發(fā)出多種方法,每種方法均有各自的優(yōu)點(diǎn)與不足,論文在傳統(tǒng)研究方法的基礎(chǔ)上介紹新興的研究技術(shù),為研究TF與DNA相互作用提供參考。
能與TF發(fā)生特異性結(jié)合并對基因表達(dá)起到調(diào)控作用的DNA序列稱之為轉(zhuǎn)錄因子結(jié)合位點(diǎn)(transcription factor binding site,TFBS),通常大小在5 bp~25 bp之間。同一個(gè)TF在不同的基因上的結(jié)合位點(diǎn)具有一定的保守性,但也不完全相同。研究TF與DNA互作首先要分析靶基因上潛在的TFBS,近年來,關(guān)于TF的數(shù)據(jù)庫被建立并得到廣泛應(yīng)用,表1列出了這些數(shù)據(jù)庫的名稱與網(wǎng)址,綜合應(yīng)用以下數(shù)據(jù)庫可為TF的研究提供較為系統(tǒng)和全面的信息,其中AnimalTFDB于2019年華中科技大學(xué)郭安源團(tuán)隊(duì)開發(fā)[15],是國內(nèi)首個(gè)建立的動(dòng)物TF注釋和預(yù)測數(shù)據(jù)庫,包含97個(gè)物種全基因組TF和轉(zhuǎn)錄輔助因子的分類和注釋,其中TF根據(jù)其DNA結(jié)合域(DNA-binding domain)又分為73個(gè)家族,輔助因子分為83個(gè)家族和6個(gè)類別。因?yàn)閷θ祟怲F使用的廣泛需求,在新版AnimalTFDB數(shù)據(jù)庫中單獨(dú)設(shè)計(jì)了一個(gè)人類TF數(shù)據(jù)庫網(wǎng)絡(luò)界面(HumanTFDB:http://bioinfo.life.hust.edu.cn/HumanTFDB/)。
表1 預(yù)測TFBS的數(shù)據(jù)庫及網(wǎng)站
雙熒光素酶報(bào)告基因系統(tǒng)常應(yīng)用于鑒定基因啟動(dòng)子及其調(diào)控元件[16],近年來也用于miRNA靶基因驗(yàn)證[17]等方面的研究。由于熒光酶素活性檢測靈敏,單報(bào)告基因常會(huì)因?yàn)榧?xì)胞狀態(tài)、轉(zhuǎn)染效率和實(shí)驗(yàn)人員操作等影響檢測結(jié)果,所以通過共轉(zhuǎn)染中加入內(nèi)參作為對照以實(shí)現(xiàn)試驗(yàn)的均一化和數(shù)據(jù)的可靠性及真實(shí)性。雙熒光素酶通常是指螢火蟲熒光素酶(firefly luciferase)和海腎熒光素酶(Ranillaluciferase),在試驗(yàn)中,前者常作為檢測基因,而后者作為內(nèi)參基因一同轉(zhuǎn)染至細(xì)胞中進(jìn)行檢測。
利用雙熒光素酶報(bào)告基因系統(tǒng)研究TF的應(yīng)用較為廣泛,其中檢測啟動(dòng)子活性的一般過程為:將啟動(dòng)子DNA片段連接至螢火蟲熒光素酶報(bào)告載體上,構(gòu)建螢火蟲熒光素酶報(bào)告基因質(zhì)粒,將報(bào)告質(zhì)粒和內(nèi)參一同轉(zhuǎn)染至特定細(xì)胞中,檢測相對熒光酶素活性[18]。為進(jìn)一步確定核心啟動(dòng)子片段可將啟動(dòng)子DNA片段進(jìn)行截短突變、缺失突變和定點(diǎn)突變。在研究特定TF的作用時(shí),可構(gòu)建TF過表達(dá)載體,將其與報(bào)告質(zhì)粒和內(nèi)參一同轉(zhuǎn)染至特定細(xì)胞中,通過與未過表達(dá)處理的對照組相比,檢測相對熒光酶活性的高低以判斷其對啟動(dòng)子轉(zhuǎn)錄活性的影響。
電泳遷移率變動(dòng)分析(electrophoretic mobility shift assay,EMSA)是一種研究TF和其相關(guān)的DNA結(jié)合序列相互作用的經(jīng)典方法,可用于定性和定量分析[19-20]。TF在特定狀態(tài)下入核,通過與基因組上特定序列結(jié)合以調(diào)控基因的轉(zhuǎn)錄與表達(dá),因此通常需要提取細(xì)胞核蛋白進(jìn)行試驗(yàn)。DNA探針的標(biāo)記分為放射性標(biāo)記和非放射性標(biāo)記,放射性探針一般用32P標(biāo)記,由于32P的壽命短、具有放射性和制作耗時(shí)較長等缺點(diǎn),該方法逐漸被替代,而非放射性標(biāo)記(地高辛、生物素或紅外熒光標(biāo)記)具有高效、省時(shí)和費(fèi)用低等優(yōu)點(diǎn),現(xiàn)在被廣泛使用。
該方法的基本原理和過程如下:將細(xì)胞核蛋白和標(biāo)記的DNA探針于室溫進(jìn)行孵育,利用非變性聚丙烯凝膠電泳檢測標(biāo)記DNA-蛋白質(zhì)復(fù)合物的位置。當(dāng)細(xì)胞核蛋白與標(biāo)記的DNA探針結(jié)合后可形成DNA-蛋白質(zhì)復(fù)合物而導(dǎo)致遷移速率變慢,從而分離出DNA-蛋白質(zhì)復(fù)合物和游離的探針。當(dāng)試驗(yàn)中加入未經(jīng)標(biāo)記的DNA探針時(shí),可形成競爭反應(yīng),使DNA-蛋白質(zhì)復(fù)合物的標(biāo)記減少。同一家族的TF存在多種亞型,檢測與DNA探針相結(jié)合的TF亞型需要進(jìn)行超級凝膠阻滯試驗(yàn)(super shift EMSA)[21],即在細(xì)胞核蛋白與標(biāo)記的DNA探針孵育后,再加入特定的TF抗體,若能形成更大的DNA-復(fù)合物條帶,即可確定TF亞型。
EMSA可在體外快速且靈敏的檢測TF和特定DNA序列的結(jié)合,但是它不能反映在活細(xì)胞內(nèi)和生理狀態(tài)下的TF與DNA結(jié)合的情況,因此還需要結(jié)合體內(nèi)試驗(yàn)進(jìn)行進(jìn)一步的驗(yàn)證。
目前,染色質(zhì)免疫共沉淀(chromatin immunoprecipitation,CHIP)是在體內(nèi)研究DNA與蛋白質(zhì)相互作用的標(biāo)準(zhǔn)方法,CHIP結(jié)合高通量測序技術(shù)稱為ChIP-seq,該方法可在全基因組范圍內(nèi)分析DNA結(jié)合蛋白和組蛋白修飾[22],是研究基因組表觀遺傳學(xué)的強(qiáng)大工具。
該方法的基本原理和過程如下:首先通過甲醛交聯(lián)處理細(xì)胞,固定活細(xì)胞內(nèi)與DNA結(jié)合的蛋白,細(xì)胞破碎處理,超聲打斷基因組DNA,其中斷裂的DNA主峰大小以200 bp~500 bp為宜;隨后加入TF特異性抗體與DNA-蛋白質(zhì)復(fù)合物孵育,利用可以結(jié)合抗體的ProteinA磁珠將抗體-蛋白-DNA復(fù)合物抓取下來,之后將DNA與蛋白解離;將DNA片段補(bǔ)平,加A,加接頭,最后進(jìn)行高通量測序,將這些DNA片段與參考基因組進(jìn)行比對分析,從而獲得與TF發(fā)生特異性結(jié)合的DNA信息及其定位。
ChIP-Seq對抗體的特異性要求較高,需要CHIP或IP級抗體,而市面上大部分的這類抗體通常來源于人和小鼠,這限制了對非模式物種的研究,且試驗(yàn)過程中的甲醛交聯(lián)、染色質(zhì)片段化、免疫共沉淀以及文庫構(gòu)建等步驟繁瑣且條件較難控制[23-24],試驗(yàn)中需要大量細(xì)胞,重復(fù)性較差,試驗(yàn)背景較高,在消耗大量細(xì)胞和抗體后得到較難分析的數(shù)據(jù),這在一定程度上又限制了ChIP-Seq在轉(zhuǎn)錄因子與DNA互作研究中的進(jìn)一步應(yīng)用。
DNA親和純化測序(DNA affinity purification sequencing,DAP-seq)技術(shù)最早發(fā)表于2016年的《Cell》期刊上[25],作者O'Malley以擬南芥作為試驗(yàn)對象,對529個(gè)TFs進(jìn)行DAP-seq測序,以研究這些TFs的結(jié)合位點(diǎn)及分布規(guī)律,試驗(yàn)最終獲得了270萬個(gè)基因組內(nèi)的TFBS,覆蓋了11 Mb(9.3%)的基因組。為驗(yàn)證DAP-seq方法的可靠性,通過對擬南芥的3個(gè)TFs進(jìn)行ChIP-seq分析,對兩種方法獲得的數(shù)據(jù)相比較,表明試驗(yàn)生物學(xué)重復(fù)的相關(guān)性高(pearson系數(shù)>0.7),結(jié)果穩(wěn)定,表明該技術(shù)可用于TF與其結(jié)合位點(diǎn)的研究。
該方法的基本原理和過程如下:首先設(shè)計(jì)合成TF基因,構(gòu)建含Halo tag與TF基因的載體并表達(dá)TF融合蛋白;然后在表達(dá)的TF中加入適量基因組DNA進(jìn)行孵育,利用磁珠富集與TF蛋白結(jié)合的DNA片段;最后通過高通量測序技術(shù),對富集的DNA產(chǎn)物進(jìn)行測序分析,從而定位與TF特異性結(jié)合的DNA區(qū)域。
DAP-seq以低成本和高通量實(shí)現(xiàn)了適用于任何物種的TFBS捕獲[26],雖然該方法是一種體外研究TF與DNA互作的方法,但是它可以保留基因的甲基化信息,從而最大程度的還原體內(nèi)真實(shí)環(huán)境,結(jié)合位點(diǎn)鑒定效果準(zhǔn)確,且不依賴于TF抗體,這對于過去無法制備TF抗體的物種、非熱門的TFs研究都適用,該方法擴(kuò)大了TF研究的范圍,可以進(jìn)行大規(guī)模基因家族的結(jié)合位點(diǎn)鑒定[27]。
2019年Henikoff等在《Nature Communication》期刊上發(fā)表了染色質(zhì)靶向切割與標(biāo)簽化(cleavage under targets and tagmentation,CUT&Tag)技術(shù)的原理,對比使用了ChIP-seq、CUT&RUN、CUT&Tag 3種方法來研究人K562細(xì)胞組蛋白修飾與RNA聚合酶Ⅱ,對比試驗(yàn)結(jié)果表明,CUT&Tag有最低的低背景噪聲,最強(qiáng)的信號,可用于研究TF調(diào)控網(wǎng)絡(luò)[28]。通過對H3K4me1修飾物進(jìn)行分析,得到的試驗(yàn)數(shù)據(jù)證實(shí)CUT&Tag的靈敏度最高,試驗(yàn)可重復(fù)性最好。CUT&Tag有望將蛋白與染色質(zhì)DNA互相作用的研究變成了一種類似PCR反應(yīng)的常規(guī)操作,對基因調(diào)控、表觀遺傳等領(lǐng)域的研究具有革命性的意義。
該方法的基本原理和過程如下:活細(xì)胞與ConA Beads孵育,對細(xì)胞進(jìn)行滲透性處理,加入TF特異性抗體和相應(yīng)二抗孵育并結(jié)合proteinA/G-Tnp轉(zhuǎn)座子,當(dāng)其被激活后,可僅在特定組蛋白修飾和TF結(jié)合染色質(zhì)的局部進(jìn)行目的DNA片段化,同時(shí)添加測序接頭,并將其釋放到細(xì)胞外。由于絕大部分無關(guān)的染色質(zhì)還留在細(xì)胞核內(nèi),因此整個(gè)試驗(yàn)的信噪比大幅提高,同時(shí)簡化了試驗(yàn)步驟。在片段化基因組的同時(shí)加上接頭,不需要繁瑣的補(bǔ)平加A加接頭,在1 d內(nèi)可以完成從細(xì)胞到測序文庫制備全流程。
CUT&Tag在低細(xì)胞數(shù)和單細(xì)胞水平上證實(shí)了對組蛋白修飾和TF分析試驗(yàn)的適用性,是一種革命性的新技術(shù),相較于傳統(tǒng)的ChIP-seq,它具有以下優(yōu)點(diǎn):省時(shí)高效,所需的細(xì)胞量少,背景信號低,可重復(fù)性好等優(yōu)點(diǎn),可用于單細(xì)胞水平測序[29-30]。但CUT&Tag與ChIP-Seq都依賴于使用特異性抗體以高效結(jié)合目的蛋白,因此獲得高品質(zhì)的抗體是試驗(yàn)成功的先決條件。
上述TF與DNA互作的研究方法各有特點(diǎn)和不同,其對比見表2。TFBS預(yù)測是運(yùn)用數(shù)據(jù)庫初步分析與靶基因結(jié)合的TF并給出可結(jié)合序列的預(yù)測分值。雙熒光素酶報(bào)告基因系統(tǒng)、EMSA和DAP-seq是體外研究TF與DNA相互作用的方法,而CHIP-seq和CUT&Tag是體內(nèi)的研究方法,可以在全基因組范圍內(nèi)分析TFBS、組蛋白修飾、核小體定位和DNA甲基化,同時(shí)也是研究DNA與蛋白質(zhì)相互作用的金標(biāo)準(zhǔn)。此外,DAP-seq與CHIP-seq和CUT&Tag一樣,能夠保留體內(nèi)的甲基化信息,對于特異性CHIP級抗體難尋和研究非模式物種的情況下,可以考慮該方法進(jìn)行試驗(yàn)。
表2 轉(zhuǎn)錄因子與DNA互作方法比較
在真核生物中,TF與DNA的相互作用受到多種因素的影響,如自身基因組DNA序列、DNA修飾、染色質(zhì)構(gòu)象和DNA相關(guān)蛋白之間動(dòng)態(tài)的相互作用等,因而研究TF與DNA的相互作用也存在一定的困難。TF對于維持生命的正?;顒?dòng)具有重要的作用,大量研究表明TF與疾病的發(fā)生發(fā)展密切相關(guān)[31-32],TF也成為某些疾病的治療靶標(biāo)[33-34]。論文詳細(xì)介紹了目前較常用和新興的幾種研究TF與DNA互作的研究方法,獲得的結(jié)果極大地豐富了TF調(diào)控網(wǎng)絡(luò)與機(jī)制的研究內(nèi)容。在上述方法中,只有ChIP-seq和CUT&Tag能夠反映活細(xì)胞內(nèi)的真實(shí)狀況,但是上述兩種方法都依賴于特異性的CHIP或IP級抗體,這在一定程度上限制了TF與DNA互作的研究,相信隨著科學(xué)技術(shù)的不斷進(jìn)步,未來新技術(shù)或許能夠去攻克這一難關(guān)。