張躍博,王立剛,侯欣華,劉 欣,顏 華,張龍超*,王立賢*
(1.中國農業(yè)科學院北京畜牧獸醫(yī)研究所,北京 100193; 2.湖南農業(yè)大學動物科學技術學院,長沙 410128)
RNA編輯廣泛發(fā)生于細菌、真菌、病毒、動植物等,具有改變氨基酸序列、影響可變剪接、導致內含子滯留、影響RNA穩(wěn)定性等功能[1],為解釋諸多復雜生命過程提供了一個新的研究方向。在哺乳動物中,A-to-I型RNA編輯最為普遍,所占比例可達90%以上[2-3]。研究顯示,大部分A-to-I編輯事件位于重復元件,僅有少數發(fā)生于編碼區(qū)[4-6],預示A-to-I編輯的功能可能以調控基因表達為主。已報道A-to-I編輯在癌癥、自身免疫性疾病、多種神經性疾病中發(fā)揮重要作用[7-10]。目前,決定RNA中腺苷發(fā)生脫氨反應的機制尚不清楚,但已知雙鏈RNA結構(double-stranded RNA,dsRNA)和作用于RNA的腺苷脫氨酶(adenosine deaminases acting on RNA,ADARs)是A-to-I編輯發(fā)生的必要條件。次黃苷(inosine,I)在翻譯過程中會被識別為鳥苷(guanosine,G),因此A-to-I編輯也稱A-to-G編輯。
ADAR2是ADAR酶家族的一員,主要存在于細胞核,具有催化A-to-I編輯的活性,但對特異性編輯位點的親和力高于隨機性編輯位點[11],其編輯作用具有選擇性。敲除ADAR2的小鼠產后出現癲癇,并會于20~25日齡時死亡,但若同時將GluR2 Q/R位點上A替換為G,小鼠的壽命表現正常[12-14],表明ADAR2介導的A-to-I編輯具有影響機體生命活動的潛力。高通量測序分析發(fā)現,ADAR2 在人體動脈中高表達,同時有研究表明,編碼區(qū)的RNA編輯水平在人體動脈中最高[15],預示著ADAR2可能與血管疾病密切相關。此外,ADAR2 過表達的小鼠會因食欲亢進而引發(fā)肥胖[16]。豬的解剖特征、生理生化特點等與人類極為相似,可作為研究人類疾病的動物模型,其相關研究勢必促進人們對自身疾病致病機理的認識。盡管如此,對豬ADAR2的研究仍然比較缺乏,其序列特征、表達模式尚未有相關報道。
本研究利用RACE技術克隆豬ADAR2 cDNA全長序列,并對序列特征進行分析,同時應用實時熒光定量PCR(real-time quantitative PCR,qPCR)技術檢測大白豬不同組織中ADAR2的表達模式,為進一步研究豬ADAR2的功能及其調控A-to-I編輯的機制奠定基礎。
本研究使用的4頭大白仔豬來自中國農業(yè)科學院北京畜牧獸醫(yī)研究所昌平試驗基地豬場。35日齡屠宰,采集心、肝、脾、肺、腎、腦、肌肉、小腸和背部脂肪組織,并經液氮速凍后于-80 ℃冰箱保存?zhèn)溆谩?/p>
使用RNA提取試劑盒(天根,北京)提取大白豬9種組織的總RNA,并利用超微量分光光度計(NanoDrop2000)和1%瓊脂糖凝膠電泳對RNA純度、濃度和完整性進行檢測。取1 μg質量合格的RNA,參照PrimeScriptTMRT反轉錄試劑盒(TaKaRa,日本)說明書合成cDNA,用于克隆全長cDNA序列的中間片段和檢測ADAR2在各組織中的表達情況。使用大白豬脾臟組織RNA,根據SMARTer RACE 5′/3′試劑盒(Clontech,日本)說明書分別合成5′- 和3′-RACE的cDNA模板,用于克隆5′和3′末端序列。
以GenBank中的豬ADAR2 mRNA預測序列(登錄號:XM_021071524.1)為模板,利用NCBI中的Primer-BLAST工具設計用于克隆1 164 bp中間片段的引物(表1)。PCR反應體系為25 μL,包括12.5 μL 2× Taq PCR Master Mix,1 μL cDNA模板,上、下游引物(10 μmol·L-1)各1 μL,以及9.5 μL ddH2O。PCR反應條件:94 ℃ 3 min;94 ℃ 30 s,55 ℃ 30 s,72 ℃ 60 s,35個循環(huán);72 ℃ 10 min。 利用1.5%瓊脂糖凝膠電泳對反應產物進行檢測,然后送北京諾賽基因組研究中心有限公司測序。以克隆獲得的中間序列為模板,應用Primer-BLAST工具設計5′- 和3′-RACE所需的特異性引物(表1)。參照SMARTer RACE試劑盒說明,分別以合成的5′- 和3′-RACE的cDNA為模板,采用巢式PCR擴增5′和3′末端序列。將獲得的PCR產物切膠回收,克隆到linearized pRACE載體,挑選陽性克隆送北京諾賽基因組研究中心有限公司測序。
利用DNAMAN軟件拼接組裝獲得cDNA序列,并分析物種間ADAR2 的CDS區(qū)核苷酸序列和氨基酸序列的一致性。使用ProtParam(https://web.expasy.org/protparam/)軟件分析豬ADAR2蛋白質的理化性質。利用ProtScale (https://web.expasy.org/protscale/)分析蛋白親-疏水性。分別使用PSIPRED(http://bioinf.cs.ucl.ac.uk/psipred/)和SWISS-MODEL(https://www.swissmodel.expasy.org/)預測豬ADAR2蛋白質二級結構和三級結構。ADAR2系統進化樹使用MEGA-X繪制。采用NCBI中的Batch CD-Search(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi) 預測ADAR2蛋白的結構域。
以大白豬心、肝、肺、腎、脾、腦、小腸、背最長肌和背部脂肪的cDNA為模板,GAPDH作內參基因,采用qPCR方法檢測ADAR2的組織表達情況。反應體系:2× SYBRRPremix ExTaqII 10 μL,cDNA 2 μL,10 μmol·L-1上、下游引物各0.4 μL,50× ROX Reference Dye II 0.4 μL和ddH2O 6.8 μL。 反應條件:95 ℃ 30 s;95 ℃ 5 s,60 ℃ 34 s,40個循環(huán);反應結束后分析熔解曲線。所需引物均利用Primer-BLAST設計(表1)。以脂肪組織為對照,用2-△△Ct法計算ADAR2在各組織中的表達量,并利用SAS 9.2的GLM過程進行單因素方差分析。
表1 豬ADAR2基因cDNA克隆及qPCR引物
在PIGPAN(http://animal.nwsuaf.edu.cn/code/index.php/panPig)的GBrowse中檢索獲得ADAR2在梅山、金華、八眉、榮昌、皮特蘭、長白、大白、漢普夏、巴克夏和藏豬不同組織中RNA-seq的表達數據,利用TBtools[17]繪制熱圖。每個品種1個 個體,7~9種組織,包括背最長肌、腰大肌、皮下脂肪、心、肝、脾、肺、腎和卵巢。
克隆獲得的cDNA序列片段經DNAMAN拼接后,得到豬ADAR2 cDNA全長序列,其長度為6 305 bp, 其中5′ UTR、3′ UTR和CDS分別為548、3 616和2 115 bp,還有一個ploy(A)尾巴;編碼704個氨基酸,起始密碼子為ATG,終止密碼子為TGA。序列已提交到GenBank,登錄號為MW273927。利用Ensembl中的BLAST/BLAT在線工具對克隆獲得的cDNA全長序列進行分析發(fā)現,豬ADAR2基因共包含12個外顯子(圖1),各外顯子長度在75~3 796 bp之間,僅有1個內含子的剪接位點序列不符合GT-AG法則,為GC-AG(表2)。
圖1 豬ADAR2基因結構Fig.1 Gene structure of porcine ADAR2 gene
表2 豬ADAR2基因的剪接位點
核甘酸序列一致性分析表明,豬與偶蹄目家畜山羊(89.9%)、綿羊(89.7%)和牛(88.8%)的一致性最高,其次是人等靈長目動物(約84%),與斑馬魚(69.0%)的一致性最低(表3)。豬ADAR2基因預測的氨基酸序列與其他物種相應序列的一致性分析發(fā)現,豬與綿羊的一致性最高,高達93.3%;其次是牛,為92.0%;與斑馬魚的一致性最低,僅為69.0%(表3)。
預測的豬ADAR2蛋白共包含10 747個原子,分子量是76.35 ku,理論等電點9.03,不穩(wěn)定系數高達48.58。蛋白質疏水性分析顯示,豬ADAR2蛋白在第358位氨基酸得分最高(2.0),表明此位點疏水性最強;在第476位氨基酸得分最低(-3.0),表明此位點的親水性最高。該蛋白的疏水性平均得分為-0.34,因此推測其屬于親水性蛋白(圖2A)。二級結構預測顯示,ADAR2共含有α-螺旋(28.0%)、β-折疊(13.9%)和無規(guī)則卷曲(58.1%)3種 二級結構(圖2B)。利用SWISS-MODEL在線軟件獲得的豬ADAR2三級結構構象由第307~703位氨基酸構成(圖2C)。
基于ADAR2的氨基酸序列,應用MEGA-X軟件構建系統進化樹,以便系統性認識該蛋白在種間的差異。如圖3所示,在進化上豬ADAR2與偶蹄目家畜牛、綿羊和山羊的關系最近,與氨基酸的序列一致性分析結果基本吻合。保守結構域預測發(fā)現,所有物種的ADAR2都含有2個dsRNA結合基序和1個脫氨酶結構域。豬ADAR2的dsRNA結合基序分別位于第82~146和第239~300位氨基酸,脫氨酶結構域位于第325~701位氨基酸。
表3 豬ADAR2基因CDS區(qū)核酸序列和氨基酸序列與其他物種間的一致性
應用qPCR檢測大白豬9種組織中ADAR2的mRNA表達量,結果顯示,ADAR2在被檢測的所有組織中均表達;在肺中表達量最高,且顯著高于其他組織;在心、肌肉和小腸中的表達量都比較低(圖4A)。利用RNA-seq數據繪制的ADAR2在不同豬種的組織表達譜表明,豬ADAR2具有高度的表達保守性,其在不同品種間的表達規(guī)律基本一致,均在肺中高表達(圖4B)。
隨著高通量測序成本的不斷下降以及相關分析軟件的快速開發(fā),已知的RNA編輯位點數目大幅增加,現已鑒定出450多萬個人類的A-to-G編輯位點[18]。ADAR酶催化A-to-G編輯發(fā)生,該酶家族主要包括ADAR1、ADAR2和ADAR3。目前,僅發(fā)現ADAR1和ADAR2具有脫氨酶催化活性,但有報道稱,ADAR3可以通過競爭性結合dsRNA從而抑制ADAR1和ADAR2的催化功能[19]。經查詢發(fā)現,NCBI數據庫中僅有豬ADAR2的不完整預測序列,在一定程度上阻礙了其功能的進一步解析。
通過RACE技術,本研究克隆獲得了豬ADAR2 基因的全長cDNA,其長度為6 305 bp,可編碼704個氨基酸,與人(701個)、鼠(701個)、雞(701個)和斑馬魚(707個)的ADAR2氨基酸序列長度比較一致[20]。本研究克隆獲得的序列比NCBI中預測的mRNA序列(XM_021071524.1,5 803 bp) 在長度上增加了502 bp,但編碼的氨基酸卻減少了9個。BLAT分析顯示,豬ADAR2基因含有12個外顯子,多于NCBI中的預測結果(9個), 并且僅有1對剪接供體和受體不符合GT-AG法則。據統計,哺乳動物中GT-AG剪切位點對占99.24%,GC-AG占0.7%,AT-AC占0.05%[21],說明非GT-AG 的剪切位點雖少但也是存在的。對于ADAR2 CDS區(qū)核苷酸序列而言,豬與同為偶蹄目家畜的牛、羊間的一致性最高(>88%),與人和鼠間的一致性也超過80%。ADAR2具有一個核定位信號,其主要位于細胞核中[22-23],與其催化脫氨功能相符,但在未成熟的神經元中卻位于細胞質[24]。本研究未在豬ADAR2中預測到任何有利于其穿透細胞膜的跨膜結構和信號肽,但發(fā)現與信號肽跨膜功能有關的α-螺旋含量較高[25]。疏水性分析發(fā)現,該蛋白親水性較強,可能有利于其通過親水性核質交換通道——核孔,由細胞質轉運到細胞核,從而對新生成的RNA進行編輯。多個物種間保守結構域的預測顯示,ADAR2蛋白在結構上高度保守,均具有2個 dsRNA結合基序和1個脫氨酶活性結構域,其中豬與哺乳動物人、黑猩猩、獼猴、長臂猿、牛、羊和小鼠的序列間具有高度一致性(>84%),表明ADAR2 在哺乳動物中高度保守,推測豬ADAR2也具有RNA編輯的功能。ADAR2蛋白的系統進化樹分析發(fā)現,豬能夠與其他物種聚到一起,為ADAR2的物種間保守性提供支持。
A. 親疏水性分析;B. 二級結構預測;C. 三級結構預測 A. Hydrophilic-hydrophobic property prediction; B. Secondary structure prediction; C. Tertiary structure prediction圖2 豬ADAR2蛋白疏水性與結構分析Fig.2 Hydrophobicity and structure analysis of the porcine ADAR2 protein
自展值和分支長度分別列于節(jié)點右側和分支上側 The bootstrap values and branch lengths are showed on the right of each node and above each branch, respectively圖3 ADAR2系統進化樹Fig.3 Phylogenetic tree of ADAR2
A. ADAR2在大白豬9種組織中的表達分析:字母不同表示差異顯著(P<0.05),字母相同表示差異不顯著(P>0.05);B. ADAR2在不同豬種不同組織的RNA-seq表達差異 A. Expression analysis of ADAR2 in 9 tissues of Large White pigs: the different letters indicate statistically significant difference (P<0.05), the same letter indicates no statistically significant difference (P>0.05); B. The RNA-seq expression difference of ADAR2 in different tissues of different pig breeds圖4 豬ADAR2的組織表達分析Fig.4 Tissue expression analysis of porcine ADAR2
ADAR2基因表達于生物體的多種組織,已報道其在大腦中的表達量較高[26]。本研究同樣發(fā)現,ADAR2 mRNA在檢測的9種大白豬組織中均表達,但不同的是其在肺組織中的表達量最高,在雞中也發(fā)現了同樣的現象[27],并且該表達模式在豬種間高度保守。ADARs介導的RNA編輯可以將內源性雙鏈RNA標記成“自我”的分子,當外源微生物入侵時,免疫系統能夠準確地識別“自我”和“非我”,對入侵病原體的外源RNA啟動免疫[28-30]。肺是機體氣體交換的重要場所,易受病原微生物感染。同時,前期的研究發(fā)現,ADAR1在肺中也高表達[31]。因此,ADAR2在肺中高表達可能是肺部抗感染的需要。
ADAR2既能與自身形成同源二聚體,又可與另一具有催化活性的酶ADAR1形成異質二聚體,其二聚體化可能是催化活性所必需的[32]。對ADARs 底物偏好性研究發(fā)現,不同蛋白的RNA底物具有明顯差異[33],其中ADAR2主要負責非重復編碼區(qū)位點的編輯[15]。ADAR2催化的A-to-G編輯通常具有位點特異性,如GluR2 Q/R位點上的A-to-G編輯[34-35],且可以通過自編輯對自身活性進行負調控[36]。ADAR2基因敲除小鼠的生存時間長于ADAR1敲除小鼠,通常在出生數周內死于癲癇[13]。但如果同時將GluR2 Q/R位點上的A變換為G,敲除鼠可繼續(xù)存活[13],表明該位點的編輯對于個體的生存是必須的。Terajima等[37]報道,在敲除ADAR2的小鼠中,由于RNA編輯的缺失導致生成的內源性miRNA let-7 g減少,從而間接引起靶基因Cry2表達量的上調,表型上出現運動節(jié)律縮短,說明ADAR2可以通過調節(jié)miRNA的表達影響正常的生理活動。隨后的研究發(fā)現,ADAR2在光照引起的生物鐘相移中發(fā)揮重要作用[38]。在正常人的腦膠質細胞中ADAR2極弱表達,但在高惡性膠質瘤中則明顯表達[39]。同時,也有研究報道,ADAR2在惡性膠質瘤中的表達量并無明顯變化,但酶活性出現下降[40],可能是由于ADAR1與ADAR3表達量提高,與ADAR2競爭性結合編輯底物造成的[41]。ADAR2的失調在癌癥的發(fā)生發(fā)展中具有重要意義,已發(fā)現多個ADAR2介導的RNA編輯的缺失與癌癥的發(fā)展密切相關。因此,還需深入挖掘ADAR2的功能,進一步解析其對人類疾病和畜禽經濟性狀的作用。
本研究成功克隆了豬ADAR2基因的全長cDNA 序列,其長度為6 305 bp,包含548 bp的5′ UTR,2 115 bp的 CDS,3 616 bp的3′ UTR和一個poly(A)尾巴,共編碼704個氨基酸。ADAR2在豬體內廣泛表達,且在肺中高表達。本研究結果對進一步探索ADAR2的功能具有重要的理論意義和學術價值。