裴徐梨,荊贊革,唐 征,羅天寬
(1.昆明學(xué)院 農(nóng)學(xué)與生命科學(xué)學(xué)院,昆明 650214;2.溫州科技職業(yè)學(xué)院 農(nóng)業(yè)與生物技術(shù)學(xué)院,浙江溫州 325006)
長鏈非編碼RNA(Long non-coding RNA,LncRNA)是一類長度大于200 nt且沒有長開放閱讀框的RNA[1]。LncRNAs在真核生物中普遍存在,其含有較少的內(nèi)含子及較低的表達(dá)水平。LncRNAs根據(jù)其與相鄰基因的相對位置可分為基因間LncRNAs、基因內(nèi)LncRNAs及與編碼序列反義LncRNAs。研究發(fā)現(xiàn)LncRNAs能在轉(zhuǎn)錄水平、轉(zhuǎn)錄后水平和表觀遺傳等層面調(diào)控生命進程[2-4]。目前,植物L(fēng)ncRNAs的研究相對較少,研究材料多集中在擬南芥、玉米、水稻、番茄等模式植物中。Enod40是第一個在植物中發(fā)現(xiàn)的LncRNA,其在蒺藜苜蓿體內(nèi)發(fā)揮著重要生物功能[5]。前人通過ESTs、RNA-Seq等技術(shù)在擬南芥中鑒定得到13 000多條LncRNAs[6],研究發(fā)現(xiàn)這些LncRNAs參與了擬南芥的開花、逆境脅迫等多種生命進程。過表達(dá)LncRNA T5120可促進擬南芥對硝酸鹽的同化,提高其生物量和根系的發(fā)育[7]。TaS1和TaS2的大量表達(dá)可以提高小麥對白粉病的抗性[8]。此外,過表達(dá)lncRNA LAIR可提高水稻產(chǎn)量及其鄰近基因簇的表達(dá)[9]。在玉米中鑒定到3 488條LncRNAs,其中1 535條可響應(yīng)干旱脅迫[10]。
高溫和高鹽對于青花菜的生長極為不利。青花菜花球的最佳形成溫度為22 ℃,溫度過高使花球形成受阻從而降低產(chǎn)量[11]。高鹽脅迫使青花菜根系活力受到抑制,根系吸收能力下降,葉片光合作用受到嚴(yán)重影響[12]。因此,探討青花菜在高溫和鹽脅迫下的響應(yīng)機制對于青花菜生產(chǎn)具有重要的現(xiàn)實意義。
LncRNAs是轉(zhuǎn)錄組的重要組成部分,在植物器官發(fā)育[13]、生物[14]和非生物脅迫[15]等過程中起著重要的調(diào)控作用。本研究成功構(gòu)建青花菜高溫和鹽脅迫的LncRNAs文庫,并進行差異 LncRNAs的鑒定、靶基因注釋以及表達(dá)特征等分析,研究結(jié)果為進一步分析LncRNAs在青花菜高溫和鹽脅迫下的調(diào)控機制提供一定的基礎(chǔ)。
以青花菜(Brassicaoleraceavar.italica)高代自交系‘WN12-95B’為試驗材料,種植于光照培養(yǎng)箱內(nèi)(白天:16 h光照,25 ℃;夜晚:8 h黑暗處理,18 ℃;相對濕度:85%),5葉期時進行高溫(38 ℃)和鹽(200 nm/L NaCl)脅迫處理,處理時間為3 h和12 h,以0 h為對照。脅迫處理設(shè)3次生物學(xué)重復(fù)。處理結(jié)束后,取第3片葉用于高通量測序和qRT-PCR分析。
提取葉片總RNA,經(jīng)檢測合格后,進行文庫構(gòu)建,于北京組學(xué)生物科技有限公司進行高通量測序。
測序所得的原始數(shù)據(jù)(raw data)經(jīng)處理后,對產(chǎn)出數(shù)據(jù)進行分析和統(tǒng)計。利用TopHat2 軟件[16]將clean reads與甘藍(lán)基因組進行序列比對,獲取序列特征信息。
使用Cufflinks和Scripture軟件對轉(zhuǎn)錄本進行拼接[17]。根據(jù)LncRNAs的結(jié)構(gòu)以及非編碼功能特點,篩選候選lincRNA、intronic LncRNA、anti-sense LncRNA類型的轉(zhuǎn)錄本。具體篩選步驟參照Zhang等[18]的進行。
采用FPKM法計算LncRNAs的表達(dá)水平。差異表達(dá)LncRNAs的檢測標(biāo)準(zhǔn)為:|Fold Change|≥ 2且FDR<0.01。對篩選出的差異表達(dá)LncRNAs使用Cluster 3.0軟件進行層次聚類分析[19]。
采用LncTar軟件對鑒定得到的LncRNAs進行cis靶基因預(yù)測[20]。trans作用靶基因根據(jù)Pearson相關(guān)系數(shù)法進行預(yù)測。
對cis、trans作用模式下的差異表達(dá)LncRNAs靶基因進行GO和KEGG注釋,并進行富集分析。
從表達(dá)量變化較大的LncRNAs中隨機挑選10個LncRNAs進行qRT-PCR驗證(表1),以actin為內(nèi)參(F:GACAACTTACAACTCCATCAT;R:CTCATACGGTCAGCGATA)。反應(yīng)過程依據(jù)SYBR Premix Ex Taq試劑盒(TaKaRa公司)說明書在ABI 7500(Applied Biosystems公司)上進行。反應(yīng)總體系及反應(yīng)程序參照Xu等[21]進行。每個反應(yīng)設(shè)3次技術(shù)重復(fù)。定量數(shù)據(jù)處理采用2-ΔΔCT法[22]。
表1 LncRNAs的qRT-PCR特異性引物Table 1 LncRNAs-specific primers for qRT-PCR
在高溫和鹽脅迫文庫中分別獲得38 738 918(CK)、35 895 588(HEAT-3H)、38 622 915(HEAT-12H)、35 772 779 (SALT-3H)和35 764 013(SALT-12H)條clean pair-end reads。文庫的平均GC含量為42.53%,Q30比例均大于91%(表2)。將clean reads比對到甘藍(lán)基因組,結(jié)果分別得到47 111 785(CK)、45 815 806(HEAT-3H)、52 658 043(HEAT-12H)、49 140 771(SALT-3H)和49 700 942(SALT-12H)條單一比對序列,文庫平均比對率約為75%。
表2 青花菜轉(zhuǎn)錄組測序結(jié)果及數(shù)據(jù)質(zhì)量匯總Table 2 Summary of transcriptome sequencing result and data quality in broccoli
5個文庫中共鑒定得到2 432條LncRNAs,其中31條為intronic RNA,79條為anti-sense RNA,2 322條為lincRNA。結(jié)構(gòu)分析顯示LncRNAs的長度較mRNA短,主要集中于200~ 2 600之間;外顯子個數(shù)多為2~13個不等,也比mRNA少。
通過比較不同處理間的LncRNAs表達(dá)量,鑒定出差異LncRNAs分別為41(CK vs HEAT-3H)、43(CK vs HEAT-12H)、12(HEAT-3H vs HEAT-12H)和17(CK vs SALT-3H)、24(CK vs SALT-12H)和21(SALT-3H vs SALT-12H)條。其中96條LncRNAs上調(diào)表達(dá),62條LncRNAs下調(diào)表達(dá)。
對差異LncRNAs進行聚類分析發(fā)現(xiàn),高溫脅迫下上調(diào)表達(dá)的LncRNAs數(shù)量較鹽脅迫多,且變化幅度更大,兩種脅迫處理后的差異LncRNAs表達(dá)模式差異較大(圖1)。XLOC_002584在高溫脅迫12 h的表達(dá)量為CK的18倍,但在鹽脅迫中的表達(dá)量差異較?。籜LOC_003847在高溫脅迫過程中表達(dá)量變化趨勢平緩,但在鹽脅迫12 h表達(dá)量達(dá)到峰值,為CK的2倍;XLOC_005515在高溫和鹽脅迫處理后,表達(dá)量急劇 下降。
圖1 青花菜差異表達(dá)LncRNAs的層次聚類分析Fig.1 Hierarchical clustering analysis of differentially expressed LncRNAs in broccoli
為了探討LncRNAs的調(diào)控網(wǎng)絡(luò),對篩選得到的LncRNAs進行靶基因預(yù)測。分別獲得 8 891條cis作用靶基因和177 364條trans作用靶基因。部分靶基因羅列在表3。
表3 部分青花菜LncRNAs靶基因的代謝通路分析Table 3 Pathway analysis of partial target genes of LncRNAs in broccoli
對差異表達(dá)LncRNAs的cis作用靶基因進行分析,發(fā)現(xiàn)高溫處理組中CK vs HEAT-3H與HEAT-3H vs HEAT-12H在3個類別中的富集數(shù)目相差不大,而在CK vs HEAT-12H中沒有富集到生物過程條目;鹽脅迫處理組中較多靶基因映射到分子功能條目。KEGG富集分析發(fā)現(xiàn)“核糖體相關(guān)”是高溫處理中差異LncRNAs參與最多的pathway,而鹽脅迫中“氧化磷酸化”和“植物激素信號轉(zhuǎn)導(dǎo)”分別是CK vs SALT-3H和SALT-3H vs SALT-12H富集最多的途徑。
對差異表達(dá)LncRNAs的trans作用靶基因進行分析,發(fā)現(xiàn)在GO分析的 3大域中生物過程是富集最多的條目,包括“DNA甲基化(DNA methylation)”“水楊酸脅迫反應(yīng)(response to salicylic acid)”“胚胎發(fā)育(embryo development)”“H3-K9組蛋白甲基化(histone H3-K9 methylation)”等。KEGG結(jié)果顯示富集量較多的靶基因參與了谷胱甘肽代謝、氨基酸合成、淀粉及糖代謝、半乳糖代謝以及脂肪酸延伸和代謝。
使用qRT-PCR技術(shù)檢測了10個差異LncRNAs在高溫和鹽脅迫下的表達(dá)模式,結(jié)果發(fā)現(xiàn)其表達(dá)模式與測序結(jié)果基本一致。XLOC_033957和XLOC_034964在鹽脅迫的表達(dá)下調(diào),在高溫脅迫的表達(dá)量先下降再上升。XLOC_005515、XLOC_027154、XLOC_023592和XLOC_035830的表達(dá)量在高溫脅迫下先下降再上升。但在鹽脅迫中表達(dá)模式存在差異,XLOC_005515和XLOC_027154先下降后上升,而XLOC_023592和XLOC_035830的表達(dá)量逐漸下降。此外,XLOC_033671、XLOC_003826、XLOC_06988和XLOC_024730也具有相同的表達(dá)模式,在鹽脅迫中持續(xù)上調(diào)表達(dá),在高溫脅迫中先上升后下降,高溫脅迫3 h的表達(dá)量最高(圖2)。
Y3H和Y12H分別代表鹽脅迫3 h和鹽脅迫12 h;H3H和H12H分別代表高溫脅迫3 h和高溫脅迫12 hY3H and Y12H represent 3 h and 12 h under salt stress treatment, respectively;H3H and H12H represent 3 h and 12 h under heat stress treatment, respectively圖2 10個差異LncRNAs在青花菜高溫和鹽脅迫下的表達(dá)特征Fig.2 Expression characteristics of 10 differentially expressed LncRNAs under high temperature and salt stress in broccoli
本研究構(gòu)建了青花菜高溫和鹽脅迫的LncRNAs文庫,獲得184.77 M clean reads,平均每個文庫36.95 M,此結(jié)果大于前人在青花菜種子及幼苗中測序得到的read數(shù)目[23]。更多的測序數(shù)量有利于表達(dá)量相對較低的LncRNAs的鑒定[24]。因此,本文的測序數(shù)據(jù)對于鑒定青花菜高溫和鹽脅迫LncRNAs具有較好的可靠度。篩選出的青花菜LncRNAs也符合LncRNAs的一般特征:長度、外顯子數(shù)以及表達(dá)量均比mRNA小。
在鹽脅迫條件下,氨基酸、蛋白質(zhì)及其他激素類物質(zhì)含量會發(fā)生變化,最終造成植物生理代謝紊亂[25]。氧化磷酸化相關(guān)的轉(zhuǎn)錄因子可調(diào)節(jié)脅迫響應(yīng)基因的表達(dá)[26],而氧化磷酸化過程是青花菜差異LncRNAs的靶基因在鹽脅迫中富集較多的途徑之一。青花菜XLOC_035830的靶基因為氧化磷酸化酶,該LncRNAs的表達(dá)量先下降后上升,其靶基因Bol018386(coproporphyrinogen oxidase)的表達(dá)量下調(diào),推測XLOC_035830通過調(diào)控氧化磷酸化酶基因的表達(dá)進行鹽脅迫響應(yīng)。乙烯和生長素是植物生長發(fā)育的重要激素,同時還是調(diào)控植物對非生物脅迫的重要因子[27]。本試驗中XLOC_003579及其靶向的生長素基因(Bol019000)在青花菜鹽脅迫過程中表達(dá)受到抑制,表明某些青花菜生長素相關(guān)基因的表達(dá)可受到鹽脅迫的調(diào)控。此外,XLOC_021367的靶基因Bol019606(ethylene-responsive transcription factor)可參與乙烯代謝途徑,其表達(dá)量在青花菜鹽脅迫過程中先上升后下降,表明XLOC_021367可通過靶基因調(diào)控乙烯介導(dǎo)的信號通路來對鹽脅迫進行響應(yīng)。
高溫脅迫使植物質(zhì)膜流動性增加,從而促使類受體蛋白激酶向細(xì)胞傳遞高溫信號,同時激活相關(guān)轉(zhuǎn)錄因子[28]。本研究發(fā)現(xiàn)差異LncRNAsXLOC_023592的靶基因為凝集素類受體蛋白激酶(Bol039139),該激酶是類受體蛋白激酶家族中的一個亞族,在植物生物/非生物脅迫和發(fā)育調(diào)控中發(fā)揮非常重要的作用[29]。qRT-PCR分析發(fā)現(xiàn)XLOC_023592及其靶基因的表達(dá)量隨著高溫脅迫時間的延長逐漸下降,表明抑制該LncRNAs的表達(dá),可能會導(dǎo)致其靶基因表達(dá)受限從而影響青花菜高溫脅迫的響應(yīng)。熱激蛋白合成可以提高植物的耐熱性,異位表達(dá)擬南芥的谷氧還原蛋白可提高HSP基因的表達(dá)來增加耐熱性[12]。XLOC_003826靶向熱激蛋白基因(Bol005002),高溫脅迫12 h的表達(dá)量為CK的8倍,靶基因的表達(dá)量也隨著高溫脅迫時間的延長而快速增加,由此推測該LncRNAs是高溫脅迫響應(yīng)過程中的重要調(diào)控因子。此外,對青花菜在高溫脅迫下的差異LncRNAs進行注釋,發(fā)現(xiàn)高溫脅迫相關(guān)的差異LncRNAs參與了青花菜的谷胱甘肽代謝、信號轉(zhuǎn)導(dǎo)以及脂肪酸延伸和代謝等過程。谷胱甘肽轉(zhuǎn)移酶蛋白基因(Bol033291)是XLOC_025914的靶基因,該LncRNA和其靶基因的表達(dá)模式相反,推測該LncRNAs可通過負(fù)調(diào)控其靶基因的表達(dá)來參與青花菜的熱脅迫過程。
本研究鑒定到青花菜高溫和鹽脅迫相關(guān)LncRNAs 2 432條,其中31條為intronic RNA,79條為anti-sense RNA,2 322條為lincRNA。LncRNAs的表達(dá)水平整體較mRNA低,且長度和外顯子個數(shù)比mRNA少。篩選得到96條上調(diào)和62條下調(diào)的差異LncRNAs。通過GO和KEGG注釋發(fā)現(xiàn)這些差異LncRNAs可參與青花菜高溫和鹽脅迫中的植物激素信號轉(zhuǎn)導(dǎo)、谷胱甘肽代謝以及氧化磷酸化等過程。實時熒光定量分析表明10個差異LncRNAs在高溫和鹽脅迫下的表達(dá)模式存在差異。研究結(jié)果為進一步分析LncRNA在青花菜逆境脅迫中的調(diào)控機理提供理論基礎(chǔ)。