趙松子,幸偉年
(江西省林業(yè)科學(xué)院·江西省油茶種質(zhì)資源保護與利用實驗室,江西 南昌 330013)
WOX 基因家族是植物特有的轉(zhuǎn)錄因子,參與調(diào)節(jié)干細胞維持、胚胎發(fā)育、側(cè)生器官發(fā)育、器官再生等生物學(xué)過程,擬南芥(Arabidopsis thaliana)、黃瓜(Cucumis sativus)、水稻(Oryza sativa)分別含有15、11、12 個WOX 基因[1-2]。WUSCHEL(WUS)是WOX 基因家族中與作物產(chǎn)量相關(guān)的重要成員,在頂端分生組織中表達,參與干細胞的維持,WUS 功能缺失突變體wus-1只有1 個雄蕊,沒有心皮[3];黃瓜中過表達CsWUS可以增加心皮數(shù)[4];番茄(Solanum lycopersicum)QTL位點lc 位于SlWUS 基因下游1080 bp 后區(qū)域,該區(qū)域的2 個SNP 與心皮數(shù)的變化相關(guān),從而使番茄心皮數(shù)增加,果實變大[5];此外,WOX4、WOX5、WOX9 也參與干細胞的維持[6-9]。WOX 基因家族可以分為3 個分支:古分支(包括WOX10、WOX13、WOX14)、中間分支(包括WOX8、WOX9、WOX11、WOX12)、WUS分支(包括WUS、WOX1、WOX2、WOX3、WOX4、WOX5、WOX6、WOX7)[10-12]。普通油茶(Camellia oleifera)是我國第一大木本油料作物,一般所指的油茶為普通油茶,目前對油茶WOX 轉(zhuǎn)錄因子缺乏了解,該研究通過對油茶基因組、轉(zhuǎn)錄組數(shù)據(jù)的挖掘,鑒別出18個WOX 基因,并進一步分析了其表達的組織特異性,為深入研究該家族基因的生物學(xué)功能提供了參考。
油茶(CON)基因組WOX 基因家族的蛋白質(zhì)序列及CDS序列來自GitHub(https://github.com/Hengfu-Yin/CON_genome_data);擬南芥WOX 基因家族的蛋白質(zhì)序列來自Phytozome(https://jgi.doe.gov/data-and-tools/phytozome/);SlWUS 及水稻W(wǎng)OX 基因家族的蛋白質(zhì)序列來自NCBI(https://www.ncbi.nlm.nih.gov/);油茶花芽(CRR274890、CRR274891、CRR274892)、雄蕊(CRR274872、CRR274873、CRR274874)的轉(zhuǎn)錄組數(shù)據(jù)來自GWH(https://ngdc.cncb.ac.cn/gwh/),葉(SRR5061852、SRR5061853 、SRR5061854)、根(SRR8698748 、SRR8698749、SRR8698750)、 種 仁(SRR10428065、SRR10428066、SRR10428067)、柱頭(SRR8275897、SRR8275898、SRR8275899) 的 轉(zhuǎn) 錄 組 數(shù) 據(jù) 來 自NCBI。
利用BLAST 軟件,以擬南芥的WUS 蛋白質(zhì)序列搜索油茶良種贛無1 花蕾轉(zhuǎn)錄組CDS數(shù)據(jù)庫[13],得到同源基因的部分CDS 序列及其蛋白質(zhì)序列,用Boetie2[14]軟件將轉(zhuǎn)錄組測序數(shù)據(jù)單讀段比對到CDS序列,根據(jù)讀段編號用自編的Perl 腳本提取成對的讀段,在默認狀態(tài)下用Cap3 軟件[15]進行序列拼接,獲得同源基因的mRNA 序列;再用Boetie2 軟件將轉(zhuǎn)錄組測序數(shù)據(jù)單讀段比對到mRNA 序列,提取成對的讀段,用Cap3 軟件進行序列拼接,獲得新的mRNA序列;重復(fù)上述過程,直到mRNA 序列不再延伸。用油茶WUS 同源基因的mRNA 序列搜索油茶良種贛無1 基因組三代測序數(shù)據(jù)[16],得到含有油茶WUS 同源基因mRNA 序列的亞讀段;亞讀段經(jīng)過校正后,用Augustus[17]軟件進行基因預(yù)測,得到油茶WUSCHEL同源基因的全長CDS 序列。
利用MEGA7[18]軟件對油茶、擬南芥、黃瓜、水稻等植物WOX 基因家族的蛋白質(zhì)序列進行比對,構(gòu)建WOX 基因家族蛋白質(zhì)系統(tǒng)進化樹(Neighbor-joining法)。
利用Boetie2[14]軟件將油茶花芽、雄蕊、柱頭、葉、根、種仁等6 種組織(或器官)樣品的轉(zhuǎn)錄組數(shù)據(jù)單讀段比對到油茶WOX 基因CDS 序列,統(tǒng)計匹配的讀段數(shù),計算基因表達水平RPKM(109×匹配讀段數(shù)/讀段總數(shù)/基因長度)。
以擬南芥15 個WOX 基因的蛋白序列為query,利用BLAST 軟件在油茶(CON)全基因組蛋白質(zhì)序列中鑒定出17 個WOX 基因家族同源體(表1),但未得到WUS 的同源基因。
以WUS 序列搜索油茶花蕾轉(zhuǎn)錄組CDS 數(shù)據(jù)庫,得到1 條最佳匹配序列,經(jīng)過序列比對,該條序列為WUS 的同源基因,將轉(zhuǎn)錄組測序數(shù)據(jù)單讀段比對到油茶WUS 的同源基因序列,提取成對讀段,用Cap3軟件進行序列拼接,獲得油茶WUS 同源基因的mRNA 序列;用油茶WUS 同源基因的mRNA 序列分別搜索油茶基因組三代測序數(shù)據(jù),得到1 條亞讀段,亞讀段經(jīng)過校正后,長度為30936 bp(GenBank 登錄號:MW512817),用Augustus 軟件進行基因預(yù)測,得到油茶WUSCHEL 同源基因的全長mRNA 序列、全長CDS 序列及aa 序列,其結(jié)果與轉(zhuǎn)錄組測序數(shù)據(jù)的拼接結(jié)果基本一致,將油茶WUS 同源基因命名為CoWUS(GenBank 登錄號:MW512818)。
用WOX 基因家族的45 條蛋白質(zhì)序列構(gòu)建進化樹(表1、圖1),結(jié)果表明,油茶的18 個WOX 基因可以分為3 個分支。CoWUS、CoWOX1A、CoWOX1B、CoWOX1C、CoWOX1D、CoWOX2A、CoWOX2B、CoWOX3A、CoWOX3B、CoWOX4A、CoWOX4B、CoWOX4C、CoWOX7等13 個基因?qū)儆赪US 分支,CoWOX9A 與CoWOX9B屬于中間分支,CoWOX11A、CoWOX11B、CoWOX13等3 個基因?qū)儆诠欧种?。在WUS 分支中,CoWUS 和WUS、SlWUS、OsWOX1 在一個亞支,是WUS 的同源基因,可能參與油茶心皮數(shù)的調(diào)控。
圖1 WOX 基因家族蛋白質(zhì)的系統(tǒng)進化樹Fig. 1 Neighbor-joining phylogenetic tree of WOX gene family proteins
表1 系統(tǒng)進化樹中WOX 基因家族蛋白質(zhì)及其編號Tab. 1 Proteins from WOX gene family in phylogenetic tree and their accession numbers
用來自油茶花芽、雄蕊、柱頭、葉、根、種仁等6 種組織(或器官)樣品的轉(zhuǎn)錄組數(shù)據(jù)對18 個WOX 基因進行表達分析(表2),結(jié)果表明:CoWOX1A 與CoWOX1B 的表達譜比較相似,但CoWOX1B 在柱頭的表達與CoWOX1A 存在較大差異;CoWOX1C 與CoWOX1D 的表達譜基本一致,在柱頭的表達水平最高;CoWOX2A 與CoWOX2B 的表達譜完全一致,在根的表達水平最高,具有較高的組織特異性;CoWOX3A與CoWOX3B 的表達譜基本一致,主要在花芽、雄蕊中表達,具有較高的組織特異性,CoWOX3A 的表達水平高于WOX3B;CoWOX4A 的表達沒有組織特異性,表達水平最高的樣品是根;CoWOX4B 與CoWOX4C 的表達譜基本一致,沒有組織特異性,表達水平最高的樣品是根,最低的是葉片;CoWOX11A與CoWOX11B 的表達譜基本一致,在種仁中表達水平最高,也是18 個WOX 基因中表達水平最高的;CoWOX7、CoWOX9A、CoWOX9B、CoWOX13 的表達沒有組織特異性,CoWOX9A 與CoWOX9B 的表達譜基本一致;CoWUS 的表達沒有組織特異性,表達水平最高的樣品是柱頭,其次是花芽,最低的是葉片和根。
表2 油茶WOX 基因家族的表達譜Tab. 2 Expression pattern of WOXs in Camellia oleifera
該研究從油茶基因組中鑒別出18 個WOX 基因,基因表達分析結(jié)果表明這些基因可能參與不同的生物學(xué)過程;CoWOX11A 與CoWOX11B 在種仁中高水平表達,可能對種仁發(fā)育具有重要作用;果實心皮數(shù)與莖尖CLV-WUS 干細胞信號轉(zhuǎn)導(dǎo)途徑有關(guān)[19-22],蛋白質(zhì)序列進化分析表明,CoWUS 是WUS 的同源基因,在分析的6 種組織(或器官)樣品中,CoWUS 表達水平最高的樣品是柱頭,表明CoWUS 可能參與油茶心皮數(shù)的調(diào)控;未來將圍繞CoWUS 開發(fā)SSR、SNP 分子標記,對油茶種質(zhì)資源群體進行心皮數(shù)的關(guān)聯(lián)分析,發(fā)現(xiàn)可以增加心皮數(shù)的等位基因,為超多心皮、超大果型、超高產(chǎn)普通油茶良種的選育奠定理論與種質(zhì)基礎(chǔ)。