段 強(qiáng),何智彪,李國(guó)瑞,趙秀平,張 帥,韓雯毓,陳永勝
(1.內(nèi)蒙古民族大學(xué) 蓖麻育種國(guó)家民委重點(diǎn)實(shí)驗(yàn)室,內(nèi)蒙古通遼 028043;2.中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所應(yīng)用光學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,吉林 長(zhǎng)春 130000;3.內(nèi)蒙古自治區(qū)高校蓖麻產(chǎn)業(yè)工程技術(shù)研究中心,內(nèi)蒙古 通遼 028043;4.內(nèi)蒙古自治區(qū)蓖麻育種重點(diǎn)實(shí)驗(yàn)室,內(nèi)蒙古 通遼 028043;5.內(nèi)蒙古自治區(qū)蓖麻產(chǎn)業(yè)協(xié)同創(chuàng)新中心,內(nèi)蒙古 通遼 028043;6.蓖麻產(chǎn)業(yè)技術(shù)創(chuàng)新內(nèi)蒙古自治區(qū)工程研究中心,內(nèi)蒙古 通遼 028043;7.通遼市農(nóng)牧科學(xué)研究所,內(nèi)蒙古 通遼 028043)
轉(zhuǎn)錄因子(transcription factor,TF)是一類能夠以序列特異性方式結(jié)合DNA 的蛋白質(zhì)分子,通過(guò)調(diào)節(jié)轉(zhuǎn)錄水平指導(dǎo)基因表達(dá),在各種生物學(xué)過(guò)程中發(fā)揮著重要的調(diào)控作用。LBD(lateral organ boundaries domain)是一類具有LOB(lateral organ boundaries)結(jié)構(gòu)域的植物特有的轉(zhuǎn)錄因子基因家族[1],也稱作AS2/LOB 基因,這類基因家族在植物的側(cè)生組織原基中特異性表達(dá)。LBD 基因參與調(diào)控植物的生長(zhǎng)發(fā)育與代謝過(guò)程并在其中起著重要作用,包括植物響應(yīng)激素、營(yíng)養(yǎng)元素、生物和非生物脅迫以及植物側(cè)生器官發(fā)育、氮素營(yíng)養(yǎng)的吸收代謝、次生代謝等[2]。
LBD 通常包含4 個(gè)高度保守的半胱氨酸基序CX2CX6CX3C(C 為保守的半胱氨酸殘基、X 為不保守的氨基酸殘基),這是LBD 家族最明顯的特征[3]。同時(shí),也發(fā)現(xiàn)一些LBD 含有甘氨酸組成的GAS 基序和類亮氨酸拉鏈基序LX6LX3LX6L。根據(jù)這些保守結(jié)構(gòu)域,將LBD 轉(zhuǎn)錄因子家族分為兩個(gè)亞家族Class 1 和Class 2[3]。當(dāng)前已經(jīng)明確了一些LBD 基因的功能,但仍有部分基因的功能尚待驗(yàn)證。在擬南芥中,AtLBD4 以及CHALFUN-JUNIOR 等[4]研究發(fā)現(xiàn)的AtLBD41 基因參與調(diào)控植物葉片發(fā)育。LBD 中的另一成員AtAS2 基因,在幼嫩花器官近軸面特異表達(dá),從而調(diào)控植物的花器官發(fā)育[5-7]。SCHEIBLE 等[8]和RUBIN 等[9]研究發(fā)現(xiàn),擬南芥中第2 類LBD 成員AtLBD37、AtLBD38、AtLBD39 以及ALBINSKY 等[10]在水稻中發(fā)現(xiàn)的OsLBD37 基因參與調(diào)控氮素代謝。ZENTELLA 等[11]研究發(fā)現(xiàn),赤霉素抑制LBD 成員AtASL37 的表達(dá);而IKEZAKI 等[12]研究發(fā)現(xiàn),LBD的另一成員AtAS2 基因能夠促進(jìn)赤霉素合成。BERCKMANS 等[13]研究發(fā)現(xiàn),擬南芥AtLBD33 和AtLBD18 基因能夠通過(guò)激活E2Fa 的表達(dá),促進(jìn)側(cè)根發(fā)育。楊樹中與擬南芥AtLBD1 同源的LBD1 基因,能夠與抑制物SRDX 結(jié)構(gòu)域平移融合,降低直徑增長(zhǎng),抑制韌皮部的發(fā)育,調(diào)控次生生長(zhǎng)[14]。有研究發(fā)現(xiàn),在擬南芥中,AtLBD16、AtLBD17、AtLBD18 和AtLBD29 是誘導(dǎo)愈傷組織初始體形成的關(guān)鍵調(diào)控因子,抑制LBD 基因表達(dá)會(huì)阻止愈傷組織的形成。
蓖麻(Ricinuscommunis)為大戟科(Euphorbiaceae)蓖麻屬(Ricinus)一年生或多年生灌木。與大多數(shù)大戟科植物類似,蓖麻的適應(yīng)能力特別強(qiáng)。2010年,蓖麻基因組草圖的繪制使其成為大戟科第1 個(gè)完成基因組測(cè)序的物種[15];2021年,蓖麻基因組組裝至染色體水平,為通過(guò)比較基因組學(xué)在染色體水平研究蓖麻耐脅迫的分子機(jī)制創(chuàng)造了條件[16]。本研究基于組裝至染色體水平的蓖麻基因組對(duì)蓖麻L(zhǎng)BD 基因家族進(jìn)行全面鑒定,并在此基礎(chǔ)上分析其基因結(jié)構(gòu)、理化性質(zhì)、進(jìn)化關(guān)系及表達(dá)模式,旨在為解析蓖麻L(zhǎng)BD基因家族功能奠定基礎(chǔ)。
綠蓖1 號(hào)、淄蓖5 號(hào)種子來(lái)自內(nèi)蒙古通遼市農(nóng)牧科學(xué)研究所,在實(shí)驗(yàn)室中種植于田園土∶蛭石∶營(yíng)養(yǎng)土=1∶2∶1 的基質(zhì)中。隨機(jī)選擇生長(zhǎng)三葉期的蓖麻植株幼苗為試驗(yàn)材料,以噴施正常濃度除草劑(90 g/hm2)——25%砜嘧磺隆的2 種蓖麻群體為處理組;以未加除草劑處理,噴施等量清水的2 種蓖麻群體為對(duì)照組。每個(gè)處理隨機(jī)取樣4 株,采取每單株的葉片、莖段、根部分,將樣品記為綠蓖1 號(hào)處理組(LB_T)、綠蓖1 號(hào)對(duì)照組(LB_C),淄蓖5 號(hào)處理組(ZB_T)、淄蓖5 號(hào)對(duì)照組(ZB_C),每組織部位設(shè)置4 次重復(fù),分別命名為L(zhǎng)1~L4、S1~S4、R1~R4。放入液氮冷凍,置-80 ℃保存。后續(xù)對(duì)處理組和對(duì)照組樣品進(jìn)行處理,包括總RNA 的提取、純化,cDNA 文庫(kù)構(gòu)建,轉(zhuǎn)錄組測(cè)序及相關(guān)分析等。
本研究中,蓖麻全基因組序列、蛋白質(zhì)序列、編碼序列與注釋文件來(lái)自O(shè)il Plant Database(http://oilplants.iflora.cn),擬南芥LBD 基因家族的基因與蛋白質(zhì)序列獲取于TAIR 數(shù)據(jù)庫(kù)(Araport11,https://www.arabidopsis.org/),麻瘋樹獲取于NCBI(RJC1_Hi-C,https://www.ncbi.nlm.nih.gov),玉米獲取于NCBI(B73 RefGen_v4.0,https://www.ncbi.nlm.nih.gov),水稻獲取于NCBI(Build 4.0,https://www.ncbi.nlm.nih.gov),番茄獲取于NCBI(SL3.0,https://www.ncbi.nlm.nih.gov),煙草獲取于NCBI(Ntab-TN90,https://www.ncbi.nlm.nih.gov),蓖麻的相關(guān)表達(dá)量數(shù)據(jù)來(lái)自Gene Expression Omnibus Database(https://www.ncbi.nlm.nih.gov)。
使用蓖麻蛋白質(zhì)序列文件在本地建立數(shù)據(jù)庫(kù),以擬南芥全部的43 個(gè)LBD 基因家族成員序列作為query 序列進(jìn)行本地BLASTP 比對(duì)(E-value≤1e-10)[17]。由Pfam 數(shù)據(jù)庫(kù)(http://pfam.xfam.org/)獲得LBD 基因家族典型結(jié)構(gòu)域的隱馬爾科夫模型(PF03195),以此為query 序列進(jìn)行本地HMMER 比對(duì)[18]。將BLASTP 與HMMER 比對(duì)結(jié)果進(jìn)行匯總,去除冗余序列。分別使用NCBI CDD 工具(https://www.ncbi.nlm.nih.gov/cdd/) 與EBI InterPro 工具(http://www.ebi.ac.uk/interpro/)對(duì)候選序列進(jìn)行結(jié)構(gòu)域檢測(cè)[19-20],使用Clustal Omega 軟件進(jìn)行多重比對(duì)[21],使用Jalview 可視化比對(duì)結(jié)果[22],手動(dòng)剔除結(jié)構(gòu)域缺失與不完整的序列,對(duì)于同一基因存在多個(gè)轉(zhuǎn)錄本的情況,選擇第1 個(gè)轉(zhuǎn)錄本作為代表序列,從而確定蓖麻L(zhǎng)BD 基因家族的成員。通過(guò)ExPASy 的ProtParam 工具(https://web.expasy.org/protparam/)對(duì)已確定的蓖麻L(zhǎng)BD 基因家族成員進(jìn)行理化性質(zhì)分析[23],同時(shí)使用Plant-mPLoc 進(jìn)行蛋白質(zhì)亞細(xì)胞定位[24]。
利用蓖麻基因組注釋文件,通過(guò)編寫的腳本提取LBD 基因家族成員的基因、內(nèi)含子與外顯子位點(diǎn)信息,并計(jì)算內(nèi)含子與外顯子長(zhǎng)度。使用MEME 在線工具(http://meme-suite.org/tools/meme)對(duì)蓖麻L(zhǎng)BD 蛋白進(jìn)行保守基序分析[25],基序數(shù)目設(shè)置為10 個(gè),通過(guò)編寫的腳本提取保守基序的位點(diǎn)信息。蓖麻L(zhǎng)BD 基因家族的結(jié)構(gòu)、蛋白質(zhì)保守基序均使用Evoview 在線工具進(jìn)行可視化[26]。使用SWISS-MODEL在線工具對(duì)具有代表性的蓖麻L(zhǎng)BD 蛋白進(jìn)行同源三維建模[27]。
使用Circos 軟件繪制基因在染色體上的分布圖[28],從而確定在染色體上的位置。使用MCScanX 軟件(http://chibba.pgml.uga.edu/mcscan2/) 對(duì)蓖 麻L(zhǎng)BD基因家族在基因組中的復(fù)制模式進(jìn)行分析[29],同時(shí)對(duì)蓖麻L(zhǎng)BD 與擬南芥LBD 基因進(jìn)行共線性分析,使用本地BLASTP 對(duì)蓖麻與擬南芥的蛋白質(zhì)序列文件進(jìn)行建庫(kù),以此蛋白質(zhì)序列文件作為query 序列進(jìn)行BLASTP 比對(duì),設(shè)置E-value 為1e-10。判定相互匹配部分的長(zhǎng)度大于較長(zhǎng)序列長(zhǎng)度的80%且相互匹配部分的相似性大于80%的緊密相連的基因中,只參與1 次復(fù)制事件,同時(shí)結(jié)合基因在染色體上的位置,判斷其復(fù)制類型,蓖麻與擬南芥的種內(nèi)、種間共線性關(guān)系使用Circos 軟件進(jìn)行可視化。使用KaKs_Calculator 2.0 軟件對(duì)復(fù)制基因?qū)M(jìn)行進(jìn)化選擇壓力分析[30],計(jì)算片段重復(fù)基因?qū)Φ姆峭x替換率(Ka)和同義替換率(Ks)及其比例(Ka/Ks),剔除不符合閾值的基因?qū)?,使用ggplot2 對(duì)符合閾值的基因?qū)Φ姆治鼋Y(jié)果進(jìn)行可視化[31]。
對(duì)蓖麻L(zhǎng)BD 蛋白質(zhì)序列及擬南芥、麻瘋樹、玉米、水稻、番茄、煙草LBD 蛋白質(zhì)序列進(jìn)行ClustalW多重序列比對(duì),對(duì)齊保守結(jié)構(gòu)域兩端序列,使用MEGA X 軟件以鄰接法(NJ)構(gòu)建蓖麻種間系統(tǒng)發(fā)育樹,使用PhyML 軟件以最大似然法(ML)構(gòu)建蓖麻L(zhǎng)BD 基因家族種內(nèi)系統(tǒng)發(fā)育樹[32-33],最大似然法采用LG+G Model,鄰接法采用JTF Model,設(shè)置Bootstrap 檢驗(yàn)1 000 次,其余采用默認(rèn)參數(shù),使用Evolview 在線工具對(duì)系統(tǒng)發(fā)育樹可視化[26]。
從NCBI GEO 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)獲取蓖麻不同組織的相關(guān)表達(dá)量數(shù)據(jù),包括Ⅱ/Ⅲ期胚乳、Ⅴ/Ⅵ期胚乳、萌芽種子、葉片、雄花[34]。非生物脅迫數(shù)據(jù)來(lái)自內(nèi)蒙古民族大學(xué)蓖麻育種國(guó)家民委重點(diǎn)實(shí)驗(yàn)室的前期研究(數(shù)據(jù)未公布),包括經(jīng)過(guò)除草劑噴施與未噴施的蓖麻葉片、莖段和根。使用編寫的腳本對(duì)統(tǒng)計(jì)得到的reads count 值進(jìn)行FPKM標(biāo)準(zhǔn)化處理,在計(jì)算過(guò)程中,將基因所有外顯子的長(zhǎng)度之和定義為有效的基因長(zhǎng)度。為了了解蓖麻L(zhǎng)BD基因家族的表達(dá)模式,對(duì)所有樣本中表達(dá)量為0 的基因進(jìn)行剔除,并對(duì)剩余的蓖麻L(zhǎng)BD 基因家族進(jìn)行層次聚類。使用R-4.1.0 軟件(https://www.r-project.org/) 的Pheatmap 包進(jìn)行基因表達(dá)量熱圖繪制(https://cran.r-project.org/web/packages/pheatmap/)[35],為使結(jié)果更加準(zhǔn)確,對(duì)表達(dá)量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
為確定蓖麻L(zhǎng)BD 基因家族成員,分別進(jìn)行了本地BLASTP 與HMMER 比對(duì),由TAIR 獲取了擬南芥LBD 基因家族成員的蛋白質(zhì)序列,以此作為query 序列進(jìn)行本地BLASTP 比對(duì),結(jié)果顯示,有33 條符合閾值的蓖麻L(zhǎng)BD 基因家族候選序列(E-value≤1e-10);經(jīng)確認(rèn),LBD 典型結(jié)構(gòu)域的Pfam 登記號(hào)為PF03195,下載其隱馬爾科夫模型,經(jīng)本地HMMER比對(duì)也獲得33 條符合閾值的候選序列(圖1)。使用NCBI CDD 與EBI InterPro 工具對(duì)候選序列進(jìn)行結(jié)構(gòu)域檢測(cè),使用Clustal Omega 進(jìn)行多重序列比對(duì),手動(dòng)剔除類鋅指結(jié)構(gòu)CX2CX6CX3C 缺失或不完整的序列,從而確保結(jié)果的準(zhǔn)確性,對(duì)于同一基因存在多個(gè)轉(zhuǎn)錄本的情況,選擇第1 個(gè)轉(zhuǎn)錄本作為代表序列;最后,共鑒定得到30 個(gè)蓖麻L(zhǎng)BD 基因家族成員,按照基因在染色體上的順序命名為RcLBD1~RcLBD30。對(duì)蓖麻L(zhǎng)BD 基因家族成員進(jìn)行了系統(tǒng)評(píng)估,包括基因長(zhǎng)度、氨基酸數(shù)目、蛋白質(zhì)分子量、等電點(diǎn)、亞細(xì)胞定位等。由表1 可知,30 個(gè)蓖麻L(zhǎng)BD 基因家族的氨基酸數(shù)目與分子量差異較小,但有個(gè)別成員差異較大,其中,RcLBD29 只有73 個(gè)氨基酸數(shù)目,分子量最小,為8 513.10 D;RcLBD12 則有1 486 個(gè)氨基酸數(shù)目,分子量最高,為166 377.47 D。等電點(diǎn)范圍波動(dòng)較大,其中,RcLBD21 等電點(diǎn)最低,為4.53;RcLBD29 等電點(diǎn)最高,為9.72。除RcLBD29 外,疏水系數(shù)(grand average of hydropathy,GRAVY)均為負(fù)值,表明其他蓖麻L(zhǎng)BD 蛋白均為親水性蛋白。亞細(xì)胞定位結(jié)果顯示,30 個(gè)蓖麻L(zhǎng)BD 基因家族的蛋白質(zhì)全部位于細(xì)胞核內(nèi),RcLBD12 既位于細(xì)胞核內(nèi)也位于細(xì)胞膜中。
表1 蓖麻L(zhǎng)BD 基因家族信息
圖1 蓖麻L(zhǎng)BD 基因家族的序列特征
為探究蓖麻L(zhǎng)BD 基因家族的基因結(jié)構(gòu),基于注釋文件,使用編寫的腳本進(jìn)行了基因結(jié)構(gòu)分析,30 個(gè)蓖麻L(zhǎng)BD 基因的外顯子、內(nèi)含子分布情況見圖2。由圖2 可知,30 個(gè)蓖麻L(zhǎng)BD 基因的外顯子數(shù)目為2~7 個(gè),內(nèi)含子數(shù)目為1~7 個(gè)。其中,RcLBD12 與RcLBD28 含有7 個(gè)外顯子和內(nèi)含子,RcLBD10 含有5 個(gè)外顯子和4 個(gè)內(nèi)含子,RcLBD25 含有4 個(gè)外顯 子和3 個(gè)內(nèi)含子,RcLBD5、RcLBD8、RcLBD14、RcLBD20、RcLBD24 均含有3 個(gè)外顯子和2 個(gè)內(nèi)含子,而RcLBD17 僅含有1 個(gè)外顯子并沒(méi)有內(nèi)含子,除此以外,其他所有成員均含有2 個(gè)外顯子和1 個(gè)內(nèi)含子。
基序,亦稱模序、模體,是指DNA、蛋白質(zhì)等生物大分子中的保守序列,是介于二級(jí)和三級(jí)結(jié)構(gòu)之間的另一種結(jié)構(gòu)層次。MEME 分析結(jié)果顯示,30 個(gè)蓖麻L(zhǎng)BD 基因家族成員中共找到10 個(gè)Motif(圖2),僅前5 個(gè)Motif 的E-value 小于0.05,單個(gè)成員含有的Motif 范圍在1~6 個(gè)。其中,所有成員均具有Motif2, 經(jīng)比較發(fā)現(xiàn),Motif2為類鋅指結(jié)構(gòu)CX2CX6CX3C,這也是LBD 基因家族的標(biāo)志;絕大多數(shù)成員同時(shí)具有Motif1 與Motif3,經(jīng)比較發(fā)現(xiàn)Motif1 為GAS 基序,Motif3 為類亮氨酸拉鏈結(jié)構(gòu)LX6LX3LX6L。值得注意的是,RcLBD7 具有Motif2與Motif3 而缺失了Motif1,RcLBD29 僅具有Motif2并且第1 個(gè)半胱氨酸突變?yōu)樘於0?,更有趣的是,RcLBD4、RcLBD6、RcLBD11、RcLBD14、RcLBD18、RcLBD27 均缺失了Motif3,而在相同位點(diǎn)以Morif4(LLWSGNWHVCQAAVETVLRGGPIRPL)取代??梢悦黠@看出,蓖麻L(zhǎng)BD 基因家族擁有較為簡(jiǎn)單的蛋白質(zhì)保守基序結(jié)構(gòu),與對(duì)應(yīng)的基因結(jié)構(gòu)基本一致。
圖2 蓖麻L(zhǎng)BD 基因的種內(nèi)系統(tǒng)發(fā)育樹、基因結(jié)構(gòu)和蛋白質(zhì)保守基序
為進(jìn)一步探究蓖麻L(zhǎng)BD 蛋白的結(jié)構(gòu),使用SWISS-MODEL 對(duì)具有代表性的蓖麻L(zhǎng)BD 蛋白進(jìn)行同源建模(圖3),其中,A 為RcLBD2,屬于Class 1,具有完整的LOB 結(jié)構(gòu)域;B 為RcLBD28,屬于Class 2,缺失類亮氨酸拉鏈;C 為RcLBD29,屬于Class 1,但缺失類亮氨酸拉鏈且GAS 基序不完整。如建模結(jié)果所示,無(wú)論屬于哪個(gè)亞族,蓖麻L(zhǎng)BD 蛋白的空間結(jié)構(gòu)都呈現(xiàn)出近似對(duì)稱的“Y”字結(jié)構(gòu),但RcLBD29是例外的,RcLBD29 只保留了上部的近似“V”的結(jié)構(gòu),這意味著RcLBD29 可能在進(jìn)化過(guò)程中丟失了部分功能。
圖3 蓖麻L(zhǎng)BD 蛋白同源建模
基因在染色體上的分布與染色體在表達(dá)過(guò)程中的參與程度以及在植物生長(zhǎng)發(fā)育中的重要性密切相關(guān)。為探究蓖麻L(zhǎng)BD 基因家族的復(fù)制模式與進(jìn)化機(jī)制,進(jìn)行了染色體定位分析,以往蓖麻多在Scafford水平進(jìn)行分析,難以有效地探明其關(guān)系,得益于測(cè)序技術(shù)的進(jìn)步,二代測(cè)序結(jié)合三代測(cè)序已將蓖麻基因組組裝至染色體水平(圖4),30 個(gè)蓖麻L(zhǎng)BD 基因分布在9 條染色體上,在RcChr6 上沒(méi)有分布。此外,除RcLBD7 位于RcChr3 外,其余染色體上均有多個(gè)成員分布,RcChr8 上最多,有7 個(gè)成員分布,分別是RcLBD18~RcLBD24。
通過(guò)對(duì)蓖麻和擬南芥進(jìn)行共線性分析,MCScanX 結(jié)果顯示,在蓖麻中有7 對(duì)同源基因?qū)?,分別是RcLBD4 和RcLBD11、RcLBD6 和RcLBD27、RcLBD7 和RcLBD17、RcLBD9 和RcLBD15、RcLBD11和RcLBD14、RcLBD13 和RcLBD28、RcLBD18 和RcLBD27。對(duì)這些共線性區(qū)域分析時(shí)發(fā)現(xiàn),在蓖麻的30 個(gè)RcLBD 基因中僅RcLBD19、RcLBD20 為串聯(lián)重復(fù)基因,RcLBD1、RcLBD2 可能來(lái)自小規(guī)模的轉(zhuǎn)座,或者是由某些其他基因的串聯(lián)復(fù)制和插入產(chǎn)生的,RcLBD4、RcLBD6、RcLBD7、RcLBD9、RcLBD11、RcLBD12、RcLBD13、RcLBD14、RcLBD15、RcLBD17、RcLBD18、RcLBD27、RcLBD28 可能來(lái)源于全基因組復(fù)制或片段復(fù)制,其他的RcLBD 基因可能來(lái)自轉(zhuǎn)座,如“復(fù)制型轉(zhuǎn)座”“非復(fù)制型轉(zhuǎn)座”或“保守轉(zhuǎn)座”等。在擬南芥中發(fā)現(xiàn)6 對(duì)同源基因?qū)Γ謩e是AtLBD1 和AtLBD11、AtLBD10 和AtLBD36、AtLBD16和 AtLBD29、AtLBD37 和 AtLBD38、AtLBD37 和AtLBD39、AtLBD38 和AtLBD39。同時(shí),蓖麻與擬南芥物種間存在25 對(duì)同源基因?qū)?,主要分布在擬南芥的AtChr1、AtChr3 上,表明了LBD 基因家族的高度保守性??梢园l(fā)現(xiàn),LBD 基因家族的部分成員在蓖麻和擬南芥染色體上的排列極為接近,聚集成簇,說(shuō)明在進(jìn)化歷程中可能發(fā)生了大規(guī)模的片段復(fù)制事件。根據(jù)Circos 軟件對(duì)共線性結(jié)果進(jìn)行了可視化,其結(jié)果見圖4。
圖4 蓖麻L(zhǎng)BD 基因染色體定位及共線性分析
蓖麻L(zhǎng)BD 基因家族進(jìn)化選擇壓力分析表明,所有基因?qū)Φ腒a 值均小于Ks 值,所有Ka/Ks 值均小于0.4(圖5),表明蓖麻L(zhǎng)BD 基因家族在進(jìn)化過(guò)程中經(jīng)歷了較強(qiáng)的純化選擇,以減少片段重復(fù)后的有害突變。
圖5 蓖麻L(zhǎng)BD 基因家族進(jìn)化選擇壓力分析
種內(nèi)系統(tǒng)發(fā)育樹(圖2)結(jié)果顯示,30 個(gè)蓖麻L(zhǎng)BD 基因分為2 個(gè)亞族Class 1 和Class 2。亞族Class 1 與Class 2 的成員基序結(jié)構(gòu)都較為簡(jiǎn)單,值得注意的是,亞族Class 1 中RcLBD7 與RcLBD29是特殊的,在Class 1 中除RcLBD7 缺失GAS 基序和RcLBD29 缺失GAS 基序與類亮氨酸拉鏈外,所有的Class 1 成員均具有包含類鋅指結(jié)構(gòu)、GAS 基序與類亮氨酸拉鏈在內(nèi)的完整結(jié)構(gòu),這可能是在進(jìn)化過(guò)程中發(fā)生了丟失。有趣的是,RcLBD13 與RcLBD28 在進(jìn)化上明顯晚于其他蓖麻L(zhǎng)BD 基因家族成員,二者的類亮氨酸拉鏈結(jié)構(gòu)出現(xiàn)了明顯的氨基酸突變。
種間系統(tǒng)發(fā)育樹(圖6)包含30 個(gè)蓖麻L(zhǎng)BD 蛋白、43 個(gè)擬南芥LBD 蛋白、40 個(gè)麻瘋樹LBD 蛋白、45 個(gè)玉米LBD 蛋白、34 個(gè)水稻LBD 蛋白、42 個(gè)番茄LBD 蛋白、92 個(gè)煙草LBD 蛋白。進(jìn)化分析結(jié)果顯示,7 個(gè)物種共計(jì)326 個(gè)LBD 蛋白被分為2 個(gè)亞族,命名為Class 1 和Class 2,在種間系統(tǒng)發(fā)育樹中可以看出,30 個(gè)蓖麻L(zhǎng)BD 蛋白分布于2 個(gè)亞族之中,與種內(nèi)系統(tǒng)發(fā)育樹結(jié)果一致。在所有亞族中均含有蓖麻與擬南芥的LBD 蛋白,在Class 2 中也包含6 個(gè)擬南芥LBD 基因家族成員,分別是AtLBD37、AtLBD38、AtLBD39、AtLBD40、AtLBD41 和AtLBD42,這也與擬南芥LBD 基因家族的分類一致,意味著兩者可能在進(jìn)化上比較相似。有趣的是,RcLBD29 在7 個(gè)物種中都是獨(dú)特的,RcLBD29 僅具有1 個(gè)類鋅指結(jié)構(gòu)CX2CX6CX3C、類亮氨酸拉鏈缺失、GAS 基序發(fā)生氨基酸突變,但在進(jìn)化中被歸于Class 1,在1 000 次Bootstrap 檢驗(yàn)的最大似然法樹中自展值為1 000。總的來(lái)看,LBD 基因家族在7 個(gè)物種中高度保守。
圖6 蓖麻L(zhǎng)BD 基因種間系統(tǒng)發(fā)育樹
為研究蓖麻L(zhǎng)BD 基因家族的表達(dá)模式,探究基因功能,從NCBI GEO 數(shù)據(jù)庫(kù)中獲取了蓖麻的表達(dá)量數(shù)據(jù),包括Ⅱ/Ⅲ期胚乳、Ⅴ/Ⅵ期胚乳、萌芽種子、葉片、雄花,命名為A 組,其結(jié)果見圖7。此外,為了探究蓖麻L(zhǎng)BD 基因家族在非生物脅迫的功能,對(duì)內(nèi)蒙古民族大學(xué)蓖麻育種國(guó)家民委重點(diǎn)實(shí)驗(yàn)室前期的測(cè)序數(shù)據(jù)進(jìn)行了探究(數(shù)據(jù)未公開),包括經(jīng)過(guò)除草劑噴施與未噴施的蓖麻葉片、莖段和根,命名為B 組,其結(jié)果見圖8。
圖7 蓖麻5 個(gè)組織中LBD 基因的表達(dá)量數(shù)據(jù)
圖8 噴施除草劑后的蓖麻L(zhǎng)BD 基因表達(dá)量數(shù)據(jù)
在A 組數(shù)據(jù)中,蓖麻L(zhǎng)BD 基因在不同組織部位中具有不同的表達(dá)模式,表現(xiàn)出了顯著的組織特異性。大多數(shù)的蓖麻L(zhǎng)BD 基因家族僅在特定的組織部位中高表達(dá)。有研究顯示,在擬南芥中ASL1基因參與調(diào)控了花的細(xì)胞分化從而調(diào)控花序的發(fā)育進(jìn)程[4],在蓖麻雄花組織中RcLBD10、RcLBD15、RcLBD16、RcLBD17、RcLBD19、RcLBD20、RcLBD24、RcLBD25、RcLBD28、RcLBD30 高表達(dá),意味著這些LBD 基因可能參與了蓖麻雄花的形態(tài)建成。在葉片組織中,RcLBD8、RcLBD18、RcLBD22、RcLBD27 高表達(dá),有研究顯示,在擬南芥中,AtAS2 通過(guò)抑制KNOX 基因表達(dá)來(lái)調(diào)控?cái)M南芥近軸面區(qū)域的細(xì)胞增殖,從而介導(dǎo)兩面對(duì)稱的平展葉形成[36],AtLBD36 參與調(diào)控了葉的形態(tài)建成[37],說(shuō)明蓖麻L(zhǎng)BD 基因可能在蓖麻葉片發(fā)育中扮演了重要角色。此外,部分蓖麻L(zhǎng)BD 基因在種子與胚的不同發(fā)育時(shí)期出現(xiàn)高表達(dá),說(shuō)明蓖麻L(zhǎng)BD 基因在蓖麻發(fā)育前期也起到了重要作用,這與AtLBD30 參與擬南芥胚胎發(fā)生、ZmLBD19 調(diào)控玉米胚珠發(fā)育一致[36,38]。此外,值得注意的是,有7 個(gè)蓖麻L(zhǎng)BD 基因在5 個(gè)組織中均為表達(dá),分別是RcLBD5、RcLBD9、RcLBD13、RcLBD21、RcLBD23、RcLBD26 和RcLBD29。
在B 組數(shù)據(jù)中,展示了蓖麻受到除草劑砜嘧磺隆噴施后在根、莖、葉3 個(gè)組織部位中響應(yīng)非生物脅迫的狀況,同時(shí),由于增加了莖段與根的樣本數(shù)據(jù),對(duì)A 組數(shù)據(jù)來(lái)說(shuō)是一個(gè)有力的補(bǔ)充??梢悦黠@看出,在蓖麻中絕大多數(shù)的LBD 基因在根中高表達(dá)。有研究表明,在擬南芥中,植物激素調(diào)節(jié)因子ARF 通過(guò)激活A(yù)tLBD16、AtLBD18、AtLBD29 從而調(diào)控了擬南芥的側(cè)根發(fā)育過(guò)程[39-41],在水稻中,OsCrl11 也參與調(diào)節(jié)了水稻不定根的發(fā)生[42],這與蓖麻中LBD 基因一致。有研究發(fā)現(xiàn),TaLBD34、TaLBD54 在受到冷脅迫的小麥中高表達(dá)[43],GmLBD12 在干旱、鹽脅迫與植物激素誘導(dǎo)的大豆中高表達(dá)[44]。在蓖麻中,RcLBD6、RcLBD16、RcLBD27 在除草劑處理的蓖麻葉片中上調(diào)表達(dá),其中,RcLBD6 上調(diào)近10 倍、RcLBD27 上調(diào)2 倍;RcLBD6、RcLBD12、RcLBD16、RcLBD23、RcLBD27 在除草劑處理的蓖麻根部中上調(diào)表達(dá),其中,RcLBD6 上調(diào)3 倍、RcLBD27 上調(diào)2 倍;RcLBD6、RcLBD8、RcLBD14、RcLBD20、RcLBD27、RcLBD28 在除草劑處理的蓖麻莖段中上調(diào)表達(dá),其中,RcLBD6 上調(diào)5 倍、RcLBD8 上調(diào)7 倍、RcLBD27上調(diào)2 倍。這表明蓖麻L(zhǎng)BD 基因在抵御非生物脅迫的過(guò)程中發(fā)揮了重要作用,并且存在明顯的組織特異性。值得注意的是,RcLBD6 與RcLBD27 在噴施過(guò)除草劑的蓖麻根、莖、葉3 個(gè)部位中均上調(diào)表達(dá),有趣的是,RcLBD6 和RcLBD29 都與擬南芥AtLBD37、AtLBD38、AtLBD39 基因同源,這些都表明LBD 基因家族可能在植物逆境脅迫中起到了重要作用。此外,蓖麻中Class 1 與Class 2 的LBD 基因家族成員在表達(dá)模式上并沒(méi)有明顯的差別。
轉(zhuǎn)錄因子普遍存在于高等植物之中,在植物生長(zhǎng)發(fā)育、逆境脅迫等方面發(fā)揮著重要作用,側(cè)生器官邊界域基因LBD 是一類廣泛存在于綠色植物中的特異性轉(zhuǎn)錄因子,參與調(diào)控植物生長(zhǎng)發(fā)育與代謝過(guò)程并起著重要作用。
本研究首先在蓖麻中鑒定了33 條LBD 蛋白質(zhì)序列,由于在蓖麻L(zhǎng)BD 基因中存在多個(gè)轉(zhuǎn)錄本,對(duì)于同一基因存在多個(gè)轉(zhuǎn)錄本的情況,選擇第1 個(gè)轉(zhuǎn)錄本作為代表序列,在剔除類鋅指結(jié)構(gòu)域缺失與不完整的序列之后,共獲得30 條蛋白質(zhì)序列,并以此作為蓖麻L(zhǎng)BD 基因家族的成員?;驈?fù)制與進(jìn)化選擇壓力分析顯示,蓖麻與擬南芥LBD 基因家族在進(jìn)化上高度保守,在進(jìn)化歷程中出現(xiàn)了大規(guī)模的片段復(fù)制事件并經(jīng)歷了較強(qiáng)的純化選擇來(lái)減少片段重復(fù)后帶來(lái)的有害突變。蓖麻種內(nèi)系統(tǒng)發(fā)育樹顯示,從基因結(jié)構(gòu)與蛋白質(zhì)保守基序來(lái)看,全部的RcLBD 基因被分為2 個(gè)亞族(Class1、Class2),2個(gè)亞族的RcLBD 基因的結(jié)構(gòu)差異較小,但蛋白質(zhì)保守基序差異明顯。從蓖麻與擬南芥、麻瘋樹、玉米、水稻、番茄、煙草的種間系統(tǒng)發(fā)育樹顯示,7 個(gè)物種共計(jì)326 個(gè)LBD 蛋白被分為2 個(gè)亞族(Class1、Class2),可以看出,種間系統(tǒng)發(fā)育樹與種內(nèi)系統(tǒng)發(fā)育樹有著極高的相似性,LBD 基因家族在進(jìn)化上較為保守。值得注意的是,在進(jìn)化過(guò)程中部分LBD 蛋白的GAS 基序與類亮氨酸拉鏈發(fā)生了氨基酸突變,類似RcLBD13與RcLBD28,可能暗示了一種進(jìn)化趨勢(shì),此外,RcLBD29 在7 個(gè)物種中都是特殊的,更像是進(jìn)化過(guò)渡階段的產(chǎn)物。表達(dá)模式分析結(jié)果顯示,蓖麻L(zhǎng)BD基因家族可能在蓖麻的花、葉片、根、胚等組織發(fā)育過(guò)程中起到了重要的作用,RcLBD6 與RcLBD27在噴施過(guò)除草劑的蓖麻根、莖、葉中均上調(diào)表達(dá)且差異顯著,被推測(cè)可能參與了蓖麻響應(yīng)非生物脅迫的過(guò)程。
綜上所述,與以往對(duì)蓖麻的基因家族研究不同,本研究是在染色體水平上進(jìn)行的。本研究采用生物信息學(xué)手段,從全基因組篩選與鑒定了蓖麻L(zhǎng)BD 基因家族成員,同時(shí)分析了基因結(jié)構(gòu)、理化性質(zhì)、蛋白質(zhì)保守基序、進(jìn)化發(fā)育、表達(dá)模式等,研究結(jié)果為解析蓖麻L(zhǎng)BD 基因家族功能奠定了基礎(chǔ),并為遺傳育種工作提供了參考。