關鍵詞:王族海棠:Alfin-like家族基因;生物信息學分析;功能鑒定;鹽脅迫;基因表達
中圖分類號:S685.99:Q781 文獻標識號:A 文章編號:1001-4942(2024)06-0016-09
隨著全球氣候變化,極端天氣頻發(fā),植物的生長發(fā)育易遭受各種不利環(huán)境因素如土壤鹽漬化、干旱和極端溫度等引起的非生物脅迫。土壤鹽堿化是影響植物生長和農業(yè)生產的主要非生物脅迫因素,而由于耕作管理不合理,這一問題正在不斷惡化。為了在逆境中生存,植物逐漸進化出復雜的調節(jié)機制以降低非生物脅迫帶來的損傷,其中誘導轉錄因子的表達是其緩解非生物脅迫的重要生理策略之一。近十年來,隨著高通量測序、基因組學等相關生物技術的發(fā)展,已在植物中發(fā)現(xiàn)許多受鹽脅迫誘導的轉錄因子家族,如DREB、ERF、WRKY、MYB、bZIP及Alfin-like(AL)等。其中AL家族為植物同源域(PHD)鋅指蛋白的重要成員,參與種子萌發(fā)、生殖生長、果實成熟及維持植物細胞水分穩(wěn)態(tài)等多種生物過程。
一般而言,植物體中的AL蛋白主要存在3個特征結構域:由130個氨基酸殘基組成的N端保守結構域(Alfin結構域),由50個氨基酸殘基組成的C端保守PHD鋅指結構域(含有Cys4-His-Cys3鋅結合基序),以及這兩個結構域之間稱為V結構域的可變剪區(qū)。PHD鋅指蛋白是典型的環(huán)指蛋白,因此具有E3連接酶活性;此外,有證據(jù)表明PHD鋅指結構域參與介導染色質的形成與功能調節(jié)。如:AtAL5通過介導染色質動力學參與擬南芥幼苗在暗反應過程中對茉莉酸(JA)的響應。在大豆中,Alfin蛋白GmPHD6可以與除GmPHD2之外的其他GmPHDs形成同源二聚體或異源二聚體,共同發(fā)揮作用。在擬南芥中,Alfin-like蛋白是典型的核蛋白,除AtAL6外的所有AL成員均可與富含G堿基(GTGGNG或GNGGTG)的元素結合,形成強復合物,抑制多種負調控因子,從而影響擬南芥非生物脅迫耐受性;進一步的氨基酸序列分析表明,AtAL6的DNA無法與富含G的元素形成復合物是由第34、35位兩個C殘基發(fā)生變異引起的。
AL家族是植物耐鹽性調控的主要轉錄因子家族之一。在紫花苜蓿(Medicago sativa L.)中,Alfin-likel不僅可以促進根系生長,還可以在鹽堿條件下通過序列特異性方式結合DNA來上調根系中鹽誘導型MsAL2基因的表達。在線果芥(Conringia planisiliqua)中,CpAL2在提高其耐鹽耐旱性中發(fā)揮著重要作用。
王族海棠(Malus doumeri‘Royalty’)為薔薇科蘋果屬(Malus)落葉喬木,樹姿優(yōu)美,樹形高貴典雅,果實富含類黃酮、多酚及氨基酸等生物活性物質,是集觀葉、觀花及用果于一體的景觀經(jīng)濟樹種。包括王族海棠在內的絕大多數(shù)海棠品種雖耐旱、耐寒、耐瘠薄,但耐鹽性較弱,對土壤中鹽含量敏感性強。本研究對王族海棠AL家族基因進行了全基因組鑒定,并系統(tǒng)分析其進化關系、結構特征和啟動子區(qū)順式作用元件,檢測其在不同器官中的轉錄譜,分析其在鹽脅迫下的表達情況,以期為未來王族海棠的基因工程改良提供理論支持。
1材料與方法
1.1試驗材料及處理方法
供試王族海棠(Malus doumeri‘Royalty’)種子及植株均由江蘇長景園林有限公司提供。試驗于2022年2—10月開展。分別于王族海棠種子、幼苗、根、莖、葉、花、100daa果實(花后100天的果實)、成熟期果實共8個階段取樣,采用TAE緩沖液沖洗后液氮速凍,-80℃保存,用于分析基因表達的組織特異性。
鹽脅迫試驗在常州大學園藝培養(yǎng)室中進行:將王族海堂種子播于海棠專用育苗基質中,于培養(yǎng)第60天用200 mL 150 mmol/L NaCl溶液進行鹽脅迫(SS)處理,對照(CK)則澆灌相應體積的蒸餾水,并分別在處理0、3、6、12、24 h取樣,采用TAE緩沖液小心沖洗后于-80℃保存,用于qRT-PCR分析。
1.2王族海棠AL家族基因的全基因組分析
1.2.1王族海棠AL家族基因成員的鑒定及蛋白理化性質分析為了鑒定王族海棠中潛在的AL蛋白序列,在Phytozome數(shù)據(jù)庫(https://phyto-zome.jgi.doe.gov/pz/portal.html)中下載所有的王族海棠ALs,然后基于擬南芥(Arabidopsis thali-ana)和水稻(Oryza sativa L.)的AL蛋白序列進行BLAST搜索(E值-5),擬南芥和水稻的AL蛋白序列通過搜索NCBI數(shù)據(jù)庫下載。使用簡單模塊化架構研究工具數(shù)據(jù)庫(http://smart.embl-hei-delberg.de/)檢查候選序列,以鑒定包含Alfn結構域(DUF3594)和PHD鋅指基序的保守AL蛋白序列,從而獲得非冗余的AL家族基因,并命名為MdALs。
采用ExPASy工具(https://web.expasy.org/protparam/)分析推定的MdALs蛋白序列長度、分子量及等電點(pI);采用NCBI的開放閱讀框(ORF)工具(http://www. ncbi.nlm.nih.gov/gorf/gorf.html)確定ORF的長度。
1.2.2王族海棠AL家族成員的系統(tǒng)發(fā)育分析為了比較來自不同物種的AL基因的系統(tǒng)發(fā)育關系,使用序列對比分析軟件ClustalX對擬南芥、水稻、玉米、紫花苜蓿和王族海棠的AL基因進行多序列比對。紫花苜蓿和玉米的Alfin1蛋白序列分別從NC-BI數(shù)據(jù)庫中獲取。利用MEGA 7.0軟件采用鄰接法(NJ)構建AL蛋白的系統(tǒng)發(fā)育樹,并用1000次重復測定bootstrap檢驗發(fā)育樹的可靠性。
1.2.3 MdALs基因結構、上游序列分析、染色體定位及蛋白相互作用網(wǎng)絡分析采用基因結構顯示服務器GSDS(http://gsds.gao-lab.org/)獲得王族海棠AL家族成員的內含子-外顯子特征。從海棠基因組數(shù)據(jù)庫(https://iris.angers.inra.fr/gd-dh13/)下載起始密碼子(ATG)前端1500 bp上游基因組DNA序列,采用PlantCARE數(shù)據(jù)庫(ht-tp://bioinformatics.psb.ugent.be/webtools/plant-care/html/)分析MdALs啟動子序列中的順式元件。采用Mapinspect軟件(http://www. plant-breeding.wur.nl/uk/software_mapinspect.html)繪制MdALs的染色體遺傳圖譜。基于STRING數(shù)據(jù)庫(https://string-db.org/cgi/network)測定MdALs的氨基酸序列以預測可行的相互作用蛋白網(wǎng)絡。
1.2.4 MdALs的基因復制事件、異義替換/同義替換比值(Ka/Ks)的計算通過NCBI的BLAST窗口(http://www.ncbi.nlm.nih.gov/BLAST/)進行序列比對以識別重復基因,其中候選基因的相似性和覆蓋率需gt;80%。在遺傳學中,異義替換與同義替換的比值(Ka/Ks)可用于闡明選擇壓力是否有助于解釋宏觀進化模式,用EMBL-EBI中的ClustalW2平臺(http://www.ebi.ac.uk/Tools/msa/clustalw2/)預測旁系同源物,接著基于PAL2NAL(http://www.bork.embl.de/pa12nal/)計算Ka/Ks值,以檢測選擇模式并用于計算復制事件的大致時間;Ka/Ks值gt;1、lt;1、=1分別表示正選擇、純化選擇和中性選擇,基因對的進化時間計算方法參照Li等的方法。
1.3王族海棠RNA提取、轉錄分析及qRT-PCR分析
1.3.1 RNA提取 將王族海棠樣品(250 mg)用液氮快速研磨,按照Trizol總RNA提取試劑盒相關說明提取總RNA,采用NanoDrop 2000紫外分光光度計檢測RNA濃度,采用1.8%瓊脂糖凝膠電泳檢測RNA質量。
1.3.2MdALs基因轉錄組數(shù)據(jù)的獲取與表達分析利用MdALs的氨基酸序列在植物基因組數(shù)據(jù)庫(https://ftp.ncbi.nlm.nih.gov/genomes/pz.portal.html#)下載獲得其轉錄組數(shù)據(jù),將下載文件的格式轉換為fastq格式,再通過Trim Galore軟件(http://www. bioinformatics.babraham.ac.uk/pro- jects/trim_galore/)進行質控。獲得的clean reads序列用RNA-seq數(shù)據(jù)量化軟件kallisto進行定量,通過TBtools(https://github.com/CJ-Chen/TBtools)進行Heatmap可視化。
1.3.3MdALs的qRT-PCR分析 基于轉錄組分析結果選取王族海棠高表達Md ALs的組織樣品提取RNA,采用PrimeScripTM RT Reagent Kit withgDNA Eraser逆轉錄試劑盒將RNA逆轉錄為cD-NA,并采用無菌水將cDNA稀釋100倍作為后續(xù)實時熒光定量分析(qRT-PCR)的模板。采用Premier 5.0軟件設計引物(表1),以Actin作為內參基因。qRT-PCR的擴增體系、擴增程序參照文獻,使用Light Cycler 96 Instrument熒光定量PCR儀進行PCR分析,采用斷層掃描法(2-ΔΔCt)計算目標基因的表達量。
1.4數(shù)據(jù)處理與統(tǒng)計分析
采用Microsoft Excel 2013進行數(shù)據(jù)整理,采用相應在線繪圖工具、R軟件及Origin 10軟件進行相關圖形的繪制。
2結果與分析
2.1 王族海棠AL家族基因的鑒定及特征分析
基于王族海棠的保守Alfin結構域和PHD鋅指基序進行BLAST搜索,共鑒定出11個MdALs基因,ORF長度在711~1680 bp之間,根據(jù)在1-17號染色體上的位置分別將其命名為MdAL1—MdAL11(表2)。MdALs蛋白序列長度為231~559個氨基酸(aa),pl從5.11(MdAL8)到6.96(MdAL9);MdAL1分子量最低,為26.76 kDa,MdAL9分子量最高,為63.65 kDa。
2.2 MdALs的系統(tǒng)發(fā)育分析
為了分析來自不同物種的AL家族基因的系統(tǒng)發(fā)育關系,利用鄰接法基于王族海棠(11個)、玉米(18個)、水稻(9個)、擬南芥(7個)的AL蛋白及紫花苜蓿Alfn1全長序列構建了系統(tǒng)發(fā)育樹(圖1)??芍?,46個Alfn蛋白可分為Ⅰ、Ⅱ和Ⅲ三組,分別有16、14個和16個成員。其中,MdALs僅分布在Ⅰ組和Ⅱ組中,分別包括5個和6個MdALs成員;Ⅰ組中的5個成員與AtAL1和AtAL2關系較近,Ⅱ組中的MdAL5和MdAL11與AtAL6、AtAL7和紫花苜蓿的Alfin1關系較近,而其余4個成員與AtAL4關系較近。ZmALs和Os-ALs主要分布在Ⅲ組中,分別有11個和5個成員,僅各有1個成員分布在Ⅱ組,另分別有6個和3個成員分布在Ⅰ組;擬南芥的AtAL3、AtAIA、AtAL5、AtAL6和AtAL7均存在于組Ⅱ中,AtAL1和AtAL2則存在于組Ⅰ中。
2.3MdALs基因的結構和序列比對分析
由圖2A可知,MdALs含有4~10個內含子,其中,MdAL1、MdAL2、NdAL3、MdAL4昶MdAL6均有4個內含子,Md AL5和MdAL10均有6個內含子,MdAL8和MdAL11有5個內含子,MdAL7有8個內含子,而MdAL9有10個內含子,是內含子數(shù)量最多的成員。多序列比對結果(圖2B)表明,MdALs的N端和C端分別存在高度保守的Alfin結構域和PHD鋅指基序。
2.4MdALs啟動子區(qū)的順式作用元件分析
對起始密碼子(ATG)前端的MdALs家族上游啟動子區(qū)域分析的結果(圖3)表明,共預測到23類順式作用元件,富含MBS、LTR、TC的重復序列和ARE元件,分別與干旱誘導、低溫響應、防御和脅迫響應以及厭氧誘導相關;同時包含分生組織表達元件(CAT-box),表明MdALs基因積極響應脅迫環(huán)境;此外,還包含與調節(jié)植物生長發(fā)育相關的激素順式作用元件,例如參與茉莉酸甲酯(Me-JA)響應的CGTCA基序,與赤霉素響應相關的P-box以及水楊酸響應所需的TCA元件。
2.5MdALs的染色體定位、同線性分析和基因復制事件分析
2.5.1Md ALs的染色體定位、同線性分析 通過MapChart工具進行染色體連鎖定位分析,結果(圖4A)表明,11個MdALs基因定位在1、4、8、10、13、15號染色體上,其中,1、4、15號染色體均包含2個成員,8、10、13分別包含1、1、3個成員;從染色體中的基因復制事件來看,除同一連鎖位置的串聯(lián)重復基因(MdAL1/MdAL2、MdAL3/MdAL4、MdAL7/MdAL8/MdAL9)外,不同染色體中還有4個片段重復基因(MdAL1/MdAL3、MdAL2/MdAL3、MdAL4/MdAL9、MdAL6/MdAL7)。
通過比較分析王族海棠、水稻、玉米和擬南芥AL家族基因的結構構建同線性圖以剖析不同物種AL基因間的關系,由結果(圖4B)可知,共鑒定出41對同源基因,其中,王族海棠與擬南芥的同源基因共14對,王族海棠與水稻的同源基因共10對,王族海棠與玉米的同源基因共17對。此外,檢測到與MdAL1基因相關的同源基因呈現(xiàn)一對多(12個)的共線性,表明MdAL1與擬南芥、水稻和玉米AL家族基因的相關性高于其他家族成員。
2.5.2MdALs的基因復制事件分析 重復的MdALs基因的進化時間采用異義替換(Ks)作為時間代表加以估計,由表3可知,5對旁系同源基因的復制時間大約發(fā)生在過去11萬~1152萬年。5個基因對的Ka/Ks值均lt;1,表明MdALs基因對是在強烈的負選擇或純化選擇壓力下進化的,其中純化選擇對于MdALs基因的功能差異至關重要。
2.6 MdALs基因在王族海棠不同組織中的轉錄表達譜
通過搜索相應的微陣列數(shù)據(jù)檢測了王族海棠8個主要器官或組織(種子、幼苗、根、莖、葉、花、100daa果實、成熟果實)中11個MdALs成員的表達水平,結果(圖5)表明,除MdAL5、MdAL10、MdAL11外,其他MdALs成員在種子、幼苗、根及莖中的表達水平均較低;除MdAL10、MdAL11外,其他MdALs成員在成熟果實中的表達水平皆高于其他組織,尤其MdAL2、MdAL3、MdAL4、MdAL7、MdAL8、MdAL9。
2.7MdALs表達響應鹽脅迫的qRT-PCR分析
如圖6所示,無論有無鹽脅迫,處理0h的MdALs基因表達水平均較低;CK處理下,MdAL2、MdAL3、MdAL6及MdAL7表達水平隨著處理時間的延長,呈升-降-升的變化趨勢,其中MdAL6的表達在處理6h達到最高水平,是Oh的22倍。MdAL5、MdAL9及MdAL11表達水平隨著處理時間的延長,呈降-升-降的變化趨勢。
鹽脅迫處理(SS)下,MdAL3和MdAL6的表達水平分別在處理6h和12h較高:MdAL4的表達水平隨著NaCl處理時間的延長呈增加趨勢,在12、24 h處于最高水平,是0h表達量的近10倍;MdAL11在鹽處理3h時達到最高,之后表達量逐漸下降;MdAL8、MdAL1、MdAL10、MdAL9、MdAL2和MdAL7的表達水平在各時間段的波動均較小。這些結果表明主要是MdAL3、MdAL4、MdAL6參與了對鹽脅迫的響應,尤其MdAL4。
3討論與結論
AL轉錄因子是雙結構域蛋白,在N端具有Alfin結構域,在C端具有PHD鋅指結構域,參與植物對脅迫的響應和/或耐受性。本研究基于擬南芥和水稻的AL蛋白序列,對王族海棠的保守Alfn結構域和PHD鋅指基序進行BLAST搜索,共鑒定出11個MdALs基因,其編碼蛋白皆為酸性蛋白,序列長度為231~559aa,分子量為26.76~63.65 kDa。開放閱讀框(ORF)是基因序列的一部分,在DNA序列中具有編碼蛋白質潛能,是指從起始密碼子開始至終止密碼子結束的連續(xù)堿基序列;一般而言,ORF越長往往越容易發(fā)生解離。本研究中,MdALs基因的ORF長度在711~1680bp范圍變化,有些成員間的ORF長度差距較大,這意味著其響應環(huán)境變化的敏感度存在較大差異。
本研究基于鄰接法構建的系統(tǒng)發(fā)育關系表明,王族海棠、玉米、水稻、擬南芥的45個AL蛋白及紫花苜蓿的Alfinl蛋白可分為三組,MdALs蛋白集中于Ⅰ組和Ⅱ組中,Ⅲ組中沒有MdALs蛋白,這可能是王族海棠在進化過程中AL蛋白的堿基發(fā)生突變的緣故。此外,外顯子一內含子結構分析表明,MdALs的內含子數(shù)皆不超過10個,大多數(shù)為4~6個內含子,這與線果芥CpALs基因的結構特征趨于一致。內含子特征與基因進化有關,更多和更長的內含子往往存在于高表達的基因中,而內含子數(shù)量差異較小表明家族成員間的功能穩(wěn)定性較佳。啟動子順式作用元件分析結果表明,MdALs基因啟動子區(qū)富含MBS、LTR、TC的重復序列和ARE元件,這與在葡萄(Vitis vinifera L.)中的研究結果基本一致,但VvAL家族沒有響應MejA的TGACG基序,這可能是不同植物的N端結構域存在差異的緣故。
進化是植物適應環(huán)境變化的必然選擇,植物單體基因的共同進化往往發(fā)生在具有兩個以上結構域的蛋白質家族成員中。本研究結果表明,MdALs在PHD鋅指結構域和Alfin結構域的分布位置表現(xiàn)出高度保守的氨基酸序列,這意味著兩個結構域的進化過程具有相似性?;虻膹椭?、轉移和丟失是促進基因家族成員功能進化的主要驅動力。在胡椒和馬鈴薯中,PHD鋅指基因通過基因復制,包括轉座子復制、片段復制和串聯(lián)復制以誘導進化。本研究結果表明,重復事件基因對(MdAL1/MdAL3、MdAL2/MdAL3、MdAL4/MdAL9、MdAL6/MdAL7)對王族海棠的進化起著至關重要的作用,其復制時間大約發(fā)生在11萬~1152萬年。這與琴葉擬南芥(Arabidopsis lyrata)、擬南芥(Arabidopsis thaliana)和鹽芥(Thellungiella halophila)中AL蛋白家族的重復事件相似。
AL轉錄因子蛋白的特異性結合狀態(tài)及功能形式是決定其調節(jié)能力的基本表征。本研究結果表明,MdALs成員主要在王族海棠發(fā)育后期的果實中表達,尤其表現(xiàn)在MdAL2、MdAL3、MdAL4、MdAL7、MdAL8及MdAL9。前人研究表明,紫花苜蓿Alfin1主要在根中高表達,而在其他營養(yǎng)器官中低表達或不表達;大豆GmPHDs在子葉、莖中的表達相對較高,而在根中和種子萌芽期表達較低。這種表達模式的差異取決于不同植物AL蛋白的功能多樣化。鹽脅迫是影響土壤可持續(xù)化及植物發(fā)育代謝的典型非生物威脅之一,鹽脅迫會誘導活性氧等氧化產物累積,引起膜脂過氧化。基于實時熒光定量分析表明,與0h相比,鹽脅迫后期MdAL3、MdAL4、MdAL6表達水平升高,尤其MdAL4,其表達水平隨著鹽脅迫時間的延長整體呈增加趨勢。
綜上表明,王族海棠AL轉錄因子家族與植物激素和非生物脅迫密切相關,尤其是MdAL4基因強烈響應鹽脅迫。本研究結果可為揭示MdALs的進化和生理功能提供理論依據(jù),也為王族海棠的基因工程改良提供潛在靶點。