鄭 曄,趙義勇,吳麗華,林 娟
(復(fù)旦大學(xué) 生命科學(xué)學(xué)院 植物科學(xué)研究所,上海 200438)
異源多倍化事件是物種形成的一個重要方式,是一種通過雜交產(chǎn)生雜合體,經(jīng)過地理隔離繼而達(dá)到生殖隔離的物種形成過程[1-2].目前普遍認(rèn)為雜交形成的兩個亞基因組間的相互干擾會對生物的生長發(fā)育造成一系列負(fù)面影響[3],但是也有一些異源多倍體生物成功存活并且表現(xiàn)出一系列超越親本的優(yōu)良品質(zhì)[4].四倍體薺菜(Capsellabursa-pastoris)是兩個二倍體薺菜(Capsellarubella或Capsellagrandiflora)的共同祖先和Capsellaorientalis通過雜交和基因漸滲作用于近期(100~300kya)形成的異源多倍體,是全球分布最廣的物種之一[5-6].二倍體薺菜C.grandiflora和C.orientalis曾出現(xiàn)過分布區(qū)域重合[5],并在多個地理區(qū)域發(fā)生了雜交和多倍化事件,從而形成了四倍體薺菜(C.bursa-pastoris)[4].四倍體薺菜在亞洲、歐洲和非洲均有分布,而四倍體薺菜的祖先親本二倍體薺菜分布范圍則呈現(xiàn)明顯的局限性: 祖先親本C.rubella目前主要分布在地中海及歐洲中部地區(qū),C.grandiflora分布在阿爾巴尼亞及希臘西北部,C.orientalis目前主要分布在東歐以及亞洲中部地區(qū).隨著人類的農(nóng)耕活動和遷徙,C.grandiflora和C.orientalis逐漸發(fā)生了地理隔離,在約73kya年前,C.grandiflora支系的最近共同祖先發(fā)生分化并逐步演變形成了現(xiàn)在的C.grandiflora和C.rubella[7].已有研究證明四倍體薺菜在演化過程中未發(fā)生大規(guī)模的基因丟失事件,其來自于父本和母本祖先的兩個亞基因組獨(dú)立進(jìn)化,且沒有出現(xiàn)亞基因組間的重組.這兩個亞基因組在基因數(shù)量和表達(dá)譜上具有高度一致性[5,8-9].目前檢測到的四倍體薺菜基因的功能性突變均繼承自其二倍體親本祖先,四倍體薺菜基因組中有害單核苷酸多態(tài)性突變(deleterious SNPs)同樣也在其二倍體親本祖先的基因組中存在[5,8].轉(zhuǎn)錄組研究發(fā)現(xiàn)四倍體薺菜的兩個亞基因組間的差異表達(dá)基因非常有限,差異表達(dá)基因的功能主要與脅迫響應(yīng)相關(guān)[8].
溫度是植物生長發(fā)育的必要條件,也是植物繁殖的必需條件之一[10].植物對低溫的適應(yīng)主要是通過冷信號引起的一系列基因表達(dá)變化完成的,這些基因能在短時間內(nèi)影響植物細(xì)胞的生理狀態(tài),對植物抗冷起到重要作用[11].植物低溫應(yīng)答是一個復(fù)雜的應(yīng)激過程,涉及低溫信號的感應(yīng)受體、轉(zhuǎn)導(dǎo)途徑、轉(zhuǎn)導(dǎo)途徑中的轉(zhuǎn)錄因子和一系列效應(yīng)蛋白等[12].離子轉(zhuǎn)運(yùn)蛋白是一類膜蛋白,具有維持細(xì)胞內(nèi)穩(wěn)態(tài)、促成胞質(zhì)Ca2+信號轉(zhuǎn)導(dǎo)的功能,而這兩項功能都在植物應(yīng)對環(huán)境脅迫過程中具有重要意義[13-15].擬南芥基因組中約有3%的基因編碼轉(zhuǎn)運(yùn)蛋白,其中大量為由質(zhì)子梯度和膜電勢供能的二級轉(zhuǎn)運(yùn)蛋白[16].Ca2+/陽離子逆轉(zhuǎn)運(yùn)蛋白超家族CaCAs是植物內(nèi)環(huán)境Ca2+循環(huán)系統(tǒng)的主要成員,通常是借助Na+、K+、H+等的電化學(xué)梯度供能,實現(xiàn)逆濃度梯度Ca2+的跨膜轉(zhuǎn)運(yùn).所有CaCAs至少有一個Na_Ca_ex(PfamID: PF01699)保守結(jié)構(gòu)域,且蛋白質(zhì)拓?fù)浣Y(jié)構(gòu)較為保守[17],平均10個跨膜螺旋結(jié)構(gòu)(TM helices)組成一個Ca2+轉(zhuǎn)運(yùn)通道,在TM helices的2~3和7~8位是兩個保守的α重復(fù)序列(α-repeats)[18].CaCAs廣泛存在于古生菌、細(xì)菌、真菌和植物中,并呈現(xiàn)出不斷擴(kuò)張的趨勢[17].植物CaCAs主要有4個轉(zhuǎn)運(yùn)蛋白家族: H+/陽離子轉(zhuǎn)運(yùn)蛋白(CAX)、陽離子/Ca2+轉(zhuǎn)運(yùn)蛋白(CCX)、陽離子/Mg2+轉(zhuǎn)運(yùn)蛋白(MHX)和EF-hand特征結(jié)構(gòu)蛋白(NCL)[17].有關(guān)植物CaCAs的研究主要針對部分高等植物的CaCAs成員展開,研究顯示植物CaCAs在冷脅迫響應(yīng)、鹽脅迫響應(yīng)、胞質(zhì)pH調(diào)節(jié)以及激素轉(zhuǎn)導(dǎo)等生理過程中均發(fā)揮功能,在植物對多種環(huán)境的適應(yīng)中發(fā)揮了不同的作用[19-20],轉(zhuǎn)入CbCAX51基因的煙草表現(xiàn)出更強(qiáng)的抗冷性[21].
四倍體薺菜的廣泛分布與其多樣化的逆境適應(yīng)能力密切相關(guān).作為跨緯度分布較廣的物種,其對溫度變化的適應(yīng)性至關(guān)重要;而CaCAs作為植物應(yīng)對多種非生物脅迫的重要成員,其在薺菜中的分布和功能還幾乎沒有報道.本研究利用3種薺菜的基因組測序數(shù)據(jù),在基因組層面分析了四倍體薺菜及其兩種二倍體薺菜C.rubella和C.grandiflora的CaCA家族,從基因家族各成員的系統(tǒng)發(fā)育關(guān)系、拷貝數(shù)差異、序列結(jié)構(gòu)差異以及直系同源基因在低溫應(yīng)答中的表達(dá)譜來探討基因家族拷貝數(shù)的變異對四倍體薺菜環(huán)境適應(yīng)性的貢獻(xiàn),該研究為進(jìn)一步探究四倍體薺菜的物種形成、基因組進(jìn)化、比較基因組學(xué)以及CaCAs超家族在逆境響應(yīng)等方面的功能提供了有益的參考.
擬南芥(Arabidopsisthaliana)、二倍體薺菜(Capsellarubella和Capsellagrandiflora)的基因組和蛋白質(zhì)序列數(shù)據(jù)均來自phytozome v12.1數(shù)據(jù)庫(https: ∥phytozome.jgi.doe.gov/pz/portal.html),四倍體薺菜(Capsellabursa-pastoris)的基因組序列來自Kasianov等在線發(fā)表的全基因組拼接數(shù)據(jù)(http: ∥capsella.org/)[8].二倍體薺菜(C.rubella)RNA-seq數(shù)據(jù)來自NCBI網(wǎng)站的SRR3993759、SRR3993756、SRR3993757、SRR1944439和SRR1944438數(shù)據(jù)包;二倍體薺菜(C.grandiflora)RNA-seq數(shù)據(jù)來自NCBI網(wǎng)站SRA數(shù)據(jù)庫中SRR797566、SRR797553、SRR1944440和SRR1944441數(shù)據(jù)集;四倍體薺菜(C.bursa-pastoris)RNA-seq數(shù)據(jù)來自NCBI網(wǎng)站SRA數(shù)據(jù)庫中SRR5387477、SRR5387479、SRR5387449、SRR5387451、SRR5387473和SRR5387475數(shù)據(jù)集.
由于薺菜全基因組測序結(jié)果中基因沒有完整的注釋,為方便后續(xù)分析,作者根據(jù)基因家族進(jìn)化樹中的親緣關(guān)系將二倍體薺菜的基因名稱和其直系同源的AtCaCAs基因名稱進(jìn)行了統(tǒng)一命名.此外,根據(jù)Kasianov等對C.bursa-pastoris中成對出現(xiàn)的基因與其祖先親本C.rubella和C.orientalis的同源性匹配結(jié)果[8],將四倍體薺菜中與同一個AtCaCAs基因同源的一對基因進(jìn)行了祖先親本的匹配,來自C.rubella親本的基因以“r”標(biāo)注,來自C.orientalis基因以“o”標(biāo)注,詳見表1.
表1 四倍體薺菜CaCAs基因原始注釋名與簡化名對應(yīng)表Tab.1 Correspondence table between the original annotated name and simplified name of C.bursa-pastoris CaCAs genes
(續(xù)表)
擬南芥哥倫比亞野生型(Col-0)種子購自Tair網(wǎng)站(http: ∥www.arabidopsis.org),四倍體薺菜(C.bursa-pastoris)種子來自中國科學(xué)院植物學(xué)研究所郭亞龍研究員實驗室饋贈.
將生長6周的擬南芥和薺菜植株置于4℃冷馴化3d后在-5℃進(jìn)行1h冷凍處理,隨后放回22℃培養(yǎng)箱繼續(xù)培養(yǎng),觀察并統(tǒng)計植物的存活率.
1.3.1 CaCA家族序列的獲取和鑒定
擬南芥基因組和蛋白質(zhì)序列根據(jù)Pittman等于2016年發(fā)表的擬南芥AtCaCAs序列在phytozome v12.1數(shù)據(jù)庫通過“Keyword Search”獲得[20];二倍體薺菜(C.rubella和C.grandiflora)的基因組和蛋白質(zhì)序列依據(jù)AtCaCAs序列在phytozome v12.1數(shù)據(jù)庫通過“Blast”獲得;四倍體薺菜的蛋白質(zhì)和基因組序列依據(jù)AtCaCAs序列比對Kasianov等在線發(fā)表的全基因組拼接數(shù)據(jù)獲得.獲得以上序列后,將全部序列輸入pFam數(shù)據(jù)庫進(jìn)行保守結(jié)構(gòu)域檢索,包含一個及以上Na_Ca_ex(PfamID: PF01699)保守結(jié)構(gòu)域的序列被最終確定為CaCA家族成員[22].
1.3.2 序列比對及分析
多序列蛋白比對在MAFFT網(wǎng)站(https: ∥mafft.cbrc.jp/alignment/server/)上在線完成[23-24],比對模型為E-INS-I.比對完成后使用BioEdit 7.1及Mega6[25]進(jìn)行序列手動調(diào)整.使用IQtree網(wǎng)站(http: ∥iqtree.cibiv.univie.ac.at)[26]進(jìn)行進(jìn)化樹構(gòu)建參數(shù)檢測,使用JTT+F+G4模型進(jìn)行進(jìn)化樹構(gòu)建.保守基序分析采用MEME軟件(http: ∥meme-suite.org)[27]完成.跨膜域分析采用TMHMM軟件(http: ∥www.cbs.dtu.dk/services/TMHMM/)[28]完成.基因染色體定位采用Mcanx軟件[29]完成.
1.3.3 轉(zhuǎn)錄組表達(dá)譜分析
轉(zhuǎn)錄組數(shù)據(jù)來自NCBI-SRA數(shù)據(jù)庫.使用Trimmomatic軟件對轉(zhuǎn)錄組進(jìn)行質(zhì)量與接頭的嚴(yán)格過濾,使所有reads錯誤率達(dá)到Q30(1‰)之下,用R軟件求得生物學(xué)重復(fù)樣本間的相關(guān)系數(shù),此外通過Hisat2軟件將reads回帖到參考基因組,用StringTie進(jìn)行進(jìn)行定量,計算得到FPKM值,采用Heatmapper軟件(http: ∥www2.heatmapper.ca/expression/)[30]繪制表達(dá)譜熱圖.
1.3.4 冷響應(yīng)基因的表達(dá)分析
將生長6周的擬南芥和薺菜植株置于4℃培養(yǎng)箱進(jìn)行冷處理,取樣時間分別為1h、3h、6h和12h.RNA抽提選用CWBIO公司的植物RNA提取試劑盒,cDNA的獲取使用TaKaRa公司反轉(zhuǎn)錄試劑盒,Realtime PCR擴(kuò)增使用TaKaRa公司TB GREEN試劑盒.CbpActin和AtActin分別為四倍體薺菜和擬南芥的內(nèi)參基因.Realtime PCR程序: 95℃(10min);95℃(15s);60℃(1min),40個循環(huán).根據(jù)程序?qū)С鯟T值數(shù)據(jù)利用2-ΔΔCT獲得相對表達(dá)量數(shù)據(jù),每個樣本3次生物性重復(fù).Realtime PCR擴(kuò)增基因?qū)?yīng)引物詳見表2.
表2 qRT-PCR引物表Tab.2 Primers used for qRT-PCR
以擬南芥CaCA家族成員的氨基酸序列為參考,從phytozome數(shù)據(jù)庫中鑒定到兩個二倍體薺菜C.rubella和C.grandiflora中各有12個CaCAs基因成員,從全基因組重測序數(shù)據(jù)[8]中鑒定到四倍體薺菜中有23個CaCAs基因成員.二倍體薺菜C.rubella中的CaCA蛋白家族稱為CrCaCAs、C.grandiflora中的稱為CgCaCAs、C.bursa-pastoris中的稱為CbpCaCAs.參照進(jìn)化樹上模式植物擬南芥的CaCAs成員的位置,將擬南芥、二倍體薺菜(C.rubella和C.grandiflora)以及四倍體薺菜中所有CaCAs成員分為4個基因簇,分別為CAX、CCX、NCL和MHX基因簇,代表4個亞家族.
表3 擬南芥和薺菜在CaCA各亞家族的拷貝數(shù)分布情況Tab.3 Copy number distribution of Arabidopsis andCapsella in CaCA subfamilies
兩個二倍體薺菜的基因拷貝數(shù)以及亞家族分布情況高度一致,CAX、CCX中各有5條序列,MHX和NCL中各有1條序列.四倍體薺菜中基因的拷貝數(shù)多于二倍體薺菜,在CAX中有10條序列,CCX中有9條序列,MHX和NCL中各有2條序列(表3).薺菜CaCAs基因的編碼蛋白與擬南芥CaCAs在保守結(jié)構(gòu)域的種類和排列上是相同的,均具有2個串聯(lián)的Na_Ca_ex保守結(jié)構(gòu)域(圖1).薺菜與擬南芥共同的保守基序分析結(jié)果顯示,同一亞家族共有一套保守基序,且保守基序的分布與CaCAs特征結(jié)構(gòu)域Na_Ca_ex的分布相對應(yīng).此外,CaCAs在N端和兩個保守結(jié)構(gòu)域的間隔區(qū)段均存在50bp到100bp長度的可變區(qū),除處于AtCAX2/AtCAX5/AtCAX6亞枝的序列在C端保守外,其余CaCAs成員均在C端也存在可變區(qū)(圖1(b),圖1(c)).
從薺菜CaCA各亞家族的分布情況可以看出,CrCaCAs相較于AtCaCAs在CAX家族中丟失了一個拷貝,在四倍體薺菜中CbpCaCA的拷貝數(shù)變化,并不是兩個二倍體薺菜的簡單加倍.為進(jìn)一步探究薺菜中CaCAs拷貝數(shù)的變化,作者選了十字花科近親楊柳科代表性物種毛果楊(Populustrichocarpa)、基部雙子葉植物耬斗菜(Aquilegiacoerulea)和基部被子植物無油樟(Amborellatrichopoda)做為陸生植物的代表性物種對薺菜CaCA家族進(jìn)行系統(tǒng)發(fā)育分析(圖2).
從圖2可以看出,與擬南芥相比3種薺菜在4個分支上都有拷貝數(shù)的變化,在AtCAX6分支上3種薺菜均丟失了一個拷貝,在AtCAX1和AtCCX3分枝上只有四倍體薺菜丟失了一個拷貝,在AtCAX5分枝也只有四倍體薺菜多了一個拷貝(表4),四倍體薺菜CaCAs基因在多個基因簇出現(xiàn)亞基因組基因的丟失或增加,
表4 薺菜CaCAs的拷貝數(shù)變異情況Tab.4 Copy number variation of theCaCAs in Capsella
這與四倍體薺菜兩套亞基因組在進(jìn)化上獨(dú)立的結(jié)論一致[8].參考毛果楊基因的位置,可以推測CbpCaCAs的拷貝數(shù)變異發(fā)生在十字花科祖先加倍時期[31],即AtCAX1、AtCAX5/AtCAX6和AtCCX3分枝中均出現(xiàn)了十字花科祖先加倍后拷貝丟失的現(xiàn)象.鑒于四倍體薺菜形成時期較短且基因數(shù)量保守性較高,CbpCaCAs 13個亞枝中有4個亞枝出現(xiàn)拷貝數(shù)變異(3個隸屬于CAX亞家族,1個隸屬于CCX亞家族),推測CaCAs在四倍體薺菜中可能扮演了與環(huán)境適應(yīng)有關(guān)的重要角色.
對薺菜和擬南芥全部CaCAs序列的保守基序的分析主要呈現(xiàn)了各亞家族內(nèi)序列的保守性,但不足以顯示序列間可能存在的分化情況.進(jìn)一步分析薺菜中具有拷貝數(shù)變異的基因在保守基序和跨膜域結(jié)構(gòu)上的變化,對拷貝數(shù)差異分支單獨(dú)進(jìn)行了保守基序分析,結(jié)果顯示,AtCAX1亞枝中并沒有出現(xiàn)四倍體薺菜特有的保守基序增加或缺失,而AtCAX5/AtCAX6分支中CbpCAX5a,CbpCAX5b和CbpCAX5c的N端“可變區(qū)”在四倍體薺菜種內(nèi)是高度保守的,該區(qū)域存在兩個特異于擬南芥及二倍體薺菜的同源保守基序(5號和7號).此外,該亞枝中的CbpCAX5c還缺失了一個其他同源序列共有的C端保守基序(4號)(圖3(b)).
通過序列聯(lián)配,發(fā)現(xiàn)在AtCAX5|AtCAX6基因簇中,5號基序是一段物種特異的插入序列,7號基序的增加是由在10號基序中插入的一段氨基酸序列造成的,4號基序的丟失是由一段12aa的片段丟失造成的(圖3(b)).而CCX3亞枝中,四倍體薺菜成員CbpCCX3不存在特異的基序,相較于其他同源序列,它存在N端可變區(qū)且丟失了兩個處于C端保守結(jié)構(gòu)域的基序(3號和6號)(圖3(c)),這兩個基序的丟失同樣也是由保守區(qū)段中氨基酸片段的插入或丟失導(dǎo)致的.此外,CbpCCX3特有一段N端非保守區(qū).可以看出,發(fā)生拷貝數(shù)變異的CbpCaCAs蛋白由于多處短氨基酸片段的插入或丟失導(dǎo)致了與直系同源基因中保守的基序的差異,這些氨基酸片段的插入或丟失可能與轉(zhuǎn)座事件有關(guān),暗示了四倍體薺菜亞基因組拷貝數(shù)變異可能與轉(zhuǎn)座子介導(dǎo)的基因片段的增加或丟失有關(guān).
CaCAs為多次跨膜的膜定位蛋白,膜蛋白N端的序列差異可能對蛋白質(zhì)結(jié)構(gòu)產(chǎn)生影響.在拷貝數(shù)變異的各個分枝中,CbpCaCA蛋白的跨膜域結(jié)構(gòu)也存在一定的變化.如AtCAX5/AtCAX6亞枝中,四倍體薺菜的3個拷貝在N端均為3個跨膜域,少于其同源序列的5個跨膜域,CbpCAX5c在C端只有3個跨膜域.CbpCAX5a,CbpCAX5b和CbpCAX5c和AtCCX3亞枝中的CbpCCX3在N端均存在一段較長的胞外域,但在其他同源序列中,N端肽段均定位在胞內(nèi).AtCAX1亞枝中,CbpCAX1在蛋白質(zhì)序列上并沒有發(fā)生分化,同樣地,在跨膜結(jié)構(gòu)上它也與其同源序列高度相似.對擬南芥CaCAs的研究表明,AtCAX家族蛋白質(zhì)的N端為一段信號肽[32],且AtCAX家族基因的表達(dá)受到N端區(qū)域的調(diào)控[33],CbpCaCA蛋白N端亞細(xì)胞定位的差異可能對其表達(dá)和信號響應(yīng)產(chǎn)生影響.
表5 發(fā)生拷貝數(shù)變異基因簇及其最近同源基因簇的理化性質(zhì)Tab.5 Physical and chemical properties of gene clades with copy number variation and their homologous gene clades
鑒于薺菜CaCAs存在蛋白質(zhì)序列和結(jié)構(gòu)上的差異,本論文對相應(yīng)蛋白質(zhì)的理化性質(zhì)進(jìn)行了預(yù)測.結(jié)果顯示,在氨基酸長度、分子量、等電點(diǎn)(pI)和平均親水系數(shù)(GRAVY)4項指標(biāo)上,在進(jìn)化樹中在同一個亞枝聚類的4個物種之間保守性較高,而不同亞枝之間存在明顯的理化性質(zhì)差異.在存在拷貝數(shù)變異的亞枝中,AtCAX5亞枝中的CbpCAX5a,CbpCAX5b和CbpCAX5c的氨基酸長度顯著長于其親本祖先,且其他指標(biāo)也存在明顯差異.而這3個拷貝內(nèi)部也存在分化,其中CbpCAX5a和CbpCAX5b的所有指標(biāo)均一致,而CbpCAX5c則呈現(xiàn)出更大的氨基酸長度、更高的等電點(diǎn)和更低的親水系數(shù).AtCCX3亞枝中僅有的一個CbpCCX3則更為特殊,它的氨基酸數(shù)目達(dá)942個,平均親水系數(shù)僅為0.121(表5).由此可以看出,CbpCaCAs中出現(xiàn)的拷貝數(shù)變異的基因簇成員在蛋白序列結(jié)構(gòu)和蛋白質(zhì)性質(zhì)上出現(xiàn)了不同程度的分化,這提示了發(fā)生拷貝數(shù)變異的基因簇可能存在表達(dá)和功能上的分化.
通過NCBI數(shù)據(jù)庫檢索,獲得了二倍體薺菜C.rubella與四倍體薺菜的組織表達(dá)轉(zhuǎn)錄組數(shù)據(jù)(圖5).與C.rubella在各個組織中的表達(dá)模式相比,CbpCaCA家族中與C.rubella同源的基因在組織表達(dá)上存在3種分化模式: 1) 與祖先親本表達(dá)模式一致,這類基因有CbpCAX1、CbpCAX2r、CbpCAX4r、CbpCAX5a、CbpCAX5b、CbpCAX5c和CbpCCX4r;2) 與祖先親本同為組成型表達(dá),但在各組織的表達(dá)分布出現(xiàn)差異,這類基因有CbpCAX3r、CbpNCLr、CbpCCX5r和CbpMHX1r;3) 在祖先親本中為組成型表達(dá),而在四倍體薺菜中為組織特異性表達(dá),這類基因有CbpCCX1r和CbpCCX2r.此外,雖然目前無法獲得拷貝數(shù)增加的AtCAX5基因簇中3個CbpCaCA成員(CbpCAX5a、CbpCAX5b、CbpCAX5c)和拷貝數(shù)減少的AtCAX1基因簇成員CbpCAX1、AtCCX3基因簇成員CbpCCX3與祖先親本的同源性關(guān)系,但作者通過組織表達(dá)數(shù)據(jù)發(fā)現(xiàn),CbpCAX5a、CbpCAX5b和CbpCAX5c與CrCAX5的組織表達(dá)模式相似,均為組成型表達(dá),且在花器官中表達(dá)量最高,在葉片中表達(dá)量最低.CbpCAX5a和CbpCAX5b的組織表達(dá)模式高度一致,與CbpCAX5c相比,CbpCAX5a和CbpCAX5b在各個組織表達(dá)量均偏低.CbpCAX1與CrCAX1的組織表達(dá)模式也非常相似,兩者均為組成型表達(dá),且在花器官和葉片中表達(dá)量較高.由此推測CbpCAX5a以及CbpCAX1是與C.rubella同源的拷貝.CbpCAX5a、CbpCAX5b可能來自C.orientalis.CbpCCX3與CrCCX3的表達(dá)模式存在明顯差異,CbpCCX3為組成型表達(dá),而CrCCX3僅在種子和花中表達(dá),目前無法判斷這種差異是同源基因的表達(dá)分化還是CbpCCX3繼承自C.orientalis親本導(dǎo)致的(圖5).可以看出,CbpCaCAs在組織表達(dá)上的分化較為普遍.在未出現(xiàn)拷貝數(shù)變異的9組基因中,僅CbpCAX2r、CbpCAX4r和CbpCCX4r繼承了祖先親本的表達(dá)模式,60%的基因發(fā)生了分化.此外,這種分化在四倍體薺菜的兩個亞基因組內(nèi)是非常保守的,即與親本C.orientalis同源的拷貝的組織表達(dá)模式與繼承自C.rubella的拷貝高度一致,這進(jìn)一步提示CaCAs在四倍體薺菜獲得勝過其祖先親本的環(huán)境適應(yīng)性能力方面具有重要功能.
為探究四倍體薺菜拷貝數(shù)變異基因與其環(huán)境適應(yīng)性之間的關(guān)系,檢測了四倍體薺菜與擬南芥的抗冷性差異.將擬南芥和四倍體薺菜正常生長4周的幼苗置于4℃冷馴化后在-5℃進(jìn)行冷凍處理,冷馴化后的擬南芥幼苗出現(xiàn)了葉片邊緣萎蔫,葉片顏色發(fā)紫等低溫?fù)p傷表型,而四倍體薺菜僅出現(xiàn)了葉片蜷曲的現(xiàn)象;冷凍處理后的擬南芥葉片為深綠色,且嚴(yán)重失水皺縮,薺菜葉片顏色輕微加深,但葉片沒有明顯的皺縮現(xiàn)象.在恢復(fù)22℃生長4d后,擬南芥已完全枯萎,而薺菜幼苗恢復(fù)正常生長,葉片顏色也恢復(fù)到嫩綠狀態(tài)(圖6(a)).存活率統(tǒng)計結(jié)果顯示,冷凍處理后薺菜存活率為48%,顯著高于擬南芥的9.8%(圖6(b)),薺菜的抗凍性顯著強(qiáng)于擬南芥.
將擬南芥和四倍體薺菜經(jīng)1、3、6、12h時間梯度4℃冷處理后,對四倍體薺菜拷貝數(shù)變異基因簇及其臨近基因簇中的擬南芥和四倍體薺菜CaCAs基因進(jìn)行了表達(dá)量檢測.結(jié)果顯示,擬南芥AtCAX1、AtCAX2、AtCAX3和AtCCX4均有不同程度的冷響應(yīng)表達(dá)上調(diào)情況,而四倍體薺菜中,僅有CbpCAX5a和CbpCAX5b在冷處理后上調(diào),且在處理1h后即達(dá)到峰值(圖6(d)),在擬南芥中的同源基因AtCAX5和AtCAX6均對冷處理沒有響應(yīng),CbpCaCAs與擬南芥相比,對冷刺激的響應(yīng)模式發(fā)生了明顯分化,AtCAX5亞枝中四倍體薺菜特異的拷貝數(shù)增加可能與其對冷響應(yīng)的表達(dá)分化有關(guān).
本研究對二倍體薺菜(C.rubella和C.grandiflora)以及四倍體薺菜(C.bursa-pastoris)的CaCA家族成員進(jìn)行了鑒定,并通過系統(tǒng)發(fā)育分析獲得了這3個薺菜物種的CaCAs成員在各個CaCAs亞家族的分布情況,以及與擬南芥CaCAs相比,薺菜CaCAs的拷貝數(shù)變化情況等.通過蛋白質(zhì)序列及結(jié)構(gòu)的分析,發(fā)現(xiàn)二倍體薺菜CaCAs在拷貝數(shù)分布、蛋白序列及結(jié)構(gòu)等方面均與擬南芥保持了較高的一致性;而四倍體薺菜的CaCAs則在多個基因簇中出現(xiàn)了拷貝數(shù)變異,且這些拷貝數(shù)變異基因簇中的CbpCaCAs基因在序列保守性和蛋白質(zhì)結(jié)構(gòu)等方面與其同源的擬南芥及二倍體薺菜基因相比均發(fā)生了明顯分化.在AtCAX1和AtCCX3亞枝中,CbpCaCAs各丟失了一個拷貝,在AtCAX5亞枝中,CbpCaCAs多出了一個拷貝,而與AtCAX5同源的AtCAX6亞枝則丟失了所有薺菜中的同源基因.由于四倍體薺菜的基因表達(dá)沉默、基因丟失及突變均繼承自其祖先親本,且存在亞基因組層面的傾向性[5],作者嘗試通過染色體定位分析以及基因的結(jié)構(gòu)和表達(dá)特征對拷貝數(shù)變異基因的來源進(jìn)行分析.結(jié)果顯示CbpCAX1在蛋白質(zhì)序列保守性、蛋白質(zhì)跨膜結(jié)構(gòu)、理化性質(zhì)和組織表達(dá)模式上均與CrCAX1一致,而CbpCCX3與CrCCX3相比,序列上出現(xiàn)了保守基序丟失,且N端肽段定位、蛋白質(zhì)理化性質(zhì)和組織表達(dá)模式均與CrCCX3不同,推測AtCAX1亞枝中與C.orientalis同源的拷貝發(fā)生了丟失,僅保留了與C.rubella同源的拷貝;而AtCCX3亞枝中,與C.rubella同源的拷貝發(fā)生了丟失,僅保留了與C.orientalis同源的拷貝,這可能與CAX1和CCX3基因在C.rubella和C.orientalis作為祖先親本時期不同程度的基因沉默及變異水平有關(guān).AtCAX5亞枝中CbpCaCAs的3個拷貝在組織表達(dá)上均與CrCAX5相似,CbpCAX5a與CbpCAX5b在序列、結(jié)構(gòu)和組織表達(dá)層面均十分相似,且與C.rubella中的同源基因CrCAX5存在明顯差異,而CbpCAX5c序列和結(jié)構(gòu)與CrCAX5明顯不同,且與CbpCAX5a和CbpCAX5b也存在差異.染色體定位表明CbpCAX5a,CbpCAX5b和CbpCAX5c均不存在串聯(lián)關(guān)系,以上結(jié)果使得AtCAX5亞枝中CbpCaCAs拷貝數(shù)變異的來源存在多種可能.鑒于scaffold水平的定位結(jié)果顯示CbpCAX5a和CbpCAX5c的距離較近(gtt注釋編號MPGU01000286.1;MPGU01000581.1),而CbpCAX5b(gtt注釋編號MPGU01006706.1)與CbpCAX5a和CbpCAX5c的距離較遠(yuǎn),推測CbpCAX5c是與C.rubella同源的拷貝,CbpCAX5b是與C.orientalis同源的拷貝,CbpCAX5a可能是CbpCAX5c自身加倍后保留的拷貝,這需要定位到染色體水平的序列拼接結(jié)果來支持.
組織表達(dá)數(shù)據(jù)表明,雖然CbpCaCAs亞基因組之間的表達(dá)是保守的,但與祖先親本相比,CbpCaCAs的同源基因在組織表達(dá)上的分化較為普遍.此外,Kasianov等通過轉(zhuǎn)錄組數(shù)據(jù)分析認(rèn)為四倍體薺菜在脅迫響應(yīng)上的表達(dá)與擬南芥基因具有很高的一致性,在冷響應(yīng)方面,在四倍體薺菜的1322個擬南芥COR家族同源基因中,99%的基因出現(xiàn)了上調(diào),且60%基因的表達(dá)與擬南芥同源基因一一對應(yīng)[8].本研究對四倍體薺菜和擬南芥CaCAs成員的冷響應(yīng)研究發(fā)現(xiàn),CaCAs在這兩個物種中對冷刺激的響應(yīng)出現(xiàn)了明顯分化: 在擬南芥中冷響應(yīng)上調(diào)的CAX1、CAX2、CAX3和CCX4基因在四倍體薺菜中均沒有響應(yīng),而擬南芥中對冷信號沒有響應(yīng)的CAX5基因則在四倍體薺菜中出現(xiàn)了應(yīng)激響應(yīng),這提示在四倍體薺菜中,CaCAs的逆境響應(yīng)模式發(fā)生了偏倚.
四倍體薺菜作為一個近期形成的物種,其受“親本繼承”模式以及松弛的進(jìn)化選擇影響[5],基因退化、丟失和表達(dá)分化現(xiàn)象均非常少見.本研究通過生物信息學(xué)和表達(dá)譜研究,發(fā)現(xiàn)CaCAs在四倍體薺菜中出現(xiàn)了較為特殊的拷貝數(shù)變異和表達(dá)分化,提示CaCAs可能在四倍體薺菜獲得環(huán)境適應(yīng)優(yōu)勢的過程中起到重要作用.此外,目前仍缺乏四倍體薺菜和其母本祖先C.orientalis的染色體水平全基因組測序數(shù)據(jù),以上數(shù)據(jù)的獲得將有助于深入分析CbpCaCAs的拷貝數(shù)變異來源,進(jìn)一步解釋四倍體薺菜的多倍化過程對其環(huán)境適應(yīng)性的影響.