張杰偉,秦新月,2,陳亞娟,劉 婧,3,崔進(jìn)榮,姚 磊*,魏建華*
(1.北京市農(nóng)林科學(xué)院北京農(nóng)業(yè)生物技術(shù)研究中心,農(nóng)業(yè)基因資源與生物技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100097;2.北京農(nóng)學(xué)院植物科學(xué)技術(shù)學(xué)院,北京 102206;3.內(nèi)蒙古師范大學(xué)生命科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古 呼和浩特 010022)
【研究意義】真核翻譯起始因子5A(eukaryotic translation initiation factor 5A, eIF5A)是一類普遍存在于真核生物細(xì)胞中、分子質(zhì)量為16~18 kDa的高度保守小分子蛋白質(zhì);是迄今為止發(fā)現(xiàn)的唯一含有羧腐胺賴氨酸(hypusine)殘基的蛋白質(zhì)[1-2]。Hypusine是由eIF5A蛋白翻譯后特定位置的賴氨酸在脫氧羧腐胺賴氨酸合酶(DHS)的和脫氧羧腐胺賴氨酸羥化酶(DOHH)的作用下形成的。eIF5A前體沒(méi)有活性,每個(gè)成熟eIF5A僅含有1個(gè)hypusine殘基, 該殘基是eIF5A 行使生物學(xué)功能所必需的[3]?!厩叭搜芯窟M(jìn)展】1976年,Kemper 等從兔子內(nèi)質(zhì)網(wǎng)膜上分離出eIF5A[4],生化分析表明eIF5A主要功能是促進(jìn)第一步甲硫氨酸的合成,故此認(rèn)為eIF5A在蛋白翻譯起始階段起重要作用[5]。植物eIF5A的研究起步較晚,2004年,Thompson等從模式植物擬南芥中分離出3個(gè)AteIF5A基因[6]。后續(xù)的研究表明AteIF5A1參與次生木質(zhì)部的形成,超量表達(dá)AteIF5A1的轉(zhuǎn)基因擬南芥木質(zhì)部增大[6-7]。AteIF5A2主要在受機(jī)械損傷的組織中高水平表達(dá),AteIF5A2能夠抑制伏馬毒素B1和黑暗引起的細(xì)胞凋亡[6, 8]。AteIF5A3主要在細(xì)胞分裂很活躍的種子中表達(dá),超量表達(dá)AteIF5A3的轉(zhuǎn)基因擬南芥葉子變?yōu)椴⑸~、種子變大、同時(shí)能夠響應(yīng)高鹽、干旱以及滲透等脅迫信號(hào)[6,9]。
由中國(guó)科學(xué)家主導(dǎo)(深圳華大基因研究院、張家口市農(nóng)業(yè)科學(xué)院)的谷子全基因組測(cè)序和美國(guó)科學(xué)家主導(dǎo)的谷子全基因組測(cè)序計(jì)劃的完成[10-11],為后續(xù)通過(guò)生物信息學(xué)挖掘、鑒定和分析谷子功能基因提供重要的基礎(chǔ)?!颈狙芯壳腥朦c(diǎn)】本研究從谷子基因組數(shù)據(jù)庫(kù)出發(fā),重點(diǎn)分析谷子eIF5A基因家族進(jìn)化關(guān)系、編碼蛋白的保守結(jié)構(gòu)域和磷酸化位點(diǎn)等,【擬解決的關(guān)鍵問(wèn)題】為進(jìn)一步研究谷子eIF5A 蛋白生物學(xué)功能以及其磷酸化修飾提供重要信息。
擬南芥(Arabidopsisthaliana)eIF5A基因及其推導(dǎo)的蛋白序列來(lái)自TAIR數(shù)據(jù)庫(kù)(http://www.arabidopsis.org);毛果楊(Populustrichocarpa)eIF5A基因及其推導(dǎo)的蛋白序列下載自phytozome 數(shù)據(jù)庫(kù)(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Ptrichocarpa);小家鼠(Musmusculus)、美洲黑楊(Populusdavidiana)和小麥(Triticumaestivum)eIF5A蛋白序列來(lái)自NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)。
分別以擬南芥AteIF5A1(AT1G13950)、AteIF5A2 (AT1G26630)、AteIF5A3(AT1G69410)、小麥TaeIF5A1(AAZ95171.1)、TaeIF5A2 (AAZ95172.1)和TaeIF5A3 (AAZ95173.1)蛋白序列為參比序列,利用phytozome 數(shù)據(jù)庫(kù)(谷子)中Blast 程序進(jìn)行BlastP檢索,檢索結(jié)果的全序列E值大于e-60的舍去,再利用美國(guó)國(guó)家生物技術(shù)信息中心提供的在線CDS(conserved domain search)程序(http://www.ncbi.nlm.nih.gov/cdd)預(yù)測(cè)這些蛋白有無(wú)DNA結(jié)合寡核苷酸結(jié)合結(jié)構(gòu)域,同時(shí)具有這兩個(gè)特征的蛋白序列屬于eIF5A基因家族。
對(duì)鑒定出的谷子eIF5A基因根據(jù)其預(yù)測(cè)編碼區(qū)序列和基因組序列進(jìn)行結(jié)構(gòu)分析,利用GSDS(http://gsds.cbi.pku.edu.cn/) 在線軟件進(jìn)行分析[12]。
利用Clustal X(2.0)[13]軟件對(duì)鑒定出所有谷子eIF5A蛋白、1個(gè)小家鼠eIF5A蛋白、3個(gè)擬南芥eIF5A蛋白[6]、4個(gè)毛果楊eIF5A蛋白[14]、4個(gè)美洲黑楊eIF5A蛋白[9]和3個(gè)小麥eIF5A蛋白[15]進(jìn)行多重序列比對(duì),使用MEGA 6.0[16]軟件,采用鄰接(neighbor-joining,NJ)算法構(gòu)建系統(tǒng)進(jìn)化樹(shù),進(jìn)行1000 次Bootstrap 抽樣。應(yīng)用在線軟件MEME(http://meme-suite.org/tools/meme)對(duì)上述eIF5A蛋白保守基序進(jìn)行分析[17]。參數(shù)設(shè)置如下:基序的最大發(fā)現(xiàn)數(shù)目是1個(gè),其它參數(shù)為程序默認(rèn)值。
利用NetPhos 3.1 Server在線軟件[18](http://www.cbs.dtu.dk)對(duì)鑒定出所有谷子eIF5A蛋白序列進(jìn)行磷酸化位點(diǎn)預(yù)測(cè),所有參數(shù)都選用程序默認(rèn)值。
分別以3個(gè)擬南芥eIF5A蛋白和3個(gè)小麥eIF5A蛋白序列為參比序列,利用phytozome 數(shù)據(jù)庫(kù)(谷子)提供的Blast P程序進(jìn)行檢索,共得到了4個(gè)谷子候選eIF5A基因。利用保守基序在線預(yù)測(cè)軟件MEME進(jìn)行驗(yàn)證保守結(jié)構(gòu)域(PF01287)的存在,初步確定了4個(gè)谷子eIF5A基因。谷子eIF5A基因分布在第2、3和9條染色體上,根據(jù)通用植物基因的命名方法,對(duì)鑒定到的4條eIF5A基因進(jìn)行了命名,并統(tǒng)計(jì)了它們對(duì)應(yīng)的轉(zhuǎn)錄本、別名、染色體定位、基因長(zhǎng)度以及對(duì)應(yīng)的推導(dǎo)蛋白長(zhǎng)度和內(nèi)含子個(gè)數(shù)等,他們推導(dǎo)的蛋白質(zhì)長(zhǎng)度從135個(gè)氨基酸到162個(gè)氨基酸不等(表1)。谷子eIF5A基因家族成員均含有4個(gè)內(nèi)含子,且內(nèi)含子的長(zhǎng)度遠(yuǎn)大于外顯子的長(zhǎng)度(圖1)。
利用在線軟件MEME對(duì)1個(gè)MmeIF5A1蛋白序列、3個(gè)AteIF5A蛋白序列、4個(gè)PtreIF5A蛋白序列、3個(gè)TaeIF5A蛋白序列、4個(gè)PdeIF5A蛋白序列和4個(gè)SieIF5A蛋白序列保守基序進(jìn)行分析,結(jié)果表明谷子eIF5A基因家族蛋白序列中均包含由基序1(相似度為6.5e-747)(圖2)。
利用進(jìn)化樹(shù)分析軟件MEGA 6.0 對(duì)4個(gè)谷子eIF5A蛋白、1個(gè)小家鼠eIF5A蛋白、3個(gè)擬南芥eIF5A蛋白、4個(gè)毛果楊eIF5A蛋白、4個(gè)美洲黑楊eIF5A蛋白和3個(gè)小麥eIF5A蛋白全蛋白序列進(jìn)行進(jìn)化分析。結(jié)果顯示:這19個(gè)eIF5A按照同源進(jìn)化關(guān)系可以分為3個(gè)亞家族,分別含有11、6和2個(gè)成員(圖3)。第Ⅰ亞家族由毛果楊、美洲黑楊和谷子共同組成;第Ⅱ亞家族由擬南芥和小麥組成,第Ⅲ亞家族中由小家鼠和谷子組成。谷子eIF5A基因家族分布于第Ⅰ和 Ⅲ亞家族中,其中毛果楊PtreIF5A1~PtreIF5A4、美洲黑楊PdeIF5A1~ PdeIF5A4和谷子SieIF5A2~SieIF5A4聚類于第Ⅰ亞家族;擬南芥AteIF5A1~AteIF5A3和小麥TaeIF5A1~TaeIF5A3聚類于第Ⅱ亞家族;小家鼠MmeIF5A1和谷子SieIF5A1聚類于第Ⅲ亞家族。利用歐洲生物信息研究所在線Clustal Omega程序?qū)?個(gè)毛果楊的蛋白序列進(jìn)行多重序列比對(duì),發(fā)現(xiàn)他們的氨基酸相似性在77.04 %~ 88.68 %,其中SieIF5A1 和SieIF5A3氨基酸序列的相似性最低達(dá)到 77.04 %,SieIF5A2 和SieIF5A4氨基酸序列的相似性最高達(dá)到 88.68 %(表2)。
表1 谷子eIF5A基因家族的基本特征
圖1 谷子eIF5A基因家族結(jié)構(gòu)分析Fig.1 Gene structure of eIF5A gene family in S.italica
圖2 eIF5A編碼蛋白保守基序分布Fig.2 Distribution of conserved motifs in eIF5A proteins
表2 谷子基因組中eIF5A蛋白氨基酸相似性分析
圖3 eIF5A蛋白進(jìn)化樹(shù)Fig.3 Phylogenetic tree for eIF5A proteins
圖4 谷子eIF5A蛋白磷酸化位點(diǎn)預(yù)測(cè)Fig.4 Phosphorylation site prediction of eIF5A proteins in S.italica
表3 谷子基因組中eIF5A蛋白磷酸化位點(diǎn)分析
利用在線軟件NetPhos 3.1 Serverl對(duì)4個(gè)谷子eIF5A蛋白進(jìn)行磷酸化位點(diǎn)預(yù)測(cè),結(jié)果顯示SieIF5A1~ SieIF5A 4蛋白中存在著12~19個(gè)絲氨酸、蘇氨酸及酪氨酸潛在磷酸化位點(diǎn),預(yù)測(cè)磷酸化位點(diǎn)主要是以絲氨酸的形式存在,其次是蘇氨酸,絡(luò)氨酸的磷酸化位點(diǎn)最少(表3)。預(yù)測(cè)SieIF5A1潛在磷酸化位點(diǎn)中存在10個(gè)絲氨酸、7個(gè)蘇氨酸和2個(gè)酪氨酸位點(diǎn)。SieIF5A2 潛在磷酸化位點(diǎn)中絲氨酸和蘇氨酸位點(diǎn)均為7個(gè),酪氨酸位點(diǎn)僅有1個(gè)(圖4)。
本研究鑒定谷子eIF5A基因家族含有4個(gè)成員,而已鑒定的擬南芥[6]、毛果楊[14]、美洲黑楊[9]和小麥[15]eIF5A基因家族分別含有3、4、4和3個(gè)成員,這說(shuō)明在植物進(jìn)化過(guò)程中,eIF5A基因可能經(jīng)歷了不斷發(fā)生譜系的特異擴(kuò)張和拷貝丟失。谷子eIF5A基因家族的4個(gè)成員均含有5個(gè)外顯子,均含有1個(gè)保守的DNA結(jié)合寡核苷酸結(jié)合結(jié)構(gòu)域(PF01287),這表明eIF5A基因家族的高度保守性,推測(cè)eIF5A蛋白在植物諸多生理過(guò)程中起著類似作用。不同植物中eIF5A基因家族含有的成員數(shù)目存在差異,推測(cè)不同植物的各成員在特定組織響應(yīng)低溫、干旱和高鹽等信號(hào)后精細(xì)調(diào)節(jié)各生理過(guò)程。
進(jìn)化分析表明,谷子eIF5A基因家族分布在第Ⅰ和第Ⅲ亞家族中,谷子SieIF5A2 ~ SieIF5A4、毛果楊PtreIF5A1~PtreIF5A4和美洲黑楊PdeIF5A1~ PdeIF5A4聚類于第Ⅰ亞家族;谷子SieIF5A1和小家鼠MmeIF5A1聚類于第Ⅲ亞家族。目前,eIF5A基因家族各成員確切的功能分析主要集中在擬南芥中。近年,伴隨著植物基因組學(xué)、生物信息學(xué)等新興學(xué)科的興起,大量的eIF5A基因從不同植物中克隆出來(lái),部分林木eIF5A基因成功克隆并功能也得到初步分析。第I亞家族中毛果楊和美洲黑楊之間的eIF5A基因間是一一對(duì)應(yīng)關(guān)系,而谷子eIF5A基因并沒(méi)有表現(xiàn)出與之相對(duì)應(yīng)的關(guān)系,表明盡管是高度保守的基因家族在經(jīng)過(guò)長(zhǎng)期進(jìn)化選擇,同屬楊屬的毛果楊和美洲黑楊eIF5A基因還未發(fā)生分離,而與其他植物發(fā)生了分離。美洲黑楊PdeIF5A3超量表達(dá)轉(zhuǎn)基因擬南芥表現(xiàn)出比轉(zhuǎn)空載體擬南芥對(duì)干旱和滲透耐受,且收獲的種子比轉(zhuǎn)空載體擬南芥增加30 %~100 %。鑒于谷子SieIF5A3與美洲黑楊PdeIF5A3同源性最高,據(jù)此推測(cè):谷子SieIF5A3可能也參與谷子的生長(zhǎng)發(fā)育及抗逆生理中發(fā)揮重要作用。聚類在一起的不同植物的同源基因可能具有不同的生物學(xué)功能[19],因此不能簡(jiǎn)單推測(cè)谷子eIF5A基因家族各成員的生物學(xué)功能,其各成員確切的生物學(xué)功能還需要逐一進(jìn)行功能驗(yàn)證。
磷酸化分析表明,谷子SieIF5A蛋白存在大量潛在磷酸化位點(diǎn)。目前,植物eIF5A蛋白確切的生物學(xué)功能尚未見(jiàn)報(bào)道。Lebska等通過(guò)多重序列比對(duì)發(fā)現(xiàn)玉米ZmeIF5A蛋白存在2個(gè)潛在的能被CK2蛋白磷酸化的位點(diǎn),分別將ZmeIF5A以及這兩個(gè)潛在的絲氨酸磷酸化位點(diǎn)突變(Ser2Ala和Ser4Ala)為丙氨酸并進(jìn)行體外重組蛋白的表達(dá)及純化,只有ZmeIF5A Ser2Ala重組蛋白不能被玉米CK2蛋白磷酸化。玉米原生質(zhì)體瞬時(shí)轉(zhuǎn)化發(fā)現(xiàn)ZmeIF5A和模擬Ser2不磷酸化的Ser2Ala融合EYFP熒光蛋白均勻地分布在細(xì)胞核和細(xì)胞質(zhì)中,而模擬Ser2磷酸化的Ser2Asp融合EYFP熒光蛋白僅在細(xì)胞核內(nèi)表達(dá),表明:玉米ZmeIF5A蛋白中Ser2是決定其進(jìn)出細(xì)胞核的關(guān)鍵位點(diǎn)[20]。谷子SieIF5A蛋白中潛在的磷酸化位點(diǎn)(尤其是絲氨酸)還需要通過(guò)潛在位點(diǎn)的定點(diǎn)突變、體外磷酸化等試驗(yàn)進(jìn)一步研究和驗(yàn)證。
谷子基因組中鑒定出4個(gè)eIF5A基因家族成員,均含有4個(gè)內(nèi)含子,位于谷子的第2、3和9染色體上。谷子eIF5A蛋白均含有1個(gè)保守的DNA結(jié)合寡核苷酸結(jié)合結(jié)構(gòu)域(PF01287)、均含有大量潛在的磷酸化位點(diǎn)。