仲巖,張?zhí)?陳釗,程宗明
(南京農(nóng)業(yè)大學園藝學院,江蘇 南京 210095)
森林草莓(Fragariavesca)屬于薔薇科草莓屬的二倍體種,分布廣泛,具有較強的抗逆性和抗病性[1]。植物通過遺傳變異和自然選擇分化成不同的生態(tài)型,這些生態(tài)型的分化同生長環(huán)境密切相關(guān),并且種群分布越廣,積累遺傳變異的概率也會越高[2]。森林草莓在歐洲各地均有分布,分化為不同的生態(tài)型。歐洲森林草莓不同生態(tài)型的抗病基因之間也存在差異,這些差異可能導致了森林草莓不同的生態(tài)型抗病能力。
抗病基因是植物抵抗自然界中病原物的重要方式,其中NBS-LRR類基因是最為重要的一類抗病基因,占已發(fā)現(xiàn)抗病基因的80%,且具有高遺傳變異度[3]。NBS-LRR基因家族的蛋白質(zhì)結(jié)構(gòu)特點是包含有N端結(jié)構(gòu)域、核苷酸結(jié)合位點(nucleotide-binding-site,NBS)和富亮氨酸重復區(qū)域(leucine-rich repeat,LRR)。根據(jù)其蛋白質(zhì)N端的TIR(toll-Interleukin-1receptor)、CC(coiled-coil)、RPW8或X(其他)結(jié)構(gòu)域,NBS-LRR基因家族可以進一步分為TIR-NBS-LRR(TNL)基因和non-TIR-NBS-LRR(non-TNL,包括CC-NBS-LRR,CNL;RPW8-NBS-LRR,RNL和X-NBS-LRR,XNL)基因2大類型。近年來,眾多園藝植物的全基因組NBS-LRR基因家族已被鑒定,如擬南芥[4]、木薯[5]、向日葵[6]、蘭花[7]、中華獼猴桃[8]、蘋果、梨、桃和梅[9-10]等,其中也包括多個草莓屬物種[11]。Zhong等[11]對森林草莓基因組中的NBS-LRR基因研究發(fā)現(xiàn),其呈現(xiàn)出快速進化和慢速進化2種不同的進化模式。由于森林草莓分布較廣,分化出多種生態(tài)型,為了對這些不同生態(tài)型間的NBS-LRR基因遺傳變異情況和進化模式有進一步了解,根據(jù)我們構(gòu)建的森林草莓NBS-LRR基因家族的系統(tǒng)進化樹[11],發(fā)現(xiàn)FvH4_1g15230和FvH4_5g22710基因均位于支長較短的進化支上,說明它們可能處于快速進化模式下,因此在森林草莓中選取了這2個具有代表性的NBS-LRR基因(其中FvH4_1g15230基因位于森林草莓1號染色體上,FvH4_5g22710基因位于5號染色體上)進行遺傳變異分析。本研究通過分析這2個NBS-LRR基因在不同森林草莓生態(tài)型中完整核苷酸序列的理化性質(zhì)、核苷酸序列以及蛋白序列比對、蛋白質(zhì)結(jié)構(gòu)域,同時根據(jù)不同森林草莓生態(tài)型核苷酸序列差異構(gòu)建系統(tǒng)發(fā)育樹并計算Ka/Ks值及核苷酸差異度(Pi值),為草莓抗病新品種的培育提供理論依據(jù)。
供試材料取自芬蘭、挪威、西班牙、英國、冰島、意大利的23種森林草莓生態(tài)型(表1)。
表1 23種森林草莓生態(tài)型的采樣國家及編號Table 1 Sampling countries and numbers of 23 woodland strawberry ecotypes
1.2.1 2個NBS-LRR基因在不同森林草莓生態(tài)型中的核苷酸序列選取健康且長勢一致的不同森林草莓生態(tài)型,并以FvH4_5g22710和FvH4_5g22710為目的基因。利用Plant Total DNA Isolation Kit Plus試劑盒(FOREGENE公司)提取不同生態(tài)型的基因組DNA。根據(jù)目標基因在Phytozome v12.1(https://phytozome.jgi.doe.gov/pz/portal.html)上的全長序列,采用Oligo6軟件進行引物設(shè)計。采用PrimeSTAR?GXL DNA Polymerase(TaKaRa公司)擴增目的基因全長序列,并用10 g·L-1瓊脂糖凝膠電泳檢測目標基因條帶,利用OMEGA膠回收試劑盒回收目的片段,送上海生工生物工程公司進行測序。利用已公布全基因組序列的森林草莓‘Hawaii4’作為參照,使用Sequencher軟件將測序結(jié)果進行拼接、核對,最終確定不同生態(tài)型中目的基因的序列。
1.2.2 理化性質(zhì)分析及分類利用ProtParam網(wǎng)站(https://web.expasy.org/protparam/)分析目的基因編碼蛋白序列的氨基酸數(shù)量、相對分子質(zhì)量、對脂溶指數(shù)、理論等電點、總平均親水性等理化性質(zhì)。采用Pfam網(wǎng)站(http://pfam.xfam.org/)、SMART網(wǎng)站(http://smart.embl-heidelberg.de/)和COILS網(wǎng)站(http://embnet.vital-it.ch/software/COILS_form.html)分析其蛋白質(zhì)結(jié)構(gòu)域組成。
1.2.3 不同生態(tài)型中目標基因及其編碼蛋白質(zhì)的序列對比及系統(tǒng)進化樹構(gòu)建利用MEGA v7.0軟件[12]中的ClustalW程序?qū)ν换虿煌鷳B(tài)型的核苷酸及基因編碼的蛋白質(zhì)序列進行排序,并利用DNAMEN v7.0軟件將比對結(jié)果可視化。根據(jù)上述獲得的核苷酸序列比對結(jié)果,利用MEGA v7.0軟件采用最大似然法(Bootstrap值設(shè)置為1 000,Tamura-Nei模型)對2個目的基因分別構(gòu)建系統(tǒng)進化樹。
1.2.4 同義突變率(Ks)、非同義突變率(Ka)和核苷酸差異度(Pi值)的計算利用MEGA v7.0軟件計算不同生態(tài)型之間目的基因CDS(coding sequence)序列的Ka、Ks、Ka/Ks以及Pi值。利用PAML程序[13]通過模型0和模型7、模型8計算ω值(dN/dS,即Ka/Ks)并進行顯著性檢測。
供試材料取自芬蘭、挪威、西班牙、英國、冰島、意大利的23種森林草莓生態(tài)型,其中FvH4_5g22710基因存在于21種森林草莓生態(tài)型中;FvH4_1g15230基因存在于20種森林草莓生態(tài)型中。
由表2可見:在21種森林草莓生態(tài)型中,FvH4_5g22710基因所編碼蛋白的理化性質(zhì)差異較小。它們均由941個氨基酸殘基組成,但由于某幾個位點的氨基酸種類的差異,其蛋白相對分子質(zhì)量和理論等電點略有差異。其中,來自ES5、ES9、ES18、UK1等7個生態(tài)型的蛋白相對分子質(zhì)量為108 121.04,理論等電點為8.65;相對分子質(zhì)量為108 122.03的蛋白來自其他14種生態(tài)型,包括‘Hawaii4’(FvH4)、FIN11、FIN29、FIN5、FIN6、IT18、IT3、NOR122、NOR21、NOR13、ICE4、NOR150、NOR163和ICE16,其理論等電點均為8.59;因此,這21種生態(tài)型FvH4_5g22710基因編碼的蛋白均為堿性蛋白。該基因編碼蛋白的對脂溶指數(shù)和總平均親水性在這21種生態(tài)型中均沒有表現(xiàn)出差異,前者均為103.15,后者均為-0.205,說明該基因編碼的蛋白均為親水蛋白。
表2 FvH4_5g22710基因在21種森林草莓生態(tài)型中的理化性質(zhì)Table 2 Physicochemical properties of FvH4_5g22710 gene from 21 woodland strawberry ecotypes
由表3可見:在20種森林草莓生態(tài)型中,FvH4_1g15230基因所編碼蛋白的氨基酸數(shù)量相同,均由 817個氨基酸殘基組成,但理化性質(zhì)也表現(xiàn)出了差異。基因編碼的氨基酸種類差異導致了蛋白相對分子質(zhì)量的差異,其中來自ICE5、ICE12、ICE16、NOR163生態(tài)型的蛋白相對分子質(zhì)量最大,為93 262.11,來自生態(tài)型FIN11的蛋白相對分子質(zhì)量最小,為93 057.94。在20種生態(tài)型中,該基因編碼的蛋白理論等電點為5.46~5.50,表明其均為酸性蛋白;對脂溶指數(shù)為101.37和101.73;總平均親水性是-0.121~-0.109,說明該基因編碼的蛋白均為親水蛋白。
表3 FvH4_1g15230基因在20種森林草莓生態(tài)型中的理化性質(zhì)Table 3 Physicochemical properties of FvH4_1g15230 gene from 20 woodland strawberry ecotypes
來自21種生態(tài)型的FvH4_5g22710基因,其編碼區(qū)堿基序列的變異程度較小,僅有2處點突變。以FvH4的核苷酸序列為參考,來自ES5、ES9、ES18、UK1、UK9、UK10和IT24這7個生態(tài)型的FvH4_5g22710基因,在核苷酸編碼區(qū)的第157位由堿基G突變?yōu)閴A基C,該突變?yōu)榉峭x突變,導致其蛋白序列的第53位由谷氨酸突變?yōu)楣劝滨0?圖1);該基因在生態(tài)型ICE4、ICE16、NOR163和NOR150中,其編碼區(qū)的第207位由堿基C突變?yōu)閴A基T,該突變?yōu)橥x突變,仍舊編碼丙氨酸。該基因的內(nèi)含子區(qū)域并無突變發(fā)生。
圖1 FvH4_5g22710基因編碼區(qū)(A)及編碼的蛋白(B)在21種森林草莓生態(tài)型中突變位點序列比對Fig.1 Alignment of FvH4_5g22710 coding sequences(A)and protein sequences encoded by FvH4_5g22710(B) around the mutation sites in 21 ecotypes of woodland strawberry 圖中省略號代表無突變發(fā)生的核苷酸序列(A)或氨基酸序列(B)。The ellipsis means the nucleotide sequences(A)or amino acid sequences(B)without mutation.
以來自FvH4的核苷酸序列為參考,在FvH4_1g15230基因的編碼區(qū)發(fā)生了17處點突變,包括11處非同義突變和6處同義突變(圖2)。例如,來自ICE5生態(tài)型的該基因在其編碼區(qū)第463位發(fā)生了非同義突變,由堿基T突變?yōu)镚,因此,其蛋白序列的第155位由半胱氨酸變?yōu)楦拾彼?圖3);NOR13生態(tài)型的該基因編碼區(qū)第477位有一處同義突變,雖然堿基A突變?yōu)镚,但依舊編碼谷氨酸;其內(nèi)含子區(qū)域發(fā)生了 8處突變,包括7處點突變和1處缺失突變,在這處缺失突變中,來自生態(tài)型NOR13、NOR17、NOR21、NOR163、FIN11、FIN29、ICE5、ICE12和ICE16的基因在其第2個內(nèi)含子的第46~51個堿基處缺失了6個堿基(圖4)。由此可見,基因FvH4_1g15230相較于FvH4_5g22710具有較大的遺傳變異性。
圖2 FvH4_1g15230基因編碼區(qū)在20種森林草莓生態(tài)型中突變位點序列比對Fig.2 Alignment of FvH4_1g15230 coding sequences around the mutation sites in 20 ecotypes of woodland strawberry圖中省略號代表無突變發(fā)生的核苷酸序列。The ellipsis means the nucleotide sequences without mutation.
圖3 FvH4_1g15230基因編碼的蛋白在20種森林草莓生態(tài)型中突變位點序列比對Fig.3 Alignment of the protein sequences encoded by FvH4_1g15230 gene around the mutation sites in 20 ecotypes of woodland strawberry圖中省略號代表無突變發(fā)生的氨基酸序列。The ellipsis means the amino acid sequences without mutation.
圖4 FvH4_1g15230基因內(nèi)含子區(qū)域在20種森林草莓生態(tài)型中的突變位點序列比對Fig.4 Alignment of FvH4_1g15230 intron regions around the mutation sites in 20 ecotypes of woodland strawberry圖中省略號代表無突變發(fā)生的核苷酸序列。The ellipsis means the nucleotide sequences without mutation.
FvH4_5g22710基因編碼的蛋白中存在3種結(jié)構(gòu)域,分別為Rx_N(N-端)、NB-ARC結(jié)構(gòu)域和LRR基序;FvH4_1g15230基因編碼的蛋白中同樣存在3種結(jié)構(gòu)域,分別為RPW8(N-端)、NB-ARC結(jié)構(gòu)域和LRR基序(圖5)。兩者的N-端結(jié)構(gòu)域不同,前者屬于X-NBS-LRR類型基因,后者屬于RPW8-NBS-LRR類型基因。FvH4_5g22710基因中的2個突變位點均發(fā)生在Rx_N結(jié)構(gòu)域中;而在FvH4_1g15230基因編碼區(qū)的17個突變位點中,有7處點突變分布在3種結(jié)構(gòu)域中。
圖5 2個目的基因的蛋白質(zhì)結(jié)構(gòu)域組成及突變位點分布Fig.5 The protein domains and locations of mutation sites for the two genes 紅色箭頭為非同義突變,藍色箭頭為同義突變。The red arrows are non-synonymous mutation sites,and the blue arrows are synonymous mutation sites.
由圖6可見:FvH4_5g22710基因的系統(tǒng)進化樹中,來自21種生態(tài)型的基因聚類為3組,其中的一組,其基因序列與FvH4的相比并無差異,包括采自芬蘭、意大利和挪威的生態(tài)型FIN5、FIN6、FIN11、FIN29、IT3、IT18、NOR13、NOR21和NOR122。其余2組的基因序列均與FvH4有一定程度的差異,第2組包括生態(tài)型ES5、ES9、ES18、UK1、UK9、UK10、IT24,大部分來自西班牙和英國;第3組包括生態(tài)型ICE4、ICE16、NOR163、NOR150,分別采集自冰島和挪威。由此可見,來源于同一國家或鄰近國家的生態(tài)型聚類在同一進化支上,說明它們的基因序列之間具有較小的核苷酸差異度。
FvH4_1g15230基因的系統(tǒng)進化樹中也呈現(xiàn)出相似的聚類方式,來自20個生態(tài)型的基因分為4組,第1組由UK1、UK9、UK10、NOR122、NOR150、IT3、IT18、ES9、ES18等生態(tài)型的基因組成,大部分來自英國、挪威、意大利和西班牙;第2組僅包括來自芬蘭的生態(tài)型FIN11;第3組則大部分來自挪威的生態(tài)型NOR13、NOR17、NOR21;第4組則是多來自冰島的生態(tài)型ICE5、ICE12、ICE16。
圖6 來自森林草莓不同生態(tài)型的2個NBS-LRR基因系統(tǒng)發(fā)育樹Fig.6 Phylogenetic trees of two NBS-LRR genes in different ecotypes of woodland strawberry
FvH4_5g22710基因和FvH4_1g15230基因所受選擇壓力情況由非同義替換率(Ka)與同義替換率(Ks)的比值(Ka/Ks)和ω來反映,兩者的平均值均小于1(表4),共同說明了2個基因均受純化選擇壓力的驅(qū)動。此外,計算了兩者編碼的不同結(jié)構(gòu)域區(qū)段的Ka/Ks值,結(jié)果也展現(xiàn)了不同結(jié)構(gòu)域區(qū)段所受的選擇壓力情況(表5)。在FvH4_5g22710基因中,2處核苷酸突變位點均分布在Rx_N結(jié)構(gòu)域中,且平均Ka/Ks值為0.291 6,表明Rx_N結(jié)構(gòu)域區(qū)段仍受到純化選擇的作用。而基因FvH4_1g15230中,3種結(jié)構(gòu)域區(qū)段中均分布有突變位點:RPW8結(jié)構(gòu)域區(qū)段中只發(fā)生非同義突變;NB-ARC和LRR結(jié)構(gòu)域中包含同義突變和非同義突變位點,它們的平均Ka/Ks值分別為0.242 9和0.478 7,均小于1,說明這2個結(jié)構(gòu)域區(qū)域受到了純化選擇。
為進一步驗證2個基因所受的選擇壓力,計算ω(dN/dS)和2Δln值。采用PAML程序的LR檢測,驗證基因編碼蛋白中受到正選擇作用的氨基酸位點(表4)。FvH4_5g22710的2Δln值為9.489 8,說明其具有極顯著(2Δln>9.210,P<0.01)的正選擇作用位點,尤其是其編碼蛋白序列的第53位的氨基酸位點(谷氨酸)受到正選擇的驅(qū)動。
FvH4_5g22710的Pi值小于FvH4_1g15230(表4),說明后者在不同生態(tài)型間的核苷酸差異度更大。在兩者不同的結(jié)構(gòu)域區(qū)段中,前者只在Rx_N結(jié)構(gòu)域中存在核苷酸差異度;而在后者中,LRR結(jié)構(gòu)域區(qū)段的Pi值最大即基因間核苷酸差異度最大,RPW8結(jié)構(gòu)域區(qū)段的Pi值最小即基因間核苷酸差異度最小(表5)。
表4 不同生態(tài)型中2個NBS-LRR基因的平均Ka/Ks值、Pi值及選擇壓力檢驗Table 4 Average Ka/Ks value,Pi value and selection pressure test of two NBS-LRR genes in different ecotypes of woodland strawberry
表5 不同生態(tài)型中2個NBS-LRR基因編碼結(jié)構(gòu)域的平均Ka/Ks值及Pi值Table 5 Average Ka/Ks value and Pi value of domain regions encoded by two NBS-LRR genes in different ecotypes of woodland strawberry
NBS-LRR基因是植物中存在最多的一類抗病基因,是植物細胞對抗病蟲害侵染的重要防御組成成分。本研究對歐洲不同的森林草莓生態(tài)型進行目標NBS-LRR基因的遺傳變異分析。序列比對、核苷酸差異度分析結(jié)果表明FvH4_5g22710基因的遺傳變異程度小于FvH4_1g15230,推測這2個抗病基因可能擁有不同的進化速率,以此應(yīng)對具有不同變異速率的病蟲害[10,14]。
生態(tài)型是指來自同一物種的不同類群為了適應(yīng)不同生態(tài)環(huán)境,產(chǎn)生不同程度的遺傳變異,且能夠在類群中穩(wěn)定遺傳[2,15]。由此可見,不同的生態(tài)型經(jīng)歷了自然選擇后,不同的基因積累了不同程度的遺傳變異。本研究中,系統(tǒng)進化樹顯示,來自同一國家或是鄰近國家的生態(tài)型中的目標基因,偏好聚類于同一個進化支中,說明相較其他基因而言,來自相同或相近地理位置的生態(tài)型,其基因序列之間具有更高的核苷酸相似度。類似的情況在不同生態(tài)型的擬南芥中也有發(fā)現(xiàn),例如孫彩玉等[16]對在意大利和瑞典不同地區(qū)取樣的擬南芥進行春化作用相關(guān)基因(FLOWERINGLOCUSC,FLC)的序列分析發(fā)現(xiàn),采自意大利不同地區(qū)的擬南芥FLC基因序列完全相同,而來自瑞典不同地區(qū)的擬南芥FLC基因序列也完全相同。然而,來自意大利和瑞典的擬南芥在基因序列第27、461、501、638、738、884位的堿基卻不相同。
根據(jù)選擇壓力結(jié)果,目標基因及其不同結(jié)構(gòu)域區(qū)段的平均Ka/Ks值均小于1,說明它們在進化過程中均受到純化選擇的作用。Zhong等[10-11]發(fā)現(xiàn)在5個薔薇科物種和6個草莓物種中,大部分NBS-LRR基因受到純化選擇壓力的驅(qū)動,但仍有部分受到正選擇壓力作用;Jia等[17]發(fā)現(xiàn)蘋果(Malusdomestica)基因組的大部分NBS-encoding基因家族受到正選擇的壓力。豆科模式植物百脈根(Lotusjaponicus)以及白色幾內(nèi)亞山藥(Dioscorearotundata)基因組中的NBS-LRR基因基本受到純化選擇的驅(qū)動,僅有少部分基因受到正選擇的作用[18-19]。正如FvH4_5g22710基因的第53位的氨基酸位點(谷氨酸)受到正選擇的驅(qū)動。植物抗病基因受到正選擇的驅(qū)動,可提高抗病基因核苷酸序列的多樣性,有效應(yīng)對病蟲害的快速變異,提高植物的抗病性,為栽培草莓抗病新品種的培育提供理論依據(jù)和候選基因資源。
通過序列比對并結(jié)合結(jié)構(gòu)域分析發(fā)現(xiàn),一部分突變位點分布于目的基因編碼的蛋白結(jié)構(gòu)域中。其中,FvH4_5g22710基因中的2個突變位點均存在于Rx_N結(jié)構(gòu)域區(qū)段。Hao等[20]發(fā)現(xiàn)Rx_N是馬鈴薯Rx抗病蛋白N端結(jié)構(gòu)域,它與NBS和LRR共同介導對馬鈴薯病毒X的抗性。而FvH4_1g15230基因在其編碼的3種結(jié)構(gòu)域RPW8、NB-ARC、LRR中均發(fā)生了變異,Xiao等[21]發(fā)現(xiàn)擬南芥中的抗病基因RPW8.1和RPW8.2對白粉病病原體具有廣譜抗性;薔薇科中的RNL基因劃歸為2大類,分別具有較高和較低的差異度,呈現(xiàn)出快速和慢速2種進化模式,用以抵御不同類型的病蟲害[10]。LRR基序是一種富含亮氨酸的重復序列,廣泛存在于植物抗病基因編碼的蛋白中[22]。LRR結(jié)構(gòu)域與病原體效應(yīng)分子的特異性識別有關(guān),并且在抗病信號轉(zhuǎn)導中具有調(diào)節(jié)作用[23];由于LRR結(jié)構(gòu)域與致病效應(yīng)因子的相互識別和相互作用,LRR結(jié)構(gòu)域與N-端結(jié)構(gòu)域、NBS結(jié)構(gòu)域相比經(jīng)歷了更頻繁的正選擇壓力作用并具有更高的差異度[24-26]。本研究可為后續(xù)研究森林草莓NBS-LRR基因抗病功能以及草莓抗病分子育種提供重要的理論參考。
致謝:南京農(nóng)業(yè)大學生物信息中心高性能計算機平臺在實驗技術(shù)方面給予了支持和幫助,謹致謝意。