楊 晨 姚雪瑩 陳志祥 王奇志
(華僑大學(xué)化工學(xué)院,廈門 361021)
葉綠體是植物進(jìn)行光合作用的場所。植物葉綠體基因具有高度保守性,葉綠體基因組是由1個大的單拷貝序列(large single copy,LSC),1 個小的單拷貝序列(small single-copy region,SSC)和兩個反向重復(fù)序列(inverted Repeat sequence,IRs)組成。大多葉綠體基因組大小在120~180 kB 左右,編碼基因100~200 個,包括蛋白質(zhì)編碼基因80個左右,tRNA 基因30~32個,rRNA 基因4個。葉綠體基因組功能基因大體分為3類:光合作用有關(guān)的基因、自我復(fù)制有關(guān)基因以及其他生物合成有關(guān)基因。在LSC 和SSC 區(qū)域分布的主要是與光系統(tǒng)Ⅰ和光系統(tǒng)Ⅱ有關(guān)基因,不同的物種葉綠體包含的基因數(shù)量以及種類會有較大變化。葉綠體基因組的GC 含量通常比較低,平均在37%,并且不同植物種類的GC 含量差異大。隨著葉綠體基因數(shù)據(jù)的增加,對植物的分類、進(jìn)化和系統(tǒng)發(fā)育提供了豐富的數(shù)據(jù)。相比于單獨的基因片段數(shù)據(jù),葉綠體基因組能提供給我們更多、更完整的基因信息,對于研究植物的系統(tǒng)進(jìn)化有著更好的前景,在植物遺傳多樣性和保護(hù)遺傳學(xué)等方面也得到了廣泛的應(yīng)用。
紅花變豆菜(F.Schmidt)又名雞爪芹、大葉芹、鴨巴掌、碗兒花、紫花變豆菜等,其嫩葉可食,具解毒、止血之效,也作為露地綠化和盆栽觀賞種類,具有很強的藥用和園藝觀賞價值。該種在恩格勒系統(tǒng)(Engler system)、哈欽松系統(tǒng)(Hutchinson system)、克朗奎斯特系統(tǒng)(Cronquist system)以及被子植物發(fā)育系統(tǒng)Ⅳ(Angiosperm Phylogeny Group Ⅳ,APGⅣ)等常用被子植物分類系統(tǒng)中是一個自然的種類,均隸屬于傘形科(Umbelliferae)變豆菜亞科(Saniculoi?deae)變豆菜屬(L.)植物。它是北極—第三紀(jì)孑遺的東亞—北美間斷分布的變豆菜屬中特殊的中國原產(chǎn)種類,其莖不分枝,相對原始,花色為紫紅色,復(fù)傘形花序,在中國主要集中分布在東北三省。紅花變豆菜的研究報道較少,僅有少量形態(tài)學(xué)和生境數(shù)據(jù)被報道,葉綠體基因組未見報道,紅花變豆菜葉綠體基因組的研究對于變豆菜屬屬下物種鑒定、系統(tǒng)發(fā)育和種間演化有著重要的意義。因此,本研究通過二代高通量測序技術(shù)和生物信息學(xué)方法對紅花變豆菜的完整葉綠體基因組進(jìn)行測序分析,結(jié)合已報道的傘形科(Apia?ceae)植物葉綠體基因組進(jìn)行聚類研究結(jié)果,可以為變豆菜屬種類鑒定,以及不同類群的系統(tǒng)發(fā)育關(guān)系和種間演化提供新數(shù)據(jù)。
紅花變豆菜由浙江大學(xué)李攀副教授采集。樣本采自吉林省撫松縣果松山北坡(127°29′16.66″N,42°5′53.34″E),采集號Li. LP185179。洗凈干燥后存于冰箱中?4 ℃?zhèn)溆?。憑證標(biāo)本存放于浙江大學(xué)植物標(biāo)本館(Herbarium of Zhejiang Univer?sity,HZU)內(nèi)。
用植物基因組DNA 試劑盒(Sangon Biotech,中國上海)提取紅花變豆菜葉片總基因組DNA。合格的DNA 樣品被打斷成約350 bp 的片段,構(gòu)建測序文庫,最后使用Illumina HiSeq Platform(Illu?mina,圣地亞哥,加利福尼亞)對末端配對的讀段進(jìn)行測序。
將棱子芹的葉綠體基因組(GenBank 登錄號:NC_033343)用作參考序列。使用FastQC v0.11.7對測序所得到的Raw reads 數(shù)據(jù)進(jìn)行質(zhì)量控制,去除低質(zhì)量序列和接頭,獲得高質(zhì)量Clean reads 數(shù)據(jù)。將所有的Clean reads 與參考序列進(jìn)行比對,獲得與葉綠體基因組相關(guān)的序列。用SOAPdeno?vo2軟件進(jìn)行拼接組裝,最后利用NOVOPlasty對組裝結(jié)果進(jìn)行補洞。利用Geneious v11.0.4軟件注釋,調(diào)整有誤差的蛋白編碼基因的啟動密碼子和終止密碼子,調(diào)整內(nèi)含子/外顯子邊界。使用OGDraw(https://chlorobox.mpimp-golm.mpg.de/OG?Draw.html)在線工具繪制葉綠體基因組的環(huán)形圖譜。組裝與注釋完成的紅花變豆菜葉綠體基因組通過Sequin軟件提交至NCBI。
利用MISA(https://webblast.ipk-gatersleben.de/misa/)在線軟件分析紅花變豆菜中簡單重復(fù)序列(simple sequence repeats,SSR),利用CodonW 1.4.2計算紅花變豆菜密碼子的相對使用頻率(relative synonymous codons usage,RSCU),RSCU>1 表示該密碼子有偏好性,RSCU<1表示該密碼子使用率較低,RSCU=1表示該密碼子沒有偏好性。
從NCBI 中下載同科的20 種植物的葉綠體基因組序列,以五加科(Araliaceae)穗序鵝掌柴()為外類群。使用MEGA 7.0 的最大似然法(包含2 個天胡荽亞科植物,11 個芹亞科植物,7 個變豆菜亞科植物,見表1)進(jìn)行系統(tǒng)發(fā)育分析,重復(fù)次數(shù)設(shè)定為1 000次。
表1 NCBI中傘形科20種植物以及外類群穗序鵝掌柴葉綠體基因組序列號Table 1 Chloroplast genome sequence numbers of 20 species of Umbelliferae and outgroup of S.delavayi from NCBI
紅花變豆菜的綠體基因組(GenBank 登錄號:MT528260)全長155 721 bp,GC 含量為38.20%。大的單拷貝(LSC)區(qū)域為85 981 bp,小的單拷貝(SSC)區(qū)域為17 060 bp,一對反向重復(fù)區(qū)域的長度分別為26 340 bp。紅花變豆菜的葉綠體基因組共檢測到129 個基因,包括84 個蛋白質(zhì)編碼基因,37個tRNA 基因和8 個rRNA 基因(見圖1)。其中15個基因中含有1 個內(nèi)含子,2 個基因(P 和3)含有2 個內(nèi)含子(見表2)。研究表明內(nèi)含子可以增強外源基因在植物特定的時間和特定的部位的表達(dá)水平。紅花變豆菜的葉綠體基因組和大多的高等植物相似,編碼的基因根據(jù)功能分為3 大類、18 個小類:第一類是與光合作用相關(guān)的基因,共45 個,包括光系統(tǒng)Ⅰ基因、光系統(tǒng)Ⅱ基因、細(xì)胞色素b/f 復(fù)合物基因、ATP合成酶基因、NADH 脫氫酶基因和RubisCO 大亞基;第二類是與葉綠體自我復(fù)制相關(guān)的基因73個,包含核糖體RNA基因、RNA聚合酶亞基基因、核糖體小亞基(Ribosomal Small Subunit,SSU)、核糖體大亞基(Ribosomal Large Sub?unit,LSU)和tRNA基因;第三類為開放閱讀框(Open Reading Frame,ORF)和其他編碼蛋白質(zhì)的基因6個以及一些未知功能基因5個,包括成熟酶基因、被膜蛋白基因、乙酰輔酶A羧化酶基因、細(xì)胞色素C的合成基因、蛋白酶基因、轉(zhuǎn)錄啟動因子基因(見表2)。
圖1 紅花變豆菜的葉綠體基因組圖譜Fig.1 The chloroplast genome of S.rubriflora
表2 紅花變豆菜葉綠體基因組注釋基因Table 2 Genes contained in S.rubriflora chloroplast genome
紅花變豆菜編碼基因共有51 907 個密碼子(見圖2)。其中編碼最多的是亮氨酸5 095個(9.81%),最少的是色氨酸689 個(1.74%)。終止密碼子中UAA 使用度最為頻繁(UGA 2.07%;UAG 1.55%;UAA 2.15%),與直刺變豆菜()一致。紅花變豆菜密碼子偏好UUU、UCU、UCC、UCA、UAU、UGU、UUA、UUG、CUU、UAA、UGA、CAU、CAA、CGA、AGA、AGG、AUU、AUA、ACU、ACC、ACA、AAU、GAU、AAA、GUU、GUA、GCU、GCC、GCA、GGU、GGA、CCU、CCC、CCA、GAA,共35 種,無偏 好性為UGG、AUG 2 種,使用頻率較低的為UUC 等共27 種。
圖2 紅花變豆菜葉綠體基因組密碼子數(shù)量和相對使用度Fig.2 The number and RSCU of codons in the chloroplast genome of S.rubriflora
紅花變豆菜葉綠體基因組中有32個SSR(見表3),大部分SSR 是單核苷酸重復(fù)(25個,78.13%),雙核苷酸重復(fù)有6個(18.75%),復(fù)雜重復(fù)有1個。除復(fù)雜重復(fù)SSR 外,其余SSRs 均由A 或T 組成。紅花變豆菜大部分簡單重復(fù)序列處于LSC 區(qū)(23 個),IRa、IRb、SSC區(qū)每個區(qū)內(nèi)僅含3個。
表3 紅花變豆菜葉綠體基因組中的SSRTable 3 SSR in the chloroplast genome of S.rubriflora
系統(tǒng)發(fā)育樹的節(jié)點都有著95%以上的置信度,可信度高。系統(tǒng)進(jìn)化樹表明,20種傘形科植物被分為3 個類群:天胡荽亞科(Hydrocotyloideae)、變豆菜亞科(Saniculoideae)和芹亞科(Apioideae)。最早分出的是天胡荽亞科的2種植物,在傘形科中是較原始的類群。芹亞科植物與變豆菜亞科植物聚成一支,形成姊妹類群,關(guān)系近緣。
變豆菜屬植物分為2 支,其中首陽變豆菜()單獨分為一支,而歐洲變豆菜()與其余五種變豆菜植物聚為一大支,其中歐洲變豆菜單獨為一支,剩余5 種變豆菜屬植物聚為一支。剩余5 種植物中紅花變豆菜與黃花變豆菜()聚為一支,薄片變豆菜()、變豆菜()和直刺變豆菜分支聚為一支,置信度為95%(見圖3)。
圖3 基于紅花變豆菜和近緣植物葉綠體全基因組序列的系統(tǒng)進(jìn)化樹(以穗序鵝掌柴為外類群)Fig.3 Phylogenetic tree based on chloroplast genome sequence of S. rubriflora and relative species(outgroup of Schefflera delavayi)
研究植物系統(tǒng)進(jìn)化常用方法有形態(tài)學(xué)研究,解剖學(xué)研究和分子學(xué)研究。傳統(tǒng)分類學(xué)主要利用花、果實等形態(tài)學(xué)數(shù)據(jù)進(jìn)行進(jìn)化分類研究,但是變豆菜屬屬下種類較多,極易混淆,難以從直觀上進(jìn)行分辨,并且在葉表皮微型態(tài)、果實微型態(tài)等研究中,紅花變豆菜上葉表皮有大量顆粒物,下葉表皮氣孔為橢圓形,果實卵形且有皮刺,其與屬下其他姊妹種差異不大,因此傳統(tǒng)形態(tài)學(xué)很難對變豆菜屬屬下進(jìn)行準(zhǔn)確分類。因此本研究利用分子學(xué)數(shù)據(jù),能對屬下分類與種間進(jìn)化研究提供新數(shù)據(jù)。
葉綠體基因組具有母系遺傳,獨立進(jìn)化和結(jié)構(gòu)保守等特點,能夠提供較完整的基因信息,為種間進(jìn)化提供新的證據(jù),且葉綠體基因組序列之間的結(jié)構(gòu)差異,能夠更好的顯示出植物種內(nèi)和植物種間的變化程度,這些信息能夠讓人更好地理解經(jīng)濟(jì)上重要作物的氣候適應(yīng)性,對于物種繁殖和鑒定以及有價值物種的保護(hù)具有重要的意義。隨著植物基因組學(xué)研究的深入,測序序列的不斷發(fā)展,常規(guī)分子序列提供信息較少,基于ITS序列,片段化分子序列提供信息較少,研究涉及的種類較少,因此利用葉綠體基因組研究植物發(fā)育進(jìn)化有著重要的意義。Deng 等對青海當(dāng)歸()進(jìn)行葉綠體基因組測序,發(fā)現(xiàn)其與白芷()最為近緣,Ge 等對天胡荽()進(jìn)行葉綠體基因組測序并將其從傘形科中去除并將其歸于五加科,Huang等利用葉綠體全基因組信息對山茶屬()屬下13 種物種進(jìn)行重新分類。而本研究結(jié)果首次對紅花變豆菜葉綠體全基因組結(jié)構(gòu)進(jìn)行報道,為紅花變豆菜的分子鑒定提供了新數(shù)據(jù),進(jìn)一步豐富了變豆菜屬植物的葉綠體基因組資料,有利于相關(guān)種類葉綠體基因組數(shù)據(jù)建樹,揭示了不同類群葉綠體基因組的進(jìn)化關(guān)系,為亞科間、屬下分類及進(jìn)化研究提供新的證據(jù)。
紅花變豆菜葉綠體分為四部分,與目前已報道的被子植物葉綠體組成保持一致。紅花變豆菜與變豆菜、直刺變豆菜和薄片變豆菜的葉綠體基因組的GC 含量均為38.2%,其總基因129 個,編碼蛋白質(zhì)基因84 個,tRNA 基因37 個,rRNA 基因8個,且出現(xiàn)了植物葉綠體基因組中少見的1,D,23和2基因。同時我們分析了紅花變豆菜密碼子偏好性,簡單重復(fù)序列中紅花變豆菜重復(fù)序列也主要以A/T為主,與直刺變豆菜一致,更偏向于A/T 的重復(fù),支持SSRs 大多由A 或T 重復(fù)組成。系統(tǒng)發(fā)育樹支持變豆菜和直刺變豆菜兩者更近緣,紅花變豆菜與黃花變豆菜單獨分為一支,二者均生長于陰暗潮濕的小道旁,但是兩者的地理分布和形態(tài)差異卻較大,紅花變豆菜主要分布在中國東北三省,而黃花變豆菜于2019年僅在浙江被發(fā)現(xiàn),二者皆為莖不分支,黃花變豆菜高15~30 cm,而紅花一般在50~100 cm,且黃花變豆菜花色為黃色,紅花變豆菜花色為紫紅色。變豆菜、薄片變豆菜與直刺變豆菜三者聚為一支,變豆菜主要分布于東北、華南、西南一帶,而剩余2種為南方廣布種,在湖北,湖南,江西,福建等省份都均有發(fā)現(xiàn),三者地理分布均比紅花變豆菜和黃花變豆菜更廣。但進(jìn)化分支結(jié)果不支持傳統(tǒng)形態(tài)分類,傳統(tǒng)分類中紅花變豆菜由于其莖不分支而被其認(rèn)為是變豆菜屬中一個相對原始的物種,被分在組內(nèi),直刺變豆菜和薄片變豆菜被分在組內(nèi),首陽變豆菜和變豆菜被分在組內(nèi),而由進(jìn)化樹可以看出,首陽變豆菜較原始,紅花變豆菜并不屬于原始的類群。本研究中傘形科植物類群葉綠體基因組聚類分析支持傳統(tǒng)亞科關(guān)系,但是變豆菜屬下分支卻與傳統(tǒng)分類不相同,我們將進(jìn)一步完善變豆菜屬不同種類的葉綠體全基因組數(shù)據(jù),為深入研究該屬的分子系統(tǒng)和種間進(jìn)化奠定基礎(chǔ)。
致謝 感謝浙江大學(xué)李攀老師為本研究提供的紅花變豆菜材料,感謝四川大學(xué)余巖老師、黃敏、陳振璽師兄對本文修改提出的寶貴意見。