江轉(zhuǎn)轉(zhuǎn),胡淑寶,楊浩東,郭 晶
(安慶師范大學(xué) 生命科學(xué)學(xué)院,安徽 安慶 246133;皖西南生物多樣性研究與生態(tài)保護(hù)安徽省重點(diǎn)實(shí)驗(yàn)室,安徽 安慶 246133)
栝樓屬(TrichosanthesL.)屬于葫蘆科(Cucurbitaceae),該科約有80余種,主要分布于馬來(lái)西亞、澳大利亞、中國(guó)、朝鮮和日本等國(guó)家[1]。我國(guó)有41 個(gè)種和8 個(gè)變種,分布于全國(guó)各地,以華南和西南地區(qū)最多[1]。一些栝樓屬植物的各個(gè)組織均含有豐富的氨基酸、核苷及碳水化合物[2],其果實(shí)不僅可以用作蔬菜食用,還可以作為觀賞植物。栝樓屬植物的某些提取物(主要為槲皮素、柚皮素、β-谷甾醇、亞油酸乙酯和前列腺素)對(duì)治療冠心病、糖尿病和結(jié)腸癌等有一定療效[3-6]。總的來(lái)說(shuō),栝樓屬植物具有很高的經(jīng)濟(jì)價(jià)值和藥用價(jià)值,在園藝中有著廣泛應(yīng)用。過(guò)去的研究主要集中在形態(tài)學(xué)、孢粉學(xué)、解剖學(xué)和細(xì)胞學(xué)上,然而這些研究并沒(méi)有明確栝樓屬的種內(nèi)關(guān)系。
葉綠體是綠色植物的重要細(xì)胞器,在植物生長(zhǎng)發(fā)育和光合作用過(guò)程中起著關(guān)鍵作用。開花植物的葉綠體基因組大多是環(huán)狀DNA分子,長(zhǎng)度約為(115~165)kb,呈現(xiàn)單親遺傳[7]。在大多數(shù)被子植物中,葉綠體基因組分為四個(gè)部分:小單拷貝(Small single copy,SSC)區(qū)域、大單拷貝(Large single copy,LSC)區(qū)域和兩個(gè)長(zhǎng)度相同的反向重復(fù)區(qū)域(Inverted repeat region,IRs)[8-9]。此外,葉綠體基因組大小的差異主要是由于IRs收縮或擴(kuò)張丟失所致[10-11]。在基因結(jié)構(gòu)和組成方面,葉綠體基因組比核基因組、線粒體基因組更為保守,但在某些被子植物中也能觀察到葉綠體基因組的基因丟失、增加或轉(zhuǎn)移[12-16]。研究證明,葉綠體基因組保持高度保守和非重組性質(zhì)并伴隨著部分結(jié)構(gòu)變異[7],是推斷不同物種系統(tǒng)發(fā)育位置的寶貴遺傳資源[17-18]。由于新一代測(cè)序方法和平臺(tái)的發(fā)展,準(zhǔn)確地解析葉綠體基因組并獲取基因組信息,在探索重要植物物種的分類與進(jìn)化,以及解決非模式植物的有爭(zhēng)議系統(tǒng)發(fā)育問(wèn)題上有重大的應(yīng)用[19-24]。迄今為止,已有6 500多個(gè)葉綠體基因組測(cè)序信息,為更好地理解陸地植物葉綠體基因組進(jìn)化提供了重要信息[25]。然而,在栝樓屬植物進(jìn)化過(guò)程中,葉綠體基因組是否存在共同的結(jié)構(gòu)變異尚不清楚。
目前NCBI中收錄了11種栝樓屬植物的葉綠體基因完整序列,為了加深對(duì)栝樓屬物種間關(guān)系的理解,本文基于系統(tǒng)的比較基因組學(xué)研究方法,對(duì)11 種栝樓屬植物的葉綠體基因組進(jìn)行了編碼基因組成、區(qū)域邊界擴(kuò)張、重復(fù)序列挖掘、密碼子偏好性、共線性分析和基因組范圍內(nèi)的多態(tài)性位點(diǎn)鑒定等研究?;谌~綠體全基因組序列,本文構(gòu)建了包括11 種栝樓屬植物在內(nèi)的葫蘆科植物系統(tǒng)進(jìn)化樹。研究結(jié)果闡明了栝樓屬植物葉綠體基因組序列特征和進(jìn)化特點(diǎn),可為栝樓屬植物的系統(tǒng)進(jìn)化提供優(yōu)良的潛在分子標(biāo)記位點(diǎn),同時(shí)為其種內(nèi)關(guān)系重建提供了更好的指導(dǎo),有助于探索其在葫蘆科內(nèi)的系統(tǒng)發(fā)育位置。
從NCBI基因組數(shù)據(jù)庫(kù)(www.ncbi.nlm.nih.govgenome)下載了11種栝樓屬植物和19種葫蘆科植物的葉綠體基因組序列,具體物種信息包括:短序栝樓(NC-046864.1,Trichosanthes baviensis)、芋葉栝樓(NC-046868.1,Trichosanthes homophylla)、顯脈栝樓(NC-046883.1,Trichosanthes nervifolia)、雙邊栝樓(MT-211650,Trichosanthes rosthornii)、截葉栝樓(NC-046875.1,Trichosanthes truncata)、管花栝樓(NC-046867.1,Trichosanthes tubiflora)、薄葉栝樓(NC-046882.1,Trichosanthes wallichiana)、三尖栝樓(NC-046866.1,Trichosanthes tricuspidata)、全緣栝樓(NC-046884.1,Trichosanthes pilosa)、分裂栝樓(NC-046885.1,Trichosanthes lobata)、栝樓(NC-041088.1,Trichosanthes kirilowii)、油渣果(NC-046857.1,Hodgsonia heteroclita)、冬瓜(NC-056352.1,Benincasa Hispida)、黃瓜(NC-007144.1,Cucumis sativus)、甜瓜(NC-057560.1,Cucumis melo)、野黃瓜(NC-023544.1,Cucumis hystrix)、西瓜(NC-032008.1,Citrullus lanatus)、無(wú)柄苦瓜(NC-046872.1,Momordica sessilifolia)、苦瓜(NC-046807.1,Momordica charantia)、羅漢果(NC-04388.1,Siraitia grosvenorii)、翅子羅漢果(NC-046482.1,Siraitia siamensis)、南瓜(NC-036506.1,Cucurbita moschata)、西葫蘆(NC-038229.1,Cucurbita pepo)、筍瓜(NC-036505.1,Cucurbita maxima)、黑子南瓜(NC-058583.1,Cucurbita ficifolia)、紅瓜(NC-031834.1,Coccinia grangis)、葫蘆(NC-036808.1,Lagenaria siceraria)、廣東絲瓜(NC-050067.1,Luffa acutangula)、小雀瓜(NC-046860.1,Cyclan‐thera pedata)、藏瓜(NC-046859.1,Indofevillea khasiana)。
葉綠體基因組中的重復(fù)結(jié)構(gòu)(正向、回文、互補(bǔ)和反向)使用REPuter(https://bibiserv.cebitec.uni-biele‐feld.de/reputer/)進(jìn)行分析[26],設(shè)置參數(shù)為:(1)漢明距離=3;(2)最小重復(fù)單元為8 bp;(3)最大重復(fù)序列大小為50 bp。同時(shí),利用MISA(https://webblast.ipk-gatersleben.de/misalindex.php)對(duì)11種栝樓的簡(jiǎn)單重復(fù)序列(Simple sequence repeats,SSRs)進(jìn)行統(tǒng)計(jì)分析,參數(shù)設(shè)置為:?jiǎn)魏塑账嶙钚≈貜?fù)10次,二核苷酸最小重復(fù)6次,三核苷酸、四核苷酸、五核苷酸和六核苷酸最小重復(fù)均為5次,每?jī)蓚€(gè)SSRs最小間隔100 bp。
所有葉綠體蛋白質(zhì)編碼基因的密碼子使用CodonW1.44 軟件并結(jié)合EMBOSS explorer(http://bioin‐formatics.nl/emboss-explorer)網(wǎng)站分析。使用Relative Synonymous Codon Usage(RSCU)來(lái)檢驗(yàn)同義密碼子使用的偏差[27],RSCU值是特定密碼子被觀察到的次數(shù)與在使用統(tǒng)一同義密碼子時(shí)該密碼子被觀察到次數(shù)的比值。在沒(méi)有任何密碼子使用偏好的情況下,RSCU值為1.00;當(dāng)密碼子使用頻率低于預(yù)期時(shí),RSCU<1.00;而密碼子使用頻率超過(guò)預(yù)期時(shí),RSCU>1.00。采用密碼子適應(yīng)指數(shù)(Codon adaptation in‐dex,CAI)、密碼子偏置指數(shù)(Codon bias index,CBI)、最佳密碼子頻率(Frequency of optimal,F(xiàn)OP)、有效密碼子數(shù)(Effective number of codon,ENc)和同義第三位密碼子的GC含量(GC3s)等5個(gè)指標(biāo)來(lái)估計(jì)密碼子的偏置程度。
通過(guò)IRscope(https://irscope.shinyapps.io/Chloroplot/)進(jìn)行葉綠體基因組的邊界擴(kuò)張分析,并采用Adobe Illustrator對(duì)數(shù)據(jù)進(jìn)行處理。
對(duì)11種栝樓屬植物的葉綠體編碼蛋白進(jìn)行進(jìn)化速率分析。DnaSP6用于計(jì)算非同義替換率(Ka)和同義替換率(Ks),如果Ks=0,則無(wú)法計(jì)算該值。利用GraphPad Prism 9繪制Ka/Ks熱圖,并利用Adobe Illustrator軟件對(duì)圖片進(jìn)行人工調(diào)整。而后,利用DnaSP6分別計(jì)算編碼序列和非編碼序列的Pi值,以及整個(gè)葉綠體基因組、LSC、SSC和IR區(qū)域的Pi值[28]。
通過(guò)在線工具Cicoletto(http://tools.batinfspire.Org/cirroletto)[29]對(duì)11 種栝樓的葉綠體基因組進(jìn)行共線性分析,參數(shù)設(shè)置E-value值為1e-10。為了重建葫蘆科植物在栝樓屬內(nèi)的系統(tǒng)發(fā)育關(guān)系,對(duì)30個(gè)物種的葉綠體基因組進(jìn)行了系統(tǒng)發(fā)育分析。使用ClustalX2.1軟件對(duì)葉綠體全基因組序列進(jìn)行比對(duì),并將比對(duì)完成的序列導(dǎo)入到MEGA11軟件中,利用鄰接法(Neighbor-Joining,NJ)進(jìn)行系統(tǒng)樹構(gòu)建[30],最后采用Adobe Illustrator對(duì)生成的系統(tǒng)進(jìn)化樹進(jìn)行修飾。
從NCBI的Genome數(shù)據(jù)庫(kù)中下載了11種栝樓屬植物完整的葉綠體基因組序列,并對(duì)其葉綠體基因組序列和編碼基因進(jìn)行了統(tǒng)計(jì)分析。如表1 所示,11 種栝樓屬植物葉綠體基因組大小介于156 413 bp(T.baviensis)至157 556 bp(T.nervifolia)之間,GC 含量均為37%,都包含有LSC、SSC 和兩個(gè)IR 等四個(gè)典型的連接區(qū)域。LSC 區(qū)長(zhǎng)度范圍為85 828 bp(T.tubiflora)至86 517 bp(T.nervifolia),占總長(zhǎng)度的54.8%~55.2%;SSC 區(qū)長(zhǎng)度范圍為18 202 bp(T.truncata)至18 510 bp(T.tricuspidata),占總長(zhǎng)度的11.6%~11.8%;IR區(qū)長(zhǎng)度范圍為51 820 bp(T.baviensis)至52 574 bp(T.lobata),占總長(zhǎng)度的33.1%~33.5%。同時(shí),11 種栝樓屬植物包含了數(shù)量不等的功能基因,其中T.rosthornii包含134 個(gè),T.kirilowii包含130個(gè),其他9種均包含131個(gè)。這些功能基因分為四類:自身復(fù)制相關(guān)基因、光合作用相關(guān)基因、其他功能基因和一些未知功能基因。除了T.rosthornii有89個(gè)基因參與編碼蛋白質(zhì)外,其他10種均有86個(gè)基因參與該過(guò)程。T.kirilowii相較于其他物種少1個(gè)tRNA,僅有36個(gè),其他物種均為37個(gè)。此外,11種栝樓具有數(shù)量相等的rRNA。對(duì)于這11種栝樓屬植物的葉綠體基因組序列來(lái)說(shuō),其中92.5%的序列為編碼序列,7.5%的序列為非編碼序列(表1)。
表1 11種栝樓屬植物的葉綠體基因組
重復(fù)序列作為一種重要的標(biāo)記,在系統(tǒng)發(fā)育分析中發(fā)揮著重要作用。SSRs也被稱為短串聯(lián)重復(fù)序列或微衛(wèi)星,由長(zhǎng)度為1-6 bp的核苷酸重復(fù)單元組成,廣泛分布于葉綠體基因組中[31-32]。在11種栝樓屬植物葉綠體全基因組中共發(fā)現(xiàn)3 種SSR:?jiǎn)魏塑眨∕ononucleotide)、雙核苷酸(Dinucleotide)和三核苷酸(Trinucleotide)。然而,僅在管花栝樓(T.tubiflora)的葉綠體基因組中檢測(cè)到三核苷酸重復(fù),但無(wú)雙核苷酸重復(fù)(圖1A/B)。在11種栝樓屬植物中,單核苷酸重復(fù)的次數(shù)最多且總重復(fù)長(zhǎng)度最長(zhǎng),而雙核苷酸重復(fù)的次數(shù)及長(zhǎng)度遠(yuǎn)低于單核苷酸重復(fù)(圖1A/B)。已有研究表明,單核苷酸重復(fù)在藜屬植物及石蒜科植物中最為豐富[32]。因此,單核苷酸重復(fù)在遺傳變異中的作用可能比其他SSRs更重要。在11種栝樓屬植物葉綠體全基因組上,分布在LSC區(qū)域的SSRs次數(shù)最多且長(zhǎng)度最長(zhǎng),而分布于IR區(qū)域的SSRs次數(shù)最少且長(zhǎng)度最短,SSC區(qū)域則居于中間(圖1C/D)。對(duì)于長(zhǎng)重復(fù)序列而言,11種栝樓屬植物的葉綠體基因組序列中均分布有正向重復(fù)序列與回文重復(fù)序列,兩者數(shù)量相當(dāng)(圖1E),但是回文重復(fù)的總長(zhǎng)度遠(yuǎn)長(zhǎng)于正向重復(fù)(圖1F)。此外,T.rosthornii、T.kirilowii和T.tubiflora既不存在反向重復(fù)序列也無(wú)互補(bǔ)重復(fù)序列,而T.tricuspidata與T.lobata無(wú)反向重復(fù)序列,T.homophylla則無(wú)互補(bǔ)重復(fù)序列(圖1E/F)。長(zhǎng)重復(fù)序列多分布在LSC與IR區(qū)域,較少分布在SSC區(qū)域(圖1G/H)。
圖1 11種栝樓屬植物葉綠體全基因組序列的短重復(fù)及長(zhǎng)重復(fù)序列。(A)單堿基、雙堿基、三堿基重復(fù)型頻率,(B)重復(fù)型長(zhǎng)度;(C)LSC、SSC、IR區(qū)域短重復(fù)的頻率,(D)長(zhǎng)度;(E)正向、回文、反向、完全重復(fù)型頻率,(F)長(zhǎng)度;(G)LSC、SSC、IR區(qū)域長(zhǎng)重復(fù)的頻率,(H)長(zhǎng)度
目前,普遍認(rèn)為密碼子的使用頻率因基因組、基因和基因內(nèi)部結(jié)構(gòu)而異。密碼子偏好通常被解釋為基因突變傾向和翻譯優(yōu)化的自然選擇間的平衡[33]。最佳密碼子有助于提高翻譯的效率和準(zhǔn)確性。本文計(jì)算了11種栝樓葉綠體基因組蛋白質(zhì)編碼基因的密碼子使用和相對(duì)同義密碼子使用(RSCU)值,與其他被子植物葉綠體基因組相似,11種栝樓葉綠體基因組的第三位密碼子使用偏向于A和U(RSCU>1)。為了進(jìn)一步研究基因組密碼子使用偏倚的模式,利用CodonW軟件分析了葉綠體基因組蛋白質(zhì)編碼基因的密碼子適應(yīng)性指數(shù)(CAI)、第三位同義密碼子的GC(GC3s)、密碼子偏好性指數(shù)(CBI)、最優(yōu)密碼子指數(shù)頻率(FOP)及有效密碼子數(shù)(ENc)。研究表明,11 種栝樓屬植物的CAI 值分布在0.154~0.162 間,其中T.baviensis具有最高的CAI 值而T.lobataCAI 值最低;GC3s 分布在34.5%~36.5%間;CBI 值分布在-0.09~-0.12 間;FOP 值分布在0.345~0.360 間;而ENc 值分布在55~56 間(圖2)。以上結(jié)果說(shuō)明了11種栝樓屬植物葉綠體編碼基因的整體密碼子偏好性不強(qiáng)。
圖2 11種栝樓屬植物葉綠體基因組的密碼子使用偏倚統(tǒng)計(jì)(CAI、GC3s、GC、CBI、FOP和ENc指數(shù))
通常認(rèn)為,高等植物葉綠體基因組長(zhǎng)度變化主要來(lái)源于IR和SSC/LSC之間的邊界位置變化[34]?;诖耍疚膶?duì)11種栝樓屬植物的葉綠體LSC、SSC和IR邊界的擴(kuò)張與序列重排進(jìn)行了分析(圖3)。除了T.tubiflora,所有栝樓屬植物葉綠體基因組的IRa/LSC連接都位于rps19基因內(nèi),導(dǎo)致IRa中存在部分rps19基因。在T.baviensis、T.truncata、T.rosthornii、T.kirilowii、T.nervifolia及T.tricuspidata中,IRa/SSC連接都位于ndhF基因內(nèi),而SSC/IRb連接位于ycf1基因中。與上述六種栝樓不同,T.wallichiana、T.homophylla、T.pilosa、T.lobata與T.tubiflora中IRa/SSC 連接都位于ycf1基因內(nèi),而SSC/IRb 連接位于ndhF基因中。以上結(jié)果說(shuō)明,某些栝樓的葉綠體基因組SSC與IR區(qū)域在進(jìn)化過(guò)程中發(fā)生過(guò)一定程度的序列重排。
圖3 11種栝樓屬植物的LSC、SSC和IR區(qū)域邊界分析
在遺傳學(xué)中,以Ka 表示密碼子的非同義替換率,Ks 表示同義替換率,同時(shí)Ka/Ks表示兩者的比值,此參數(shù)可用于判斷是否有選擇壓力作用于蛋白質(zhì)的編碼基因[35]。如圖4所示,11種栝樓屬植物的Ka/Ks 值大多小于或接近1,說(shuō)明這些葉綠體基因經(jīng)歷了中性或純化選擇。此外,T.kirilowii與T.nervifolia、T.tricuspidata之間的Ka/Ks 比值均顯著大于1,說(shuō)明這三個(gè)物種的葉綠體編碼位點(diǎn)處于正向選擇狀態(tài)。
圖4 11種栝樓屬植物葉綠體基因組Ka/Ks比值
葉綠體基因組的差異位點(diǎn)可以用來(lái)識(shí)別近緣物種,并提供系統(tǒng)發(fā)育信息[36]。利用DnaSP 6 程序計(jì)算了11 種栝樓屬基因組的編碼區(qū)和基因間區(qū)的核苷酸多樣性(Pi)值。從圖5可知,SSC區(qū)域的Pi值及多態(tài)性位點(diǎn)顯著高于LSC及IR區(qū)域,說(shuō)明SSC區(qū)域分化程度較高。從葉綠體基因組中確定了9個(gè)相對(duì)高度變異區(qū)域,其可能正在經(jīng)歷更快速的核苷酸替換。這些區(qū)域包括4 個(gè)基因區(qū)和5 個(gè)基因間區(qū):rps16、ndhD、ndhE、ycf1、psbI-psbK、trnS-trnG、trnT-trnE、trnT-trnL和trnL-trnA(圖5)。這些區(qū)域可作為系統(tǒng)發(fā)育和植物地理學(xué)研究中潛在的分子標(biāo)記。
圖5 11種栝樓屬植物葉綠體基因組的核苷酸多樣性。(A)葉綠體基因組差異位點(diǎn);(B)葉綠體基因的多態(tài)位點(diǎn)的數(shù)目
以T.baviensis作為參考基因組,分析了11種栝樓葉綠體基因組共線性,結(jié)果表明T.pilosa與T.bavien‐sis葉綠體基因組結(jié)構(gòu)相似度最高,達(dá)到99.89%,其次是T.truncata,達(dá)到99.14%。與短序栝樓基因組結(jié)構(gòu)相似度最低的是T.homophylla,為98.04%(圖6)。
圖6 11種栝樓屬植物葉綠體基因組的共線性分析
本文基于葉綠體全基因組序列,利用MEGA11軟件構(gòu)建了葫蘆科30種植物的系統(tǒng)發(fā)育樹。30種葫蘆科植物分屬于13個(gè)屬,三個(gè)亞族。結(jié)果顯示,所有葫蘆科物種聚集形成了一個(gè)高步長(zhǎng)值的單系群,同屬的植物均聚類。除了絲瓜屬外,其他12個(gè)屬聚成一個(gè)大的分支。11種栝樓被分為兩個(gè)亞支,一支與藏瓜屬親緣關(guān)系較為接近,而另一支與油渣果屬親緣關(guān)系較近(圖7)。
圖7 基于葉綠體基因組構(gòu)建的30種葫蘆科植物的系統(tǒng)發(fā)育樹
栝樓是葫蘆科的一個(gè)重要屬,但其葉綠體基因組還沒(méi)有得到很好的研究。本文首次分析了栝樓屬葉綠體全基因組,研究發(fā)現(xiàn)11種栝樓屬植物的葉綠體基因組都具有典型的四聯(lián)體結(jié)構(gòu)(即1個(gè)LSC,1個(gè)SSC,2個(gè)IR),包含130~134個(gè)特異基因,其中,86~89個(gè)編碼基因、36~37個(gè)tRNAs和8個(gè)rRNAs。基因組長(zhǎng)度為156 413 bp~157 556 bp,GC含量為37%。與大多數(shù)被子植物相似,11種栝樓屬植物的葉綠體基因組在基因組大小、結(jié)構(gòu)和組織上高度保守,可以為進(jìn)一步分析其內(nèi)部核酸變異提供基礎(chǔ)。已有研究認(rèn)為,重復(fù)序列在葉綠體基因組排列和序列分化中起著重要作用,盡管這樣的重排在被子植物質(zhì)體基因組中比較少見(jiàn)[37]。重復(fù)序列分析表明,栝樓屬植物不論是短序列或長(zhǎng)序列重復(fù)均較長(zhǎng)地分布在LSC區(qū)域,這些重復(fù)基序可用于開發(fā)分子標(biāo)記并進(jìn)行系統(tǒng)發(fā)育分析。邊界擴(kuò)展、系統(tǒng)進(jìn)化樹及Ka/Ks 比值分析表明,11種栝樓可以明確分為兩個(gè)分支,第一分支為T.baviensis、T.truncata、T.rosthornii、T.kirilowii、T.nervifolia及T.tricuspidata,第二分支為T.wallichiana、T.homophylla、T.pilosa、T.lobata與T.tubiflora。這兩個(gè)分支的出現(xiàn)可能與葉綠體基因組的SSC及IR區(qū)域的序列重排有關(guān),這些重排對(duì)群體分化產(chǎn)生重要影響。此外T.kirilowii、T.nervifolia及T.tricuspidata三者的分化可能與環(huán)境的正選擇導(dǎo)致的群體分化有關(guān)。而對(duì)栝樓屬的基因組共線性分析表明,某些進(jìn)化上關(guān)系較遠(yuǎn)的物種在基因結(jié)構(gòu)上卻較為接近,如T.baviensis與T.pilosa。核苷酸分析結(jié)果顯示,栝樓屬葉綠體基因組中的SSC區(qū)域核苷酸多樣性最高,其中典型基因有ndhD、ndhE及ycf1,這些位點(diǎn)可用于編碼栝樓屬特異的DNA條碼。ndhD、ndhE均屬于NAD(P)H脫氫酶復(fù)合體成員,該復(fù)合體對(duì)維持非生物脅迫下的植物生長(zhǎng)及對(duì)光環(huán)境的適應(yīng)有非常重要的作用[38]?;谌蚪M,栝樓屬與絲瓜屬、油渣果屬親緣關(guān)系較近,而基于葉綠體全基因組,栝樓屬則與藏瓜屬的親緣關(guān)系較近,這可能是由于葫蘆科物種多發(fā)生基因組的加倍行為引起[39]。
11種栝樓的葉綠體基因組在大小、結(jié)構(gòu)、基因組成及GC含量上均較為保守,同時(shí)在種內(nèi)曾經(jīng)發(fā)生過(guò)SSC與IR區(qū)域內(nèi)的序列重排。密碼子偏倚分析表明栝樓屬葉綠體編碼基因的密碼子偏性不強(qiáng),而11種栝樓中有三種存在正向選擇,這些選擇可能導(dǎo)致栝樓的群體分化。序列重排及環(huán)境的正選擇將11種栝樓分為兩個(gè)分支,并且T.nervifolia和T.tricuspidata很可能由T.kirilowii演化而來(lái)。栝樓屬葉綠體基因組的SSC區(qū)域存在數(shù)量較多的核酸變異位點(diǎn),其可作為栝樓屬植物物種鑒定和系統(tǒng)發(fā)育的潛在標(biāo)記。