洪森榮,林順來,李盈萍,李蕓蕓,李和月,張慶寶
(1. 上饒師范學(xué)院生命科學(xué)學(xué)院,江西 上饒 334001; 2. 上饒農(nóng)業(yè)技術(shù)創(chuàng)新研究院,江西 上饒 334001; 3. 上饒市藥食同源植物資源保護(hù)與利用重點實驗室,江西 上饒 334001; 4. 上饒市薯芋類作物種質(zhì)保存與利用重點實驗室,江西 上饒 334001)
甜高粱(Sorghumbicolor)屬C4作物,是禾本科高粱屬中普通高粱的一個變種,不僅具有較高的生物產(chǎn)量和經(jīng)濟(jì)產(chǎn)量,干生物量可達(dá) 30 t·hm-2,而且對不同生長環(huán)境下土壤的適應(yīng)能力較強(qiáng),具有抗旱、抗鹽堿、水分利用率高的特性,即使在干旱、鹽堿化嚴(yán)重的地區(qū),甜高粱也表現(xiàn)出良好的適應(yīng)性[1],同時其莖稈中含有豐富的糖分汁液,可以用來制作糖漿及酒產(chǎn)品等[2],還可替代玉米制作優(yōu)質(zhì)青貯飼料[3],是兼具食用、釀造及飼用等多種應(yīng)用價值的新型高效能源作物[4]。目前,關(guān)于高粱屬植物的研究主要集中在種植栽培[5]、營養(yǎng)價值[6]、分子指紋圖譜[7]和遺傳多樣性[8]等方面,而高粱屬植物的葉綠體基因組的研究少見報道,黃卓然等[9]對四種禾本科作物(小麥Triticumaestivum、水稻Oryzasativa、玉米Zeamays和高粱Sorghumbicolor)葉綠體基因組堿基替換的側(cè)翼序列特征進(jìn)行了研究,發(fā)現(xiàn)這4種禾本科作物的葉綠體基因組均表現(xiàn)出CpG甲基化效應(yīng)以及顛換相鄰位點的特殊組成規(guī)律;許衛(wèi)東等[10]研究了高粱葉綠體psbD基因的克隆及其高效表達(dá),克服了D2蛋白質(zhì)(由psbD基因編碼的蛋白質(zhì))體外極難分離與純化的困難,為研究D2蛋白質(zhì)的高級結(jié)構(gòu)提供了有利條件;Klein[11]為了進(jìn)一步了解高粱細(xì)胞質(zhì)雄性不育(CMS)和育性恢復(fù)基因(Rf)的作用,對富含線粒體和葉綠體亞細(xì)胞部分的A1CMS(A1雄性不育系即買羅milo細(xì)胞質(zhì)雄性不育系)線粒體基因組進(jìn)行了測序和組裝。但基于單個片段或分子標(biāo)記其有效信息位點不足,高粱屬內(nèi)物種間的系統(tǒng)位置支持率不高,高粱屬內(nèi)種間系統(tǒng)進(jìn)化關(guān)系未能很好的解析。因此,解析甜高粱的葉綠體基因組結(jié)構(gòu)特征與系統(tǒng)進(jìn)化關(guān)系,對甜高粱種質(zhì)資源的分子鑒定、品種選育和農(nóng)藝經(jīng)濟(jì)性狀的遺傳分析具有重要意義,亦為高粱屬系統(tǒng)進(jìn)化研究提供依據(jù)。
葉綠體是植物進(jìn)行光合作用的重要細(xì)胞器,是高等植物細(xì)胞獨立的遺傳物質(zhì),對植物生長發(fā)育起重要作用[12]。葉綠體基因組長度約120~160 kb,一般具有閉合的環(huán)狀結(jié)構(gòu),即包括大單拷貝區(qū)(Large single copy,LSC),小單拷貝區(qū)(Small single copy,SSC),2個反向重復(fù)區(qū)(Inverted repeat region,IRs,包括IRa和IRb)[13]。大多數(shù)被子植物葉綠體基因組為母系遺傳,約110~130個基因,其編碼區(qū)的基因序列相對保守,與其他質(zhì)體基因組相比,葉綠體基因組的進(jìn)化速率較低,結(jié)構(gòu)較為穩(wěn)定,是進(jìn)行系統(tǒng)進(jìn)化和分化時間分析的理想標(biāo)記[14]。本研究利用高通量測序技術(shù)進(jìn)行甜高粱葉綠體全基因組測序,通過組裝、拼接和注釋得到其全長葉綠體基因組序列,并對其葉綠體基因組結(jié)構(gòu)、組成及系統(tǒng)進(jìn)化關(guān)系進(jìn)行分析,旨在豐富甜高粱的遺傳信息,為未來研究高粱屬植物間的系統(tǒng)進(jìn)化、親緣關(guān)系及品種鑒定提供理論依據(jù)。
甜高粱試管苗(種子產(chǎn)地:江蘇宿遷,試管苗由上饒市藥食同源植物資源保護(hù)與利用重點實驗室提供)。
1.2.1DNA提取和測序 利用改良的CTAB法提取甜高粱(TGL)試管苗葉片總DNA[15]。甜高粱試管苗葉片基因組DNA檢測合格后,用機(jī)械打斷的方法(超聲波)將DNA片段化,然后對片段化的DNA進(jìn)行片段純化、末端修復(fù)、3′端加A、連接測序接頭,再用瓊脂糖凝膠電泳進(jìn)行片段大小選擇,進(jìn)行PCR擴(kuò)增形成測序文庫,建好的文庫先進(jìn)行文庫質(zhì)檢,質(zhì)檢合格的文庫用BGISEQ-500平臺進(jìn)行測序。
1.2.2葉綠體全基因組的組裝與注釋 對Raw Data進(jìn)行數(shù)據(jù)過濾,去除其中的接頭序列及低質(zhì)量Reads獲得高質(zhì)量的Clean Data。將Clean Data按參考物種的葉綠體基因組序列進(jìn)行序列組裝,獲得葉綠體序列組裝結(jié)果。使用GeSeq[16]、tRNAscan-SE[17]對葉綠體基因組進(jìn)行注釋,再經(jīng)過手工校正后得到最終的葉綠體基因組基因注釋結(jié)果。將注釋完成的甜高粱葉綠體基因組序列提交至NCBI(https://www.ncbi.nlm.nih.gov/),獲得登錄號(OQ843017)。使用OGDRAW制作葉綠體基因組圖譜[18]。
1.2.3葉綠體基因組特征分析 通過JSHYCloud在線工具集(http:∥cloud.genepioneer.com:9929)分析并統(tǒng)計葉綠體基因組、大單拷貝區(qū)(LSC)、小單拷貝區(qū)(SSC)和反向重復(fù)區(qū)(IR)的GC含量;使用MISA軟件[19]進(jìn)行SSR的分析,單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸的最小重復(fù)值分別設(shè)置為10,6,5,5,5,5。利用REPuter軟件[20]進(jìn)行Longrepeat分析,查找正向重復(fù)F(forward)、反向重復(fù)R(reverse)、互補(bǔ)重復(fù)C(complement)、回文重復(fù)P(palindromic)四種重復(fù)類型;通過Pasteur Galaxy在線工具集中的CodonW模塊分析密碼子使用情況,設(shè)置輸出結(jié)果為有效密碼子數(shù)(ENC)和相對同義密碼子使用度(RSCU),其他參數(shù)設(shè)為默認(rèn)值。將甜高粱葉綠體基因組序列上傳至NCBI進(jìn)行BLASTn比對,選擇highly similar sequence(megablast)來比較相似性在95%以上的序列,檢索獲得甜高粱的近緣種。利用Gview、VISTA tools、IRscope[21]和DNADnaSP6.0軟件[22]繪制甜高粱及其高粱屬14個近緣種(見表1)的變異圈圖、mVIST結(jié)構(gòu)變異圖、IR結(jié)構(gòu)變異圖,計算甜高粱及其14個近緣種的基因組核苷酸多態(tài)性(Pi,參數(shù)設(shè)置100 bp滑窗和25 bp步長);并對上述甜高粱及其14個近緣種進(jìn)行GC3-GC12分析(Neutrality-plot分析)、ENC-plot分析和PR2-bias-plot分析和最優(yōu)密碼子分析;對甜高粱葉綠體基因的ENC值進(jìn)行排序,分別選取兩端基因各5個,構(gòu)建高表達(dá)基因庫(ENC值小)和低表達(dá)基因庫(ENC值大),并計算二者的RSCU差值(ΔRSCU)。篩選ΔRSCU≥0.08的高表達(dá)密碼子,且RSCU>1的高頻率密碼子定義為甜高粱葉綠體基因組的最優(yōu)密碼子;最后利用mafft 7.0軟件[23]對甜高粱及其高粱屬22個近緣種(見表2)進(jìn)行序列比對,利用fasttree 2.1.10軟件[24]構(gòu)建甜高粱及其22個近緣種以及物種外外群甘蔗屬2個種的進(jìn)化樹。
表1 高粱屬14個近緣種Table 1 14 related species of sorghum genus
表2 高粱屬22個近緣種以及甘蔗屬2個種Table 2 24 related species of sorghum genus and 2 species of sugarcane genus
經(jīng)過測序組裝的完整的甜高粱葉綠體基因組長度為140 644 bp,基因組圖譜(圖1)顯示:甜高粱葉綠體基因組呈典型的環(huán)狀結(jié)構(gòu),具有LSC,SSC,IRa和IRb之四分體結(jié)構(gòu)?;蚪M的A含量為30.79%、T含量為30.73%、C含量為19.23%、G含量為19.26%,總GC含量為38.48%,低于總AT含量(61.52%)。其中,IR區(qū)的GC含量最高(43.90%),LSC區(qū)次之(36.33%),SSC區(qū)的GC含量最低(32.95%)。
圖1 甜高粱葉綠體基因組圖譜Fig.1 Chloroplast genome map of S. bicolor
由表3可知,共注釋到光合作用基因、自我復(fù)制基因、其他基因和未知功能基因4類,包括86個CDS基因、38個tRNA基因和8個rRNA基因,共132個基因。對有多個外顯子的葉綠體基因進(jìn)行結(jié)構(gòu)分析,發(fā)現(xiàn)2個外顯子構(gòu)成的基因有18個,包括10個CDS基因和8個tRNA基因;由3個外顯子構(gòu)成的基因有3個,為rps12,rps12,pafI基因;81個基因完全在LSC區(qū);9個基因完全在SSC區(qū);19個基因完全在IRB和IRA區(qū);1個基因(ndhF)在SSC-IRB連接區(qū);LSC-IRB連接區(qū)無基因;1個基因(ndhH)在SSC-IRA連接區(qū);rps12基因有2個拷貝,每個拷貝具有3個外顯子,且兩個拷貝共享第一個外顯子,第一個外顯子位于LSC區(qū)域,另外2個外顯子位于IR區(qū)域。
表3 甜高粱葉綠體基因功能分類Table 3 Chloroplast gene functional classification of S. bicolor
甜高粱葉綠體基因組中共檢測到31個SSR位點,對不同重復(fù)頻率的SSR位點數(shù)量進(jìn)行統(tǒng)計,結(jié)果(表4)顯示:31個SSR位點均為單核苷酸SSR。在單核苷酸SSR位點中,由T組成的單核苷酸SSR位點最多(17個),由A組成的單核苷酸SSR位點次之(9個),由C或G組成的單核苷酸SSR位點僅為2~3個,表明甜高粱葉綠體基因組的堿基組成偏向使用A或T。甜高粱葉綠體基因組共鑒定到42個長重復(fù)(Long repeat)序列,包括23個正向重復(fù)F(Forward)、19個回文重復(fù)P(Palindromic),無反向重復(fù)R(Reverse)和互補(bǔ)重復(fù)C(Complement)。
表4 甜高粱葉綠體基因組中SSR的類型及分布Table 4 Type and distribution of SSR in chloroplast genome of S. bicolor
由甜高粱及其14個近緣種葉綠體基因組的變異圈圖(圖2)、mVIST結(jié)構(gòu)變異圖(圖3)和Pi核苷酸多態(tài)性分析圖(圖4)可知,甜高粱及其14個近緣種的葉綠體基因組變化不大,甜高粱Sorghumbicolor和高粱SorghumbicolorMT333845、高粱SorghumbicolorMT333848、高粱SorghumbicolorMT459453的葉綠體基因組較為保守,葉綠體基因組較為穩(wěn)定。由圖4可知,甜高粱及其14個近緣種葉綠體基因組核苷酸多態(tài)性的變化范圍為0~0.010 51,基因psbA/trnK-UUU,trnK-UUU,matK/rps16,trnK-UUU,matK/rps16,trnG-UCC/trnT-GGU,trnT-GGU/trnE-UUC,trnD-GUC,trnD-GUC/psbM,trnV-UAC,ndhF,rps12變異率最高(圖4),以上結(jié)果與Gview和mVISTA分析結(jié)果一致。
圖2 甜高粱及其14個近緣種葉綠體基因組Gview變異圈Fig.2 Gview variation circle of chloroplast genomes of S. bicolor and its14 related species注:從外到內(nèi)的序號與表1一致,下同Note:The serial numbers from outside to inside are consistent with Table 1,the same as below
圖4 甜高粱及其14個近緣種葉綠體基因組Pi核苷酸多態(tài)性分析Fig.4 Pi nucleotide polymorphism analysis of chloroplast genomes of S. bicolor and its14 related species
甜高粱及其14個近緣種葉綠體基因組LSC區(qū)、SSC區(qū)和IR區(qū)邊界的比較結(jié)果見圖5。結(jié)果顯示:甜高粱和14個近緣種IR區(qū)長度一致,其IRa區(qū)和IRb區(qū)長度均為22 782 bp。在IRb區(qū)內(nèi),甜高粱和14個近緣種的rps19基因距LSC-IRb邊界線36 bp,ndhF基因橫跨IRb區(qū)和SSC區(qū),長度均為2 216 bp(IRb區(qū)28 bp,SSC區(qū)2 188 bp);在IRa區(qū)內(nèi),甜高粱和14個近緣種的rps15基因距SSC-IRa邊界線1 bp,rps19基因距LSC-IRa邊界線35 bp,其rps15,rps19,rpl2,trnH基因長度相同;在LSC區(qū)內(nèi),甜高粱和14個近緣種的rpl22和psbA基因長度相同;在SSC區(qū)內(nèi),甜高粱和14個近緣種的ndhH基因長度均為1 181 bp,均距SSC-IRa邊界線1 bp。說明甜高粱和14個近緣種葉綠體基因組的JLB,JSB,JSA,JLA邊界無明顯差異,甜高粱葉綠體基因組IR區(qū)邊界未發(fā)生明顯的收縮與擴(kuò)張。
圖5 甜高粱及其14個近緣種葉綠體基因組IR擴(kuò)張和收縮圖Fig.5 IR expansion and contraction of the chloroplast genome of S. bicolor and its14 related species
2.6.1同義密碼子的偏性分析 由圖6可知,3個位置GC含量的平均值為38.60%,GC1,GC2,GC3分別為46.13%,39.84%,29.83%.這說明GC在密碼子3個位點上的分布存在顯著差異,呈GC3
圖6 甜高粱及其14個近緣種葉綠體基因組密碼子組成成分分析Fig.6 Composition analysis of chloroplast genome codons of S. bicolor and its14 related species注:GC_first、GC_second、GC_third分別表示密碼子第 1、2、3位的GC含量;GC_total表示密碼子總GC含量Note:GC_first、GC_second、GC_third represent the GC content of codon 1,2 and 3 respectively;GC_total represents the total GC content of the codons
表5 甜高粱葉綠體基因組同義密碼子的使用頻率(RSCU)Table 5 Relative synonymous codon usage (RSCU) of chloroplast genome of S. bicolor
2.6.2中性繪圖分析(GC3~GC12分析) 由圖7可知,GC3~GC12分析發(fā)現(xiàn)甜高粱及其14個近緣種植物葉綠體基因的GC3含量分布在0.151 2~0.407 4之間,GC12含量分布在0.333 3~0.646 3之間,二者基本是沿對角線上方分布。兩者的相關(guān)系數(shù)r=0.045(R2=0.002),相關(guān)顯著(P<0.05),回歸斜率為0.044,說明GC12與GC3相關(guān)。表明甜高粱葉綠體基因組密碼子使用偏性很大程度上受自然選擇的影響,而受突變壓力的影響小。
圖7 甜高粱及其14個近緣種葉綠體基因組密碼子GC3~GC12分析Fig.7 GC3~GC12 analysis of chloroplast genome codons of S. bicolor and its14 related species
2.6.3ENC-plot分析 由圖8可知,分布在期望曲線上的基因較少,分布在期望曲線下方且遠(yuǎn)離曲線的基因較多,說明大部分基因的實際ENC值與理論ENC值存在差異,這表明自然選擇是影響甜高粱葉綠體基因組密碼子使用偏性的主要因素,而突變壓力的作用較小。
圖8 甜高粱及其14個近緣種葉綠體基因組密碼子ENC-plot分析Fig.8 ENC-plot analysis of chloroplast genome codons of S. bicolor and its14 related species
2.6.4PR2-plot分析 由圖9可知,X,Y坐標(biāo)軸均以0.5為界限,發(fā)現(xiàn)4個平面內(nèi)基因分布不均衡。從G3/GC3軸看,少數(shù)基因位于上方(>0.5),多數(shù)基因位于下方(<0.5);從A3/AU3軸看,多數(shù)基因位于左側(cè)(<0.5),少數(shù)基因位于右側(cè)(>0.5),這表明4種堿基在同義密碼子第3位上存在G>C,A>T現(xiàn)象。由于當(dāng)密碼子使用存在偏性完全受突變壓力影響時,C和G以及A和T同義密碼子在第3位上的分布應(yīng)相等。因此,甜高粱葉綠體基因組密碼子使用偏性除受到突變影響外,還受自然選擇等因素影響。
圖9 甜高粱及其14個近緣種葉綠體基因組密碼子PR2-plot分析Fig.9 PR2-plot analysis of chloroplast genome codons of S. bicolor and its14 related species
2.6.5最優(yōu)密碼子確定 由表6可知,同時滿足條件RSCU>1和ΔRSCU≥0.08的密碼子共14個,即ACU,UAG,CCU,CUA,GCU,AGU,GAU,UUA,CGU,GAA,GUU,UCA,CAU,UGU,這些密碼子除一個密碼子以G結(jié)尾之外,其它均以A,U結(jié)尾,被確定為甜高粱葉綠體基因組的最優(yōu)密碼子。
表6 甜高粱葉綠體基因最優(yōu)密碼子篩選Table 6 Optimal codon screening of chloroplast genome of S. bicolor
由圖10可知,高粱屬聚為一大類;甘蔗屬聚為另一大類。在高粱屬中,又可分為2類,甜高粱(S.bicolor,TGL)與高粱S.bicolorMT333845、高粱S.bicolorMT333848、高粱S.bicolorMT459453單獨聚為一分支。說明甜高粱(TGL,產(chǎn)地:江蘇宿遷)與高粱S.bicolorMT333845(產(chǎn)地:韓國,栽培種Donganme)、高粱S.bicolorMT333848(產(chǎn)地:韓國,栽培種Sodam Chal)、高粱S.bicolorMT459453(產(chǎn)地:韓國,栽培種ATx623)親緣關(guān)系較近,但與高粱S.bicolorMT333846(產(chǎn)地:韓國,栽培種Hwanggum Chal)、高粱S.bicolorMT333847(產(chǎn)地:韓國,栽培種Nampoong Chal)、高粱S.bicolorNC_008602(產(chǎn)地:美國)、高粱S.bicolorAC144549(產(chǎn)地:美國)、高粱S.bicolorMK348612(產(chǎn)地:中國唐山)關(guān)系較遠(yuǎn),表明中國甜高粱與韓國高粱栽培種(Hwanggum Chal、Nampoong Chal)、美國高粱以及中國唐山高粱的起源存在差異。究其原因,可是能不同產(chǎn)地的高粱的IR區(qū)邊界局部存在一定的收縮與擴(kuò)張。
圖10 基于葉綠體基因組的甜高粱及其22個近緣種以及外群甘蔗屬2個種的系統(tǒng)發(fā)育樹Fig.10 Phylogenetic tree of S. bicolor and its 22 related species,as well as 2 species of sugarcane in the outer group,based on the chloroplast genome
葉綠體SSR分子標(biāo)記可廣泛應(yīng)用于群體遺傳學(xué)、生物地理學(xué)和系統(tǒng)進(jìn)化等方面的研究[29]。在甜高粱葉綠體基因組SSR預(yù)測中,31個SSR位點均為單核苷酸SSR,在單核苷酸SSR位點中,由T或A組成的單核苷酸SSR位點較多,表明甜高粱葉綠體基因組的堿基組成偏向使用A或T,這與北陵鳶尾(Iristyphifolia)[30]和‘草原3號’雜花苜蓿(Medicagovaria‘Caoyuan No. 3’)[31]等研究結(jié)果基本一致。北陵鳶尾(Iristyphifolia)葉綠體基因組SSR位點包含33個單核苷酸重復(fù)、14個雙核苷酸重復(fù)、2個三核苷酸重復(fù)、7個四核苷酸重復(fù)和1個五核苷酸重復(fù)單核苷酸類型重復(fù)占比最大,為57.9%,且全部由A/T組成。由A/T組成的SSR占全部SSR的87.7%,表明北陵鳶尾葉綠體基因組偏好使用A堿基和T堿基[30];‘草原3號’雜花苜蓿單核苷酸重復(fù)序列出現(xiàn)頻率較高,為79個,其中僅有A堿基的重復(fù)序列51 SSRs,T堿基28 SSRs,雜花苜蓿葉綠體基因組SSR位點A/T堿基占優(yōu)勢,具有堿基偏好性[31]。因此,重復(fù)序列的分析為將來甜高粱品種及其他高粱屬植物的物種鑒定和個體水平的遺傳差異分析提供了豐富的遺傳信息支撐。
盡管甜高粱葉綠體基因組與同屬14個近緣種的葉綠體基因組比較相似,甜高粱與14個近緣種在LSC區(qū)與IRb區(qū)的邊界、SSC區(qū)與IRb區(qū)的邊界、SSC區(qū)與IRa區(qū)的邊界和LSC區(qū)與IRa區(qū)的邊界幾乎無差異,ndhF,rps15,rps19,rpl2,trnH,rpl22,psbA和ndhH基因長度相同,未顯示出較高的序列分化,其它高粱屬植物[26]的葉綠體基因組中也得到類似的結(jié)果。推測高粱屬植物的葉綠體基因組進(jìn)化較為保守。本試驗的mVISTA分析結(jié)果表明,非編碼序列變異程度明顯高于編碼序列,這與大多數(shù)被子植物中發(fā)現(xiàn)的多樣性模式一致[32]。總的來說,甜高粱葉綠體基因組的序列變異集中在非編碼序列,而編碼序列的變異較小。許多研究也表明,非編碼序列由于富含多種序列調(diào)節(jié)因子,對生物進(jìn)化和關(guān)鍵生物功能有著重要作用[33]。
同義密碼子以并不隨機(jī)的方式出現(xiàn)在不同的物種中,形成密碼子的使用偏好性。密碼子使用偏好性可以作為研究植物間葉綠體基因組進(jìn)化關(guān)系的一項重要指標(biāo)[34]。不同物種或同一物種的不同基因?qū)γ艽a子的偏性也可能不同。影響密碼子使用偏好性的關(guān)鍵因素是突變壓力和自然選擇[35]。密碼子的使用偏好性與密碼子的GC含量密切相關(guān),因密碼子第3位受到的選擇壓力影響較小,所以通常將GC3作為分析CUB的重要參數(shù)[36]。在本試驗中,甜高粱葉綠體基因組的密碼子GC含量低于50%,表明甜高粱葉綠體更傾向于使用A/T密碼子,這與其他高粱屬植物[26]的葉綠體基因組的研究結(jié)果一致。甜高粱葉綠體基因組密碼子GC3表現(xiàn)為低GC含量,這也證明了Campbell等[37]提出的“高等植物密碼子傾向于使用A/T結(jié)尾”的假設(shè)。
甜高粱葉綠體基因組的PR2-plot分析表明,甜高粱葉綠體基因組密碼子使用偏性除受到突變影響外,還受自然選擇等因素影響。甜高粱葉綠體基因組的中性繪圖分析和ENC-plot分析表明,在甜高粱的進(jìn)化過程中,其葉綠體基因組密碼子使用偏性很大程度上受自然選擇的影響,而受突變壓力的影響小。盡管突變壓力和自然選擇都可以獨立地導(dǎo)致密碼子使用偏好性的形成,但這兩種機(jī)制的組合和長時間的累積效應(yīng)才是對甜高粱密碼子使用偏好性形成的主要原因[38]。
甜高粱葉綠體基因組中的蛋白編碼基因的密碼子同時滿足條件RSCU>1和ΔRSCU≥0.08的密碼子共14個,即ACU,UAG,CCU,CUA,GCU,AGU,GAU,UUA,CGU,GAA,GUU,UCA,CAU,UGU,這些密碼子除一個密碼子以G結(jié)尾之外,其它均以A,U結(jié)尾,被確定為甜高粱葉綠體基因組的最優(yōu)密碼子,這說明了甜高粱在密碼子的使用偏向于第三個密碼子位置為A和U,有較強(qiáng)的A/U堿基偏好性。本試驗結(jié)果與蒺藜苜蓿(MedicagotruncatulaGaertn.)[39]等葉綠體基因的第3位密碼子偏好性趨勢一致,但與酸棗(Ziziphusjujubavar.Spinosa)[40]等的葉綠體基因分析結(jié)果存在差異。這表明密碼子使用偏好性因物種而異。
葉綠體基因在進(jìn)化過程中很少受外界影響,適合用來研究物種的進(jìn)化關(guān)系[41]。物種間的遺傳關(guān)系越近,CUB越相似,物種間的歐式平方距離越小[42]。在本試驗中,甜高粱(TGL,產(chǎn)地:江蘇宿遷)與來自韓國的高粱栽培種MT333845,MT333848和MT459453親緣關(guān)系較近,但與來自韓國的高粱栽培種MT333846,MT333847、美國的高粱栽培種NC_008602、AC144549以及中國唐山高粱栽培種MK348612關(guān)系較遠(yuǎn)。由于,甜高粱(Sorghumbicolor)是粒用高粱的一個變種[43],據(jù)此推測,甜高粱與近緣種出現(xiàn)較大差異也可能與其為變種相關(guān)。
甜高粱葉綠體基因組長度為140 644 bp,具有LSC,SSC,IRa和IRb之四分體結(jié)構(gòu)。31個SSR位點均為單核苷酸SSR。堿基組成偏向使用A或T。甜高粱及其14個近緣種的葉綠體基因組變化不大。甜高粱葉綠體基因組IR區(qū)邊界未發(fā)生明顯的收縮與擴(kuò)張。甜高粱葉綠體基因組密碼子的使用偏好性主要受到自然選擇的影響,但其他因素如突變壓力在一定程度上也會影響甜高粱葉綠體基因組密碼子的使用偏好性。確定了14個最優(yōu)密碼子,甜高粱(TGL,產(chǎn)地:江蘇宿遷)與來自韓國的高粱栽培種MT333845,MT333848和MT459453親緣關(guān)系較近。以上研究結(jié)果為完善高粱屬植物分子育種技術(shù)和探究高粱屬植物系統(tǒng)發(fā)育提供了參考。