摘要:從NCBI數(shù)據(jù)庫中獲得47 913條茶樹(Camellia sinensis)EST序列,通過Cd-hit-est除去冗余序列后得到26 185條非冗余序列,利用Misa軟件分析后共發(fā)現(xiàn)8 244個微衛(wèi)星標記分布于6 283條EST序列中,平均相隔1.52 kb出現(xiàn) 1個 SSR,EST-SSR序列出現(xiàn)頻率為23. 99%。其中,單、二和三核苷酸重復(fù)為主導(dǎo)類型,占 EST-SSR 總數(shù)的 97.83%。A/T、AG/CT和AAG/CTT作為單、二和三核苷酸的優(yōu)勢重復(fù)基元,分別占所屬類型的92.99%、85.11%和26.99%。利用 Primer 5.0軟件,設(shè)計了76對引物進行多態(tài)性檢測,發(fā)現(xiàn)其中59對引物可以擴增出明顯的條帶,34對引物具有多態(tài)性,多態(tài)性比率高達57.63%,表明茶樹 EST-SSR中的多態(tài)性位點比較豐富,比較適合進行大規(guī)模的 EST-SSR多態(tài)性標記的篩選。
關(guān)鍵詞:茶樹(Camellia sinensis);EST-SSR;分布特征
中圖分類號:S571.1 文獻標識碼:A 文章編號:0439-8114(2013)24-6178-04
微衛(wèi)星DNA又稱簡單重復(fù)序列(Simple sequence repeat,SSR),是基因組中由1~6個核苷酸組成的基本單位重復(fù)構(gòu)成的一段DNA序列。與其他分子標記相比,微衛(wèi)星DNA多態(tài)性高、數(shù)量豐富并重復(fù)性好,而且具有遺傳共顯性、對基因組有很好的覆蓋性和操作簡便等特點[1-3]。根據(jù)SSR標記來源的序列性質(zhì)不同,SSR標記可分為基因組SSR(Genomic SSR,gSSR)和表達序列標簽SSR(Expressed sequence tag SSR,EST-SSR)兩種。gSSR標記是來源于整個基因組的,而EST-SSR標記則來源于基因組的轉(zhuǎn)錄區(qū)域即表達區(qū),可以直接反映功能基因的多態(tài)性,為功能基因的直接鑒定提供了可能性,具有通用性更高的優(yōu)點[4]。我國是茶樹(Camellia sinensis)的原產(chǎn)地,茶樹也是我國目前非常重要的經(jīng)濟作物。截至2013年5月,在GeneBank中可獲得47 913條茶樹EST序列, 相比2010年5月時,增加了3倍[5]?;诓铇銭ST序列信息的快速擴增,本研究對已有的茶樹EST序列中SSR信息進行了全面的發(fā)掘,對其組成、特征及分布進行了分析,同時設(shè)計了76對EST-SSR引物,并對19份茶樹樣品材料進行了多態(tài)性分析,從而開發(fā)了可以用于茶樹的EST-SSR標記,為開發(fā)新的茶樹功能基因組SSR標記提供了理論依據(jù),為建立茶樹EST-SSR標記和探索其在功能基因發(fā)掘、種質(zhì)鑒定、遺傳多樣性分析中的應(yīng)用奠定了基礎(chǔ)。
1 材料與方法
1.1 EST序列的獲得
1.2 EST-SSR的搜索與預(yù)處理
1.3 EST-SSR引物的設(shè)計與合成
1.4 基因組DNA提取與PCR擴增
試驗中所用的19份茶樹樣品材料來自中國農(nóng)業(yè)科學(xué)院茶葉研究所和湖北省農(nóng)業(yè)科學(xué)院果樹與茶葉研究所。采用天根生化科技(北京)有限公司植物基因組DNA提取試劑盒提取每個樣品材料的基因組DNA,用1%瓊脂糖凝膠電泳檢測其基因組DNA質(zhì)量,-20 ℃下保存?zhèn)溆?。PCR反應(yīng)體系為15 μL,包括2×PCR Master Mix 7.5 μL,10 μmol/L上、下游引物各 0.6 μL,基因組DNA 1.0 μL,ddH2O補至15 μL。PCR 反應(yīng)在Bio-Rad S-1000TM PCR儀上進行。反應(yīng)程序為:94 ℃預(yù)變性 4 min;94 ℃變性 30 s,最適退火溫度退火30 s,72 ℃延伸 1 min,35個循環(huán);最后 72 ℃延伸 10 min,結(jié)束后將產(chǎn)物置于4 ℃保存。PCR 擴增產(chǎn)物采用 8%聚丙烯酰胺凝膠電泳檢測其多態(tài)性,250 V 電泳 2.5 h,電泳結(jié)束后銀染顯色,并記錄。
2 結(jié)果與分析
2.1 EST-SSR分布頻率及特點
47 913條茶樹 EST 序列經(jīng)拼接處理后共獲得26 185 條無冗余、高質(zhì)量的 EST序列。運用Misa軟件對26 185條共12 552 726 bp的非冗余EST序列進行SSR 搜索得到6 283條微衛(wèi)星序列,占 EST總數(shù)的 23.99%。經(jīng)過統(tǒng)計分析發(fā)現(xiàn),1~6個堿基的排列組合重復(fù)均能被檢出,但各種類型的EST-SSR 出現(xiàn)的頻率數(shù)量大不相同,共有4 153個單核苷酸型SSR、2 935個二核苷酸型 SSR、977個三核苷酸型 SSR、76個四核苷酸型 SSR、41個五核苷酸型 SSR 及 62個六核苷酸型 SSR。
如圖1 所示,從微衛(wèi)星數(shù)目的角度分析,以單核苷酸重復(fù)的數(shù)目最多,占 50.38%;其次是二核苷酸重復(fù)和三核苷酸重復(fù),分別占 35.60%和11.85%;五核苷酸重復(fù)所占比例最低(0.50%)。單、二和三核苷酸為主要重復(fù)類型,占EST-SSR總數(shù)的97.83%,基元長度大于或等于4的核苷酸重復(fù)所占的比例極小,僅為2.17%。
2.2 EST-SSR 基元類型和比例
從圖2可以看出 ,單核苷酸重復(fù)類型中,A/T重復(fù)頻率最高,占單核苷酸重復(fù)數(shù)目的92.99%;二核苷酸重復(fù)類型中AG/CT重復(fù)數(shù)目最多(2 498個),占二核苷酸重復(fù)數(shù)目的 85.11%,AC/GT和AT/AT重復(fù)頻率相當,沒有出現(xiàn)GC/GC重復(fù)類型;三核苷酸重復(fù)10 種類型中,AAG/CTT重復(fù)頻率最高(26.99%),其次分別是ACC/CTG(21.29%)、ATC/ATG(13.20%),其他7種基元的頻率均不高于10%;四核苷酸重復(fù)類型發(fā)現(xiàn)了14種,除AAAC/GTTT(14.47%)、AAAG/CTTT(23.68%)和AAAT/ATTT(13.16%)外,其他類型重復(fù)出現(xiàn)的頻率均較低,重復(fù)數(shù)目低于10個;五、六核苷酸重復(fù)數(shù)目分別有41個和62個,但是出現(xiàn)次數(shù)都很少,均為個位數(shù)。
2.3 茶樹EST-SSR引物的多態(tài)性分析
利用Primer 5.0軟件,在26 185條 EST序列中隨機選取了其中含有SSR位點的序列進行引物設(shè)計,共設(shè)計了76對EST-SSR引物。利用這76對EST-SSR引物對19份茶樹樣品進行分析,結(jié)果發(fā)現(xiàn)其中59對引物能夠擴增出較清晰的條帶,其余17對引物無明顯條帶,即未能擴增出產(chǎn)物。在可擴增出的較清晰條帶引物中,42對引物的擴增條帶大小與預(yù)期片段大小相近,另外17對引物擴增條帶大小明顯與預(yù)期不符。其中,34對引物能夠擴增出多態(tài)性條帶,多態(tài)性引物占擴增引物的 57.63%,占所有設(shè)計引物的44.74%。圖3為引物A41、A58在19份茶樹樣品中的擴增結(jié)果,把這兩個引物結(jié)合起來足以有效區(qū)分19份茶樹樣品。
3 小結(jié)與討論
本研究對47 913條茶樹 EST序列進行了 EST-SSR特征分析。結(jié)果表明,茶樹EST序列中分布的微衛(wèi)星序列相當豐富,含不同重復(fù)基元SSR的EST序列有6 283條,約占EST序列的13.11%,該篩出率高于已報道的高梁(Sorqhum bicolor L. Moench)(3.6%)、大麥(Hordeum vulgare)(3.4%)和小麥(Triticum aestivum Linn.)(3.2%),表明茶樹EST-SSR標記具有一定的開發(fā)潛力。其中共8 244個EST-SSR序列,平均相隔1.52 kb出現(xiàn)1個SSR,出現(xiàn)頻率明顯高于小麥[7] (1/15.6 kb)、柑橘(Citrus reticulata Blanco)[8](1/5.7 kb)、大麥[9](1/6.3 kb)和楊樹(Populus L.)(1/14.0 kb)[10]等植物,這表明茶樹轉(zhuǎn)錄組中SSR數(shù)量很豐富,這種差異可能與搜索SSR的算法(如參數(shù)設(shè)定)等多種因素有關(guān)。
當4種不同的堿基隨機組合時,將可能分別產(chǎn)生 2、4、10、33、102和350種單、二、三、四、五、六核苷酸重復(fù)[11]。本研究中單核苷酸的2種重復(fù)和三核苷酸的10種重復(fù)均有出現(xiàn),二核苷酸重復(fù)中僅缺乏GC/GC重復(fù)類型,但大多數(shù)四、五和六核苷酸重復(fù)均未出現(xiàn),表現(xiàn)出明顯的偏倚性,且每一種重復(fù)類型所占比例也各不相同。單核苷酸重復(fù)是主導(dǎo)類型,其次是二核苷酸和三核苷酸。單核苷酸中A/T出現(xiàn)頻率最高,是所有單核苷酸重復(fù)類型的92.99%。在二核苷酸重復(fù)類型中所占比列最重的是AG/CT,是所有二核苷酸重復(fù)類型的85.11%,沒有出現(xiàn) CG/CG重復(fù)。三核苷酸類型中,AAG/CTT、ACC/CTG和ATC/ATG等排列組合出現(xiàn)頻率比較高,依次所占比列為26.99%、21.29%和13.20%。這與金基強等[5]報道的茶樹 EST-SSR 中的優(yōu)勢重復(fù)類型是一致的。
本研究利用EST序列共設(shè)計了76對 EST-SSR引物,并對19份茶樹樣品進行了檢測分析,共篩選出具有多態(tài)性的SSR引物34對,多態(tài)性引物比例為 44.74%。有17對引物不能進行有效擴增,其原因可能是由于擴增區(qū)段存在較為復(fù)雜高級結(jié)構(gòu)或者是上、下游引物含有內(nèi)含子。綜上所述,茶樹EST-SSR基元重復(fù)類型豐富,多態(tài)性位點也較豐富,因此,獲得的SSR標記具有較高的可用性,對于豐富其分子標記類型及數(shù)量、建立遺傳圖譜及進行比較基因組研究都有重要意義。
參考文獻:
[1] POWELL W,MACHRAY G C,PROVAN J. Polymorphism revealed by simple sequence repeats[J]. Trends Plant Science,1996, 1(7):215-222.
[2] PARK J S, KIM J B, HAHN B S, et al. EST analysis of genes involved in secondary metabolism in Camellia sinensis(tea),using suppression subtractive hybridization[J]. Plant Sci, 2004,166(4):953-961.
[3] 周紅偉,姚艷梅,付 忠,等.春性雙低甘藍型油菜雜交種和親本指紋圖譜構(gòu)建及雜交種純度鑒定[J]. 西北農(nóng)業(yè)學(xué)報,2010,19(3):81-86.
[4] EUJAYL I, SORRELLS M, BANM M, et al. Isolation of EST-derived microsatellite markers for genotyping the A and B genomes of wheat[J]. Theor Appl Genet,2002,104(2):399-407.
[5] 金基強,崔海瑞,陳文岳,等.茶樹EST-SSR的信息分析與標記建立[J].茶葉科學(xué),2006(1):17-23.
[6] LI W Z, GODZIK A. Cd-hit: A fast program for clustering and comparing large sets of protein or nucleotide sequences[J]. Bioinformatics,2006,22(13):1658-1659.
[7] KANTETY R V, ROTA M L, MATTHEWS D E, et al. Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat[J]. Plant Mol Biol,2002,48(5/6):501-510.
[8] CHEN C X, ZHOU P, CHOI Y A, et al. Mining and characterizing microsatellites from citrus ESTs[J]. Theor Appl Genet,2006,112(7):1248-1257.
[9] THIEL T, MICHALEK W, VARSHNEY R K, et al. Exploiting EST database for the development and characterization of gene-derived SSR markers in barley (Hordeum vulgare L.)[J]. Theor Appl Genet,2003,106(3):411-422.
[10] CARDLE L, RAMSAY L, MILBOURNE D, et al. Computational and experimental characterization of physically clustered simple sequence repeats in plants[J]. Genetics,2000,156(2):847-854.
[11] ROTA L R, KANTETY R V, YU J K. Nonrandom distribution and frequencies of genomic and EST-derived microsatellite markers in rice, wheat and barley[J]. BMC Genomics,2005,6(1):23.