王會(huì)敏,蘇秀紅,2,董誠明,2,朱畇昊,2*
(1.河南中醫(yī)藥大學(xué) 藥學(xué)院,河南 鄭州 450046;2.呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心,河南 鄭州 450046)
夏枯草為唇形科夏枯草PrunellavulgarisL.的干燥果穗,味辛、苦,性寒,歸肝、膽經(jīng),具有清肝瀉火、明目、散結(jié)消腫的功能[1]。廣泛分布于全國各地,主產(chǎn)于江蘇、河南、浙江、安徽等地[2]。夏枯草既是臨床常用中藥材,又是藥食兩用之品,具有獨(dú)特的藥用和經(jīng)濟(jì)價(jià)值。近年來我國夏枯草市場(chǎng)需求量呈增加態(tài)勢(shì),使得夏枯草野生資源逐漸變得稀少。因此,急需加強(qiáng)對(duì)夏枯草種質(zhì)資源的保護(hù)和利用。目前夏枯草研究主要集中在栽培、質(zhì)量評(píng)價(jià)、臨床應(yīng)用、化學(xué)成分研究及藥理作用等方面[3],遺傳多樣性研究和分子標(biāo)記研究有廖麗等[4]利用ISSR方法分析夏枯草種質(zhì)間的遺傳多樣性;賴江琴等[5]對(duì)夏枯草不同品種間進(jìn)行RAPD分析;江建銘、沈宇峰等利用AFLP方法對(duì)夏枯草進(jìn)行種質(zhì)資源遺傳多樣性分析[6-7]。目前尚缺乏對(duì)夏枯草進(jìn)行可以大規(guī)模種質(zhì)鑒定、分子標(biāo)記輔助育種、功能基因定位等的具有種屬特異性的分子標(biāo)記研究。
簡單重復(fù)序列(simple sequence repeat,SSR)又稱微衛(wèi)星(microsatellite),是一種由1~6個(gè)核苷酸組成的串聯(lián)重復(fù)單元,廣泛分布在真核和原核生物基因組中[8]。SSR標(biāo)記是較為理想的遺傳標(biāo)記,具有數(shù)量豐富、重復(fù)性好、多態(tài)性強(qiáng)、可靠性高和共顯性遺傳易于分析等特點(diǎn),成為構(gòu)建連鎖遺傳圖譜、研究群體遺傳學(xué)、進(jìn)行分子標(biāo)記輔助育種、分析系譜、繪制品種指紋圖譜等的理想工具[9]。常用的SSR標(biāo)記主要有基因組SSR(genomic-SSR)和轉(zhuǎn)錄組SSR(EST-SSR);轉(zhuǎn)錄組SSR避免了基因組SSR標(biāo)記引物開發(fā)需要構(gòu)建文庫所帶來的步驟繁瑣、工作量大、成本高及大量人力、物力和時(shí)間投入的缺點(diǎn),同時(shí)轉(zhuǎn)錄組SSR多態(tài)性可能與基因功能直接相關(guān),在不同物種間具有良好的通用性[10]。本研究基于夏枯草轉(zhuǎn)錄組文庫高通量測(cè)序結(jié)果,利用MicroSAtellite(MISA)軟件搜索夏枯草SSR位點(diǎn)信息,分析其分布、組成特征,并進(jìn)行初步可用性評(píng)價(jià),在此基礎(chǔ)上開發(fā)設(shè)計(jì)夏枯草轉(zhuǎn)錄組SSR引物,以期為夏枯草遺傳多樣性研究和分子標(biāo)記輔助育種提供參考和基礎(chǔ)。
轉(zhuǎn)錄組測(cè)序樣本采自于河南省確山縣夏枯草GAP種植基地,經(jīng)河南中醫(yī)藥大學(xué)董誠明教授鑒定為唇形科夏枯草PrunellavulgarisL.。夏枯草轉(zhuǎn)錄組數(shù)據(jù)來自于課題組前期利用Illumina HiSeq2500測(cè)序平臺(tái)對(duì)夏枯草莖、葉、果穗進(jìn)行的轉(zhuǎn)錄組測(cè)序,測(cè)序結(jié)果使用Trinity軟件進(jìn)行從頭組裝,得到共含32 336 280 bp核苷酸的Unigene(>1 kb)5450條。
使用軟件MISA(Micro Satellite identification tool,http://www.pgrc.ipk-gatersleben.de/misa/)對(duì)夏枯草轉(zhuǎn)錄組中序列長度在1 kb以上的Unigenes進(jìn)行SSR位點(diǎn)搜索,并利用軟件Primer3對(duì)搜索到的SSR位點(diǎn)設(shè)計(jì)引物。所檢測(cè)SSR位點(diǎn)包括單核苷酸重復(fù)、二核苷酸重復(fù)、三核苷酸重復(fù)、四核苷酸重復(fù)、五核苷酸重復(fù)和六核苷酸重復(fù)6類。設(shè)置參數(shù)為單核苷酸重復(fù)至少10次、二核苷酸重復(fù)至少6次;三核苷酸重復(fù)、四核苷酸重復(fù)至少5次;五核苷酸重復(fù)和六核苷酸重復(fù)至少4次。復(fù)合SSR兩個(gè)位點(diǎn)間最大間隔堿基數(shù)為100。將生成的文本文件導(dǎo)入到Excel(Microsoft Office Excel 2016)表中,對(duì)查找到的SSR位點(diǎn)信息進(jìn)行特征分析。
利用軟件MISA搜索夏枯草轉(zhuǎn)錄組序列SSR位點(diǎn),設(shè)置的SSR最小長度均不小于12 bp。從總長度約32.34 Mb的15 443條轉(zhuǎn)錄組Unigene序列(序列長度>1 kb)中搜索到5450個(gè)SSR位點(diǎn),分布于4248條Unigene序列中,SSR發(fā)生頻率(含有SSR的Unigene數(shù)目與總Unigene的數(shù)目之比)為27.5%,出現(xiàn)頻率(檢出SSR個(gè)數(shù)與總Unigene數(shù)目之比)為35.29%。平均每相隔5.9 kp出現(xiàn)1個(gè)SSR位點(diǎn),復(fù)合型SSR有267個(gè),其中3329條Unigenes含有單個(gè)SSR,919條Unigenes含有2個(gè)或2個(gè)以上的SSR。
夏枯草轉(zhuǎn)錄組SSR重復(fù)類型較多,單核苷酸重復(fù)至六核苷酸重復(fù)都有出現(xiàn),所占比例變化較大。從SSR位點(diǎn)數(shù)量上看,二核苷酸、三核苷酸及單核苷酸重復(fù)是其優(yōu)勢(shì)重復(fù)類型,分別有2430、1550、1349個(gè),合計(jì)占總SSR位點(diǎn)數(shù)量的97.78%。其中以二核苷酸重復(fù)比例最高,占44.59%;其次是三核苷酸重復(fù)和單核苷酸重復(fù),分別為28.44%和24.75%。四、五、六核苷酸重復(fù)類型的數(shù)量較少,總計(jì)2.22%。見表1。
夏枯草轉(zhuǎn)錄組中的SSR位點(diǎn)的序列總長度達(dá)到32 336 280 bp。基序重復(fù)次數(shù)的變異引起位點(diǎn)長度的變異是產(chǎn)生SSR多態(tài)性的主要原因[8]。分析發(fā)現(xiàn),夏枯草轉(zhuǎn)錄組中SSR重復(fù)單元的重復(fù)次數(shù)集中在5~11次,隨著重復(fù)次數(shù)的增加,SSR位點(diǎn)數(shù)量隨基序長度和重復(fù)次數(shù)的變化總體上呈現(xiàn)下降趨勢(shì),其中以6次重復(fù)(1380個(gè))最多,占總SSR的25.32%,其次為重復(fù)次數(shù)5、10、7、8、11次,SSR位點(diǎn)數(shù)分別為1150、895、743、427、304個(gè),占總SSR的21.1%、16.42%、13.63%、7.8%、5.58%。統(tǒng)計(jì)5~11次重復(fù)的SSR位點(diǎn)共有5144個(gè),占94.39%;12~24次重復(fù)的SSR位點(diǎn)共有306個(gè),占5.61%,見表2。
表1 夏枯草轉(zhuǎn)錄組中SSR統(tǒng)計(jì)
在夏枯草轉(zhuǎn)錄組SSR中共發(fā)現(xiàn)160種重復(fù)基元,一到六核苷酸重復(fù)分別有4、12、60、59、20、5種,從分布頻率上看,在5450個(gè)SSR位點(diǎn)中出現(xiàn)頻率最多的基元是AG/CT(1362個(gè),約占25%),其次是A/T(1322個(gè),占24.26%)。二核苷酸重復(fù)中AG/CT占絕對(duì)優(yōu)勢(shì),其次是AT/AT(640個(gè),占11.74%)和AC/GT(425個(gè),占7.8%)。三核苷酸重復(fù)中AAG/CTT出現(xiàn)頻率最高(394個(gè),占7.23%),其次是AGC/GCT(240個(gè),占4.4%)和CCG/CGG(207個(gè),占3.8%)。四核苷酸、五核苷酸和六核苷酸中各類重復(fù)基元出現(xiàn)頻率相對(duì)較低,均在0.3%以下。在夏枯草轉(zhuǎn)錄組SSR中,還發(fā)現(xiàn)3個(gè)CG/CG的二核苷酸重復(fù)基元。見表3和圖1。
表2 夏枯草轉(zhuǎn)錄組SSR重復(fù)次數(shù)分布圖
注:“-”表示SSR數(shù)量為0。
表3 夏枯草轉(zhuǎn)錄組中不同微衛(wèi)星重復(fù)基元(motif)出現(xiàn)的頻率
注:其他重復(fù)類型為出現(xiàn)頻率在0.3%以下的重復(fù)類型。圖1 夏枯草轉(zhuǎn)錄組SSR中不同重復(fù)基元類型及不同重復(fù)基元的分布
SSR分子標(biāo)記在個(gè)體中是否具有多態(tài)性以及多態(tài)性的高低是判斷其可用性的重要依據(jù),SSR片段長度是影響其多態(tài)性高低的重要因素[11],為了提高潛在的多態(tài)性差異,增加分析結(jié)果的實(shí)用性,本研究中只搜索長度在12 bp以上的SSR。結(jié)果表明,夏枯草轉(zhuǎn)錄組中所發(fā)現(xiàn)的5450個(gè)SSR中,微衛(wèi)星長度存在顯著變異。夏枯草轉(zhuǎn)錄組SSR大部分基序長度集中在12~20 bp,共有3199個(gè),占75.97%;其次是21~30 bp,共有467個(gè),占11.1%;30 bp以上的基序數(shù)量相對(duì)較少,共有545個(gè),占12.94%。根據(jù)Temnykh等[12]提出的當(dāng)SSR長度大于或等于20 bp時(shí)多態(tài)性較高,長度在12~20 bp的SSR多態(tài)性中等,而長度在12 bp以下時(shí)多態(tài)性極低,研究結(jié)果表明夏枯草轉(zhuǎn)錄組SSR具有較高的多態(tài)性。
夏枯草轉(zhuǎn)錄組SSR出現(xiàn)的頻率較高,重復(fù)單元的類型較為豐富。從夏枯草轉(zhuǎn)錄組15 443條序列長度在1 kb以上的Unigenes進(jìn)行SSR位點(diǎn)搜索,共獲得5450個(gè)SSR位點(diǎn),這些SSR位點(diǎn)分布在4248條序列上,平均分布距離為5.93 kb,出現(xiàn)頻率35.29%。為進(jìn)一步將篩選出的夏枯草轉(zhuǎn)錄組SSR位點(diǎn)應(yīng)用于遺傳多樣性分析、遺傳圖譜構(gòu)建等分子育種相關(guān)的研究,我們對(duì)找出的SSR位點(diǎn)采用Primer 3軟件進(jìn)行引物設(shè)計(jì),每個(gè)SSR位點(diǎn)設(shè)計(jì)3對(duì)引物,共得到4228對(duì)SSR位點(diǎn)特異性引物。部分引物序列信息見表4。
本研究通過對(duì)夏枯草莖、葉、果穗3個(gè)樣本高通量測(cè)序組裝后序列長度在1 kb以上的Unigene進(jìn)行SSR位點(diǎn)分布及序列特征分析,結(jié)果發(fā)現(xiàn),從15 443條Unigenes中找到5450個(gè)SSR位點(diǎn),分布在4248條Unigenes中,平均距離為5.59 kb,跟其他檢索一至六核苷酸重復(fù)基元SSR的藥用植物相比,夏枯草轉(zhuǎn)錄組SSR的出現(xiàn)頻率明顯高于茯苓(1/17.01 kb)[13]、魚腥草(1/9.04 kb)[14]、膜莢黃芪(1/7.97 kb)[15]、連翹(1/7.9 kb)[16]、番紅花(1/5.67 kb)[17];低于枇杷(1/5.52 kb)[18]、冬凌草(1/3.52 kb)[19]、藍(lán)靛果忍冬(1/2.58 kb)[20]、杜仲(1/0.73 kb)[21]:這表明夏枯草轉(zhuǎn)錄組中SSR數(shù)量比較豐富。除此之外,在夏枯草轉(zhuǎn)錄組序列長度在1 kb以上的15 443條Unigenes中找到5450個(gè)SSR位點(diǎn),其出現(xiàn)頻率為35.29%,普遍較其他物種高,造成這種差異的原因,一方面可能與物種的特異性有關(guān),還與搜索標(biāo)準(zhǔn)設(shè)定、軟件類型、原始序列數(shù)據(jù)、長度不同有關(guān)[22]。
SSR位點(diǎn)多態(tài)性主要是因基元重復(fù)數(shù)和堿基數(shù)不同而形成的序列長度多態(tài)性[8]。夏枯草轉(zhuǎn)錄組SSR中,單核苷酸重復(fù)基元出現(xiàn)的重復(fù)次數(shù)類型相對(duì)較多且跨度大,如C/G有27種,跨度有10~24次;二核苷酸重復(fù)AG/CT有425種,6~17次。Xu等[23]認(rèn)為重復(fù)序列長度存在一個(gè)閾值,在20~30 bp,長度在閾值以下的SSR傾向于擴(kuò)張,序列長度在閾值以上的SSR傾向于收縮。夏枯草轉(zhuǎn)錄組中12~20 bp的SSR位點(diǎn)占75.97%,因而這些位點(diǎn)傾向于擴(kuò)張;長度在30 bp以上的SSR位點(diǎn)約占12.94%,這些位點(diǎn)傾向于收縮。根據(jù)上述觀點(diǎn),夏枯草轉(zhuǎn)錄組測(cè)序發(fā)掘的5450個(gè)SSR位點(diǎn)大部分具有多態(tài)性潛能,能夠應(yīng)用于分子標(biāo)記研究。此外,在夏枯草轉(zhuǎn)錄組中,基序長度在20 bp以上的SSR位點(diǎn)達(dá)到1012條,占SSR總數(shù)的18.57%,并且其中有93.09%是多態(tài)性潛能較高的低級(jí)基元一、二、三核苷酸重復(fù)序列,這部分的SSR可以作為潛在的SSR重復(fù)基元加以開發(fā)利用。
表4 夏枯草EST-SSR部分引物序列
夏枯草轉(zhuǎn)錄組中SSR種類豐富,一至六核苷酸重復(fù)類型都有出現(xiàn),二核苷酸、三核苷酸和單核苷酸重復(fù)是其優(yōu)勢(shì)重復(fù)類型,分別有2430、1550和1349個(gè),占夏枯草轉(zhuǎn)錄組SSR總數(shù)的44.59%、28.44%、24.75%,這與魚腥草[14]、連翹[16]情況相似,與多數(shù)報(bào)道的以二、三核苷酸重復(fù)為主稍有不同,出現(xiàn)這種情況可能與物種主導(dǎo)重復(fù)類型差別有關(guān);四、五、六核苷酸重復(fù)類型的數(shù)量較少,共計(jì)2.22%。在夏枯草轉(zhuǎn)錄組SSR中,AG/CT(1362個(gè),占25.00%)出現(xiàn)的頻率最高,這與煙草、茶樹、馬尾松、杏樹、魚腥草[14]、半夏[8]、胡桃[24]、番紅花[17]、丹參[25]、浮萍[26]情況一樣,其次是A/T(1322個(gè),占24.26%);在二核苷酸重復(fù)中,除AG/CT外,AT/AT(640個(gè),占11.74%)出現(xiàn)頻率最多,這與半夏[8]、杜仲[21]出現(xiàn)情況類似;在夏枯草轉(zhuǎn)錄組SSR中,三核苷酸重復(fù)種類繁多,其中以AAG/CTT(394,占25.42%)為主導(dǎo),這與半夏[8]、杜仲[21]、番紅花[17]情況相類似。這種分布差異可能與物種的組成結(jié)構(gòu)有關(guān),但也有可能與物種轉(zhuǎn)錄組SSR來源、SSR數(shù)目、密碼子偏倚、編碼相應(yīng)蛋白質(zhì)的使用頻率較高有關(guān)[22]。GC含量是堿基序列的重要特征之一,其反映基因的結(jié)構(gòu)、功能和進(jìn)化信息,GC分布不均會(huì)導(dǎo)致基因不同,GC含量序列不同其性質(zhì)和功能也有差異;在多個(gè)研究中均提到GC重復(fù)基元可能與脅迫抗性、轉(zhuǎn)錄調(diào)控、信號(hào)傳導(dǎo)等特定功能相關(guān)[27]。GC在大多數(shù)植物中很難見到或者出現(xiàn)頻率較低[11,15],本文中也僅發(fā)現(xiàn)3個(gè),出現(xiàn)頻率也很低,存在一定的偏倚。
綜上所述,在夏枯草轉(zhuǎn)錄組序列中存在豐富的SSR,且出現(xiàn)頻率高、密度大、類型多樣。同時(shí)參照前人研究結(jié)果對(duì)其多態(tài)性潛能進(jìn)行了評(píng)價(jià),發(fā)現(xiàn)具有較高的可用性。由于SSR引物在品種間具有較高的通用性,本研究結(jié)果為進(jìn)一步開發(fā)夏枯草SSR分子標(biāo)記奠定了基礎(chǔ),有助于夏枯草功能基因資源、種質(zhì)資源評(píng)價(jià)、遺傳多樣性研究等方面的研究。
[1] 國家藥典委員會(huì).中華人民共和國藥典:一部[S].北京:中國醫(yī)藥科技出版社,2015:280.
[2] 簡美玲,鄭基煥,毛潤乾.夏枯草藥材資源開發(fā)研究[J].廣東農(nóng)業(yè)科學(xué),2011,38(5):109-111.
[3] 陳蕾,周倩.夏枯草現(xiàn)代研究進(jìn)展述要[J].海峽藥學(xué),2015,27(12):9-12.
[4] 廖麗,郭巧生.夏枯草ISSR分子標(biāo)記技術(shù)的建立與體系優(yōu)化[J].中草藥,2009,40(7):1131-1135.
[5] 賴姜琴,李萍,袁藝,等.夏枯草DNA提取及RAPD反應(yīng)條件的優(yōu)化[J].天然產(chǎn)物研究與開發(fā),2007,19(1):123-126,134.
[6] 江建銘,沈宇峰,孫乙銘.利用AFLP分子標(biāo)記分析夏枯草種質(zhì)資源遺傳多樣性[J].浙江農(nóng)業(yè)學(xué)報(bào),2009,21(1):16-19.
[7] 沈宇峰,孫乙銘,沈曉霞,等.夏枯草種質(zhì)資源遺傳多樣性的AFLP分析[J].中國中藥雜志,2009,34(3):260-263.
[8] 王森,張震,姜倪皓,等.半夏轉(zhuǎn)錄組中的SSR位點(diǎn)信息分析[J].中藥材,2014,37(9):1566-1569.
[9] ?,|,趙雪,李俠,等.大豆EST-SSR標(biāo)記開發(fā)及與Genomic-SSR的比較研究[J].中國油料作物學(xué)報(bào),2009,31(2):149-156.
[10] Portis E,Nagy I,Sasvayi Z,et al.The design of Capsicum spp.SSR assays via analysis of in silico DNA sequence,and their potential utility for genetic mapping[J].Plant Sci,2007,172(3):640-648.
[11] 王東,曹玲亞,高建平.黨參轉(zhuǎn)錄組中SSR位點(diǎn)信息分析[J].中草藥,2014,45(16):2390-2394.
[12] Temnykh S,Declerck G,Lukashova A,et al.Computational and experimental analysis of microsatellites in rice(OryzasatitaL.):frequency,length variation,transposon associations,and genetic marker potential[J].Genome Res,2001,11(8):1441-1452.
[13] 何海,郭繼云,馬毅平,等.茯苓轉(zhuǎn)錄組SSR序列特征及其基因功能分析[J].中草藥,2015,46(23):3558-3563.
[14] 黎曉英,劉勝貴,王丹,等.魚腥草轉(zhuǎn)錄組SSR位點(diǎn)信息分析及其多態(tài)性研究[J].中草藥,2016,47(10):1762-1767.
[15] 常越,閆嵩,劉振鵬,等.膜莢黃芪的轉(zhuǎn)錄組測(cè)序質(zhì)量評(píng)估及其SSR位點(diǎn)信息分析的研究[J].中國中藥雜志,2016,41(8):1430-1434.
[16] 王興春,譚河林,陳釗,等.基于RNA-Seq技術(shù)的連翹轉(zhuǎn)錄組組裝與分析及SSR分子標(biāo)記的開發(fā)[J].中國科學(xué):生命科學(xué),2015,45(3):301-310.
[17] 陳國慶.番紅花EST資源的SSR信息分析[J].廣西植物,2011,31(1):43-46.
[18] 鄭婷婷,魏偉淋,楊向暉,等.基于枇杷轉(zhuǎn)錄組序列的SSR分子標(biāo)記引物開發(fā)[J].亞熱帶植物科學(xué),2015,44(4):274-278.
[19] 蘇秀紅,李慶磊,陳隨清,等.冬凌草轉(zhuǎn)錄組SSR位點(diǎn)分析及多態(tài)性初步評(píng)價(jià)[J].北方園藝,2016(4):93-96.
[20] 張慶田,李曉艷,楊義明,等.藍(lán)靛果忍冬轉(zhuǎn)錄組SSR信息分析及其分子標(biāo)記開發(fā)[J].園藝學(xué)報(bào),2016,43(3):557-563.
[21] 林開勤,李巖,趙德剛.杜仲轉(zhuǎn)錄組SSR發(fā)掘及標(biāo)記開發(fā)[J].分子植物育種,2016,14(6):1548-1558.
[22] 劉越,岳春江,王翊,等.藏茵陳川西獐牙菜轉(zhuǎn)錄組SSR信息分析[J].中國中藥雜志,2015,40(11):2068-2076.
[23] Xu X,Peng M,F(xiàn)ang Z,et.al.The direction of microsatellite mutations is dependent upon allele length[J].Nat Genet,2000,24(4):396-399.
[24] 馮怡,張智俊,張舍龍,等.胡桃EST-SSR標(biāo)記的篩選及引物設(shè)計(jì)[J].安徽農(nóng)業(yè)科學(xué),2011,39(36):22217-22219,22276.
[25] 王學(xué)勇,周曉麗,高偉,等.丹參新的EST-SSR分布規(guī)律及分子標(biāo)記的建立[J].中國中藥雜志,2011,36(3):289-293.
[26] 孫蛟龍,方揚(yáng),靳艷玲,等.浮萍轉(zhuǎn)錄組數(shù)據(jù)SSR位點(diǎn)的生物信息學(xué)分析[J].應(yīng)用與環(huán)境生物學(xué)報(bào),2015,21(3):401-405.
[27] 岳春江,陳川川,郭鳳仙,等.蒙藥冷蒿轉(zhuǎn)錄組SSR信息分析[J].中國農(nóng)業(yè)科技導(dǎo)報(bào),2016,18(6):31-43.