袁燦 彭芳 楊澤茂 鐘文娟 牟方生 龔一耘 戢沛城
[摘要] 該研究通過組裝川芎根轉(zhuǎn)錄組數(shù)據(jù)獲得24 422個(gè)unigene,隨后對(duì)得到的unigene進(jìn)行了SSR檢測,共檢測到 4 073個(gè)SSR位點(diǎn)。對(duì)檢測到的ESTSSR進(jìn)行特征分析,結(jié)果顯示單核苷酸重復(fù)最多,占41.0%。SSR所在序列功能注釋結(jié)果顯示在Nr中有2 201條序列能夠被注釋,同時(shí)SSR所在序列還被注釋到49個(gè)GO分類和242個(gè)KEGG代謝通路中。利用SSR檢測結(jié)果進(jìn)行了ESTSSR標(biāo)記開發(fā),合成其中235對(duì)引物進(jìn)行驗(yàn)證,74對(duì)擴(kuò)增效果較好。利用74對(duì)ESTSSR引物對(duì)34個(gè)川芎資源進(jìn)行遺傳多樣性分析,結(jié)果顯示收集的川芎資源多樣性較好,UPGMA聚類顯示川芎資源分為兩大類,聚類結(jié)果表現(xiàn)出一定的地域性,PCoA分析與UPGMA聚類結(jié)果類似。該研究首次對(duì)川芎進(jìn)行ESTSSR分析和標(biāo)記開發(fā),對(duì)推動(dòng)川芎資源遺傳多樣性研究、品種純度檢測、基因定位和分子育種等具有重要意義。
[關(guān)鍵詞] 川芎; ESTSSR; 功能注釋; 標(biāo)記開發(fā); 遺傳多樣性
ESTSSR identification, markers development of Ligusticum chuanxiong
based on Ligusticum chuanxiong transcriptome sequences
YUAN Can1, PENG Fang1, YANG Zemao2, ZHONG Wenjuan1, MOU Fangsheng1,
GONG Yiyun1, JI Peicheng1, PU Deqiang1, HUANG Haiyan1, YANG Xiao1*, ZHANG Chao1*
(1. Industrial Crop Research Institute, Sichuan Academy of Agricultural Sciences, Chengdu 610300, China;
2. Institute of Bast Fiber Crops, Chinese Academy of Agricultural Sciences, Changsha 410205, China)
[Abstract] Ligusticum chuanxiong is a wellknown traditional Chinese medicine plant. The study on its molecular markers development and germplasm resources is very important. In this study, we obtained 24 422 unigenes by assembling transcriptome sequencing reads of L. chuanxiong root. ESTSSR was detected and 4 073 SSR loci were identified. ESTSSR distribution and characteristic analysis results showed that the mononucleotide repeats were the main repeat types, accounting for 41.0%. In addition, the sequences containing SSR were functionally annotated in Gene Ontology (GO) and KEGG pathway and were assigned to 49 GO categories, 242 KEGG pathways, among them 2 201 sequences were annotated against Nr database. By validating 235 ESTSSRs,74 primer pairs were ultimately proved to have high quality amplification. Subsequently, genetic diversity analysis, UPGMA cluster analysis, PCoA analysis and population structure analysis of 34 L. chuanxiong germplasm resources were carried out with 74 primer pairs. In both UPGMA tree and PCoA results, L. chuanxiong resources were clustered into two groups, which are believed to be partial related to their geographical distribution. In this study, ESTSSRs in L. chuanxiong was firstly identified, and newly developed molecular markers would contribute significantly to further genetic diversity study, the purity detection, gene mapping, and molecular breeding.
[Key words] Ligusticum chuanxiong; ESTSSR; functional annotation; development of molecular marker; genetic diversityendprint
川芎Ligusticum chuanxiong為傘形科藁本屬藥用植物,始載于《神農(nóng)本草經(jīng)》[1],以其干燥根莖入藥,是我國傳統(tǒng)大宗中藥材。四川的彭州和都江堰為川芎道地產(chǎn)區(qū)[23] 。其味辛、性溫,有活血行氣、祛風(fēng)止痛功效,用于治療頭痛、風(fēng)濕、月經(jīng)不調(diào)等。
近年來,川芎活性成分、藥理藥效研究較多,已分離出阿魏酸、藁本內(nèi)酯[47]和多糖[8]等多種有效成分,具有擴(kuò)張血管、抗血小板聚集和血栓形成、鈣拮抗等作用。然而川芎遺傳多樣性、DNA指紋圖譜、基因定位、遺傳圖譜構(gòu)建、分子育種等研究卻鮮有報(bào)道。川芎中能夠用于上述研究的分子標(biāo)記甚少,僅一些通用引物如RAPD[9],ISSR[1011],ITS[1213]等,極大的限制了川芎功能基因定位、分子育種等相關(guān)研究。
微衛(wèi)星序列又稱簡單重復(fù)序列(SSR)、短串聯(lián)重復(fù)序列,由若干個(gè)串聯(lián)重復(fù)單元組成,每單元含1~10個(gè)核苷酸,廣泛分布在真核生物基因組中[14]。SSR具有標(biāo)記之間密度大、材料間多態(tài)性好、易擴(kuò)增、重復(fù)性高等優(yōu)點(diǎn)[1516],已在水稻[17],玉米[18],小麥[19]等作物的分子育種等研究上廣泛應(yīng)用。隨著EST數(shù)據(jù)庫不斷豐富和高通量測序技術(shù)發(fā)展,ESTSSR在藥用植物上也被大量開發(fā)和應(yīng)用[20],已有紅花[21]、丹參[22]、黨參[23]、人參[24]、西洋參[25]、金銀花[26]等開發(fā)了ESTSSR,這些標(biāo)記逐漸代替通用引物應(yīng)用于藥用植物遺傳多樣性、基因定位、道地性鑒定等研究。本研究對(duì)川芎根轉(zhuǎn)率組測序數(shù)據(jù)拼接組裝,對(duì)unigene進(jìn)行SSR位點(diǎn)檢測,對(duì)檢測到的ESTSSR進(jìn)行分布規(guī)律等特征分析,同時(shí)對(duì)SSR所在序列進(jìn)行功能注釋和代謝通路分析。隨后利用SSR檢測結(jié)果進(jìn)行ESTSSR標(biāo)記開發(fā)并驗(yàn)證其有效性,利用效果較好的標(biāo)記對(duì)都江堰、彭州等主產(chǎn)地進(jìn)行了川芎遺傳多樣性檢測、聚類分析、PCoA分析、群體結(jié)構(gòu)分析。旨在后續(xù)川芎基因定位、遺傳作圖、品種標(biāo)準(zhǔn)化、分子育種等研究奠定基礎(chǔ)。
1 材料和方法
1.1 數(shù)據(jù)來源 材料為彭州、都江堰等地收集的川芎資源34份(表1),統(tǒng)一種植于四川省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物育種栽培研究所青白江基地。測序數(shù)據(jù)來源于NCBI SRA數(shù)據(jù)庫(SRX621358)。
1.2 原始測序數(shù)據(jù)質(zhì)量查看、拼接和ESTSSR 統(tǒng)計(jì) 用FastQC查看測序數(shù)據(jù)的質(zhì)量信息[Q=-10log10(e),e為測錯(cuò)的概率,如Q10時(shí),e=1/10],利用Trinity[27]對(duì)clean data進(jìn)行組裝,利用MISA對(duì)得到的unigene進(jìn)行SSR統(tǒng)計(jì)(檢測標(biāo)準(zhǔn)為單堿基重復(fù)≥10,二堿基重復(fù)≥6,三堿基重復(fù)≥5,四堿基重復(fù)≥5,五堿基重復(fù)≥5,六堿基重復(fù)≥5)。
1.3 SSR序列注釋 利用BLAST+(ncbiblast2.2.28+,evalue<1e-5)[28]將SSR所在的unigene序列與Swissprot,TrEMBL,Nr,Nt,CDD數(shù)據(jù)庫進(jìn)行比對(duì)注釋,同時(shí)利用hmmscane將unigene與Pfam[29]數(shù)據(jù)庫進(jìn)行比對(duì)注釋(evalue=0.01)。最后利用CDD和GO比對(duì)結(jié)果將unigene進(jìn)行KOG和GO分類[30],利用KAAS[31]將unigene比對(duì)KEGG(Kyoto Encyclopedia of Genes and Genomes)數(shù)據(jù)庫對(duì)SSR所在的unigene進(jìn)行代謝通路映射分析。
1.4 ESTSSR 引物設(shè)計(jì)與驗(yàn)證 利用Primer 3和MISA運(yùn)行結(jié)果進(jìn)行SSR引物的設(shè)計(jì)(設(shè)計(jì)參數(shù)為GC量30%~70%, Tm 57~59 ℃,引物長度18~23 bp, 預(yù)期擴(kuò)增產(chǎn)物長度80~300 bp),隨機(jī)挑選部分引物由合成。利用CATB法提取川芎DNA,利用分光光度計(jì)檢測DNA質(zhì)量,PCR擴(kuò)增體系[Taq酶(5 U·μL-1) 0.2 μL、引物(10 mmol·L-1)2 μL,dNTP(2.5 mmol·L-1) 2 μL,10×Buffer(25 mmol·L-1) 2 μL,ddH2O 11.8 μL]。在PCR 產(chǎn)物中加入5 μL 的dilution buffer,最后一孔加25 μL DNA Ladder(30~1 500 bp),30~1 500 bp 分離膠進(jìn)行毛細(xì)管電泳,利用毛細(xì)管電泳結(jié)果分析軟件PROSizeTM分析數(shù)據(jù),自動(dòng)生成結(jié)果:有條帶的讀數(shù)為“1”,無條帶讀數(shù)為“0”。
1.5 數(shù)據(jù)的分析與處理 利用Popgene進(jìn)行遺傳多樣性分析,分別計(jì)算Nei指數(shù)(遺傳相似系數(shù))、Shannon指數(shù)、平均有效位點(diǎn)數(shù)。利用軟件NTSYS進(jìn)行聚類分析和PCoA,聚類分析采用按非加權(quán)配對(duì)法(UPGMA)進(jìn)行,并計(jì)算GS值。利用STRUCTURE計(jì)算群體結(jié)構(gòu),不作數(shù)迭代設(shè)為10 000,將不作數(shù)迭代后的Markov Chain Monte Carlo(MCMC)設(shè)為100 000,K取值范圍1~12,10次獨(dú)立運(yùn)算重復(fù),根據(jù)Evanno等[32]的算法利用STRUCTURE HARVESTER計(jì)算ΔK。
2 結(jié)果與分析
2.1 數(shù)據(jù)的下載和拼接 從NCBI上下載川芎根轉(zhuǎn)錄組數(shù)據(jù),合計(jì)13 717 243個(gè)reads,1.1 Gb數(shù)據(jù)。通過FastQC查看測序結(jié)果,所下載數(shù)據(jù)為去接頭和去低質(zhì)量讀序的clean data,所有位置測序質(zhì)量四分位數(shù)均高于10、中位數(shù)均高于25,A/T,C/G未出現(xiàn)分離現(xiàn)象。利用Trinity進(jìn)行組裝,共拼接出50 212個(gè)轉(zhuǎn)錄本,24 422個(gè)unigene,contig N10的長度為1 182 bp,contig N50的長度600 bp,平均長度616.86 bp,最長unigene為3 899 bp,最短unigene為401 bp,所有轉(zhuǎn)錄本平均GC量為40.78%。
2.2 ESTSSR的檢測和注釋 利用MISA腳本對(duì)拼接得到unigene進(jìn)行SSR位點(diǎn)檢測。結(jié)果顯示共檢測到4 073個(gè)SSR位點(diǎn),3 602個(gè)unigene含有SSR位點(diǎn),含SSR的unigene占unigene總數(shù)的7.17%,檢測SSR頻率為8.11%(檢測出的SSR數(shù)目與unigene數(shù)目之比),平均7 604 bp 1個(gè)SSR(unigene長度與SSR次數(shù)之比),其中410個(gè)unigene含有2個(gè)或2個(gè)以上的SSR位點(diǎn),224個(gè)unigene含有2種或2種以上的SSR類型。endprint
將含有SSR的unigene序列比對(duì)Nr和Nt數(shù)據(jù)庫進(jìn)行注釋,結(jié)果顯示2 201個(gè)unigene在Nr數(shù)據(jù)庫中具有同源匹配信息,782個(gè)unigene在Nt數(shù)據(jù)庫具有同源匹配信息,分別占比對(duì)序列的61.1%,21.7%。在與Nr數(shù)據(jù)庫進(jìn)行同源比對(duì)時(shí),比對(duì)最多的物種為胡蘿卜,共計(jì)1 655條,占比對(duì)序列的45.9%。同時(shí)將unigene與SwissProt(蛋白數(shù)據(jù)庫)、TrEMBL、Pfam(蛋白結(jié)構(gòu)域注釋分類)、CDD數(shù)據(jù)庫進(jìn)行比對(duì)和注釋,注釋結(jié)果顯示分別有1 302,2 009,1 110,1 318個(gè)基因被注釋,占比對(duì)序列的36.2%,55.8%,30.8%,36.6%。
隨后將含有SSR的unigene按GO(Gene Ontology)和KOG(Eukaryotic Orthologous Groups of proteins)分類系統(tǒng)進(jìn)行分類(圖1)。SSR所在序列共計(jì)分為25個(gè)KOG類,最多一類為蛋白轉(zhuǎn)錄后修飾139個(gè),其次為一般功能預(yù)測118個(gè),最少的一類為細(xì)胞運(yùn)動(dòng)1個(gè),其次為未知蛋白2個(gè)。在GO分類中,將unigene分為細(xì)胞組分、分子功能和生物學(xué)過程3類。在GO分類中,進(jìn)一步將3大功能細(xì)分為49個(gè)小類。在生物學(xué)過程中細(xì)胞過程最多(25.6%),生物附著過程最少(0.06%);細(xì)胞組分中細(xì)胞部分最多(28.8%),細(xì)胞外基質(zhì)最少(0.03%);分子功能中結(jié)合功能最多(23.2%),最少的為通道調(diào)節(jié)激活(0.03%)。同時(shí)對(duì)unigene進(jìn)行了KEGG注釋(圖1),共計(jì)1 271個(gè)unigene在KEGG中能夠被注釋,注釋到242個(gè)代謝通路,分為30個(gè)亞組。通過對(duì)代謝通路分析發(fā)現(xiàn)其中最多映射到的為剪切體代謝通路,共計(jì)38個(gè)基因?;诖ㄜ旱乃幱锰匦钥疾炝薑EGG中一些活性成分相關(guān)的代謝通路注釋結(jié)果,結(jié)果顯示本研究共有28條序列注釋到萜類骨架生物合成、類苯基丙烷生物合成、黃酮類生物合成、固醇類生物合成等7個(gè)代謝通路中。
對(duì)全部注釋的數(shù)據(jù)庫結(jié)果進(jìn)行比對(duì)分析發(fā)現(xiàn),543個(gè)unigene在4個(gè)數(shù)據(jù)庫中都有注釋(圖1),345,24,111條序列在3個(gè)數(shù)據(jù)庫中被注釋。在KEGG中具有注釋的序列,都能在Nr數(shù)據(jù)庫中得到注釋。
2.3 ESTSSR特征和分布規(guī)律分析 根據(jù)檢測結(jié)果對(duì)SSR重復(fù)單元進(jìn)行特征分析:從重復(fù)單元的組成數(shù)量分析發(fā)現(xiàn),單核苷酸重復(fù)到六核苷酸重復(fù)全都含有。出現(xiàn)頻率最高為單核苷酸重復(fù),占總SSR的41.0%,其次為二核苷酸,占總SSR的38.5%,五核苷酸和六核苷酸重復(fù)最少,2種核苷酸共計(jì)占所有核苷酸總數(shù)的1.91%(圖2)。
從重復(fù)單元的組成堿基類型分析發(fā)現(xiàn),共計(jì)85種不同組成的重復(fù)單元,其中單核苷酸重復(fù)有2種、二核苷酸重復(fù)有4種, 三、四、五、六核苷酸重復(fù)基元分別有10,23,22,24種(表2)。
重復(fù)的92.6%;二核苷酸中CG/CG最少,AG/CT最多占總SSR的20.5%,占二核苷酸重復(fù)的55.0%;三核苷酸中ACG/CGT重復(fù)最少,ATC/GAT重復(fù)最多(表3);四核苷酸、五核苷酸、六核苷酸數(shù)量每種重復(fù)單元數(shù)量都較少,四核苷酸中ACAT/ATGT重復(fù)最多,五核苷酸中AAAAG/CTTTT和ACCCG/CGGGT重復(fù)最多,六核苷酸中ACCTCC/GGAGGT和AGCTCC/GGAGCT重復(fù)最多。
對(duì)重復(fù)單元的重復(fù)次數(shù)進(jìn)行分析發(fā)現(xiàn),單核苷酸重復(fù)中,10次單核苷酸重復(fù)最多占單核苷酸重復(fù)的45.7%;二核苷酸重復(fù)中,6次二核苷酸重復(fù)最多占二核苷酸重復(fù)的38.5%;三核苷酸重復(fù)中,5次三核苷酸重復(fù)最多占三核苷酸重復(fù)的64.4%,四核苷酸、五核苷酸、六核苷酸重復(fù)中都是4次重復(fù)最多(圖3)。
2.4 ESTSSR引物驗(yàn)證與川芎資源遺傳多樣研究 引物設(shè)計(jì)結(jié)果顯示2 616條unigene序列能夠設(shè)計(jì)引物,占含有SSR uingene序列的72.6%,本研究共計(jì)出2 765對(duì)引物。合成其中235對(duì)進(jìn)行有效性驗(yàn)證。通過毛細(xì)管電泳,共得到74對(duì)SSR引物擴(kuò)增帶譜清晰,大小在100~300,適合用于后續(xù)研究。
利用上述74對(duì)引物對(duì)從彭州、都江堰等道地產(chǎn)區(qū)收集的川芎栽培資源進(jìn)行遺傳多樣性分析,74對(duì)引物共擴(kuò)增得到多態(tài)性條帶208條。利用Popgene軟件計(jì)算各位點(diǎn)遺傳多樣性指數(shù),有效等位基因數(shù)為1.48,Nei多樣性指數(shù)0.28,Shannon信息指數(shù)0.43,結(jié)果表明34份川芎資源具有較高的遺傳多樣性。
通過聚類分析發(fā)現(xiàn)收集的川芎資源GS值在0.58~0.91,在GS等于0.59時(shí)被分為兩大類(Ⅰ,Ⅱ)(圖4)。第一類包含7個(gè)資源材料,收集于都江堰、什邡、新都、彭州,各個(gè)資源間平均GS 0.76,最小GS 0.49,這一支聚類較為分散,材料間聚類關(guān)系和地理關(guān)系不大。第二類包含27個(gè)資源材料,收集于都江堰、彭州、崇州、什邡、彭山等地,各個(gè)資源間平均GS 0.75,最小GS 0.57,其中來源于彭州的川芎主要集中于Ⅱ類中的Ⅱ1分枝中,都江堰川芎聚類則分散在多個(gè)類群。同時(shí)對(duì)34份川芎資源進(jìn)行了PCoA分析,PCoA分析結(jié)果與NTSYS一致性較高(圖5)。
通過對(duì)收集的川芎資源進(jìn)行群體結(jié)構(gòu)分析,采用ΔK最大值的方法尋找最優(yōu)K值,根據(jù)Evanno計(jì)算法得到ΔK值,在K=3時(shí)得到ΔK最大值126.7(圖6),34份川芎資源被分成3組。其中第一組與NTSYS聚類結(jié)果類似,僅一份來源彭州敖平的綠色莖桿川芎聚類結(jié)果有差異,同時(shí)這一組分類與PCoA分析結(jié)果一致性較高(圖5)。第二組主要來源于彭州川芎,也包括2份都江堰川芎資源。第三組包含資源較多,主要來源于彭州,都江堰資源僅3個(gè),在新產(chǎn)區(qū)彭山、什邡收集的少量資源也在第三組里。
3 討論
3.1 藥用植物SSR標(biāo)記的開發(fā) 最早的SSR標(biāo)記開發(fā)有包括文庫篩選法、磁珠富集法、省略篩庫法等,隨著數(shù)據(jù)庫的豐富,許多研究者也基于數(shù)據(jù)庫開發(fā)相應(yīng)的SSR[33]。近年來高通測序技術(shù)的發(fā)展和二代測序成本的降低,SSR開發(fā)軟件的更新,使SSR標(biāo)記開發(fā)簡易、高效[34]。藥用植物SSR也不斷被開發(fā)和應(yīng)用,鄧科君等[22]利用丹參EST數(shù)據(jù)庫開發(fā)丹參ESTSSR,并利用該標(biāo)記進(jìn)行了丹參種屬間親緣關(guān)系分析。謝明璐等[35]利用磁珠富集法開發(fā)了60對(duì)石斛SSR標(biāo)記,并應(yīng)用于石斛種質(zhì)純度檢測。李炎林等[36]利用轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行紅豆杉ESTSSR標(biāo)記的開發(fā),同時(shí)利用這些標(biāo)記進(jìn)行了紅豆杉遺傳圖譜構(gòu)建。本研究首次對(duì)川芎進(jìn)行SSR標(biāo)記開發(fā),共計(jì)得到4 073個(gè)SSR位點(diǎn),開發(fā)出2 765條SSR序列引物,隨機(jī)選擇235對(duì)進(jìn)行驗(yàn)證,31.5%的引物序列擴(kuò)增效果較好。新開發(fā)的標(biāo)記可用于川芎資源多樣性檢測、系統(tǒng)發(fā)育樹構(gòu)建、DNA指紋圖譜構(gòu)建、品種純度檢測、遺傳作圖、基因定位等研究。endprint
3.2 川芎ESTSSR分布與特征分析 川芎ESTSSR檢出頻率為1/7 604,高于擬南芥(1/13 830)、楊樹[37](1/14 000)、水稻[38](1/11 810)、小麥[19,38](1/15 600)、棉花[39](1/14 800),略低于大豆[38](1/7 400)、茶樹[40](1/3 680);與其他藥用植物相比,川芎ESTSSR的含量處于中等水平,低于模式藥用植物丹參[22](1/2 100)、冬凌草[41](1/3 517)、番紅花[42](1/5 670)、金銀花[26](1/4 050)、人參[24](1/5 700)、黨參[23](1/4 520),與西洋參[25](1/7 500)、野三七[43](1/7 750)相當(dāng),高于紅豆杉[36](1/18 010)、杜仲[44](1/11 610)、紅景天[45](1/8 520)、藏茵陳川西獐牙菜[46]1 /(12 600)。其中川芎、野三七、西洋參三者的ESTSSR含量接近,可能與三者同屬于傘形目有關(guān)。西洋參、野三七與人參同屬于人參屬,人參ESTSSR出現(xiàn)頻率卻較高,前人研究表明ESTSSR的檢測頻率還與檢測參數(shù)設(shè)置、基因組中轉(zhuǎn)錄比例、基因組大小、基因組低拷貝序列等[22, 47]因素有關(guān)。
大多數(shù)植物ESTSSR以二、三核苷酸重復(fù)為主要類型,藥用植物中藏紅花[42]、紅花[21]、紅景天[45]、黃花蒿[48]、刺梨[49]等以三核苷酸為主,丹參[22]、金銀花[26]、杜仲[44]、燈盞花[50]等以二核苷酸為主,但川芎ESTSSR以單核苷酸(45.7%)和二核苷酸重復(fù)(38.5%)為主(表3),與文獻(xiàn)報(bào)道的3種人參屬植物(人參、三七、西洋參)ESTSSR結(jié)果[51]相似。單核苷酸重復(fù)以A/T為主,二核苷酸重復(fù)以AG/CT為主,去掉單核苷酸重復(fù)后,二核苷酸重復(fù)占65.3%,這一特征與山核桃ESTSSR重復(fù)基元特征一致較高[52],大多數(shù)藥用植物二核苷酸重復(fù)也以AG/CT為主,由于三核苷酸重復(fù)種類較多,在各個(gè)植物間變異也較大,川芎ESTSSR三核苷酸重復(fù)以ATC/GAT、AAG/CTT為主,這與丹參[22]、人參[24]、藏紅花[42]等三核苷酸重復(fù)特征基本一致。
3.3 川芎ESTSSR功能注釋 對(duì)SSR所在序列與Nr,Nt,TrEMBL,Pfam,CDD數(shù)據(jù)庫進(jìn)行比對(duì)和注釋, 結(jié)果顯示SSR序列參與的功能較多,有轉(zhuǎn)錄調(diào)控、ATP酶催化、DNA修復(fù)等。通過對(duì)SSR進(jìn)行KOG分類,結(jié)果顯示983條序列具有KOG分類,這些SSR參與功能最多是蛋白轉(zhuǎn)錄后修飾,其中37條序列參與次生代謝。GO注釋結(jié)果顯示ESTSSR所在的序列被分為49類,其中分子功能中最多為結(jié)合功能,其次為催化活性。在細(xì)胞組分分類中細(xì)胞部分比例最多,生物學(xué)過程分類中細(xì)胞過程最多,這一結(jié)果與紅花SSR[53]和黃花蒿ESTSSR[50]所在序列GO分類結(jié)果較為相似。通過KEGG分析,SSR所在序列共計(jì)分為242個(gè)代謝通路,其中有6條序列注釋到類苯基丙烷生物合成代謝通路,與此代謝通路相關(guān)的阿魏酸為川芎主要活性成分,有7條序列注釋到與川芎另一活性成分多糖合成相關(guān)的N聚糖生物合成途徑。本研究所得到SSR所在序列注釋信息和與活性成分相關(guān)基因緊密連鎖標(biāo)記的開發(fā),將有助于川芎的功能基因研究和遺傳改良。
3.4 川芎資源遺傳多樣性和聚類分析 從川芎傳統(tǒng)道地產(chǎn)區(qū)彭州、都江堰以及新興產(chǎn)區(qū)彭山、什邡共收集川芎資源34份,資源多樣性豐富聚類分析顯示都江堰和彭州資源雖然沒有明顯的界限,但彭州收集的資源在聚類上表現(xiàn)出一定的地域關(guān)系,大部分收集的彭州資源都被聚集在Ⅱ1中,PCoA分析結(jié)果與聚類分析結(jié)果一致性較高。新興產(chǎn)區(qū)彭山、什邡等地資源與老產(chǎn)區(qū)差異不大,可能是因?yàn)樾屡d產(chǎn)區(qū)苓種主要來源于老產(chǎn)區(qū)。近年來生產(chǎn)調(diào)查發(fā)現(xiàn)都江堰川芎種植面積越來越少[54],本研究收集于都江堰產(chǎn)區(qū)的資源,對(duì)川芎基因資源的保存和川芎品種選育等都有重要意義。
[致謝] 本研究的資源收集得到成都中醫(yī)藥大學(xué)蔣桂華教授和馬逾英教授的大力支持和幫助。
[參考文獻(xiàn)]
[1] 單鋒,郝近大. 川芎(芎藭)的本草源流考[J]. 中國中藥雜志,2011,36(16):2306.
[2] 宋平順,馬瀟,張伯崇,等. 芎藭(川芎)的本草考證及歷史演變[J]. 中國中藥雜志,2000,25(7):50.
[3] 劉圓,賈敏如. 川芎品種、產(chǎn)地的歷史考證[J]. 中藥材,2001,24(5):364.
[4] 張曉琳,徐金娣,朱玲英,等. 中藥川芎研究新進(jìn)展[J]. 中藥材,2012,35(10):1706.
[5] 金玉青,洪遠(yuǎn)林,李建蕊,等. 川芎的化學(xué)成分及藥理作用研究進(jìn)展[J]. 中藥與臨床,2013,4(3):44.
[6] 郝淑娟,張振學(xué),田洋,等. 川芎化學(xué)成分研究[J]. 中國現(xiàn)代中藥,2010,12(3):22.
[7] 王文祥,顧明,蔣小崗,等. 川芎化學(xué)成分研究[J]. 中草藥,2002,33(1):6.
[8] Hu J, Jia X, Fang X, et al. Ultrasonic extraction, antioxidant and anticancer activities of novel polysaccharides from Chuanxiong Rhizome[J]. Int J Biol Macromol,2015,85:277.
[9] 羅禹,王天志,楊兵,等. 川芎和引種日本川芎的RAPD分析與鑒定[J]. 華西藥學(xué)雜志,2008,23(3):296.
[10] 王嵐,肖海波,馬逾英,等. 川芎道地性的ISSR分析[J]. 四川大學(xué)學(xué)報(bào):自然科學(xué)版,2008,45(6):1472.endprint
[11] 陳要臻,王嵐,馬逾英,等. 川芎簡單序列重復(fù)間區(qū)多態(tài)性和擴(kuò)增片段長度多態(tài)性分子標(biāo)記技術(shù)多態(tài)性比較研究[J]. 時(shí)珍國醫(yī)國藥,2009,20(6):1422.
[12] 劉玉萍,曹暉,韓桂茹,等. 中日產(chǎn)川芎的matK、ITS基因序列及其物種間的親緣關(guān)系[J]. 藥學(xué)學(xué)報(bào),2002,37(1):63.
[13] 辛天怡,李美妮,宋經(jīng)元. 川芎及其近緣物種的ITS2序列分析與鑒別研究[J]. 中國現(xiàn)代中藥,2011,13(12):18.
[14] 陸丹,牛楠,李玥瑩. SSR標(biāo)記技術(shù)在植物基因組研究上的應(yīng)用[J]. 沈陽師范大學(xué)學(xué)報(bào):自然科學(xué)版,2010,28(1):83.
[15] Song Q J, Shi J R, Singh S, et al. Development and mapping of microsatellite (SSR) markers in wheat[J]. Theor Appl Genet,2005,50(3):550.
[16] Kalia R K, Rai M K, Kalia S, et al. Microsatellite markers: an overview of the recent progress in plants[J]. Euphytica,2011,177(3):309.
[17] Moorthy K K, Babu P, Sreedhar M, et al. Identification of informative ESTSSR markers capable of distinguishing popular Indian rice varieties and their utilization in seed genetic purity assessments[J]. Seed Sci Technol,2011,39(2):282.
[18] Galvo K S, Ramos H C, Santos P H, et al. Functional molecular markers (ESTSSR) in the fullsib reciprocal recurrent selection program of maize (Zea mays L.). [J]. Genet Mol Res,2015,14(3):7344.
[19] Gao L F, Jing R L, Huo N X, et al. One hundred and one new microsatellite loci derived from ESTs (ESTSSR) in bread wheat[J]. Theor Appl Genet,2004,108(7):1392.
[20] 周曉麗,劉春生,王學(xué)勇,等. 藥用植物ESTSSR的研究進(jìn)展[C]. 西安:中華中醫(yī)藥學(xué)會(huì)中藥鑒定學(xué)術(shù)會(huì)議暨WHO中藥材鑒定方法和技術(shù)研討會(huì),2010:6.
[21] Chapman M A, Hvala J, Strever J, et al. Development, polymorphism, and crosstaxon utility of ESTSSR markers from safflower (Carthamus tinctorius L.)[J]. Theor Appl Genet,2009,120(1):85.
[22] 鄧科君,張勇,熊丙全,等. 藥用植物丹參ESTSSR標(biāo)記的鑒定[J]. 藥學(xué)學(xué)報(bào),2009,44(10):1165.
[23] 王東,曹玲亞,高建平. 黨參轉(zhuǎn)錄組中SSR位點(diǎn)信息分析[J]. 中草藥,2014,45(16):2390.
[24] 楊成君,王軍. 人參EST資源的SSR信息分析[J]. 植物生理學(xué)通訊,2008,44(1):69.
[25] 楊維澤,金航,趙振玲,等. 西洋參EST資源的SSR信息分析[J]. 西南農(nóng)業(yè)學(xué)報(bào),2011,24(1):275.
[26] 蔣超,袁媛,劉貴明,等. 基于ESTSSR的金銀花分子鑒別方法研究[J]. 藥學(xué)學(xué)報(bào),2012,47(6):803.
[27] Grabherr M G, Haas B J, Yassour M, et al. Fulllength transcriptome assembly from RNASeq data without a reference genome[J]. Nat Biotechnol,2011,29(7):644.
[28] Altschul S F, Madden T L, Schffer A A, et al. Gapped BLAST and PSIBLAST: a new generation of protein database search programs. [J]. Nucleic Acids Res,1997,25(17):3389.
[29] Finn R D, Coggill P, Eberhardt R Y, et al. The Pfam protein families database: towards a more sustainable future[J]. Nucleic Acids Res,2016,44(1):D279.
[30] Li X, Xiao X, Liang Y, et al. Analysis and functional annotation of expressed sequence tags from the aquatic midge (Chironomus plumosus) using highthroughput transcriptome sequencing[C]. 南京:第四屆昆蟲生理生化與分子生物學(xué)學(xué)術(shù)研討會(huì),2013.endprint
[31] Moriya Y, Itoh M, Okuda S, et al. KAAS: an automatic genome annotation and pathway reconstruction server[J]. Nucleic Acids Res,2007,35(suppl 2):182.
[32] Evanno G, Regnaut S, Goudet J. Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study[J]. Mol Ecol, 2005, 14(8): 2611
[33] 邵陽,范文,黃連冬,等. 基于RNAseq的崇左金花茶ESTSSR標(biāo)記開發(fā)[J]. 復(fù)旦學(xué)報(bào):自然科學(xué)版,2015,54(6):761.
[34] 李衛(wèi)國,常天俊,龔紅梅. ESTSSR及其在植物基因組學(xué)研究中的應(yīng)用[J]. 生物技術(shù),2008,18(4):90.
[35] 謝明璐,侯北偉,韓麗,等. 珍稀鐵皮石斛SSR標(biāo)記的開發(fā)及種質(zhì)純度鑒定[J]. 藥學(xué)學(xué)報(bào),2010,45(5):667.
[36] 李炎林. 紅豆杉紫杉烷代謝突變體篩選和連鎖圖譜構(gòu)建[D]. 長沙:湖南農(nóng)業(yè)大學(xué),2014.
[37] Cardle L, Ramsay L, Milbourne D, et al. Computational and experimental characterization of physically clustered simple sequence repeats in plants[J]. Genetics,2000,156(2):847.
[38] 楊素麗,明軍,劉春,等. 基于EST信息的百合SSR標(biāo)記的建立[J]. 園藝學(xué)報(bào),2008,48(7):1069.
[39] Wang C, Guo W, Cai C, et al. Characterization, development and exploitation of ESTderived microsatellites in Gossypium raimondii Ulbrich[J]. 科學(xué)通報(bào):英文版,2006,51(5):557.
[40] Wu H, Chen D, Li J, et al. De novo characterization of leaf transcriptome using 454 sequencing and development of ESTSSR markers in tea (Camellia sinensis)[J]. Plant Mol Biol Rep,2013,31(3):524.
[41] 蘇秀紅,李慶磊,陳隨清,等. 冬凌草轉(zhuǎn)錄組SSR位點(diǎn)分析及多態(tài)性初步評(píng)價(jià)[J]. 北方園藝,2016,40(4):93.
[42] 陳國慶. 番紅花EST資源的SSR信息分析[J]. 廣西植物,2011,31(1):43.
[43] 李翠婷,張廣輝,馬春花,等. 野三七轉(zhuǎn)錄組中SSR位點(diǎn)信息分析及其多態(tài)性研究[J]. 中草藥,2014,45(10):1468.
[44] 黃海燕,杜紅巖,烏云塔娜,等. 基于杜仲轉(zhuǎn)錄組序列的SSR分子標(biāo)記的開發(fā)[J]. 林業(yè)科學(xué),2013,49(5):176.
[45] 雷淑蕓,高慶波,付鵬程,等. 基于Solexa高通量測序的唐古特紅景天(Rhodiola algida)微衛(wèi)星信息分析[J]. 植物研究,2014,34(6):829.
[46] 劉越,岳春江,王翊,等. 藏茵陳川西獐牙菜轉(zhuǎn)錄組SSR信息分析[J]. 中國中藥雜志,2015,40(11):2068.
[47] 李永強(qiáng),李宏偉,高麗鋒,等. 基于表達(dá)序列標(biāo)簽的微衛(wèi)星標(biāo)記(ESTSSRs)研究進(jìn)展[J]. 植物遺傳資源學(xué)報(bào),2004,5(1):91.
[48] 王英,蔡漢強(qiáng),賈偉章. 黃花蒿EST資源的SSR信息分析及標(biāo)記開發(fā)[J]. 中國中藥雜志,2012,37(5):570.
[49] 鄢秀芹,魯敏,安華明. 刺梨轉(zhuǎn)錄組SSR信息分析及其分子標(biāo)記開發(fā)[J]. 園藝學(xué)報(bào),2015,42(2):341.
[50] 陳茵,李翠婷,姜倪皓,等. 燈盞花轉(zhuǎn)錄組中SSR位點(diǎn)信息分析及其多態(tài)性研究[J]. 中國中藥雜志,2014,39(7):1220.
[51] 楊維澤,金航,崔秀明,等. 三種人參屬植物的ESTSSR信息分析及其在三七中的應(yīng)用[J]. 基因組學(xué)與應(yīng)用生物學(xué),2011, 30(1):62.
[52] 趙國淼,曾燕如,黃有軍,等. 基于種子發(fā)育過程RNASeq的山核桃SSR位點(diǎn)分析[J]. 分子植物育種,2015,13(11):2516.
[53] Ambreen H, Kumar S, Variath M T, et al. Development of genomic microsatellite markers in Carthamus tinctorius L. (Safflower) using next generation sequencing and assessment of their crossspecies transferability and utility for diversity analysis[J]. PLoS ONE,2015,10(8):e0135443.
[54] 陳林,彭成,劉友平,等. 川芎道地藥材形成模式的探討[J]. 中國中藥雜志,2011,36(16):2303.
[責(zé)任編輯 呂冬梅]endprint