李慧,馬德志,姜明,劉溪,陳曉婷,劉振艷
(齊齊哈爾醫(yī)學(xué)院醫(yī)藥科學(xué)研究院,黑龍江 齊齊哈爾 161006)
傳統(tǒng)中藥繼承了數(shù)千年歷史精華的積累,在現(xiàn)代疾病預(yù)防和治療方面具有自身的優(yōu)越性和特點(diǎn)。隨著質(zhì)譜色譜技術(shù)的快速進(jìn)步,促進(jìn)了中藥有效成分的發(fā)現(xiàn)與鑒定,然而尚有許多中醫(yī)藥理論缺少現(xiàn)代自然科學(xué)的支撐和驗(yàn)證[1]。隨著人類基因組計(jì)劃的完成,人類探索生物的發(fā)展規(guī)律進(jìn)入了后基因組時(shí)代,轉(zhuǎn)錄組學(xué)、蛋白組學(xué)和基因組學(xué)等逐漸被廣泛應(yīng)用。其中轉(zhuǎn)錄組學(xué)的應(yīng)用最為廣泛,發(fā)展也最為迅速,不僅是研究細(xì)胞表型和功能的重要手段,也是研究基因結(jié)構(gòu)、基因功能及表達(dá)的新的研究方法[2]。廣義的轉(zhuǎn)錄組(Transcriptome)是指生物體細(xì)胞或組織在特定狀態(tài)下所轉(zhuǎn)錄出來的所有RNA的總和,包括能夠編碼蛋白質(zhì)的RNA(即mRNA)和不能編碼蛋白質(zhì)的RNA(rRNA,tRNA,microRNA等)。狹義的轉(zhuǎn)錄組指所有編碼蛋白質(zhì)的mRNA總和。
近年來,隨著DNA高通量測(cè)序技術(shù)的飛速發(fā)展,大規(guī)模測(cè)序技術(shù)(如Roche公司的454 GS-FLX、Illumina公司的Genome Analyzer II和ABI公司的AB SOLiD))的出現(xiàn)徹底顛覆了轉(zhuǎn)錄組研究的方式,由傳統(tǒng)的基因芯片技術(shù)發(fā)展到RNA測(cè)序技術(shù)(RNA-seq),也稱為轉(zhuǎn)錄組測(cè)序技術(shù)。該技術(shù)以高通量的方式揭示特定時(shí)間、特定組織或細(xì)胞中基因的全部表達(dá)情況、測(cè)定轉(zhuǎn)錄水平的SNP/Indel/SSR等遺傳多態(tài)性情況、識(shí)別相同基因的選擇性剪切或拼接情況、檢測(cè)未知基因等。目前,RNA-seq技術(shù)已成功應(yīng)用于動(dòng)物、植物、微生物等各類生物當(dāng)中。在動(dòng)物(例如:半番鴨[3]、黃牛[4]、山羊[5]等)研究中主要涉及到疾病研究、關(guān)鍵基因發(fā)掘及基因剪切等方面。而植物轉(zhuǎn)錄組研究則顯示出更加巨大的應(yīng)用潛能,例如:Wang等利用Illumina HiSeq 2000技術(shù)研究了枸橘的轉(zhuǎn)錄組序列特征,并篩選出參與冷調(diào)控途徑的相關(guān)基因與轉(zhuǎn)錄因子[6]。Zhang等研究東方百合轉(zhuǎn)錄組信息,獲得39 636條Unigene序列并篩選出156個(gè)與類黃酮生物合成途徑相關(guān)的關(guān)鍵酶基因,從而為花色形成的分子機(jī)理及分子標(biāo)記輔助育種奠定了基礎(chǔ)[7]。自2010年以來,RNA-seq技術(shù)在中藥材中的應(yīng)用也越來越廣泛,例如,人參[8]、冬蟲夏草[9]、燈籠果[10]等傳統(tǒng)中藥材都進(jìn)行了高通量轉(zhuǎn)錄組的測(cè)序和分析。
本文參考已發(fā)表的轉(zhuǎn)錄組測(cè)序研究文獻(xiàn),概括了轉(zhuǎn)錄組測(cè)序技術(shù)在藥用植物領(lǐng)域中的應(yīng)用及取得的成果,并對(duì)該技術(shù)在藥用植物中的后期研究進(jìn)行展望。
到目前為止,用于轉(zhuǎn)錄組數(shù)據(jù)獲取和分析的測(cè)序方法主要經(jīng)歷了三代技術(shù)類型的變遷(見表1):1)第一代測(cè)序技術(shù)主要有以Sanger測(cè)序作為基礎(chǔ)的SAGE(serial analysis of gene expression)和MPSS(massively parallel signature sequensing)、以PCR為基礎(chǔ)的全長(zhǎng)cDNA文庫(kù)和EST(expressed sequence tag)文庫(kù)的測(cè)序分析。2)第二代測(cè)序技術(shù)即RNA-seq技術(shù),是以Roche公司的454技術(shù)、Illumina公司的Solexa技術(shù)和ABI公司的SOLiD技術(shù)為代表的新一代測(cè)序技術(shù),該技術(shù)可實(shí)現(xiàn)快速、大批量轉(zhuǎn)錄組檢測(cè)。鑒于其通量高、分辨率高、靈敏度高、不受限制等優(yōu)點(diǎn),使得RNA-seq技術(shù)成為目前轉(zhuǎn)錄組測(cè)序研究的主導(dǎo)方法。3)第三代測(cè)序技術(shù)是近年來建立在第二代測(cè)序基礎(chǔ)之上興起的以PacBio為代表的測(cè)序技術(shù),該技術(shù)可獲得更長(zhǎng)乃至全長(zhǎng)轉(zhuǎn)錄組序列。目前,第三代測(cè)序技術(shù)應(yīng)用較少但發(fā)展迅猛,將會(huì)為組學(xué)和生物信息學(xué)研究帶來新一輪的機(jī)遇。
表1 三代轉(zhuǎn)錄組測(cè)序技術(shù)比較
RNA-seq已經(jīng)成功用于水稻、擬南芥、玉米等模式生物當(dāng)中,而大多數(shù)中藥材植物作為非模式生物,缺乏相關(guān)基因組信息。因此,RNA-seq成為藥用植物新基因挖掘、功能預(yù)測(cè)等重要的研究方法,已在國(guó)內(nèi)外大規(guī)模開展,比如丹參[17]、西洋參[18]、甘草[19]等。目前, 已經(jīng)有超過50種傳統(tǒng)藥用植物通過RNA-seq 進(jìn)行了轉(zhuǎn)錄組研究,尤其2014年以來,RNA-seq技術(shù)發(fā)展極為迅速,見表2。
表2 藥用植物轉(zhuǎn)錄組研究明細(xì)
2.2.1 藥用植物發(fā)育機(jī)制研究
長(zhǎng)期以來,中藥材種植缺乏優(yōu)良的管理與品種選育技術(shù),導(dǎo)致品種退化、抗逆性差等問題嚴(yán)重?,F(xiàn)代轉(zhuǎn)錄組技術(shù)可以從整體水平上研究藥用植物種質(zhì)資源的代謝途徑與調(diào)控機(jī)制,深入開展藥用植物轉(zhuǎn)錄組研究有助于揭示生長(zhǎng)發(fā)育過程中的關(guān)鍵影響因素,為藥用植物栽培育種提供指導(dǎo)。鄧楠等[71]利用RNA-seq技術(shù)獲得6個(gè)不同發(fā)育時(shí)期膜果麻黃種子轉(zhuǎn)錄組信息,KEGG分析表明種子萌發(fā)期間共有16 748個(gè)編碼基因參與了125個(gè)代謝通路,其中代謝途徑參與基因最多,占所有編碼基因的22.5%(3 768個(gè));其次是次生代謝產(chǎn)物生物合成途徑占11.27 %(1 888個(gè));再次是植物激素信號(hào)傳導(dǎo)編碼基因占4.54 %(761個(gè))。Mehta等[63]利用轉(zhuǎn)錄組測(cè)序技術(shù)發(fā)現(xiàn)參與番瀉葉干旱脅迫響應(yīng)的基因涉及到植物激素信號(hào)傳導(dǎo)、滲透活性物質(zhì)、活性氧清除、葉綠素代謝途徑和信號(hào)因子等方面。進(jìn)一步基因表達(dá)分析表明存在6個(gè)基因(轉(zhuǎn)錄因子MYC2,9-順式-環(huán)氧類胡蘿卜素雙加氧酶,L抗壞血酸過氧化物酶,氨基環(huán)丙烷羧酸氧化酶,8′羥化酶,WRKY轉(zhuǎn)錄因子)與干旱脅迫密切相關(guān)。唐娟[55]對(duì)3個(gè)不同品種茯苓進(jìn)行品質(zhì)特征分析和轉(zhuǎn)錄組測(cè)序研究,結(jié)果發(fā)現(xiàn)靖航一號(hào)在加工性能和有效成分含量方面占有優(yōu)勢(shì),通過轉(zhuǎn)錄組測(cè)序和基因差異表達(dá)分析發(fā)掘出673個(gè)新基因,并篩選出與茯苓多糖代謝相關(guān)的4個(gè)關(guān)鍵基因。
2.2.2 次生代謝產(chǎn)物生物合成途徑研究
次生代謝產(chǎn)物是藥用植物的重要組成部分,其種類繁多,主要有含氮有機(jī)物、生物堿、萜類、酚類、黃酮類及有機(jī)酸等。次生代謝產(chǎn)物不僅是藥用植物適應(yīng)環(huán)境壓力,提高生存競(jìng)爭(zhēng)能力,抵抗生物和非生物脅迫的重要角色,而且是具有廣泛藥用價(jià)值的生物活性物質(zhì)。藥用植物具有作用靶點(diǎn)多,組分復(fù)雜的特點(diǎn),通過轉(zhuǎn)錄組測(cè)序解析次生代謝產(chǎn)物生物合成途徑并挖掘關(guān)鍵酶基因,可為藥用植物活性成分的積累和高效利用提供科學(xué)依據(jù)。朱孝軒[72]利用二代測(cè)序技術(shù)和三代測(cè)序技術(shù)同時(shí)對(duì)長(zhǎng)春花的葉、花和根進(jìn)行轉(zhuǎn)錄組測(cè)序和分析,通過二代測(cè)序篩選出可能參與吲哚生物堿(TIAs)合成的8個(gè)P450候選基因和5個(gè)功能基因,通過三代測(cè)序發(fā)現(xiàn)了與TIAs途徑有關(guān)的轉(zhuǎn)錄因子及可能參與TIAs途徑的調(diào)控催化酶編碼基因的可變剪切,克隆了所有環(huán)烯醚萜途徑的催化酶基因并構(gòu)建了3個(gè)基因的表達(dá)模塊,為探索完整TIAs途徑在酵母中的重建奠定了基礎(chǔ)。Li等[57]研究了金釵石斛中石斛堿生物合成途徑關(guān)鍵基因,發(fā)現(xiàn)了可能參與倍半萜骨架合成相關(guān)的30個(gè)蛋白編碼基因序列,其中的MF23通過調(diào)節(jié)MVA途徑中的基因表達(dá)影響石斛堿的生物合成。并推測(cè)后修飾酶在石斛堿的生物合成中發(fā)揮了重要作用。
2.2.3 藥用植物SSR分子標(biāo)記的開發(fā)
Simple sequence repeat (SSR)分子標(biāo)記也稱為微衛(wèi)星DNA多態(tài)性標(biāo)記,由2~6 bp的基本重復(fù)單元組成。SSR分子標(biāo)記能按孟德爾規(guī)律穩(wěn)定地遺傳與分離,在藥用植物基因組中散布著大量的串聯(lián)重復(fù)序列,具有多態(tài)性高、重復(fù)性好、共顯性、覆蓋面廣、易檢測(cè)、操作簡(jiǎn)單等優(yōu)點(diǎn),已在遺傳圖譜構(gòu)建、基因定位和分子標(biāo)記輔助育種、遺傳多樣性分析和品種及純度鑒定等方面得到廣泛應(yīng)用。利用轉(zhuǎn)錄組測(cè)序獲得SSR分子標(biāo)記,可不依賴于全基因組信息,快速和廉價(jià)地獲得大量的重復(fù)序列位點(diǎn),避免全基因組測(cè)序周期長(zhǎng)、成本高的缺點(diǎn),也可避免EST-SSR信息量少的問題。目前,已廣泛應(yīng)用于丹參、沙棘、甘草、茯苓及羅漢果等多種藥用植物中。李翠婷等[73]分析了野三七轉(zhuǎn)錄組中的SSRs位點(diǎn)信息,共搜索到21 320個(gè)SSRs,分布于17 780條unigenes中,SSRs位點(diǎn)出現(xiàn)頻率為16.82%。利用15對(duì)具有多態(tài)性的引物對(duì)13個(gè)野三七材料進(jìn)行遺傳多樣性分析并將其分為2類。Liu等[74]檢測(cè)到2 446條大蒜EST-SSRs,這些序列中AGA/TCT和GAA/TTC重復(fù)基元頻率最高(66.1%),并將其中的1 506條序列設(shè)計(jì)成SSR引物。隨機(jī)選擇200對(duì)引物對(duì)大蒜及其他5個(gè)不同百合科品種進(jìn)行擴(kuò)增,有效擴(kuò)增引物分別為194對(duì)和155~186對(duì),表明這些引物具有很好的種間通用性,為圖譜構(gòu)建、QTL定位、遺傳多樣性分析和關(guān)聯(lián)作圖等提供了支撐。代嬌等[75]在16 369條厚樸轉(zhuǎn)錄組序列中共獲得8 635個(gè)SSRs位點(diǎn),出現(xiàn)頻率為52.75%。SSR 序列中單核苷酸、二核苷酸和三核苷酸為優(yōu)勢(shì)重復(fù)類型,主導(dǎo)重復(fù)基元類型為 A/T(47.16%)、AG/CT(31.74%)、AAG/CTT(6.53%)。45對(duì)引物中22對(duì)(48.89%)可以擴(kuò)增出預(yù)期大小的條帶。含SSR的Unigene與能量和氧化還原等代謝過程,以及 RNA 轉(zhuǎn)運(yùn)、剪接體和植物激素信號(hào)轉(zhuǎn)導(dǎo)等通路有關(guān),這些SSR序列的獲得將為厚樸基因挖掘和分子標(biāo)記輔助育種提供有利的工具。
本文在簡(jiǎn)要介紹轉(zhuǎn)錄組測(cè)序技術(shù)的基礎(chǔ)上,從藥用植物發(fā)育機(jī)制、次生代謝產(chǎn)物生物合成和SSR分子標(biāo)記開發(fā)等3個(gè)方面綜述了國(guó)內(nèi)外近年來在藥用植物轉(zhuǎn)錄組研究方面的應(yīng)用成果。轉(zhuǎn)錄組測(cè)序技術(shù)具有通量高、覆蓋范圍廣、精度高、不依賴于基因組參考序列等特點(diǎn),適用于所有模式和非模式生物,使得轉(zhuǎn)錄組測(cè)序成為藥用植物經(jīng)濟(jì)有效的研究工具。通過對(duì)轉(zhuǎn)錄組數(shù)據(jù)分析,將有助于挖掘新的功能基因和代謝通路,為天然藥物來源新途徑,探索藥用植物道地性形成的分子機(jī)制提供新的思路和方法。通過對(duì)次生代謝途徑關(guān)鍵酶基因的研究,為藥用植物次生代謝產(chǎn)物的生物合成與含量調(diào)控提供分子基礎(chǔ)。通過SSR分子標(biāo)記的開發(fā),構(gòu)建藥用植物指紋圖譜,為分子標(biāo)記輔助育種,種質(zhì)資源收集、鑒定與評(píng)價(jià)提供技術(shù)支撐。轉(zhuǎn)錄組的研究能夠?qū)斫馑幱弥参锏纳韺W(xué)和生物化學(xué)的各個(gè)方面提供新的信息,為中醫(yī)藥理論提供現(xiàn)代分子生物學(xué)的支撐和驗(yàn)證。
轉(zhuǎn)錄組測(cè)序技術(shù)作為后基因組時(shí)代發(fā)展起來的一項(xiàng)測(cè)序技術(shù),必將成為今后應(yīng)用最廣的分析技術(shù),將有更多的藥用植物會(huì)采用轉(zhuǎn)錄組測(cè)序方法來了解其基因的表達(dá)、功能。結(jié)合新興的蛋白質(zhì)組學(xué)、代謝組學(xué)研究,實(shí)現(xiàn)高通量與高效率的結(jié)合,助力傳統(tǒng)中藥的現(xiàn)代化進(jìn)程。