張聞婷,焦 萌,王繼華
(1.廣東省農(nóng)業(yè)科學(xué)院作物研究所/廣東省農(nóng)作物遺傳改良重點實驗室/廣東省道地南藥資源保護與利用工程中心,廣東 廣州 510640;2.華南農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,廣東 廣州 510642)
藥用植物被視為發(fā)現(xiàn)和開發(fā)新藥物和療法的重要自然資源。據(jù)估計,世界上約有 75% 的人口,特別是居住在發(fā)展中國家的人口,使用植物作為民間藥物的來源,以滿足他們的初級保健需求[1]。世界衛(wèi)生組織(WHO)已記錄了全球300 000 種植物中的 21 000 種具有藥用價值的植物[2]。藥用植物是各種生物活性物質(zhì)的主要來源,包括生物堿、萜類、多酚、香豆素、皂苷等。植物生物活性物質(zhì)的藥用保健功能和治療效果主要歸因于其多種生物學(xué)和藥學(xué)作用,例如抗氧化、抗菌、抗炎、抗癌、抗糖尿病活性。利用草藥治療各種人類疾病是世界性和普遍性的,因其有害反應(yīng)較少且比現(xiàn)代藥物便宜而在制藥業(yè)中受到越來越多的關(guān)注。
基因組學(xué)研究闡明了基因組序列中嵌入的遺傳組成、結(jié)構(gòu)、組織、功能、多樣性和相互作用,從基因組的分子、染色體、生化和表型水平研究變化情況,涵蓋基于基因組組裝展開的注釋功能和非功能元件、識別重復(fù)序列、研究基因組區(qū)域的表觀遺傳狀態(tài)和質(zhì)體基因組的序列信息等結(jié)構(gòu)基因組方面工作,以及基于基因轉(zhuǎn)錄、翻譯和調(diào)控展開的轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)等功能基因組方面工作。三七作為藥用成分人參皂苷的重要原料,種植歷史悠久,應(yīng)用范圍廣,經(jīng)濟價值顯著,目前已先后公布四版三七的基因組序列信息,對三七基因組信息的探索和挖掘可以為異源生產(chǎn)皂苷生物合成途徑提供寶貴資源[3-4]。中國罌粟地方品種的基因組測序擴展了這一寶貴藥用物種的可用遺傳信息,從而能夠系統(tǒng)地研究BIA 的生物合成、調(diào)控和運輸,用于農(nóng)藝和制藥目的;基因組組裝和分析將成為評估罌粟藥理學(xué)、化學(xué)成分、栽培、性狀遺傳改良和種群的未來研究的有用資源[5]?;蚪M序列為傳統(tǒng)藥材作物遺傳改良的進化、變異和性狀研究提供寶貴的資源,對藥用植物基礎(chǔ)生物學(xué)研究和應(yīng)用育種計劃都非常有價值。
本文綜述了藥用植物基因組學(xué)的最新研究進展,涵蓋藥用植物基因組測序、結(jié)構(gòu)基因組學(xué)和功能基因組學(xué)三方面研究方向,討論了藥用植物遺傳作圖、全基組組裝、質(zhì)體序列價值以及比較基因組學(xué)的應(yīng)用,并從轉(zhuǎn)錄組、蛋白組、代謝組三方面綜合分析了藥用植物功能基因組的研究策略和關(guān)注重點,在此基礎(chǔ)上,對藥用植物在表觀基因組學(xué)和泛基因組學(xué)方面進行展望,以期推動藥用植物基因組學(xué)長足發(fā)展。
基因組的 DNA 序列整合了物種起源、發(fā)育和表觀基因組調(diào)控的重要信息?;蚪M學(xué)領(lǐng)域的最新進展很大程度上歸因于增加的通量和降低的成本對DNA 進行測序的能力[6]。人類基因組計劃和其他主要的基因組測序項目推動了測序技術(shù)的發(fā)展。
由Frederick Sanger 提出的鏈終止法[7]以及Walter Gibert 發(fā)明的鏈降解法[8]被稱為第一代測序技術(shù)(FGST),是1977 年首次成功采用的測序方法,因其操作簡單、準(zhǔn)確率高、讀長較長的優(yōu)勢而被廣泛應(yīng)用,基于該技術(shù)啟動[9]并完成了人類基因組計劃[10]。雖然多種新一代測序技術(shù)(the next generation sequencing,NGS)應(yīng)運而生,但第一代測序技術(shù)因其高度的準(zhǔn)確性仍然被作為驗證新一代測序技術(shù)結(jié)果的“黃金標(biāo)準(zhǔn)”。
第一代測序技術(shù)的讀長可以達到700~1 000 bp,但每個反應(yīng)只能得到一條序列,測序通量低,無法滿足大規(guī)模的基因測序。鑒于此,第二代測序技術(shù)應(yīng)運而生,可以實現(xiàn)一次對幾十萬到幾百萬條核酸分子進行序列測定,也稱為高通量測序技術(shù)(High-throughput sequencing,HTS),其讀長和準(zhǔn)確率雖然不及第一代測序技術(shù),但HTS 的應(yīng)用使得對一個物種的轉(zhuǎn)錄組和基因組進行細致全貌的分析成為可能,幫助基因組學(xué)和分子生物學(xué)的研究取得突破性進展。二代測序平臺主要有Roche 公司的454、Illumina 公司的Solexa和Hiseq、ABI 公司的Solid、Themo fisher 公司的IonTorrent 和華大基因的BGISEQ 等,它們都基于相似的原理,實現(xiàn)邊合成邊測序[11-12]。
與二代測序相比,第三代測序技術(shù)真正實現(xiàn)了單分子測序,無PCR 擴增偏好性和GC 偏好性,具有超長的測序讀長,平均測序讀長達到10~15 kb,最長讀長40 kb,同時三代測序技術(shù)還可直接檢測堿基修飾,如DNA 甲基化等,為表觀遺傳學(xué)研究提供了有力手段。PacBio 平臺的 HiFi 模式生成 DNA 模板的長高保真循環(huán)連續(xù)一致(CCS)讀數(shù),實現(xiàn)了高精度(99.8%)的長序列測序[13]。三代測序技術(shù)正被應(yīng)用于高質(zhì)量的基因組測序及組裝相關(guān)工作。
基于納米孔的測序儀作為第四代DNA 測序技術(shù),有可能以不到 1 000 美元,甚至可能不到100 美元的價格快速可靠地對整個人類基因組進行測序,該技術(shù)使用的單分子技術(shù)使我們能夠進一步研究DNA 與蛋白質(zhì)之間,以及蛋白質(zhì)與蛋白質(zhì)之間的相互作用[14]。
隨著下一代測序技術(shù)的高速發(fā)展,基因組數(shù)據(jù)庫的主要功能已經(jīng)從數(shù)據(jù)存儲發(fā)展成為整合各種基因組信息的基因組門戶/中心,以及提供在線基因組學(xué)分析的網(wǎng)絡(luò)服務(wù)器,引領(lǐng)基因組測序和重測序項目的拼圖。迄今為止,專門針對藥用植物的基因組數(shù)據(jù)庫很少,金銀花(Lonicera japonica,http://www.gzybioinformatics.cn/LjaFGD/index.php)、杜鵑(Rhododendron,http://bioinfor.kib.ac.cn/RPGD/)和百脈根(Lotus japonicus,http://www.kazusa.or.jp/lotus/)等藥用植物已陸續(xù)建立各自獨立的基因組數(shù)據(jù)庫,迫切需要建立一個以藥用植物為重點的綜合基因組序列信息和藥理屬性相關(guān)的數(shù)據(jù)庫。
2021 年8 月,陳士林團隊在Chinese Medicine和Science China Life Sciences 雜志上分別發(fā)表了BPGD(Brazilian Pharmacopoeia Genomic Database,http://www.bpgenome.com)[15]和GPGD(Global Pharmacopoeia Genome Database,http://www.gpgenome.com)[16]數(shù)據(jù)庫相關(guān)文章,可以說是首個藥用植物基因組數(shù)據(jù)庫。這兩個數(shù)據(jù)庫是獲取和分析藥用植物DNA 條形碼數(shù)據(jù)、加速藥用植物研究并促進其市場監(jiān)管合理發(fā)展的有效平臺。
MepmiRDB 是第一個藥用植物MicroRNA(miRNA)數(shù)據(jù)庫,其中包含了29 種藥用植物miRNA 的信息(http://mepmirdb.cn/mepmirdb/index.html)[17]。由于生物活性成分的主要部分是通過次級代謝途徑產(chǎn)生的,miRNA 在調(diào)節(jié)次生代謝物的生物合成和積累對藥用植物尤為重要。
此外,已經(jīng)建立了大量的藥用植物及其衍生植物化學(xué)物質(zhì)的公共數(shù)據(jù)庫,包括UMPDB[18]、MPD3[1]、IMPPAT[19]、Phytochemica[20]、SerpentinaDB[21]、FERN Ethnomedicinal Plant Database[22]、NPACT[23]、HIT[24]、CHCD[25]、NuBBEDB[26]、NANPDB[27]等。這些數(shù)據(jù)庫對于藥用植物的傳統(tǒng)信息(包括分類學(xué)、通用名稱、位置、藥用部位和用途)、化學(xué)信息和基因組信息(依賴NCBI)給予了較為詳細的注釋,為研究藥用植物的藥效屬性提供便利。
遺傳連鎖圖譜的構(gòu)建是基因組研究中的重要環(huán)節(jié),是基因定位與克隆乃至基因組結(jié)構(gòu)與功能研究的基礎(chǔ)。傳統(tǒng)的利用正向遺傳學(xué)方法的基因定位一般是通過構(gòu)建遺傳連鎖圖譜進行,但由于多態(tài)性標(biāo)記鑒定步驟繁瑣,而且多數(shù)情況下定位精確度低、區(qū)間大,導(dǎo)致全過程耗時耗力。大多數(shù)藥用植物生長周期長,栽培歷史短,遺傳背景復(fù)雜,基因高度雜合,為建立藥用植物的遺傳圖譜帶來了較大的困難,所以目前建立的較為完善的藥用植物遺傳圖譜很少。
利用傳統(tǒng)的SSR、AFLP、RFLP、RAPD 與EST-SSR 等分子標(biāo)記構(gòu)建的藥用植物遺傳圖譜有紅菽草(Trifolium pratense)[28]、洋薊(Cynara scolymus)[29]、白玉草(Silene vulgaris)[30]和百香果(Passiflora edulis)[31]。隨著高通量測序技術(shù)的快速發(fā)展以及測序成本的不斷降低,植物基因組參考序列得以釋放促進全基因組范圍分子標(biāo)記的開發(fā),有力推動藥用植物分子遺傳圖譜的研究向著高飽和化、實用化和通用化的方向發(fā)展。例如,通過構(gòu)建雌雄異株植物戟葉酸模(Rumex hastatus)的連鎖圖譜和染色體規(guī)模的基因組組裝,發(fā)現(xiàn)低重組率可能促進植物性染色體進化[32]。此外,五節(jié)芒(Miscanthus floridulus)[33]高密度遺傳圖譜證實Hi-C 組裝的物理圖譜,兩者在染色體分配和順序方面一致;長葉薄荷(Mentha longifolia(L.)Huds.)全基因組測序和組裝,并構(gòu)建抗黃萎病和感黃萎病亞種間的遺傳圖譜,最終錨定在12 條假染色體上[34]。
藥用植物基因組大小變化范圍廣,目前已知最大的是寬瓣重樓[35],其基因組達到82.55 Gb,而我們所熟知的銀杏[36]也有9.87 Gb,此外如罌粟[5]、三七[3]、姜和地黃等物種的基因組也都大于2 Gb;基因組較小的藥用植物有掌葉覆盆子(240 Mb)、穿心蓮(270 Mb)和菟絲子(270 Mb)等。藥用植物多數(shù)都是二倍體植物,比較少數(shù)的多倍體,如地黃[37]作為同源四倍體其染色體的數(shù)目也達到4n=56,廣藿香[38]約在631 萬年前經(jīng)歷了全基因組八倍化(WGO,whole-genome octuplication)復(fù)制事件。而染色體數(shù)較少藥用植物有菘藍(2n=14)和香椿(2n=16)等。
隨著基因組測序技術(shù)的飛速發(fā)展,已有上百種藥用植物獲得了全基因組序列(圖1)。近兩年三代測序技術(shù)廣泛普及,利用二代Illumina、三代Pacbio 或Nanopore 以及Hi-C 掛載,完成了大量藥用植物染色體水平的基因組測序和組裝。本團隊通過陸續(xù)采集上百種南方道地藥材,對其中20 多種完成全基因組調(diào)查(Genome survey),并完成了巴戟天[39]的全基因組測序和組裝。巴戟天作為中國南方嶺南四大草藥之一,主根入藥廣泛用于治療各種疾病,如陽痿、不孕癥、月經(jīng)不調(diào)、風(fēng)濕病、關(guān)節(jié)痛等。巴戟天高質(zhì)量基因組組裝為了解該物種的進化、活性成分生物合成和遺傳改良提供了寶貴的基因組資源。此外,四大南藥之一的檳榔[40]基因組也已公布,益智和砂仁的基因組暫時還未破解。
圖1 完成全基因組測序和組裝的藥用植物舉例Fig.1 Examples of medicinal plants that have completed whole-genome sequencing and assembly
有意思的是藥用植物中文名相似的植物親緣關(guān)系可能離得非常遠,例如貫葉連翹和連翹其實是兩個完全不同目的物種。貫葉連翹[41]是薔薇類植物,基因組大小在373 Mb 左右,2n=2x=16,對治療抑郁癥具有一定的效用。而連翹[42]是菊類植物,基因組達到737.5 Mb,2n=2x=28,清熱解毒常用治外感風(fēng)熱。
除了被子植物外,石松門的卷柏、苔蘚植物門的地錢、松柏門的紅豆杉以及買麻藤門的買麻藤,鑒于經(jīng)濟價值和藥用價值突出,基因組序列的公布也受到廣泛關(guān)注。此外,在我們熟知的一些物種中,例如靈芝、冬蟲夏草、猴菇菌,雖然不屬于植物但具有悠久的藥材使用歷史。以上這些特殊的藥用物種均已公布基因組序列?;蚪M測序技術(shù)的發(fā)展推動了藥用植物鑒定、起源、進化、藥用化合物的分子表征、非生物脅迫抗性等研究,促進了后續(xù)功能基因組的研究,對研究藥用植物的育種栽培、代謝產(chǎn)物、功能調(diào)控和藥理屬性提供了大量生物信息和遺傳信息數(shù)據(jù)。
葉綠體是在植物、藻類和藍細菌中發(fā)現(xiàn)的具有代謝活性的半自主細胞器,其主要功能是進行光合作用,還參與脂肪酸、氨基酸、激素、維生素、核苷酸和次生代謝產(chǎn)物的生物合成[43]。葉綠體基因組可以母系遺傳,基因含量和順序高度保守,分子進化緩慢,重組率低,使其成為物種鑒定和系統(tǒng)發(fā)育研究的理想材料[44-45]。葉綠體非編碼區(qū)已成功應(yīng)用于 DNA 條形碼研究[46]。藥用植物葉綠體基因組組裝對探索葉綠體功能與其適應(yīng)性和植物化學(xué)特征之間的關(guān)系具有重要意義。
葉綠體基因組具有保守的四分體結(jié)構(gòu):一個大的單拷貝(LSC)區(qū)域、一個小的單拷貝(SSC)區(qū)域和兩個反向重復(fù)(IR)區(qū)域。葉綠體基因組分析通常從測序確定分子結(jié)構(gòu)、注釋獲得編碼基因、系統(tǒng)發(fā)育、進化和比較等方面展開。本團隊已陸續(xù)發(fā)表多種藥用植物葉綠體基因組文章,包括臺灣榕(Ficus formosana)[47]、梅片樹(Dryobalanops aromatica)[48]、涼粉草(Mesona chinensis)[49]、扁桃斑鳩菊(Vernonia amygdalina)[50]、白簕(Acanthopanax trifoliatus)[49]、華山姜(Alpinia chinensis)[51]和龍脷葉(Sauropus spatulifolius)[52]。藥用植物丹參的葉綠體基因組序列受到廣泛關(guān)注,從Salvia miltiorrhiza[53]、S.yangii[54]到S.przewalskii、S.bulleyana和S.japonica[55],陸續(xù)有丹參屬的物種葉綠體基因組被公布。2021 年6 月,有研究提供了跨屬的(Cadaba和Maerua)4 種山柑科(Capparaceae)藥用植物(即C.farinosa、C.glutenulosa、M.crassifolia和M.oblongifolia)完整葉綠體基因組[56]。此外,山槐[57]、青蒿[58]、芍藥[59]、馬兜鈴屬[60]等藥用植物的完整葉綠體基因組也陸續(xù)公布。藥用植物葉綠體基因組的研究為品種鑒定和高藥效植物選育提供了有價值的信息。
與葉綠體基因組不同的是,植物線粒體基因具有許多獨特的特征,表現(xiàn)出物種之間的廣泛差異,目前為止僅有200 多個陸地植物的線粒體基因組被公布[61]。丹參的線粒體基因組上發(fā)現(xiàn)長片段的葉綠體基因組序列,暗示兩者間的基因轉(zhuǎn)移[54]。通過對人參(Panax ginsengCA Mey)線粒體基因組進行測序和表征,開發(fā)了用于闡明人參種質(zhì)多樣性的 KASP 標(biāo)記[62]。此外,藥用植物毛茛科寬裂北烏頭(Aconitum kusnezoffii)[63]和豆科烏拉爾甘草(Glycyrrhiza uralensis)的完整線粒體基因組[64]均于2021 年發(fā)表公布。
比較基因組學(xué)通過比較不同生物的基因組序列,在分子水平上了解不同生命形式的區(qū)別,為研究生物體之間的進化與變異提供了強大工具,有助于識別物種間保守或共有的基因,以及賦予每個生物體獨特特征的序列變化。隨著測序技術(shù)的簡單化和測序成本的降低,比較基因組學(xué)作為一種梳理物種之間微妙差異的工具,在生物學(xué)研究中得到廣泛應(yīng)用。
通過對決明子(Senna tora)和其他14 個豆科植物的比較基因組分析,發(fā)現(xiàn)決明子具有豐富的物種特異基因,其中擴張的基因家族多富集在苯丙烷、異黃酮和萜烯生物合成相關(guān)基因,為研究植物中蒽醌生物合成途徑提供更多的理論依據(jù)[65]。有籽和無籽君遷子(Diospyros lotus)基因組之間的比較為闡明無籽發(fā)育提供分子基礎(chǔ)[66]。黃芩(Scutellaria baicalensis)和半枝蓮(Scutellaria barbata)的染色體水平基因組組裝實現(xiàn)兩者比較基因組分析,基于基因共線性發(fā)現(xiàn)兩物種間的染色體數(shù)目變異和結(jié)構(gòu)重排,DNA 序列水平的比對顯示兩者基因組之間大規(guī)模結(jié)構(gòu)變異,單拷貝同源蛋白重建的系統(tǒng)發(fā)育分析表明兩者與丹參(Salvia miltiorrhiza)親緣關(guān)系最密切[67]。佛手瓜(Sechium edule)、蛇瓜和南瓜的染色體共線性分析顯示佛手瓜和南瓜間存在大量同義基因塊,而佛手瓜和蛇瓜間則發(fā)生了更多的染色體間重排事件[68]。
基于罌粟地方品種CHM 和先前發(fā)表品種HN1 基因組比較,結(jié)合罌粟科其他物種的LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子的進化分析,發(fā)現(xiàn)Gypsy 和Copia 家族的大量增殖是最有可能推動罌粟基因組擴張的主要因素;CHM 和HN1 基因組中特異基因家族分析顯示,CHM 中的獨特基因主要富集在涉及碳固定和代謝的功能類別,表明CHM 作為野生種質(zhì)可以為馴化罌粟的種質(zhì)改良提供寶貴的遺傳資源[5]?;谌鷾y序技術(shù)已經(jīng)先后完成多套染色體規(guī)模的大麻全基因組組裝,包括產(chǎn)生高THC的雌性株系PK、雄性株系Finola、產(chǎn)生高CBD的CBDRx(cs10)株系、野生大麻雌性株系JL以及產(chǎn)生平衡CBD:THC 大麻素比例的雌性株系Cannbio-2,其基因組大小在600~800 Mb 范圍,BUSCO 評估證實Cannbio-2 基因組序列組裝的完整性最好[69]?;趯?0 株大麻后代栽培種的二代重測序數(shù)據(jù),與父本基因組比較分析實現(xiàn)了大麻Y 染色體的識別;拷貝數(shù)變異(CNV)和RNA表達評估確定了多個控制大麻素表達的 CNV 和抗性相關(guān)的基因[70]。除了罌粟和大麻之外,已有多個針對同種藥用植物的基因組版本公布,如黃連、姜、穿心蓮和雞蛋果等。
功能基因組學(xué)建立在結(jié)構(gòu)基因組學(xué)的基礎(chǔ)上,利用轉(zhuǎn)錄組和蛋白組等項目產(chǎn)生的大量數(shù)據(jù),試圖描述基因的功能和相互作用,側(cè)重于基因轉(zhuǎn)錄、翻譯、表達調(diào)控和蛋白質(zhì)相互作用等動態(tài)信息。
轉(zhuǎn)錄組學(xué)技術(shù)是用于研究生物體其所有RNA轉(zhuǎn)錄本總和的技術(shù),其中mRNA 在信息網(wǎng)絡(luò)中充當(dāng)瞬時中介分子,而非編碼RNA 則執(zhí)行其他各種功能。轉(zhuǎn)錄組學(xué)研究領(lǐng)域主要有兩種技術(shù):微陣列,可以量化一組預(yù)定序列;RNA 測序(RNASeq),使用高通量測序來捕獲所有序列。測量生物體基因在不同組織、環(huán)境或時間點的表達,可以提供有關(guān)基因調(diào)控方式的信息,并揭示生物體生物學(xué)的細節(jié),還可以幫助推斷以前未注釋的基因的功能[71]。雖然越來越多藥用植物的基因組序列得到解析公布,但還是有大量的藥用植物缺乏基因組信息,在功能基因和遺傳機制方面的研究遠遠不足,因此將轉(zhuǎn)錄組測序應(yīng)用于藥用植物至關(guān)重要。
藥用植物轉(zhuǎn)錄組學(xué)研究主要從4 個方面展開:功能基因挖掘、分子標(biāo)記開發(fā)、次級代謝物生物合成途徑的鑒定和藥用植物發(fā)育機制的鑒定[72]。研究者使用NGS 技術(shù)對天麻(Gastrodia elata)進行轉(zhuǎn)錄組測序和分析,鑒定出34 322 個轉(zhuǎn)錄本,其中2 007 個(5.85%)轉(zhuǎn)錄本包含至少1 個SSR,在這些SSR 中AG/CT 重復(fù)基序是最常見的,共檢測到498 個,該結(jié)果為天麻代謝、生長和發(fā)育的分子機制研究提供了更深入的了解[73]。三萜皂苷是鴨腱藤(Entada phaseoloides)中的主要生物活性化合物,通過對鴨腱藤的根、莖和葉組織進行比較轉(zhuǎn)錄組分析,鑒定了26 個細胞色素P450 和17 個與三萜皂苷生物合成相關(guān)的尿苷二磷酸糖基轉(zhuǎn)移酶候選基因,為研究三萜皂苷生物合成的功能基因組學(xué)提供便利[74]。李等人使用轉(zhuǎn)錄組測序來分析丹參不同組織對中度干旱脅迫響應(yīng)的分子機制,GO 富集分析顯示根和葉的差異轉(zhuǎn)錄本在代謝過程和催化活性中顯著富集,在中等干旱脅迫下,編碼參與苯丙烷和萜類化合物生物合成的關(guān)鍵酶的基因表達上調(diào),該研究結(jié)果為進一步研究丹參藥用成分的生物合成機制和栽培中的有效灌溉方法提供了科學(xué)依據(jù)[75]。
此外,本團隊在解析巴戟天基因組的同時,采集了莖、葉、1 年生根(AR)、3 年生根(TR)和6 年生根(SR)組織材料,并提取RNA 進行轉(zhuǎn)錄組測序;通過分析組織特異性表達的基因簇,發(fā)現(xiàn)與活性成分的合成、運輸和儲存以及防御反應(yīng)相關(guān)的基因隨著根發(fā)育而表現(xiàn)出不斷增強的表達模式,這結(jié)果為進一步揭示基因表達調(diào)控網(wǎng)絡(luò)和調(diào)控巴戟天生物活性代謝物及其衍生物的產(chǎn)生提供了基礎(chǔ)[39]。基于大麻Purple Kush 和Finola株系的轉(zhuǎn)錄組比較分析表明,許多編碼參與大麻素和前體途徑的蛋白質(zhì)的基因在Purple Kush 中的表達比在Finola 中更高,檢測到Δ9-四氫大麻酚酸合酶在Purple Kush 中有表達而在Finola中被大麻二酚酸合酶取代,從基因表達水平解釋了Purple Kush 株系可以而Finola 不能產(chǎn)生大麻素Δ9-四氫大麻酚(THC)的原因[76]。
植物蛋白質(zhì)組巨大的功能、空間和時間多樣性受到多種因素的調(diào)控,這些因素不斷改變蛋白質(zhì)的豐度、修飾、相互作用、定位和活性,以滿足植物的動態(tài)需求。剖析蛋白質(zhì)組的復(fù)雜性及其潛在的遺傳變異正引起越來越多的研究關(guān)注[77]。由于質(zhì)譜、樣品制備程序、分析軟件的顯著改進以及眾多植物物種基因組可用性的增強,現(xiàn)在可以進行大規(guī)?;谫|(zhì)譜的植物蛋白質(zhì)組學(xué)研究,并提供更全面的概述[78]。
基因組測序、計算機預(yù)測和基于質(zhì)譜的肽組學(xué)的進步促進了越來越高通量的生物活性肽的發(fā)現(xiàn),通過基于 MS 的蛋白質(zhì)組學(xué)/肽組學(xué)對三色莧(Amaranthus tricolor)氣生組織進行了分析,識別了計算機預(yù)測的抗菌肽(AMP),蛋白質(zhì)組學(xué)以高通量的方式鑒定了新型抗菌肽[79]。通過無標(biāo)記定量蛋白質(zhì)組學(xué)方法對高麗參(Korean Ginseng)的葉、根、芽和果實進行比較蛋白質(zhì)組分析,最終在4 種組織中鑒定出2 604 種顯著調(diào)節(jié)的蛋白質(zhì),并確定與人參皂苷生物合成相關(guān)的差異途徑和蛋白質(zhì),包括甲基赤蘚糖醇 4-磷酸(MEP)途徑、甲羥戊酸(MVA)途徑、UDP-糖基轉(zhuǎn)移酶(UGT)和氧化還原酶(CYP450s)[80]。通過對胡黃連(Picrorhiza kurroa)葉和根莖進行特異性蛋白質(zhì)組學(xué)分析,觀察到在CO2增強情況下與光合作用和碳代謝相關(guān)的蛋白質(zhì)豐度以組織特異性方式發(fā)生變化,該研究為藥用植物將如何應(yīng)對不斷變化的環(huán)境以及適應(yīng)性反應(yīng)提供更好的理解[81]?;趯η噍锏娜值鞍踪|(zhì)組學(xué)分析以及高(HAP)和低(LAP)青蒿素含量兩種化學(xué)型的定量靶向亞蛋白質(zhì)組學(xué)分析,分別在質(zhì)譜的結(jié)果和基因組序列注釋的基礎(chǔ)上鑒定了182和13 403 種蛋白質(zhì)[82]。雙向電泳鑒定了群心菜(Lepidium draba)缺水脅迫(6% PEG)下20 個與光合作用、能量代謝等功能相關(guān)的差異表達蛋白[83]。通過對鐵線蓮(Clematis florida)耐熱株系(PS)和熱敏感株系(SG)進行蛋白質(zhì)組學(xué)分析,在蛋白質(zhì)水平上表征兩者對熱應(yīng)激的不同耐熱反應(yīng)[84]。
總之,藥用植物的蛋白質(zhì)組學(xué)提供了關(guān)于蛋白質(zhì)的結(jié)構(gòu)、功能和翻譯后修飾、蛋白質(zhì)-蛋白質(zhì)相互作用、植物性生物活性藥物的蛋白質(zhì)靶標(biāo)、分子水平的蛋白質(zhì)-藥物相互作用以及細胞中各信號通路的信息,這些提供了對藥用植物在人類疾病細胞中的治療機制的深入了解,以及對藥用植物可遺傳性狀和生理狀態(tài)的復(fù)雜理解。在生物學(xué)或醫(yī)學(xué)背景下蛋白質(zhì)組學(xué)信息的積累有助于制定藥用植物的有效使用方法。
代謝組學(xué)是一種用于綜合分析植物化學(xué)物質(zhì)的現(xiàn)代組學(xué)技術(shù)。藥用植物生物合成的代謝產(chǎn)物作為活性成分不僅具有藥用價值,而且在植物對環(huán)境的適應(yīng)和植物抵抗外界脅迫方面發(fā)揮著不可或缺的作用。在不同的生長環(huán)境、生長階段和器官中,代謝產(chǎn)物的積累存在特定差異。盡管在異源宿主中生產(chǎn)藥用化合物的合成生物學(xué)取得了進展,但天然植物物種通常是其生產(chǎn)的最可靠和最經(jīng)濟的來源。因此,研究藥用植物的代謝成分以表征其天然代謝物多樣性并確定重要化合物的植物體內(nèi)生物合成途徑,從而制定進一步提高其含量的策略,就變得至關(guān)重要。
基于佛手瓜基因組解析,對其3、6、9 d 的果實進行代謝組的比較分析,鑒定了一系列差異表達的代謝物,幫助理解果實發(fā)育相關(guān)的代謝調(diào)控途徑[68]。研究者使用高效液相色譜技術(shù)在板藍(Strobilanthes cusia)4 個發(fā)育階段測量了不同組織(包括根、莖和葉)中3 種主要次生代謝物(indicant、indigo、indirubin)的含量,結(jié)果表明這3 種代謝物主要在葉組織中合成和積累,其次是莖,最后是根[85]。通過對生姜根莖進行發(fā)育階段的劃分并利用UHPLC-MS/MS 測定各個階段的活性化合物,發(fā)現(xiàn)在從成熟根莖到新發(fā)芽根莖的過程中,大部分氨基酸和多半脂類物質(zhì)的含量升高,而大多數(shù)有機酸、核苷酸、維生素和次級代謝物的水平趨于降低[86]。主成分分析(PCA)顯示貫葉連翹(Hypericum perforatum)和粉色西番蓮(Passiflora incarnate)之間的代謝組學(xué)特征相似,而纈草(Valeriana officinalis)和蜜蜂花(Melissa officinalis)具有不同的代謝組學(xué)特征,該結(jié)果對于分類屬性來講是一致的[87]。利用同位素和質(zhì)譜相結(jié)合的方法開展了短小蛇根草(Ophiorrhiza pumila)的代謝組分析,鑒定出獨特且多樣的含氮代謝物,其中MIA(monoterpene indole alkaloids)、IA(indole alkaloids)和蒽醌(anthraquinones)以組織特異性方式積累,在根和毛根中含量最高,在葉組織中含量低[88]。通過對黃芩和半枝蓮的根、莖、葉和花組織進行活性化合物檢測,發(fā)現(xiàn)黃芩素(Baicalein)、去甲漢黃芩素(norwogonin)、漢黃芩素(wogonin)、黃芩苷(baicalin)、去甲漢黃芩苷(norwogonoside)和漢黃芩苷(wogonoside)主要在根部積累,而野黃芩苷(scutellarin)主要分布在地上部分的器官(莖、葉和花)中,證實了生物活性化合物的器官特異定位[67]。
代謝組獲得的數(shù)據(jù)可以為藥用植物活性成分的積累和有效利用信息提供科學(xué)依據(jù)。GC-MS 和LC-MS 等基于質(zhì)譜的平臺技術(shù)進步有助于分離和鑒定多種代謝物。隨著草藥基因組計劃的實施和中醫(yī)藥合成生物學(xué)的發(fā)展,藥用植物的代謝組學(xué)研究將迎來一個蓬勃發(fā)展的新時期。
藥用植物在泛基因組學(xué)方面的研究面臨巨大挑戰(zhàn),很大原因在于藥用植物種質(zhì)資源匱乏,受全球消費需求和環(huán)境因素的影響育種工作難以開展,世界范圍內(nèi)物種加速喪失和棲息地破壞增加了藥用植物滅絕的風(fēng)險。藥用植物的育種比農(nóng)作物要復(fù)雜得多,需要考慮植物的有效成分含量、產(chǎn)量、藥用部位和生長周期,多數(shù)藥用植物的品質(zhì)與其棲息地關(guān)系緊密[89]。在多方組織和研究機構(gòu)的共同努力下,希望全球藥用植物資源保護和可持續(xù)利用戰(zhàn)略和方法可以得到廣泛普及。藥用植物表觀基因組學(xué)研究也還處于萌芽階段,從DNA 或者RNA 修飾水平關(guān)注藥用植物亞種間表型、活性化合物以及環(huán)境適應(yīng)性等方面的差異,為功能基因組研究提供寶貴的資源。
藥用植物具有顯著的經(jīng)濟和社會效益?;诮Y(jié)構(gòu)基因組學(xué)和功能基因組學(xué)展開的多組學(xué)分析,可以更全面、深入和精確地解析藥用植物復(fù)雜藥理屬性形成的分子機制和調(diào)控機理。未來幾年,基因組學(xué)的研究將以前所未有的速度揭開藥用植物化學(xué)多樣性和特殊代謝物分子功能的神秘面紗。一旦闡明了涉及藥用植物中特定化合物生物合成途徑的基因,就可以應(yīng)用合成生物學(xué)或基因組編輯在工程生物中生產(chǎn)。藥用植物基因組工程可以極大地促進藥用植物生物活性成分生物合成機制的研究,并將中藥研究推向生命科學(xué)領(lǐng)域的前沿。