閆嵩 柳馳 任偉超 劉秀波 徐姣 馬偉
(黑龍江中醫(yī)藥大學(xué),哈爾濱,150040)(開姆尼茨工業(yè)大學(xué),德國·開姆尼茨)(黑龍江中醫(yī)藥大學(xué))
柳葉芹(Czernaevialaevigataturcz.)是傘形科多年生植物。從形態(tài)學(xué)研究可知,傘形科植物的果實,因其具有豐富的變異和穩(wěn)定的結(jié)構(gòu)而成為最顯著的分類器官;傘形科物種果實的翅、油管、內(nèi)果皮、心皮柄等特征,被用于物種的分類[1-5];但也有研究認(rèn)為,這些變異的果實性狀很難推斷出傘形科物種內(nèi)部的進(jìn)化關(guān)系[6]?,F(xiàn)代藥物化學(xué)研究表明,傘形科植物具有大量的揮發(fā)油、香豆素、三萜皂苷、生物堿等多種化學(xué)成分[7]。Suleimen et al.[8]采用高效液相色譜法,成功檢測到了33種揮發(fā)油成分,除此之外還含有少量香豆素。
葉綠體是植物進(jìn)行光合作用的場所,是一種半自主復(fù)制的細(xì)胞器,具有單獨的轉(zhuǎn)錄和轉(zhuǎn)運系統(tǒng)、相對獨立的遺傳信息,其結(jié)構(gòu)和遺傳信息在研究親緣關(guān)系方面具有重要的作用[9]。葉綠體基因組具有大小適中、便于測序,且在不同物種間有良好的共線性等特點,有利于基因組之間的比較分析[10]。近幾年,隨著高通量技術(shù)的發(fā)展,葉綠體基因組在多種藥用植物[11-16]的物種鑒定及分類、系統(tǒng)發(fā)育與進(jìn)化、遺傳多樣性分析等方面得到了廣泛應(yīng)用。
柳葉芹是一種重要的藥用植物。以往關(guān)于柳葉芹的研究,主要集中在描述其形態(tài)變異和化學(xué)成分方面;但對柳葉芹的分子和進(jìn)化方面的研究減少。為此,本研究在依據(jù)本課題組前期對柳葉芹葉綠體基因組研究[17]的基礎(chǔ)上,以2020年5月31日采自黑龍江省伊春市的柳葉芹為試驗材料,利用十六烷基三甲基溴化銨法(CTAB)提取基因組DNA,采用Illumina NovaSeq平臺進(jìn)行高通量測序,得到柳葉芹完整的葉綠體基因組序列,分析柳葉芹葉綠體基因組組裝、序列特征、系統(tǒng)發(fā)育。深層次挖掘葉綠體基因組信息,對組裝后的葉綠體基因組結(jié)構(gòu)、長重復(fù)序列、簡單重復(fù)序列(SSR)位點、密碼子偏好性進(jìn)行分析,并與其他傘形科植物共同構(gòu)建系統(tǒng)發(fā)育樹。旨在為研究傘形科其他植物提供較為詳細(xì)、完善的資料,為該物種鑒定以及群體和個體水平的遺傳差異分析提供新的方法。
試驗材料:柳葉芹(Czernaevialaevigataturcz.)植物樣本,于2020年5月31日采自黑龍江省伊春市。取部分新鮮葉片用液氮處理,于超低溫低溫冰箱中-80 ℃保存;其余部分保存在黑龍江中醫(yī)藥大學(xué)藥學(xué)院(標(biāo)本號:YCL20200531T7)。
柳葉芹的DNA提取與高通量測序方法:使用十六烷基三甲基溴化銨法(CTAB)提取的基因組DNA經(jīng)檢測合格后,用機(jī)械打斷的方法(超聲波)將DNA片段化;后對片段化的DNA進(jìn)行片段純化、末端修復(fù)、3′端加A、連接測序接頭,再用瓊脂糖凝膠電泳進(jìn)行片段大小選擇,進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增形成測序文庫;建好的文庫先進(jìn)行文庫質(zhì)檢,質(zhì)檢合格的文庫用Illumina NovaSeq進(jìn)行測序(測序由武漢貝納科技服務(wù)有限公司完成)。通過SOAPnuke軟件進(jìn)行低質(zhì)量數(shù)據(jù)過濾。
柳葉芹的葉綠體基因組組裝、注釋與分析方法:使用測序數(shù)據(jù)拼接軟件(SPAdes)進(jìn)行基因組拼接,利用序列比對軟件(blastn)將拼接結(jié)果與Czernaevialaevigata(MW284876)參考基因組進(jìn)行比對分析比對,依據(jù)比對情況確定候選序列組裝結(jié)果。利用葉綠體基因組注釋軟件(PGA)[18]對柳葉芹葉綠體基因組注釋后并繪圖;運用葉綠體基因組邊界收縮擴(kuò)張在線分析軟件(IRscope)對柳葉芹和同屬傘形科5個物種以及擬南芥葉綠體基因組進(jìn)行比較分析;使用密碼子偏好性分析軟件(CodonW)對密碼子偏好性進(jìn)行分析,統(tǒng)計估算相對同義密碼子的使用頻率;采用簡單重復(fù)序列分析軟件(MISA)[19]對葉綠體進(jìn)行簡單重復(fù)序列(SSR)檢測。
柳葉芹葉綠體基因組系統(tǒng)進(jìn)化分析方法:從美國國家生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫中下載傘形科6個物種的葉綠體基因組序列,分別是北柴胡[BupleurumchinenseDC.(MN893666)]、疏葉當(dāng)歸[AngelicalaxifoliataDiels(NC_040122)]、林當(dāng)歸[AngelicasylvestrisLinnaeus(MN275034)]、細(xì)苞藁本[LigusticumcapillaceumWolff(NC_049051)]、歐芹[Petroselinumcrispum(Mill.) Hill(NC_015821)]、擬南芥[Arabidopsisthaliana(L.) Heynh.]葉綠體基因組(NC_000932),并將其作為外類群參與系統(tǒng)進(jìn)化分析。通過核苷酸序列多重比對軟件(MAFFT),對上述7個物種葉綠體基因組序列進(jìn)行多重比對,導(dǎo)出的比對序列利用系統(tǒng)進(jìn)化分析軟件(MEGA 7.0)構(gòu)建鄰接樹;自舉檢測值為1 000。
柳葉芹的葉綠體基因組呈現(xiàn)雙螺旋環(huán)狀結(jié)構(gòu)(見圖1),基因組全長146 161 bp,包括2個反向重復(fù)序列(IRa區(qū)長度為17 422 bp、IRb區(qū)長度為17 422 bp)、1個大單拷貝區(qū)(LSC區(qū)長度為93 538 bp)、1個小單拷貝區(qū)(SSC區(qū)長度為17 779 bp)?;蚪M中包含有2個基因間隔(Gap),DNA的4種堿基中鳥嘌呤和胞嘧啶所占的比例(GC)為37.54%,組裝覆蓋度為224.3。
圖1 柳葉芹葉綠體基因組圖譜
通過對柳葉芹葉綠體基因組進(jìn)行注釋,共得到113個基因(見表1),可將其分為4個大類:自身復(fù)制、光合作用、其它基因、未知功能。具有自我復(fù)制功能的基因共70個,參與光合作用的基因共33個基因,其它基因共5個,未知功能基因共5個。
表1 葉綠體基因組的基因
柳葉芹與其他6種植物的LSC/IRb、IRb/SSC、SSC/IRa、IRa/LSC邊界及基因分布見圖2。柳葉芹與疏葉當(dāng)歸、林當(dāng)歸、細(xì)苞藁本的LSC/IRb的交界處,存在完整的ycl2基因。細(xì)苞藁本Ndhf基因,完整地存在于IRb/SSC交界處;而柳葉芹、疏葉當(dāng)歸、林當(dāng)歸的Ndhf基因,僅存在于SSC區(qū)一側(cè),且距邊界11~22 bp。柳葉芹、疏葉當(dāng)歸、林當(dāng)歸3個物種在IRa區(qū)域含有完整的trnL基因,同時柳葉芹在該區(qū)域還有1個完整的ndhB基因,而在疏葉當(dāng)歸、林當(dāng)歸中不存在ndhB基因。
圖2 柳葉芹葉綠體基因組的反向重復(fù)區(qū)域和單拷貝區(qū)域邊界
所有的長重復(fù)序列包括3種類型,包括正向重復(fù)序列、回文重復(fù)序列、串聯(lián)重復(fù)序列,這些長重復(fù)序列具有促進(jìn)葉綠體基因組重排的功能,并且可以增加其居群遺傳多樣性。在柳葉芹葉綠體基因組中,共發(fā)現(xiàn)5個正向重復(fù)序列、3個回文重復(fù)序列、4個串聯(lián)重復(fù)序列。其中1個回文重復(fù)序列較長(為17 422 bp),是葉綠體基因組的反向重復(fù)區(qū)(IR),其余重復(fù)序列長度較短(均在100 bp左右)。利用這些重復(fù)序列,可為后期開發(fā)種群進(jìn)化標(biāo)記提供研究基礎(chǔ)。
簡單重復(fù)序列,是由基因組中1到6個核苷酸組成的基本單位重復(fù)多次構(gòu)成的一段DNA序列,廣泛存在于基因組的各個區(qū)域,具有結(jié)構(gòu)簡單、相對保守等優(yōu)點,可用于遺傳多態(tài)性研究[20-21]。通過對柳葉芹葉綠體基因組的分析,共有205個簡單重復(fù)序列位點,包括:138個復(fù)雜重復(fù)類型,其數(shù)量最多;沒有單核苷酸重復(fù)類型;52個二核苷酸重復(fù)類型;2個三核苷酸重復(fù)類型;8個四核苷酸重復(fù)類型;1個五核苷酸重復(fù)類型。97.56%的簡單重復(fù)序列位點都含有腺嘌呤(A)-胸腺嘧啶(T)的堿基對,僅有5個簡單重復(fù)序列位點由鳥嘌呤(G)-胞嘧啶(C)堿基對組成,說明腺嘌呤(A)-胸腺嘧啶(T)堿基對具有堿基偏好性。從堿基組成方面分析,這與柳葉芹葉綠體基因組中腺嘌呤(A)-胸腺嘧啶(T)堿基對比例較高(62.38%)相一致。
葉綠體基因組的聚類分析,對植物發(fā)育進(jìn)化研究具有重要意義。本研究選用5種已報道的傘形科植物葉綠體基因組,并以擬南芥的葉綠體基因組作為外類群,通過構(gòu)建鄰接樹(NJ-tree),對柳葉芹進(jìn)行進(jìn)化分析,以確定其在傘形科植物中的進(jìn)化位置(見圖3)。由圖3可見:不同科的植物分為不同的進(jìn)化分支,6種傘形科植物聚在1個分支上,說明植物科間關(guān)系明確。在這個大的分支基礎(chǔ)上,柳葉芹與同屬物種聚到一支上,并且自展值為100,說明柳葉芹與同屬物種在漫長的進(jìn)化過程中親緣關(guān)系最為接近。
圖3 依據(jù)柳葉芹和6個物種葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹
葉綠體基因組大小一般在70~220 kbp之間,隨著物種的不同而不同[22-23]。已有研究表明,導(dǎo)致葉綠體基因組大小發(fā)生顯著變化的主要原因,是反向重復(fù)區(qū)的顯著擴(kuò)張、收縮,甚至丟失。光合作用是影響反向重復(fù)區(qū)區(qū)大小的因素之一。有研究[24]表明,寄生植物的葉綠體基因組相對較小,主要是由于反向重復(fù)區(qū)區(qū)收縮導(dǎo)致的。葉綠體基因組通常含有100~120個編碼基因,其中蛋白編碼基因占總數(shù)80%以上,而tRNA、rRNA占比較少。在對葉綠體功能基因注釋的結(jié)果也能發(fā)現(xiàn),絕大多數(shù)的基因與光合作用以及基因轉(zhuǎn)錄翻譯相關(guān)。因此,深入分析植物葉綠體基因組,有助于了解植物在光合作用過程中相關(guān)機(jī)制。
葉綠體基因組具有高度保守性,不易于重組,在一定程度上保留了植物的進(jìn)化信息,因而在植物系統(tǒng)發(fā)育分析上,葉綠體基因組被認(rèn)為是一個遺傳信息豐富、有價值的多層次的分類資源。本研究對柳葉芹葉綠體基因組進(jìn)行測序及數(shù)據(jù)挖掘,通過分析發(fā)現(xiàn),起轉(zhuǎn)錄翻譯作用和參與光合作用過程的基因,占被注釋到基因總數(shù)的91.15%,這與多數(shù)植物葉綠體基因組中基因功能一致。柳葉芹97.56%的簡單重復(fù)序列位點都含有腺嘌呤(A)-胸腺嘧啶(T)的堿基對,這與該物種葉綠體基因組整體腺嘌呤(A)-胸腺嘧啶(T)比例相一致。通過將柳葉芹與其它傘形科植物以及以擬南芥作為外類群植物構(gòu)建系統(tǒng)發(fā)育樹,結(jié)果表明:柳葉芹與疏葉當(dāng)歸的關(guān)系最為接近,支持率達(dá)100%。
本研究采用高通量測序技術(shù),對柳葉芹葉綠體進(jìn)行測序,并進(jìn)行了長重復(fù)序列、簡單重復(fù)序列位點、密碼子偏好性、近緣種葉綠體基因組比較、系統(tǒng)進(jìn)化的分析。為傘形科植物研究提供了更為詳細(xì)、完善的資料,為該物種鑒定以及群體和個體水平的遺傳差異分析提供了新的方法。