雷 蕾,潘顯強,4,張 露*,黃少偉,趙 衡,易 敏,賴 猛
(1.江西農業(yè)大學 林學院,江西 南昌 330045;2.華南農業(yè)大學 林學院,廣東 廣州 510642;3.廣東省森林植物種質創(chuàng)新與利用重點實驗室,廣東 廣州 510642;4.南昌市林業(yè)局,江西 南昌 330000)
松脂主要由單萜、倍半萜烯、二萜組成,其生物合成是以類戊二烯(C5)為底物,經由磷酸甲基赤蘚糖(methyl-erythritol 4-phosphate,MEP)途徑形成萜類化合物的各類前體,再在萜稀合成酶(terpene synthases,TPS)的參與下合成松脂[1]。TPS 基因有 6 大類(Tpsa、Tpsb、Tpsc、Tpsd、Tpse、Tpsf),其中 Tpsd 是裸子植物特有的相對獨立的基因家族,Tps-d1、Tps-d2、Tps-d3分別是單萜合成酶、倍半萜稀合成酶和二萜合成酶,這3個亞家族的基因序列高度相關[2]。α-蒎烯(α-pinene)和β-蒎烯(β-pinene)是松脂中含量最多的兩種成分,與松樹抗蟲、抗機械創(chuàng)傷關系密切[3]。β-蒎烯因其在合成工業(yè)中步驟少的特點備受育種家的關注,有兩種同分異構體:(+)β-蒎烯和(-)β-蒎烯,它們分別在兩種不同的TPS作用下合成,松脂中的β-蒎烯以左旋居多。
濕地松(Pinus elliottii)原產美國東南部潮濕地區(qū),我國于20世紀30年代開始引種栽培。近10年來,隨著松脂產業(yè)的迅速發(fā)展,高產脂濕地松種子園紛紛建立,產脂性狀的研究也成為熱點[4]。濕地松產脂量高、松脂品質極好,因其β-蒎烯含量高,成為最受關注的采脂樹種[5-6]。本研究同源克隆了濕地松的(-)β-蒎烯合成酶基因,分別命名為PeTPS-(+)Apin、PeTPS-(-)Apin和PeTPS-(-)BPin,分析了其序列同源性,并預測了其蛋白質結構和功能,旨在為更深入的研究濕地松產脂性狀提供重要的候選基因。
濕地松嫩葉樣品于2013年3月采集自江西省吉安縣白云山林場,位于東經26°51′,北緯115°11′,海拔90m,亞熱帶氣候,年均氣溫18.6℃,極端高溫38.3℃,極端低溫-4.4℃,年均降雨1 646mm,無霜期308 d。
下載GeneBank數(shù)據(jù)庫中已有的松屬物種(主要是火炬松、北美短葉松和北美扭葉松)的(-)-β-蒎烯合成酶((-)-beta-pinene synthase)的cDNA序列,與火炬松全基因組比對,在其上下游1 kb以內設計巢式引物,引物序列見表1。
表1 用于同源克隆的引物序列Tab.1 Primer sequences used for homology cloning
采用CTAB+吸附柱法提取DNA,藥品配置及具體操作參照李義良[8]針對濕地松的CTAB快速提取法,沉淀DNA后,用CB3吸附柱(天根公司試劑盒)吸附,用TE洗脫,稀釋至50 ng/μL,4℃保存。
PCR 擴增反應體系:1×PrimeSTAR buffer、0.2 mmol/L dNTPs、0.2 μmol/L primes、2 ng/μL DNA、0.02 U/μL PrimeSTAR HSDNA Ploymerase。第一輪擴增(outer primes)用10 μL 體系,第二輪擴增(inner primes)用50μL體系,產物直接測序。
PCR擴增程序:94℃預變性5min,94℃預變性10 s,55~65℃退火10 s,72℃延伸45 s~4 min 30 s,72℃延伸7min,10℃保溫,循環(huán)34次。
主要試劑:PrimeSTAR HSDNA Ploymerase、dNTPMixture、DL5000 DNA Marker、DL10000 DNA Marker購自TAKARA公司,DNAsecure Plant Kit購自天根生化科技(北京)有限公司,CTAB、瓊脂糖、EDTA、Tris購自上海生物工程有限公司,引物合成及測序由上海生工完成。
儀器設備:MM301磨樣儀(Qiagen公司)、Thermo SCIENTIFIC NanoDrop 1000核酸分析儀、PTC-200 PCR擴增儀、DYC Z-30電泳槽、DYY-12電泳儀、EPPENDORF CENTRIFUGE 5810R高速低溫離心機、Bio RAD Gel Doc XR凝膠圖像采集與分析系統(tǒng)、Grant XB70制冰機、H.H.S2電熱恒溫水浴鍋、New Brunswick Scientific 410超低溫冰箱。
測序結果拼接完成后,用 BLAST 在線程序(http://blast.ncbi.nlm.nih.gov)同源比對,用 WEBGENE在線程序(http://www.itb.cnr.it/sun/webgene/)分析內含子。用 ORF finder在線程序(http://www.ncbi.nlm.nih.gov/gorf/)翻譯成氨基酸序列。氨基酸的基本理化性質用Expasy Protparam在線程序(http://web.expasy.org/cgi-bin/protparam/)預測。蛋白質親/疏水性用 ProtScale 在線程序(http://www.expasy.org/cgi-bin/protscale.pl)預測。前導肽用 TargetP 1.1 Server在線程序(http://www.cbs.dtu.dk/services/TargetP/)預測。磷酸化位點用 NetPhos 2.0 Server在線程序(http://www.cbs.dtu.dk/services/NetPhos/)分析。蛋白質保守結構域用 NCBI的 CDD 程序(http://www.ncbi.nlm.nih.gov/Structure/cdd/)預測。用PSIPRED軟件分析蛋白質的二級結構。用SWISS-MODEL軟件分析蛋白質的三級結構。蛋白質功能性位點用ELM在線程序(http://elm.eu.org/)預測。
DNA提取效果較好,核酸檢測 OD260/280均在1.7~1.9,OD260/230均為2.0左右。PCR 擴增效果較好,條帶清晰、單一。圖1為DNA及PCR產物的電泳圖。
序列分析結果顯示:PeTPS-(-)BPin基因全長3 574 bp,有9個外顯子10個內含子,共編碼627個氨基酸。同源性分析結果表明:PeTPS-(-)BPin基因與其他松屬植物之間的序列同源性達90%~93%,氨基酸序列具有2個長的保守區(qū)(>50a.a.)。與松科其他屬之間的同源性為89%,氨基酸序列具有5個短的保守區(qū)(>15a.a.)。與裸子植物其他 TPS基因的同源性為73%~76%,氨基酸序列具有1~2個短的保守區(qū)(>15a.a.)。
研究表明,各種TPS基因序列的外顯子和內含子位置分布幾乎一致,其蛋白質同源性較高,由一個共同的祖先進化而來,參與初生代謝和次生代謝的TPS的分支,發(fā)生在被子植物與裸子植物分離之前[9]。裸子植物的TPS基因是TPS基因家族中較獨立的成員Tpsd,Tpsd又可以進行亞分類:Tpsd1(單萜合成酶)、Tpsd2(倍半萜烯合成酶)、Tpsd3(二萜合成酶)[2]。本研究下載了NCBI中已發(fā)表的3種萜烯合成酶基因序列,與濕地松的序列比對,構建了系統(tǒng)進化樹,結果如下:被子植物和裸子植物的TPS基因被聚為兩大類,關系較遠,兩大分支的置信度均為100,可靠性高(圖2);裸子植物的TPS分為3個亞支,分別對應3種TPS基因,3大分支的置信度為98~100,可靠性較高;濕地松與火炬松、扭葉松、班克松等松屬物種親緣關系較近,聚為一類,而與松科的云杉屬(Picea)、黃杉屬(Pseudotsuga)距離逐漸疏遠(圖3),這與國外文獻報道結果一致[10-11]。
圖1 左:DNA電泳圖(DL10 000 Mark);右:PCR產物電泳圖(DL5 000 Mark)Fig.1 DNA electrophoresis figure(DL10 000 Mark)on left,PCR product electrophoretogram(DL5 000 Mark)on right
圖2 不同物種的TPS基因序列的進化樹Fig.2 Phylogenetic tree of TPS gene in difference species
PeTPS-(-)BPin的蛋白質分子式為 C3197H4972N862O957S32,分子量為71.74 ku,等電點為5.73,含20種基本氨基酸,含量最高的是L(9.4%)和S(8.8%),帶負電荷殘基89個(14.15%,包括Asp和Glu),帶正電荷的殘基92個(14.63%,包括Arg、Lys和His),水溶液吸光系數(shù)為91 970,不穩(wěn)定系數(shù)為43.38,脂肪系數(shù)為82.80,平均總親水性為-0.398,疏水氨基酸占 35.1%,親水氨基酸占 65.1%,定位在葉綠體,包含37個磷酸化位點(包括20個絲氨酸(Ser),9個蘇氨酸(Thr),8個酪氨酸(Tyr)。
圖3 裸子植物TPS基因序列的進化樹Fig.3 Phylogenetic tree of TPS gene in gymnospermae
左旋β-蒎烯合成酶蛋白質二級結構中含有4個不規(guī)則卷曲,24個 α-螺旋。蛋白質三級結構同源建模結果顯示:左旋β-蒎烯合成酶與紫杉二烯合成酶、冷杉二烯合成酶和某倍半萜烯合成酶有著相似的三級結構,比對得分分別為 428、395、438。
保守結構域分析表明,左旋β-蒎烯合成酶含有一個cd00684保守域,屬于類異戊二烯生物合成酶基因家族,主要參與次級代謝的生物合成途徑。根據(jù)已知該家族成員的蛋白質結構,可知萜烯合成酶定位在真核生物的細胞質或葉綠體中,最多可以結合3個鎂/鉀離子,催化位點由兩個富含天冬氨酸(Asp-rich)的區(qū)域和一個大的反向α-螺旋構成的中央腔組成,該位點高度保守。其蛋白質三級結構及其保守結構域如圖4。
圖4 蛋白質的三級結構和保守結構域Fig.4 Protein tertiary structure and CDD predicted for candidate genes
ELM工具和NCBI的CDD工具相結合,共搜索出7個可能的功能域(圖5)。第1個功能域為CLV_NDR_NDR_1,是一個NDR切割位點(NDR cleavage site),由兩個精氨酸組成,出現(xiàn)在第68、69位氨基酸。第2個功能域為LIG_FHA_1,是一個FHA磷酸肽配體(FHA phosphopeptide ligands),由7個氨基酸組成,出現(xiàn)在第611~617位氨基酸。第3個功能域為LIG_FHA_2,出現(xiàn)在第622~627位氨基酸。第4個功能域為LIG_PDZ_Class_2,是一個PDZ配體(PDZ ligands),由6個氨基酸組成,出現(xiàn)在第622~627位氨基酸。第5個功能域為LIG_SH2_PTP2、LIG_SH2_SRC、LIG_SH2_STAT5,是一個SH2配體(SH2 ligand),由4個氨基酸組成,出現(xiàn)在第283~286位氨基酸。第6個功能域為MOD_GSK3_1,是一個GSK3磷酸化位點(GSK3 phosphorylation site),由8個氨基酸組成,出現(xiàn)在第293~300和606~613位氨基酸。第7個功能域為MOD_PKA_2,是一個PKA磷酸化位點(PKA Phosphorylation site),由7個氨基酸組成,出現(xiàn)在第43~49位氨基酸。
圖5 蛋白質的功能結構域預測Fig.5 Protein function structure domain predicted
萜烯合成酶(TPS)一般由550~850個氨基酸組成,絲氨酸和蘇氨酸含量高,酸性氨基酸含量低,相對分子質量為50~100 ku[12]。TPS在三維結構上有很高的相似度,由α-螺旋、連接環(huán)、拐角等結構組成。酶的活性中心是6個α-螺旋組成的C-末端疏水區(qū),N-末端沒有特殊的功能元件[13]。這些研究與本研究結果相符。
國外報道,所有單萜合成酶序列靠前段都存在連續(xù)的2個精氨酸,功能未知,可能與GPP異構化有關[9]。濕地松PeTPS-(-)BPin基因的在第68、69位出現(xiàn)了這個保守結構,并在該區(qū)搜索到一個NDR切割位點,該位點被發(fā)現(xiàn)于小鼠大腦和睪丸的金屬內肽酶(metalloendopeptidase),它能夠斷裂Arg的N末端殘基[14]。因此猜測,裸子植物單萜合成酶的RR保守結構能夠在第二個R的N末端斷裂并與底物結合,從而參與底物異構化。
幾乎所有的TPS都含有一個Asp富集基序(DDxxD),這個基序被認為起到結合金屬離子的作用,它定位在活性位點的入口處,若基序發(fā)生突變則導致酶催化活性下降,因此推測是二磷酸脂的結合部位[12],本研究在第380~384位出現(xiàn)了這個保守域,但未能在該區(qū)搜到相關的功能位點。本研究預測的兩個磷酸化位點分別位于第302位和623位,可見,基于生物信息學的功能預測只能作為后期實驗的理論依據(jù),并不是完全可靠,要更準確的了解TPS的功能還需更多的生物化學實驗研究。
對有親緣關系的松屬樹種來說,不僅是葉綠體DNA(cpDNA)序列,核DNA(nDNA)序列的保守程度也很高,其基因的同源克隆和比較作圖比被子植物容易得多[15]?;鹁嫠傻腅STP標記已被用于濕地松[16]、海岸松[17]、歐洲赤松[18],甚至被用于黃杉屬的花旗松[19]。本研究比較了不同松屬植物的 3 個TPS基因cDNA序列,相似度極高,同源性達到90%以上。濕地松TPS基因與松科其他屬之間的同源性在80%以上。裸子植物不同TPS基因之間的同源性在70%以上。將3個基因與火炬松全基因組比對,并在濕地松基因組上擴增成功,再次證明松屬植物基因序列的高保守性,火炬松全基因序列的公開給其他研究相對滯后的松樹提供了極為有利的條件。
對于基因的同源克隆來說,最常用的方法是利用植物特定時空的材料提取RNA,反轉錄成cDNA,然后用同源引物(有時需設計簡并引物)擴增得到同源的cDNA序列。本研究直接在火炬松基因組上設計巣式引物,直接用于濕地松的基因組,并獲得成功。生物信息學上的驗證思路類似于人類基因組的未知基因的發(fā)掘[20],對拼接結果進行內含子分析,去除內含子翻譯成氨基酸序列,進行一級、二級、三級結構的預測,通過同源建模找到功能結構域,預測其蛋白質功能。結果證明所克隆的基因正是目的基因,這種方法只需提取基因組DNA,大大簡化了克隆的過程。
[1]Lange BM,Ghassemian M.Genome organization in Arabidopsis thaliana:A survey for genes involved in isoprenoid and chloro-phyllmetabolism[J].Plant Mol Biol,2003,58,925-948.
[2]Keeling C I,Bohlmann J.Genes,enzymes and chemicals of terpenoid diversity in the constitutive and induced defence of conifers against insects and pathogens[J].New Phytol,2006,170:657-675.
[3]Byun-McKay A,Godard K A,Toudefallah M,et al.Wound-induced terpene synthase gene expression in Sitka spruce that exhibit resistance or susceptibility to attack by the White pine weevil[J].Plant Physiol,2006,140:1009-1021.
[4]潘志剛,游應天.濕地松、火炬松、加勒比松引種栽培[M].北京:北京科學技術出版社,1991:79-92.
[5]莊偉瑛,張玉英,鄒元熹.高產脂濕地松選擇和相關因子的分析[J].江西農業(yè)大學學報,2007,29(1):55-65.
[6]李彥杰,姜景民,欒啟福.濕地松家系產脂力、樹脂密度和松節(jié)油含量的測定與遺傳分析[J].北京林業(yè)大學學報,2012,34(4):48-51.
[7]Hall D E,Yuen M M,Jancsik S,et al.Transcriptome resources and functional characterization ofmonoterpene synthases for two host species of themountain pine beetle,lodgepole pine(Pinus contorta)and jack pine(Pinus banksiana)[J].BMC Plant Biol,2013,13(80):1-14.
[8]李義良,趙奮成,張應中,等.適用于微衛(wèi)星標記的濕地松、加勒比松DNA快速提取法[J].生物技術通報,2010(1):83-86.
[9]Bohlmann JR,Martin D,Oldham N J,et al.Terpenoid secondarymetabolism in Arabidopsis thaliana:cDNA cloning,characterization,and functional expression of a Myrcene/(E)-B-Ocimene synthase[J].Arch Biochem Biophys,2000,375(2):261-269.
[10]Christopher IK,SabrinaW,Steven GR,etal.Transcriptomemining,functional characterization,and phylogeny of a large terpene synthase gene family in spruce(Picea spp.)[J].Plant Biology,2011,11:43-57.
[11]Dawn EH,Macaire M S,Sharon J,etal.Transcriptome resources and functional characterization ofmonoterpene synthases for two host species of themountain pine beetle,lodgepole pine(Pinus contorta)and jack pine(Pinus banksiana)[J].Plant Biology 2013,13:80-94.
[12]岳躍沖,范燕萍.植物萜類合成酶及其代謝調控的研究進展[J].園藝學報,2011,38(2):379-388.
[13]Degenhardt J,Kollner TG,Gershenzon J.Monoterpene and sesquiterpene synthases and the origin of terpene skeletal diversity in plants[J].Phytochemistry,2009,70(15-16):1621-1637.
[14]Pierotti A R,Prat A,Chesneau V,et al.N-Arginine dibasic convertase,ametalloendopeptidase as a prototype of a class of processing enzymes.[J].Proc Natl Acad,1994,91:6078-6082.
[15]Christopher I.Keeling,J?rg Bohlmann.Diterpene resin acids in conifers[J].Phytochemistry,2006,67:2415-2423.
[16]Brown G R,Kadel EE,BassoniD L,etal.Anchored reference loci in loblolly pine(Pinus taeda L.)for integrating pine genomics[J].Genetics,2001,159(2):799-809.
[17]ChagnéD,Brown G,Lalanne C,etal.Comparative genome and QTLmapping betweenmaritime and loblolly pines[J].Molecular Breeding,2003,12(3):185-195.
[18]Komulainen P,Brown G R,Mikkonen M,et al.Comparing EST-based genetic maps between Pinus sylvestris and Pinus taeda[J].Theoretical and Applied Genetics,2003,107(4):667-678.
[19]Krutovsky K V,Troggio M,Brown G R,et al.Comparativemapping in the Pinaceae[J].Genetics,2004,168(1):447-461.
[20]馬大龍.我國人類功能基因研究策略探討[J].中華醫(yī)學雜志,2004,84(18):1497-1498.