諶穎蓮 竭 航 趙貴軍 封孝蘭 張承露 吳佳勇 曾德軍
(重慶市藥物種植研究所,特色生物資源研究與利用川渝共建重點實驗室,重慶,408435)
麝香在心腦血管疾病及神經(jīng)系統(tǒng)疾病中具有較好的療效,在香料行業(yè)中具有較高的經(jīng)濟價值[1-3],其主要來源途徑為林麝(Moschusberezovskii)的人工養(yǎng)殖及其活體取香,但麝香的生物合成機制尚不明確,限制了麝香產(chǎn)業(yè)的發(fā)展。目前對麝香主要基于微生物宏基因組[4]、代謝組[1]和轉(zhuǎn)錄組[5]測序研究,麝香化學組分或前體組分的生物合成是麝香形成的關鍵步驟,分析與其合成有關的基因可為解析麝香的生物合成機制提供基礎數(shù)據(jù)。根據(jù)麝香的化學組分構(gòu)成分析,其含有大量的棕櫚酸、軟脂酸、長碳鏈環(huán)骨架、固醇物質(zhì)和甾類等物質(zhì)[1,4]。研究表明,脂肪酸合酶(Fatty acid synthase,F(xiàn)ASN)對脂肪酸、長碳鏈骨架和甲羥戊酸的合成具有重要作用[6],因此林麝FASN基因mRNA的克隆及序列分析可為解析麝香的生物合成機制提供參考[7]。本研究通過轉(zhuǎn)錄組測序及Trinity拼接[8]獲取林麝FASN基因的mRNA序列,并通過反轉(zhuǎn)錄PCR擴增及PCR產(chǎn)物Singer測序驗證序列的準確性,對序列進行一系列的生物信息學分析,以麝鼠(Ondatrazibethicus)、牛(Bostaurus)、山羊(Caprahircus)和綿羊(Ovisaries)的FASN序列為參考找出與麝香合成有關的位點信息,為掌握林麝的FASN基因mRNA序列信息及解析麝香的生物機制提供基礎數(shù)據(jù)。
在5—6月泌香盛期,采取飼養(yǎng)于重慶市藥物種植研究所林麝養(yǎng)殖基地的健康成年雄性林麝(5歲)香腺組織樣本,置于RNA保存液中-80 ℃保存;送樣至生工生物工程(上海)股份有限公司采用HiSeq 2500對mRNA轉(zhuǎn)錄組進行測序。
1.2.1 RNA提取
取250 mg左右組織塊利用液氮研磨后轉(zhuǎn)至2 mL離心管中,加入樣品1 mL,TRIzol冰上裂解5 min并搖勻,加入200 μL的氯仿,充分混勻后12 000 r/min 離心15 min,將上清轉(zhuǎn)移至1.5 mL離心管中,加入等體積的異丙醇,至冰盒中搖床放置20 min,取出后10 000 r/min 離心10 min,去上清并晾至白色沉淀濕潤為止,加入400 μL 75%乙醇洗滌,7 500 r/min 離心5 min后取出晾至白色沉淀濕潤,加入50 μL的DEPC水溶解,置于水浴鍋內(nèi)85 ℃水浴5 min后放置冰箱中-80 ℃保存。
1.2.2 cDNA合成
取1 μg的RNA樣品利用DNA酶處理2 min后,75 ℃處理5 min去酶活,加入多聚dT引物和隨機引物各1 μL(10 μmol/L),65 ℃孵育5 min,加入dNTP、反轉(zhuǎn)錄酶、反應Buffer及滅菌水,42 ℃孵育1 h,75 ℃處理5 min去酶活,cDNA樣品于冰箱中-20 ℃保存。
1.2.3 引物設計及PCR反應
利用Primer 5.0、GenBank數(shù)據(jù)庫(www.ncbi. nlm.nih.gov)及轉(zhuǎn)錄組拼接序列,對林麝FASN基因mRNA序列進行PCR引物設計,以RNA逆轉(zhuǎn)錄cDNA為模板分段克隆基因CDS序列,詳細引物信息見表1。反應體系20 μL,包括Mix 10 μL、上游和下游引物各1 μL(10 μmol/L)、cDNA模板1 μL、滅菌水7 μL,置于PCR儀反應。反應程序為95 ℃預變性5 min;95 ℃變性30 s,55~65 ℃退火30 s,35個循環(huán);72 ℃終延伸10 min。用1%瓊脂糖凝膠電泳檢測反應產(chǎn)物片段大小,將PCR反應產(chǎn)物送重慶擎科生物科技有限公司進行Singer測序。
表1 FASN擴增引物信息
1.2.4 Singer測序和Trinity拼接
以轉(zhuǎn)錄組測序Trinity拼接結(jié)果FASNmRNA序列與牛(NM_001012669.1)、山羊(NM_001285629.1)和綿羊(XM_027974304.1)序列比對為參考,篩選林麝的FASN基因mRNA序列,用擴增片段與拼接結(jié)果進行匹配,驗證Trinity拼接的FASNmRNA序列準確性,差異的堿基位點以Singer測序結(jié)果為準,進行下一步序列分析。
1.2.5 FASN進化樹構(gòu)建
對FASNmRNA序列用BioXM 2.6進行ORF分析及序列比對,以最長的ORF判定為CDS,通過脊椎動物標準氨基酸密碼子翻譯林麝FASN蛋白序列。從GenBank數(shù)據(jù)庫下載并選擇人(HomosapiensNP_004095.4)、阿肯色鏢鱸(EtheostomacraginiXP_034717176.1)、小家鼠(MusmusculusNP_032014.3)、紅色原雞(GallusgallusNP_990486.2)、野豬(Susscro-faNP_001093400.1)、牛(NP_001012687.1)、山羊(NP_001272558.1)、綿羊(XP_027830105.1)、揚子鱷(AlligatorsinensisXP_025050442.1)、豹(PantherapardusXP_019321392.1)和旋毛蟲(Trichinellasp.T9 KRX63946.1)序列,結(jié)合轉(zhuǎn)錄組測序拼接的麝鼠(Ondatrazibethicus)FASN蛋白序列,利用MEGA 6.0軟件和最大似然法構(gòu)建進化樹,Bootstrap檢驗計算支持百分率。
1.2.6 蛋白序列分析
利用DNASTAR 7.1分析林麝FASN蛋白序列的二級結(jié)構(gòu)、SwissModel(Swissmodel.expasy.org)分析三維結(jié)構(gòu)、String(string-db.org)預測與FASN相互作用的蛋白、Scansite 4.0(scansite4.mit.edu/4.0/#home)預測林麝FASN可能的磷酸化位點。以能夠生產(chǎn)麝香的麝鼠FASN蛋白序列為參考,同時用與林麝遺傳距離較接近的牛、山羊和綿羊FASN蛋白序列比對,在林麝FASN蛋白序列中,選擇與麝鼠相同與牛、山羊和綿羊不同的氨基酸位點作為麝香合成相關的關鍵,在mRNA序列中標出,最后通過SWChen(https://github.com/YLCHEN1992/SWChen)使用雙閾值預測(全局110分+種子80分)調(diào)控林麝FASN表達的miRNA,使用SSNChen(https://github.com/YLCHEN1992/SSNChen)繪制林麝FASNmRNA 基因序列圖。
利用轉(zhuǎn)錄組測序拼接結(jié)果及牛、羊序列比對,成功獲取了林麝FASN基因的mRNA序列,利用反轉(zhuǎn)錄PCR擴增和Singer測序驗證。由于使用了2個不同的個體樣本分別進行轉(zhuǎn)錄組測序拼接和Singer測序,序列中存在4個不一致的堿基位點,分別為G2片段上的T/C(AGT/AGC,CDS第1 425位,編碼絲氨酸)變化;G3片段上的A/G(ACA/ACG,CDS第2 031位,編碼蘇氨酸)變化;A6片段上的T/C(ATT/ATC,CDS第738位,編碼異亮氨酸)變化;I6片段上的C/T(GAC/GAT,CDS第738位,編碼天冬氨酸)變化。變化的堿基位點并不改變編碼氨基酸。利用GenBank數(shù)據(jù)庫下載的各物種FASN蛋白序列構(gòu)建遺傳進化樹(圖1),結(jié)果顯示林麝FASN序列與牛、山羊和綿羊遺傳距離最為接近,其次為野豬、豹,與揚子鱷、紅色原雞、阿肯色鏢鱸遺傳距離較遠,與麝鼠差異較大,麝鼠與小家鼠歸為一支且接近人種,F(xiàn)ASN蛋白序列在同源物種中具有較高的保守性。
圖1 基于FASN蛋白序列構(gòu)建的系統(tǒng)發(fā)育樹Fig.1 Phylogenetic tree construction based on FASN protein sequence 注:分支上的數(shù)據(jù)表示Bootstrap檢驗的支持百分率,以旋毛蟲為外群;▲表示林麝FASN蛋白序列,其中麝鼠FASN序列通過轉(zhuǎn)錄組測序Trinity拼接序列翻譯獲取;標尺表示氨基酸替代率 Note:The data on the branch represented the percentage of support for the Bootstrap test.Trichinella sp.was the outgroup.The “▲” represented the FASN protein sequence of forest musk deer.The FASN protein sequence of muskrat was obtained by transcriptome sequencing,Trinity splicing and following protein translation.The ruler represented amino acid substitution rate
通過序列比對發(fā)現(xiàn),林麝FASN基因mRNA的CDS區(qū)包含9個結(jié)構(gòu)域,其中6個區(qū)域為酶活性區(qū),3個區(qū)域為結(jié)構(gòu)區(qū),CDS區(qū)域全長7 545 nt,5′-UTR和3′-UTR全長分別為99 nt和576 nt,詳細結(jié)果如圖2所示。對林麝FASN蛋白的基本性質(zhì)、磷酸化位點、互作蛋白、二級和三級結(jié)構(gòu)的預測結(jié)果顯示,相對分子質(zhì)量為274 284.44,等電點為5.70~5.80,預測發(fā)現(xiàn)11個候選磷酸化位點如圖2所示。通過String網(wǎng)站預測與林麝FASN相互作用蛋白(圖2),選取試驗評分和高置信度的判定規(guī)則方法,發(fā)現(xiàn)細胞分化循環(huán)5樣蛋白(Cell division cycle 5-like protein,CDC5L)、膽固醇羥化酶(Sterol 26-hydroxylase,CYP27A1)、熱休克蛋白ATP酶激活劑同源1蛋白(Activator of 90 kDa heat shock protein ATPase homolog 1,AHSA1)和L-氨基乙二酸-半醛脫氫酶-磷酸泛酰巰基乙胺基轉(zhuǎn)移酶(L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase,AASDHPPT)能夠與FASN相互作用;SWChen雙閾值分析顯示miR-1307-5p和miR-669為調(diào)控其表達的miRNAs。二級結(jié)構(gòu)預測結(jié)果顯示,林麝FASN蛋白含有多個α螺旋、β折疊、轉(zhuǎn)角、無規(guī)卷曲結(jié)構(gòu)及較多的可變域(圖3)。三維預測結(jié)果顯示林麝FASN呈現(xiàn)二聚體結(jié)構(gòu),存在多個位點的絲氨酸和蘇氨酸位點(圖4A),以及2個NADPH結(jié)合位點,三維結(jié)構(gòu)呈現(xiàn)X型(圖4B)。
圖2 林麝FASN基因mRNA序列信息Fig.2 The mRNA sequence information of FASN gene in Moschus berezovskii 注:下標尺度為序列長度;中間柱形圖為FASN基因的mRNA序列,不同條帶顏色顯示不同的區(qū)域結(jié)構(gòu),關鍵的堿基位點在條帶內(nèi)部被標記出來,CDS區(qū)使用藍色條帶標出,其黃色點顯示Scansite 4.0預測的蛋白磷酸化位點,灰色條帶為對應引物的擴增區(qū)域;使用String預測的互作蛋白被標記在圖左下方,互作的miRNAs位置及名稱被標記在3′-UTR下方 Note:The subscript scale is sequence length.The middle column has shown the mRNA sequence of FASN gene that different stripe colors show different regional structures and key base sites are marked.The CDS region is marked with a blue band,with yellow dots showing the protein phosphorylation sites predicted by Scansite 4.0.Grey bands are the amplification regions of corresponding primers.The interacting proteins predicted by String software are labeled at the lower left,and the positions and names of the interacting miRNAs are labeled below 3′-UTR region
圖3 林麝FASN蛋白二級結(jié)構(gòu)Fig.3 Second structure analysis of FASN protein in Moschus berezovskii
圖4 林麝FASN蛋白三維結(jié)構(gòu)模型Fig.4 3D model of FASN protein in Moschus berezovskii 注:A.絲氨酸/蘇氨酸標識FASN二聚體,藍色部分為絲氨酸或蘇氨酸位點;B.FASN二聚體,綠色和黃色為各自的單體結(jié)構(gòu) Note:The A represents the dimer of FASN protein with Ser/Thr marking,and the blue part is the site of serine or threonine.The B represents the dimer of FASN protein where green and yellow are respective monomer structures respectively
通過物種中的氨基酸變化篩選關鍵氨基酸位點,其中有4個位點涉活性羥基變化,如FASN蛋白α螺旋上的第307位氨基酸在林麝和麝鼠中為絲氨酸,牛羊中為絲氨酸,與第265位(距離:8.90 ?)和第274位(距離:9.89 ?)的絲氨酸臨近;α螺旋上的第602位氨基酸為丙氨酸,牛羊中為絲氨酸,臨近第693位(距離:13.19 ?)蘇氨酸;第657位氨基酸在牛羊中為絲氨酸,在麝鼠和林麝中為丙氨酸,臨近第652位(距離:10.62 ?)絲氨酸;而α螺旋上的第1 334位氨基酸在牛羊中為甘氨酸,林麝和麝鼠為絲氨酸,且與第1 331位(距離:5.23 ?)蘇氨酸位于同一測螺旋上;關鍵蛋白氨基酸位點信息見表2和圖2。
表2 FASN差異氨基酸位點描述
麝香具有較高的藥用和香用價值,但目前麝香的生物合成機制尚不明確。根據(jù)現(xiàn)有的報道顯示,麝香中的化學成分與碳鏈骨架、固醇和甾類物質(zhì)具有較大的關聯(lián)性,而FASN基因是其合成的關鍵酶之一。本研究通過轉(zhuǎn)錄組測序拼接獲取林麝FASN基因的全長mRNA序列,利用反轉(zhuǎn)錄PCR及Sanger測序進一步驗證序列的準確性,進行生物信息學分析,為解析麝香的生物合成機制提供基礎數(shù)據(jù)。
由于基因轉(zhuǎn)錄后存在可變剪切現(xiàn)象,Trinity拼接的Chrysalis過程中會認定未加工完成的mRNA為unigene[8]。為保證獲取序列的準確性,本研究利用牛、羊的mRNA序列作參考,選擇長度接近、無內(nèi)含子且CDS序列連續(xù)的片段為林麝的FASN基因mRNA序列,避開Trinity拼接的Chrysalis過程,得到的林麝FASN基因為加工的成熟mRNA序列;為保證序列的準確性后續(xù)使用反轉(zhuǎn)錄PCR擴增及Sanger測序進行驗證,結(jié)果顯示存在4個位點的差異,但并不改變編碼的氨基酸序列,不一致的4個位點可能為潛在的SNP多態(tài)位點,需要進一步的試驗驗證。對于大片段的擴增具有難度且耗時,難以擴增出全長序列,林麝的FASN基因mRNA序列全長為8 221 nt。本研究通過片段拆分擴增,缺少5′-UTR區(qū)域、第100~280位和第3 378~4 244位堿基(CDS第1~60位和第1 093~1 382位氨基酸)的PCR擴增測序,后期可能需要獲取高質(zhì)量的RNA進行反轉(zhuǎn)錄擴增測序進一步驗證,但根據(jù)其他片段的測序結(jié)果顯示出的FASN基因mRNA序列可靠并可用于下一步的序列分析。
林麝FASN基因mRNA序列的獲取及克隆驗證對于以FASN角度研究麝香的生物合成機制具有重要參考價值。FASN參與脂類物質(zhì)的合成[9],在進化過程中具有較高的保守性,因此與牛羊歸為一支;林麝FASN的二級結(jié)構(gòu)和三級結(jié)構(gòu)顯示,林麝脂肪酸合酶呈現(xiàn)二聚體結(jié)構(gòu),與牛羊等哺乳動物FASN結(jié)構(gòu)相似,但變化的氨基酸位點可能影響蛋白之間的相互作用和蛋白的磷酸化,例如,與CDC5L、CYP27A1、AHSA1和AASDHPPT蛋白的相互作用,通過改變底物傳遞速度、酶構(gòu)象或蛋白磷酸化能力,影響終產(chǎn)物的生成[10-13]。進一步對靶向調(diào)控林麝FASN基因表達的miRNA通過SWChen系統(tǒng)利用雙閾值進行預測[14-17],結(jié)果顯示miR-1307-5p和miR-669與FASN基因mRNA的3′-UTR具有較高的親和能力,暗示3′-UTR可能通過海綿機制影響miRNA功能的執(zhí)行[18],參與麝香合成過程。預測分析林麝FASN的二級結(jié)構(gòu)、三級結(jié)構(gòu)、磷酸化、蛋白相互作用和靶向miRNAs對了解FASN在麝香合成過程中的功能具有參考作用。
麝鼠也能合成和分泌能夠替代麝香的麝鼠香[19],通過牛、山羊、綿羊、麝鼠和林麝的FASN蛋白序列比對,找出林麝與牛羊具有差異且與麝鼠相同的氨基酸位點,可能與麝香合成有關,同時絲氨酸和蘇氨酸的R基團羥基對于酶的活性、蛋白磷酸化等具有關鍵作用[9,20]。本研究通過找到16個差異位點進行分析,變化的氨基酸位點不含磷酸化位點,暗示物種FASN磷酸化位點具有較高的保守性;而第307、602、657和1 334位氨基酸位點能夠增添或消除羥基基團,其中第307位氨基酸位于FASN蛋白β-酮酰合酶的α螺旋上,在牛羊中為甘氨酸,在林麝和麝鼠中為絲氨酸,與第265位和第274位絲氨酸臨近,臨近的絲氨酸群有一定的概率組合成新的指環(huán)區(qū)域影響酶學活性,如BLM解旋酶的精氨酸指環(huán)結(jié)構(gòu)[21]和RecQ的半胱氨酸指環(huán)[22-24];而第602和657位氨基酸由絲氨酸變?yōu)橹行员彼?,羥基基團的消除可能影響該區(qū)域?;D(zhuǎn)移酶的活性,β-酮酰合酶和?;D(zhuǎn)移酶能夠?qū)χ舅岬奶兼溂映珊脱由靃6,9],第307、602和657位點的變化有可能對脂肪酸碳鏈的活化和麝香酮的成環(huán)具有重要作用;FASN約1/3的區(qū)域為結(jié)構(gòu)區(qū)域,對蛋白的正確折疊功能發(fā)揮等具有重要作用[9],第1 334位絲氨酸與同一螺旋結(jié)構(gòu)上第1 331位的絲氨酸存在相互影響,而該位點屬于結(jié)構(gòu)區(qū)域,氨基酸變化可能影響其他蛋白域的活性,因此4個具有羥基變化的氨基酸位點提示與麝香的生物合成具有較強關聯(lián)性,但還需要進行進一步的試驗驗證,如模型細胞的定點突變驗證等。通過以牛、山羊、綿羊、麝鼠和林麝的FASN蛋白序列比對,篩選出與麝鼠相同且與牛羊不同的位點可為麝香的生物合成機制研究提供參考數(shù)據(jù)。
林麝FASN對于麝香的化學組分的合成密切相關,通過轉(zhuǎn)錄組測序拼接及Singer測序驗證獲取了林麝FASN基因的mRNA序列,進行進化樹構(gòu)建、二級結(jié)構(gòu)、三級結(jié)構(gòu)、蛋白相互作用、蛋白磷酸位點化及靶向miRNAs分析,結(jié)果顯示,林麝FASN具有較高的物種保守性,16個關鍵位點與麝鼠相同且與牛羊不同,其中第307、602、657和1 334位氨基酸位點能夠影響活性羥基的變化與麝香的合成密切相關;FASN的3′-UTR與miR-1307-5p和miR-669具有較高的親和能力,林麝FASN基因序列與其他物種之間的差異信息可為解析麝香生物合成機制提供參考。