孫世宇,馮 猜,孫 威,2*,徐小蓉,2*
(1.貴州師范大學(xué) 生命科學(xué)學(xué)院/植物生理與發(fā)育調(diào)控重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;2.西南喀斯特山地生物多樣性保護(hù)重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025)
錦繡杜鵑(Rhododendronpulchrum),也稱毛杜鵑,半常綠灌木,性喜溫暖濕潤氣候,喜光而耐半陰,忌強(qiáng)光曝曬,較耐寒[1]。錦繡杜鵑開花時(shí)顏色鮮艷奪目,是一種極具觀賞價(jià)值的花卉。錦繡杜鵑原產(chǎn)我國,廣泛種植于江蘇、福建、廣西等地[2],近些年越來越多的人工培植品種在市場(chǎng)上出現(xiàn),使錦繡杜鵑的顏色和形態(tài)更加多樣化,成為人們非常喜愛的景觀植物之一。錦繡杜鵑除具有重要的觀賞價(jià)值外,其亦可入藥。例如,徐寶貴等[3]研究證明錦繡杜鵑葉片中含有廣譜抗菌成分,對(duì)一些常見的革蘭氏菌以及耐藥菌具有抑制作用[4]。此外,研究顯示錦繡杜鵑中含有較為豐富的黃酮類化合物,如:金絲桃苷、槲皮素及映山紅素等[5],具有鎮(zhèn)痛、祛痰、止咳、抗菌消炎以及保護(hù)心血管等功效[6-7]。
錦繡杜鵑作為觀賞植物,豐富其花色多樣性是園藝工作者們關(guān)心的核心問題?;ǖ念伾饕?大類色素決定:類胡蘿卜素、類黃酮以及其他水溶性色素如:小檗堿、罌粟堿等。類黃酮-3′,5′-羥基化酶(F3′5′H)是類黃酮合成途徑中的關(guān)鍵酶之一,決定無色二氫黃酮醇的羥化位置和程度[8]。在F3′5′H的作用下,二氫楊梅素不斷合成,隨后在DFR、ANS、3GT等酶催化作用下形成飛燕草素,可使花瓣呈現(xiàn)出藍(lán)色、紫色等顏色[9]。自然界中很多觀賞性植物都缺少藍(lán)色色系,有學(xué)者[10-11]研究發(fā)現(xiàn)其主要原因是F3′5′H基因的缺乏或者表達(dá)量較低造成的,因而F3′5′H基因又被稱為“藍(lán)色基因”,可通過導(dǎo)入F3′5′H基因得到藍(lán)色菊花株系[12-13]。目前對(duì)于錦繡杜鵑F3′5′H(RpF3′5′H)基因的研究較少,本文從NCBI數(shù)據(jù)庫中查找并獲得RpF3′5′H完整的mRNA序列,利用生物信息學(xué)方法及工具對(duì)其進(jìn)行了分析,研究結(jié)果將為RpF3′5′H基因的克隆及功能研究提供一定的參考。
錦繡杜鵑類黃酮-3′,5′-羥基化酶完整的mRNA序列(GenBank:AB289598.1)來源于美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)[14]。
首先利用NCBI在線工具ORF Finder查找RpF3′5′H完整的開放式閱讀框[15];使用Softberry 在線工具TSSP 預(yù)測(cè)此序列無啟動(dòng)子及增強(qiáng)子序列[16];采用ExPASy-ProtParam tool的ProtParam在線軟件分析RpF3′5′H所編碼蛋白的理化性質(zhì)[17];應(yīng)用Signal P-5.0 Server[18]與PSORT II[19]對(duì)其信號(hào)肽及亞細(xì)胞定位進(jìn)行預(yù)測(cè);通過ExPasy-ProtScale 在線軟件預(yù)測(cè)RpF3′5′H氨基酸的親/疏水性[20];分別選用PREDICT PROTEIN[21]和SWISS-MODEL[22];預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu)使用DNAMAN對(duì)F3′5′H基因編碼的氨基酸序列進(jìn)行對(duì)比分析,最后利用MEGA-7.0構(gòu)建系統(tǒng)進(jìn)化樹。
從NCBI數(shù)據(jù)庫獲得長度為1871 bp 的mRNA序列,通過NCBI中的ORF Finder找到10種可能的ORF結(jié)果(圖1),長度分別從87 bp到1 551 bp不等,選擇其中最長的進(jìn)行分析,因此RpF3′5′H基因的ORF長度為1 551 bp(圖2),共編碼516個(gè)氨基酸(圖3)。
圖2 錦繡杜鵑F3′5′H基因的cDNA序列
圖3 錦繡杜鵑F3′5′H氨基酸序列
2.2.1 理化性質(zhì)
使用Prot Param對(duì)RpF3′5′H基因編碼的氨基酸序列進(jìn)行蛋白質(zhì)理化性質(zhì)分析,結(jié)果顯示,其蛋白分子量為57.31 kD,等電點(diǎn)為9.03,共由20種氨基酸組成,其中含量較多的為亮氨酸和丙氨酸。半衰期為30 h,推測(cè)其為穩(wěn)定蛋白。使用Prot Scale分析F3′5′H氨基酸序列的疏水性/親水性,結(jié)果表明,親水性最強(qiáng)分值為-4.5,疏水性最強(qiáng)分值為4.5,平均疏水性為-0.49,該蛋白總體表現(xiàn)為親水性,見圖4。
圖4 錦繡杜鵑F3′5′H蛋白親水性/疏水性預(yù)測(cè)
2.2.2 信號(hào)肽及亞細(xì)胞定位預(yù)測(cè)分析
信號(hào)肽處于蛋白質(zhì)N端,是引導(dǎo)新合成的蛋白質(zhì)向分泌通路轉(zhuǎn)移的短肽鏈,極少超過45個(gè)氨基酸殘基,通過SignalP-5.0軟件分析RpF3′5′H前70個(gè)氨基酸,結(jié)果顯示此蛋白無信號(hào)肽,無RNA結(jié)合位點(diǎn)。PSORTII分析結(jié)果顯示,F(xiàn)3′5′H蛋白有高達(dá)39.1%的概率定位于細(xì)胞質(zhì)內(nèi),因此推斷RpF3′5′H定位于細(xì)胞質(zhì)內(nèi)的可能性最大,見表1。
表1 RpF3′5′H的亞細(xì)胞定位
2.2.3 RpF3′5′H多序列對(duì)比分析
利用 DNAman 軟件對(duì)不同物種F3′5′H的氨基酸序列進(jìn)行比對(duì)后發(fā)現(xiàn)(見圖5),RpF3′5′H含有與其他同源基因相似的保守區(qū)。如“PPGP” 序列,是細(xì)胞色素 P450 酶系基序,連接膜的錨定位點(diǎn)和酶蛋白的球體部分[23]。I 螺旋基序“AGTDT”,該序列高度保守與底物的選擇性結(jié)合有關(guān)[24]。C 端血紅素的結(jié)合區(qū)“FGAGRRICAG”,其是 CYP 酶系所必需的序列,同時(shí)該段序列受半胱氨酸的調(diào)節(jié)[25]。
注:CcF3′5′H QOR29536.1(Cistus creticus subsp.creticus); GaF3′5′H KHF97502.1(Gossypium arboreum);NnF3′5′H ARQ79447.1(Nelumbo nucifera); RnF3′5′H AGI16385.1(Ribes nigrum); JcF3′5′H XP_012065863.1(Jatropha curcas); PtF3′5′H XP_002314004.2(Populus trichocarpa); CpF3′5′H ACX37698.1(Cyclamen persicum); VdF3′5′H AHK10251.1(Vitis davidii); VvF3′5′H BAE47007.1(Vitis vinifera); VmF3′5′H ACZ63205.1(Vinca major); AcF3′5′H PSR86766.1(Actinidia chinensis var.chinensis); RpF3′5′H BAF96946.1(Rhododendron pulchrum); VcF3′5′H AYC35391.1(Vaccinium corymbosum)。
2.2.4 二級(jí)結(jié)構(gòu)與三級(jí)結(jié)構(gòu)預(yù)測(cè)
氨基酸的排列順序?yàn)榈鞍踪|(zhì)的一級(jí)結(jié)構(gòu),決定了蛋白質(zhì)的性質(zhì);二級(jí)結(jié)構(gòu)是指多肽主鏈骨架原子沿一定的軸盤旋或折疊而形成的特定構(gòu)象,即肽鏈主鏈骨架原子的空間位置排布,不涉及氨基酸殘基側(cè)鏈;三級(jí)結(jié)構(gòu)是在二級(jí)結(jié)構(gòu)的基礎(chǔ)上借助范德華力、氫鍵、靜電和疏水等相互作用折疊形成特定的球狀分子結(jié)構(gòu),是蛋白質(zhì)發(fā)揮功能的基礎(chǔ)。蛋白結(jié)構(gòu)分析顯示(見圖6),RpF3′5′H蛋白的二級(jí)結(jié)構(gòu)包含較多的α螺旋(見表2),同時(shí)三級(jí)結(jié)構(gòu)中也存在大量的螺旋結(jié)構(gòu),這種高度保守的螺旋基序可能與底物的選擇與結(jié)合有關(guān)。
圖6 RpF3′5′H蛋白的空間構(gòu)象
表2 RpF3′5′H的二級(jí)結(jié)構(gòu)
2.2.5 進(jìn)化樹分析
進(jìn)化樹在生物學(xué)中用來表示物種之間的進(jìn)化關(guān)系。在進(jìn)化樹上每個(gè)結(jié)點(diǎn)代表一個(gè)物種,如果每一條邊都被賦予一個(gè)適當(dāng)?shù)臋?quán)值,那么兩個(gè)結(jié)點(diǎn)之間的最短距離表示相應(yīng)兩個(gè)物種之間的差異程度。通過NCBI在線工具Blastx搜索同源序列,篩選出同源性高于75%的13個(gè)氨基酸序列,使用MEGA 7.0構(gòu)建進(jìn)化樹(圖7)。結(jié)果顯示,錦繡杜鵑F3′5′H氨基酸序列與高叢越橘、獼猴桃F3′5′H氨基酸序列有極高親緣性。
圖7 RpF3′5′H進(jìn)化系統(tǒng)分析
通過對(duì)錦繡杜鵑F3′5′H基因進(jìn)行生物信息學(xué)分析發(fā)現(xiàn)RpF3′5′H基因cDNA全長為1 551 bp,共編碼516個(gè)氨基酸。其蛋白分子量為57.31 kD,理論等電點(diǎn)為9.03,共由20種氨基酸組成,亮氨酸及丙氨酸含量較多。RpF3′5′H蛋白半衰期為30 h,屬于穩(wěn)定蛋白,有利于其在花色苷積累過程中持續(xù)發(fā)揮作用。通過PSORT Ⅱ在線軟件分析,并結(jié)合“轉(zhuǎn)心烏”馬鈴薯F3′5′H蛋白的定位預(yù)測(cè)[26],及該蛋白所發(fā)揮的功能,推斷RpF3′5′H在細(xì)胞質(zhì)中發(fā)揮作用的可能性最大。同時(shí),RpF3′5′H蛋白無 DNA Binding Site以及 RNA Binding Site,進(jìn)一步證明其定位于細(xì)胞質(zhì)中的可能性最大。通過氨基酸序列比對(duì)發(fā)現(xiàn),不同物種的F3′5′H還有很多高度保守的氨基酸區(qū)域,這些未知區(qū)域功能的揭示將為全面解析 F3′5′H在花色素代謝途徑中的作用機(jī)制提供理論依據(jù)。
花色苷的生物合成需要多酶復(fù)合體的催化,在合成過程中多酶復(fù)合體被細(xì)胞色素P450固定在內(nèi)質(zhì)網(wǎng)上發(fā)揮作用。RpF3′5′H屬于細(xì)胞色素P450家族,它在氧和NADPH的參與下,可以催化五羥基黃烷酮最終生成二氫楊梅素,作為藍(lán)色花色素合成的底物。Shimada等[27-28]的研究表明,將矮牽牛、草原龍膽的F3′5′H基因轉(zhuǎn)入不含F(xiàn)3′5′H基因的矮牽牛或者煙草中,轉(zhuǎn)基因植株明顯比野生型積累了更多的飛燕草素,導(dǎo)致藍(lán)紫色花的形成。Wang等[29]研究發(fā)現(xiàn)不同物種F3′5′H基因在不同發(fā)育時(shí)期和不同組織的時(shí)空表達(dá)模式不同,同樣Menting[30]和白藍(lán)等[31]的研究也發(fā)現(xiàn)F3′5′H基因的表達(dá)有時(shí)間差異性,花蕾期間表達(dá)量高,盛花期基本不表達(dá),花色積累在盛花期之前已到達(dá)最大值。因此,可以在盛花期前通過調(diào)節(jié)花瓣的pH值、金屬元素濃度等來提高特定花色素苷的積累。綜上,我們可以有選擇性地克隆F3′5′H基因并利用轉(zhuǎn)基因技術(shù)將其導(dǎo)入不同受體植物中,從而獲得可量產(chǎn)的藍(lán)紫色株系。