倪典墨, 李冉郡, 郭忠靜, 高玲玲, 周嘉裕, 廖 海
(西南交通大學 生命科學與工程學院, 成都 610031)
百合科(Liliaceae)為單子葉植物中的一大科,廣布于溫帶及亞熱帶地區(qū),在全世界約有250屬3500種[1]。我國百合科植物約有60屬,600多種,主要分布在西南地區(qū)[1],其在藥用、食用、園林綠化及工業(yè)等領域有較大的開發(fā)利用潛力。例如,川貝母是貝母屬(Fritillaria)的代表植物,其藥用歷史首載于《神農(nóng)本草經(jīng)》,其鱗莖具有潤肺、止咳與化痰等功效,被譽為“止咳神藥”[2]。百合屬(Lilium)植物百合(Liliumbrownii)不僅能藥用和食用,而且因其花朵鮮艷、花色豐富,亦被視為庭園觀賞和綠化珍品[3]。蘆薈屬(Aloe)植物蘆薈(Aloevera),既是優(yōu)良的觀賞花卉,還能吸收苯等有毒物質,起到凈化空氣的作用[4],其在藥理上具有殺菌抗炎、健胃下泄、強心活血、解毒化瘀、免疫和再生等作用[5]。黃精屬(Polygonatum)植物黃精(Polygonatumsibiricum),主要用于藥物和保健品,有養(yǎng)陰生津、補脾潤肺、止虛咳、治消渴和降低膽固醇等作用,對治療冠心病、腦動脈硬化疾病也有較好的療效[6]。
然而,百合科植物在栽培及生長過程中受到了多種生物及非生物因素的影響:第一,地老虎、蚜蟲等大規(guī)模蟲害的出現(xiàn),極易造成植株死亡[7];第二,貝母的耐熱性弱導致貝母出現(xiàn)“倒苗”,嚴重影響產(chǎn)量[8];第三,百合科植物的生長受到黑腐病、灰霉病、干腐病與軟腐病等的嚴重威脅[9];第四,百合科藥用植物活性成分含量偏低,這也限制了該科植物藥用價值的提升[10]?;蚬こ碳夹g是改良植物性狀、提高百合科植物抵抗外界不利因素能力與活性成分含量的一種有效手段。葉綠體因其表達蛋白穩(wěn)定性較高,同時能將轉化基因的擴散控制在最低程度[11],使之成為植物基因工程的理想載體。目前,葉綠體轉基因技術在提高植物抗性及改良性狀方面已取得較大進展,為提高植物的抗病蟲害以及對增強干旱、鹽堿等逆境的抗性開辟了一條更為有效的途徑[12]。并且,葉綠體載體也大量應用于疫苗抗原、激素及抗體等外源蛋白質的生產(chǎn)[13]。相比較核基因組,葉綠體基因組在結構與序列上相對保守,組成及結構更簡單,具有與核基因明顯不同的密碼子偏好性,因此為提高外源基因在葉綠體中的表達效率,研究葉綠體基因的密碼子偏好性勢在必行[14]。psbA基因是葉綠體中的重要光調控基因,其編碼光合系統(tǒng)II反應中心的Dl蛋白,在光合作用中發(fā)揮光電子轉運的功能[15]。psbA基因在葉綠體基因工程中發(fā)揮了重要作用,其啟動子(PpsbA)與終止子(TpsbA)經(jīng)常作為外源基因的啟動子與終止子使用,并且psbA-trnK間隔區(qū)常常作為外源基因的插入位點[16]。
為了更好地設計葉綠體高效表達載體,進一步利用葉綠體基因工程技術改良百合科植物重要性狀,分析百合科植物psbA基因密碼子偏好性十分必要。本文以60種百合科植物的psbA基因為研究對象,分析該基因的堿基組成特點以及密碼子的偏好性,以期對葉綠體基因工程研究提供理論參考。
實驗室近期完成了暗紫貝母(Fritillariaunibracteata)的葉綠體基因組測序,從中獲得了暗紫貝母的psbA基因序列(登錄號MN727396)。同時,登錄NCBI數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/),下載來自百合科百合屬、貝母屬、黃精屬與蔥屬等7個不同屬來源的59種植物的psbA基因序列,具體序列信息見表1。
表1 60種百合科植物psbA基因序列
續(xù)表1 (Table 1 Continued)
1.2.1psbA基因同義密碼子偏好性研究
密碼子偏好性的相關參數(shù)包括:相對密碼子使用度RSCU(Relative synonymous codon usage);密碼子適應指數(shù)CAI(Codon adaptation index);同義密碼子第3位堿基的GC含量GC3s;同義密碼子GC含量;有效密碼子數(shù)ENc(Effective number of codons)。
首先,利用CodonW程序分析60種百合科植物psbA序列的RSCU、CAI、GC3s和GC含量;其次,利用CUSP和CHIPS在線程序計算各psbA序列的密碼子出現(xiàn)頻率和ENc值。
1.2.2 密碼子偏好性與CDS的聚類分析
以60種百合科植物、煙草、擬南芥的密碼子RSCU值為基礎,利用SPSS軟件進行密碼子偏好性聚類分析。利用ClustalW軟件對psbA基因的 CDS序列進行序列比對,再用DNAMAN軟件將比對結果,利用鄰近法構建系統(tǒng)進化樹。
RSCU是指對于某一特定的密碼子在編碼對應氨基酸的同義密碼子間的相對概率。若RSCU>1,則說明該密碼子的使用頻率高;若RSCU<1,則說明該密碼子的使用頻率低;若RSCU=1,則說明該密碼子的使用不存在偏好性[17]。60種百合科植物的psbA基因中,有26個密碼子具有偏好性,分別為GCU、GCC、UGC、GAU、GAA、UUC、GGU、GGA、CAU、AUU、AAA、UUG、CUC、AAU、CCA、CAA、AGA、AGG、AGU、AGC、ACC、ACG、GUU、UAC、UAA與UAG。其中GCC、GAU、GAA、UUC、CAU、CUC、CCA、CAA、AGA、AGG、AGC與ACC的偏好性極強,它們的RSCU值不小于2;AUG與UGG密碼子的RSCU值為1,不具有偏好性。RSCU=0的密碼子有13個,分別為GAC、GAG、UUU、CAC、CUU、CUA、CCG、CAG、CGU、CGC、CGA、CGG和UCA;RSCU<0.5的密碼子有10個,分別為GCA、GCG、UGU、UUA、CCU、UCU、UCG、ACA、GUC和UGA;百合科植物傾向于UAA和UAG作為終止密碼子(圖1)。
圖1 60種百合科植物psbA基因的RSCU熱圖
ENc值用來衡量同義密碼子的偏好使用程度,介于20~61,以35為臨界值,越靠近20,則表明該密碼子的偏好性越強[18]。CAI值常用來衡量基因表達強度,其大小0~1,其值越高,則表明基因表達強度越高[19]。GC3s可以反映密碼子第3位的使用偏好性,若GC3s大于0.5,則密碼子偏向于G/C結尾。GC含量反映G/C堿基對的使用偏好性,若GC大于0.5,表明G/C堿基對的偏好性強,反之表示A/U的偏好性強。
圖2 psbA基因CAI、ENc、GC與GC3s熱圖
由圖2可知:百合科植物psbA基因的ENc值超過35(范圍為36.97~39.06),平均值為37.84,標準偏差為0.5147,說明百合科植物psbA基因的密碼子偏好性整體較弱;CAI值為0.212~0.233,平均值為0.218,標準偏差為0.005 19,說明密碼子的表達水平偏低[9]。由此,可以推斷百合科植物中psbA基因的表達水平較低,D1蛋白含量低,成為光反應的限制性因素之一。進一步分析psbA基因的堿基組成發(fā)現(xiàn),G+C含量介于42.1%~43.6%,平均值為42.5%,標準偏差為0.003 28,說明百合科植物更加偏向A與U堿基。以G+C為結尾的密碼子含量(GC3s)介于47.5%~48.9%,平均值為48.0%,標準偏差為0.003 71,盡管GC3s低于50%,但仍然超過G+C的總體含量。
ENc-plot分析以ENc為縱坐標、GC3s為橫坐標作圖,繪圖中的標準曲線表示密碼子偏好性僅由堿基組成決定基因位置,標準曲線計算方法[20]如下:ENc= 2 +GC3s+ 29/[GC3s2+(1-GC3s)2]。由此可構建GC3s散點圖和ENc-GC3s期望曲線,各點離期望曲線的遠近可反映密碼子偏好性形成的原因是堿基突變或是自然選擇[21]。若某一基因的密碼子偏好性形成受突變影響較大時,其ENc-GC3s點將分布于期望曲線附近;若其受自然選擇影響較大時,則會分布在偏離期望曲線較遠的位置。利用Origin 8繪制的GC3s散點圖和ENc-GC3s期望曲線可知,自然選擇是影響百合科psbA密碼子偏好性的主要原因(圖3)。
圖3 psbA基因的ENc-plot分析
圖4 psbA基因RSCU值聚類樹狀圖
依據(jù)不同植物密碼子的RSCU值進行聚類(圖4),能夠將所有百合科植物分為兩簇,其中蔥屬、黃精屬與天門冬屬聚為第一簇,百合屬、貝母屬、大百合屬和老鴉瓣屬為第二簇。來自蔥屬的12種植物具有接近的密碼子偏好性,然而,基于RSCU的聚類并不能反映出所有百合科植物之間的親緣關系,比如:日本大白合、蕎麥葉大白合與貝母屬植物聚為一類;同為大百合屬的3種植物未能單獨聚為一類,其中大百合單獨形成一個分支;百合屬與貝母屬的多種植物在聚類樹中相互交叉,形成復雜的混合分布。盡管煙草與擬南芥不屬于百合科,但卻與蔥屬、黃精屬與天門冬屬同處在第一簇,與蔥屬有相近的密碼子偏好性。
基于CDS的系統(tǒng)進化樹更接近這60種植物的真實系統(tǒng)分類,在NJ進化樹(圖5)中煙草、擬南芥與百合科植物形成2個不同的分支。百合科植物中,貝母屬、百合屬、大百合屬與老鴉瓣屬等聚為一簇,而黃精屬與天門冬屬等聚為一簇。具有相近親緣關系的植物在NJ樹中相對接近,表明psbA基因CDS的差異大小與物種的親緣關系遠近有較密切的聯(lián)系。比如:來自貝母屬的所用植物均集中在進化樹中的一個分支;來自大百合屬的3種植物集中在一個分支。
圖5 psbA基因CDS的NJ進化樹
RSCU是衡量密碼子偏好性的重要指標。對60種百合科植物psbA基因密碼子的偏好性分析,發(fā)現(xiàn)有26種存在偏好性的密碼子,其中有12個表現(xiàn)出較強的偏好性。有13個密碼子的RSCU值均顯示為0,另有10種密碼子在60種百合科植物中應用較少(RSCU<0.5),表明在百合科葉綠體基因工程中,應盡量避免這23種使用率極低的密碼子,而優(yōu)選26種存在偏好性的密碼子。從psbA基因的ENc值與堿基組成上看:百合科植物的ENc值均大于35,偏好性整體偏低;GC平均含量為42.5%,盡管GC結尾的密碼子含量(48.0%)高于GC平均含量,但仍然傾向以A/U結尾的密碼子,這與多數(shù)單子葉植物,如水稻(GC3s 49.5%)、小麥(GC3s 48.9%)、玉米(GC3s 49.7%)和高粱(GC3s 49.5%)等物種的密碼子結尾特點相一致[22]。在26個具有偏好性的密碼子中,有16個是以A/U結尾,這也表明百合科植物psbA基因偏向以A/U結尾的密碼子。一般認為,單子葉植物偏好以G/C結尾,雙子葉植物偏好以A/U結尾[23]。然而,本研究發(fā)現(xiàn)百合科與禾本科植物的GC3s均小于且接近50%,表明若開展百合科與禾本科葉綠體基因工程時,密碼子傾向于A/U結尾。CAI值反映百合科植物中psbA基因的表達水平較低,表明若對百合科植物開展基因改造以提高光合效率,psbA基因可能是一個合適的候選靶基因。比如通過調控psbA基因的表達,能夠顯著提高煙草的光合效率及生物量積累[24]。
突變和選擇是密碼子偏好形成的主要原因。ENc-plot分析結果表明60種百合科植物psbA基因的ENc-GC3s點均遠離標準曲線,基因的實際ENc值遠小于理論ENc值,表明psbA基因密碼子偏好性主要受到自然選擇的作用。
基于RSCU的聚類分析與基于CDS的進化分析結果可能存在一定差異,這種現(xiàn)象在前人[22]的研究中也曾出現(xiàn)。在本研究中,圖4和圖5的2個聚類圖也不完全一致:圖4未能將百合屬和貝母屬的植物區(qū)分開,而圖5則較好地反映了植物之間的進化關系,說明基因序列比密碼子偏好性更適應于做進化分析使用。分析導致該現(xiàn)象的可能原因是:psbA基因的適應性進化主要源于負向選擇[25],非同義密碼子的突變往往會導致psbA功能的改變,因此基因序列受到的選擇壓力更大;psbA基因的功能多樣性,植物在長期進化過程中,由于葉綠體基因與核基因組、原生噬藻體與宿主(藍藻)之間[26]的物質與信息交流,導致psbA基因雖然表現(xiàn)出一定的種族特異性,但通過單基因的密碼子偏好性聚類仍然難以反映出正確的親緣關系。