端木慧子 ,牛志新 ,李海英 *
(1.黑龍江大學 農業(yè)微生物技術教育部工程研究中心,哈爾濱150500;2.黑龍江大學生命科學學院/黑龍江省普通高校分子生物學重點實驗室,哈爾濱150080)
甜菜是雙子葉藜科(Chenopodiaceae)甜菜屬(Beta)的二年生異花授粉作物,是世界上重要的經濟作物之一,供應著世界上約35%的糖[1]。同時,甜菜也是發(fā)展畜牧業(yè)的優(yōu)良飼料以及新興的能源作物,具有重要的研究價值。目前,我國對于甜菜的研究多集中于生理、生化和表型的研究,分子水平的研究相對較少。近年來高通量測序技術的發(fā)展為研究者從全基因組水平篩選功能基因,培育優(yōu)質甜菜品種提供了可能。
絲氨酸/蘇氨酸蛋白激酶(serine/threonine protein kinase,STPK)是一種特異催化蛋白質底物上的絲氨酸/蘇氨酸殘基磷酸化,從而調節(jié)該蛋白質功能的酶。其重要的功能之一就是參與環(huán)境脅迫信號的轉導過程[2-3]。目前,已經有多個STPK在擬南芥、水稻、小麥等植物中被鑒定出在非生物脅迫的過程中起著重要的作用[4-8]。然而,全基因組水平上甜菜STPK家族的分析和功能預測研究相對較少。因此,本研究通過生物信息學的方法及工具,從全基因組的水平鑒定甜菜STPK,并從序列和蛋白互作水平對其進行系統(tǒng)的分析,為今后甜菜遺傳育種提供理論支持與優(yōu)質基因資源。
利用HMMER[9]軟件構建STPK家族的序列特征模型,并利用該模型在NCBI(https://www.ncbi.nlm.nih.gov/)數據庫中搜索可能的甜菜STPK家族成員,進一步利用SMART(http://smart.embl-h(huán)eidelberg.de/)數據庫對結果進行驗證,最終獲得甜菜STPK家族成員。
利用ClustalX[10]對甜菜STPK進行多序列比對,并利用MEGA 5.0軟件[11]建立甜菜STPK家族的系統(tǒng)發(fā)育樹。所采用的方法為最大似然法(Maximum likelihood,ML)和最大簡約法(Maximum parsimony,MP),并將兩種方法的結果進行整合,最終利用Bootstrap方法對結果進行檢驗(隨機1000次)。
利用STRING數據庫 (https://string-db.org/cgi/input.pl)構建甜菜STPK蛋白互作網絡,并利用MCL(Markov Clustering Algorithm)聚類算法識別網絡中的子網。通過agriGO[12](http://systemsbiology.cau.edu.cn/agriGOv2/)數據庫對網絡中的蛋白質進行功能富集分析。
利用HMMER軟件結合基因注釋與SMART數據庫,共在甜菜基因組中鑒定得到148個STPK。多序列比對結果顯示,這148條序列所具有的保守結構集中在第100個氨基酸到第500個氨基酸之間,共有11個保守的結構域,與已知蛋白激酶結構域相符[13]。
分別使用最大似然法(ML)和最大簡約法(MP)構建甜菜STPK的系統(tǒng)發(fā)育樹,選擇兩種方法共有的結構進行整合,最終獲得的系統(tǒng)發(fā)育樹分為9個亞類,這些不同亞類中的基因具有不同的結構特點,可能行使不同的功能(圖1)。比如亞類I中共有13個成員,主要由絲氨酸/蘇氨酸蛋白激酶AFC和MHK及其異構體組成,而亞類II主要包含WNK等蛋白激酶。
圖1 甜菜STPK家族系統(tǒng)發(fā)育樹Fig.1 Phylogenetic tree of STPKs in sugar beet
圖2 甜菜STPK蛋白互作網絡Fig.2 Protein-protein network of STPKs in sugar beet
利用STRING數據庫構建甜菜STPK蛋白互作網絡并分析,共識別了8個子網(圖2)。值得注意的是,最大的子網是由 WNK8、SnRK2.8、SnRK2.3、SnRK2.7、SnRK2.2、SnRK2.5、SnRK2.1、SnRK2.4、OST1 和 HT1 等蛋白激酶構成。其中,SnRK2蛋白激酶是植物中非常常見的一種絲氨酸/蘇氨酸蛋白激酶[14],它屬于蔗糖非酵解型-1(SNF1)型,土壤中的鹽分或者脫落酸可以使SnRK2蛋白激酶激活,從而調控下游基因表達。因此,SnRK2蛋白激酶與植物抗逆境生存有很大關聯。
對網絡中的節(jié)點進行功能富集分析的結果顯示,這些STPK家族成員主要富集在“細胞過程”、“代謝過程”、“發(fā)育過程”等生物學功能上(圖3),說明STPK家族參與了廣泛的生物學過程。值得注意的是,一些STPK家族成員顯著富集在了刺激響應功能上,說明一些STPK參與植物的脅迫應答過程。
圖3 甜菜STPK功能注釋Fig.3 Functional annotation of STPKs in sugar beet
本研究以甜菜全基因組序列為基礎,通過HMMER方法進行甜菜STPK家族鑒定。與傳統(tǒng)的BLAST方法相比,HMMER能夠更加準確找到親緣關系較遠的同源序列。另外,本研究采用SMART數據庫對HMMER鑒定的STPK家族成員做進一步的檢驗,最大程度上確保了鑒定的甜菜STPK的全面性和準確性。
通過多序列比對的方法對鑒定得到的甜菜STPK家族成員進行序列特征分析,結果顯示鑒定得到的甜菜STPK家族成員均具有蛋白激酶所特有的11個激酶結構域,再次證明了鑒定結果的可靠性。分別采用最大似然法(ML)和最大簡約法(MP)兩種方法構建進化樹,并僅選取兩種方法結果中相同的部分構建系統(tǒng)發(fā)生樹,并在構建進化樹過程中采用了BootStrap方法進行驗證,確保了構建進化樹的科學性與準確性。
甜菜STPK蛋白互作網絡分析的結果顯示,STPK之間存在復雜的互作關系,不同的STPK可能行使不同的功能。而功能富集分析的結果顯示,除了正常的生物學功能,一些STPK還參與了植物發(fā)育與刺激響應過程。
本研究從甜菜基因組中鑒定得到148個甜菜STPK家族成員,這些甜菜STPK家族成員分為9個亞類,每個亞類可能行使不同的功能。甜菜STPK互作網絡包括8個子網,網絡中的蛋白質與發(fā)育和刺激應答功能相關。本研究結果可為甜菜遺傳育種提供理論支持與基因資源。