于千 黃濤
摘 要: 對(duì)Genbank數(shù)據(jù)庫(kù)中的43條長(zhǎng)度在546-906個(gè)氨基酸之間的HSP90蛋白序列,采用生物信息學(xué)手段對(duì)HSP90家族蛋白序列標(biāo)識(shí)和保守基序進(jìn)行了分析,并結(jié)合這些信息對(duì)這些蛋白進(jìn)行了分子系統(tǒng)發(fā)育分析表明:藻類HSP90蛋白高度保守,家族內(nèi)可以分為幾個(gè)亞家族,亞家族內(nèi)既有原核又有真核藻類HSP90蛋白序列。
關(guān)鍵詞: 藻類熱休克蛋白;HSP90;系統(tǒng)發(fā)育
【中圖分類號(hào)】 Q51 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 2236-1879(2017)12-0013-01
大多數(shù)熱休克蛋白的研究是以微生物、動(dòng)物材料為主,關(guān)于植物熱休克蛋白反應(yīng)的研究起步較晚,80年代初期才開始研究高等植物中的熱休克蛋白[1]。HSP90蛋白存在于從低等的原核藻類到陸生高等的植物中,在高等植物中,有些HSP90在常溫下即有較高的表達(dá),有些需要熱激誘導(dǎo)產(chǎn)生,此外,低溫、光照和高鹽脅迫亦能使其高表達(dá)[2]。因此,以HSP90蛋白作為貫穿原核藻類到真核藻類間的紐帶,除了可以了解原核藻類與真核藻類HSP90家族間的進(jìn)化關(guān)系,也能為進(jìn)一步探索HSP90蛋白在藻類中的分子系統(tǒng)學(xué)的研究提供有價(jià)值的參考依據(jù)。
1 材料與方法
1.1 蛋白序列的獲得:
數(shù)據(jù)資料來源于NCBI的蛋白質(zhì)數(shù)據(jù)庫(kù)。共檢索到33種藻類的336條HSP90蛋白提交記錄。對(duì)這些蛋白序列下載到本地后通過人工和軟件篩選,去除重復(fù)記錄和長(zhǎng)度不足500bp的序列后,共得到43條長(zhǎng)度在546-906個(gè)氨基酸之間的HSP90蛋白序列。
1.2 HSPs蛋白序列結(jié)構(gòu)分析:
蛋白序列標(biāo)識(shí)的繪制和分析在網(wǎng)站上完成;運(yùn)用MEME程序分析基因家族的氨基酸保守基序,程序在設(shè)置上選擇做大的基序數(shù)為50,不同的基序數(shù)為15,其它均采用默認(rèn)的參數(shù);利用TargetP和SignalP工具進(jìn)行信號(hào)肽和導(dǎo)肽預(yù)測(cè)。
1.3 HSPs蛋白系統(tǒng)發(fā)育關(guān)系分析:
將得到的氨基酸序列, 用CLUSTAL_X軟件進(jìn)行比對(duì), 并進(jìn)行人工調(diào)整以避免缺刻(gap)對(duì)結(jié)果的影響. 系統(tǒng)發(fā)育關(guān)系的構(gòu)建和距離計(jì)算使用MEGA3.1 軟件包進(jìn)行。
2 結(jié)果與討論
2.1 蛋白序列標(biāo)識(shí)的繪制和Motif分析:
TargetP進(jìn)行導(dǎo)肽預(yù)測(cè)結(jié)果顯示(表1),其中預(yù)測(cè)可靠性等級(jí)最高為一級(jí)(隱藻的HSP90可能性=0.947),但細(xì)胞內(nèi)定位未顯示;隱藻門的四個(gè)HSP90預(yù)測(cè)等級(jí)為3-4級(jí),可能性平均在0.7左右,定位于線粒體中;定位于葉綠體的只有萊茵衣藻的HSP90(可能性=0.741),該導(dǎo)肽位于葉綠體的可能性較高。
對(duì)HSP90基因家族的氨基酸序列做保守基序的分析,最短的序列有546個(gè)氨基酸殘基,最長(zhǎng)的序列有906個(gè)氨基酸殘基。發(fā)現(xiàn)基序1-15在HSP90蛋白家族的大多數(shù)的蛋白序列中都有,并且基序6、8、2、7和10只是在保守的HATPase_C結(jié)構(gòu)域內(nèi),其余基序都位于HSP90中。HSPs的高度保守性說明他們?cè)谏锷顒?dòng)中具有重要的作用(圖1)。
2.2 利用SignalP和TargetP工具進(jìn)行信號(hào)肽和導(dǎo)肽預(yù)測(cè):
熱休克蛋白HSP90的信號(hào)肽剪切位點(diǎn)位于第第22 和 第23位氨基酸之間,即: VSA-MC之間,可能為信號(hào)肽的各個(gè)參數(shù)值為:(max.C=0.380;max.Y=0.467;max.S=0.972),其成為信號(hào)肽的可能性非常高。通過查詢?cè)摰鞍姿跀?shù)據(jù)庫(kù)信息發(fā)現(xiàn),此蛋白序列恰好是一種內(nèi)質(zhì)網(wǎng)型蛋白,屬于一種分泌型蛋白。
2.3 蛋白序列分子系統(tǒng)發(fā)育分析:
用鄰接法構(gòu)建了HSP90氨基酸序列的系統(tǒng)發(fā)育樹,得到的無(wú)根樹顯示分為4個(gè)群,群1-4分別包括蛋白個(gè)數(shù)為:15,14, 5和9。用鄰接法構(gòu)建的有根樹也支持這一結(jié)果。我們推測(cè)所分析的43個(gè)HSP90蛋白序列可初步分為2-4個(gè)亞家族,并且亞家族之間對(duì)應(yīng)的編碼基因可能為旁系同源基因,即HSP90基因的復(fù)制先于物種的分離。對(duì)HSP90蛋白的基因序列分析提示,其在由原核向真核細(xì)胞進(jìn)化過程中發(fā)生過基因復(fù)制事件,出現(xiàn)了細(xì)胞質(zhì)型和內(nèi)質(zhì)網(wǎng)型兩種HSP90蛋白,這與無(wú)根樹中的分為不同的群是相符合的,但目前對(duì)HSP90家族的亞家族劃分還不明確,因此,今后在考慮用HSP90蛋白序列對(duì)不同藻類進(jìn)行分子系統(tǒng)學(xué)研究時(shí),應(yīng)該注意旁系同源基因的干擾,隨著公共數(shù)據(jù)庫(kù)中藻類HSP90蛋白序列的增多和藻類HSP90蛋白各個(gè)亞家族劃分的明晰,HSP90將會(huì)更加成熟地應(yīng)用與藻類分子系統(tǒng)學(xué)的研究。
參考文獻(xiàn)
[1] 陳亞瓊,肖調(diào)江,周浙昆(2006).熱激蛋白與生物環(huán)境適應(yīng)及進(jìn)化的關(guān)系.自然科學(xué)進(jìn)展, 16(9):1066-1073.
[2] Isaacs JS, Xu W, Neckers L (2003). Heat shock protein 90 as a molecular target for cancer therapeutics. Cancer Cell. 3(3):213-217.