于岸洲 彭冠華
摘 要:細(xì)胞骨架是細(xì)胞的重要結(jié)構(gòu)之一,它在維持細(xì)胞形態(tài)、物質(zhì)運(yùn)輸與細(xì)胞分裂中都有重要作用。因?yàn)榧?xì)胞骨架蛋白屬于高表達(dá)的蛋白,在植物中任何部位,都有表達(dá)。細(xì)胞骨架對(duì)植物的抗逆可能具有重要作用。本文利用大數(shù)據(jù)挖掘方法,通過聚類分析、主成分分析算法挖掘出兩個(gè)不同源細(xì)胞骨架基因具有相似的表達(dá)模式,初步得出這兩個(gè)基因在響應(yīng)干旱脅迫中具有相似功能。
關(guān)鍵詞:細(xì)胞骨架基因;干旱脅迫;表達(dá)模式;聚類分析;主成分分析
中圖分類號(hào):R96 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2018)14-0214-02
1 實(shí)驗(yàn)背景介紹
細(xì)胞骨架是細(xì)胞的重要結(jié)構(gòu)之一,它在維持細(xì)胞形態(tài)、物質(zhì)運(yùn)輸與細(xì)胞分裂中都有重要作用。細(xì)胞骨架中微絲與微管的聚合與解聚,二者分別結(jié)合不同的結(jié)合蛋白,具有不同的功能。所以,為了探究在植物的逆境生長(zhǎng)中細(xì)胞骨架基因及其相關(guān)基因在逆境中的功能,我們?cè)贜CBI的Gene Expression Omnibus(GEO)Database數(shù)據(jù)庫(kù)中找到了GPL15008平臺(tái)做的Daytime soybean transcriptome fluctuations during water deficit stress(大豆轉(zhuǎn)錄組在白天的缺水脅迫下波動(dòng))的數(shù)據(jù)。將此數(shù)據(jù)下載后,于R軟件中轉(zhuǎn)換為TXT格式[2]。用于分析。該平臺(tái)通過用Illumina技術(shù)對(duì)36個(gè)cDNA文庫(kù)進(jìn)行測(cè)序,鑒定了在大豆植物中差異表達(dá)的基因,以應(yīng)答水缺乏和在一天的不同時(shí)期上調(diào)或下調(diào)的基因。在54,175個(gè)預(yù)測(cè)的大豆基因(Glyma v1.1)中,35.52%在24小時(shí)期間表現(xiàn)出表達(dá)振蕩。所以目標(biāo)在于從Phytozome V11.0數(shù)據(jù)庫(kù)中找到已知的確定的編碼細(xì)胞骨架的基因,以這些已知基因?yàn)榛A(chǔ),找到下載的數(shù)據(jù)中包含的這些已知基因。采用聚類分析的方法找出其他可能與這些基因有共表達(dá)途徑的基因。然后采用生物信息學(xué)方法進(jìn)行基因功能的預(yù)測(cè)。
以表1中的Glyma.04g02390基因?yàn)檠芯繉?duì)象,通過PhytozomeV11.0數(shù)據(jù)庫(kù)、文獻(xiàn)追蹤的方法總結(jié)出此基因編碼微管蛋白的相關(guān)蛋白(FtsZ蛋白)根據(jù)搜集的資料表明,該基因?qū)儆贔tsZ家族基因,F(xiàn)ts1Z基因編碼的蛋白能夠在原核細(xì)胞分裂時(shí)產(chǎn)生分裂環(huán),在分裂環(huán)中微管之間發(fā)生相對(duì)滑動(dòng)導(dǎo)致細(xì)胞縮。序列比較分析以及對(duì)FtsZ蛋白和微管蛋白三維結(jié)構(gòu)的解析都顯示出二者在序列和結(jié)構(gòu)上具有同源性。且FtsZ蛋白在不同物種中的功能都是保守的。
2 聚類分析
以該基因?yàn)閰⒖紝?duì)象,進(jìn)行聚類分析:因?yàn)橄螺d的數(shù)據(jù)是按照時(shí)間序列進(jìn)行基因表達(dá)量的測(cè)量記錄。所以按照時(shí)間序列對(duì)數(shù)據(jù)進(jìn)行了雙因素K值聚類[3]。聚類結(jié)果如下:
如圖1所示,紅色代表基因表達(dá)量上調(diào);綠色代表基因表達(dá)量下調(diào);黑色代表基因表達(dá)量穩(wěn)定。圖中橫向聚類為Gene ID,縱向?yàn)樘幚頃r(shí)間的聚類。圖中黃色方框圈出的部分代表Glyma.04g02390基因在缺水處理下不同時(shí)間段的表達(dá)量情況。以大于0.9的相關(guān)性系數(shù)為篩選分類標(biāo)準(zhǔn),表達(dá)情況相似的基因?yàn)镚lyma.10g01940。首先,利用PhytozomeV11.0數(shù)據(jù)庫(kù)查詢以上基因的功能,發(fā)現(xiàn)Glyma.10g01940無已知功能。
在熱圖中發(fā)現(xiàn),Glyma.04g02390基因在干旱處理后表達(dá)量一直下調(diào),根據(jù)該基因的功能,猜想該基因下調(diào)導(dǎo)致了葉綠體含量的減少,通過這種途徑來應(yīng)對(duì)干旱。當(dāng)干旱脅迫時(shí),該基因表達(dá)量下調(diào),導(dǎo)致FtsZ蛋白合成減少,這樣導(dǎo)致了葉綠體分裂時(shí)無法產(chǎn)生合適的分裂環(huán),分裂環(huán)中微管的相對(duì)滑動(dòng)距離不足,導(dǎo)致葉綠體無法正常分裂。從而葉綠體數(shù)量減少。而保衛(wèi)細(xì)胞中一般含有大量葉綠體,通過葉綠體光合作用利用CO2值升高pH,促使淀粉磷酸化酶催化淀粉轉(zhuǎn)化為葡萄糖-1-磷酸,細(xì)胞中糖分高,使得細(xì)胞中的水的相對(duì)濃度下降,從而導(dǎo)致水勢(shì)下降,水勢(shì)下降對(duì)水的吸收能力增大,細(xì)胞吸收水分,氣孔開放。當(dāng)干旱脅迫時(shí),F(xiàn)tsZ蛋白合成減少,葉綠體分裂受抑制,導(dǎo)致光合作用不足,CO2利用率低,不能產(chǎn)生足夠的糖分使得氣孔導(dǎo)度減小。以此減少水分流失。
另一方面,根據(jù)圖2中BLAST比對(duì)Glyma.10g01940與Glyma.04g02390的相似性不高,所以我判斷二者不具有同源性。聚類分析得知二者的差異表達(dá)方式及其相似,差異表達(dá)的相關(guān)性系數(shù)高,所以我猜想該基因可能具有Arc基因的功能。Arc基因源于擬南芥的FtsZ基因研究中的核基因突變體,該基因在正常情況下誘導(dǎo)葉綠體正常分裂,突變后導(dǎo)致葉綠體分裂數(shù)顯著下降。
3 啟動(dòng)子的主成分分析
利用R語(yǔ)言做出主成分分析圖[1]:
周期相似的啟動(dòng)子,能夠?qū)ο嗤沫h(huán)境變化產(chǎn)生共同貢獻(xiàn)值的響應(yīng)。所以由表2、表3以及圖3的主成分分析圖可以分析這是一類突變基因,可能在干旱響應(yīng)中產(chǎn)生類似功能。后期應(yīng)該增加篩選突變株的實(shí)驗(yàn),并將突變株置于干旱脅迫下處理一定時(shí)間觀測(cè)其葉綠體數(shù)目。
4 結(jié)語(yǔ)
盡管在Blast結(jié)果上Glyma.10g01940與Glyma.04g02390的相似性不高,所以判斷二者不具有同源性。聚類分析得知二者的差異表達(dá)方式及其相似,差異表達(dá)的相關(guān)性系數(shù)高,所以猜想該基因可能具有Arc基因的功能。在啟動(dòng)子的主成分分析中兩個(gè)基因的啟動(dòng)子都有相似功能的順式作用元件,且兩個(gè)啟動(dòng)子相似的順手作用原件主要集中在相同正負(fù)極鏈上。所以兩個(gè)基因在響應(yīng)干旱的表達(dá)模式上具有一定相似性。
參考文獻(xiàn)
[1]黃金國(guó),劉濤,周先春,嚴(yán)錫君.基于可變粒度機(jī)會(huì)調(diào)度的網(wǎng)絡(luò)大數(shù)據(jù)知識(shí)擴(kuò)充算法[J/OL].計(jì)算機(jī)應(yīng)用研究,2019,(03):1-3[2018-03-10].
[2]鄭喬舒,岳淏偉,楊云鋒.基因芯片數(shù)據(jù)預(yù)處理方法(LnMR和RAln)的評(píng)估和比較[J].微生物學(xué)通報(bào),2015,42(05):817-825.
[3]張聰.基于極限學(xué)習(xí)機(jī)的基因表達(dá)數(shù)據(jù)分類算法研究[D].中國(guó)計(jì)量學(xué)院,2014.