萬 莎,付蘇宏,郝豆豆,施靜,張勇群
(西藏自治區(qū)人民政府駐成都辦事處醫(yī)院,分子醫(yī)學(xué)實(shí)驗(yàn)室,四川 成都 610041)
太陽光對(duì)于植物來說是非常重要的物質(zhì),不僅提供其光合作用的能量來源,更是調(diào)節(jié)其生長(zhǎng)發(fā)育環(huán)境信號(hào),例如調(diào)節(jié)種子發(fā)芽和開花等.紫外線(ultraviolet, UV)是太陽光的組成部分,根據(jù)其波長(zhǎng)主要可分為UV-A (315-400 nm)、UV-B (280-315 nm)和UV-C (<280 nm).UV-C和大部分的UV-B在經(jīng)過地球的臭氧層時(shí)被吸收,只有UV-A和少部分的UV-B能到達(dá)地球表面.雖然只有< 0.5%的UV-B到達(dá)地面,但是其在日光光譜中的能量卻最高,對(duì)地球上的生物圈產(chǎn)生的影響最大,過量的UV-B射線會(huì)損害植物的光合作用過程[1],以及引起DNA光解產(chǎn)物的生成從而造成細(xì)胞損傷,甚至?xí)苯訐p傷蛋白質(zhì)、脂質(zhì)和RNA[2-3].此外,UV-B的照射還會(huì)引起植物形態(tài)學(xué)上的改變,Str?mme等發(fā)現(xiàn)UV-B會(huì)影響白楊芽的定型以及延遲花蕾的定植[4],Mark等曾報(bào)道增加UV-B照射會(huì)顯著降低歐洲玉米的高度[5],Johanson等曾報(bào)道落葉性越橘屬植物的葉片厚度隨著UV-B照射的增加減小[6],Jenkins等曾總結(jié)發(fā)現(xiàn)UV-B照射通常引起植物葉腋分支增多[7].
臭氧是UV-B主要的吸收物質(zhì),隨著地球臭氧層被破壞,越來越多的UV-B到達(dá)地面,對(duì)地球上的天然植物系統(tǒng)造成影響[8].因此,探討UV-B對(duì)植物基因表達(dá)的影響從而了解植物對(duì)UV-B的應(yīng)激保護(hù)機(jī)制則變得十分重要.GEO (gene expression omnibus)數(shù)據(jù)庫(kù)包含有多個(gè)物種的基因表達(dá)數(shù)據(jù),可從中檢索出與研究相關(guān)的表達(dá)芯片數(shù)據(jù),通過數(shù)據(jù)分析從而挖掘出數(shù)據(jù)背后的深層含義.擬南芥是模式植物,挖掘擬南芥的相關(guān)數(shù)據(jù)可獲取植物UV-B保護(hù)機(jī)制的參考.本研究從GEO數(shù)據(jù)庫(kù)中選取GSE3533和GESE22951表達(dá)芯片數(shù)據(jù),通過差異基因篩選找出UV-B照射后表達(dá)改變的DEGs(differentially expressed genes),并進(jìn)一步對(duì)DEGs進(jìn)行GO(Gene Ontology)功能和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析,并進(jìn)行DEGs編碼蛋白的PPI網(wǎng)絡(luò)分析(protein-protein network),從中找出關(guān)鍵的DEGs編碼蛋白,進(jìn)而揭示植物受UV-B照射后的應(yīng)激保護(hù)機(jī)制.本研究基于生物信息學(xué)的方法對(duì)公共數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘,為植物的UV-B應(yīng)激分子機(jī)制奠定了科學(xué)的研究基礎(chǔ).
選取模式生物擬南芥(Arabidopsisthaliana)為研究物種,從公共數(shù)據(jù)庫(kù)美國(guó)生物技術(shù)中心GEO數(shù)據(jù)庫(kù)中下載UV-B輻射相關(guān)的基因表達(dá)芯片數(shù)據(jù),登錄號(hào)為GSE3533[9]和GSE22951,測(cè)試平臺(tái)為GPL198,白光照射作為對(duì)照組,UV-B照射作為實(shí)驗(yàn)組,表達(dá)芯片數(shù)據(jù)的具體信息如表1所示.
表1 表達(dá)芯片數(shù)據(jù)詳細(xì)信息
采用在線軟件GEO2R( http://www.ncbi.nlm.nih.gov/geo/geo2r/ ) 對(duì)GSE3533和GSE22951表達(dá)芯片數(shù)據(jù)進(jìn)行差異表達(dá)分析,將基因表達(dá)值倍數(shù)變化(fold change, FC)和錯(cuò)誤檢測(cè)率 (False discovery rate, FDR)作為評(píng)定指標(biāo),使用 Benjamini - Hochberg 錯(cuò)誤檢測(cè)率 (FDR) 方法校正 P 值,校正后的 P 值 <0.05 和 |log2FC| ≥1作為篩選條件[10].利用R軟件分別繪制GSE3533和GSE22951表達(dá)芯片的表達(dá)火山圖.利用在線軟件Venny 2.1.0 (http://bioinfogp.cnb.csic.es/tools/venny/)進(jìn)行GSE3533和GSE22951表達(dá)芯片的交叉基因篩選,并繪制Venny圖.
GO可提供基因產(chǎn)物的功能信息以助于對(duì)基因能有更全面的認(rèn)識(shí)[11],KEGG能系統(tǒng)地分析基因功能,揭示基因功能之間的生物聯(lián)系[12],而DAVID (Database for Annotation, Visualization and Integration Discovery, https://david.ncifcrf.gov/)則可對(duì)一系列基因進(jìn)行功能解釋,實(shí)現(xiàn)基因列表的GO功能富集分析[13].利用DAVID在線軟件對(duì)篩選得到的DEGs做GO功能注釋富集分析,設(shè)定篩選條件為P<0.05,獲取DEGs富集的GO條目,利用R語言的ggplot2包對(duì)富集結(jié)果進(jìn)行可視化繪圖.DEGs的KEGG通路富集分析與可視化通過Cytoscape中的ClueGO插件實(shí)現(xiàn).
將上述分析得到的上調(diào)的交叉DEGs和下調(diào)的交叉DEGs分別導(dǎo)入在線數(shù)據(jù)庫(kù)STRING (https://string-db.org/)中,構(gòu)建其編碼蛋白的相互作用關(guān)系,并利用本地軟件Cytoscape 3.6.1進(jìn)行PPI網(wǎng)絡(luò)圖的可視化,根據(jù)degree值篩選出中心度較高的DEGs.
數(shù)據(jù)來源于GSE3533和GSE22951兩個(gè)表達(dá)芯片,分別選取其中6例樣本,3例經(jīng)白光照射作為對(duì)照組;另3例經(jīng)UV-B照射作為實(shí)驗(yàn)組.GSE3533和GSE22951所有檢測(cè)到的基因分別如圖1A和圖1B所示,分別篩選出2 741個(gè)和1 079個(gè)DEGs,其中上調(diào)基因分別為1 535個(gè)和443個(gè)(a區(qū)域),下調(diào)基因1 183個(gè)和630個(gè)(b區(qū)域).按表達(dá)上調(diào)和下調(diào)分別取GSE3533和GSE22951的交集,共鑒定到251個(gè)上調(diào)DEGs和246個(gè)下調(diào)DEGs (圖1C和D).
圖1 差異表達(dá)基因篩選
利用DAVID分別對(duì)251個(gè)上調(diào)的交叉DEGs和246個(gè)下調(diào)的交叉DEGs進(jìn)行GO功能富集分析.上調(diào)的DEGs共注釋到58個(gè)GO條目,前20的GO條目如圖2A所示,其中顯著性較高的有karrikin反應(yīng)、UV-B反應(yīng)、熱反應(yīng)、UDP-糖基轉(zhuǎn)移酶活性和類黃酮生物合成過程;下調(diào)的DEGs共注釋到46個(gè)GO條目,前20的GO條目如圖2B所示,其中顯著性較高的有胞外區(qū)、3-氧-花生四烯酸基-CoA合酶活性、3-氧-二十四烷?;?CoA合酶活性、3-氧-蠟基-CoA合酶活性、羧酸酯水解酶活性、細(xì)胞壁.
圖2 GO功能富集分析
采用Cytoscape的ClueGO插件對(duì)交叉DEGs進(jìn)行KEGG通路富集分析,結(jié)果顯示上調(diào)的交叉DEGs主要注釋到苯丙氨酸代謝、類黃酮生物合成、內(nèi)質(zhì)網(wǎng)蛋白加工、植物-病原體相互作用和晝夜節(jié)律通路中(圖3A);下調(diào)的交叉DEGs主要注釋到戊糖和葡萄糖醛酸互變異構(gòu)、脂肪酸延長(zhǎng)和吞噬體通路中(圖3B).
圖3 KEGG通路富集分析
為獲取DEGs編碼蛋白的相互作用關(guān)系,我們采用STRING數(shù)據(jù)庫(kù)和Cytoscape軟件構(gòu)建交叉DEGs編碼蛋白的PPI網(wǎng)絡(luò)圖,每一條邊表示蛋白之間的相互作用,每一個(gè)節(jié)點(diǎn)表示一個(gè)蛋白,節(jié)點(diǎn)越大對(duì)應(yīng)其degree值越大,degree值越大的節(jié)點(diǎn)表明其對(duì)應(yīng)的蛋白在PPI網(wǎng)絡(luò)圖中的中心度較高,能與多個(gè)蛋白發(fā)生相互作用(圖4).上調(diào)的DEGs編碼蛋白的PPI網(wǎng)絡(luò)圖中總共包括219個(gè)節(jié)點(diǎn),1 080條邊,根據(jù)網(wǎng)絡(luò)拓?fù)鋵W(xué)性質(zhì),degree值前10%的關(guān)鍵基因?yàn)锳T5G25930、BCS1、BRL3、TOC64-V、MTHSC70-1、AT1G19020、SIGE、WRKY33、HSP70、MTHSC70-2、HSP90.1、NUDT7、AT5G24810、ATRPAC42、AT3G09440、HSP70-2、WRKY46、NRPA2、HSP81-2、F3H、CRK11,其中WRKY33注釋到植物-病原體相互作用通路中,HSP70、HSP90.1、AT3G09440、HSP70-2、HSP81-2注釋到內(nèi)質(zhì)網(wǎng)蛋白加工通路中,F(xiàn)3H注釋到類黃酮生物合成通路中.下調(diào)的DEGs編碼蛋白的PPI網(wǎng)絡(luò)圖中總共包括153個(gè)節(jié)點(diǎn),306條邊,degree值排前10%的關(guān)鍵基因?yàn)锳T3G49670、HTH、AT1G09750、AT4G23820、AT3G16370、CYP86A2、DRT100、PME44、SAUR68、GAE1、CER2、KCS10、AT3G20820、FLA8、SHY2,其中PME44注釋到戊糖和葡萄糖醛酸互變異構(gòu)通路中,KCS10注釋到脂肪酸延長(zhǎng)通路中.
本研究基于生物信息學(xué)的分析手段,下載GEO數(shù)據(jù)庫(kù)中擬南芥的GSE3533和GSE22951兩個(gè)表達(dá)芯片數(shù)據(jù),旨在從中挖掘出與植物UV-B保護(hù)機(jī)制相關(guān)的基因表達(dá)信息.通過對(duì)GSE3533和GSE22951進(jìn)行差異表達(dá)基因篩選并整合,總共得到251個(gè)上調(diào)DEGs和246個(gè)下調(diào)DEGs,對(duì)這些DEGs分別進(jìn)行GO功能和KEGG通路富集分析發(fā)現(xiàn),上調(diào)的DEGs注釋到karrikin反應(yīng)、UV-B反應(yīng)、熱反應(yīng)、UDP-糖基轉(zhuǎn)移酶活性和類黃酮生物合成過程等GO功能,以及苯丙氨酸代謝、類黃酮生物合成、內(nèi)質(zhì)網(wǎng)蛋白加工、植物-病原體相互作用和晝夜節(jié)律KEGG通路中;下調(diào)的DEGs注釋到胞外區(qū)、3-氧-花生四烯酸基-CoA合酶活性、3-氧-二十四烷酰基-CoA合酶活性、3-氧-蠟基-CoA合酶活性、羧酸酯水解酶活性、細(xì)胞壁等GO功能,以及戊糖和葡萄糖醛酸互變異構(gòu)、脂肪酸延長(zhǎng)和吞噬體KEGG通路中.此外,PPI網(wǎng)絡(luò)分析表明上調(diào)DEGs中關(guān)鍵基因主要與植物-病原體相互作用/內(nèi)質(zhì)網(wǎng)蛋白加工和類黃酮生物合成相關(guān),下調(diào)DEGs中的關(guān)鍵基因則主要與戊糖和葡萄糖醛酸互變異構(gòu)和脂肪酸延長(zhǎng)通路相關(guān).
圖4 交叉DEGs的PPI網(wǎng)絡(luò)圖Fig.4 PPI network diagram of cross DEGs
太陽光中的UV-B作為非生物壓力信號(hào)會(huì)對(duì)植物造成多種影響,總的而言,植物對(duì)UV-B的反應(yīng)主要分為兩類:應(yīng)激反應(yīng)和光形態(tài)建成反應(yīng),而反應(yīng)的類型主要取決于曝光率和植物是否已適應(yīng)所照射的UV-B[2].高UV-B曝光率照射引起植物體內(nèi)壓力相關(guān)的生理過程,例如DNA損傷、ROS (reactive oxygen species)生成、細(xì)胞過程損害等,然而調(diào)節(jié)這些反應(yīng)的信號(hào)通路在其他壓力中也存在,并不是UV-B所特異性[14];低UV-B曝光率照射則引起植物體內(nèi)的光形態(tài)建成反應(yīng),主要引起植物下胚軸生長(zhǎng)和子葉擴(kuò)張抑制、黃酮類和花青素類化合物生物合成、氣孔打開等,是UV-B照射所特異的植物反應(yīng)[15-16].研究表明,高海拔地區(qū)生長(zhǎng)的植物相較于低海拔地區(qū)生長(zhǎng)的植物來說擁有更強(qiáng)的UV-B耐受性,其主要原因在于高海拔植物體內(nèi)的類黃酮含量更高且具有更強(qiáng)的染色質(zhì)重構(gòu)能力[8, 17-18].F3H全名為黃烷酮3-羥化酶,催化黃烷酮羥化生成黃酮醇,進(jìn)一步合成花青素、原花色素以及各類黃酮醇衍生物[19-20],F(xiàn)3H基因在UV組中表達(dá)上調(diào),并且具有較高的degree值,即F3H在上調(diào)基因的PPI網(wǎng)絡(luò)中占據(jù)有重要的位置,說明F3H是擬南芥UV-B保護(hù)重要的分子機(jī)制之一.AT5G25930是一類富含亮氨酸重復(fù)序列型受體蛋白激酶,在上調(diào)基因的PPI網(wǎng)絡(luò)中位于中心度最高的位置,該類蛋白在抗逆性反應(yīng)、介導(dǎo)植物激素信號(hào)轉(zhuǎn)導(dǎo)過程中發(fā)揮著重要的作用,與植物對(duì)應(yīng)答逆境脅迫以及形態(tài)相關(guān)[21-23].而在下調(diào)基因的PPI網(wǎng)絡(luò)中AT3G49670占據(jù)著最中心的位置,調(diào)控多數(shù)DEGs的表達(dá),AT3G49670對(duì)植物的發(fā)育進(jìn)行調(diào)控[24-25].
通過對(duì)表達(dá)芯片數(shù)據(jù)GSE3533和GSE22951的挖掘與分析,結(jié)果發(fā)現(xiàn),在應(yīng)對(duì)UV-B脅迫時(shí),擬南芥上調(diào)AT5G25930和F3H的表達(dá),進(jìn)而調(diào)控植物形態(tài)的改變以及類黃酮類化合物的生物合成,可能與植物葉片變厚、葉柄變短、莖變短、腋窩分枝增多和根芽比改變有關(guān)[26];另一方面,受到UV-B脅迫時(shí)擬南芥抑制AT3G49670的表達(dá),引起擬南芥的生長(zhǎng)發(fā)育受到抑制.本研究通過挖掘公共數(shù)據(jù)庫(kù)得到3個(gè)關(guān)鍵基因:AT5G25930、F3H和AT3G49670,它們?cè)谥参锏腢V-B紫外線保護(hù)機(jī)制中扮演著重要的角色,為今后進(jìn)行深入的分子機(jī)制研究奠定了基礎(chǔ).