李 霞, 于 逸, 左海維, 周鳳娟, 辛 勇
(1.徐州醫(yī)科大學(xué)附屬醫(yī)院放療科,江蘇 徐州 221000;2.徐州醫(yī)科大學(xué)生命科學(xué)學(xué)院,江蘇 徐州 221000;3.徐州醫(yī)科大學(xué)醫(yī)學(xué)信息與工程學(xué)院,江蘇 徐州 221000;4.徐州醫(yī)科大學(xué)第二附屬醫(yī)院放療科,江蘇 徐州 221000)
結(jié)直腸癌是消化系統(tǒng)中最常見(jiàn)的惡性腫瘤之一, 其 發(fā) 病 率 在 多 種 癌 癥 中 排 第4 位[1]。 環(huán) 狀RNA (circular RNA, circRNA) 是一類(lèi)廣泛表達(dá)于真核細(xì)胞的環(huán)形RNA, 多起源于蛋白編碼基因[2]。 近 年 研 究[3]顯 示: circRNA 可 通 過(guò) 微 小RNA (microRNA,miRNA)“海綿” 等作用模式在基因表達(dá)中發(fā)揮重要的調(diào)控作用,且越來(lái)越多的證 據(jù)[4]表 明:circRNA 可 能 是 一 種 潛 在 的 疾 病 標(biāo)志物和治療靶點(diǎn)。高通量測(cè)序技術(shù)[5]發(fā)現(xiàn):在結(jié)直腸癌患者腫瘤細(xì)胞和血漿中circRNA-VAPA 水平均明顯升高,并且可以通過(guò)與miRNA-101 結(jié)合,呈現(xiàn)原癌基因活性,促進(jìn)腫瘤發(fā)展。circFAT1 在結(jié)直腸癌組織中表達(dá)高于癌旁正常腸黏膜組織,體外細(xì)胞實(shí)驗(yàn)[5]顯示:下調(diào)circFAT1 表達(dá)可明顯降低腸癌細(xì)胞株遷移和侵襲能力。has_circ_0079656在結(jié)直腸癌組織中呈低表達(dá),且隨著結(jié)直腸癌病情的進(jìn)展其表達(dá)水平逐步降低,其可能通過(guò)作用于HINFP 基因調(diào)控細(xì)胞周期中G1/S 期的轉(zhuǎn)錄過(guò)程,進(jìn)而影響結(jié)直腸癌的進(jìn)展[6]。與已經(jīng)報(bào)道的研究不同,本課題組采用表達(dá)譜數(shù)據(jù)與生物信息分析方法發(fā)現(xiàn):hsa_circ_0043278 的表達(dá)水平在結(jié)直腸癌樣本中明顯降低, 通過(guò)統(tǒng)計(jì)分析得到了與hsa_circ_0043278 結(jié)合的miRNA, 結(jié)合基因本體論(Gene Ontology,GO) 生物學(xué)功能富集分析與京都基因與基因組大百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes, KEGG) 信號(hào)通路富集分析的方法,闡明hsa_circ_0043278 對(duì)Wnt 介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)與PI3K-AKT 信號(hào)通路的影響, 為揭示hsa_circ_0043278 對(duì)結(jié)直腸癌發(fā)生發(fā)展的抑制作用提供依據(jù)。
1.1 GEO數(shù)據(jù)庫(kù)數(shù)據(jù)篩選基因表達(dá)數(shù)據(jù)庫(kù)(Gene Expression Omnibus,GEO) 由美國(guó)國(guó)立生物 技 術(shù) 信 息 中 心 (National Center for Biotechnology Information,NCBI) 創(chuàng)建并維護(hù)[7]。以“ 結(jié)直腸癌” 為關(guān)鍵詞進(jìn)行搜索, 可獲得GSE126094 芯片數(shù)據(jù),該芯片包含10 例結(jié)直腸癌組織樣本與10 例癌旁組織樣本。首先,采用Perl語(yǔ)言將circRNA 的名稱(chēng)轉(zhuǎn)換為標(biāo)準(zhǔn)的circRNA ID,同時(shí)采用R 語(yǔ)言讀取GSE126094 芯片的數(shù)據(jù),對(duì)circRNA 的 表 達(dá) 值 進(jìn) 行 以2 為 底 數(shù) 的 對(duì) 數(shù) 變 換[8],對(duì)相同的circRNA 有多個(gè)表達(dá)值數(shù)據(jù),采用 “取平均值” 的方法合并; 使用R 語(yǔ)言對(duì)處理后的GSE126094 芯片數(shù)據(jù)進(jìn)一步分析,得到結(jié)直腸癌組織樣本與癌旁組織樣本中差異表達(dá)的circRNA,界 定 條 件: |log2FC| >2 且P<0.05。 并 繪 制GSE126094 數(shù)據(jù)中差異表達(dá)circRNA 熱圖和GSE126094 芯片數(shù)據(jù)中差異表達(dá)circRNA 火山圖。
1.2候選circRNA的生物信息學(xué)分析采用circBase 數(shù)據(jù)庫(kù)(http://www.circbase.org) 確定差異表達(dá)circRNA 所在染色體的位置信息[9];采用癌癥特異性circRNA 數(shù)據(jù)庫(kù)(Cancer-Specific circRNA Database, CSCD) 得 到 與 差 異 表 達(dá)circRNA 結(jié) 合 的miRNA[10]; 采 用Perl 語(yǔ) 言 檢 索miRDB 數(shù)據(jù)庫(kù)(http://mirdb.org/)、miRTarBase數(shù) 據(jù) 庫(kù)(http://mirtarbase.mbc.nctu.edu.tw/php/index.php) 與TargetScan 數(shù) 據(jù) 庫(kù)(http://www.targetscan.org/vert_72/),得到miRNA 的靶基因,用于進(jìn)一步研究。采用R 語(yǔ)言對(duì)預(yù)測(cè)的靶基因進(jìn)行GO 富集分析與KEGG 富集分析。GO 富集分析包括分子功能(molecular function,MF)、生物學(xué)過(guò)程(biological process, BP) 與細(xì)胞成分(cellular component, CC)[11]。 KEGG 富集分析包括系統(tǒng)信息、 基因組信息、 化學(xué)信息和健康信息[12]。以P<0.05 判定為有統(tǒng)計(jì)學(xué)意義的富集。
1.3統(tǒng)計(jì)學(xué)分析采用RStudio 0.94.102 和ActivePerl v5.26 統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。同一個(gè)circRNA 在結(jié)直腸癌組織與癌旁組織中表達(dá)水平的差異倍數(shù)以log2FC 表示,組間樣本均數(shù)比較采用兩獨(dú)立樣本t檢驗(yàn)。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1結(jié)直腸癌組織與癌旁組織中差異表達(dá)的circRNA 結(jié)直腸癌組織與癌旁組織均有10 個(gè)樣本。差異表達(dá)circRNA 的認(rèn)定條件:|log2FC|>2 且P<0.05,見(jiàn)圖1 (插頁(yè)八)。對(duì)GSE126094 中數(shù)據(jù)進(jìn)行聚類(lèi)分析, 結(jié)果表明存在差異表達(dá)的circRNAs (|log2FC|>2 且P<0.05), 見(jiàn) 圖2 (插頁(yè)八)。通過(guò)對(duì)比結(jié)直腸癌組織樣本與癌旁組織樣本,共篩選出59 個(gè)差異表達(dá)circRNAs (|log2FC|>2 且P<0.05)。與癌旁組織樣本比較,在結(jié)直腸癌組織樣本中, 表達(dá)水平升高的circRNAs 有23 個(gè)(logFC>2 且P<0.05), 表 達(dá) 水 平 下 降 的circRNAs 有36 個(gè)(logFC<-2 且P<0.05)。結(jié)直腸癌組織樣本與癌旁組織樣本表達(dá)差異倍數(shù)最大的是 hsa_circ_0043278 (logFC=-7.481 且P<0.05),見(jiàn)表1。
2.2靶基因的預(yù)測(cè)結(jié)果對(duì)hsa_circ_0043278 進(jìn)一步分析。采用circBase 數(shù)據(jù)庫(kù),檢索得到hsa_circ_0043278 所在染色體位置信息。利用CSCD 數(shù)據(jù)庫(kù)確定與hsa_circ_0043278 結(jié)合的miRNA,結(jié)果得到66 個(gè)與hsa_circ_0043278 結(jié)合的miRNAs。具體包括hsa-miR-1207-3p、 hsa-miR-1197 和hsa-miR-561-5p 等。 編 寫(xiě)Perl 程 序, 對(duì)miRDB 數(shù) 據(jù) 庫(kù)、miRTarBase 數(shù)據(jù)庫(kù)和TargetScan 數(shù)據(jù)庫(kù)分別檢索,得到這66 個(gè)miRNAs 的靶基因。 10 個(gè)代表性miRNAs 與其對(duì)應(yīng)的靶基因見(jiàn)表2。
2.3靶基因GO富集分析結(jié)果在生物學(xué)功能方面,靶基因主要參與Wnt 介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、脫磷與對(duì)肽的反應(yīng)等(P<0.05);在細(xì)胞成分方面,靶基因主要定位于染色質(zhì)與核染色體等(P<0.05);在分子功能方面,靶基因主要參與近端啟動(dòng)子序列特異性DNA 結(jié)合和染色質(zhì)結(jié)合與轉(zhuǎn)錄輔調(diào)節(jié)活性等(P<0.05)。見(jiàn)圖3 (封三)。
表1 結(jié)直腸癌組織和癌旁組織中部分circRNAs 表達(dá)水平差異倍數(shù)Tab.1 Difference multiples of some circRNAs expression levels in colorectal cancer tissue and adjacent cancer tissue
2.4靶基因KEGG富集分析結(jié)果利用R 語(yǔ)言對(duì)與hsa_circ_0043278 結(jié)合的miRNA 靶基因進(jìn)行KEGG 富集分析。 共得到19 條KEGG 統(tǒng)計(jì)結(jié)果,靶基因主要與PI3K-AKT 信號(hào)通路、 MAPK 信號(hào)通路與調(diào)節(jié)干細(xì)胞多能性的信號(hào)通路等有關(guān)聯(lián)(P<0.05)。見(jiàn)圖4 (封三)。
表2 部分與hsa_circ_0043278 結(jié)合的miRNAs 和miRNAs 的靶基因Tab.2 Part of miRNAs combined with hsa_circ_0043278 and target genes of miRNAs
結(jié)直腸癌的發(fā)病率和死亡率普遍較高。盡管許多學(xué)者與科研機(jī)構(gòu)對(duì)結(jié)直腸癌的研究非常深入,但仍有超過(guò)50% 的結(jié)直腸癌患者最終死于該疾?。?3]。因此, 研究結(jié)直腸癌發(fā)生發(fā)展的機(jī)制非常必要。circRNA 作為非編碼RNA 的一種,因其高穩(wěn)定性和組織特異性已成為近年的研究熱點(diǎn)[14]。circRNA 作為內(nèi)源性RNA 可以與其他內(nèi)源性RNA 競(jìng)爭(zhēng)結(jié)合miRNA 從而影響靶基因的表達(dá)[15]。本研究從circRNA 的角度研究結(jié)直腸癌發(fā)生發(fā)展的機(jī)制。
芯片技術(shù)具有高通量與高效率的特點(diǎn),與傳統(tǒng)生物學(xué)方法相比優(yōu)勢(shì)明顯[16]。本研究選取了GEO數(shù)據(jù)庫(kù)中結(jié)直腸癌基因芯片表達(dá)譜數(shù)據(jù), 包括10 例結(jié)直腸癌組織樣本與10 例癌旁組織樣本。通過(guò)比較2 組circRNAs 表達(dá)水平,共發(fā)現(xiàn)59 個(gè)有統(tǒng)計(jì)學(xué)意義的差異表達(dá)circRNAs,其中表達(dá)水平上升的circRNAs 有23 個(gè),表達(dá)水平下降的circRNAs有36 個(gè)。與癌旁組織樣本比較,在結(jié)直腸癌組織樣本中hsa_circ_0043278 表達(dá)水平降低最明顯,提示hsa_circ_0043278 可能在結(jié)直腸癌中具有一定特異性。
采用Perl 語(yǔ)言分別檢索miRDB 數(shù)據(jù)庫(kù)、miRTarBase 數(shù)據(jù)庫(kù)與TargetScan 數(shù)據(jù)庫(kù),得到與hsa_circ_0043278 結(jié) 合 的miRNA 的 靶 基 因。 使 用R 語(yǔ)言對(duì)miRNA 的靶基因進(jìn)行GO 富集分析與KEGG 富集分析。GO 富集分析包括3 個(gè)層面:BP、CC 和MF[17]。GO 富 集 分 析 結(jié) 果 表 明:靶 基 因 主要參與Wnt 介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、脫磷與對(duì)肽的反應(yīng)等BP。已有研究[18-19]表明:Wnt 蛋白是調(diào)節(jié)分泌的生長(zhǎng)因子,在胚胎發(fā)育過(guò)程中能調(diào)節(jié)干細(xì)胞的增殖和分化,細(xì)胞間Wnt 信號(hào)轉(zhuǎn)導(dǎo)表達(dá)異常與癌癥的發(fā)生有密切關(guān)系。脫磷是與hsa_circ_0043278 結(jié)合的miRNA 的靶基因主要參與的BP。 因此,hsa_circ_0043278 在結(jié)直腸癌組織樣本中表達(dá)水平的異常降低可能會(huì)間接影響Wnt 介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)與脫磷過(guò)程, 進(jìn)而減弱了對(duì)結(jié)直腸癌的抑制作用。
KEGG 富集分析表明:與Hsa_circ_0043278 結(jié)合的miRNA 的靶基因富集的通路有PI3K-AKT 信號(hào)通路、MAPK 信號(hào)通路與調(diào)節(jié)干細(xì)胞多能性的信號(hào)通路等。PI3K-AKT 信號(hào)通路作為細(xì)胞中重要的信號(hào)轉(zhuǎn)導(dǎo)通路之一,通過(guò)影響下游多種效應(yīng)分子的活化狀態(tài),發(fā)揮著促進(jìn)細(xì)胞增殖和抑制凋亡的作用[20]。 已 有 研 究[21]表 明: 組 成 性 活 化 的PI3KAKT 信號(hào)通路在廣泛的人類(lèi)腫瘤譜中失調(diào),原因是AKT 被過(guò)度活化以及PI3K-AKT 通路的部分調(diào)控成分突變。因此,hsa_circ_0043278 在結(jié)直腸癌組織樣本中表達(dá)水平的異常降低可能會(huì)間接影響其對(duì)PI3K-AKT 信號(hào)通路的調(diào)控作用,進(jìn)而減弱了對(duì)結(jié)直腸癌的抑制作用。
本研究采用生物信息學(xué)方法確定了hsa_circ_0043278 在結(jié)直腸癌組織樣本中表達(dá)水平異常降低(logFC=-7.481 且 P<0.05), 提 示 hsa_circ_0043278 的正常表達(dá)或提升其表達(dá)水平可能會(huì)抑制結(jié)直腸癌的發(fā)生發(fā)展。通過(guò)GO 富集分析與KEGG富集分析闡明了hsa_circ_0043278 的作用機(jī)制:其間接影響靶基因UTP18、 CLIP4 與STC2 等的功能,進(jìn)而影響對(duì)Wnt 介導(dǎo)的細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)與PI3KAKT 信號(hào)通路的調(diào)控作用,最終降低了對(duì)結(jié)直腸癌的抑制作用。由于樣本的局限性,本研究并未對(duì)結(jié)直腸癌的發(fā)生發(fā)展機(jī)制進(jìn)行進(jìn)一步探索。未來(lái),本課題組將整合更多臨床樣本數(shù)據(jù),并開(kāi)展相應(yīng)的生物實(shí)驗(yàn),進(jìn)一步揭示circRNA 對(duì)結(jié)直腸癌的作用機(jī)制。
吉林大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2020年6期