溫海燕,朱玉坤,曹立宇
(安徽醫(yī)科大學(xué)附屬阜陽(yáng)醫(yī)院病理科,安徽 阜陽(yáng) 236000)
肺癌是全球患病率、病死率最高的惡性腫瘤之一,作為肺癌主要類(lèi)型的肺腺癌患病率占全部肺癌的30%~35%,屬于非小細(xì)胞肺癌(NSCLC)范疇[1]。近年來(lái),由于吸煙和空氣污染,肺腺癌患者數(shù)量正在上升[2]。有研究表明,晚期肺腺癌患者總體5年生存率低于15%;盡管出現(xiàn)了多種治療肺腺癌的新方法,如靶向治療和免疫治療,但長(zhǎng)期生存率仍然很低[3-4]。其中一個(gè)主要原因是大多數(shù)患者在晚期才被診斷出來(lái)。早期診斷是提高肺癌患者生存率和預(yù)后的最有效策略之一[5-7]。因此,了解肺腺癌發(fā)生、發(fā)展背后的分子機(jī)制,并確定可在疾病早期檢測(cè)到的生物標(biāo)志物,以期設(shè)計(jì)新的治療藥物以提高患者的生存率至關(guān)重要。
隨著微陣列技術(shù)和高通量測(cè)序技術(shù)的快速發(fā)展,能夠有效篩選肺腺癌的基因表達(dá)變化,已被證明是篩選良、惡性疾病早期生物標(biāo)志物較有價(jià)值且高效的方法[8-9]。本研究利用生物信息學(xué)方法,從GEO數(shù)據(jù)庫(kù)中下載2個(gè)相關(guān)mRNA微陣列數(shù)據(jù)集,通過(guò)分析篩選出差異表達(dá)基因(DEGs)并進(jìn)行富集分析,找出關(guān)鍵基因——Hub基因,再對(duì)Hub基因進(jìn)行多個(gè)數(shù)據(jù)庫(kù)的比對(duì)驗(yàn)證,以期找到肺腺癌發(fā)生、發(fā)展的關(guān)鍵靶點(diǎn)。
1.1資料來(lái)源 GEO數(shù)據(jù)庫(kù)隸屬于美國(guó)國(guó)立生物信息中心,是當(dāng)今最大、最全面的公共基因表達(dá)數(shù)據(jù)資源。為使篩選的結(jié)果更為可靠準(zhǔn)確,以“l(fā)ung adenocarcinoma”為關(guān)鍵詞篩選出符合條件的基因芯片數(shù)據(jù)集——GSE63459和GSE27262。GSE63459包含33例Ⅰ期肺腺癌患者中腫瘤(T)組織和32例相鄰正常(N)癌旁組織,從腫瘤和與之匹配的非腫瘤肺中提取細(xì)胞總RNA,并與平臺(tái)芯片陣列雜交,數(shù)據(jù)集平臺(tái)為GPL6883[Illumina HumanRef-8 v3.0 expression beadchip]。GSE27262中包含25例Ⅰ期肺腺癌患者中腫瘤(T)組織和25例相鄰正常(N)癌旁組織的RNA提取和微陣列雜交數(shù)據(jù),數(shù)據(jù)集平臺(tái)為GPL570[HG-U133_Plus_2]。
1.2方法
1.2.1DEGs分析 使用GEO芯片平臺(tái)的注釋文件將數(shù)據(jù)集——GSE63459和GSE27262原始矩陣文件中的探針?lè)?hào)轉(zhuǎn)換為基因名。GEO2R是一個(gè)在線網(wǎng)絡(luò)工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/),由GEO提供,用于比較GEO數(shù)據(jù)集,以確定試驗(yàn)條件下的DEGs。得出DEGs后排除沒(méi)有精確基因符號(hào)的探針集,并對(duì)具有2個(gè)或更多探針集的基因表達(dá)水平取均值,篩選閾值設(shè)定為P<0.05,logFC絕對(duì)值大于2。將篩選出的明顯上調(diào)基因取交集后進(jìn)行后續(xù)分析。
1.2.2基因功能注釋 利用DAVID(https://david.ncifcrf.gov/)在線分析平臺(tái)分別對(duì)2個(gè)數(shù)據(jù)集中的22個(gè)明顯上調(diào)基因進(jìn)行基因本體(GO)功能注釋?zhuān)琍<0.05表示差異有統(tǒng)計(jì)學(xué)意義。GO富集分析包括生物過(guò)程、分子功能、細(xì)胞組成3個(gè)部分。
1.2.3基因信號(hào)通路富集分析 使用KOBAS(http://kobas.cbi.pku.edu.cn/)在線分析平臺(tái)進(jìn)行KEGG信號(hào)通路富集分析,設(shè)定篩選閾值為P<0.05和校正后的P<0.05[10]。條形圖每一行表示一個(gè)充實(shí)函數(shù),條的長(zhǎng)度表示充實(shí)比,計(jì)算輸入基因數(shù)/背景基因數(shù)。條形圖的顏色與上圖圓形網(wǎng)絡(luò)中的顏色相同,表示不同的簇。對(duì)于每個(gè)集群,如果有超過(guò)5個(gè)術(shù)語(yǔ),則顯示濃縮比最高的前5個(gè)術(shù)語(yǔ)。氣泡圖每個(gè)氣泡代表1個(gè)富集的功能。
1.2.4蛋白互作網(wǎng)絡(luò)構(gòu)建及篩選Hub基因 在 STRING 數(shù)據(jù)庫(kù)(https://string-db.org/cgi/)中輸入DEGs,種屬限定為“Homo sapiens”,最小連接評(píng)分為0.4分,再導(dǎo)出相應(yīng)結(jié)果文件[11]。將所得文件導(dǎo)入 Cytoscape軟件,利用CytoHubba插件中每一個(gè)基因的最大團(tuán)中心性分?jǐn)?shù),將得分前10的基因作為初篩的Hub基因[12]。
1.2.5Hub基因驗(yàn)證 在Oncomine數(shù)據(jù)庫(kù)(www.oncomine.org)中驗(yàn)證10個(gè)初篩的Hub基因,將篩選條件限定為“腫瘤與正常組織”“肺腺癌”,將Hub基因分別輸入逐一檢索,P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
1.2.6Hub基因生存分析 利用Kaplan-Meier plotter數(shù)據(jù)庫(kù)(http://kmplot.com/analysis/)分析得到驗(yàn)證后的Hub基因?qū)θ祟?lèi)肺腺癌總體生存期(OS)的影響。首先打開(kāi)Kaplan-Meier plotter數(shù)據(jù)庫(kù),將限定條件設(shè)定為“肺腺癌”,其余條件均為默認(rèn)值,分別將在Oncomine數(shù)據(jù)庫(kù)中再次篩選得到的Hub基因輸入,根據(jù)基因的中位表達(dá)值判定高、低表達(dá)與OS的關(guān)系,P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
2.1DEGs篩選 共篩選出543個(gè)基因在肺腺癌組織和細(xì)胞中的表達(dá)有明顯差異,其中GSE63459數(shù)據(jù)集中29個(gè)基因在肺腺癌組織中表達(dá)明顯上調(diào),3個(gè)基因表達(dá)明顯下調(diào);GSE27262數(shù)據(jù)集中328個(gè)基因表達(dá)明顯上調(diào),145個(gè)基因表達(dá)明顯下調(diào)。根據(jù)選擇DEGs的標(biāo)準(zhǔn)排除重復(fù)的候選基因,篩選了335個(gè)在肺腺癌組織中比在正常對(duì)照樣本中表現(xiàn)出過(guò)度表達(dá)狀態(tài)的基因。335個(gè)DEGs通過(guò)Draw Venn Diagram網(wǎng)站進(jìn)行計(jì)算。在2個(gè)數(shù)據(jù)集中觀察到22個(gè)基因過(guò)度表達(dá)和重疊,包括表面活性蛋白C、甘油磷酸肌醇錨定高密度脂蛋白結(jié)合蛋白1、微纖絲關(guān)聯(lián)蛋白4、脂肪酸結(jié)合蛋白家族4、宮分泌球蛋白家族成員1、纖維膠凝蛋白3、碳酸酐酶4、血清剝奪蛋白反應(yīng)、晚期糖基化終產(chǎn)物特異性受體、人CMRF35樣分子9、缺氧誘導(dǎo)因子2、神經(jīng)元膜糖蛋白錨定蛋白2、小窩蛋白1(CAV1)、封閉蛋白18、水通道蛋白4、金屬硫蛋白1M、胃動(dòng)蛋白2、脂肪形成調(diào)節(jié)因子、肥大細(xì)胞表達(dá)膜蛋白1、人類(lèi)β珠蛋白、四加半LIM域蛋白1、跨膜蛋白100等。
2.2基因功能注釋 根據(jù)P值排序發(fā)現(xiàn),這些基因主要涉及16個(gè)GO條目,主要涉及蛋白質(zhì)結(jié)合等分子功能,主要富集在基底外側(cè)質(zhì)膜、粗面內(nèi)質(zhì)網(wǎng)和胞外外泌體等細(xì)胞組分中,參與膽固醇穩(wěn)態(tài)、對(duì)缺氧的反應(yīng)、血管生成、碳酸氫鹽運(yùn)輸和炎性反應(yīng)的調(diào)節(jié)等生物學(xué)過(guò)程。見(jiàn)表1。
表1 DEGs的GO富集分析結(jié)果
2.3信號(hào)通路分析 KEGG通路富集分析顯示,明顯上調(diào)基因主要集中在氮代謝、近端小管碳酸氫鹽回收、非洲錐蟲(chóng)病、加壓素調(diào)節(jié)的水重吸收、瘧疾、礦物質(zhì)吸收、脂肪細(xì)胞中脂解的調(diào)節(jié)、病毒性心肌炎、腎細(xì)胞癌、膽汁分泌、上皮細(xì)胞受細(xì)菌侵襲和過(guò)氧化物酶增殖物激活受體等信號(hào)通路。
2.4Cytoscape篩選出的Hub基因及在Oncomine 數(shù)據(jù)庫(kù)的驗(yàn)證及生存分析驗(yàn)證 CAV1、轉(zhuǎn)化生長(zhǎng)因子β1、白細(xì)胞抑制因子2、E-鈣黏蛋白1(CDH1)、轉(zhuǎn)化生長(zhǎng)因子β受體1、轉(zhuǎn)化生長(zhǎng)因子β3、母親信號(hào)蛋白同源物7、人類(lèi)表皮生長(zhǎng)因子受體(EGFR)、細(xì)胞酪氨酸激酶(SRC)、內(nèi)皮型一氧化氮合酶等為初步篩選出的Hub基因。見(jiàn)圖1A。10個(gè)初篩得到的Hub基因中有3個(gè)在肺腺癌組織中較正常組織表達(dá)增高,分別為CDH1、EGFR、SRC。與正常組織比較,CDH1中位值排名為122.5,EGFR中位值排名為1 006.5,SRC中位值排名為2 520.5,均在肺腺癌組織中高表達(dá),差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見(jiàn)圖1B。Hub基因高、低表達(dá)對(duì)肺腺癌患者OS均存在差異,高表達(dá)組OS明顯短于低表達(dá)組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見(jiàn)圖1C。
本研究通過(guò)對(duì)2個(gè)數(shù)據(jù)集中人類(lèi)肺腺癌腫瘤組織及正常癌旁組織的RNA測(cè)序數(shù)據(jù)進(jìn)行分析共獲得22個(gè)明顯上調(diào)的DEGs,然后對(duì)22個(gè)基因進(jìn)行GO功能注釋和KEGG通路富集分析,結(jié)果顯示,DEGs主要涉及蛋白質(zhì)結(jié)合等分子功能,主要富集在基底外側(cè)質(zhì)膜、粗面內(nèi)質(zhì)網(wǎng)和胞外外泌體等細(xì)胞組分中,參與了膽固醇穩(wěn)態(tài)、對(duì)缺氧的反應(yīng)、血管生成、碳酸氫鹽運(yùn)輸、炎性反應(yīng)的調(diào)節(jié)等生物學(xué)過(guò)程。KEGG通路富集分析顯示,DEGs主要富集在氮代謝、近端小管碳酸氫鹽回收、非洲錐蟲(chóng)病、加壓素調(diào)節(jié)的水重吸收、瘧疾、礦物質(zhì)吸收、脂肪細(xì)胞中脂解的調(diào)節(jié)、病毒性心肌炎、腎細(xì)胞癌、膽汁分泌、上皮細(xì)胞受細(xì)菌侵襲和過(guò)氧化物酶增殖物激活受體等信號(hào)通路。本研究利用STRING數(shù)據(jù)庫(kù)構(gòu)建PPI蛋白互作網(wǎng)絡(luò),然后使用Cytoscape軟件篩選出CAV1等10個(gè)Hub基因,再利用Oncomine數(shù)據(jù)庫(kù)對(duì)初篩得到的10個(gè)Hub基因進(jìn)行驗(yàn)證,即再次篩選最終得到CDH1、EGFR、SRC 3個(gè)Hub基因,在肺腺癌中的表達(dá)均增高。最后利用Kaplan-Meier plotter數(shù)據(jù)庫(kù)進(jìn)行生存分析發(fā)現(xiàn),CDH1、EGFR、SRC 3個(gè)Hub基因高表達(dá)患者OS均明顯短于低表達(dá)組。由此推測(cè)CDH1、EGFR、SRC 3個(gè)Hub基因高表達(dá)可能與人類(lèi)肺腺癌患者的不良預(yù)后密切相關(guān)。
CDH1是鈣依賴性黏附蛋白家族中的成員,同時(shí)是上皮間質(zhì)轉(zhuǎn)化的重要表型蛋白,可介導(dǎo)細(xì)胞間的黏附。編碼CDH的CDH1基因是一種跨膜鈣依賴性黏附分子,在幾乎所有上皮細(xì)胞中均有表達(dá)[13]。此外,CDH在進(jìn)化上高度保守,對(duì)胚胎干細(xì)胞的多能性、自我更新和分化至關(guān)重要。已有相關(guān)研究揭示了致癌途徑和干細(xì)胞途徑之間復(fù)雜的相互作用,其中CDH1作為癌基因,分別通過(guò)激活磷酸肌醇-3激酶(PI3K)和抑制有絲分裂原活化蛋白激酶途徑促進(jìn)肺腫瘤干細(xì)胞更新[14]。CDH1的上調(diào)及隨后在轉(zhuǎn)移的定植期均促進(jìn)間充質(zhì)向上皮轉(zhuǎn)化。最近的一項(xiàng)研究表明,CDH1可在體細(xì)胞重編程過(guò)程中替代八聚體結(jié)合轉(zhuǎn)錄因子4,并且是維持小鼠胚胎干細(xì)胞未分化狀態(tài)所必需的[15]。CDH1在大多數(shù)癌癥(包括肺腺癌)中過(guò)度表達(dá)的癌基因功能已通過(guò)對(duì)公開(kāi)的癌癥臨床數(shù)據(jù)庫(kù)(包括GEPIA、Oncomine、TCGA、GEO、Kaplan-Meier等)的生物信息學(xué)分析和數(shù)據(jù)挖掘被發(fā)現(xiàn)。據(jù)相關(guān)文獻(xiàn)[16]報(bào)道,CDH1、PI3K、有絲分裂原活化蛋白激酶信號(hào)之間可能存在反饋調(diào)節(jié)機(jī)制。
EGFR是表皮生長(zhǎng)因子受體(HER)家族受體的4個(gè)成員之一,由EGFR/HER1/erbB1、HER2/erbB2、HER3/erbB3、HER4/erbB4組成。HER家族中有11種生長(zhǎng)因子,可大致分為與EGFR特異性結(jié)合的生長(zhǎng)因子[表皮生長(zhǎng)因子(EGF)、轉(zhuǎn)化生長(zhǎng)因子α、雙調(diào)蛋白]、與EGFR和HER4結(jié)合的生長(zhǎng)因子(β細(xì)胞素、同源異型核蛋白-EGF、表皮調(diào)節(jié)因子)及與HER3和HER4結(jié)合的生長(zhǎng)因子(神經(jīng)調(diào)節(jié)蛋白)。盡管HER2并沒(méi)有相應(yīng)的配體,但通常與激活其的配體結(jié)合,很容易與家族中的其他成員形成二聚體。此外,EGFR是酪氨酸激酶的受體,由具有激酶活性的C端細(xì)胞內(nèi)區(qū)域和N端細(xì)胞外配體結(jié)合位點(diǎn)(疏水性跨膜結(jié)構(gòu)域)組成。EGFR信號(hào)網(wǎng)絡(luò)在上皮組織的維持和生長(zhǎng)中具有重要作用,在肺癌中經(jīng)常觀察到活躍的EGFR信號(hào),EGFR水平與疾病的晚期和不良預(yù)后有關(guān)[17]。肺腺癌EGFR活性突變的發(fā)現(xiàn),以及對(duì)該生物標(biāo)志物預(yù)測(cè)EGFR酪氨酸激酶抑制劑治療后高反應(yīng)率和延長(zhǎng)無(wú)進(jìn)展生存期的后續(xù)認(rèn)識(shí)使肺癌患者治療發(fā)生了革命性改變。所熟知的PI3K/蛋白激酶B (Akt)信號(hào)通路中PI3K的上游信號(hào)一般是生長(zhǎng)因子受體,如EGFR,引起二聚體構(gòu)象改變而被激活。活化的PI3K產(chǎn)生下一級(jí)信號(hào),改變Akt的蛋白結(jié)構(gòu)。而活化的Akt通過(guò)磷酸化作用激活或抑制下游一系列底物,如凋亡相關(guān)蛋白B細(xì)胞淋巴瘤2細(xì)胞死亡相關(guān)激動(dòng)劑、含半胱氨酸的天冬氨酸蛋白酶9改變,從而調(diào)節(jié)增殖、分化、凋亡及遷移等表型。
SRC也稱為原癌基因c-SRC,是一種非受體酪氨酸激酶,通過(guò)促進(jìn)生存、血管生成、增殖和侵襲途徑在癌癥進(jìn)展中發(fā)揮著重要作用。泛素-蛋白酶體途徑和自噬-溶酶體途徑是SRC蛋白降解的主要機(jī)制[18]。此前有研究表明,E3泛素連接酶以磷酸化SRC為靶點(diǎn),使其發(fā)生自噬,并將蛋白酶體依賴的蛋白降解轉(zhuǎn)化為自噬-溶酶體介導(dǎo)的轉(zhuǎn)換[19]。在分子基礎(chǔ)上SRC調(diào)節(jié)與腫瘤發(fā)展和進(jìn)展相關(guān)的多種信號(hào)級(jí)聯(lián),包括黏著斑激酶途徑、EGFR途徑、酪氨酸蛋白激酶/信號(hào)轉(zhuǎn)導(dǎo)及轉(zhuǎn)錄激活因子、PI3K/Akt、血管內(nèi)皮生長(zhǎng)因子、上游激活蛋白/蛋白激酶通路[20]。這些不同的底物相互作用將SRC與廣泛的致癌機(jī)制聯(lián)系在一起,有利于各類(lèi)型癌細(xì)胞的增殖、遷移和侵襲。有研究表明,SRC在NSCLC的發(fā)生和轉(zhuǎn)移中具有關(guān)鍵作用。敲除SRC可抑制人NSCLC細(xì)胞的增殖、遷移和侵襲,并下調(diào)核因子κB信號(hào)傳導(dǎo)[19]。
綜上所述,本研究利用生物信息學(xué)方法通過(guò)對(duì)人類(lèi)肺腺癌基因芯片數(shù)據(jù)集進(jìn)行挖掘,發(fā)現(xiàn)并探討論證了CDH1、EGFR、SRC 3個(gè)Hub基因高表達(dá)可能與人類(lèi)肺腺癌患者不良預(yù)后密切相關(guān),并且在查閱大量文獻(xiàn)后發(fā)現(xiàn)CDH1、EGFR、SRC 3個(gè)Hub基因均參與了幾個(gè)較為經(jīng)典的信號(hào)通路,據(jù)相關(guān)癌癥科學(xué)文獻(xiàn)報(bào)道,對(duì)DEGs進(jìn)行功能富集分析時(shí)大多數(shù)P值相對(duì)較小的功能均參與了肺腺癌各癌變過(guò)程。雖然這些工作為篩選肺腺癌相關(guān)基因提供了值得借鑒的分子靶點(diǎn),對(duì)肺腺癌的診治具有潛在的轉(zhuǎn)化應(yīng)用價(jià)值,但具體工作仍需臨床醫(yī)學(xué)工作者采集大量肺腺癌組織樣本及患者臨床資料進(jìn)行實(shí)驗(yàn)推斷和進(jìn)一步驗(yàn)證,并結(jié)合分子生物學(xué)實(shí)驗(yàn)驗(yàn)證其在人類(lèi)肺腺癌中的具體機(jī)制。